Tuk Gwet: arreglando el futuro digital para las sociedades excluidas por el idioma
Proyecto Kamusi Internacional
Sesión 278
Abordar la inequidad lingüística a través de las TIC: enfoques para recopilar y compartir los datos necesarios para permitir que las lenguas no lucrativas participen en pie de igualdad en el universo de las TIC
Los hablantes de la mayoría de los 7000 idiomas del mundo están excluidos de la participación en motores globales de conocimiento y prosperidad porque sus idiomas no tienen una presencia digital significativa. La desigualdad lingüística no es accidental; Los idiomas coloniales que se impusieron en África en la Conferencia de Berlín de 1884 siguen siendo los idiomas extranjeros en los que la mayoría de los estudiantes africanos deben realizar sus estudios secundarios, y los niños de idiomas sin poder en todo el mundo comparten historias similares de represión lingüística violenta durante un período de tiempo similar. Esta inequidad ahora se ha incorporado a las herramientas y tecnologías disponibles para los idiomas en la era digital. Los idiomas con mayor poder político y económico se han beneficiado de décadas de investigación e inversión. Los hablantes de idiomas que no son favorecidos por quienes controlan los hilos del dinero quedan bloqueados de manera efectiva en los caminos digitales hacia la mayoría de los Objetivos de Desarrollo Sostenible, no solo idiomas en peligro de extinción que contienen una gran cantidad de patrimonio humano que se está desvaneciendo, sino también idiomas demográficamente fuertes con decenas de millones de hablantes. y creciendo.
Las tecnologías digitales han cambiado vidas de maneras demasiado numerosas para contarlas. Ya sea la capacidad de consultar con un médico en salud electrónica, solicitar una licencia comercial en gobierno electrónico o estudiar STEM en línea, los hablantes de idiomas lucrativos experimentan un mundo altamente mediatizado por las tecnologías del lenguaje. El camino hacia el éxito está bien recorrido: reúna abundantes datos lingüísticos, como palabras y modelos de lenguaje, en formas que sean compatibles con las técnicas de procesamiento de lenguaje natural existentes, luego ponga esos datos a trabajar en herramientas bien desarrolladas. Los elementos que faltan para que la mayoría de los idiomas se unan a este camino son el dinero y la atención para adquirir los datos, la creencia de que la equidad lingüística digital es una perspectiva realista y, lo que es más importante, el compromiso con la equidad lingüística como una prioridad de desarrollo.
Este panel examinará la equidad lingüística a través de la lente de un concepto descrito por un término del idioma Basaa de Camerún: tuk gwét. Tuk gwét se refiere a hacer la guerra contra una injusticia para reparar, no para castigar, con el objetivo de evitar que vuelva a suceder en el futuro. Sin concentrarse en la historia que ha creado la brecha digital lingüística actual, el panel se centrará en los métodos que se pueden implementar en el futuro para que los idiomas no privilegiados salten a las tecnologías lingüísticas avanzadas. Esto incluirá tanto el entorno técnico, como la Plataforma para el Empoderamiento de Idiomas Africanos que la Academia Africana de Idiomas propone para la Unión Africana con tecnología y datos de Kamusi.org y otros socios tecnológicos y lingüísticos, y las transformaciones financieras e ideológicas que deben ocurren para pasar de la retórica a la realidad, para todos y cada uno de los lenguajes que han sido suprimidos o ignorados por aquellos que guían la investigación y la inversión desde siglos pasados hasta el día de hoy.

Martin Benjamin es el fundador y director del Proyecto Kamusi , una organización internacional sin fines de lucro dedicada a producir diccionarios y recursos de datos para idiomas de todo el mundo que fue reconocida como un "proyecto faro" de Big Data por la Oficina de Política Científica y Tecnológica de la Casa Blanca, y experto en tecnología e idiomas de ACALAN, la Academia Africana de Idiomas de la Unión Africana. Su doctorado en Antropología, de Yale (2000), examinó la ayuda en las zonas rurales de Tanzania. También tiene un canal de YouTube como el "Profesor Pirata" para explorar aspectos de la tecnología del lenguaje y la equidad lingüística, y dirige Kamusi Labs , un laboratorio virtual con un enfoque especial en la capacitación de un grupo de jóvenes tecnólogos africanos, para construir herramientas avanzadas de tecnología del lenguaje para idiomas fuera de la corriente principal de la investigación y la inversión.

Claudia Pozo es Coordinadora de Idiomas de Whose Knowledge?. Como feminista morena boliviana y tecnóloga de derechos humanos, Claudia es una activista multifacética, científica social y estratega, cuyo trabajo se basa en luchas situadas en América Latina. Es una persona de tecnología que ha trabajado como desarrolladora web y productora de contenido en diversos formatos y en varios idiomas durante más de 15 años. Claudia es una apasionada del software libre y de código abierto, la radio comunitaria y el arte digital; y un firme defensor de la privacidad y la seguridad en línea. Tiene un MPhil en Estudios de Desarrollo y una licenciatura en Comunicaciones. Más recientemente, Claudia se ha convertido en miembro del consejo del Programa Global Fund for Women's Artist Changemaker Program. Cuando no está haciendo senderismo en las montañas, puede encontrarla bebiendo té negro y haciendo mojo de datos a altas horas de la noche.

Parameswari Krishnamurthy es lingüista computacional y actualmente trabaja como profesor asistente en el centro de recursos de tecnologías del lenguaje en el Instituto Internacional de Tecnología de la Información (IIIT-Hyderabad). Su interés de investigación radica en la creación de herramientas y aplicaciones de tecnología lingüística para los idiomas indios. Ha trabajado en la construcción de sistemas de traducción automática, herramientas de análisis superficial, análisis sintáctico y análisis semántico.


Emmanuel NGUE UM es lingüista y actual director del Departamento de Lenguas y Culturas de Camerún en la Universidad de Bertoua. Su interés de investigación se encuentra en la intersección de Lenguas, Culturas y Tecnologías Digitales. Es editor asociado del International Journal of Humanities and Arts Computing (IJHAC). También es un activista lingüístico y miembro del comité de Gobernanza del Proyecto de Lenguas en Peligro de Extinción.
-
C2. Infraestructura de la información y la comunicación
-
C3. Acceso a la información y al conocimiento
-
C6. Entorno habilitador
-
C7. Aplicaciones de las TIC: ventajas en todos los aspectos de la vida — Aprendizaje electrónico
-
C8. Diversidad e identidad culturales, diversidad lingüística y contenido local
-
C11. Cooperación internacional y regional
La tecnología del lenguaje es una infraestructura fundamental para cualquier actuación que requiera la participación ciudadana. Si las personas no pueden entender, no pueden participar, y la mayoría de las personas no entienden los lenguajes dotados de tecnología a un nivel que les permita participar. Por lo tanto, la atención al lenguaje aborda las Líneas de Acción C2 y C6 al habilitar directamente la infraestructura de TIC para los pueblos previamente excluidos. La información y el conocimiento (C3) solo pueden transmitirse a través de un lenguaje que una persona conozca cómodamente, incluido, entre otros, el e-learning y todos los demás e-'s de la Línea de Acción C7. La diversidad lingüística (C8) está en el centro de estos objetivos, incluida la preservación de las lenguas en peligro de extinción y la incorporación de lenguas grandes pero carentes de recursos en el futuro digital. La Plataforma ACALAN propuesta para el empoderamiento de las lenguas africanas es un ejemplo de cooperación hacia los objetivos lingüísticos acordados entre los estados miembros de la Unión Africana (C11), aunque hasta la fecha la igualdad para las lenguas no europeas no ha sido apoyada en su mayoría por financiadores gubernamentales y privados en el Norte global que propugnan “cooperación” en su retórica pública y financian agresivamente la digitalización en sus propios idiomas nacionales. “Tuk gwét” busca soluciones a través de las cuales aquellos que dirigen la agenda y aquellos que valoran los lenguajes no lucrativos compartan la responsabilidad de permitir un mundo equitativo en el futuro, para que las personas participen en todas las Líneas de Acción de las que actualmente están bloqueados porque su madre Las lenguas han estado pasiva o intencionalmente fuera del alcance histórico de la investigación y la inversión en tecnología del lenguaje.
-
Objetivo 4: Garantizar una educación inclusiva, equitativa y de calidad y promover oportunidades de aprendizaje durante toda la vida para todos
-
Objetivo 8: Promover el crecimiento económico sostenido, inclusivo y sostenible, el empleo pleno y productivo y el trabajo decente para todos
-
Objetivo 9: Construir infraestructuras resilientes, promover la industrialización inclusiva y sostenible y fomentar la innovación
-
Objetivo 10: Reducir la desigualdad en y entre los países
-
Objetivo 16: Promover sociedades pacíficas e inclusivas para el desarrollo sostenible, facilitar el acceso a la justicia para todos y crear instituciones eficaces, responsables e inclusivas a todos los niveles
El vínculo entre el lenguaje y el desarrollo sostenible rara vez se ha articulado en un escenario global. Las agencias de desarrollo a menudo encuentran medios para abordar necesidades lingüísticas particulares de manera ad hoc, como traductores locales o la interfaz localizada ocasional para una aplicación digital. Sin embargo, la producción de una infraestructura lingüística viable está fuera del alcance de los mandatos de la mayoría de las organizaciones. Al mismo tiempo, la financiación para la investigación y el desarrollo de la mayoría de los idiomas a nivel académico o industrial es insignificante o inexistente, un problema que se ve agravado en gran medida por la fijación actual en la IA, para la cual solo los idiomas que ya tienen grandes cantidades de pueden participar datos digitalizados para sustentar “grandes modelos de lenguaje”. Además, una dimensión de género en muchos lugares, donde la educación en los idiomas lucrativos que conducen al poder político y económico a menudo se les niega a las niñas, casi no genera consideración entre los planificadores y los formuladores de políticas. La necesidad de priorizar el lenguaje dentro del proceso de desarrollo es manifiesta, pero la realidad de hacerlo está mayormente ausente.
African Academy of Languages: https://au.int/en/african-academy-languages-acalan
Platform for African Language Empowerment: http://kamu.si/pale-acalan
Kamusi Project: http://kamusi.org
Whose Knowledge?: https://whoseknowledge.org/
A short video regarding STEM education in national languages in Africa and Europe: http://kamu.si/mali-stem