Tuk Gwet : Fixer l'avenir numérique des sociétés exclues par la langue
Projet Kamusi International
Session 278
Aborder l'inégalité linguistique grâce aux TIC : approches de collecte et de partage des données nécessaires pour permettre aux langues non lucratives d'être des acteurs égaux dans l'univers des TIC
Les locuteurs de la plupart des 7 000 langues du monde sont exclus de la participation aux moteurs mondiaux de la connaissance et de la prospérité parce que leurs langues n'ont pas de présence numérique significative. L'inégalité linguistique n'est pas accidentelle; Les langues coloniales qui ont été imposées à l'Afrique lors de la Conférence de Berlin de 1884 restent les langues étrangères dans lesquelles la plupart des étudiants africains doivent parcourir leurs études secondaires, et les enfants de langues dépourvues de pouvoir dans le monde entier partagent des histoires similaires de suppression linguistique violente sur une période tout aussi longue. Cette iniquité est maintenant intégrée dans les outils et les technologies disponibles pour les langues à l'ère numérique. Les langues qui ont le plus de pouvoir politique et économique ont bénéficié de décennies de recherche et d'investissement. Les locuteurs de langues qui ne sont pas favorisés par ceux qui contrôlent les cordons de la bourse sont effectivement bloqués des voies numériques vers la plupart des objectifs de développement durable - non seulement les langues en danger qui contiennent une richesse du patrimoine humain en voie de disparition, mais aussi les langues démographiquement fortes avec des dizaines de millions de locuteurs et en pleine croissance.
Les technologies numériques ont changé des vies de façons trop nombreuses pour être comptées. Qu'il s'agisse de la possibilité de consulter un médecin en e-santé, de demander une licence commerciale en e-gouvernance ou d'étudier les STEM en ligne, les locuteurs de langues lucratives font l'expérience d'un monde fortement médiatisé par les technologies langagières. La voie du succès est bien tracée : assembler de nombreuses données linguistiques, telles que des mots et des modèles de langage, sous des formes compatibles avec les techniques existantes de traitement du langage naturel, puis mettre ces données en œuvre dans des outils bien développés. Les éléments manquants pour que la plupart des langues rejoignent cette voie sont l'argent et l'attention nécessaires pour acquérir les données, la conviction que l'équité linguistique numérique est une perspective réaliste et, surtout, l'engagement envers l'équité linguistique en tant que priorité de développement.
Ce panel examinera l'équité linguistique à travers le prisme d'un concept décrit par un terme de la langue basaa du Cameroun : tuk gwét. Tuk gwet désigne le fait de mener une guerre contre une injustice afin de réparer, non de punir, dans le but d'empêcher qu'elle ne se reproduise à l'avenir. Sans se concentrer sur l'histoire qui a créé la fracture numérique linguistique actuelle, le panel se concentrera sur les méthodes qui peuvent être déployées à l'avenir pour que les langues non privilégiées sautent dans les technologies linguistiques avancées. Cela comprendra à la fois l'environnement technique, tel que la plateforme pour l'autonomisation des langues africaines que l'Académie africaine des langues propose à l'Union africaine avec la technologie et les données de Kamusi.org et d'autres partenaires technologiques et linguistiques, et les transformations financières et idéologiques qui doivent se produire afin de passer de la rhétorique à la réalité, pour toutes les langues qui ont été supprimées ou ignorées par ceux qui ont guidé la recherche et l'investissement des siècles passés jusqu'à nos jours.

Martin Benjamin est le fondateur et directeur du projet Kamusi , une organisation internationale à but non lucratif dédiée à la production de dictionnaires et de ressources de données pour les langues du monde entier, reconnue comme un "projet phare" Big Data par le Bureau de la politique scientifique et technologique de la Maison Blanche, et expert en technologie et en langues pour l'ACALAN, l'Académie africaine des langues de l'Union africaine. Son doctorat en anthropologie, de Yale (2000), a examiné l'aide en Tanzanie rurale. Il a également une chaîne YouTube en tant que « professeur pirate » pour explorer les aspects de la technologie linguistique et de l'équité linguistique, et dirige Kamusi Labs , un laboratoire virtuel avec un accent particulier sur la formation d'un cadre de jeunes technologues africains, pour créer des outils technologiques linguistiques avancés pour langues en dehors du courant dominant de la recherche et de l'investissement.

Claudia Pozo est coordinatrice des langues de Whose Knowledge?. En tant que féministe brune bolivienne et technologue des droits de l'homme, Claudia est une militante, une spécialiste des sciences sociales et une stratège aux multiples facettes, dont le travail est fondé sur des luttes situées à travers l'Amérique latine. C'est une technicienne qui a travaillé comme développeur Web et productrice de contenu dans divers formats et dans plusieurs langues pendant plus de 15 ans. Claudia est passionnée par les logiciels libres et open source, la radio communautaire et l'art numérique ; et un ardent défenseur de la confidentialité et de la sécurité en ligne. Elle est titulaire d'une maîtrise en études du développement et d'une licence en communications. Plus récemment, Claudia est devenue membre du conseil du programme Global Fund for Women's Artist Changemaker. Lorsqu'elle ne fait pas de trekking dans les montagnes, vous pouvez la trouver en train de boire du thé noir et de faire du datamoshing tard dans la nuit.

Parameswari Krishnamurthy est un linguiste informatique et travaille actuellement comme professeur adjoint au centre de ressources sur les technologies linguistiques à l'Institut international des technologies de l'information (IIIT-Hyderabad). Ses intérêts de recherche portent sur la création d'outils technologiques linguistiques et d'applications pour les langues indiennes. Elle a travaillé sur la construction de systèmes de traduction automatique, d'outils d'analyse syntaxique superficielle, d'analyse syntaxique et d'analyse sémantique.


Emmanuel NGUE UM est linguiste et l'actuel Responsable du Département des Langues et Cultures Camerounaises à l'Université de Bertoua. Ses intérêts de recherche se situent à l'intersection des langues, des cultures et des technologies numériques. Il est rédacteur en chef adjoint de l'International Journal of Humanities and Arts Computing (IJHAC). Il est également un activiste linguistique et membre du comité de gouvernance du projet des langues en danger.
-
C2. L'infrastructure de l'information et de la communication
-
C3. L'accès à l'information et au savoir
-
C6. Créer un environnement propice
-
C7. Les applications TIC et leur apport dans tous les domaines — Téléenseignement
-
C8. Diversité et identité culturelles, diversité linguistique et contenus locaux
-
C11. Coopération internationale et régionale
La technologie linguistique est une infrastructure fondamentale pour toute action nécessitant la participation des citoyens. Si les gens ne peuvent pas comprendre, ils ne peuvent pas s'engager, et la plupart des gens ne comprennent pas les langues dotées de technologie à un niveau qui permet leur participation. L'attention portée à la langue répond donc aux lignes d'action C2 et C6 en activant directement l'infrastructure TIC pour les personnes précédemment exclues. L'information et les connaissances (C3) ne peuvent être transmises qu'à travers une langue qu'une personne connaît confortablement, y compris, mais sans s'y limiter, l'apprentissage en ligne et tous les autres e-'s de la ligne d'action C7. La diversité linguistique (C8) est au cœur de ces objectifs, y compris la préservation des langues en danger et l'intégration de langues nombreuses mais dépourvues de ressources dans l'avenir numérique. La plate-forme proposée par l'ACALAN pour l'autonomisation des langues africaines est un exemple de coopération vers des objectifs linguistiques convenus entre les États membres de l'Union africaine (C11), bien que l'égalité pour les langues non européennes soit à ce jour principalement non soutenue par les gouvernements et les bailleurs de fonds privés du Nord mondial qui épousent « coopération » dans leur rhétorique publique et financent de manière agressive la numérisation dans leurs propres langues nationales. "Tuk gwet" recherche des solutions par lesquelles ceux qui dirigent l'agenda et ceux qui valorisent les langues non lucratives partagent la responsabilité de permettre un monde équitable à l'avenir, pour que les gens participent à toutes les lignes d'action dont ils sont actuellement bloqués parce que leur mère les langues ont été passivement ou intentionnellement en dehors du champ historique de la recherche et de l'investissement dans la technologie du langage.
-
Objectif 4: Garantir une éducation de qualité et des possibilités d’apprentissage tout au long de la vie pour tous
-
Objectif 8: Promouvoir croissance économique soutenue, plein emploi productif et travail décent pour tous
-
Objectif 9: Bâtir une infrastructure résiliente, promouvoir une industrialisation durable et encourager l’innovation
-
Objectif 10: Réduire les inégalités dans les pays et d’un pays à l’autre
-
Objectif 16: Promouvoir l’avènement de sociétés pacifiques, l’accès de tous à la justice et des institutions efficaces
Le lien entre langue et développement durable a rarement été articulé sur la scène mondiale. Les agences de développement trouvent souvent des moyens de répondre à des besoins linguistiques particuliers sur une base ad hoc, comme des traducteurs locaux ou l'interface localisée occasionnelle pour une application numérique. Cependant, la production d'une infrastructure linguistique viable sort du cadre des mandats de la plupart des organisations. Dans le même temps, le financement de la recherche et du développement pour la plupart des langues au niveau académique ou industriel est dérisoire ou inexistant - un problème qui est grandement exacerbé par la fixation actuelle sur l'IA, pour laquelle seules les langues qui ont déjà de grandes quantités de les données numérisées pour sous-tendre les "grands modèles linguistiques" peuvent participer. De plus, une dimension de genre dans de nombreux endroits, où l'éducation dans les langues lucratives qui mènent au pouvoir politique et économique est souvent refusée aux filles, n'attire presque pas l'attention des planificateurs et des décideurs. La nécessité de donner la priorité à la langue dans le processus de développement est manifeste, mais la réalité de le faire est généralement absente.
African Academy of Languages: https://au.int/en/african-academy-languages-acalan
Platform for African Language Empowerment: http://kamu.si/pale-acalan
Kamusi Project: http://kamusi.org
Whose Knowledge?: https://whoseknowledge.org/
A short video regarding STEM education in national languages in Africa and Europe: http://kamu.si/mali-stem