Тук Гвет: исправление цифрового будущего для обществ, исключенных из-за языка
Камуси Проект Интернэшнл
Сессия 278
Борьба с языковым неравенством с помощью ИКТ: подходы к сбору и обмену данными, необходимыми для того, чтобы неприбыльные языки стали равноправными игроками во вселенной ИКТ.
Носители большинства из 7000 языков мира исключены из участия в глобальных двигателях знаний и процветания, потому что их языки не имеют значимого цифрового присутствия. Языковое неравенство не случайно; колониальные языки, которые были навязаны Африке на Берлинской конференции 1884 года, остаются иностранными языками, на которых большинство африканских студентов должны учиться в средней школе, и дети, владеющие языками, лишенными прав, во всем мире рассказывают схожие истории о насильственном языковом подавлении на протяжении столь же длительного периода времени. Это неравенство теперь заложено в инструментах и технологиях, доступных для языков в эпоху цифровых технологий. Языки с наибольшей политической и экономической властью выиграли от десятилетий исследований и инвестиций. Носители языков, которые не нравятся тем, кто контролирует финансовые потоки, эффективно блокируются на цифровых путях к большинству Целей в области устойчивого развития — не только исчезающим языкам, содержащим богатое исчезающее человеческое наследие, но и демографически сильным языкам, на которых говорят десятки миллионов человек. и растет.
Цифровые технологии изменили жизни настолько, что их невозможно сосчитать. Будь то возможность проконсультироваться с врачом в области электронного здравоохранения, подать заявку на получение бизнес-лицензии в области электронного управления или изучать STEM онлайн, носители прибыльных языков познают мир, в значительной степени опосредованный языковыми технологиями. Путь к успеху хорошо протоптан: собирайте большое количество лингвистических данных, таких как слова и языковые модели, в формы, совместимые с существующими методами обработки естественного языка, а затем применяйте эти данные для работы в хорошо разработанных инструментах. Недостающими элементами для того, чтобы большинство языков присоединились к этому пути, являются деньги и внимание для получения данных, вера в то, что цифровое лингвистическое равенство является реалистичной перспективой, и, что особенно важно, приверженность лингвистическому равенству как приоритету развития.
Эта группа будет рассматривать равенство языков через призму концепции, описываемой термином из языка басаа в Камеруне: tuk gwét. Тук гвет относится к ведению войны против несправедливости, чтобы исправить, а не наказать, с целью предотвращения ее повторения в будущем. Не сосредотачиваясь на истории, которая создала нынешний языковой цифровой разрыв, панель сосредоточится на методах, которые могут быть развернуты в будущем для непривилегированных языков, чтобы совершить скачок в передовые языковые технологии. Это будет включать как техническую среду, такую как Платформа для расширения возможностей африканских языков, которую Африканская академия языков предлагает Африканскому союзу с использованием технологий и данных из Kamusi.org и других технологических и лингвистических партнеров, так и финансовые и идеологические преобразования, которые должны происходят для того, чтобы перейти от риторики к реальности, для всех без исключения языков, которые подавлялись или игнорировались теми, кто руководил исследованиями и инвестициями из прошлых столетий в наши дни.

Мартин Бенджамин является основателем и директором Kamusi Project , международной некоммерческой организации, занимающейся созданием словарей и информационных ресурсов для языков по всему миру, которая была признана Управлением по науке и технологиям Белого дома «маяком» в области больших данных. эксперт по технологиям и языкам в ACALAN, Африканской академии языков Африканского союза. Его докторская степень в области антропологии, полученная в Йельском университете (2000 г.), исследовала помощь в сельских районах Танзании. У него также есть канал на YouTube в качестве «Профессора пиратов», на котором он исследует аспекты языковых технологий и языкового равенства, а также управляет Kamusi Labs , виртуальной лабораторией, уделяющей особое внимание обучению кадров молодых африканских технологов, для создания передовых инструментов языковых технологий для языки вне основных направлений исследований и инвестиций.

Парамешвари Кришнамурти — компьютерный лингвист, в настоящее время работает доцентом в Ресурсном центре языковых технологий в Международном институте информационных технологий (IIIT-Хайдарабад). Ее исследовательский интерес заключается в создании инструментов языковых технологий и приложений для индийских языков. Она работала над созданием систем машинного перевода, неглубоких инструментов синтаксического анализа, синтаксического анализа и семантического анализа.


Эммануэль NGUE UM — лингвист и в настоящее время заведующий кафедрой камерунских языков и культур Университета Бертуа. Его исследовательский интерес лежит на стыке языков, культур и цифровых технологий. Он является помощником редактора Международного журнала гуманитарных наук и вычислений в искусстве (IJHAC). Он также является языковым активистом и членом руководящего комитета проекта «Языки, находящиеся под угрозой исчезновения».

Клаудия Позо — координатор по языкам организации «Чьи знания?». Боливийская коричневая феминистка и специалист по правам человека, Клаудия — многогранный активист, социолог и стратег, чья работа основана на ситуативной борьбе в Латинской Америке. Она технический специалист, более 15 лет работала веб-разработчиком и производителем контента в различных форматах и на разных языках. Клаудия увлечена свободным программным обеспечением и программным обеспечением с открытым исходным кодом, общественным радио и цифровым искусством; и ярый сторонник конфиденциальности и безопасности в Интернете. Она имеет степень магистра в области исследований в области развития и степень бакалавра в области коммуникаций. Совсем недавно Клаудия стала членом совета Глобального фонда для программы женщин-артистов Changemaker. Когда вы не путешествуете по горам, вы можете найти ее, пьющую черный чай и собирающую данные поздно ночью.
-
С2 Информационная и коммуникационная инфраструктура
-
C3. доступ к информации и знаниям
-
C6. Разрешающая среда
-
C7. приложения ИКТ: преимущества во всех аспектах жизни - электронное обучение
-
С8. Культурное разнообразие и самобытность, языковое разнообразие и местное содержание
-
С11. Международное и региональное сотрудничество
Языковые технологии являются фундаментальной инфраструктурой для любых действий, требующих участия граждан. Если люди не могут понять, они не могут участвовать, и большинство людей не понимают языки с технологическими возможностями на уровне, позволяющем им участвовать. Таким образом, внимание к языку относится к направлениям деятельности C2 и C6, напрямую предоставляя инфраструктуру ИКТ для ранее исключенных людей. Информация и знания (C3) могут быть переданы только на языке, который человеку удобно знать, включая, помимо прочего, электронное обучение и все другие электронные средства Направления действия C7. В основе этих целей лежит языковое разнообразие (C8), в том числе сохранение языков, находящихся под угрозой исчезновения, и включение крупных, но лишенных ресурсов языков в цифровое будущее. Предлагаемая платформа ACALAN для расширения возможностей африканских языков является примером сотрудничества в достижении согласованных языковых целей между государствами-членами Африканского союза (C11), хотя равенство неевропейских языков на сегодняшний день в основном не поддерживается правительством и частными спонсорами на глобальном Севере, которые поддерживают «сотрудничество» в своей публичной риторике и активно финансируют цифровизацию на своих национальных языках. «Tuk gwét» ищет решения, с помощью которых те, кто руководит повесткой дня, и те, кто ценит неприбыльные языки, разделяют ответственность за обеспечение справедливого мира в будущем, за то, чтобы люди участвовали во всех линиях действий, от которых они в настоящее время заблокированы, потому что их мать языки пассивно или преднамеренно выходили за рамки исторических исследований и инвестиций в языковые технологии.
-
Цель 4: Обеспечить инклюзивное и справедливое качественное образование и содействовать созданию возможностей для обучения на протяжении всей жизни для всех
-
Цель 8: Содействие всеохватному и устойчивому экономическому росту, занятости и достойной работе для всех
-
Цель 9: Создание устойчивой инфраструктуры, содействие устойчивой индустриализации и стимулирование инноваций
-
Цель 10: Сокращение неравенства внутри стран и между ними
-
Цель 16: Поощрение справедливых, мирных и инклюзивных обществ
Связь между языком и устойчивым развитием редко озвучивалась на мировой арене. Агентства по развитию часто находят средства для удовлетворения конкретных языковых потребностей на разовой основе, например, местные переводчики или случайный локализованный интерфейс для цифрового приложения. Однако создание жизнеспособной лингвистической инфраструктуры выходит за рамки полномочий большинства организаций. В то же время финансирование исследований и разработок для большинства языков на академическом или промышленном уровне ничтожно или вообще отсутствует — проблема, которая значительно усугубляется нынешним зацикливанием на ИИ, для которого только языки, которые уже имеют большое количество могут участвовать оцифрованные данные для поддержки «больших языковых моделей». Более того, гендерный аспект во многих местах, где девочкам часто отказывают в обучении на прибыльных языках, ведущих к политической и экономической власти, почти не привлекает внимание планировщиков и политиков. Необходимость отдавать приоритет языку в процессе разработки очевидна, но в действительности это практически отсутствует.
African Academy of Languages: https://au.int/en/african-academy-languages-acalan
Platform for African Language Empowerment: http://kamu.si/pale-acalan
Kamusi Project: http://kamusi.org
Whose Knowledge?: https://whoseknowledge.org/
A short video regarding STEM education in national languages in Africa and Europe: http://kamu.si/mali-stem