这是由谷歌翻译生成的机器翻译。机器翻译是将一种语言的原始内容直译为另一种语言。这是完全自动化完成的,无需人工干预。从一类案文到另一类案文以及在不同的语言对之间,机器翻译的质量和准确性可能存在很大差异。国际电联不保证准确性,也不对可能出现的错误承担任何责任。如果对我们网页翻译版本中提供的信息的准确性有任何疑虑和关切,请重新查阅官方英文文本。由于受到系统的技术限制,一些内容(如图片、视频、文件等)可能无法翻译。

Tuk Gwet:为被语言排斥的社会修复数字化未来


Kamusi 项目国际

会话278

星期一, 3 四月 2023 13:00–14:00 (UTC+02:00) 专题研讨会

通过 ICT 解决语言不平等问题:收集和共享必要数据的方法,使非盈利语言能够在 ICT 世界中平等参与

世界上 7000 种语言中大多数的使用者被排除在参与全球知识和繁荣引擎之外,因为他们的语言没有有意义的数字存在。语言不平等并非偶然;在 1884 年柏林会议上强加给非洲的殖民语言仍然是大多数非洲学生必须在中学学习时使用的外语,全世界使用被剥夺语言权利的儿童在同样长的时间跨度内都有类似的暴力语言压制故事。这种不平等现在已经嵌入到数字时代语言可用的工具和技术中。最具政治和经济影响力的语言受益于数十年的研究和投资。那些控制钱袋的人不喜欢的语言的使用者实际上被阻止了通向大多数可持续发展目标的数字途径——不仅是包含大量正在消失的人类遗产的濒危语言,还有拥有数千万使用者的人口统计强大的语言和成长。


数字技术改变生活的方式多得数不过来。无论是在电子医疗领域咨询医生、在电子政务领域申请营业执照,还是在线学习 STEM,使用有利可图的语言的人都会体验到一个高度依赖语言技术的世界。通往成功的道路已经走过:以与现有自然语言处理技术兼容的形式收集大量语言数据,例如单词和语言模型,然后将这些数据用于开发完善的工具中。大多数语言加入这条道路所缺少的要素是获取数据的资金和注意力、数字语言公平是一个现实前景的信念,以及至关重要的是,将语言公平作为发展优先事项的承诺。


该小组将通过喀麦隆巴萨语中的一个术语描述的概念来检查语言公平:tuk gwét。 Tuk gwét 指的是对不公正行为发动战争以修复而非惩罚,目的是防止其在未来发生。在不关注造成当前语言数字鸿沟的历史的情况下,该小组将专注于可以部署的方法,让非特权语言能够跨越到先进的语言技术。这将包括技术环境,例如非洲语言学院利用 Kamusi.org 和其他技术和语言合作伙伴的技术和数据为非洲联盟提议的非洲语言赋权平台,以及必须进行的金融和意识形态转变发生这种情况是为了从修辞变为现实,适用于从过去几个世纪到现在一直被那些指导研究和投资的人压制或忽视的任何和所有语言。


Martin Benjamin
马丁·本杰明 执行董事 Kamusi Project International(瑞士) 主持人

Martin Benjamin 是Kamusi Project的创始人和主管,Kamusi Project 是一家致力于为全球语言制作词典和数据资源的国际非营利组织,被白宫科技政策办公室认定为大数据“灯塔项目”,并且非洲联盟非洲语言学院 ACALAN 的技术和语言专家。他在耶鲁大学获得人类学博士学位(2000 年),研究对坦桑尼亚农村的援助。他还以“海盗教授”的身份拥有一个 YouTube 频道,探索语言技术和语言公平的各个方面,并经营Kamusi Labs ,这是一个虚拟实验室,特别专注于培训一批年轻的非洲技术专家,以构建先进的语言技术工具主流研究和投资之外的语言。


Parameswari Krishnamurthy
拜里米斯瓦里·克里希那穆提 语言技术资源中心助理教授 国际信息技术学院,印度海得拉巴

Parameswari Krishnamurthy 是一名计算语言学家,目前在国际信息技术学院 (IIIT- Hyderabad) 的语言技术资源中心担任助理教授。她的研究兴趣在于为印度语言构建语言技术工具和应用程序。她致力于构建机器翻译系统、浅层解析器工具、句法解析和语义解析。


Onyothi Nekoto
猫妖猫 纳米比亚

Claudia Pozo
克劳迪娅·波佐 语言司法协调员 谁的知识? (玻利维亚)

Claudia Pozo 是谁的知识的语言协调员?。作为玻利维亚棕色女权主义者和人权技术专家,克劳迪娅是一位多方面的活动家、社会科学家和战略家,她的工作以拉丁美洲的情境斗争为基础。她是一名技术人员,从事多种格式和多种语言的 Web 开发人员和内容制作人工作超过 15 年。 Claudia 热衷于免费/自由和开源软件、社区广播和数字艺术;以及在线隐私和安全的坚定倡导者。她拥有发展研究硕士学位和传播学学士学位。最近,克劳迪娅成为全球女性艺术家变革者计划基金会的理事会成员。不爬山的时候,你可以看到她喝着红茶,熬夜刷数据。


Emmanuel Ngué Um
Emmanuel Ngué Um 非洲语言和语言学副教授 雅温得第一大学和贝尔图阿大学(喀麦隆)

Emmanuel NGUE UM 是一名语言学家,现任贝尔图瓦大学喀麦隆语言和文化系主任。他的研究兴趣在于语言、文化和数字技术的交叉领域。他是国际人文与艺术计算杂志 (IJHAC) 的副主编。他还是一名语言活动家,也是濒危语言项目管理委员会的成员。


主题
大数据 多元文化 基础设施 教育 数字包容 数字划分
WSIS行动专线
  • AL C2 logo C2。信息和通信基础设施
  • AL C3 logo C3。获得信息和知识
  • AL C6 logo C6。有利环境
  • AL C7 E–LEA logo C7。 ICT应用:生活各个方面的收益-电子学习
  • AL C8 logo C8。文化多样性和身份认同,语言多样性和当地内容
  • AL C11 logo C11。国际和区域合作

语言技术是任何需要公民参与的行动的基础设施。如果人们无法理解,他们就无法参与,而且大多数人对技术赋予的语言的理解程度不足以让他们参与。因此,对语言的关注通过直接为以前被排斥的人群启用 ICT 基础设施来解决行动方面 C2 和 C6。信息和知识 (C3) 只能通过人们熟悉的语言进行传播,包括但不限于电子学习和行动方面 C7 的所有其他电子学习。语言多样性 (C8) 是这些目标的核心,包括保护濒危语言以及将大量但资源匮乏的语言纳入数字未来。拟议的 ACALAN 非洲语言赋权平台是非洲联盟成员国 (C11) 为实现商定的语言目标而合作的一个例子,尽管非欧洲语言的平等迄今为止在全球北方大多没有得到政府和私人资助者的支持,他们支持在他们的公开言论中“合作”,并积极资助本国语言的数字化。 “Tuk gwét” 寻求解决方案,通过这些解决方案,那些引导议程的人和那些重视非盈利语言的人共同承担责任,使一个公平的世界向前发展,让人们参与他们目前被阻止的所有行动线,因为他们的母亲方言已经被被动或有意地排除在语言技术研究和投资的历史范围之外。

可持续发展目标
  • 目标4 logo 目标4:确保包容和公平的优质教育,并为所有人提供终身学习机会
  • 目标8 logo 目标8:促进全民包容和可持续的经济增长,就业和体面工作
  • 目标9 logo 目标9:建立有弹性的基础设施,促进可持续工业化和促进创新
  • 目标10 logo 目标10:减少国家内部和国家之间的不平等
  • 目标16 logo 目标16:促进公正,和平与包容的社会

语言与可持续发展之间的联系很少在全球舞台上得到阐明。开发机构通常会找到临时解决特定语言需求的方法,例如本地翻译或数字应用程序偶尔的本地化界面。然而,建立可行的语言基础设施超出了大多数组织的任务范围。与此同时,大多数语言在学术或工业层面的研发资金微不足道或根本不存在——当前对人工智能的关注大大加剧了这个问题,只有那些已经拥有大量资金的语言支持“大型语言模型”的数字化数据可以参与。此外,在许多地方,女孩往往被剥夺了以有利可图的语言接受政治和经济权力教育的性别维度,这在规划者和决策者中几乎没有得到考虑。在开发过程中优先考虑语言的需求是显而易见的,但这样做的实际情况大多不存在。

链接

African Academy of Languages: https://au.int/en/african-academy-languages-acalan
Platform for African Language Empowerment: http://kamu.si/pale-acalan
Kamusi Project: http://kamusi.org
Whose Knowledge?: https://whoseknowledge.org/
A short video regarding STEM education in national languages in Africa and Europe: http://kamu.si/mali-stem