欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

AI已成为濒危语言新的救星

科普小知识2021-11-02 18:41:38
...

去年,联合国宣布2019年为“国际母语年”。现在离这个节日越来越近了。事实上,此举旨在提高人们对濒临灭绝的濒危语言的意识。“通过语言,人们保存了他们社区的历史、习俗和传统、记忆、独特的思维方式、意义和表达方式。他们也用语言来建设自己的未来。在*保护、善治、建设和平、和谐和可持续发展领域,语言是关键”:这些也是联合国可持续发展目标的核心。

根据联合国的统计,世界上有7000多种语言,但是灭绝的速度非常快,平均每个月有两种语言消失。由于人工智能在语言存档和学习方面的优势,它在拯救濒危语言的斗争中变得比以往任何时候都更加重要。

杰森·洛弗尔正在学习新西兰的母语“毛利语”,但他缺少任何人来帮助他练习。因此,他与IBM的“沃森人工智能”合作建立了一个Facebook信使聊天机器人,可以理解和回复用户的信息,包括毛利语和英语。即使用户犯了拼写错误,比如“Reobot”,也不会给Lovell的聊天机器人造成障碍。洛弗尔希望在不久的将来引入发音帮助。通过提供毛利语交流机会,Reobot可以帮助学习者更快地发展自信心和技能。

为了向生活在偏远社区的儿童教授澳大利亚土著语言,一组来自ARC语言动力学卓越中心的研究人员开发了一种低成本、易于运输的机器人Opie。当学习故事、游戏和课程时,奥皮的眼睛可以和孩子们互动。此外,机器人可以记录孩子的语言技能,并帮助老师跟踪他们的学习进度。由于谷歌的开源人工智能平台TensorFlow,CoEDL与谷歌合作,为土著语言转录和构建人工智能模型。这种机器学习技术为语言学家节省了数百万小时,并在CoEDL的存储库中记录了超过40,000小时的记录。

维护语言数据并将其引入土著社区对许多组织来说是一项挑战。第一人民文化委员会(FPCC)的任务是支持不列颠哥伦比亚省土著语言、艺术、文化和遗产的复兴,与当地社区合作,将语言数据存档,并通过其第一声音平台进行教学。第一之声的最新创新是一个键盘应用程序,允许用户在移动设备上的任何应用程序上输入100多种本地语言,包括社交媒体、电子邮件和文字处理。

第一之声存储的数据是一个开源的云本地内容服务引擎,集成了人工智能和机器学习。

未来学家托马斯·弗雷设想了一个全球语言档案馆,作为一个活的博物馆,一个“语言的卢浮宫”,在那里甚至可以学习灭绝的语言:“将足够多的视频、音频和书面文件输入人工智能语言重建引擎,它可以生成一个功能性的三维化身,向那些想要学习语言的人教授语言。”人工智能引擎将更进一步,填补任何语言空白,在需要时创建一种语言的书面形式,并提供语言间的翻译。

弗雷将濒危语言项目作为创建全球语言档案的第一步,该档案由夏威夷大学第一人民文化委员会濒危语言目录/濒危语言项目(ELCat/ELP)管理。濒危语言项目已经收集了濒危语言的资源和信息,这要感谢全世界的合作伙伴。到目前为止,该项目有3418种语言的数据,其中许多是濒危语言。