Duolingo 如何将海地克里奥尔语添加到其语言库中

Duolingo 如何将海地克里奥尔语添加到其语言库中

流行的语言学习应用程序 Duolingo 将于 2 月 22 日添加海地克里奥尔语作为新课程。为配合新课程的推出,该科技平台还与美国各地的海地人经营的餐馆合作推广该课程。

“海地克里奥尔语在美国很流行。这是一种非常广泛的语言。它是迈阿密继英语和西班牙语之后的第三大语言,”Duolingo 高级学习科学家 Cindy Blanco 说道。“我们鼓励学习者在这些餐厅使用海地克里奥尔语。这样做的部分动机是为了确保我们将语言与文化和社区联系起来。”

Duolingo 由卡内基梅隆大学的计算机科学家创建,将语言学习与技术相结合,例如融入了机器学习等技术。这家总部位于匹兹堡的科技独角兽(估值超过 10 亿美元的初创公司的名称)于 2012 年首次推出,并于 2021 年上市。Duolingo 以其略显疯狂的吉祥物而闻名于流行文化,与其他几款语言学习应用一样,在疫情期间下载量激增。

为了开发课程内容,Duolingo 与佛罗里达国际大学的 Nicolas André 等语言学家进行了合作。

“我们的海地克里奥尔语团队决定了我们在课堂上需要教授的词汇,以及你需要的语法,”布兰科说。“然后他们想出进行教学所需的短语、单词和句子。”

这带来了独特的挑战,因为海地克里奥尔语在历史上是一种口语,几乎没有明确的书写、拼写和语法规则。

“我们花了很多时间才弄清楚我们想要向学习者展示什么,因为实际上海地克里奥尔语使用者对于可接受的拼写、表达这个句子或这个想法的最佳方式可能有不同的看法,”布兰科说。“对于许多语言,如西班牙语和法语,实际上都有正式的组织来做这件事。现在也有针对海地克里奥尔语的组织,所以我们的团队非常依赖这些正在制定的语言标准。”

海地克里奥尔语是 Duolingo 今年计划添加的几种新语言中的第一个。目前,他们有 41 种语言的 104 多个课程。

“对我们来说,这永远不够。全世界有 7,000 多种语言,而我们只有 41 种。还有很多。”布兰科说。“我们希望能够教所有这些语言。”

Duolingo 如何创造语言体验

为了在应用程序上打造语言体验,具有语言教学背景的布兰科的任务是弄清楚如何将团队对语言学习和语言教学的了解与他们对人们如何与应用程序和移动技术互动和导航的了解结合起来。

尽管语言学习应用无法提供与身处异国他乡相同的体验,但 Duolingo 已尝试使其界面变得有趣且具有互动性,因此用户很可能会再次使用它,他们可以从上次中断的地方继续学习。在主页选项卡上,有一系列技能测验可供用户进步,还有音频课程选项卡、阅读和听力理解故事,以及记分板,可将您的进度与其他用户的进度进行比较。

“我们的技术实际上非常灵活。只要我们提供正确的信息,它就可以从我们的课程、句子和词汇等内容中抽取内容来创建课程,”布兰科说。他们拥有的机器学习算法还可以跟踪用户正在处理的内容和练习,以调整他们接下来看到的内容。例如,如果用户对某个概念的掌握特别好,算法可能会更早地触发更难的练习。

一般来说,不同语言课程的设计具有共同的结构。“如果你是一个初学者,我们希望你在完成本单元后能够用这门语言做什么?这可能是描述自己、谈论你的家人、问路、在餐厅点菜等事情,”布兰科说。“我们从这些沟通目标开始,通常,这些目标在各种语言中都是相同的。”

对于每个目标,团队都会考虑实现该目标所需的词汇和语法。这就是事情可能出现分歧的地方。“也许在西班牙语课程中你会比在法语课程中更早遇到一些结构,这取决于语法的难度或你想按照什么顺序排列这些交流目标,”布兰科解释说。“确切的词汇和语法可能会有很大差异。这实际上是一个问题,即我们该按照什么顺序来教学才能实现所有这些交流目标。”

语言学习如何影响

这款应用的学习方式与儿童学习新语言的方式既相似又不同。其中一个相似之处是接触和输入的概念。布兰科说:“你需要大量的语言使用经验。”对于那些在家里和学校里听到成人、家人和朋友如何使用这种语言的孩子来说,这很容易。

“对于成年人来说,这确实很难。这也是我们开发这款应用的部分原因,”她指出。“我们知道接触和输入非常重要。所以我们试图让学习语言变得非常有趣和容易,这样你就可以在通勤时花 5 分钟学习,也可以在睡觉前学习,你不需要占用课堂上这一小时的时间。”

除了接触新知识外,Duolingo 还将让用户开始进行“接受性”练习,即用户接受新语言,但还不必做出反应。随着他们继续学习课程,他们将获得更多“成果性”练习,即他们必须写出翻译和回复或说出单词。

该技术不仅可以对用户进行评分,还可以评估不同练习的难度,并以此来确定整个体验中的课程顺序。

“我们知道一些普遍适用的难度问题。接受性(练习),翻译成英语,对每个人来说都会更容易,”布兰科说。“但根据你个人的错误和失误模式,它可以找出哪些练习对你来说比较棘手,哪些词汇和语法对你来说比较困难,我们可以根据你特定的学习模式进行个性化设置。”

他们从儿童学习方式中借鉴的另一个特点是所谓的隐性教学。这种理念认为,句子中的每个单词都不需要翻译和记忆,随着用户接触内容和课程,他们会开始注意句子中单词的顺序,并推断出语法在每种情况下是如何运作的。

[相关:麻省理工学院的科学家教机器人如何互相破坏]

“我们根本无法让成人的体验像儿童一样高效。儿童没有工作,他们有大量的时间,身边有许许多多的人,”布兰科说。“对于成人,我们永远无法创造那种体验。但我们可以做一些事情来加快速度。”

这是通过将隐性学习与更明确的指示、纠正或反馈相结合来实现的。“在我们更大的课程中,比如法语课程,你会得到更多关于不同类型错误的提示和信息,”布兰科说。“我们知道隐性学习可以让你学到更多类型的信息,但我们知道我们需要补充。”该算法有助于设定这些明确评论出现的频率以及针对哪些错误。例如,它可以辨别出简单的拼写错误和更大的语法问题。

Duolingo 正在开展的工作

Blanco 认为,许多新技术的发展让语音识别等挑战变得更容易。但他们使用的模型与典型的语言模型不同。“部分原因是我们的用例与客户服务聊天应用程序中使用的技术完全不同,”她说,因为 Duolingo 的用户本质上并不是他们选择学习的语言的母语熟练者。“客户服务聊天正在寻找特定的关键词,但他们也期望某些类型的措辞和语法。”他们的算法预计会出现某些类型的错误。

这项工作正在进行中。该团队正在尝试将这项技术从单纯的翻译转变为其他技术,尽管从计算上来说这更容易实现。

她说:“我觉得我们在有效语言教学方面的下一个前沿是如何处理开放式演讲和开放式问题。”

<<:  沃尔沃为何要开始“大规模选角”其新款电动汽车

>>:  Jelly Belly 生产可可豆的彩色工厂内部

推荐阅读

总统日最佳电脑和显示器优惠

总统日周末促销主要是让您尽情享受有趣但不必要的放纵,虽然我们坚决支持这一点,但您也可以节省购买职业装...

科普问答:NASA 如何选拔 2013 年宇航员

想当宇航员吗?NASA 去年结束了最新一轮宇航员招募,所以你得等几年才能再次看到该机构发布“招聘启事...

挥霍一把,买一台带研磨机和奶泡器的高端 De'Longhi 浓缩咖啡机,可节省 200 美元

好吧,所以你制定了新年省钱的决心,然后你马上就搞砸了。没关系。我们理解。你可以在二月份再试一次。不过...

电子游戏能告诉我们什么有关经济如何运作的信息?

2008 年 10 月 3 日,乔治·W·布什总统签署了《问题资产救助计划》法案,向破产银行提供 ...

档案中的片段:20 世纪 70 年代,蜂窝技术让“旅行电话”变得更加普及

为了纪念 150 周年,我们重新回顾了科普故事(成功和失败),这些故事有助于定义科学进步、理解和创新...

Facebook 在 2019 年 F8 大会上宣布的所有新功能

扎克伯格正在制定一项粗略计划,试图提升 Facebook 在隐私方面的声誉。Facebook Fac...

比格猎犬的常见疾病与全面防治指南

比格猎犬以活泼好动、亲人友善的性格著称,深受许多宠物爱好者的喜爱。尽管它们身体结实,通常健康状况良好...

超越梦境与现实界限的感人电影《尤梅莉亚》的魅力与评价

《尤梅莉亚》——在梦境与现实之间展开的青春奇幻故事《尤梅莉亚》是一部 12 集电视动画系列,于 20...

Alton Brown 的 Jet Cream

美食频道明星 Alton Brown 即将开始他的第二场全国烹饪综艺节目,即 Eat Your Sc...

Gambit 系列军用无人机及其独特用途指南

9 月 19 日,国防巨头通用原子公司公布了四款相关的无人机概念,均以 Gambit 为家族名称。该...

《橘馆与骗子》的魅力与评价:彻底剖析骗人的世界

“橘馆要躺角” - 橘馆三角 - 评论与推荐■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间20...

无头骑士分享她的秘密

每年十月的第一个星期六,成千上万的游客都会来到纽约州的沉睡谷这个阴森可怖的小村庄,参加一年一度的街头...

你现在可以购买 LG 售价 42,000 美元的 8K OLED 电视,但你可能不应该购买

如果你的房子是这样的,那么你就可以买一台第一代 8K 电视了。LG上周,LG 正式开始销售其 Sig...

方程式赛车计划如何利用更可持续的燃料为赛车提供动力

公路上很难有比一级方程式赛车更快的速度了,一级方程式赛车的最高时速可达 220 英里每小时。所谓的赛...

自 1900 年以来,美国已耗尽两个伊利湖的地下水

根据美国地质调查局的一项新研究,在过去一个世纪里,美国消耗的地下淡水足以填满伊利湖两次。这是了解我们...