语言很难;需要训练有素的耳朵才能分辨出语言中的措辞、惯用语、语气、地域趋势和不断变化的侮辱性语言,这些才能让人真正流利地使用语言。这就是为什么即使是最好的应用程序和谷歌翻译也无法破解它的原因之一。同样,需要训练有素的语言学家才能知道这些单词是如何从一个词根发展而来的,它们仍然会发展成无数种形式,所有形式都表示着同一件事。狡猾的计算机能像聪明的语言学家一样解决这个问题吗?在这种情况下,答案可能是肯定的。 一种新的机器学习算法可以利用声音规则找出不断变化的语言中最有可能的语音变化。所有单词都会随着时间和地点的变化而变化,但某些元音和发音的变化会比其他元音和发音更大——你说的是tomato,我说的是tomahtoe,加拿大人说的是“aboot”,等等。温哥华不列颠哥伦比亚大学的亚历山大·布沙尔-科特和同事开发了一种系统,可以提示单词在过去的发音方式,以及哪些声音最有可能发生变化。然后,他们将结果与人类专家的分析进行了比较,发现85%的计算机建议都在正确单词的一个字符之内。 他们研究了 637 种不同的南岛语,这些语言横跨从菲律宾到夏威夷的太平洋。例如,他们从“星星”这个词开始。在斐济语中,这个词是kalokalo 。在台湾原住民语言 Pazeh 中,它是mintol 。说婆罗洲语马兰瑙的人称之为biten ,说菲律宾方言伊纳巴克农的人称之为bitu'on 。所有这些语言的词根都是bituquen 。计算机正确地推断出了这一点。 问题在于,在计算机进行分析之前,需要完成大量的前端工作。语言学家必须输入给定语言中的单词列表及其含义,并生成一种语言的“生命之树”——一种显示每个单词与其他单词之间关系的系统发育图。(它在形式和功能上都类似于植物学家和生物学家用来显示生命如何关联的系统发育图。)但当它开始工作时,该算法是高效的。它可以识别语言中的同源词,即具有相同词根的词,然后找出可能的词根。 研究人员承认,还有更多高级工作要做,但他们希望这将给历史语言学家带来福音,就像遗传信息改变生物学一样。形态变化——观察一个事物并观察它如何变化或与其他事物进行比较——比观察基因要简单得多。该算法可以以类似的方式工作,通过计算研究单词和语言的词根,而不是使用经过特殊训练的耳朵。这篇论文本周发表在《美国国家科学院院刊》上。 |
由警察和私人保安部队驾驶的军用 Cybertruck 可能很快就会在美国街头巡游——特斯拉首席执...
银河系约有 136.1 亿年历史。这个古老的星系既有我们自己的太阳系,也有 1000 亿到 4000...
一枚载有科学仪器、技术设备和……比特币(字面意思)的火箭即将飞向月球表面。联合发射联盟 (Unite...
《Shiranpuri》:NHK 经典歌曲以动画形式复活1983年2月在NHK教育电视台(现NHK ...
数字时代正在蓬勃发展,随之而来的是,对熟练 IT 专业人员的需求也随之增长。如果您曾经考虑过从事这一...
太阳喜欢提醒我们,地球只是整个系统的一部分。它发出的紫外线会灼伤我们的皮肤和眼睛,甚至导致灭绝。日食...
我们走吧!我们的Chimchim-chan!! - 我们走吧!我们的Chimchim-chan!!概...
Ponkikki Meisaku World - Ponkikki Meisaku World(第 ...
众所周知,OpenAI 和 Google 提供的大型语言模型需要大量的训练数据才能发挥作用。这些模型...
无可否认,我喜欢尼康的大多数产品。我不是那种从头到脚穿着尼康服装到处走动、谴责任何敢于使用佳能相机的...
“Mizudori”:NHK《大家的歌》中的珍品NHK教育电视台播出的《大家的歌》是一档深受儿童到...
气候变化正在加剧全球多种自然灾害和危险,从火灾到飓风。但根据对两个多世纪以来欧洲雪崩的分析,有一种危...
你不仅仅是一个数据点。选择退出功能可帮助你恢复隐私。在过去十年中, Ancestry.com 和 2...
柠檬的气味是洁净的气味。没有什么比刚打扫过的浴室(柠檬)、一尘不染的盘子(柠檬)或一尘不染的地板的气...
Blassreiter——一部以近未来德国为背景的黑暗幻想小说。 2008 年播出的电视动画《Bla...