语言很难;需要训练有素的耳朵才能分辨出语言中的措辞、惯用语、语气、地域趋势和不断变化的侮辱性语言,这些才能让人真正流利地使用语言。这就是为什么即使是最好的应用程序和谷歌翻译也无法破解它的原因之一。同样,需要训练有素的语言学家才能知道这些单词是如何从一个词根发展而来的,它们仍然会发展成无数种形式,所有形式都表示着同一件事。狡猾的计算机能像聪明的语言学家一样解决这个问题吗?在这种情况下,答案可能是肯定的。 一种新的机器学习算法可以利用声音规则找出不断变化的语言中最有可能的语音变化。所有单词都会随着时间和地点的变化而变化,但某些元音和发音的变化会比其他元音和发音更大——你说的是tomato,我说的是tomahtoe,加拿大人说的是“aboot”,等等。温哥华不列颠哥伦比亚大学的亚历山大·布沙尔-科特和同事开发了一种系统,可以提示单词在过去的发音方式,以及哪些声音最有可能发生变化。然后,他们将结果与人类专家的分析进行了比较,发现85%的计算机建议都在正确单词的一个字符之内。 他们研究了 637 种不同的南岛语,这些语言横跨从菲律宾到夏威夷的太平洋。例如,他们从“星星”这个词开始。在斐济语中,这个词是kalokalo 。在台湾原住民语言 Pazeh 中,它是mintol 。说婆罗洲语马兰瑙的人称之为biten ,说菲律宾方言伊纳巴克农的人称之为bitu'on 。所有这些语言的词根都是bituquen 。计算机正确地推断出了这一点。 问题在于,在计算机进行分析之前,需要完成大量的前端工作。语言学家必须输入给定语言中的单词列表及其含义,并生成一种语言的“生命之树”——一种显示每个单词与其他单词之间关系的系统发育图。(它在形式和功能上都类似于植物学家和生物学家用来显示生命如何关联的系统发育图。)但当它开始工作时,该算法是高效的。它可以识别语言中的同源词,即具有相同词根的词,然后找出可能的词根。 研究人员承认,还有更多高级工作要做,但他们希望这将给历史语言学家带来福音,就像遗传信息改变生物学一样。形态变化——观察一个事物并观察它如何变化或与其他事物进行比较——比观察基因要简单得多。该算法可以以类似的方式工作,通过计算研究单词和语言的词根,而不是使用经过特殊训练的耳朵。这篇论文本周发表在《美国国家科学院院刊》上。 |
以色列与哈马斯支持的武装分子在加沙地带的冲突持续了整个周末,直到今天,加沙地带的死亡人数已接近 10...
《无奈的等待》——NHK经典动画《等待一无所有》是一部两分钟的短篇动画片,于1973年8月在NHK教...
《暴风雨之夜》——友谊与冲突的故事《暴风雨之夜》是一部日本动画电影,于2005年12月10日上映。该...
“我发现了一根蓝色的羽毛!” 《少年的故事》的魅力与评价——从绘本到动画的感人旅程“我发现了一根蓝...
根据对这块古老太空岩石的最新研究表明,这块来自火星的独一无二的陨石具有意想不到的化学性质,可以完善科...
12 月 25 日,一架涂有鲜黄色机身底漆的新型歼-20 战斗机在成都航空工业公司 (CAC) 工厂...
天文学家最近探测到一次爆炸,其规模如此之大,他们将其命名为 BOAT,即有史以来最明亮的爆炸。这次爆...
零排放汽车、人工智能和自充电设备正在帮助改造和更新过去几个世纪的一些最重要的技术。由于太阳能电池板更...
当太阳在中国济南附近的群山间落下时,妮可·阿贝德坐在一个狭窄的山洞口,看着一群蝙蝠从洞口出来。与人类...
这个故事最初刊登在《田野与溪流》杂志上。每个人都应该花一周时间划独木舟——如果不是每年,至少一生一次...
坦桑尼亚干旱土地上的养牛农民。Pixabay人类的生存依赖于水。水可以维持生命,滋养土地。几个世纪以...
经过五年的太阳系之旅,朱诺号太空飞船于 7 月成功抵达木星,人们兴奋不已。完美的发动机点火使这艘太阳...
除非你一直生活在与世隔绝的地方——没有 Wi-Fi——否则你一定知道可穿戴技术是下一件大事。从戒指到...
夏季,农村地区的观星者习惯于看到几颗卫星划过天空。但在未来几年,目光敏锐的业余爱好者可能能够发现数百...
周二,流媒体巨头 Spotify 推出了其首款硬件。这款设备被称为“Car Thing”,旨在让听众...