AI 朗读员将免费为你朗读经典文学作品

AI 朗读员将免费为你朗读经典文学作品

录制有声读物不是一件容易的事,即使对于经验丰富的配音演员来说也是如此。但对有声读物的需求正在上升,Spotify 等大型流媒体平台正在为它们的发展搭建专门的空间。为了将创新与狂热融合,麻省理工学院和微软的研究人员正在使用人工智能从在线文本制作有声读物。在一个雄心勃勃的新项目中,他们正在与世界上历史最悠久、可能也是最大的开放许可电子书在线存储库古腾堡计划合作,制作 5,000 本由人工智能讲述的有声读物。这个系列包括《傲慢与偏见》《包法利夫人》《野性的呼唤》和《爱丽丝梦游仙境》等经典文学作品。三人于 9 月在 arXiv 上发表了关于他们努力成果的预印本。

“我们想要做的是制作大量免费有声读物,并将它们回馈给社区,”麻省理工学院计算机科学与人工智能实验室的博士生、该项目的首席研究员马克·汉密尔顿 (Mark Hamilton) 告诉 PopSci。“最近,神经文本转语音技术取得了很大进展,这些算法可以阅读文本,而且听起来很像人类。”

实现这一目标的神奇因素是神经文本转语音算法,该算法经过数百万个人类语音示例的训练,然后负责模仿人类语音。它可以生成不同语言中不同口音的不同声音,并且可以仅用五秒钟的音频创建自定义声音。“它们可以阅读你给的任何文本,而且阅读速度非常快,”汉密尔顿说。“即使你给它八个小时的文本,它也会在几分钟内完成。”

重要的是,该算法可以捕捉到诸如音调之类的细微差别,以及人类在阅读单词时添加的修改,例如电话号码或网站的读法、哪些内容组合在一起以及停顿在哪里。该算法基于微软的一些论文合著者之前的研究成果。

与大型语言模型一样,该算法严重依赖机器学习和神经网络。“核心部分相同,但输入和输出不同,”汉密尔顿解释道。大型语言模型接收文本并填补空白。他们使用这一基本功能来构建聊天应用程序。另一方面,神经文本转语音算法接收文本,通过相同类型的算法对其进行处理,但现在它们不是输出文本,而是输出声音,汉密尔顿说。

[相关:互联网档案馆刚刚在针对大型图书出版商的联邦诉讼中败诉]

“它们试图生成忠实于你输入的文本的声音。这也给了它们一点回旋余地,”他补充道。“它们可以发出它们认为解决任务所需的声音。它们可以改变、分组或改变发音,使其听起来更像人类。”

然后可以使用一种称为损失函数的工具来评估模型的表现是好还是坏。以这种方式实施人工智能可以加快 Librivox 等项目的努力,该项目目前使用人类志愿者制作公共领域作品的有声读物。

这项工作还远未完成。下一步是提高质量。由于古腾堡计划电子书是由人类志愿者创建的,因此每个制作电子书的人的做法都略有不同。他们可能会在意想不到的地方添加随机文本,电子书制作者放置页码、目录或插图的位置可能会因书而异。

“所有这些不同的东西都会导致有声读物产生奇怪的瑕疵,以及一些你根本不想听的东西,”汉密尔顿说。“北极星是开发更多更灵活的解决方案,利用良好的人类直觉来判断这些书中应该读什么,不应该读什么。”一旦他们搞定了这一点,他们希望利用这一点,以及人工智能语言技术的最新进展,将有声读物收藏扩展到古腾堡计划上的所有 60,000 本,甚至可能翻译它们。

目前,所有 AI 配音的有声读物都可以在 Spotify、Google Podcasts、Apple Podcasts 和 Internet Archive 等平台上免费播放。

这种算法有多种应用。它可以朗读剧本,并为每个角色分配不同的声音。它可以用你的声音模拟整本有声读物,这可以成为一份漂亮的礼物。然而,尽管有很多相当无害的方式来使用这项技术,但专家们此前曾对人工生成音频的缺点及其滥用的可能性表示担忧。

聆听下面的《野性的呼唤》。

<<:  谷歌正在悄悄地取消另一项有用的功能

>>:  这套巨型机甲套装售价 300 万美元

推荐阅读

公民科学是另一种伟大的自然疗法

2020 年,新冠肺炎疫情导致人们无法正常生活,而大自然成为许多被困家中的人们的避难所。随着疫情导致...

据报道,特斯拉希望通过整块车身底部实现“千兆传输”

据路透社最近的一篇报道,特斯拉从一开始就避开了传统的制造、设计和销售模式,该公司的最新举措可能涉及彻...

一头小虎鲸为濒临灭绝的鲸鱼群带来了一线希望

今年夏天,一头小虎鲸自 2011 年以来首次与当地的一群虎鲸一起在萨利希海(华盛顿州和不列颠哥伦比亚...

鬼太郎的大海兽篇:重新评价 60 年代的经典

《鬼太郎》——在电影院感受水木茂的世界1968年7月21日,根据水木茂的热门漫画《鬼太郎》改编的动画...

不同文化对时间的理解截然不同

忘掉手表的齿轮吧。这些齿轮和弹簧的集合也许能帮助我们追踪时间的流逝,但我们想象节奏的方式却更加微妙。...

仅供参考:人类为什么喜欢碳酸饮料?

饮用碳酸水至少从 1767 年开始就很流行,而且似乎没有消失。那么是什么让我们喜欢这种气泡水呢?目前...

冰菓 OAD 的详细评论和评分

冰菓 OAD - 冰菓 OAD 《冰菓OAD》是根据米泽帆信的小说改编的OVA,由KADOKAWA于...

Rolling☆Girls 的魅力与名声:从黑帮预告片看新视角

Rolling☆Girls Mob 预览 - 迷人的动漫世界2015年3月18日发售的《Rollin...

世界上最大的生物正被鹿活活吃掉

如果你参观犹他州的菲什莱克国家森林,你可能会觉得自己正在穿过一片巨大的颤杨树林。但在地下,所有这些树...

城市里的海蛇会因为奇怪的原因改变颜色

通常情况下,人类和海蛇不会在同一水域游动。这些爬行动物喜欢在偏远地区游动。它们往往有毒,所以人类通常...

适用于手机的最佳截图和屏幕录制应用程序

无论您想记录在应用程序中发现的奇怪错误,还是需要记录您的移动游戏实力以供后人参考,或者需要窃取朋友刚...

使用“精简版”应用程序提升手机速度

庞大、臃肿的应用程序会拖累您的智能手机,迫使您等待菜单加载和对话出现。解决方案:用轻量级版本替换您最...

这些古代鸟类的菜单上是否有岩石?

对郭氏渤海鸟胃中保存的晶体进行 X 射线检查有助于大致了解石英的化石形成时间。刘等人,IVPP如果回...

濒临灭绝的苏门答腊犀牛黛利拉迎来了第一只幼崽

11 月 25 日,一头健康的雄性苏门答腊犀牛在印度尼西亚西部的一个保护区出生。这对这种极度濒危的物...

新歌舞伎町故事:花之飞鸟组! - 回顾有吸引力的角色和深刻的故事

新歌舞伎町故事花之飞鸟组!概述《新歌舞伎町物语:花之飞鸟组!》于1987年6月12日作为OVA发行。...