AI 朗读员将免费为你朗读经典文学作品

AI 朗读员将免费为你朗读经典文学作品

录制有声读物不是一件容易的事,即使对于经验丰富的配音演员来说也是如此。但对有声读物的需求正在上升,Spotify 等大型流媒体平台正在为它们的发展搭建专门的空间。为了将创新与狂热融合,麻省理工学院和微软的研究人员正在使用人工智能从在线文本制作有声读物。在一个雄心勃勃的新项目中,他们正在与世界上历史最悠久、可能也是最大的开放许可电子书在线存储库古腾堡计划合作,制作 5,000 本由人工智能讲述的有声读物。这个系列包括《傲慢与偏见》《包法利夫人》《野性的呼唤》和《爱丽丝梦游仙境》等经典文学作品。三人于 9 月在 arXiv 上发表了关于他们努力成果的预印本。

“我们想要做的是制作大量免费有声读物,并将它们回馈给社区,”麻省理工学院计算机科学与人工智能实验室的博士生、该项目的首席研究员马克·汉密尔顿 (Mark Hamilton) 告诉 PopSci。“最近,神经文本转语音技术取得了很大进展,这些算法可以阅读文本,而且听起来很像人类。”

实现这一目标的神奇因素是神经文本转语音算法,该算法经过数百万个人类语音示例的训练,然后负责模仿人类语音。它可以生成不同语言中不同口音的不同声音,并且可以仅用五秒钟的音频创建自定义声音。“它们可以阅读你给的任何文本,而且阅读速度非常快,”汉密尔顿说。“即使你给它八个小时的文本,它也会在几分钟内完成。”

重要的是,该算法可以捕捉到诸如音调之类的细微差别,以及人类在阅读单词时添加的修改,例如电话号码或网站的读法、哪些内容组合在一起以及停顿在哪里。该算法基于微软的一些论文合著者之前的研究成果。

与大型语言模型一样,该算法严重依赖机器学习和神经网络。“核心部分相同,但输入和输出不同,”汉密尔顿解释道。大型语言模型接收文本并填补空白。他们使用这一基本功能来构建聊天应用程序。另一方面,神经文本转语音算法接收文本,通过相同类型的算法对其进行处理,但现在它们不是输出文本,而是输出声音,汉密尔顿说。

[相关:互联网档案馆刚刚在针对大型图书出版商的联邦诉讼中败诉]

“它们试图生成忠实于你输入的文本的声音。这也给了它们一点回旋余地,”他补充道。“它们可以发出它们认为解决任务所需的声音。它们可以改变、分组或改变发音,使其听起来更像人类。”

然后可以使用一种称为损失函数的工具来评估模型的表现是好还是坏。以这种方式实施人工智能可以加快 Librivox 等项目的努力,该项目目前使用人类志愿者制作公共领域作品的有声读物。

这项工作还远未完成。下一步是提高质量。由于古腾堡计划电子书是由人类志愿者创建的,因此每个制作电子书的人的做法都略有不同。他们可能会在意想不到的地方添加随机文本,电子书制作者放置页码、目录或插图的位置可能会因书而异。

“所有这些不同的东西都会导致有声读物产生奇怪的瑕疵,以及一些你根本不想听的东西,”汉密尔顿说。“北极星是开发更多更灵活的解决方案,利用良好的人类直觉来判断这些书中应该读什么,不应该读什么。”一旦他们搞定了这一点,他们希望利用这一点,以及人工智能语言技术的最新进展,将有声读物收藏扩展到古腾堡计划上的所有 60,000 本,甚至可能翻译它们。

目前,所有 AI 配音的有声读物都可以在 Spotify、Google Podcasts、Apple Podcasts 和 Internet Archive 等平台上免费播放。

这种算法有多种应用。它可以朗读剧本,并为每个角色分配不同的声音。它可以用你的声音模拟整本有声读物,这可以成为一份漂亮的礼物。然而,尽管有很多相当无害的方式来使用这项技术,但专家们此前曾对人工生成音频的缺点及其滥用的可能性表示担忧。

聆听下面的《野性的呼唤》。

<<:  谷歌正在悄悄地取消另一项有用的功能

>>:  这套巨型机甲套装售价 300 万美元

推荐阅读

弁庆VS牛若:描绘传奇对决的动画的魅力与评价

《弁庆与牛若》:日本动画的开端之作■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期1939 年 7 ...

《Green Green》的魅力与评价:透彻解读这部青春恋爱喜剧杰作

《绿色绿色》:乡村和城市生活的成长故事《Green Green》是 Starlink 于 2002 ...

很尊贵!第三棒球部——全面回顾青春与热血的棒球故事

很尊贵!第三棒球部-Maimon!第三野球部■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间19...

黑松露陷入困境

科学家保罗·托马斯 (Paul Thomas) 不会忘记他第一次撕开从法国订购的松露包装时的情景,此...

改变世界的四起实验室事故

事情的起因是明尼苏达州圣保罗的一个烧杯破碎。3M 化学家 Patsy Sherman 正在研究一种合...

在 6,000 个大气压下榨汁,可快速制作新鲜的现调鸡尾酒

Atomic Fizz 现调 Camper English在拉斯维加斯的新 T-Mobile 竞技场...

赤潮毁坏了佛罗里达的海洋生物长达 16 个月。原因何在?

佛罗里达问题:特别报道。农作物苦苦挣扎。含盐层含盐量高。野生动物入侵。成堆的死鱼。阳光之州的海滩、农...

看不见的洋流:盲人海洋学家追逐海底风暴

当我们穿过贝尔岛海峡,驶离纽芬兰岛的背风处时,大副从舰桥传来指令:系好或收好所有物品。前方天气恶劣。...

如何不吃东西就吃

我们对食物的依赖已经过时了。因此,人们认为:购买和准备食物需要时间和精力,而且食物可能缺乏营养(我们...

参议员 Tammy Duckworth 描述了她的黑鹰直升机被击落的那一天

以下是改编自Tammy Duckworth 所著《每一天都是一份礼物》的摘录。当我们的黑鹰直升机飞过...

《斯特拉的魔法OVA》的魅力与评价:粉丝必看的特别版

《斯特拉的魔法》OVA的魅力与评价《斯特拉的魔法》是一部根据黑羽优原作漫画改编的OVA,由角川媒体工...

三级飓风罗斯林袭击墨西哥,引发山体滑坡、洪水泛滥和强风

昨天,强大的 3 级飓风罗斯林在墨西哥纳亚里特州圣克鲁斯附近登陆。这个海滨小镇位于热门度假胜地巴亚尔...

Meine Liebe Wieder - 对引人入胜的故事和人物深度的全面回顾

Meine Liebe wieder——青春的重聚和新的挑战■ 公共媒体电视动画系列■ 原创媒体游戏...

大藏爷爷和鹅:感人的故事及其评论

大藏爷爷和鹅——一部被改编成电影的温馨童话1996年2月上映的《大藏爷爷和鹅们》是一部以童话故事为主...

牛粪可能使更清洁的氢气成为现实

科学家们表示,他们在生产可持续、高效氢燃料的竞赛中发现了一个意想不到的盟友——牛粪。根据伊利诺伊大学...