AI 朗读员将免费为你朗读经典文学作品

AI 朗读员将免费为你朗读经典文学作品

录制有声读物不是一件容易的事,即使对于经验丰富的配音演员来说也是如此。但对有声读物的需求正在上升,Spotify 等大型流媒体平台正在为它们的发展搭建专门的空间。为了将创新与狂热融合,麻省理工学院和微软的研究人员正在使用人工智能从在线文本制作有声读物。在一个雄心勃勃的新项目中,他们正在与世界上历史最悠久、可能也是最大的开放许可电子书在线存储库古腾堡计划合作,制作 5,000 本由人工智能讲述的有声读物。这个系列包括《傲慢与偏见》《包法利夫人》《野性的呼唤》和《爱丽丝梦游仙境》等经典文学作品。三人于 9 月在 arXiv 上发表了关于他们努力成果的预印本。

“我们想要做的是制作大量免费有声读物,并将它们回馈给社区,”麻省理工学院计算机科学与人工智能实验室的博士生、该项目的首席研究员马克·汉密尔顿 (Mark Hamilton) 告诉 PopSci。“最近,神经文本转语音技术取得了很大进展,这些算法可以阅读文本,而且听起来很像人类。”

实现这一目标的神奇因素是神经文本转语音算法,该算法经过数百万个人类语音示例的训练,然后负责模仿人类语音。它可以生成不同语言中不同口音的不同声音,并且可以仅用五秒钟的音频创建自定义声音。“它们可以阅读你给的任何文本,而且阅读速度非常快,”汉密尔顿说。“即使你给它八个小时的文本,它也会在几分钟内完成。”

重要的是,该算法可以捕捉到诸如音调之类的细微差别,以及人类在阅读单词时添加的修改,例如电话号码或网站的读法、哪些内容组合在一起以及停顿在哪里。该算法基于微软的一些论文合著者之前的研究成果。

与大型语言模型一样,该算法严重依赖机器学习和神经网络。“核心部分相同,但输入和输出不同,”汉密尔顿解释道。大型语言模型接收文本并填补空白。他们使用这一基本功能来构建聊天应用程序。另一方面,神经文本转语音算法接收文本,通过相同类型的算法对其进行处理,但现在它们不是输出文本,而是输出声音,汉密尔顿说。

[相关:互联网档案馆刚刚在针对大型图书出版商的联邦诉讼中败诉]

“它们试图生成忠实于你输入的文本的声音。这也给了它们一点回旋余地,”他补充道。“它们可以发出它们认为解决任务所需的声音。它们可以改变、分组或改变发音,使其听起来更像人类。”

然后可以使用一种称为损失函数的工具来评估模型的表现是好还是坏。以这种方式实施人工智能可以加快 Librivox 等项目的努力,该项目目前使用人类志愿者制作公共领域作品的有声读物。

这项工作还远未完成。下一步是提高质量。由于古腾堡计划电子书是由人类志愿者创建的,因此每个制作电子书的人的做法都略有不同。他们可能会在意想不到的地方添加随机文本,电子书制作者放置页码、目录或插图的位置可能会因书而异。

“所有这些不同的东西都会导致有声读物产生奇怪的瑕疵,以及一些你根本不想听的东西,”汉密尔顿说。“北极星是开发更多更灵活的解决方案,利用良好的人类直觉来判断这些书中应该读什么,不应该读什么。”一旦他们搞定了这一点,他们希望利用这一点,以及人工智能语言技术的最新进展,将有声读物收藏扩展到古腾堡计划上的所有 60,000 本,甚至可能翻译它们。

目前,所有 AI 配音的有声读物都可以在 Spotify、Google Podcasts、Apple Podcasts 和 Internet Archive 等平台上免费播放。

这种算法有多种应用。它可以朗读剧本,并为每个角色分配不同的声音。它可以用你的声音模拟整本有声读物,这可以成为一份漂亮的礼物。然而,尽管有很多相当无害的方式来使用这项技术,但专家们此前曾对人工生成音频的缺点及其滥用的可能性表示担忧。

聆听下面的《野性的呼唤》。

<<:  谷歌正在悄悄地取消另一项有用的功能

>>:  这套巨型机甲套装售价 300 万美元

推荐阅读

乌鸦普塔:一篇深入探讨迷人情节和人物的评论

乌鸦普塔——两个令人难忘的故事1995年作为动画电视连续剧播出的《乌鸦普塔》虽然播出时间较短,但却给...

男子误将女友当成机器人

这是丹佛科学会议的第四天——二月份的四天,会议中心非常繁忙,走廊很长,灯光明亮,严肃的科学家在漆黑的...

“象牙女士”墓中的宝藏揭示了铜器时代女性的非凡力量

破解过去的性别不平等和误解正成为热门话题。过去几周,研究揭穿了男性是狩猎者、女性是采集者的神话,我们...

『Kamotori Gonbei』的魅力与评价:绝对不能错过的动漫体验

《小鸭子权兵卫》:日本动画史上的经典之作■作品概要《鸭子和猪》是一部日本动画电影,于 1958 年上...

OVA《长门有希消失记》的号召力与评价

OVA《长门有希消失记》的魅力和详细说明■作品概要《长门有希酱的消失》是改编自谷川流的轻小说《凉宫春...

1968 年《大众科学》如何报道《2001:太空漫游》

未来已至。这是您看完《2001:太空漫游》离开影院时的感觉,这是有史以来最逼真的科学冒险电影。它采用...

新潜艇战舰:全面回顾深海冒险与动人故事

新海廷军馆的综合评价与推荐■ 公共媒体卵子■ 原创媒体动漫原创■ 发布日期1995 年 12 月 1...

“行走”机器人的人工智能设计是一个柔软的紫色球体

几年前,萨姆·克雷格曼和他的同事们因他们的“异种机器人”登上了头条新闻——这种机器人是由人工智能设计...

奥巴塔里安:欣赏极度幽默与深刻主题的融合

《Obatarian》——独特幽默和社会讽刺的杰作概述《Obatarian》是 1990 年在朝日电...

《SUPER LOVERS》的魅力与评价:BL粉丝必看的动画

SUPER LOVERS 的全面评论和推荐概述《SUPER LOVERS》是 2016 年播出的电视...

回顾 2009 年 100 项最佳创新

如果你和我一样,假期就是阅读大家的年终总结——当然,还有展望来年。我们在 PopSci.com 上短...

莎莎舞很好,很好 彻底解析《大家的歌》的魅力

“萨尔萨舞很好,很好”:NHK 动画短片的趣味性和教育价值《Salsa Is Good, It...

一只“雄性”章鱼让饲养员大吃一惊,它产下了一万只章鱼宝宝

佐治亚大学海洋教育中心和水族馆最近获得了一只普通章鱼,但结果却出乎意料。他们以为这是一只雄性章鱼,于...

如何阻止网站跟踪你

从将笔记本电脑或手机连接到互联网的那一刻起,你就必须接受有人在跟踪你的事实。如果这让你感到不安,你应...

氨“糊状球”可能在木星上引发奇怪的闪电

木星天气预报多云,可能会出现“蘑菇球”。这颗被漩涡笼罩的行星上,数百年来,猛烈的风暴肆虐其表面,风速...