人工智能耳机可以调成人群中的单个声音

人工智能耳机可以调成人群中的单个声音

领先品牌耳机和耳塞中嵌入的主动降噪 (ANC) 技术让世界变得更加安静。只需轻轻一按开关,咖啡店顾客和航空旅客就可以调低音量,或按下静音键,消除嘈杂的背景噪音和其他令人分心的闲聊。但是,当你在一片寂静的人群中听到一个人说话时,会发生什么?目前,耳机用户必须做出选择:继续静音整个声音环境或关闭降噪功能以进行对话。

这种在降噪和对话之间做出选择的情形有朝一日可能会成为过去,这得归功于华盛顿大学的研究人员设计的一种新型人工智能“目标语音听力”系统。在美国计算机协会最近发表的一篇论文中,研究人员声称,他们定制的概念验证耳机可以从人群中挑选出特定的声音,然后锁定该声音,同时消除周围的声音。耳机佩戴者只需直视说话者的脸,人工智能系统就会捕捉到充满其独特语音特征的声音信号。最终的结果是:耳机佩戴者可以与仍然配备降噪技术的人进行持续的对话。研究人员相信,这个系统有朝一日可以帮助部分听力受损的人,或者只是让在嘈杂环境中的交谈变得不那么混乱。

华盛顿大学保罗·G·艾伦计算机科学与工程学院教授、资深作者 Shyam Gollakota 在一份声明中表示:“在这个项目中,我们开发了人工智能来根据佩戴耳机的人的偏好来修改他们的听觉感知。有了我们的设备,即使你身处嘈杂的环境中,有很多人在说话,你现在也可以清楚地听到单个说话者的声音。”

改进后的耳机如何捕捉个人的声音

为了构建他们的系统,研究人员采用了一副现成的商用耳机,并为其配备了麦克风和板载 AI 神经网络。实际上,戴着耳机的人如果想单独辨别出某个说话者,只需直视该说话者,同时按下设备侧面的按钮即可。该按钮将启动一个称为“注册”的过程,在此过程中,耳机接收来自目标说话者的声音信号。该信号位于左右耳机上的麦克风中间,神经网络会实时分析该信号,以识别与该特定人相关的具体语音特征。然后,该数据被发送到另一个神经网络,该网络的任务是不断将目标说话者的信号与其他所有信号分离出来。

整个注册过程仅需三到五秒。一旦注册并专注于目标说话者,系统实际上会随着时间的推移而不断改进,因为它会不断接收越来越多的实时训练数据。耳机佩戴者也不需要尴尬地保持静止,盯着人的眼睛才能让系统工作。经过短暂的初始注册过程后,研究人员表示,人工智能耳机系统能够“锁定”语音信号,并在佩戴者转过头后继续跟踪它。这意味着佩戴耳机的人即使不再与说话者面对面,也可以听到孤立的声音。

“我们的方法的优势在于,佩戴者只需注视目标说话者几秒钟,在此期间我们就会识别目标说话者,”研究人员写道。“随后,佩戴者可以朝任何方向看,移动头部,或四处走动,同时仍能听到目标说话者的声音。”

在上面的视频中,华盛顿大学博士生马利克·伊塔尼演示了如何使用耳机在校园公共空间锁定一位同事,那里挤满了其他人。在注视同事几秒钟后,说话者略显低沉的声音突破了降噪雾,清晰可闻。两人在室外再次重复了测试,这次是在嘈杂的喷泉前,结果相似。一旦注册,耳机佩戴者便背对目标说话者,当他们漫步在大学校园时,可以继续听到他的声音。

华盛顿大学博士生、论文合著者 Bandhav Veluri 表示:“耳机系统利用人工智能技术提取马利克想要听到的声音,同时从那时起忽略环境中的所有声音。”

目标语音听力对于便利性和可访问性都大有裨益

以前,此类系统会首先尝试从扬声器捕捉干净、无噪音的音频,并将系统标识作为扬声器的特性。在这里,研究人员采用了不同的方法,选择构建一个即使在嘈杂环境中也能快速捕捉扬声器信号的系统。结果非常显著。研究​​人员声称,他们的系统使用不到五秒的训练数据就将信号清晰度提高了 7.01 dB。从更人性化的层面上讲,研究人员让 21 位不同的测试对象在现实世界的室外和室内环境中使用改进后的耳机,花费大约 420 分钟对信号清晰度进行评级。这些测试对象在使用系统时对目标说话者声音质量的平均评分几乎是不使用系统的两倍。

这个系统并不完美。目前,只有当目标说话者是房间中声音最大的人时,注册过程才会起作用。不过,研究人员乐观地认为,他们可以修改未来的系统来解决这个缺点。有朝一日,旅行者可以在人来人往的博物馆里使用这些耳机,专注于导游,同时屏蔽背景对话。一对在繁忙的城市街道上散步的朋友也可以使用这项技术继续交谈,而不会受到交通噪音的干扰。展望未来,研究人员表示,他们正在探索将这种新耳机柄嵌入品牌耳机和耳塞中的可能性。有朝一日,他们希望该系统可以作为助听器的辅助功能。

“人工智能,尤其是神经网络,在语音处理方面取得了巨大进步,”Veluri 说。“这个应用程序真的令人兴奋,对于有听力障碍的人来说尤其有用,因为他们想放大他们想听到的人的声音。”

伊塔尼补充道:“这可能会产生重大影响,可能会影响很多人。”

<<:  查看 B-21 核隐形轰炸机的首次官方飞行照片

>>:  谷歌的人工智能概览告诉你吃胶水。(别吃。)

推荐阅读

这款儿童科技套装可让他们打造自己的智能手表和虚拟宠物

为好奇的孩子寻找礼物很难。你想要一些可以帮助他们成长的东西,但让他们玩得开心也很重要。没有人希望在生...

这种古老的爬行动物以素食为主,非常致命

在这个化石星期五,我们想让你见见喙龙。这种古老的爬行动物是鳄鱼和现代鸟类的远亲,在 2.5 亿至 2...

仅供参考:膀胱真的会破裂吗?

只有在特殊情况下才会发生。“我的意思是,这不是任何走在街上憋尿时间太长的人都会发生的事,”芝加哥大学...

2012 年发明奖:加速康复的模块化铸件

凯莉·安德森在腕部手术两个月后拆下手臂石膏,但关节僵硬得连门把手都转不了。四个月后她才完全康复。丹尼...

猪鱼利用皮肤“看”东西

尖嘴的、栖息在礁石中的猪鱼散布在北卡罗来纳州和巴西之间的大西洋上,以其变色的皮肤而闻名。这些海洋变色...

重新评价魔法天使奶油真美的魅力与情感-深情的小夜曲

魔法天使奶油妈妈可爱的小夜曲 - 详细评论和推荐概述《魔法天使奶油真美:可爱的小夜曲》是1985年3...

《我的百合就是我的工作!》的魅力与评价:探索职场百合的新魅力

“我的百合就是我的工作!” - 描绘百合世界的新挑战电视动画《我的百合是一份工作!》于 2023 年...

由青蛙细胞制造的机器人已具备自我复制的能力

自然界中,大多数生物通过交配产生后代或克隆自身来繁殖。但一种新的繁殖方式已经出现——新型活体机器人可...

Hackintosh 日记,第 3 部分:安装和配置 OS X

现在您已经为运行 Mac OS X 的自制 Hackintosh PC 准备好了所有部件,是时候执行...

超薄“镜面膜”或将助力打造更大的太空望远镜

经过多年的设计和工程努力,詹姆斯·韦伯太空望远镜终于成功将有史以来最大的望远镜镜面送入太空。如今,詹...

啤酒科学:揭开大麦的秘密

上个月,科学家宣布大麦研究取得重大突破:他们终于完成了大麦全基因组测序。对此,一些媒体报道称这将以某...

学生创新的 3D 视觉系统获奖

本周,我很荣幸地为美国国家仪器公司的学生设计竞赛的获胜者加冕,学生们在竞赛中展示了他们使用 NI L...

唯有你万岁!歌舞表演俱乐部 - 深度回顾令人着迷的歌舞表演俱乐部体验

《Only You Viva!歌舞表演俱乐部》——一部描绘歌舞表演俱乐部世界的独特电视动画1998年...

《卡美拉-Rebirth-》的魅力与评价:全面解析新卡美拉世界

《GAMERA -Rebirth-》:Gamera 的新挑战及其魅力《GAMERA -Rebirth...

《七大罪:龙的裁决》评论:该系列第四季的吸引力何在?

《七大罪:龙的审判》:系列的巅峰之作和新的挑战《七大罪》系列是一部改编自铃木央原作漫画的人气动画,...