这种人工智能可以利用声音来揭示看不见的空间的结构

这种人工智能可以利用声音来揭示看不见的空间的结构

想象一下,你走过一系列房间,越来越靠近声源,无论是扬声器播放的音乐还是说话的人。当你穿过这个迷宫时,你听到的噪音会根据你所在的位置而扭曲和波动。考虑到这样的场景,麻省理工学院和卡内基梅隆大学的一组研究人员一直在研究一个模型,该模型可以真实地描绘听众在穿过某个空间时周围的声音如何变化。他们上周在一篇新的预印本论文中发表了关于这个主题的研究成果。

我们在世界上听到的声音会因各种因素而有所不同,例如声波在何种空间中反弹、它们撞击或穿过何种材料以及它们需要传播多远。这些特征会影响声音的散射和衰减方式。但研究人员也可以逆向工程这一过程。他们可以采集声音样本,甚至用它来推断环境是什么样的(在某些方面,这就像动物使用回声定位来“看”一样)。

“我们主要在模拟空间声学,所以重点是混响,”麻省理工学院研究生兼论文作者杜逸伦 (Yilun Du) 表示。“如果你在音乐厅,可能会有很多混响;如果你在大教堂,可能会有很多回声;而如果你在小房间里,实际上没有任何回声。”

他们的模型称为神经声学场(NAF),这是一个神经网络,可以解释声源和听众的位置,以及声音传播的空间的几何形状。

为了训练 NAF,研究人员向其输入了有关场景的视觉信息和一些音频声谱图(捕捉声音的幅度、频率和持续时间的视觉模式表示),这些音频是从听众在不同有利位置和位置听到的声音收集的。

“我们拥有少量的数据点;我们以此为基础,建立某种模型,可以准确合成房间内任何位置的声音,以及新位置的声音,”杜说。“一旦我们建立好这个模型,你就可以模拟各种虚拟漫游。”

该团队使用了从虚拟模拟房间获得的音频数据。“我们在真实场景中也取得了一些成果,但问题是在现实世界中收集这些数据需要花费大量时间,”杜指出。

利用这些数据,模型可以学会预测听众听到的声音在移动到另一位置时会如何变化。例如,如果音乐来自房间中央的扬声器,如果听众走近扬声器,声音会变得更大,如果听众走进另一个房间,声音会变得更低沉。NAF 还可以利用这些信息预测听众周围世界的结构。

这种模型的一大应用领域是虚拟现实,这样就可以为在虚拟现实空间中移动的听众准确地生成声音。他认为,这种模型的另一大应用领域是人工智能。

“我们有很多视觉模型。但感知不仅限于视觉,声音也很重要。我们也可以想象这是利用声音进行感知的尝试,”他说。

声音并不是研究人员利用人工智能研究的唯一媒介。如今的机器学习技术可以拍摄 2D 图像,并利用它们生成物体的 3D 模型,从而提供不同的视角和新视图。这种技术在虚拟现实环境中非常有用,工程师和艺术家必须在屏幕空间中构建真实感。

此外,像这种专注于声音的模型可以增强当前传感器和设备在弱光或水下条件下的表现。“声音还能让你看到角落。根据照明条件,变化很大。物体看起来非常不同,”杜说。“但声音在大多数情况下都是一样的。这是一种不同的感官方式。”

目前,他们模型进一步发展的主要限制因素是缺乏信息。“有一件事出乎意料地困难,那就是获取数据,因为人们还没有深入研究过这个问题,”他说。“当你试图在虚拟现实中合成新奇的视角时,会有大量数据集,所有这些数据集都是真实的图像。有了更多的数据集,探索更多这样的方法将会非常有趣,尤其是在真实场景中。”

观看(并聆听)以下虚拟空间的演示:

<<:  Meta 遭遇公司历史上“最严重衰退” 裁员逾 11,000 人

>>:  Apple 清楚地知道你对其应用的使用频率

推荐阅读

BUDDHA2 手冢治虫的佛陀-无尽的旅程 - 评论:史诗故事与深刻主题的融合

手冢治虫的佛陀-无尽的旅程-详细评论和推荐概述《手冢治虫之佛陀:无尽的旅程》是2014年上映的动画电...

您的 iPhone 充电声音很无趣。请让它说“给我充电!”。

如果您有 Apple 移动设备,您就会知道充电时会发出什么声音。它很简单,而且工作得很好,但很无聊。...

《真女神转生D Children Light&Dark》的魅力与评价:深度故事与策略的融合

真女神转生D Children Light&Dark:源自游戏的冒险《真·女神转生 D Childr...

气候变化可能并未像我们想象的那样消灭那么多物种

人类正在通过全球科学实验来检验生态系统,即气候变化。随着生物喜欢的气候海拔升高或向极地移动(或彻底被...

《神凪》评论:巫女的迷人故事

神凪疯狂巫女 - 神与男孩的迷人故事《神凪:疯狂的巫女》于 2008 年 10 月至 12 月播出,...

喇叭鱼利用其他鱼类作为伪装

珊瑚礁是生物多样性的聚集地,大约有 25% 的已知海洋物种都栖息于此。这些珊瑚礁是许多互利关系的家园...

《千剑客》评论:一个由迷人人物和深刻故事编织而成的动人世界

千手诗的全面评论和推荐■ 公共媒体电视动画系列■ 原创媒体游戏■ 播出时间2018年7月3日 - 2...

地狱少女:Yoi no Kake 评论:新的恐怖和深刻的故事吸引力

《地狱少女:夕阳碎片》:深刻的故事和吸引力《地狱少女:夕阳下的余晖》是2017年播出的电视动画,作为...

你能闻出波本威士忌和黑麦威士忌的区别吗?

威士忌爱好者会告诉你,波本威士忌和黑麦威士忌的口味相差甚远。波本威士忌更甜,是老式威士忌的完美主打。...

不要错过:BOGO 无人机优惠今晚结束!

无人机 FOMO 是真实存在的。无论你是在看你的好友还是 YouTuber Casey Neista...

心形鸡尾酒色彩缤纷:领略鲜艳色彩和故事的魅力

“五彩缤纷的心形鸡尾酒”:5分钟的多彩情感2023年3月28日至29日在NHK综合电视台播出的《彩色...

经过令人难以置信的努力,“好奇号”火星探测器成功着陆火星

加利福尼亚州帕萨迪纳 — 太空迷们,举杯庆祝吧:美国宇航局的这辆配备激光、武器强大、大小与汽车相当的...

土豆:透彻解析《大家的歌》的魅力与情感

《土豆》——回顾大家的代表作歌曲1968年8月在NHK教育电视台(现NHK E-Tele)播出的《土...

旧金山雾制成迷雾马提尼酒

Chris Fogliatti 和他的捕雾器,图片由 Hangar One 提供今天,Hangar ...

越南旅游去哪玩最好玩?越南最值得一游的城市是哪一座?

许多人在计划越南旅行时都会陷入选择困难:「究竟是去胡志明市、芽庄、河内,还是岘港?」每个城市都有其独...