您在便携式音乐播放器上收听的音乐文件(无论是 MP3、AAC 还是 WMA)在准确重现原始录音声音方面非常糟糕。但直到现在才知道它们到底有多糟糕。 音频数据压缩的核心非常简单。软件通过删除冗余部分并在离散时间段内近似音频信号来压缩数字音频数据。采样时间段越大,近似值越不精确。这就是为什么高采样率(短采样时间)的 MP3 质量高于低采样率的 MP3 的原因。 为了测试人耳是否足够准确,能够辨别音频压缩算法的某些理论极限,纽约洛克菲勒大学的物理学家 Jacob N. Oppenheim 和 Marcelo O. Magnasco 为测试对象播放了音调。研究人员想看看受试者是否能区分音调的时间和它们之间的频率差异。这项研究的基本依据是,几乎所有的音频压缩算法,如 MP3 编解码器,都是基于线性预测模型推断信号的,而这种模型是在科学家了解人类听觉系统工作原理的更精细细节之前很久就开发出来的。这个线性模型认为,声音的时间和频率有特定的截止极限:也就是说,在某个时刻,两个音调在频率或时间上非常接近,以至于人听不出差别。此外,时间和频率是相关的,一个轴(比如时间)的精度越高,另一个轴的精度就越低。如果人类听觉遵循线性规则,我们就不应该听出高质量文件和原始录音之间的质量下降(给定足够高的采样率 - 我们说的不是一些可怕的 192kbps 翻录)。 实验分为五项任务,要求受试者聆听参考音调和不同于参考音调的音调。这些任务测试以下内容: 1) 仅限频率差异 我想很多发烧友都不会对此感到惊讶,但人类的听觉绝对没有线性响应曲线。事实上,在任务 5(被认为是最复杂的任务)中,许多测试对象能够听出音调之间的差异,其敏锐度比线性模型预测的高出 13 倍。最善于区分音调时间和频率差异的人是音乐家。其中一位电子音乐家可以区分相隔约三毫秒的音调——这很了不起,因为一个音调周期仅持续 2.27 毫秒。同一受试者在频率区分方面的表现不如其他人。另一位专业音乐人擅长频率区分,并擅长音调的时间区分。 更有趣的是,研究人员发现,作曲家和指挥家在任务 5 上的整体表现最好,因为他们必须能够辨别整个交响乐团中许多同时出现的音符的频率和时间。最后,研究人员发现,大多数测试对象的时间敏锐度(辨别音符之间的时间差异)比频率敏锐度要好得多。 那么,这一切意味着什么呢?作者直截了当地指出,音频工程师应该重新考虑他们处理音频压缩的方法——并且可能完全抛弃他们用于实现这种压缩的线性模型。他们还建议,重新审视音频处理算法将改进语音识别软件,并可能应用于声纳研究或射电天文学。这真是太棒了。但我不能说我期待在这些编解码器可用后重新翻录我的整个音乐收藏。 |
ChatGPT 是强大人工智能工具最著名的例子,当微软决定将聊天机器人集成到他们的搜索引擎中时,科技...
麻省理工学院的计算机科学家团队可能刚刚解决了数字时代最令人烦恼的问题之一,而这个问题主要设备制造商似...
绕个弯子,是的。但首先我们必须加热大气层,因为火星表面温度约为 -58°F。“我们知道如何加热行星;...
一部恐怖电影中最后一个幸存的主角在夜晚穿过一间漆黑的房子,一只手捂住嘴巴,抑制自己的呼吸声。他们显然...
Sonoma 是即将推出的 macOS 版本,它有一些非常酷的功能,包括将小部件放在桌面上。但操作系...
无论是毒害敌人、溺毙敌人,还是让敌人脱水,人类长期以来一直在为争夺水资源而战。立石只是最近的一次。公...
Windows 11 即将发布,但很多人仍然不确定如何在计算机上安装它。对于大多数人来说,这个过程...
以色列国防军正准备部署一条身披伪装、携带摄像头的机器蛇。这款间谍机器人利用源自真实蛇的运动原理,在裂...
美国心理学协会的一份报告试图将暴力电子游戏的科学研究与正在进行的争论调和起来。(顺便说一句,这份报告...
《Kamukamo Shikamonidomo Kamo!》的吸引力和评价“鸭鸭鹿兽鸭!”是一部仅有...
Genesis Climbbear MOSPEADA Love Live Alive - 一个感人至...
康帕内拉的祝福 OVA - 康帕内拉的祝福 OVA概述《Campanella Blessing OV...
“超人国王盖纳”:出埃及记未来与超人的故事《OVERMAN KING GAINER》是富野由悠季导演...
亚马逊旗下的自动驾驶汽车公司 Zoox 昨日宣布,已在加利福尼亚州福斯特城的公共道路上成功测试了其未...
螺旋星系旋转臂的惊人视觉效果是我们星系和其他星系所能提供的一些令人惊叹的图像。詹姆斯韦伯太空望远镜 ...