观鸟者大饱眼福:康奈尔大学的 Merlin 应用程序现已成为鸟类识别的一站式商店

观鸟者大饱眼福:康奈尔大学的 Merlin 应用程序现已成为鸟类识别的一站式商店

去年,随着疫情封锁限制措施在美国实施,新的鸟类爱好者纷纷涌向免费的 Merlin Bird ID 应用程序。这款由康奈尔鸟类学实验室开发的应用程序之前曾允许用户通过描述或照片来识别附近的神秘鸟类。今年夏初,它又增加了一项更酷的功能:能够根据鸟鸣、鸣叫或叫声的短音频片段来识别鸟类。

从 2020 年 3 月开始,Merlin 团队发现应用程序下载量有所上升,这一趋势一直持续。“我们不仅获得了更多的下载量,而且活跃用户的数量也在持续增长,”Merlin 的项目协调员德鲁·韦伯 (Drew Weber) 说。今年春天,有 120 万人(并且还在增加)使用 Merlin。“人们正在下载它,了解鸟类,尽管封锁等现实正在发生变化,但今年他们仍然对鸟类感兴趣,”他说。“它似乎激起了他们的兴趣,并保持了他们的兴趣。”

此时,鸟类新闻正在飞速传播,尤其是在纽约市,一些珍稀鸟类已经上升到名人地位。 《纽约时报》上刊登了横斑林鸮和雪鸮的报道,2018 年《纽约杂志》对鸳鸯进行了报道,仿佛它是下一个值得了解的鸟类影响者。

声音识别功能于 6 月在 Merlin 上首次亮相,并已收到观鸟界的积极响应。新的声音识别功能现在与基于机器学习的照片识别工具一起推出,该工具于 2015 年左右向用户推出。

“在声音识别发布之前,我认为我们收到的最大反馈是‘我以为你可以用这个应用程序通过声音识别鸟类!’或者‘鸟类的 Shazam 在哪里?’因此,真正将它提供给人们真的很酷,”韦伯说。

还有其他一些通过声音识别鸟类的方法,包括 Bird Genie、Song Sleuth 和 Smart Bird ID。许多方法都使用基于机器学习的算法,但由于背景噪音和鸟叫声的个体差异,结果的准确性可能会有所不同。

Merlin 已经是一款成熟的鸟类指南应用。除了更先进的工具外,它还提供了常规目测识别的演练流程,这对鸟类初学者来说很有用。

Merlin 声音 ID 的工作原理如下

通过 Merlin,观鸟者可以打开手机的麦克风,让它聆听周围的环境。然后,该应用程序会提示鸟儿在唱歌或叫什么。该应用程序拾取的音频也会转换成视觉模式表示,即频谱图,它可以捕捉声音的振幅、频率和持续时间。

“一旦你有了树上真实鸟的图像或频谱图形式的音频特征,你就可以使用强大的计算机视觉工具开始构建模型来识别这些模式,”Merlin 项目首席研究员 Grant Van Horn 说。

除了声音识别外,使用该应用程序识别鸟类的其他方法还包括手动输入其身体特征和上传照片。

公民科学的巨大壮举

人工智能系统需要数据,当然,数据首先需要存在。

在这种情况下,该项目需要一些严肃的公民科学。如果没有鸟类学实验室的麦考利图书馆数据库,照片 ID 功能和较新的声音 ID 选项就不可能实现,该数据库包含近 3000 万张存档和带注释的鸟类照片以及鸟类社区上传的 110 多万个声音片段。

随后,一个团队开始将媒体转化为有用的工具。他们于 2012 年开始构建 Merlin 照片 ID 组件,当时计算机视觉技术正在取得进步。“我们知道,如果我们能够收集数据,我们就可以利用这些工具构建一个非常有用的功能,让某人拍摄一张照片,然后让计算机告诉他们照片里有什么,”范霍恩说。到 2015 年,该实验室能够让公民科学家将照片和音频上传到不断增长的收藏中。自从照片 ID 组件在应用程序上推出以来,它不断得到改进,增加了更多照片样本,并扩大了南美、非洲、亚洲和欧洲新地区的物种覆盖范围。“只有当你拥有这个可以在其上构建的良好数据基础时,机器学习才能很好地发挥作用,”范霍恩解释说。

麦考利图书馆收集的音频和照片来源于实验室运行的另一个项目,即 2002 年启动的 eBird。eBird 应用程序允许世界各地的公民科学家和当地组织记录和分享鸟类观测情况,包括与研究和绘制鸟类种群的科学家分享。

“由于我们花了很长时间来收集这些数据,所以我们非常清楚,如果你在 7 月 19 日来到纽约,你可能会遇到哪些物种,”范霍恩说。“这类信息确实有助于我们进行声音识别和照片识别,因为它让我们能够立即解决 450 个物种的问题,即声音识别,8,000 个物种的问题,照片识别,并帮助我们将范围缩小到 40 个真正需要考虑的物种。”

音频识别组件的进展比图像识别要慢,“因为外出记录鸟叫声并不像外出拍照那么流行,”范霍恩说。“但可以肯定的是,在过去三年左右的时间里,北美已经相当密集地覆盖了音频记录。”

去年这个时候,该团队认为他们拥有足够的音频数据,可以开发和推出针对美国和加拿大流行物种的声音识别功能。他们开始梳理所有数据并挑选物种。

然而,背景噪音问题仍然是工程团队面临的挑战。为了解决这个问题,他们转向了现有的音频数据。这些音频数据集可能是交通场景、城市环境和机器噪音——不是鸟类发出的正常声音。“我们会将这些音频转换成声谱图,并将其用作‘这不是鸟;任何时候你看到这个,你都不应该报告鸟类’的反面例子,”范霍恩补充道。“这是一种平衡,既要建立高质量的鸟类数据集,又要加强非鸟类噪音的良好数据集,我们可以向机器展示并教它什么鸟听起来不像。”

[相关:如何在美国任何城市开始观鸟]

接下来是更多的工作。由于项目的成功取决于数据集的高质量,这意味着韦伯和范霍恩必须组织和招募鸟类观察界的资深专家来帮助他们查看数据库中的原始音频文件并标记录音中的物种。

“在构建我们首次发布的数据集时,我想我们花了大约 2,000 个小时进行注释,绘制鸟儿鸣叫的位置以及各种鸟儿鸣叫的位置,”韦伯说。“这主要是由许多输入这些 eBird 数据和观察结果的人自愿完成的。”

2014 年,该应用程序首次推出时,只记录了美国和加拿大最常见的鸟类。2016 年,首批国际标签发布,首先是墨西哥和哥斯达黎加,然后扩展到欧洲、澳大利亚、新西兰、非洲和亚洲部分地区。“我们仍然看到,大约 75% 的新活跃用户来自美国和加拿大,”韦伯说,但世界各地记录的新物种数量正在不断增加。

随着全球用户继续向 eBird 数据库提交目击事件,新的目击事件被纳入 Merlin 应用程序,研究团队也因此了解了哪些物种何时何地出现。“我们不断更新应用程序中每种物种的照片和声音,以便不断改进 Merlin 展示的内容,”Weber 补充道。

[相关:看看鸟儿如何改变它们的曲调以适应周围环境]

韦伯指出,他们收到的一些最令人惊讶的反馈来自听力障碍的用户。“他们对实时视图和能够直观呈现鸟鸣声的频谱图感到非常兴奋,”他说。“无论是听力一直不佳的人,还是随着年龄增长而失去高音的人,很多人都对能够在某种程度上恢复部分听力损失感到非常兴奋。”

该团队仍在努力完善该应用程序并整合用户的反馈。通过与当地社区和组织合作,范霍恩认为他们可以构建各种有用的工具,帮助人们在户外获得更有趣的体验,尤其是与当地鸟类相处。“这是人类和机器成功的故事,”范霍恩说。“人类在这个拼图中扮演着重要的角色。”

<<:  担心沉迷 Netflix 会毁了地球?现在你可以冷静一下了。

>>:  中国科学家培育微型猪作为宠物出售

推荐阅读

波音公司的卫星发射器给火箭带来了“臀部撞击”

埃隆·马斯克并不是唯一一个对重复使用火箭发射系统感兴趣的人。现在,与 SpaceX 一起赢得 NAS...

《福星小子:凉子的九月茶会》——全面解析该系列活动上映的魅力

《福星小子:凉子的九月茶会》:粉丝必看的特别活动《福星小子 凉子九月茶会》是1985年9月24日在粉...

不要对“第十星球”过度兴奋

2006 年冥王星被降级后,我们又回到了单调乏味的八行星太阳系。去年,天文学家宣布他们在外太阳系发现...

虚拟现实法国实验剧院是最迷幻的东西

多年来,Benoit Marini 一直在为法国达索系统公司研究虚拟现实技术。作为该公司实验实验室和...

如何避免常见的电话相关伤害

智能手机总是伴随着我们,为我们提供了娱乐、必不可少的生产力工具以及与亲人保持联系的能力。尽管这些小玩...

沉船的 170 年历史的啤酒味道如何?

哟嗬嗬和一瓶啤酒。芬兰科学家分析了从 19 世纪 40 年代波罗的海沉船中打捞出的两种不同的啤酒,看...

《像云一样,像风一样》评论:随着清风翩翩起舞的动人故事

“像云一样,像风一样”——1990 年的一夜惊魂《像云一样,像风一样》于 1990 年 3 月 21...

哈姆太郎的《Hamuhamuparadaichu!》的呼吁与评价

哈姆太郎是哈姆太郎的天堂! - 爱与冒险的仓鼠“哈姆太郎哈姆哈姆天堂!”是一部电视动画系列,于 20...

我们经常不小心吃到的令人难以置信的恶心食物

每晚会吞下八只蜘蛛的说法是一派胡言,互联网早期流行的一系列随机“事实”使之流行起来。然而,这个令人反...

《沉默的莫比乌斯》电影 2 评论:是什么让这部续集如此出色并超出预期?

沉默的莫比乌斯 电影版 2 - 从深渊归来1992年7月18日上映的《沉默的莫比乌斯》电影版是改编自...

科学无处不在

项目:InformalScience.org科学、技术、工程和数学 (STEM) 教育面临的最大难题...

Puraore的魅力和评价! ~橙色骄傲~:一部描绘冰球青春的动画

对Puraore的全面评价和推荐! ~橙色的骄傲~概述《Puraore!~PRIDE OF ORAN...

激光揭示羽毛恐龙化石的秘密

天色已晚,位于中国平邑县的山东天宇自然博物馆内。古生物学家们戴上墨镜,让周围的环境显得更加诡异,然后...

恶魔岛王子:三眼怪——深入回顾引人入胜的故事和人物

《恶魔岛的三眼王子》:一部仅播出一晚的电视动画,描绘了手冢治虫的幻想世界《三眼仔:恶魔岛的王子》于 ...

电影《K MISSING KINGS》的魅力与评论:深入探究故事与人物

《K MISSING KINGS》:史诗故事与精美视觉效果的融合《K MISSING KINGS》是...