戴头戴式摄像头的婴儿如何教人工智能学习单词

戴头戴式摄像头的婴儿如何教人工智能学习单词

人工智能研究人员成功创建了一种机器学习模型,该模型能够利用佩戴头戴式摄像机的幼儿拍摄的镜头来学习单词。本周发表在《科学》杂志上的这项研究结果可能会为儿童学习语言的方式提供新的见解,并可能为研究人员构建未来更像人类学习的机器学习模型提供参考。

先前的研究估计,儿童通常在 6 至 9 个月大时开始学会第一个单词。到两岁生日时,儿童的词汇量平均已达到 300 个左右。但儿童如何将意义与单词联系起来的实际机制仍不清楚,也是科学争论的焦点。纽约大学数据科学中心的研究人员试图通过创建一个 AI 模型来进一步探索这一灰色地带,该模型试图以与儿童相同的方式学习。

为了训练该模型,研究人员依靠一个绑在名叫 Sam 的孩子身上的轻型头戴式摄像机拍摄的超过 60 小时的视频和音频记录。这名幼儿从六个月大开始就时不时地戴着这台摄像机,直到他两岁生日之后才结束。在这 19 个月里,摄像机收集了超过 60 万个视频帧,这些视频帧与附近人的 37,500 多条转录的话语有关。从头戴式摄像机拍摄的背景谈话和视频帧让我们得以一窥正在成长的孩子在进食、玩耍和体验周围世界时的体验。

有了 Sam 的眼睛和耳朵,研究人员随后创建了一个神经网络模型,试图理解 Sam 看到和听到的内容。该模型有一个模块分析从相机拍摄的单帧,另一个模块专注于转录直接对 Sam 的语音,该模型是自我监督的,这意味着它不使用外部数据标签来识别物体。就像孩子一样,当单词与特定物体和视觉效果碰巧同时出现时,该模型通过将单词与它们联系起来进行学习。

模型和儿童的测试程序。图片来源:Wai Keen Vong

“通过使用人工智能模型研究儿童面临的真正语言学习问题,我们可以解决关于儿童学习单词需要什么要素的经典争论——他们是需要语言特定的偏见、先天知识,还是只需要联想学习,”论文合著者、纽约大学数据科学中心教授 Brenden Lake 在一份声明中表示。“看来,我们仅通过学习就能获得比通常认为的更多的东西。”

研究人员测试该模型的方式与科学家评估儿童的方式相同。研究人员向模型展示了从训练集中抽取的四张图片,并要求它挑选出哪一张与给定的单词(如“球”、“婴儿床”或“树”)相匹配。该模型的成功率为 61.6%。婴儿摄像头训练模型的准确度甚至接近一对使用更多语言输入进行训练的独立 AI 模型。更令人印象深刻的是,该模型能够正确识别 Sam 的头戴式摄像头数据集中未包含的一些图像,这表明它能够从训练数据中学习,并利用这些数据进行更普遍的观察。

“这些发现表明,通过儿童在使用神经网络等相对通用的学习机制时所获得的自然数据,词汇学习的这一方面是可行的,”莱克说。

换句话说,人工智能模型仅使用头部摄像头的数据就能持续识别物体的能力表明,代表性学习,或者简单地将视觉效果与同时出现的单词联系起来,似乎足以让儿童学习和掌握词汇。

研究结果暗示了训练人工智能的另一种方法

展望未来,纽约大学研究人员的发现可能对未来有兴趣创建以类似人类的方式学习的人工智能模型的人工智能开发者很有价值。人工智能行业和计算机科学家长期以来一直以人类思维和神经通路为灵感来构建人工智能系统。

最近,大型语言模型(如 OpenAI 的 GPT 模型或 Google 的 Bard)已被证明能够编写实用的论文、生成代码并定期伪造事实,这要归功于密集的训练期,在此期间,模型注入了从庞大的数据集中提取的数万亿参数数据。然而,纽约大学的发现表明,单词习得的另一种方法可能是可行的。与依赖大量可能受版权保护或有偏见的输入相比,模仿人类在世界各地爬行和跌跌撞撞地学习的方式的人工智能模型可以提供另一种识别语言的途径。

“我很惊讶,今天的人工智能系统在接触到孩子在学习语言时所接收的少量数据时,能够学到这么多东西,”莱克说。

<<:  不,“10G互联网”根本不存在

>>:  这可能是 SLIM 从月球发出的告别信号

推荐阅读

飓风迈克尔是史无前例的

今天,飓风迈克尔在佛罗里达州巴拿马城附近登陆,其最大持续风速达 155 英里/小时,强度极强。这是有...

推特上的恐怖活动

2014 年 6 月,自称伊斯兰国(又称 ISIS、ISIL 或 Daesh)的武装分子袭击伊拉克城...

忍术界魂小藏:消灭海盗 - 全面回顾引人入胜的故事和人物深度

《忍术火魂小藏:讨伐海贼》的魅力与历史背景1935年5月上映的《忍术火之玉小抄》在日本动画电影史上占...

苹果正在关闭“我的照片流”。你应该关心吗?

Apple 用户收到了一些令人困惑的电子邮件,称“我的照片流”即将关闭。电子邮件称,这项服务的上传...

男子利用人工智能歌曲目录“骗取”流媒体服务 1000 万美元

长期以来,音乐人一直批评流媒体服务的收入分成计划糟糕透顶。例如,2021 年,Spotify 旗下 ...

我希望在和孩子们玩 Minecraft 之前知道这些

Minecraft 已经有十多年的历史了,但它的受欢迎程度却从未减弱。新一代的孩子正在发现这款多功能...

这些强壮的青蛙从不错过手臂训练日

即使健身房重新开放但人数有限,在家或户外锻炼仍然更安全。因此,我们将今年 9 月命名为“肌肉月”,以...

新职业高尔夫球手猴子#6 评论:他的高尔夫球技术如何?故事如何发展?

新职业高尔夫球手猴子 #6 - Shin 职业高尔夫球手猴子概述《新职业高尔夫球手 Saru #6 ...

全面回顾《Yuukan Club》中整个狗和猫的HOW-match!

《Yuukan Club:狗和猫有多少》:这部华丽的青春动作喜剧的吸引力■作品概要《友情俱乐部:猫...

《二人高》的魅力与评价:必看动画

《Futari Taka》——80 年代摩托车动漫的典范《二人高》于1984年至1985年播出,是一...

首次探测到来自系外行星的可见光

我们不能简单地观察系外行星。为了更多地了解这些隐藏在许多光年之外的太空岩石,研究人员有各种间接方法来...

这座瑞士桥梁证明混凝土可以重复使用

乍一看,它就像一座简单的人行桥,拱门平缓。它几乎就像中世纪古城里常见的那种桥。然而,这座桥并不横跨溪...

享受黑色星期五一日优惠,享受 Xbox Live Gold 三个月访问权限

黑色星期五特惠已经到来,如果您想要获得 Xbox Live Gold 访问权限,我们为您提供为期一天...

“Artiswitch”的吸引力与评价:深度探寻艺术与开关的融合

“Artist Switch”——艺术与科技融合诞生的新娱乐《Artist Witch》于 2021...

法律是否保护用户免受社交媒体监控?

Twitter、Facebook 和 Instagram 已于本月初终止与 Geofeedia 的...