人工智能研究人员成功创建了一种机器学习模型,该模型能够利用佩戴头戴式摄像机的幼儿拍摄的镜头来学习单词。本周发表在《科学》杂志上的这项研究结果可能会为儿童学习语言的方式提供新的见解,并可能为研究人员构建未来更像人类学习的机器学习模型提供参考。 先前的研究估计,儿童通常在 6 至 9 个月大时开始学会第一个单词。到两岁生日时,儿童的词汇量平均已达到 300 个左右。但儿童如何将意义与单词联系起来的实际机制仍不清楚,也是科学争论的焦点。纽约大学数据科学中心的研究人员试图通过创建一个 AI 模型来进一步探索这一灰色地带,该模型试图以与儿童相同的方式学习。 为了训练该模型,研究人员依靠一个绑在名叫 Sam 的孩子身上的轻型头戴式摄像机拍摄的超过 60 小时的视频和音频记录。这名幼儿从六个月大开始就时不时地戴着这台摄像机,直到他两岁生日之后才结束。在这 19 个月里,摄像机收集了超过 60 万个视频帧,这些视频帧与附近人的 37,500 多条转录的话语有关。从头戴式摄像机拍摄的背景谈话和视频帧让我们得以一窥正在成长的孩子在进食、玩耍和体验周围世界时的体验。 有了 Sam 的眼睛和耳朵,研究人员随后创建了一个神经网络模型,试图理解 Sam 看到和听到的内容。该模型有一个模块分析从相机拍摄的单帧,另一个模块专注于转录直接对 Sam 的语音,该模型是自我监督的,这意味着它不使用外部数据标签来识别物体。就像孩子一样,当单词与特定物体和视觉效果碰巧同时出现时,该模型通过将单词与它们联系起来进行学习。 “通过使用人工智能模型研究儿童面临的真正语言学习问题,我们可以解决关于儿童学习单词需要什么要素的经典争论——他们是需要语言特定的偏见、先天知识,还是只需要联想学习,”论文合著者、纽约大学数据科学中心教授 Brenden Lake 在一份声明中表示。“看来,我们仅通过学习就能获得比通常认为的更多的东西。” 研究人员测试该模型的方式与科学家评估儿童的方式相同。研究人员向模型展示了从训练集中抽取的四张图片,并要求它挑选出哪一张与给定的单词(如“球”、“婴儿床”或“树”)相匹配。该模型的成功率为 61.6%。婴儿摄像头训练模型的准确度甚至接近一对使用更多语言输入进行训练的独立 AI 模型。更令人印象深刻的是,该模型能够正确识别 Sam 的头戴式摄像头数据集中未包含的一些图像,这表明它能够从训练数据中学习,并利用这些数据进行更普遍的观察。 “这些发现表明,通过儿童在使用神经网络等相对通用的学习机制时所获得的自然数据,词汇学习的这一方面是可行的,”莱克说。 换句话说,人工智能模型仅使用头部摄像头的数据就能持续识别物体的能力表明,代表性学习,或者简单地将视觉效果与同时出现的单词联系起来,似乎足以让儿童学习和掌握词汇。 研究结果暗示了训练人工智能的另一种方法展望未来,纽约大学研究人员的发现可能对未来有兴趣创建以类似人类的方式学习的人工智能模型的人工智能开发者很有价值。人工智能行业和计算机科学家长期以来一直以人类思维和神经通路为灵感来构建人工智能系统。 最近,大型语言模型(如 OpenAI 的 GPT 模型或 Google 的 Bard)已被证明能够编写实用的论文、生成代码并定期伪造事实,这要归功于密集的训练期,在此期间,模型注入了从庞大的数据集中提取的数万亿参数数据。然而,纽约大学的发现表明,单词习得的另一种方法可能是可行的。与依赖大量可能受版权保护或有偏见的输入相比,模仿人类在世界各地爬行和跌跌撞撞地学习的方式的人工智能模型可以提供另一种识别语言的途径。 “我很惊讶,今天的人工智能系统在接触到孩子在学习语言时所接收的少量数据时,能够学到这么多东西,”莱克说。 |
当我还是个孩子的时候,科学是我最喜欢的科目之一。我喜欢实验、建模、概念,也喜欢我的老师。高中毕业后,...
去年开业并获得好评的热门新餐厅让您爱不释手?如果您今年再去尝试不同的菜肴,却发现他们已经将原本就很高...
您肯定注意到,最近各种应用、设备和平台上都出现了人工智能工具。LinkedIn 也不例外:这家用于寻...
美国宇航局定期进行的国际空间站直播昨晚让观众们意外地惊恐不已。美国东部时间 6 月 12 日下午 6...
《阿特鲁伊》:历史与梦想交织的穿越动画电影概述《Aterui》是一部由出崎哲导演,动画《Aterui...
以下是本周无人机热门新闻汇总:无人机的军事、商业、非营利和娱乐应用。通过扫描鹰暗无人机战争的伦理问题...
成为开发人员的道路似乎令人望而生畏。不过,Microsoft Visual Studio Profe...
《真·救世主传说:北斗神拳ZERO拳四郎传》的号召力与评价《真·救世主传说:北斗神拳ZERO:拳四郎...
在晴朗的天空和高挂的太阳下,普通人的眼睛几乎可以看到整个可见光谱。如果没有直射的阳光,反射只能提供彩...
如果你家里安装了智能灯,那么你可能已经尝试过用手机打开和关闭它们,并循环切换数百万种颜色。但如果你拥...
我们正面临一场回收危机。上周,印度官员宣布,该国将不再接受消费后塑料进口,以努力对抗美国和其他国家在...
虽然强大的巨齿鲨( Otodus megalodon )在大约 360 万年前灭绝,但它对流行文化的...
Google Docs 是现代互联网中光标密集的动脉。该服务可让您在灵活的文字处理器中写作,并将所有...
当我展望技术的未来时,我的第一个想法并不是从 20 世纪中期的火车调度板中获取灵感,但这正是促使 V...
新英格兰很少是飓风首先登陆的地方。通常情况下,风暴会进一步向南突破海岸,并在逐渐失去动力时向上移动。...