通过 GIPHY 以动词“移除”为例。作为人类,您了解该词的不同用法,并且您知道从视觉上看,场景会因移除的内容不同而有所不同。从大块物体中取出蜂窝状碎片与从田地中拉出防水布或从智能手机上取下屏幕保护膜看起来不同。但您明白了:在所有这些例子中,都有一些东西被移除了。 但是,计算机和人工智能系统需要学会这些动作是什么样子的。为了实现这一目标,IBM 最近发布了一个大型新数据集,其中包含三秒钟的视频片段,旨在通过向研究人员提供动作动词(如“瞄准”、“俯冲”和“除草”)的视觉示例,帮助研究人员训练他们的机器学习系统。探索它(上面的汽车视频和下面的蜜蜂视频来自数据集并演示了“移除”)可以让你了解机器学习中香肠制作过程的奇妙之处。在“眨眼”下,观众可以看到乔恩·哈姆 (Jon Hamm) 扮演的唐·德雷珀 (Don Draper) 眨眼的片段,以及辛普森一家的片段;还有更多这样的片段。在此处查看数据集的一部分 - 总共有 300 多个动词和一百万个视频。 通过 GIPHY 教会计算机理解视频中的动作比让它们理解图像更难。IBM-MIT 联合实验室的研究员 Dan Gutfreund 表示:“视频更难,因为与物体识别相比,我们处理的问题在复杂性方面要高出一步。因为物体就是物体;热狗就是热狗。”与此同时,理解动词“opening”也很棘手,他说,因为狗张嘴或人开门看起来会有所不同。 该数据集并不是研究人员为帮助机器理解图像或视频而创建的第一个数据集。一个名为 ImageNet 的数据集在教计算机学习识别图片方面发挥了重要作用,其他视频数据集也已经存在:一个叫做 Kinetics,另一个专注于体育运动,还有一个来自中佛罗里达大学,包含“篮球扣篮”等动作。 但古特弗伦德表示,他们的新数据集的优势之一是它专注于他所谓的“原子动作”。这些动作包括从“攻击”到“打哈欠”等基本动作。古特弗伦德表示,将事物分解为原子动作比专注于更复杂的动作(如展示某人换轮胎或系领带)更有利于机器学习。 最后,他说他希望这个数据集能够帮助计算机模型能够像人类一样轻松地理解简单的动作。 |
>>: Facebook Messenger Kids 可能不会毁了你的孩子
让我们花一点时间来思考一下迅猛龙。在侏罗纪公园/世界系列的典型恐龙电影中,迅猛龙是这样的杀戮机器:不...
土卫二是土星的第六颗卫星,大小与英国相当,表面覆盖着数英里厚的冰层。它下面是一片液态海洋,液态海洋通...
《两只秋刀鱼》:栗洋二的实验动画杰作《两只秋刀鱼》于1967年上映,是导演栗用二的一部实验动画作品,...
进击的巨人:人类生存之战及其深刻主题《进击的巨人》是改编自谏山创同名热门漫画的动画,于 2013 年...
《不死鸟2772:爱的宇宙地带》:手冢治虫的宏伟太空史诗■ 公共媒体剧院■ 原创媒体动漫原创■ 发布...
全球最大的龙卷风搜寻行动陷入了困境。我身处俄克拉荷马州佩里市智选假日酒店会议室的临时指挥中心,35 ...
《少年芦部 GO!GO!Goma-chan 第 2 部》的评论和详情概述《芦部:Go!Go!戈玛酱第...
一项新研究表明,许多种蝙蝠利用回声定位来定位自己并捕猎昆虫,但它们也依靠非常详细的记忆来寻找方向。它...
在疫情期间,时尚销售量激增,亚马逊将于今年晚些时候在加利福尼亚州格伦代尔开设第一家实体服装店。这家名...
虽然大多数人早上喝咖啡,但生物黑客和益智药使用者会服用药丸来获得认知效果。通过专门选择他们摄入的化合...
喵喵! - 猫与少年的浪漫喜剧的魅力2009年播出的电视动画《猫恋!》改编自藤原佐藤的同名漫画。该剧...
美国环境保护署 (EPA) 正在采取行动恢复各州和部落的电力,以否决可能污染当地河流和溪流的能源基础...
GJ Club Repeat!Disc详细评测及推荐-Good Job Repeat Disk- ■...
如果您觉得阅读有关毁灭性的洪水、干旱和风暴的报道比以前更频繁,那是因为这些极端事件实际上发生得更频繁...
正如传奇歌手芭芭拉·史翠珊曾经唱到的:“需要他人帮助的人是世界上最幸运的人。”事实证明,猴子也需要猴...