核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。 为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。 [相关:这只敏捷的机器狗使用摄像机代替感官。] 《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。 通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。 [相关:让汽车进行通信的人工智能可能会减少交通拥堵。] 尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。 OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。 我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。 |
<<: 不要错过亚马逊网络星期一最后一刻的 AirPods 优惠
>>: 本网络星期一购买 NIU Kqi3 Pro 电动滑板车可享受 200 美元优惠
想象一下这样的场景:黑色星期五上午 11 点,你一边在笔记本电脑上玩电子游戏,一边用新无线耳机和朋友...
深入探究《紫罗兰永恒花园外传:永恒与自动手记人偶》的魅力与情感2019年9月6日上映的《紫罗兰永恒花...
F-35 是为导弹战争而打造的。美国最新的隐形战斗机有三种型号:F-35A 供空军使用,F-35B ...
去年这个时候,飓风桑迪登陆,席卷了新泽西州的小城市霍博肯,该市 70% 的面积被洪水淹没。你认为任何...
风味轮——一种视觉描述特定物质可能呈现的各种味道或香气的方法——有着悠久的历史,尽管有些粗糙。几个世...
我们做个朋友吧 [第一季] - 《我们做个朋友吧(第一季)》详细评论与推荐概述《我们成为朋友吧 [第...
这些灯泡不需要独立的集线器,而且比 Hue 和 Lifx 的类似智能灯稍微便宜一些。测试与其他智能灯...
三百多万年前,一种体重超过 500 磅的有袋动物在澳大利亚漫游,赢得了该大陆第一位长距离行走冠军。在...
杰里米·迪顿 (Jeremy Deaton) 为非营利性气候变化新闻服务机构Nexus Media撰...
谷歌的新款相机名为 Clips,是一款小巧、有趣的实验性设备。它是一台相机,但没有屏幕供您构图或查看...
如果你想以低价买到热水浴缸,只有几种可行的方法。你可以买一个旧的铸铁浴缸,然后像西部牛仔一样在浴缸下...
迪斯科曾经是伟大的统一者。这是在迪斯科被主流社会所接受之前,在“迪斯科糟透了!”的呼声出现之前。抛开...
华盛顿特区巡回法院就 Verizon 诉 FCC 案做出了一项裁决,该裁决很可能决定互联网的本质。该...
《风-心灵的呼吸-》的诉求与评价《风 -心灵的呼吸-》是一部于 2004 年播出的电视动画系列,其...
经过几次飞行后,美国空军的第一架女武神无人机就将离开地球,在美国空军国家博物馆展出。仅进行了几次试飞...