核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。 为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。 [相关:这只敏捷的机器狗使用摄像机代替感官。] 《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。 通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。 [相关:让汽车进行通信的人工智能可能会减少交通拥堵。] 尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。 OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。 我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。 |
沙发上你家狗狗最喜欢的地方散发着恶臭。你的厨房里弥漫着陈年食用油的味道。你最喜欢的运动鞋放在前门附近...
詹姆斯·杨的仿生手臂将配备蓝牙功能,并配有屏幕来控制电子设备。它配有激光和手电筒,还可以操控无人机。...
“严重地!” 2:冲突篇:这部 OVA 的魅力在于描绘了年轻黑帮的热情精神■作品概要“严重地!” 《...
《政宗君的复仇》第一季综合评论与推荐概述《政宗君的复仇》是改编自竹冈叶月同名漫画的电视动画,于 2...
最近分析的化石最终证实了一项长期存在的古生物学理论:大约 500 万年前,体型与家猫相当的飞鼠曾滑过...
虽然劳动节标志着夏季的非正式结束,但这个炎热的季节正在美国西部加剧。今天,一场可能创历史性的热浪导致...
越后民间故事《Attentengano》——传统与文化的结晶2000年5月1日,以新潟县越路町的传统...
单击此处查看 PopSci 的所有 COVID-19 报道。随着疫苗接种服务迅速扩大到所有美国人,人...
从某个角度来看,Bose VideoWave 是一款售价 5,349 美元的 46 英寸 CCFL ...
虽然人类和马都可以穿鞋,但我们的马朋友无需担心保养脚趾。然而,情况并非总是如此。6 月 21 日发表...
正是沙子毁了勇气号。2009 年 5 月,在火星表面行驶了数年之后,NASA 的勇气号探测器被困在沙...
多年来,波罗的海的水下怪异圆形结构一直让当地居民感到困惑。有些人认为它们是炸弹坑,或者是由仙女或外星...
竞争已经拉开帷幕,争夺第一枚真正可重复使用的低地球轨道火箭,而现在空中客车公司已决定加入这场日益激烈...
18 世纪中叶,即地质学诞生和首次科学尝试确定地球年龄的大约一个世纪前,爱尔兰教会的大主教詹姆斯·...
美国宇航局科学任务理事会太阳物理学部研究太阳及其接触的一切的性质。其中包括地球、大气层和磁层,磁层基...