核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。 为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。 [相关:这只敏捷的机器狗使用摄像机代替感官。] 《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。 通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。 [相关:让汽车进行通信的人工智能可能会减少交通拥堵。] 尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。 OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。 我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。 |
伊隆·马斯克一直梦想着建造火星殖民运输机——一艘能够将 100 人或 100 公吨货物运往火星的巨型...
加油!导盲犬服务-Ganbare!导盲犬服务概述《加油!导盲犬Serve》是1988年12月18日在...
夏天即将来临,但高温已经开始。从无情的阳光到炙热的烧烤,炎热(和降温)已经成为日常生活的一部分。Po...
佛蒙特州的人们非常想在感恩节吃披萨。Google超过十亿活跃用户使用谷歌地图寻找目的地,这为公司提供...
氢燃料电池有望成为汽车、发电机等各种设备的替代燃料来源,但价格昂贵、结构复杂且极为稀有。事实证明,深...
2018 年 6 月 11 日,FCC 投票通过《恢复互联网自由法案》六个月,该法案实际上废除了互...
拥有 3.6 亿年历史的冈瓦纳次大陆水域是游泳的危险之地。一种致命的硬骨鱼体长与成年加州海狮相当,是...
如果你抵挡住了黑色星期五促销活动的诱惑,那么你很幸运。你仍然可以在购买新游戏机时节省数百美元,并在各...
美国圣母大学的两名研究人员最近与韩国庆熙大学合作,利用量子计算开发出一种能够阻挡太阳热量的新型透明窗...
强力黑帮动画《浪速幽径传》的魅力与评价概述《浪速幽径》是一部强大的黑帮动漫,于 1992 年以 OV...
魔鬼是兼职的!!第二季回顾和详情介绍《恶魔是打工仔!》第二季于2022年7月14日至9月29日播出。...
《魔法记录:魔法少女小圆外传》评论与推荐《魔法纪录:魔法少女小圆外传》是一部改编自游戏《魔法纪录:魔...
您是否曾经尝试描述一种颜色,但最终却听起来像一个拿着词典的诗人?我们明白。颜色是一种难以捉摸的生物,...
《闪亮的山地导盲犬平次》——一部根据感人的真实故事改编的杰作1990年4月4日上映的电影《闪闪发光的...
“GR[GIANT ROBO]”的完整故事和吸引力■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时...