核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。 为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。 [相关:这只敏捷的机器狗使用摄像机代替感官。] 《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。 通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。 [相关:让汽车进行通信的人工智能可能会减少交通拥堵。] 尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。 OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。 我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。 |
神奇宝贝皮丘和皮卡丘的冬季假期 2001 - 冬季魔法和友谊的故事对于宠物小精灵系列的粉丝来说,20...
本文已更新。最初于 2017 年 10 月 20 日发布。中学时,每年一英里跑步之前,在从教室走到跑...
我们扔掉的很多东西都很容易变成堆肥。但开始堆肥可能很棘手。做错了,你的整个厨房都会臭气熏天。Vita...
《高校特工》:80年代间谍动漫的号召力与评价《高校特工:间谍》于 1988 年作为 OVA 发行,改...
更新:周三早上,科学家公布了首张黑洞照片。有关此项努力的背景信息请参见下文,并稍后回来查看更多信息。...
蛋白质是我们体内庞大的工蜂网络,它们都发挥着不同的功能,从促进肌肉运动到引发思考。我们的基因合成了大...
乌鸦在世界各地都被视为一种重要的象征,在土著文化中被视为神圣的动物,在古希腊则被视为死亡的预兆。由于...
本文摘自 2017 年最佳新品榜单。如需查看本年度最具变革性的产品和发现的完整列表,请点击此处。谷歌...
史蒂文斯学院的许多学生都直接受到飓风桑迪造成的破坏,或亲眼目睹沿海社区遭到破坏。许多学生还挺身而出提...
让我们猜猜:你在 TikTok 上看到了一段视频,视频中有人制作了声音动听、音质出色的机械键盘,你也...
枯叶:疯狂与混乱的顶峰《DEAD LEAVES》是2004年上映的日本动画电影,以其独特的世界观和极...
过去几年,Netflix 和 Spotify 等在线订阅服务的人气和覆盖范围都呈爆炸式增长,而且还有...
Curiosity Stream 由 Discovery Communications 创始人 Jo...
美国国防承包商投入大量资源开发机器人,帮助五角大楼各军种监视敌人,但位于圣地亚哥的 Torrey P...
“我的百合就是我的工作!” - 描绘百合世界的新挑战电视动画《我的百合是一份工作!》于 2023 年...