核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。 为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。 [相关:这只敏捷的机器狗使用摄像机代替感官。] 《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。 通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。 [相关:让汽车进行通信的人工智能可能会减少交通拥堵。] 尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。 OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。 我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。 |
《爸爸的小提琴》:NHK 的经典动画及其魅力《爸爸的小提琴》是1968年在NHK教育电视台(现NHK...
在发生可怕的事情之前,很难想象在紧急情况下你需要什么设备。不过,Anker 的 PowerHouse...
只有当你的老板想在最后一刻接听视频电话,而你所在的咖啡店没有访客网络时,你才会意识到 WiFi 并不...
《人间革命》综合评价与推荐概述《人间革命》是1995年以OVA形式发售的动画系列,原作由池田大作撰写...
在上一个冰河时期,一英里高的冰川将数十立方英里的岩石、沙子和碎屑推入北美中大西洋沿岸的海洋,形成了一...
每当苹果推出新产品时,总会引起人们的极大兴趣,有时甚至会引发谣言。这是因为人们真的喜欢苹果生产的产品...
当柬埔寨拉达那基里省的一群猪挤在一起,它们的粉红色耳朵泛着紫色时,一切都太迟了。3 月 22 日,金...
在 DARPA 和美国能源部的支持下,科学家们破解了一项具有里程碑意义的技术密码,首次开发出一种纳米...
东京大理石巧克力——感人的纯情故事■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期2008 年 8 ...
泥炭沼泽覆盖了世界 3% 的陆地表面,是一个特殊的地方。虽然历史上它们通常被认为是毫无价值的沼泽,但...
电子宠物:真实故事 - 怀旧角色登上荧幕《电子宠物:真实的故事》于 1997 年 7 月 12 日上...
夏至快乐!今天是北半球一年中白天最长的一天,北极圈以南的人平均能看见 15 小时的日照。靠近两极的人...
无论是休闲高尔夫球手还是狂热高尔夫球手,没有什么比在阳光明媚的日子与周末勇士们相聚更有意义的事情了。...
小虎的冒险 - 小虎的冒险■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期1955 年 3 月■流通...
如果有的话,这是一个科学侦探故事,喷气推进实验室的斯拉瓦·图里舍夫和他的同事们花了数年时间追查他们的...