核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。 为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。 [相关:这只敏捷的机器狗使用摄像机代替感官。] 《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。 通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。 [相关:让汽车进行通信的人工智能可能会减少交通拥堵。] 尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。 OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。 我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。 |
<<: 使用 MacOS 的快捷方式应用可以轻松自动执行 5 项任务
>>: 中国抗议活动期间,Twitter 被 NSFW 垃圾邮件淹没
“我没有钱”——一段悲伤却美丽的纯爱故事《我没有钱》于 2007 年作为 OVA 发行,改编自篠崎和...
《JUDGE》综合评价与推荐概述《JUDGE》是根据细野藤彦的原作漫画改编的剧场版动画。该片于199...
自然力量塑造了地球的每一寸土地,但在加利福尼亚州,最大的两个影响因素是天上掉下来的雨(或没有雨)和地...
在俄罗斯入侵乌克兰的前线后方,机器人正在努力清除道路上的潜在爆炸物。这项枯燥、致命且至关重要的军事任...
《圆润女友与令人失望男友》——温馨浪漫喜剧的魅力《圆润女友和失望男友》是一部电视动画,改编自叶山泉创...
大约 4.65 亿年前,一种现已灭绝的节肢动物——三叶虫,在今天的捷克共和国四处觅食。它死后,时间的...
凭借其猛禽般的钳子和獠牙般的前肢,一种新发现的掠食性甲壳动物似乎非常擅长在海洋极端环境中生活。一个国...
秩父山医生:一部充满古怪人物和幽默的医疗动画概述1988年播出的《秩父山医生》是根据田中圭一的原著改...
本周,我们将在谷歌年度秋季发布会上(我们将现场直播)关注谷歌的一些重要产品,但在此之前还有很多事情需...
在过去 138 年里,我们每个月都会展示旨在改善生活的机制发明和概念。有时这意味着治愈癌症,有时这意...
行星科学家有时会开玩笑说,我们对火星的了解比对月球的了解还多。美国宇航局在美国建国 200 周年之际...
当气温开始下降时,编织者的双手开始发痒,需要做一些温暖的项目。希望在温暖的炉火旁。喝一杯可可。裹着自...
《虫师》:一部描绘神秘与共生世界的杰作动画■作品概要《虫师》是改编自漆原雪同名漫画的电视动画,于20...
我们都知道,给设备充电是一件非常混乱的事情。笔记本电脑、手机、平板电脑和智能手表,很容易就没插座了(...
上个月,埃隆·马斯克公开支持唐纳德·特朗普连任后不久,就宣布成立了他的最新企业 AmericaPAC...