核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。 为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。 [相关:这只敏捷的机器狗使用摄像机代替感官。] 《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。 通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。 [相关:让汽车进行通信的人工智能可能会减少交通拥堵。] 尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。 OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。 我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。 |
为了减轻海啸带来的死亡和灾难,沿海地区的人们需要尽可能多的时间撤离。高达百英尺的海浪速度与汽车相当,...
随着飓风季节的高峰期临近,大西洋也正值复苏。未来几周的条件似乎更有利于热带气旋的发展,与今年夏天迄今...
“鬓鬓鬓そばにならけど”~大家的歌的魅力与背景《鬓鬓胡须》是2015年6月在NHK《大家的歌》中播出...
毫不奇怪,耶鲁大学的科学家发现,像 Twitter 这样的社交媒体平台会放大我们的集体道德愤怒。此外...
直到 1 亿年前,蝴蝶都是夜行动物。地球上只有夜行蛾,直到一些流氓蛾开始在白天飞行。这些富有进取心的...
如果你不喜欢牛奶麦片,那你一定是疯了。但是那些酥脆的泡芙或薄片在牛奶碗里放的时间越长,它们就会变得越...
观察者记录了多种动物使用植物进行自我治疗,例如类人猿食用治疗寄生虫感染的植物或用植物摩擦酸痛的肌肉。...
土豆:煮熟、捣碎、炖煮。或者不煮,因为土豆供应严重短缺。由于生长季节开始较晚,再加上秋季异常寒冷潮湿...
关注和猜测有关电子产品的传闻可能很有趣,但它们并不总是最可靠的信息来源。以下是目前流传的一些最突出的...
BURN-UP SCRAMBLE - 详细评论和推荐■ 公共媒体电视动画系列■ 原创媒体动漫原创■ ...
这已经成为必然。在一款备受瞩目的电子产品上市一两天后,电子产品博客、科技网站和杂志上就会出现两则新闻...
大约 2.52 亿至 2.01 亿年前,大约 76% 的海洋和陆地物种从地球表面消失。人们普遍认为,...
在阅读本专栏之前,我建议您打开一瓶迟来的生日啤酒。将啤酒倒入透明玻璃杯(品脱杯或郁金香杯,任您选择)...
新型四足机器人基于多年的研究,并受到一些两栖动物的启发,有朝一日,它们可以爬行和摇摆,参与搜救行动。...
野火蔓延范围越来越广,造成的破坏也比近几年来更大。为了扑灭大火,消防专家和普通民众都开始采用一种保护...