看看当人工智能教机器人“手”转动钢笔时会发生什么

看看当人工智能教机器人“手”转动钢笔时会发生什么

研究人员正在通过反复试验的强化学习来训练机器人执行越来越多的任务,而这通常既费力又费时。为了提供帮助,人类现在正在利用大型语言模型 AI 来加快训练过程。在最近的一项实验中,这产生了一些非常灵巧的模拟机器人。

NVIDIA Research 的一个团队指导了由 OpenAI 的 GPT-4 提供支持的 AI 协议,以教会机械手模拟近 30 项复杂任务,包括抛球、推积木、按开关以及一些令人印象深刻的转笔能力。

[相关:这些人工智能机器人手臂足够灵敏,可以拾起品客薯片。]

NVIDIA 的新 Eureka“AI 代理”利用 GPT-4,要求大型语言模型 (LLM) 编写自己的基于奖励的强化学习软件代码。据该公司称,Eureka 不需要复杂的提示,甚至不需要预先编写的模板;相反,它只是开始磨练程序,然后遵循任何后续的外部人工反馈。

在公司的公告中,NVIDIA 高级研究科学家 Linxi “Jim” Fan 将 Eureka 描述为 LLM 与 GPU 加速模拟编程的“独特组合”。Fan 补充道:“我们相信 Eureka 将实现灵巧的机器人控制,并为艺术家提供一种制作逼真动画的新方法。”

从 NVIDIA 的演示视频来看,经过 Eureka 训练的机械手可以完成旋转笔的技巧,其技巧甚至可以与灵巧的人类相媲美,甚至超越他们。

在高级模拟程序中测试其训练协议后,Eureka 随后分析其收集的数据并指导 LLM 进一步改进其设计。最终结果是一个几乎自我迭代的 AI 协议,能够成功编码各种机械手设计,以便在物理精确的模拟环境中操纵剪刀、旋转钢笔和打开橱柜。

Eureka 的替代人类编写的试错学习程序不仅有效,而且在大多数情况下,它们实际上比人类编写的程序更好。在该团队的开源研究论文中,Eureka 设计的奖励程序在 80% 以上的任务中表现优于人类代码,在机器人模拟中平均性能提高了 50% 以上。

[相关:研究人员如何训练廉价机器狗完成各种技巧。]

NVIDIA 人工智能研究高级总监、Eureka 论文合著者之一 Anima Anandkumar 在公司公告中表示:“强化学习在过去十年中取得了令人瞩目的成就,但仍然存在许多挑战,例如奖励设计,这仍然是一个反复试验的过程。Eureka 是开发新算法的第一步,这些算法将生成式和强化学习方法结合起来解决困难任务。”

<<:  如何解锁 iPhone 15 上隐藏的、更强大的相机

>>:  适用于书籍和播客的最佳有声读物应用程序

推荐阅读

2022 年我们买过的最好的东西

因此,您拥有祖父母寄来的礼品卡和 5 美元支票,但不确定在电子商务的狂野世界中什么是噪音,什么是噪音...

免费打字应用程序可帮助您的手指移动得更快

我们花了大量时间敲击键盘,因此,提高打字速度可以使你在几乎任何工作中更有效率——无论是浏览收件箱、撰...

《魔法彩绘》评论:《大家的歌》的魅力究竟是什么?

NHK 的杰作《魔法颜料》激发儿童的想象力1995年10月在NHK教育电视台(现NHK E-Tel...

装甲骑兵沃托姆斯:孤独的影子归来——重新评价和印象

装甲兵沃托姆斯:孤影归来:雾子的新旅程与不断深化的剧情■ 公共媒体事件■ 原创媒体小说■ 发布日期2...

雪是防止一些植物和动物冻死的唯一方法

在下雪的冬日,你可能看不到任何动物。落叶乔木已经落叶,灌木丛光秃秃的,只剩下春夏时节的寒意。除了偶尔...

《十二战士爆裂连者》的魅力与评价:动作与剧情都不容错过

《十二战士爆裂连者》:回顾 90 年代的经典动画《十二战士爆裂连者》于1995年至1996年播出,于...

这些古老的海洋爬行动物长得非常大,速度也非常快

大约 2.46 亿年前,一种长度与座头鲸相当的海洋爬行动物在现在的内华达州的海域巡游。科学家最近分析...

意想不到的来源纺出比凯夫拉纤维更坚韧的蜘蛛丝

研究人员已经成功诱导普通蚕吐出更耐用、更环保的蜘蛛丝——这只需要进行一些基因改造和数十万次蚕卵微注射...

这些机器人像一群蜜蜂一样达成了团队共识

尽管蜜蜂的大脑只有两毫克重,但它们却非常善于交流。事实上,它们达成共识的效率非常高,以至于研究人员受...

糖果珍妮的魔法滴:深入探究引人入胜的故事和人物的评论

糖果珍妮的神秘水滴 - 糖果珍妮的神秘水滴概述《Candy Jane's Mysteriou...

钻石光盘可以存储数据数百万年

钻石不仅仅是奢侈品——作为现存最坚硬的天然材料之一,它们是许多工业钻头、医疗设备甚至太空级材料的重要...

选择退出:对科技公司撒谎的回报与风险

你不仅仅是一个数据点。选择退出功能可帮助你恢复隐私。算法就是它们的食物。这些复杂的代码片段需要营养才...

剑桥分析公司 Facebook 丑闻:如何查明你的数据是否遭到泄露

以下是如何查明剑桥分析公司是否掌握了你的 Facebook 数据上周,Facebook 证实多达 8...

一休先生:春天!淘气公主 - 回顾迷人的角色和故事

一休先生:春天来了!淘气公主 - 一休同学:春天来了!淘气公主概述《一休:春天!淘气公主》是东映制作...

铁壁阿童木的地球防卫军:第 4 集和第二部电影的吸引力和评论

阿童木地球防卫军 - Tetsuwanatomu Chikyuboueitai ■ 公共媒体剧院■ ...