DeepMind全新AI项目曝光：可控制各类机器人，数据集有望开源-德赢Vwin官网网

DeepMind 的新项目是什么？

开发机器人技术的一大挑战，就在于必须投入大量精力来为每台机器人、每项任务和每种环境训练机器学习模型。近日，谷歌 DeepMind 团队及其他 33 个研究机构正共同发起新项目，旨在创建一套通用 AI 系统来应对这个挑战。据称该系统能够与不同类型的物理机器人协同运作，成功执行多种任务。

谷歌机器人部门高级软件工程师 Pannag Sanketi 在采访中表示，“我们观察到，机器人在专项领域表现极佳，但在通用领域却缺乏灵性。一般来讲，大家需要为每项任务、每台机器人和每种环境分别训练一套模型，从零开始调整每一个变量。”

为了克服这个问题，让机器人的训练和部署变得更加轻松、快捷，谷歌 DeepMind 在名为 Open X-Embodiment 的大型共享数据库项目中引入了两大关键组件：一套包含了 22 种机器人类型数据的数据集，外加一系列能够跨多种任务进行技能迁移的模型 RT-1-X（这是一个源自 RT-1 的机器人变压器模型）。为了开发 Open X-Embodiment 数据集，研发人员在超过 100 万个场景中展示了 500 多种技能和 150,000 项任务，因此，该数据集也是同类中最全面的机器人数据集。

此外，研究人员还在机器人实验室和不同类型的物理装置之上对模型进行了测试，并发现与传统机器人训练方法相比，新方案确实能取得更好的成绩。

来自 Open X-Embodiment 数据集的样本展示了 500 多种技能和 150,000 项任务。

Open X-Embodiment 数据集结合了跨实施例、数据集和技能的数据。

结合机器人数据

通常来讲，不同类型的机器人往往拥有独特的传感器和执行器，所以需要配合专门的软件模型。这就类似于不同生物体的大脑和神经系统需要专门进化，从而适应该生物的身体结构与所处环境。

但 Open X-Embodiment 的诞生却出于这样一条先验性的假设：将来自不同机器人和任务的数据结合起来，就能创建一套优于专用模型的通用模型，足以驱动所有类型的机器人。这个概念在一定程度上受到大语言模型（LLM）的启发，即在使用大型通用数据集进行训练时，模型成果的匹配度甚至可以优于在特定数据集上训练的小型针对性模型。而研究人员惊喜地发现，此项原理果然也适用于机器人领域。

为了创建 Open X-Embodiment 数据集，研究团队收集了来自不同国家 20 个机构的 22 台机器人具身的真实数据。该数据集包含超 100 万种情节（所谓情节，是指机器人每次尝试执行任务时所采取的一系列动作），其中具体涉及 500 多种技能和 15 万个任务示例。

随附的各模型均基于 Transformer，一套在大语言模型中也得以应用的深度学习架构。RT-1-X 建立在 Robotics Transformer 1（简称 RT-1）之上，是一套适用于在真实环境下实现机器人技术规模化的多任务模型。RT-2-X 则建立在 RT-1 后继者 RT-2 的基础之上——RT-2 是一种视觉语言动作（VLA）模型，能够从机器人和网络数据中学习，并具备响应自然语言命令的能力。

研究人员在五所不同研究实验室的五台常用机器人上测试了 RT-1-X 对各类任务的执行能力。与针对这些机器人开发的专用模型相比，RT-1-X 在拾取和移动物体、以及开门等任务上的成功率高出 50%。该模型还能将技能迁移至多种不同环境，这也是在特定视觉场景下训练出的专用模型所做不到的。由此可见，由不同示例集训练而成的模型在大多数任务中都优于专用模型。论文还提到，此模型适用于从机械手臂到四足动物在内的多种机器人。

加州大学伯克利分校副教授、论文联合作者 Sergey Levine 写道，“对于任何曾有机器人研究经验的朋友来说，都能意识到这是多么了不起：这类模型「从来」就没能第一次就尝试成功，但这个模型却做到了。”

值得注意的是，即使是规模较小的 RT-1-X 模型，也实现了对各实验室内部专用模型的超越！对于任何曾有机器人研究经验的朋友来说，都能意识到这是多么了不起：这类模型“从来”就没能第一次就尝试成功，但这个模型却做到了。

在应急技能和处理训练数据集中未涉及的新任务方面，RT-2-X 的成功率可达 RT-2 的 3 倍。具体来讲，RT-2-X 在需要空间认知的任务上表现出更好的性能，例如理解“将苹果放到布旁边”和“将苹果放到布上”两种要求间的区别。

研究人员在 Open X 和 RT-X 的发布博文中写道，“我们的结果表明，与其他平台的数据进行联合训练之后，RT-2-X 获得了原始数据集中并不具备的额外技能，使其能够执行前所未见的新任务。”

步步迈向机器人研究的新未来

展望未来，科学家们正在考虑将这些进展与 DeepMind 开发的自我改进模型 RoboCat 的见解相结合，希望探索出新的研究方向。RoboCat 能够学会在不同机械臂上执行各种任务，然后自动设计出新的训练数据以提高自身性能。

Sanketi 认为，另一个潜在的研究方向，也可能是进一步研究不同数据集间的混合会如何影响跨机器人具身的能力泛化与改进效果。

该团队目前已经开源了 Open X-Embodiment 数据集和小型 RT-1-X 模型，但并未公开 RT-2-X 模型。

Sanketi 总结道，“我们相信，这些工具将改变机器人的训练方式，并加速该领域的研究进展。我们希望开源相关数据，并提供安全但受限的模型以减少障碍、加速研究。机器人技术的未来离不开机器人之间的相互学习，而这一切的前提，首先要求研究人员之间能够相互学习。”

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28379

浏览量
206914
AI

AI

+关注

关注
87

文章
30728

浏览量
268886
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24689
DeepMind

DeepMind

+关注

关注
0

文章
130

浏览量
10846

原文标题：DeepMind 全新 AI 项目曝光：可控制各类机器人，数据集有望开源

文章出处：【微信号：AI前线，微信公众号：AI前线】欢迎添加关注！文章转载请注明出处。

《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

要给AI这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机，可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体，是具身智能的代表产品。与传统的软件智能体

发表于 12-19 22:26

开源项目！OpenCat—— 一个全能的平价四足机器人

Arduino。一个人工遥控器处于中间位置，可以拦截机器人对自身身体的控制。它仍将保留某些本能，比如拒绝跳下悬崖。目前，我有两个功能原型：迷你模型是一个独立的8 自由度（支持多达 16 自由度

发表于 12-16 11:44

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

早就听大佬们说，具身智能是人工智能的下一波浪潮，也是AI未来的趋势！最近，具身智能的概念更是炙手可热，备受瞩目！不论是这几天稚晖君开源人形机器人全套图纸+代码，引发圈内热议。还是各类

发表于 11-11 10:20

【开源项目】你准备好DIY一款功能强大的机器人了吗？

新项目。设计界面：添加移动按钮、用于LED控制的色彩轮以及眼睛表情的图像资源。设置蓝牙通信：集成蓝牙连接以发送串行数据到机器人。为按钮分配动作：配置每个按钮以发送特定的串行字符来

发表于 11-08 10:53

“0元购”智元灵犀X1机器人，软硬件全套图纸和代码全公开！资料免费下载！

、仿真Sim2Sim、Sim2Real代码、强化学习训练代码、模型转换、推理工具，和调试工具（数据可视化、遥控器）等等，“一站式”全套图纸和代码帮助大家更好地学习人形机器人开发流程。作为业内首家全栈开源

发表于 10-25 15:20

认识机器人与CW32四足机器人控制项目

认识机器人与CW32四足机器人控制项目一、认识机器人 机器人是一种能够自动执行任务的

发表于 09-28 15:46 •236次阅读

开源项目！用ESP32做一个可爱的无用机器人

简介作者在完成硕士论文答辩后，利用空闲时间制作了一个他一直想做的机器人——可爱无用机器人。无用机器人原理是一个连接到开关的电机，通过逻辑门控制。当开关被推到“开”时，

发表于 09-03 09:34

开源项目！用ESP32做一个可爱的无用机器人

简介作者在完成硕士论文答辩后，利用空闲时间制作了一个他一直想做的机器人——可爱无用机器人。无用机器人原理是一个连接到开关的电机，通过逻辑门控制。当开关被推到“开”时，

发表于 08-30 14:50

谷歌借助Gemini AI系统深化对机器人的训练

7月12日，国际科技界传来新动态，谷歌正借助其先进的Gemini AI系统，深化对旗下机器人的训练，旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论

发表于 07-12 16:29 •623次阅读

Al大模型机器人

理解能力强大: AI大模型机器人可以理解和生成自然语言，能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感，并据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的数据集

发表于 07-05 08:52

宏集智能机器人控制系统驱动高效生产

宏集MC系列控制器结合CODESYS编程环境和宏集SC安全控制器，为用户提供全方位的智能机器人运动控制

发表于 05-23 14:10 •376次阅读

其利天下技术·搭载无刷电机的扫地机器人的前景如何？

大的吸力，有效清除各类污渍和颗粒物。同时，低噪音设计使得机器在工作时不会打扰到家庭成员的休息或工作。此外，无刷电机的寿命更长，减少了用户的维护成本，提高了产品的性价比。 2.扫地机器人智能化程度的提升

发表于 05-05 15:03

英伟达推出全新AI聊天机器人

近日，英伟达（Nvidia）宣布推出其全新的AI聊天机器人——“Chat With RTX”。这款聊天机器人被视为英伟达版的ChatGPT，为用户提供了一个

发表于 02-19 11:09 •914次阅读

【开源项目】Emo：基于树莓派 4B DIY 能笑会动的桌面机器人

Emo是一款基于树莓派4做的个人伴侣机器人，集时尚与创新于一身。它不仅仅是一款机器人，更是一个活生生的存在，与其他机器人不同，它拥有独特的个性和情感。硬件部分树莓派 4B

发表于 12-26 15:18

开源项目！教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等

开源项目作品为了方便大家更好提升自己，德赢Vwin官网小编为大家整理了一些工程师大佬设计的开源项目作品，供大家可以参考学习，希望对广大工程师有所帮助。 1.用全志R128复刻自平衡赛车

发表于 12-26 09:17

搜索历史

DeepMind全新AI项目曝光：可控制各类机器人，数据集有望开源

评论

《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

开源项目！OpenCat—— 一个全能的平价四足机器人

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

【开源项目】你准备好DIY一款功能强大的机器人了吗？

“0元购”智元灵犀X1机器人，软硬件全套图纸和代码全公开！资料免费下载！

认识机器人与CW32四足机器人控制项目

开源项目！用ESP32做一个可爱的无用机器人

开源项目！用ESP32做一个可爱的无用机器人

谷歌借助Gemini AI系统深化对机器人的训练

Al大模型机器人

宏集智能机器人控制系统驱动高效生产

其利天下技术·搭载无刷电机的扫地机器人的前景如何？

英伟达推出全新AI聊天机器人

【开源项目】Emo：基于树莓派 4B DIY 能笑会动的桌面机器人

开源项目！教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等