1 伯克利那个会“18般武艺”的DeepMimic模型开源了!-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

伯克利那个会“18般武艺”的DeepMimic模型开源了!

DPVg_AI_era 来源:未知 作者:李倩 2018-10-19 09:06 次阅读

还记得今年4月伯克利BAIR实验室发布的那个会“18般武艺”的DeepMimic模型吗?他们使用强化学习技术,用动作捕捉片段训练模型,教会了AI智能体完成24种动作,走路、跑步就不用说了,还包括翻跟斗、侧翻跳、投球、高踢腿等等高能动作。

体会一下:

回旋踢

跑步

投球

训练每一种动作都需要动作捕捉和深度强化学习,而BAIR的研究者创造了一个全新的系统,教会agent完成复杂、逼真的动作任务。

作者Xue Bin Peng等人将这个系统命名为DeepMimic,比已有工作更进一步的是,他们的目标是在训练一个agent完成特定任务的前提下,使它的动作更贴近真实。他们的论文发表在SIGGRAPH 2018。

除了人形机器人外,他们还训练了Atlas机器人、暴龙、龙等形态的agent。

Atlas机器人

整个DeepMimic所需要的input分为三部分:一个被称为Character的Agent模型;希望Agent学习的参考动作(reference motion);希望Agent完成的任务(task)所定义的reward function。

训练之后会得到一个可以控制Agent同时满足与参考动作相似且可以完成任务的控制器

四种翻滚动作

现在,DeepMimic的代码、数据和训练策略已经全部开源,感兴趣的读者不妨试试拿来训练自己的“功夫小子”。

开源代码

SIGGRAPH 2018论文:“DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills”的代码。这个框架使用强化学习来训练一个vwin 人形智能体来模仿来自mocap数据的各种运动技能。

项目页面:

https://xbpeng.github.io/projects/DeepMimic/index.html

C++:

Bullet 2.87 (https://github.com/bulletphysics/bullet3/releases)

Eigen (http://www.eigen.tuxfamily.org/index.php?title=Main_Page)

OpenGL >= 3.2

freeglut (http://freeglut.sourceforge.net/)

glew (http://glew.sourceforge.net/)

Python:

PyOpenGL (http://pyopengl.sourceforge.net/)

Tensorflow (https://www.tensorflow.org/)

MPI4Py (https://mpi4py.readthedocs.io/en/stable/install.html)

Misc:

SWIG (http://www.swig.org/)

MPI

Windows:https://docs.microsoft.com/en-us/message-passing-interface/microsoft-mpi

Linux:sudo apt install libopenmpi-dev

Build

模拟环境是用C++编写的,python包装器使用SWIG构建。要安装python依赖项,请运行

pip install -r requirements.txt

请注意,必须在MPI4Py之前安装MPI。

Windows

wrapper使用DeepMimicCore.sln构建。

1. 从配置管理器中选择x64配置。

2. 在DeepMimicCore的项目属性下,修改要包含的其他包含目录

Bullet源目录

Eigen包括目录

python包含目录

3. 修改要指定的其他库目录

Bullet lib目录

python lib目录

使用Release_Swig配置构建DeepMimicCore项目,这应该在DeepMimicCore/. 中生成DeepMimicCore.py。

Linux

1. 通过指定以下内容修改DeepMimicCore中的Makefile,

EIGEN_DIR:Eigen包含目录

BULLET_INC_DIR:Bullet源目录

PYTHON_INC:python包含目录

PYTHON_LIB:python lib目录

2. 建立wrapper,

make python

这应该在DeepMimicCore/中生成DeepMimicCore.py

如何使用

一旦构建了python wrapper,就可以使用Tensorflow完全在python中完成训练。DeepMimic.py运行用于查看模拟的可视化工具。使用mpi_run.py完成训练,它使用MPI在多个进程之间并行训练。

通过指定提供场景配置的参数文件来运行DeepMimic.py。例如,

python DeepMimic.py --arg_file args/run_humanoid3d_spinkick_args.txt

将为“回旋踢”运行一个预训练的policy。同样的,

python DeepMimic.py --arg_file args/kin_char_args.txt

将加载并播放mocap片段。

要训练一个策略(policy),请通过指定参数文件和工作进程数来运行mpi_run.py。例如,

python mpi_run.py --arg_file args/train_humanoid3d_spinkick_args.txt --num_workers 4

将训练一个策略,使用4个workers进行“回旋踢”。作为训练方案,它会定期打印统计数据并将其记录到output/,以及最新策略的.ckpt。通常需要大约6千万个样本来训练一个策略,而训练16个workers需要一天时间。16个workers可能是框架所能支持的最大workers数量。

args中已经为不同的技能提供了许多参数文件。train_ [something] _args.txt文件是为mpi_run.py设置的,用于训练策略,并为DeepMimic.py设置run_ [something] _args.txt文件以运行其中一个预训练策略。要运行自己的策略,请使用run_ [something] _args.txt的文件之一,并指定要使用--model_file运行的策略。确保引用的动作--motion_file对应于策略所训练的动作,否则策略将无法正常运行。

接口

右上角的图显示了价值函数的预测

单击右键并拖动将平移相机

单击左键并拖动将对特定位置处的角色施加力

滚轮会放大/缩小

按“r”将重置该episode

按'l'将重新加载参数文件并重建所有内容

按'x'将使用随机的框投向角色

按空格将暂停/恢复模拟

按’>'将逐步执行模拟

Mocap Data

Mocap clips位于data/motions/中。要播放剪辑,首先修改args/kin_char_args.txt并指定要使用的文件--motion_file,然后运行

python DeepMimic.py --arg_file args/kin_char_args.txt

动作文件遵循JSON格式。“Loop”字段指定运动是否是循环的。“wrap”指定一个循环运动,该循环将在结束时回到起始点,而“none”指定一旦运动结束就会停止的非循环运动。“Frames”列表中的每个向量指定运动中的关键帧。每个框架具有以下格式:

位置以米为单位指定,球面关节的3D旋转指定为四元数(w,x,y,z),转动关节(例如膝关节和肘关节)的1维旋转用弧度的标量表示。根位置和旋转在世界坐标中,但所有其他关节旋转都在关节的局部坐标中。要使用你自己的动作剪辑,请将其转换为类似格式的JSON文件。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268871
  • 智能体
    +关注

    关注

    1

    文章

    144

    浏览量

    10575
  • 强化学习
    +关注

    关注

    4

    文章

    266

    浏览量

    11245

原文标题:强化学习练就18般武艺!伯克利开源DeepMimic

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    UC伯克利教授Stuart Russell:人工智能基础概念与34个误区

    Russell是加州大学伯克利分校人工智能系统中心创始人兼计算机科学专业教授,同时还是人工智能领域里「标准教科书」《人工智能:一种现代方法》作者(谷歌研究主管Peter Norvig也是该书作者)。在这篇文章中,他以Q&A的方式讲解了人工智能的未来以及常见的误解。
    的头像 发表于 07-04 09:41 5567次阅读

    伯克利博士论文:DC-DC转换器

    伯克利博士的论文,关于DC-DC转换器的理解介绍和应用分析。
    发表于 09-29 18:13 103次下载
    <b class='flag-5'>伯克利</b>博士论文:DC-DC转换器

    美国劳伦斯伯克利国家实验室开发出“病毒发电”元件

      美国劳伦斯伯克利国家实验室(LBNL)开发出了利用病毒来发电的技术,并在2012年5月13日发行的学术杂志《Nature Nanotechnology》上发表相关论文。
    的头像 发表于 05-16 09:45 4493次阅读

    美国加州大学伯克利分校模电资料

    美国加州大学伯克利分校模电资料,个人收集整理了很久的资料,大家根据自己情况,有选择性的下载吧~
    发表于 10-28 09:19 0次下载

    伯克利(Berkeley)联网程序代码介绍

    本章介绍伯克利( B e r k e l e y )联网程序代码。开始我们先看一段源代码并介绍一些通篇要用的印刷约定。对各种不同代码版本的简单历史回顾让我们可以看到本书中的源代码处于什么位置。接下来
    发表于 05-09 14:33 0次下载

    伯克利分校和韩国KAIST先后公布柔性传感器据说能检测血氧

    加利福尼亚大学伯克利分校开发的一种柔性传感器可以大面积获取皮肤、组织和器官的血氧水平图谱。这种传感器通过在一种柔性材料上印刷红色OLED、近红外OLED和有机光电二极管的交替阵列制成。
    的头像 发表于 11-24 09:47 4146次阅读

    推特公开宣布伯克利机器人学习实验室最新开发的机器人BLUE

    ieter Abbeel 是领域内著名的机器人学与机器学习专家,他目前是加州大学伯克利分校电子工程与计算机系教授、伯克利人工智能实验室(BAIR)联合主任、伯克利机器人学习实验室(UC Berkeley's Robot Lear
    的头像 发表于 04-13 11:09 4456次阅读

    UC伯克利新机器人成果:灵活自由地使用工具

    之前我们刚刚介绍加州大学伯克利分校 Pieter Abbeel 教授领导伯克利机器人学习实验室(UC Be
    的头像 发表于 04-15 09:03 2472次阅读

    机器人遭绑架?一男子看不惯在伯克利街道上漫游的送货机器人

    根据媒体报道,4月25日周四晚间,Kiwibot公司向伯克利警察局报案,指出他们价值 2500 美元的送货机器人被偷,伯克利警察局局长 Peter Hong 表示,警方使用 GPS 追踪机器人的位置,确定机器人被锁在一辆汽车的后备厢里,随即找到了车主。
    的头像 发表于 05-07 18:09 2760次阅读

    伯克利单腿跳机器人迎来新升级 即将在ICRA2019会议上亮相

    IEEE Spectrum上就有一篇最新进展的介绍,在很多人的眼中,加州大学伯克利分校的Salto从2016年以来就是他们最喜欢的机器人之一,然后在后来的机器人技术突飞猛进的几年里Salto就开始显得有点过时
    的头像 发表于 05-23 15:59 2913次阅读

    加州大学伯克利分校的团队给予跳跃机器人更高目标

    美国加州大学伯克利分校的研究人员,研发出一款能不断跳跃的机器人:Salto-1P。
    的头像 发表于 06-13 17:52 3437次阅读

    清华、伯克利联手打造 成立RISC-V国际实验室

    图灵奖得主牵头,清华伯克利联手打造开源芯片,以深圳为根节点,全面提升 RISC-V 生态系统至最先进水平、成为一家以技术成果转移为主要使命的非营利组织,并产出免受专利诉讼的工业级知识产权成果。
    的头像 发表于 06-16 10:16 3676次阅读

    图灵奖得主牵头推动芯片开源 清华伯克利成立RISC-V国际实验室

    图灵奖得主牵头,清华伯克利联手打造开源芯片,以深圳为根节点,全面提升 RISC-V 生态系统至最先进水平、成为一家以技术成果转移为主要使命的非营利组织,并产出免受专利诉讼的工业级知识产权成果。
    的头像 发表于 06-17 15:05 4590次阅读

    加州大学伯克利分校研发可以操控的机器人

    近日,加州大学伯克利分校(UC Berkeley)研发出了一款新型机器人,可实现洗碗、叠衣服、收拾房间的等动作。
    发表于 08-05 15:45 962次阅读

    美国伯克利市考虑2027年出台汽油车禁售令

    据外媒报道,六年后,美国加州伯克利或将禁售汽油车。 伯克利市考虑到2027年出台一项汽油车禁售令,旨在应对气候变化。 伯克利市议会计划在下周二发起可行性调查请求,计划出台一项法规,逐步淘汰伯克
    的头像 发表于 01-19 11:25 1451次阅读