1 科学家开发可提高3D感知能力的模型,实现四足机器人自由行走-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

天津机器人 来源:天津机器人 2023-09-11 17:11 次阅读

借助机器人的本体感觉对足式运动进行研究已有数十年。在以往的研究手段中,研究人员往往采用基于模型的方法开发神经网络控制器。但是,这类方法无法在那些现实世界里没有见过的环境中得到应用。

近年来,为了获得更好的泛化性和鲁棒性,研究者们开始采用无模型强化学习,在vwin 中训练控制器,然后将学习到的策略直接转移到真实的机器人上。

那么,如何在无需遥控器操控的条件下,让四足机器人实现在复杂地形上自由流畅地行走呢?

近期,来自美国加州大学圣地亚哥分校和麻省理工学院的研究团队,开发了一个可以提高机器人 3D 感知能力的模型,能够支配四足机器人在各种困难地形场景下完成自动化行走,比如爬楼梯、踩石头、在树林中走路等。

视频所示,该四足机器人的额头上装有前置的深度摄像头,该摄像头向下倾斜的角度,可以帮助该机器人前面的两足,根据所看到的前方场景和脚下地形做出正确的行动决策。但其后面的两足必须先记住前面看过的内容,才能确保在经过时踩在正确的位置上。

所以,这中间存在一个重要的问题,即需要一个短期的 3D 环境记忆体,能够使得机器人的四足都对三维环境有良好的感知和模拟。

为此,该团队构建了一种神经体积记忆(Neural Volumetric Memory,NVM)架构,可以先借助自监督方法对视频帧中的三维特征进行学习,再用几何变换把这些三维特征投影到同一个空间下面,最后通过模型将所有的特征信息融合在一起,让机器人对它所处的 3D 环境建立起短期记忆。

其中,需要说明的是,将上述带有特征的全部视觉信息综合在一起,可以帮助四足机器人记住其看到的内容,以及足部之前做过的动作,并利用这些记忆指导它下一步行动。这也表明,NVM 能为机器人执行决策提供可靠的 3D 结构信息,并为足式机器人利用视觉进行观察开辟新的可能性。

2023 年 3 月,相关论文以《用于视觉运动控制的神经体积记忆》(Neural Volumetric Memory for Visual Locomotion Control)为题发表在CVPR上,并被选为Highlight论文[1]。

d50e95f0-4fec-11ee-a25d-92fbcf53809c.jpg

图丨相关论文(来源:arXiv)

据介绍,该研究始于 2022 年 1 月。在当时的条件下,该团队先在模拟器环境下进行训练,再转至机器人上进行部署和测试。NVM 模块可以令四足机器人在模拟环境和真实世界中穿越复杂地形,并获得更好的模拟-真实泛化结果。

但是,由于模拟器和机器人在物理和视觉方面都存在一些差距,因此需要克服许多有难度的工程问题。此外,从模拟器中制定任务,以及做强化学习训练所需的代码,也需要该团队自行开发。

d52f9732-4fec-11ee-a25d-92fbcf53809c.jpg

图丨实际部署(来源:arXiv)

据了解,这项成果建立在该团队之前的一项研究上,此前,该团队使用强化学习和基于 Transformer 的模型,将本体感受和视觉信息相结合,使得四足机器人能够避开障碍物,在不平整的地面上行走和奔跑 [2]。

“我们目前这项研究是在不同帧上抽取三维特征,把它们放到同一个三维空间下进行合并,而之前的那项研究仅仅将不同帧直接合并起来,当做一个视频放入卷积神经网络中,没有做太多三维理解。”谈及本项成果取得的进展,王小龙表示,“并且,之前机器人能完成的任务比较简单,不能实现爬楼梯或踩木桩这种比较困难的任务。”

不过,该团队也表示,他们目前开发的模型还存在一些局限性。首先,不能引导四足机器人到达指定的目的地;其次,完成部署后,机器人只能简单地走一条直线,如果看到障碍物,会通过另一条直线避开;此外,机器人还不能精确控制其去向。

从应用层面上看,相较于安装轮子才能走路的机器人,四足机器人的通用性更强。比如,其可以用于应急救援领域,执行受困人员搜救、废墟清理等任务;用于下水管道探测等。

后续,该团队不仅计划开发更多用于规划机器人的技术,还打算在四足机器人上增加机械臂,来执行抓取、开门等任务;同时,他们也想让机器人实现更多创意性的技能,诸如跳跃、踢球等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28379

    浏览量

    206906
  • 模型
    +关注

    关注

    1

    文章

    3226

    浏览量

    48806
  • 3D感知
    +关注

    关注

    0

    文章

    19

    浏览量

    3724

原文标题:科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

文章出处:【微信号:tjrobot,微信公众号:天津机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、
    发表于 12-20 19:17

    开源项目!OpenCat—— 一个全能的平价机器人

    以额外承载约 1 千克的重量(但行走速度会变慢)。它面向 STEM教育和创客社区。价格将与一些机器人汽车套件相似。 完整版使用树莓派来实现更多人工智能增强的感知功能,并指挥一个升级版的
    发表于 12-16 11:44

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    情况为例,具身智能机器人的核心元器件(包括 3D 视觉传感器、六维力传感器、微型传动系统、灵巧手与精密力控系统、高性能 驱控关节模组、融合通用大模型机器人算力底座 AI 芯片、具身行
    发表于 11-11 10:20

    认识机器人与CW32机器人控制项目

    认识机器人与CW32机器人控制项目 一、认识机器人 机器人是一种能够自动执行任务的
    的头像 发表于 09-28 15:46 234次阅读

    【CW32开发】初探机器人

    本项目使用8自由度舵机控制的机器人。主要用于爱好者学习参考。实现基本控制姿态:前进、左转、
    的头像 发表于 09-25 12:08 1654次阅读
    【CW32<b class='flag-5'>开发</b>】初探<b class='flag-5'>四</b><b class='flag-5'>足</b><b class='flag-5'>机器人</b>

    英伟达预测机器人领域或迎“GPT-3时刻”

    英伟达,作为全球图形处理器与人工智能领域的佼佼者,正引领着科技界对机器人未来的无限遐想。近日,英伟达高级科学家Jim Fan在科技媒体The Decoder的博文中,以及红杉资本的采访中,大胆预测
    的头像 发表于 09-20 17:05 789次阅读

    Jim Fan展望:机器人领域即将迎来GPT-3式突破

    英伟达科学家9月19日,科技媒体The Decoder发布了一则引人关注的报道,英伟达高级科学家Jim Fan在近期预测,机器人技术将在未来两到三年内迎来类似GPT-3在语言处理领域的
    的头像 发表于 09-19 15:13 566次阅读

    Nullmax视觉感知能力再获国际顶级学术会议认可

    日前,欧洲计算机视觉国际会议 ECCV 2024公布论文录用结果,Nullmax感知团队的目标检测论文《SimPB: A Single Model for 2D and 3D Object Detection from Mult
    的头像 发表于 09-02 14:07 415次阅读

    天津大学科学家突破人类大脑器官成功驱动机器人

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧密相连,开启了人脑与
    的头像 发表于 07-08 16:00 602次阅读

    Al大模型机器人

    和迭代来不断改进自身性能。它们可以从用户交互中学习并根据反馈进行调整,以提高对话质量和准确性。定制性与整合性: AI大模型机器人可以根据特定需求进行定制和整合,以满足不同场景和应用的
    发表于 07-05 08:52

    基于FPGA EtherCAT的六自由机器人视觉伺服控制设计

    和增强系统处理图像的实时性,本文提出了一种伊瑟特的六自由机器人视觉伺服控制系统,将摄像头集成到基于 Zynq的伊瑟特主站上,提高了视觉伺服的实时性.经测试,该平台能够对视觉检测目标的变化做出及时的反应
    发表于 05-29 16:17

    为什么机器人设计常借鉴狗的外形特征?

    刘表示,机器狗是机器人的一部分,被称为“动物”,意思很明显是“条腿”。
    发表于 04-10 14:30 437次阅读

    银牛微电子3D视觉感知方案赋能小米CyberDog系列仿生机器人

    2024年3月21日,合肥银牛微电子宣布小米CyberDog系列仿生机器人的AI多模态融合感知决策系统正式采用银牛的双目立体视觉产品解决
    的头像 发表于 03-21 13:55 816次阅读

    技术基因+自主创新,光鉴科技塑造3D视觉感知新范式

    感知技术已经渗透到智能汽车、工业机器人、服务机器人、智慧城市、新零售和智能家居等广泛领域,凭借精度高、速度快、适配性强、抗干扰能力强等突出优势,3D
    的头像 发表于 01-16 00:22 1304次阅读
    技术基因+自主创新,光鉴科技塑造<b class='flag-5'>3D</b>视觉<b class='flag-5'>感知</b>新范式

    高精度彩色3D相机:开启崭新的彩色3D成像时代

    近年来,机器人技术的快速发展促使对3D相机技术的需求不断增加,原因在于,相机在提高机器人的性能和实现多种功能方面发挥了决定性作用。
    的头像 发表于 01-15 14:09 533次阅读
    高精度彩色<b class='flag-5'>3D</b>相机:开启崭新的彩色<b class='flag-5'>3D</b>成像时代