1 借助Hydra-MDP框架实现端到端自动驾驶-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助Hydra-MDP框架实现端到端自动驾驶

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-09-06 14:28 次阅读

构建一个能在复杂物理世界中导航的自动驾驶系统极具挑战性。系统必须感知周围环境并做出快速且明智的决策。乘客体验也很重要,需要考虑加速、曲率、平滑度、路面附着力、碰撞时间等因素。

本文将介绍 Hydra-MDP,这个创新的框架将推动端到端自动驾驶领域的发展。Hydra-MDP 采用新颖的多教师、学生-教师知识提炼架构,整合了来自人类和基于规则的规划器的知识。这使模型能够学习不同的轨迹,从而提高在不同驾驶环境和条件下的通用性。

wKgaombaoSyAcPunAAgXaVMvpo0759.png

图 1 端到端规划范式比较

Hydra-MDP 所提供的通用框架展示了如何通过基于规则的规划器来增强基于机器学习的规划。这一整合确保模型不仅能模仿人类驾驶行为,还能遵守交通规则和安全标准,打破了传统模仿学习的局限性。

Hydra-MDP 以数据驱动的扩展法则展现了其鲁棒性和适应性。通过使用具有大量数据和 GPU 小时数的预训练基础模型,Hydra-MDP 展示了其可扩展性以及持续改进的潜力。

NVIDIA 的 Hydra-MDP 模型在 CVPR 2024 大规模端到端驾驶挑战赛中获得了第一名和创新奖,并且在 nuPlan 基准测试中的表现优于当前最先进的规划器。它为基于 ML 的规划系统在自动驾驶中的应用开辟了一条前景广阔的道路。

端到端自动驾驶是一套系统接收来自摄像头、雷达和激光雷达的原始传感器数据并直接输出车辆控制的完整方法。

相关论文

Hydra-MDP:多目标 Hydra-Distillation 端到端多模式规划

Hydra-MDP 采用新颖的多教师、学生-教师知识提炼架构,整合了来自人类和基于规则的规划器的知识。

借助基于规则的教师知识,Hydra-MDP 可以学习环境如何以端到端的方式影响规划,而不是求助于无差别的后处理,使其在不同驾驶环境和条件下的通用性有了显著提高。

通过多目标 Hydra-Distillation

加强多模态规划

在开发 Hydra-MDP 的过程中,NVIDIA 学到了一些关键的经验,这些经验决定了 Hydra-MDP 的架构及其成功。Hydra-MDP 将人类和基于规则的知识提炼相结合,创建出一个强大的多功能自动驾驶模型。

以下是 NVIDIA 学习到的关键经验:

认识到多模态和多目标规划的复杂性

利用多目标 Hydra-Distillation 的强大功能

克服后处理的局限性

了解环境背景的重要性

通过vwin 反复完善

使用有效的模型组合

认识到多模态和多目标规划的复杂性

认识到多模态和多目标规划的必要性是一门“基础课”。

传统的端到端自动驾驶系统通常只侧重于单个模态和目标,这限制了其在现实世界中的有效性。Hydra-MDP 整合了根据安全、效率、舒适度等多个指标定制的不同轨迹,确保模型不只是模仿人类驾驶员,而是能够适应复杂的驾驶环境。

wKgZombaoWGAe5LhAAbXk3u5PTY946.png

图 2 Hydra-MDP 架构

利用多目标 Hydra-Distillation 的强大功能

多目标 Hydra-Distillation 是一个教师-学生多模态框架,它是 NVIDIA 方法中的关键策略。通过采用多个专业教师(既有人类教师,也有基于规则的教师),模型能够学会预测与各种模拟指标相一致的轨迹。该技术提高了模型在不同驾驶条件下的通用性。

NVIDIA 了解到加入基于规则的规划器提供了一个结构化框架,而加入人类教师则带来了适应性和细致的决策能力,这对于适应不可预测的场景至关重要。

克服后处理的局限性

另一个洞察是依赖后处理进行轨迹选择存在固有的局限性。

传统方法通常会将感知和规划分离成不同且不可微分的步骤,从而丢失有价值的信息。Hydra-MDP 的端到端架构将感知和规划整合成一个无缝衔接的工作流,并在整个决策过程中保持了环境数据的丰富性。通过这种整合,使预测变得更加明智且准确。

了解环境背景的重要性

加入详细的环境背景对于规划的准确性来说至关重要。

Hydra-MDP 的感知网络以 Transfuser 基线为基础构建而成,它将激光雷达和摄像机输入所具有的特征加以组合。这种多模态融合有助于模型更好地理解和应对复杂的驾驶环境。

Transformer 层将这些模态连接起来,保证了对环境背景的全面编码,并提供丰富、可操作的洞察。

通过模拟反复完善

事实证明,离线模拟促进的反复完善过程非常有价值。

在整个训练数据集上运行模拟生成了各项指标的基准真实模拟分数。这些数据随后被用于监督训练过程,使模型能够从各种模拟驾驶场景中学习。

该步骤凸显了大量模拟在填补理论性能与实际应用之间差距的重要性。

wKgZombaoXKAHvDMAACRyjjmGK4293.png

表 1 Hydra-MDP 的准确性与输入图像分辨率、预训练和骨干架构的函数关系。获胜方案 Hydra-MDP-C 通过将这些因素结合在一起提高了性能。

使用有效的模型集合

有效的模型集合是取得成功的关键。

NVIDIA 使用了混合编码器和子分数集合等技术来结合模型的优势。这提高了 Hydra-MDP 的鲁棒性,保证了最终模型能够以高精度处理各种驾驶场景。

集合技术兼顾了计算效率和性能,对于实时应用至关重要。

结论

Hydra-MDP 的开发是一个创新、实验和不断学习的过程。通过采用多模态和多目标规划、利用多目标 Hydra-Distillation,以及通过大量模拟加以完善, NVIDIA 创建了一个明显优于当前最先进方法的模型。这些经验造就了 Hydra-MDP 的成功,并为未来自动驾驶技术的进步提供了宝贵的启发。

更多信息,参见 Hydra-MDP:借助多目标 Hydra-Distillation 实现端到端多模态规划。相关工作参见自动驾驶汽车应用研究。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4978

    浏览量

    102987
  • 模型
    +关注

    关注

    1

    文章

    3226

    浏览量

    48807
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132561
  • 自动驾驶
    +关注

    关注

    784

    文章

    13784

    浏览量

    166384

原文标题:借助 Hydra-MDP 实现大规模端到端驾驶

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自动驾驶真的会来吗?

    自动驾驶面临的主要挑战是基于图像的机器学习能力。  理论上,基于图像的机器学习可以让汽车实现自动驾驶,但在实际技术发展方面,仍有很多问题无法解决。例如现在特斯拉的辅助驾驶只能在高速公路
    发表于 07-21 09:00

    自动驾驶技术的实现

    的带宽有了更高的要求。从而使用以太网技术及中央域控制(Domain)和区域控制(Zonal)架构是下一代车载网络的发展方向。然而对于自动驾驶技术的实现,涉及感知、规划、执行三个层面。由于车辆行...
    发表于 09-03 08:31

    如何基于深度神经网络设计一个自动驾驶模型?

    如何基于深度神经网络设计一个自动驾驶模型?如何设计一个基于增强学习的自动驾驶决策系统?
    的头像 发表于 04-29 16:44 4887次阅读
    如何基于深度神经网络设计一个<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的<b class='flag-5'>自动驾驶</b>模型?

    基于自动驾驶系统只能做demo吗

    只配做demo吗?由剑桥大学团队创办的Wayve无人驾驶软件公司却不这么认为。
    的头像 发表于 12-26 10:39 501次阅读

    自动驾驶到底是什么?

    UniAD 统一自动驾驶关键任务,但是的训练难度极大,对数据的要求和工程能力的要求比常规的技术栈要高,但是由此带来的全局一致性让整个系统变得更加简洁,也能够防止某个模块进入局部最
    发表于 06-28 14:47 3613次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>到底是什么?

    基于矢量化场景表征的自动驾驶算法框架

    在ICCV 2023上,地平线和华中科技大学提出基于矢量化场景表征的自动驾驶算法——VAD。VAD摈弃了栅格化表征,对整个驾驶场景进行
    发表于 08-31 09:28 1105次阅读
    基于矢量化场景表征的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>算法<b class='flag-5'>框架</b>

    理想汽车自动驾驶模型实现

    理想汽车在感知、跟踪、预测、决策和规划等方面都进行了模型化,最终实现的模型。这种模型不仅完全模型化,还能够虚拟化,即在模拟环境中进行训练和测试。
    发表于 04-12 12:17 446次阅读
    理想汽车<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型<b class='flag-5'>实现</b>

    佐思汽研发布《2024年自动驾驶研究报告》

    自动驾驶是直接从传感器信息输入(如摄像头图像、LiDAR等)控制命令输出(如转向、加减速等)映射的一套系统,最早出现在1988年的A
    的头像 发表于 04-20 11:21 3102次阅读
    佐思汽研发布《2024年<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>研究报告》

    智行者联合清华完成国内首套全栈式自动驾驶系统的开放道路测试

    近日,智行者与清华大学车辆学院李克强院士、李升波教授领导的研究团队,完成了国内首套全栈式自动驾驶系统的开放道路测试。
    的头像 发表于 04-22 09:24 770次阅读
    智行者联合清华完成国内首套全栈式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>系统的开放道路测试

    理想汽车加速自动驾驶布局,成立“”实体组织

    近期,理想汽车在其智能驾驶领域迈出了重要一步,正式成立了专注于“自动驾驶”的实体组织,该组织规模超过200人,标志着理想在
    的头像 发表于 07-17 15:42 1343次阅读

    实现自动驾驶,唯有

    ,去年行业主流方案还是轻高精地图城区智驾,今年大家的目标都瞄到了(End-to-End, E2E)。
    的头像 发表于 08-12 09:14 720次阅读
    <b class='flag-5'>实现</b><b class='flag-5'>自动驾驶</b>,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    Mobileye自动驾驶解决方案的深度解析

    自动驾驶技术正处于快速发展之中,各大科技公司和汽车制造商均在争相布局,试图在这个新兴领域占据一席之地。Mobileye作为全球自动驾驶技术的领军企业之一,凭借其独特的
    的头像 发表于 10-17 09:35 351次阅读
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>解决方案的深度解析

    Waymo利用谷歌Gemini大模型,研发端自动驾驶系统

    迈新步,为其机器人出租车业务引入了一种基于谷歌多模态大语言模型(MLLM)“Gemini”的全新训练模型——“多模态自动驾驶模型”(EMMA)。
    的头像 发表于 10-31 16:55 1050次阅读

    连接视觉语言大模型与自动驾驶

    自动驾驶在大规模驾驶数据上训练,展现出很强的决策规划能力,但是面对复杂罕见的驾驶场景,依然
    的头像 发表于 11-07 15:15 224次阅读
    连接视觉语言大模型与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>

    自动驾驶技术研究与分析

    传递和全局优化的优势,成为智能驾驶技术发展的重要方向。与传统模块化架构相比,技术通过深度神经网络实现从传感器数据输入
    的头像 发表于 12-19 13:07 80次阅读