利用对抗性深度强化学习来衡量自动驾驶汽车的运动规划和碰撞避免机制的可靠性-德赢Vwin官网网

现如今，随着人工智能技术的迅速发展，人们普遍认为，未来的交通系统将由自动驾驶汽车（AV）所主导。可以说，对于更为安全的交通设施的需求是引起人们对自动驾驶汽车感兴趣并推动其发展的一个主要推动力。但不可否认，就现在而言，可靠和具有鲁棒性的自动驾驶汽车技术的发展仍然是一个持续的挑战，对可靠的运动规划和碰撞避免机制的研究尤其重要。最近，堪萨斯州立大学（Kansas State University，KSU）的科学家了提出了一种基于深度强化学习的新框架，用于对自动驾驶汽车的碰撞避免机制的行为进行基准测试。

现如今，随着人们对自主导航的兴趣日益增长，关于运动规划和碰撞避免技术（collision avoidance techniques）的研究已经加速了全新提议和新进展的速度。然而，新技术的复杂性及其安全性要求使得当前的大部分基准测试框架不充分，因此对高效的比较技术的需求没有得到满足。这项研究提出了一种基于深度强化学习的新框架，用于在处理最佳对抗性智能体的最坏情况下对碰撞避免机制的行为进行基准测试，该最佳对抗性智能体进行训练从而将系统驱动到不安全状态。我们将这个框架的体系结构和流程描述为一个基准测试解决方案，并通过一个比较两种碰撞避免机制的可靠性的实际案例研究来证明其有效性，从而对有意识的碰撞尝试做出回应。

人们普遍认为，未来的交通系统将由自动驾驶汽车（AV）所主导。随着近年来这一领域的迅速发展，许多人预测这种转变将在未来十年内发生。对更为安全的交通运输的需求，是引起人们兴趣和推动自动驾驶汽车发展的一个主要动机。一般认为，用专家计算模型代替人类驾驶员的内在缺陷，可以显著减少由驾驶员的误差所导致的事故数量。然而，可靠和具有鲁棒性的自动驾驶汽车技术的发展仍然是一个持续的挑战，并且人们正在积极从各个研究和发展方向来追求这一目标。

图1：对抗性目标的图释

对可靠的运动规划和碰撞避免机制的研究尤其重要。在过去数十年的时间里，科学家们已经提出了许多解决这个问题的方法，从控制理论形式化和最优控制方法到潜在的基于场和规则的技术（field- and rule-based techniques），等等。最近，机器学习的进步使得基于诸如模仿学习和深度强化学习（RL）等技术的全新数据驱动的碰撞避免方法成为可能。然而，随着其部署环境和机制日益复杂，为这些解决方案提供安全保障的挑战变得越来越困难。一个值得注意的例子是交通碰撞避免系统（TCAS），在它广泛部署到NextGen商用飞机之前，它就已经满足了联邦航空局（FAA）的严格安全要求。然而，最近的一些表现表明它在现代高密度空域中非常不可靠，在一定程度上，它可能会导致不可避免的碰撞状态（ICS）——不管未来的轨迹如何，最终都会发生碰撞。此外，最近的研究表明，自动感知和避免机制可以被对抗性地加以利用以操纵自动驾驶车辆的运动轨迹。

作为回应，科学家们提出了越来越多的缓解技术和全新的安全运动规划方法，但每一种都有特定的特定于案例的假设和验证程序。因此，对这些方法进行定量比较变得非常困难。当前最为先进的方法包括在运动规划和碰撞避免中对安全行为进行基准测试的几次尝试，但是许多现有的框架未能满足基于机器学习的新自适应技术的要求。而且，目前的基准测试框架并不能提供全面的和具有鲁棒性的探测机制，用于在不理想状态和轨迹的复杂空间中进行探索。这种框架中的突出方法是基于随机化或基于情景的障碍产生，这些障碍很容易丢失特定于被测机制的关键ICS或其他不需要的状态。这些框架中的另一种方法依赖于计算上昂贵的碰撞状态可达性分析技术，而这也无法为安全运行的关键边界提供具体的保证。

图2：实验环境设置

为了弥补以安全为中心的基准测试的缺陷，本文提出了一种基于机器学习的新框架，用于在与最优对抗性智能体进行交互的最坏情况下对新技术的可靠性进行基准测试。该框架采用深度强化学习的强大的探索和优化性能来训练对抗性自主智能体，而该智能体的目标是学习旨在将系统驱动到ICS和其他不安全状态的最佳导航策略。根据分析的参数和目标，这些目标可能包括对抗性智能体与自动驾驶汽车的直接碰撞，或利用避免碰撞机制来操纵自动驾驶汽车的轨迹以改变和控制其路径，或间接诱发自动驾驶汽车和环境中的其他物体之间的碰撞。

在此基础上，这项研究的主要贡献包括：

1）提出碰撞避免算法的最坏情况基准测试的计算框架和处理流程，且独立于其复杂性、随机性以及自适应动力学。

2）提出深度强化学习过程流程以无缝地适应于被测系统，并克服完全随机或基于情景的探索机制的缺点。

3）提出关于碰撞避免算法标准化比较的全新的衡量指标。

4）通过一个比较两种碰撞避免机制应对故意碰撞企图的可靠性的实际案例研究，来证明所提出框架的实际应用和效果。

图3：实验结果——平均超过100次运行

总而言之，在本文中，我们提出了一个流程和框架，它利用对抗性深度强化学习来衡量自动驾驶汽车的运动规划和碰撞避免机制的可靠性。我们已经确立了这一框架的优势，要超过当前的基准测试规划，其中包括灵活性和通用性、通过针对特定系统下测试、样本效率和自定义探索机制对对抗性策略进行训练获得的适用性探测，以及为不同系统之间的基准测试和比较提供基线（例如，最坏的情况）测量。

可以这样说，本文所提出框架的直接架构为进一步研究提供了一些潜在的研究领域。紧随而来的下一个步骤就是将此框架应用于显著的和最近发布的运动规划和碰撞避免技术中，目的是为相关研究项目创建参考基准。另一个有发展前景的研究领域是检查近期发布技术的适用性，这些已发布的技术声称在对抗性干扰下进行训练可以增强策略的适应力和鲁棒性。因此，通过对对抗性策略和碰撞避免的强化学习模型的结合性训练进行调查，可能会出现潜在的缓解和防御技术。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47183

浏览量
238209
自动驾驶

自动驾驶

+关注

关注
784

文章
13784

浏览量
166375

原文标题：对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

文章出处：【微信号：IV_Technology，微信公众号：智车科技】欢迎添加关注！文章转载请注明出处。

一个使用传统DAS和深度强化学习融合的自动驾驶框架

本文提出了一个使用传统DAS和深度强化学习融合的自动驾驶框架。该框架在DAS功能（例如车道变换，巡航控制和车道保持等）下，以最大限度地提高平均速度和最少车道变化为规则，来确定超车次数。

发表于 06-14 09:41 •8896次阅读

什么是深度强化学习?深度强化学习算法应用分析

什么是深度强化学习? 众所周知，人类擅长解决各种挑战性的问题，从低级的运动控制(如：步行、跑步、打网球)到高级的认知任务。

发表于 07-01 10:29 •1435次阅读

什么是<b class='flag-5'>深度</b><b class='flag-5'>强化学习</b>?<b class='flag-5'>深度</b><b class='flag-5'>强化学习</b>算法应用分析

FPGA在自动驾驶领域有哪些应用？

低，适合用于实现高效的图像算法，如车道线检测、交通标志识别等。雷达和LiDAR处理：自动驾驶汽车通常会使用雷达和LiDAR（激光雷达）等多种传感器来获取环境信息。FPGA能够协助完成这些传感器

发表于 07-29 17:09

AI/自动驾驶领域的巅峰会议—国际AI自动驾驶高峰论坛

已经渗透到了社会生活的方方面面。人工智能在自动驾驶领域将对整个汽车出行领域产生颠覆性变革。汽车的人工智能技术和数据后端的最新突破使自动驾驶成

发表于 09-13 13:59

人工智能深度学习发展迅速，智能科技公司都已经涉足人工智能产品的研发！

深度学习（Deep Learning）核心技术开发与应用1,Deep Learning—循环神经网络2,Deep Learning—CNN应用案例3,Deep Learning—对抗性生成网络4

发表于 09-05 10:22

如何让自动驾驶更加安全？

要有可靠性、安全性做保证。现在一些企业往往以市场推广宣传为主，真正技术上能达到安全可靠的还是比较少。实现真正意义上的自动驾驶是个系统工程需要汽车

发表于 05-13 00:26

深度学习DeepLearning实战

内容2:课程一： Tensorflow入门到熟练：课程二：图像分类：课程三：物体检测：课程四：人脸识别：课程五：算法实现：1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成

发表于 01-09 17:01

深度强化学习实战

内容2:课程一： TensoRFlow入门到熟练：课程二：图像分类：课程三：物体检测：课程四：人脸识别：课程五：算法实现：1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成

发表于 01-10 13:42

存储如何提升自动驾驶汽车的可靠性看了就知道

更智能的存储如何提升自动驾驶汽车的可靠性

发表于 03-10 07:01

基于强化学习的飞行自动驾驶仪设计

针对强化学习在连续状态连续动作空间中的维度灾难问题，利用BP神经网络算法作为值函数逼近策略，设计了自动驾驶仪。并引入动作池机制，有效避免飞行

发表于 06-25 16:27 •27次下载

强化学习在自动驾驶的应用

自动驾驶汽车首先是人工智能问题，而强化学习是机器学习的一个重要分支，是多学科多领域交叉的一个产物。今天人工智能头条给大家介绍强化学习在

发表于 07-10 09:00 •4974次阅读

探讨深度学习在自动驾驶中的应用

深度强化学习的理论、自动驾驶技术的现状以及问题、深度强化学习在自动驾驶技术当中的应用及基于

发表于 08-18 10:19 •5145次阅读

深度学习技术与自动驾驶设计的结合

在过去的十年里，自动驾驶汽车技术取得了越来越快的进步，主要得益于深度学习和人工智能领域的进步。作者就自动驾驶中使用的

发表于 10-28 16:07 •2020次阅读

强化学习与智能驾驶决策规划

本文介绍了强化学习与智能驾驶决策规划。智能驾驶中的决策规划模块负责将感知模块所得到的环境信息转化成具体的

发表于 02-08 14:05 •1847次阅读

鉴源实验室·如何通过雷达攻击自动驾驶汽车-针对点云识别模型的对抗性攻击的科普

非常精确，它们也面临一种新兴的威胁——对抗性攻击。 对抗性攻击是一种通过微小但精心设计的扰动，旨在欺骗机器学习模型的攻击方式。对于自动驾驶系统而言，这意味着通过对传感器输入的数据进行极

发表于 11-05 15:44 •225次阅读