Notice: Undefined index: HTTP_ACCEPT_LANGUAGE in /mnt/wwwroot/nokov.new/public/public_base.php on line 10
IROS 2025 多智能体深度强化学习算法实现Crazyflie无人机在复杂环境中协同追逐-度量科技 | NOKOV度量动作捕捉
English 日本語 Русский

IROS 2025 多智能体深度强化学习算法实现Crazyflie无人机在复杂环境中协同追逐

IROS 2025 多智能体深度强化学习算法实现Crazyflie无人机在复杂环境中协同追逐

客      户
国防科技大学智能科学学院周晗老师团队

国防科技大学智能科学学院周晗老师团队在国际机器人顶会IROS 2025上发表题为”Emergent Cooperative Strategies for Pursuit-Evasion in Cluttered Environments: A Knowledge-Enhanced Multi-Agent Deep Reinforcement Learning Approach” 的论文。该论文提出了一种面向复杂环境多智能体追逃的知识增强深度强化学习方法,并通过大量数值仿真和真实实验验证了本文方法的效率和优越性。NOKOV度量动作捕捉系统为真实实验提供Crazyflie无人机位置和速度数据,助力验证本文算法的有效性。

 

研究背景

为增强多智能体系统在协同追逐任务中的自主性和适应性,无模型深度强化学习 (DRL) 作为一种有前景的方案受到了越来越多的关注。然而,大多数现有基于DRL的追逐方法仍依赖个体奖励,并且在复杂场景中表现不佳。

 

本文贡献

为了在复杂环境中促进具有感知限制的追逐者之间的协作行为,本文提出了一种基于团队奖励的知识增强多智能体延迟深度确定性策略梯度 (KE-MATD3) 算法。主要贡献总结如下:

1、提出了一种基于团队奖励的 MADRL 方法,用于在杂乱环境中进行多智能体协同追逐,其中任务被建模为去中心化的部分可观测马尔可夫决策过程。

2、引入了一种知识增强 (KE) 机制,利用改进的人工势场法 (IAPF) 的见解,从而促进了具有挑战性的团队奖励的学习。

3、通过仿真和物理实验验证了追逐者之间协作行为的出现。

 合作追逐任务的系统框架

合作追逐任务的系统框架。(a) 多智能体追逐-逃避环境。(b) 本文提出的 KE-MATD3 算法。

 

数值仿真实验

在数值模拟中,本文算法(KE-MATD3)通过与多种基线算法(如 MATD3MADDPGMADDQN 及其变体)的比较,验证了其优越性。

结果显示,本文算法利用知识增强机制,显著提升了学习效率和最终性能,实现了最高的捕获成功率和最低的碰撞率。

在不同障碍物密度下,本文算法始终保持最佳性能,展现出强大的泛化能力。这表明本文算法能有效促进复杂环境中的协同行为,实现高效的目标捕获。

 

真实世界实验

6.4×11×2 m实验场地中,包含5Crazyflie 2.1四轴飞行器、NOKOV度量光学动捕捕捉系统、20 个圆柱形障碍物(半径20 cm,高1 m)和机载计算机。

物理实验结果

物理实验结果

NOKOV度量动作捕捉系统实时输出Crazyflie无人机的高精度位置和速度数据,通过ROS实时传输到机载计算机。

真实实验表明,本文方法能安全有效地完成捕获任务,同时实现追逐者之间的涌现式协同行为。

物理实验结果 - 视频

NOKOV度量动作捕捉系统为真实实验提供多架Crazyflie无人机位置和速度数据,助力验证本文算法的有效性。

 

作者简介

孙懿豪,国防科技大学智能科学学院,博士研究生,主要研究方向为无人机集群分布式决策技术

闫超,南京航空航天大学自动化学院,副研究员,博士,主要研究方向为深度学习、多智能体强化学习、无人集群协同控制与智能决策

周晗,国防科技大学智能科学学院,副教授,博士,主要研究方向为无人系统协同控制

相晓嘉,国防科技大学智能科学学院,研究员,博士生导师,主要研究方向为无人系统技术

姜杰,中国运载火箭技术研究院,中国科学院院士,博士生导师,主要研究方向为导航制导与控制、运载火箭总体设计


IEEE RAL 2025最佳论文!集群依靠局部感知形成目标形状

近日,西北工业大学航海学院彭星光教授团队的研究成果荣获 2025 IEEE Robotics and Automation Letters(RA-L)Best Paper Award。论文第一作者为航海学院博士研究生向雅伦。该论文从 2025 年 RA-L 收录的 1700 余篇论文中脱颖而出,成为全球仅有的五篇最佳论文奖获奖论文之一,代表了国际机器人与自动化领域的前沿研究水平。

ICRA 2026 无人机复合干扰估计

北航郭克信教授团队提出了一种集成控制理论与数据驱动学习的复合干扰估计框架,该算法在无须预设干扰界限的情况下,实现了对复杂耦合干扰的高精度、轻量化估计。

首尔大学医学院 ASTRA无标记动捕模拟腔镜手术操作姿态采集

无需穿戴设备或粘贴标记点,韩国首尔大学医学院(SNUH)妇产科及韩国单孔腔镜手术学会(KSPS)采用NOKOV ASTRA AI Markerless无标记动作捕捉方案,仅4小时完成30位模拟腔镜手术参与者的全身运动轨迹记录与手术操作姿态采集。

人机对战羽毛球,央视上手过招

人机对战羽毛球,央视上手过招。度量动捕助力动易科技人形机器人与多人现场对战,精准接打、见招拆招。
联系我们
如需更多应用、案例信息或产品报价,请致电 010-64922321,或在下方留言:
机器人/无人机 VR/AR/XR 运动康复 传媒娱乐
北京度量科技有限公司(总部)
Location 北京市朝阳区安慧里四区15号五矿大厦8层820室
Email info@nokov.com
Phone 010-64922321
提交成功!请您耐心等待!
欢迎关注公众号,获取更多信息
关闭