Notice: Undefined index: HTTP_ACCEPT_LANGUAGE in /mnt/wwwroot/nokov.new/public/public_base.php on line 14
基于关系图深度强化学习的机器人多目标包围问题新算法——中科院自动化所蒲志强教授团队 | NOKOV度量动作捕捉
English 日本語 Русский

基于关系图深度强化学习的机器人多目标包围问题新算法——中科院自动化所蒲志强教授团队

基于关系图深度强化学习的机器人多目标包围问题新算法——中科院自动化所蒲志强教授团队

客      户
中科院自动化所
关  键 词
中科院,关系图,深度强化学习,机器人,多目标包围问题
被捕捉物
机器人

在多机器人系统的研究领域中,包围控制是一个重要的课题。其在民用和军事领域都有广泛的应用场景,包括协同护航、捕获敌方目标、侦察监视、无人水面舰艇巡逻狩猎等。


这些应用的核心问题是如何控制一个多机器人系统,涉及多目标分配,同时解决目标包围和避碰子问题。这是一个巨大的挑战,特别是对于分散的多机器人系统。


中国科学院自动化所蒲志强教授团队在2022年ICRA大会发表论文,提出了一种基于关系图的深度强化学习方法,对各种条件下的多目标避碰包围(MECA)问题具有良好的适应性。



论文检索页面

论文检索页面

定义任务

该研究定义了一个MECA任务,即在具有L个静态障碍物(黑色圆圈)的环境中,由N个机器人(绿色圆圈)组成的多机器人系统,协同包围K (1 < K < N)个静止或运动的目标(红色圆圈)。

所有机器人需要自动形成多组,包围所有目标,每组需要形成圆形队形,包围一个独立的目标,同时避免碰撞。这涉及到以下三个子问题:

1) 动态多目标分配与分组

2) 每组分别包围目标

3) 相互之间避免碰撞


分散式多机器人系统的MECA图解

分散式多机器人系统的MECA图解

方法框架

在MECA问题中,存在三种类型的实体,即机器人、目标和障碍物。不同的实体对机器人有不同的影响关系,例如避障、包围目标、与其他机器人合作等。

研究提出了一种基于机器人级和目标级关系图(RGs)的DRL分散方法,命名为MECA-DRL-RG方法。

具体而言:

1. 利用图注意网络(GATs)对机器人级RGs进行建模和学习,该RGs由每个机器人与其他机器人、目标和障碍物之间的三个异构关系图组成。

2. 利用GAT构建目标级RG,构建机器人与各目标之间的空间关系。目标的运动由目标级RG建模,并通过监督学习进行学习,以预测目标的轨迹。

3. 此外,定义了一个知识嵌入式复合奖励函数,解决MECA中的多目标问题。采用基于集中式训练和去中心化执行框架的演员-评论家训练算法对策略网络进行训练。


MECA-DRL-RG方法的整体结构

MECA-DRL-RG方法的整体结构

实验验证

研究团队分别进行了仿真实验和真实环境实验。在真实实验中,情景设置为:6个机器人在有2个障碍物的环境中包围2个移动的目标。机器人的位置和速度数据由NOKOV度量动作捕捉系统提供。


6个机器人在有2个障碍物的环境中包围2个移动目标

6个机器人在有2个障碍物的环境中包围2个移动目标

仿真实验和真实实验都验证了,相比于其他方法,MECA-DRL-RG方法使机器人能够从周围环境中,学习异构空间关系图,并预测目标的轨迹,从而促进每个机器人对其周围环境的理解和预测。证实了MECA-DRL-RG方法的有效性。

并且,无论机器人、障碍物或目标的数量增加,抑或是目标的移动速度加快,MECA-DRL-RG方法都表现出良好的性能,具有广泛的适应性。



IEEE RAL 2025最佳论文!集群依靠局部感知形成目标形状

近日,西北工业大学航海学院彭星光教授团队的研究成果荣获 2025 IEEE Robotics and Automation Letters(RA-L)Best Paper Award。论文第一作者为航海学院博士研究生向雅伦。该论文从 2025 年 RA-L 收录的 1700 余篇论文中脱颖而出,成为全球仅有的五篇最佳论文奖获奖论文之一,代表了国际机器人与自动化领域的前沿研究水平。

ICRA 2026 无人机复合干扰估计

北航郭克信教授团队提出了一种集成控制理论与数据驱动学习的复合干扰估计框架,该算法在无须预设干扰界限的情况下,实现了对复杂耦合干扰的高精度、轻量化估计。

首尔大学医学院 ASTRA无标记动捕模拟腔镜手术操作姿态采集

无需穿戴设备或粘贴标记点,韩国首尔大学医学院(SNUH)妇产科及韩国单孔腔镜手术学会(KSPS)采用NOKOV ASTRA AI Markerless无标记动作捕捉方案,仅4小时完成30位模拟腔镜手术参与者的全身运动轨迹记录与手术操作姿态采集。

人机对战羽毛球,央视上手过招

人机对战羽毛球,央视上手过招。度量动捕助力动易科技人形机器人与多人现场对战,精准接打、见招拆招。
联系我们
如需更多应用、案例信息或产品报价,请致电 010-64922321,或在下方留言:
机器人/无人机 VR/AR/XR 运动康复 传媒娱乐
北京度量科技有限公司(总部)
Location 北京市朝阳区安慧里四区15号五矿大厦8层820室
Email info@nokov.com
Phone 010-64922321
提交成功!请您耐心等待!
欢迎关注公众号,获取更多信息
关闭