基于关系图深度强化学习的机器人多目标包围问题新算法——中科院自动化所蒲志强教授团队

关键词中科院，关系图，深度强化学习，机器人，多目标包围问题

在多机器人系统的研究领域中，包围控制是一个重要的课题。其在民用和军事领域都有广泛的应用场景，包括协同护航、捕获敌方目标、侦察监视、无人水面舰艇巡逻狩猎等。

这些应用的核心问题是如何控制一个多机器人系统，涉及多目标分配，同时解决目标包围和避碰子问题。这是一个巨大的挑战，特别是对于分散的多机器人系统。

中科院自动化所蒲志强教授团队在2022年ICRA大会发表论文，提出了一种基于关系图的深度强化学习方法，对各种条件下的多目标避碰包围(MECA)问题具有良好的适应性。

该研究定义了一个MECA任务，即在具有L个静态障碍物(黑色圆圈)的环境中，由N个机器人(绿色圆圈)组成的多机器人系统，协同包围K (1 < K < N)个静止或运动的目标(红色圆圈)。

所有机器人需要自动形成多组，包围所有目标，每组需要形成圆形队形，包围一个独立的目标，同时避免碰撞。这涉及到以下三个子问题：

1) 动态多目标分配与分组

分散式多机器人系统的MECA图解

在MECA问题中，存在三种类型的实体，即机器人、目标和障碍物。不同的实体对机器人有不同的影响关系，例如避障、包围目标、与其他机器人合作等。

研究提出了一种基于机器人级和目标级关系图(RGs)的DRL分散方法，命名为MECA-DRL-RG方法。

1. 利用图注意网络(GATs)对机器人级RGs进行建模和学习，该RGs由每个机器人与其他机器人、目标和障碍物之间的三个异构关系图组成。

2. 利用GAT构建目标级RG，构建机器人与各目标之间的空间关系。目标的运动由目标级RG建模，并通过监督学习进行学习，以预测目标的轨迹。

3. 此外，定义了一个知识嵌入式复合奖励函数，解决MECA中的多目标问题。采用基于集中式训练和去中心化执行框架的演员-评论家训练算法对策略网络进行训练。

MECA-DRL-RG方法的整体结构

研究团队分别进行了仿真实验和真实环境实验。在真实实验中，情景设置为：6个机器人在有2个障碍物的环境中包围2个移动的目标。机器人的位置和速度数据由NOKOV度量动作捕捉系统提供。

6个机器人在有2个障碍物的环境中包围2个移动目标

仿真实验和真实实验都验证了，相比于其他方法，MECA-DRL-RG方法使机器人能够从周围环境中，学习异构空间关系图，并预测目标的轨迹，从而促进每个机器人对其周围环境的理解和预测。证实了MECA-DRL-RG方法的有效性。

并且，无论机器人、障碍物或目标的数量增加，抑或是目标的移动速度加快，MECA-DRL-RG方法都表现出良好的性能，具有广泛的适应性。

MECA-DRL-RG方法训练曲线

北京航空航天大学自动化科学与电气工程学院

吉林大学机械与航天工程学院

中国矿业大学计算机科学与技术学院

交通运输部天津水运工程科学研究院

哈尔滨工业大学-机器人技术与系统国家重点实验室

电子科技大学自动化工程学院

南京航空航天大学航天学院

上海大学机电工程与自动化学院

科技冬奥水立方冬-夏场景转换项目课题

北京科技大学机械工程学院

中国矿业大学机电工程学院

同济大学航空航天与力学学院

中国矿业大学机电工程学院

西北农林科技大学、北方民族大学、贵州中医药大学和萨肯·塞富林哈萨克农业技术大学组成的研究团队

同济大学建筑与城市规划学院

海南大学生物医学工程学院

同济大学航空航天与力学学院

西安电子科技大学机电工程学院

重庆邮电大学生物信息学院

南京航空航天大学自动化学院

西北工业大学无人系统技术研究院

浙江大学FAST-Lab

上海交通大学、荷兰代尔夫特理工大学

上海交通大学机械与动力工程学院

湖南大学机械与运载工程学院

浙江大学控制科学与工程学院

湖南大学机械与运载工程学院

中国科学院北京纳米能源与纳米系统研究所

同济大学建筑与城市规划学院

南京理工大学机械工程学院

中科深谷科技发展有限公司

北京航空航天大学人工智能研究院

中国地震局地球物理研究所

东南大学仪器科学与工程学院

山东大学控制科学与工程学院

合肥工业大学机械工程学院

北京航空航天大学自动化科学与电气工程学院

吉林大学机械与航天工程学院

中国矿业大学计算机科学与技术学院

交通运输部天津水运工程科学研究院

哈尔滨工业大学-机器人技术与系统国家重点实验室

电子科技大学自动化工程学院

南京航空航天大学航天学院

上海大学机电工程与自动化学院

科技冬奥水立方冬-夏场景转换项目课题

北京科技大学机械工程学院

中国矿业大学机电工程学院

同济大学航空航天与力学学院

中国矿业大学机电工程学院

西北农林科技大学、北方民族大学、贵州中医药大学和萨肯·塞富林哈萨克农业技术大学组成的研究团队

同济大学建筑与城市规划学院

海南大学生物医学工程学院

同济大学航空航天与力学学院

西安电子科技大学机电工程学院

重庆邮电大学生物信息学院

南京航空航天大学自动化学院

西北工业大学无人系统技术研究院

浙江大学FAST-Lab

上海交通大学、荷兰代尔夫特理工大学

上海交通大学机械与动力工程学院

湖南大学机械与运载工程学院

浙江大学控制科学与工程学院

湖南大学机械与运载工程学院

中国科学院北京纳米能源与纳米系统研究所

同济大学建筑与城市规划学院

南京理工大学机械工程学院

中科深谷科技发展有限公司

北京航空航天大学人工智能研究院

中国地震局地球物理研究所

东南大学仪器科学与工程学院

山东大学控制科学与工程学院

合肥工业大学机械工程学院

协同控制

外骨骼机器人

仿生机器人

多旋翼无人机

机械臂

船舶、海洋和水下应用

医疗机器人&手术导航

位移测量

其他

其他

虚拟直播&虚拟数字人

虚拟拍摄/XR

动漫影视/动作捕捉实训室

游戏、电影动画制作

动作捕捉系统选配

动作捕捉系统套装

机器人开发平台

集成产品

动作捕捉相机Mars系列

动作捕捉相机Pluto系列

动作捕捉相机Orbit系列

动作捕捉相机水下镜头

动作捕捉软件

动作捕捉附件

同步设备

AI视频动作捕捉套装

VRT动作捕捉系统套装

集成产品

技术资讯

经典案例

相关论文

常见问题

动捕工作室

新闻动态

联系我们

动作捕捉系统用于丝驱动连续体机器人研究

动作捕捉用于蛇运动分析及蛇形机器人开发

基于深度相机的下肢外骨骼的自适应梯级步态生成方法

基于示教学习的手术机器人缝合技能学习

无人车实验室编队中的动作捕捉

柔性微创手术机器人性能实验验证

动作捕捉系统验证OPT追踪井下无人机的性能

具有编码能力的可展开结构人造肌肉

（转自新华网）蓄势数载业初就 | 水下悬浮隧道项目一瞥

无人机室内定位与自主建造

边云协同电力自主巡检系统的研发

动作捕捉技术识别细小错位 机械外骨骼适应性升级

动作捕捉助力多足机器人各腿间的数据协调

装配机器人（机械臂）组装技能学习

动捕技术助力研发太空机械臂 航天设备有望实现“自愈”

无人驾驶汽车定位追踪

应用虚拟现实技术的柔性上肢康复机器人

六旋翼无人机室内定位系统

工业机器人动作捕捉与协作定位研究

水下仿生机器人：红外动捕系统用于机器海豚开发

白酒上甑工艺工业机器人系统研究

动作捕捉技术助力行星漫游车的技术创新

仿生机器人的运动规划

机械外骨骼中的恒力悬浮背包研究

无人机协同“嗅出”数字信息素 狼群算法提升地图构建精度

无人机编队与协同控制

人车协同导航定位技术优化

中科院自动化所多智能体协同控制平台编队与自主避障

动作捕捉系统用于绳索牵引康复机器人轨迹规划与验证

动作捕捉系统用于悬臂式掘进机精准位姿测量

动作捕捉助力重庆理工大学采摘机器人项目研究

光学动作捕捉用于锥束CT平台几何位置校正

焊接机器人本体标定中动作捕捉的应用

嫦娥五号回家！航天器交会对接研究中动作捕捉系统的应用

双机械臂机器人定位与运动规划

效率提升4倍，动作捕捉助力科技冬奥水立方变身冰立方

精度亚毫米级！无人机编队定位技术解读

多旋翼无人机室内定位与飞控算法测试平台

蛇形机器人高空电缆巡检

动作捕捉系统用于苹果采摘机器人

让机器学会“察颜观色”：人体行为识别

动作捕捉系统用于柔性机械臂的末端定位控制

自动驾驶沙盘系统

机器人性能测试系统

动作捕捉系统用于飞行机械臂目标检测与定位算法验证

动作捕捉技术识别细小错位机械外骨骼适应性升级

动捕技术助力研发太空机械臂航天设备有望实现“自愈”

无人机协同“嗅出”数字信息素狼群算法提升地图构建精度

从避障到越障地面移动机器人协同操纵载体搬运

可穿戴生物反馈装置监测部分负重行走时胫骨负荷

自动驾驶 | 多无人车协同轨迹规划无信号灯无车道自由路口公平通过