哈尔滨工业大学深圳校区研究团队提出端到端的基于强化学习的狭缝穿越策略,和现有轨迹优化方法及强化学习方法相比,本文策略在实时动态响应、敏捷性、耗时和泛化方面的性能更优。
现实实验中,NOKOV度量动作捕捉系统被用于环境感知,实时反馈无人机和狭缝的状态信息。