基于注意力学习的多智能体路径规划协作策略(英文)
2023-04-15分类号:TP18
【部门】中国科学技术大学计算机科学与技术学院
【摘要】多智能体路径发现(MAPF)是一个具有挑战性和有意义的问题,其中要求所有智能体在不相互碰撞和避免障碍的情况下有效地达到其目标地点。在多智能体路径发现中,有效地提取和表达智能体的观察结果、有效地利用历史信息以及与相邻智能体之间的有效通信是完成多智能体协作任务所面临的挑战。为了解决这些问题,本文提出了一个精心设计的模型,利用附近智能体的局部状态,并为每个智能体输出一个最优的执行动作。我们通过使用残差注意力卷积神经网络(residual attention CNN)来提取局部观测构建局部观测编码器,并使用Transformer架构来构建交互层来组合智能体的局部观测。为了提高该模型的成功率。我们还引入了一种新的指标,即额外时间比率(ETR)。实验结果表明,我们提出的模型在成功率和ETR方面优于以前的大多数模型。此外,我们还完成了对模型的消融研究,并证明了模型各组成部分的有效性。
【关键词】多智能体路径发现 强化学习 去中心化规划 注意机制
【基金】supported by the Fundamental Research Funds for the Central Universities (WK2150110017)
【所属期刊栏目】中国科学技术大学学报
文献传递