基于优势竞争网络的转运机器人路径规划

2022-08-05分类号：P111.44;TP242

【作者】何启嘉王启明李佳璇王正佳王通

【部门】中国科学院国家天文台中国科学院大学中国科学院FAST重点实验室中国科学院沈阳自动化研究所中国科学院机器人与智能制造创新研究院南京工业大学计算机科学与技术学院

【摘要】该文提出了一种基于深度强化学习的优势竞争网络(advantage dueling double deep Q-network,AD3QN)算法作为500 m口径球面射电望远镜(five-hundred-meter aperture spherical radio telescope,FAST)促动器自动化维护车间转运机器人的路径规划方法。通过预先学习竞争网络中的状态价值层,使状态价值参数根据环境状态进行初始化,减少了首次接触目标点所需要的步数;通过改进竞争网络中的贪婪搜索算法,使环境探索与利用的转变更为合理;通过改进动作选择策略,使机器人路径规划不易陷入局部极小值,进一步加快了算法收敛的速度。AD3QN算法具有动态规划能力强、实时性好、柔性高、鲁棒性强和准确率高等优点。对促动器自动化维护车间进行建模并测试网络改进前后的路径规划能力,仿真结果表明:采用AD3QN算法在首次找到目标点用时方面比一般竞争网络快176%。该研究有望提高FAST促动器的维护效率,进而减少对FAST观测时间的挤占。

【关键词】FAST促动器深度强化学习竞争网络路径规划

【基金】国家重点研发计划项目(2019YFB1312702)

【所属期刊栏目】清华大学学报(自然科学版)

文献传递