标题
  • 标题
  • 作者
  • 关键词

离散制造系统环境下基于深度Q学习的AGV路径规划

2023-06-25分类号:TP18;TP23

【作者】房殿军  周彬彬  赵春苗  ROLF Schmidt  
【部门】同济大学机械与能源工程学院  青岛中德智能技术研究院  苏州罗伯特木牛流马物流技术有限公司  
【摘要】针对传统深度Q学习算法在AGV路径规划问题容易过估计和收敛效果不好的问题,提出一种改进的双深度Q学习算法,通过引入优先经验回放机制和基于启发式信息的连续奖励函数,提高AGV智能体的有效训练,利用贪婪策略和玻尔兹曼策略结合的动作选择策略在与环境交互的训练中引导AGV智能体充分探索环境。仿真实验结果表明,所提出的算法能够规划出良好的AGV路径,而且在算法的稳定性和收敛速度上有所提升。
【关键词】AGV路径规划  强化学习  离散制造系统  DQN算法
【基金】国家重点研发计划“政府间国际科技创新合作”重点专项项目(2022YFE0114300)
【所属期刊栏目】物流技术
文献传递