基于多智能体强化学习的自动化电力仓库货位优化
2021-08-15分类号:TP18;F426.61;F274
【部门】国网北京市电力公司物资分公司
【摘要】自动化仓库的货位优化是提高仓库效率的重要途经之一。本文针对电力仓库货位优化问题,采用基于多智能体强化学习的方法,提升优化效果。首先分析DDPG算法和MADDPG等算法的不足;然后在此基础上提出改进算法ECS-MADDPG及其模型。在该算法中,同时考虑当前时间点的即时奖励和未来奖励因素;最后利用电力物资的历史出入库数据,应用强化学习算法训练货位优化模型。研究表明,与MADDPG、DDPG等算法相比,ECSMADDPG拥有较高的稳定性和回报值。
【关键词】电力仓库 货位优化 多智能体强化学习
【基金】
【所属期刊栏目】工业工程
文献传递