融合强化学习与变邻域搜索的柔性作业车间调度研究
2022-07-22分类号:TH165;TP18
【部门】武汉科技大学冶金装备及其控制教育部重点实验室 武汉科技大学机械传动与制造工程湖北省重点实验室
【摘要】针对柔性作业车间调度问题,以完工时间最小化为目标,提出一种融合强化学习的变邻域搜索算法,以提升算法求解性能。基于皮尔逊相关性分析,提炼出工序加工时长这一关键特征,设计一种优先考虑加工时长的邻域结构,以精炼搜索空间。基于强化学习,设计算法进化状态集、关键参数动作集和奖励机制;提出改进的ε-贪婪策略来选择动作,随着ε取值的自适应变化,算法前期倾向于探索新解,后期注重利用邻域解;最终构建起算法状态与算法参数的关联关系,实现了算法参数的自适应选择。实验表明所提算法利用强化学习动态调整算法参数,在解的寻优能力和稳定程度上更具优势。
【关键词】强化学习 变邻域搜索 自适应参数选择 柔性作业车间
【基金】国家自然科学基金资助项目(51875421;51875420)
【所属期刊栏目】工业工程与管理
文献传递