基于增强学习的半导体测试调度研究
2009-08-10分类号:TN307
【部门】广东东莞理工学院工业工程系 清华大学工业工程系 南佛罗里达大学工业与管理系统工程系
【摘要】采用Sarsa(λ,k)学习算法求解、产品、测试机、测试工具包、使能器部件对应关系非常复杂的半导体测试调度问题。针对测试调度,通过定义系统状态的表示方式、构造行为和报酬函数把调度问题转化为增强学习问题,并把Sarsa(λ,k)算法和梯度下降径向基神经网络函数泛化器结合使用。实验验证了Sarsa(λ,k)算法解决半导体测试调度问题的有效性。Sarsa(λ,k)算法通过反复解决调度问题来调整调度策略,能克服单个行为策略短视的缺点,综合利用各个行为策略的优点,从而找到较优的调度方案。
【关键词】调度 半导体测试 增强学习 多资源约束
【基金】国家自然科学基金(70771058); 国家自然科学基金(50375082); 国家863计划资助项目(2008AA04Z102)
【所属期刊栏目】工业工程与管理
文献传递