基于优化并行的四足机器人运动技能学习
2024-05-28分类号:TP242
【部门】北京工业大学信息学部 北京工业大学北京人工智能研究院北京计算智能与智能系统重点实验室
【摘要】动物对自然界的适应能力是由环境选择与适者生存决定的,四足哺乳动物可以通过种群的进化逐步适应环境的变化,提高其对环境的适应度和种群的生存率。基于上述启发,该文在软演员-评论家(SAC)算法基础上提出一种基于优化并行强化学习的算法OP-SAC,该算法使用进化策略与强化学习交替训练,通过知识共享和知识继承优化四足机器人学习效果,提高训练效率。算法验证结果显示,OP-SAC算法能够完成四足机器人的仿生步态学习;对比实验验证出OP-SAC算法比其他结合了进化策略的SAC算法具有更加优越的鲁棒性;设计消融实验证明了知识共享和知识继承策略使算法的训练效果获得较大提升。
【关键词】生物进化 强化学习 四足机器人 进化策略
【基金】国家自然科学基金青年科学基金项目(62103009);; 北京市自然科学基金面上项目(4202005)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递