location: Current position: Home >> Scientific Research >> Paper Publications

Robocup半场防守中的一种强化学习算法

Hits:

Indexed by:期刊论文

Date of Publication:2008-01-10

Journal:计算机技术与发展

Volume:18

Issue:1

Page Number:59-62

ISSN No.:1673-629X

Key Words:Robocup;强化学习;Markov对策;零和对策

Abstract:Robocup仿真比赛是研究多Agent之间协作和对抗理论的优秀平台,提高Agent的防守能力是一个具有挑战性的问题.为制定合理的防守策略,将Robocup比赛中的一个子任务--半场防守任务分解为多个一对一防守任务,采用了基于Markov对策的强化学习方法解决这种零和交互问题,给出了具体的学习算法.将该算法应用到3D仿真球队--大连理工大学梦之翼(Fantasia)球队,在实际比赛过程中取得了良好效果.验证了采用Markov零和对策的强化学习算法在一对一防守中优于手工代码的结论.

Pre One:基于线性预测和位操作的信息隐藏算法

Next One:基于大学生创新实验计划的创新教育平台构建