大连理工大学主页平台管理系统 Lin Feng Robocup半场防守中的一种强化学习算法 Home

Current position: Home >> Scientific Research >> Paper Publications

Robocup半场防守中的一种强化学习算法

Release Time:2019-03-10 Hits:

Indexed by: Journal Article

Date of Publication: 2008-01-10

Journal: 计算机技术与发展

Volume: 18

Issue: 1

Page Number: 59-62

ISSN: 1673-629X

Key Words: Robocup;强化学习;Markov对策;零和对策

Abstract: Robocup仿真比赛是研究多Agent之间协作和对抗理论的优秀平台,提高Agent的防守能力是一个具有挑战性的问题.为制定合理的防守策略,将Robocup比赛中的一个子任务--半场防守任务分解为多个一对一防守任务,采用了基于Markov对策的强化学习方法解决这种零和交互问题,给出了具体的学习算法.将该算法应用到3D仿真球队--大连理工大学梦之翼(Fantasia)球队,在实际比赛过程中取得了良好效果.验证了采用Markov零和对策的强化学习算法在一对一防守中优于手工代码的结论.

Prev One:基于线性预测和位操作的信息隐藏算法

Next One:基于大学生创新实验计划的创新教育平台构建

Home

Scientific Research

Teaching Research

Awards and Honours

Enrollment Information

Student Information

My Album

Blog

Robocup半场防守中的一种强化学习算法