《清华大学团队与腾讯AI_Lab专项合作夺冠FPS游戏AI竞赛VizDoom》(2)
来源:未知 时间:2018-08-28 11:30
针对该复杂任务,TSAIL团队提出了环境信息引导的分层强化学习技术,在对环境信息有效感知基础上,融合环境反馈和强化学习的奖励信号,引导分层强化学习训练,使得AI闯关表现优异,预赛中以绝对优势保持第一,直至决赛锁定冠军。
第二个挑战Track2是随机对战模式(DeathMatch),这是VizDoom的传统项目,采用死亡竞赛模式,要求参赛选手在同一个地图里对杀10分钟,AI要在保存自己的同时,尽量多的杀伤敌人。最后用Frags(=杀敌数量-自杀数量)定胜负。清华大学和腾讯AILab去年曾参赛并获得优异成绩。今年的比赛喜迎了33个参赛队的152个机器人。
在Track2中,TSAIL团队针对目前强化学习中普遍存在的动作空间大和奖励信号稀疏等问题,更改适配了轻量级物体检测架构YOLO-v3,并与强化学习算法有效融合,极大提高了强化学习的训了效率。预赛竞争异常激烈,TSAIL团队与第二名不断交换领先,最后以0.1个frag优势夺冠。决赛有6支团队参加,包括预赛的前三名、2017年冠、亚军及2016年冠军,TSAIL最终夺得亚军,成绩远超前两届冠军。
参与VizDoom竞赛的意义,首先是探索输入像素级视觉信息,直接输出AI控制策略的强化学习算法。在研究上,这能带动同类任务研究,如无人驾驶、机器人导航和物体追踪等;应用上,可助力同类射击游戏开发,如虚幻竞技场、雷声之锤和刺激战场等,从而拓展人工智能技术的研究和应用领域。
团队介绍——清华大学TSAIL人工智能创新团队
该团队由张钹院士领衔,聚焦人工智能原创性基础理论,团队核心成员包括国家“万人计划”青年拔尖人才、MITTR35中国区先锋者朱军教授、以及胡晓林、李建民、苏航等教师,和30余名在读博士和博士后。经过多年的积累,TSAIL团队在深度学习、贝叶斯学习、强化学习等人工智能基础理论方面取得了一系列创新成果,研发的深度贝叶斯平台“珠算”具有重要的影响力。近年来,TSAIL团队成员在ICML、NIPS、CVPR、IJCAI等人工智能领域顶级会议上发表论文一百余篇,先后获得中国计算机学会自然科学一等奖、nvidia先锋实验室等多个重要奖项,和多个国际比赛的冠亚军,是人工智能基础理论研究领域具有重要国际影响力的团队。
延伸阅读——腾讯AILab核心方向:游戏AI
游戏AI是腾讯AILab的核心研究领域,这是人工智能与博弈论的一个交叉领域,从小来说,它研究如何用AI提升人类玩游戏的体验。从大来说,它研究人、智能体及环境间的复杂交互关系。游戏AI一直在推动人工智能的核心发展,从国际象棋和围棋中AI击败人类高手,现在已转移到更复杂的实时策略型游戏,如《星际争霸》;及多人在线战术竞技MOBA游戏,如《DOTA2》与《王者荣耀》。