OpenMind与暴雪的“教AI打星际”的最新一次对抗落下帷幕。OpenMind的AI“AlphaStar”与职业选手TeamLiquid的MaNa和TLO大战一番,最终的结果是人类选手告负。
虽然对AlphaStar作为AI的操作模式做了诸多限制,AlphaStar还是展现了惊人高效率的操作,TLO在极限状态下APM(Actions per minute)操作接近2000,而AlphaStar在运营中的APM低于100,并在对抗中维持在300到400左右。
AlphaStar使用神族的追猎者这样一个操作收益极大的单位,用极其优秀的操作压制了职业选手。虽然MaNa和TLO都尝试使用高级单位降低自己的操作压力,但AlphaStar还是用极高效率的操作让追猎者重创气体成本远高于自己的敌方部队。
需要说明的是,和之前“小狗冲坦克”的脚本设计出神操作相比,AlphaStar展现的精彩操作和依然丰富多变的战术决策,是由机器学习得到的结果。在名为AlphaStar League的对抗学习过程中,AlphaStar观察了大量的对战Replay并从中学习,并把学习的结果运用于对抗之中。
在很多场对战中,可以看到AlphaStar也成功学习了很多对战中会出现的套路,例如使用探路农民干扰开矿和野建筑之类的策略。显然AlphaStar使用它的学习模式敏锐地捕捉到了这些决策的战术收益,并灵活地将之使用出来。
当然,这次对战也让我们看出,AI与人类进行《星际争霸2》的对抗和测试,还需要更多的合理限制,MaNa力挫AlphaStar的唯一一场胜利也反应出AlphaStar的一些决策问题,无论如何,这确实是一场精彩的大战,而AlphaStar的表演也实在赏心悦目。而整个OpenMind的AI与机器学习项目究竟能带来怎样的成果,让我们拭目以待。
暴雪在人工智能学习领域很早就有动作,与谷歌进行了深度合作,而这项低调持续进行的“教AI打星际”的项目,似乎又有了新的进展。
暴雪和DeepMind宣布,将在本周五(一月 10 am PT/1)进行直播,展示AI与人类选手对抗《星际争霸2》并公开相关研究的最新成果。
直播地点将会同时在暴雪星际争霸的twitch频道和Deepmind的youtube直播频道进行。
与简单的作弊AI不同,AI以机器学习的方式学打《星际争霸2》会有一定程度的上的限制,对AI单位时间内处理的游戏信息范围有严格的要求,尽可能地保证与人类选手对抗的公平。
长远地看,对玩家来说,AI与机器学习技术的发展显然会带来很多体验的提升——单单就RTS这一种游戏类型来说,复杂多变的AI行为首先可以让高端玩家获得更多的挑战,同时,又可以为普通玩家带来更丰富多变,更持久的轻度游戏乐趣。
作为在即时战略游戏(RTS)领域绝对意义上的霸主,暴雪对人工智能的重视确实很让人欣喜。同时,很多RTS开发者和玩家显然也意识到,游戏AI的发展很可能为即时战略游戏带来新的发展,近几年层出不穷的《红色警戒》、《命令与征服》等游戏的AI设计与对抗比赛也可以看出这种趋势。
而人工智能和机器学习技术在这几年间有怎样的发展,就让我们期待周五的对决和各种新消息的公布吧。
评论区
共 141 条评论热门最新