谷歌开始训练 DeepMind AI 玩《星际争霸2》

机械学习的一场艰难战斗

2017-08-12发布于资讯

本文系用户投稿，不代表机核网观点

本文译自 PCGamer。

我们已经见证了机械学习一次又一次在各种竞赛中击败人类，比如《危险边缘》（一档电视智力竞赛节目）中， IBM 的 Watson 击败了人类最强的选手。最近，谷歌的 DeepMind AI 击败了最强的围棋手。现在AI研究者们的目光放在了《星际争霸2》这个最流行的多人在线游戏之一身上。

暴雪表示支持，并提供了用于建造对抗人类玩家的机器人的工具。在去年宣布的和 DeepMind 的合作关系中，暴雪还要公布65,000场《星际争霸2》比赛数据的缓存，帮助机器人训练。这只是个开始——暴雪和 DeepMind 每个月都将再加五十万场比赛的缓存。

为什么着眼于《星际争霸2》？《星际争霸2》不光是时下最流行的电竞项目之一，还能为机械学习提供不少尚未攻克的难题。例如，围棋和国际象棋之类的游戏，被称作完全信息游戏（perfect information game）——AI可以知道对手所有的操作，并计算结果。在围棋盘上有1跟着170个0的可能性，但是在《星际争霸2》里，研究人员估算还要再加100多个0.
“这是一大步，” Oriol Vinyals，参与此项目的一位研究员，说道，“这款游戏迫使我们在计划，记忆，以及对不确定性的对策上进行创新。”

乍看上去，比起围棋或国际象棋，《星际争霸2》应该更容易攻克，但是无法知道所有信息带来了挑战。机器人只能看到和做到人类玩家能看到的画面和进行的操作。这会迫使机器人尝试与揣测玩家策略，并发展出自己的风格。

看AI对人类虽然很有趣，但是此项目有着深远的目的。谷歌已经用 DeepMind 的机械学习节约了大把数据中心的降温费用。有朝一日AI能在《星际争霸2》里战胜人类玩家时，它就能从事更加复杂的工作了。

“从科学的角度看，《星际争霸2》和生命的一些特性很像，” David Churchill，纽芬兰纪念大学教授，《星际争霸2》机器人比赛组织者说道，“这是我们将来在现实中用到的技术的试验场。”

研究人员们在真正实现此目的之前，还有很长的路要走。早期结果显示，机器在《星际争霸2》里还是远远比不上人类的。