索尼集团开发了可以在复杂游戏中战胜人类的人工智能(AI),并独自构筑了相关机制:在需要瞬间从众多选项中做出决定的赛车游戏中,让人工智能通过反复对战来提升实力。索尼认为,该程序不仅可用于游戏,还可以应用于产业机器人开发,将开展相关研究。
人工智能“GT Sophy(苏菲)”(以下简称:苏菲)是与索尼互动娱乐(SIE)等共同开发的。苏菲在人气游戏《GT 赛车》中,与世界冠军和实际赛车手进行比赛并取得了胜利。研究成果论文将刊登在10日的英国科学杂志《自然》上。
与竞技相关的人工智能有英国 deepmind 开发的围棋人工智能“阿尔法”。与围棋不同,《GT赛车》需要根据路线、对方车辆的位置等诸多条件,瞬间做出转向方式、加速方式等多项决定,这类竞技游戏一直被认为是人工智能开发的难点。
索尼制作了“强化学习”的模型,即不由人为告知 AI “正确答案”还是“错误答案”,而是由人工智能自身在不断的错误中进行学习。AI 之间反复进行了数万小时、数百万公里的比赛,学习了高效率的行车方法和超越对手的策略。
以往的学习的是采取某种行动时的平均获益,也就是“期待值”,但这次的“苏菲”学习了以何种概率获得何种收益等整体情况,扩大了数据的范围。不仅学会了取胜的方法,还学会了“在赛道上不实施露骨的妨碍动作”这种很难明确定义的礼仪。
产业领域的机器人需要在实际空间反复进行动作测试,由人设定动作,控制方法繁杂。如果能使用“苏菲”在虚拟空间进行模拟,不仅能提高开发速度,降低成本,还能创造出人们想不到的控制方法。
《GT 赛车》再现了物理空间,可能有助于提高实际赛车手的驾驶技术。索尼也在讨论电动汽车(EV)的加入,有可能将“苏菲”应用于自动驾驶的开发。
美国的大型IT企业正在竞争开发人工智能的强化学习。美国谷歌在半导体电路设计等领域应用了人工智能技术。在日本国内,为了制定运输船的有效运航和大规模成套设备的生产体制变更等程序,产业界正在推进AI实用化。
与游戏的对决一直是衡量人工智能进化的指标。1997年美国IBM的“深蓝”战胜国际象棋世界冠军,2017年阿尔法战胜了被认为是世界最强的棋手。近年来,在不知道对手信息的扑克牌和需要多人合作的战略游戏中,人工智能也能战胜职业游戏玩家。
注:根据 GAME WATCH 的消息,《GT 赛车7》玩家将迎来“苏菲”的适配版。
原始出处:《日本经济新闻》电子版
评论区
共 24 条评论热门最新