导语: 对于游戏玩家来说,没有什么比游戏中的Artificial Intelligence(人工智能,以下简称AI)更熟悉又更陌生的存在了——在任何类型的游戏中,引导玩家进入游戏世界、与玩家进行对抗、为玩家阐述故事的,都是游戏中的角色,而随着玩家对游戏体验的深入,对游戏品质要求的上升,不断提升AI的价值就成为了游戏开发者们需要面对的核心问题。
2023年,随着OpenAI的ChatGPT成为公众媒体渠道中的热门话题,AI在游戏中的应用前景也成为了人们投射想象力的领域。开发者们如何使游戏中的互动AI进化和提升?专业的游戏制作者们会如何使用和训练AI?游戏玩家理想中的无限靠近真实边界的游戏有实现的可能吗?
在今年的GDC中,腾讯游戏带来了18场主题演讲,涉及机器学习、影视级别大规模渲染、下一代移动游戏开发技术、音频技术和流程管理的效率工具等内容,充分展示了技术创新和前沿探索。带着许多问题,我访问了腾讯互娱光子工作室群的几位游戏工程师,他们是资深的玩家更是专业的开发人员,从他们的回答之中,可以得到许多玩家与游戏创作者们所关心的答案。
马老师:腾讯互娱光子工作室群高级游戏引擎工程师,主攻提高游戏动画质量及动作保真度,擅长利用机器学习和物理模拟。
王老师:腾讯互娱光子工作室群专家研究员,研究聚焦计算机视觉和计算机图形交叉领域。
张老师:腾讯互娱光子工作室群高级研究员,计算机视觉研究专家。
孙老师:腾讯互娱光子工作室群高级游戏AI研究员,十余年游戏开发经验。
舒老师:腾讯互娱光子工作室群高级游戏AI研究员,专注于学习型游戏AI制作。
机核: 对于游戏来说,玩家的感知是通过游玩进行的,但是从工程师和开发人员的角度来说,游戏首先是一个完整的工业项目。今天受访的几位,都是从事游戏AI相关领域研究的专家,我们的话题也会围绕AI展开。首先想知道,在游戏开发的从业经历中,工程师们如何看待AI与游戏之间存在的关联?您的分享都是有关AI的哪些方面?
马老师: (笑)从事游戏开发的人几乎没有不玩游戏的吧。我们虽然喜欢的游戏类型不太一样,也都是多年的老玩家了,对于游戏的认识身份很多时候就是在玩家与从业者之间转换。
我们几个在这次所做的演讲与分享都是有关AI的内容,但应用领域都不太一样,同样的我们在做这些事情的时候,虽然大多数时间谈论的是技术,但最终目的都是以创作来服务玩家,用技术让玩家的体验得到提升才是目标。咱们谈的AI在游戏里的应用其实已经非常深入了,只不过它不一定以非常具体的“角色”或“对话”出现,而是在方方面面给游戏玩家的各种体验带来改变,而且它现在已经有了非常深入的应用价值。
比如我这次分享的主题就是一个很有趣的事:“基于ML驱动合成自平衡布娃娃”,它就是利用机器学习对游戏人物的全身物理特征进行拟真交互计算,让游戏角色的各种行动更加逼真和自然。过去业界在这个方向尝试过很多方案,包括使用基础动画、IK(反向运动学)以及Euphoria引擎中间件等等,这些方案或多或少都存在解决问题单一,计算代价过高等情况。但是在AI的帮助下,我们能够制作功能多样化,工程更精简,且计算时耗更低的方案来实现各种物理交互,包括角色的各种行动。如果它能够进一步研发下去的话,就有可能为游戏开发者们提供一种更好的物理交互实现方案。
王老师: AI在不同游戏里的外在反映也是不一样的,这里也不局限于角色,还包括很多场景、互动内容等方面,其实都涉及到AI的运用。比如我们在GDC宣讲的一项AI研究,就是在数字化内容里部署人工智能技术来优化游戏的体验,我们模拟的场景是在虚拟世界里直播“真实的篮球比赛”,它不是编写好的脚本也不是像传统的事件触发器那样埋点、行为判断和固定动画演出,涉及到更多AI对环境的处理。如果这项技术能够成熟,它就能应用到游戏世界里去,比如说玩家进入一个环境里对NPC进行观察就不会出现一套动作翻来覆去的执行,游戏对于现实生活的场景和对象的复刻就会更加真实。
孙老师: 我们做的AI这块可能就跟玩家关联比较直接了,要求AI能够适应各种环境下的对战逻辑,能够满足各种场景要求:从初学者到资深玩家的PVP和PVE对战,也包括玩家在线游戏时如果突然掉线,怎么由AI接管角色这样的选项。传统的游戏AI是通过行为树这类基于规则的方法进行有限的选择,我们这次分享的强化学习+GAIL方案是更先进、学习效率更高的强化学习算法,只需要少量的训练数据,训练时间更短,能够快速地提升AI的拟人效果。
机核: 几位老师刚才都对AI这部分的认识做了一个初步的描述。由于涉及的领域众多,想问各位老师一个比较直观的问题,就是谈及的技术领域,能够为未来的游戏和游戏开发带来怎样的帮助?
张老师: 其实除了咱们刚才谈到的内容之外,我还想说说UGC(用户贡献内容)的话题。我跟王老师一起做的这个项目其实面向的不仅是玩家,还有从玩家身份转化出来的轻度创作者。很多玩家非常喜欢一个游戏,进而希望在游戏里去复原一个现实场景,但是它往往对于玩家的专业技能要求很高,举个例子就像很多3A游戏的MOD编辑器等等,尽管已经能够做到非常好,但是玩家能够调用的资源和使用的方法是很耗费学习的时间成本的。我们想做的就是用AI的技术帮助玩家来解决这一类需求,降低门槛,让玩家也能轻松地、更快速地上手游戏制作,这样就能够对游戏产生更深入的兴趣。
王老师: 是的,而且我们希望通过对AI的研究把技术进一步提升,比如我们团队分享的项目为什么说是分享“真实的篮球比赛”,是因为这项技术可以使用摄像头对真实比赛中的运动员进行一个实时的动作捕捉,再在游戏世界里同步还原,这样游戏玩家看游戏画面就等于看直播。这个对于技术的要求难点在于需要能做到与电视台直播信号同步,并且不添加任何标记点的情况下,精确地还原多人复杂场景的骨骼动画 。如果这项技术在经过打磨推广应用之后,玩家就有可能用较低的成本实现“动作转换”也就是现在成本非常高的真人动作捕捉,让他成为比赛、聚会等真实世界大型活动的创作者。
马老师: 我们所做的这个项目,也是通过AI的强化学习去生成一个控制模式,在人物的动作动画上实现一个全局的物理交互。它就有点类似于Boston Dynamics做的那种人形机器人,能跑能跳,你过去踹他一脚他能够非常自然地保持平衡而不是穿模,现实世界嘛。我们等于说把它在游戏里做了个实现,这样子我们玩家所控制的角色和游戏里的NPC,就能通过合理的方式形成更多的交互细节,并且能够跟游戏的整个世界基于物理规则进行全局互动。这个技术分享其实是很具象的,如果能够实现,无论是玩家还是开发者,对游戏中的“真实世界”的认识就会更加具体。
机核: 我们刚才谈到了AI技术细分的各个领域,接下来想聊聊有关AI的角色的话题。我想问的问题是AI“拟人化”的发展方向如何?各位从开发者的角度怎样去理解AI与人的行为之间的区别与关联?
舒老师: 我跟Gerry(孙老师)做同一个项目,我来说说有关“拟人化”的事情吧。在FPS或者MOBA这类对抗游戏中,传统的对AI操作的定义可能有些局限性,比如释放技能、进行攻击、走位等等。人机对抗的时候,去判断对面是不是AI的依据有时候会是“他的动作太干净了”,一般来说人类到达电子竞技的职业级水准时才会通过艰苦的训练来去掉很多无意义的动作。
但我们的项目中通过算法捕捉到的内容是根据人类玩游戏的数据来进行深度训练的,这里面就会包括一些人所做出的“无意义的动作”,这也是形成人机游戏过程中的“拟人化”因素。虽然从FPS游戏效率角度上来说它会降低获胜可能,但是我们做AI也不完全是为了提高模型强度,这没有意义。
机核: 这个说法很有趣。我想追问一下就是这个算法生成的AI是否有过互动的身份测试,就是把玩家放进游戏环境而不告诉对面的角色身份,让他去判断对面是人还是AI。
舒老师: 我们在分享的这个FPS项目里没有做过,不过我们之前曾经在另一个MOBA游戏里做过内部的测试,玩家体验过AI之后之后给一个调查问卷,问你觉得对面是人还是AI?为什么?
测试结果很有意思。AI被识别出来的几率是10%,就是打10场对决,回收的问卷里有1份会指出对方是AI。这个结果的反馈还是让我们比较满意的,因为在同一项问卷里,即使对面是真人也会有5%的几率被认为是AI,就好像我们在FPS游戏的路人局里看到一个人KD比很高就认为他开挂一样(笑)。
机核: 那可以说这个项目的“拟人化”已经很厉害了,至少有90%的玩家认为AI是真人。
马老师: 我这边的项目因为不是涉及对抗性的,所以我对于“拟人化”的认识还是基于真实交互这个部分。我认为AI走向“拟人化”的另一种表现形式,可能是帮助游戏开发者去生成内容,开发者有了好的AI,就不用再去直接参与游戏世界中的大部分叙事,而是致力于制订规则与世界观,然后将它作为语料或者基础条件投给AI。这样,AI就能根据规则在创造的游戏世界里去自己演化,通过玩家的互动看看整个游戏环境究竟会发生怎样的变化。我的理想是游戏里的物理规则是恒定的,但是环境规则不是一成不变的。人类玩家在其中,就有可能体验到和真实社会、现实世界差不多的一种沉浸式的感觉。当然这个只是一种设想,它对游戏的开发重心是有要求的,如果能够在技术上实现突破的话,成为一种全新的游戏类型也说不定。
张老师: 我要从一个玩家的身份来回答这个问题,就是我不喜欢游戏和现实生活太像(笑),因为现实生活很累,我不想把真实社交啥的都搬回到游戏里。我更喜欢的是个人的沉浸和没有别人去干扰的游戏时光。所以说我对“拟人化”的理解未必是真实性,而是针对游戏世界的框架,对AI进行行为的调整,让它能够给玩家带来跟现实生活不一样的体验。
我们的项目侧重点虽然是“尽量传递真实”,但我们希望带给玩家的仍然是“另一个世界观下的真实”。从技术上来说,我们可以使用真实数据和先进的技术,训练出一个通用的大模型,但开发者可以根据不同的游戏类型和特征,对这个模型进行调整,让它给玩家带来专属于游戏世界的“真实陪伴”。
机核: 最近ChatGPT非常火,我们在各个公开渠道也看到了人们跟他去对话和交互的各种反馈,以及GPT4在自然语言交互方面的惊人表现。那么我想问的是ChatGPT这样的AI参与到游戏里的话,它对于游戏有“体验”或者能够输出感受吗?
张老师: 让AI体验游戏这个事情其实在游戏生产领域是已经在做了,但它不是我们所说的“玩家体验”,不涉及情感方面。它是参与游戏的“自动化测试”,也就是让AI来遍历游戏,找bug——玩家碰到bug是肯定不爽的,但AI只要做好了算法,他生成报告就可以了。如果说感受方面,这件事情恰恰就是学界和研究界去有意避免的。
张老师: 对,我们避免这个方面,因为它最终会涉及到伦理限制的问题,就是如何判断AI有情感?如果我们真的想让AI输出有情绪的感受,从基础构建上仍然是通过公式和算法,让它输出一个评判,然后让接受信息的玩家体验到所谓情感。但它是否在评判的表述里真的带有情感呢?这种判断是是人来定义的。以前学界有学术项目,让AI来判断“看到一张图的感受”,包括恶心、恐惧、悲伤等等情感表达,但如何判定“感受”,我们或许在伦理上还没有准备好。
王老师: AI在体验方面能够预判“情绪”,但我觉得输出感受还是很难,因为在脑科学和神经科学方面的研究粒度和数据积累还不是很全面,所以说做出跟人类一样的情感感知和表达还是有难度的。
孙老师: 我从ChatGPT的另一个角度说说。我觉得ChatGPT能把游戏AI对环境的作用推进到更复杂、更真实的场景里去,因为以前的AI基本都是在非常细分的垂直领域里,很难做到通用,但如果说它自身能够适应更加复杂的环境,它就能够把角色对环境的反馈再传递给玩家,进一步提升玩家的体验。类似MMORPG的应用前景会非常宽广,只要有突破就会出现很多解决方案,因为之前没有很好的方法来解决RPG类游戏的AI。
舒老师: 我认为ChatGPT引入可能不只局限于互动,首先对互动来说它肯定会有很大帮助,因为它在自然语言理解,包括对话这块,成功是有目共睹的。另外比较重要的是之前就算在游戏里玩家和AI有互动,互动与AI的行为可能也是相对分离的,现在其实也有挺多工作在做多模态的模型,例如图文的多模态,未来游戏状态、游戏动作也可以和自然语言进行对齐,到时候这个互动就可以跟NPC角色的动作、行为有一定关联,这样整体的表现也会更自然更拟人一些。
孙老师: 像人一样,他看到游戏里面的画面,听到游戏里面的声音,也是一种体验。
舒老师: 对,两块要结合起来,如果单纯要用一个对话模型提升也是相对有限,但是如果大语言模型能够结合游戏状态和游戏动作,整体的效果就会更好一些。
机核: 我们刚才问了许多关于AI的技术发展问题,下个问题可能比较宏观或者说泛泛了。在玩家对游戏的认识或者游戏体验方面,AI技术的发展,会拓宽游戏的“边界”吗?或者说它会改变人或社会对游戏的认知状态吗?
王老师: 我认为AI的发展方向可能会让会让游戏的外延变得越来越广泛,或者说玩家们在游戏里体验到的东西,会借由发达的AI交互被放大许多。如果AI处理信息的能力进一步提升,我们就会做到很多以前不能想像的事情,比如说网上开会,视频会议人们都会觉得疲劳,但是如果在游戏里开会呢?如果游戏里应用的AI技术能够完全满足现实开会的各种需求,那么是不是人们会把玩游戏和开会结合起来,比如GDC就是一场大游戏。
机核: 这么说起来游戏和AI结合起来,有可能超越原本的娱乐属性,成为一种基础设施。
王老师: 是的,这个是我理解的拓宽游戏的边界,前提就是技术也包括AI技术的发展能够使构建游戏的成本越来越低,那么它的目标或者能帮助玩家实现的东西就会变大。我进入一个游戏不一定是为了去扮演一个英雄,可能会去做更多的事情,而这些事情即使放在现实社会里也是有意义的。
张老师: 我想说的是另一个层面的边界,是一个小例子触动了我。今天早晨我刚看了一个微博,有一个用户说他跟GPT4聊天,他说他很孤独,想问一下要怎么办,然后GPT4就表现得很“温暖”,跟他说了很多话。然后他们俩不断的交流,最后能让那个用户感觉到心里好受一点。
虽然我们知道它肯定是从大量的语料中,学到了这样子类似于心理咨询师的表现,但是它确实从实际功能上来说,已经可以开始帮忙,帮真实的人类来缓解情绪了。如果它是一个游戏,那么人们在进入这个游戏的时候,其实所期待获取的游戏性或者说玩游戏的目的,就和传统定义上的游戏不一样了。从这个层面上来说它就能拓宽游戏的边界。
马老师: 刚才几个问题期间我一直在思考的就是怎么去定义“AI理解人”这个事情。我举个例子可能不恰当,比如说有个AI通过了图灵测试,那么我们如何去定义这个AI是否能理解人呢?或许它仍然是通过数据模型反应出来的决策,但只是在行为取舍方面跟人类的通常逻辑一样呢?
这个事情放进游戏里的AI表达就很有意思了。我理解的这方面就是无论底层的AI还是角色扮演的AI,如果它能够在游戏里产生不同的功能和作用,比如说心理咨询、比如说陪伴服务,能够对人类社会产生价值,它就是有意义的探索方向。如果在这方面能够得到成果,那么游戏的边界也就相应被拓宽了。
孙老师: 我想说的是AI的技术进步其实在游戏的设计和制作方面起到的作用是很大的,它能够全面提升玩家在游戏里的沉浸体验,不管是测试还是其他的方面,只要我们给出量化的条件,它可以得到一个合理的范围,而这个范围就是游戏提供给玩家的乐趣空间。但是我们也不会只提供一个最优解,那样就没有游戏性了。比如说原本RPG因为制作成本和资源限制,线性的或者有限分支的是一种常见的设计方法,但如果AI的发展能够探索故事的多样性,那么它就可以降低很大的设计成本。
机核: 但是游戏自身的过程是具备连续性的,RPG的事件链条与逻辑链条如果被拉长的话,总体要求也会指数级上升吧?
孙老师: 是的,复杂环境里AI面对各种条件的资源消耗也很大,但我觉得通过不断的研究和尝试,它在内容增量方面就能够让游戏的边界更加宽广。
舒老师: AI在游戏内容生成这块未来可能的一个应用点是,创作者可以通过自然语言的交互方式,生成更多的关卡、场景与地图,这就是为游戏创作者拓宽了创作的边界。我们这边也在做相关的调研,希望通过自然语言交互在较为简单的2D游戏里输出一个具体可玩的关卡,但交互效率还有待提升,总之还是在探索和尝试。
机核: 最后的问题是对未来的一个畅想,想请AI方面的专家们来谈一谈,您认为未来几年里,游戏AI可能会发展到一个什么样的程度?有哪些领域是需要游戏从业者关注的?
孙老师: 我之前跟舒老师聊天时候说到过这个事,就是我们有生之年可能会看到AI学会使用工具,学会自己训练自己。这是一种挺可怕的想象。
舒老师: 是的,之前我们聊的时候脑洞比较大,但也并不是说局限于游戏领域,任何一个领域的AI到达一定水平之后,可以通过自我迭代提升的方式,进一步提高自己的能力。
之前Meta有发过一篇Toolformer的文章,说的就是大语言模型可以通过调用计算器、日历等工具,进一步提升对话的准确性与逻辑性。如果给AI一个明确的评判标准和奖励体系,结合强化学习的方法,它就能够通过自我迭代的方式获得更多的奖励和更好的评判结果。
机核: 那么如果两个目标相同的AI放在一个环境里岂不就是赛博斗兽场了。
孙老师: AI如果进入自我训练的循环,只要没有达到能力的上限,它就会追求完美继续优化,但那个上限可能永远也无法达到。用我们做的项目来举例子,两个AI都通过强化学习方式在同一个环境里博弈的话,我们最后只能把进程断掉,因为获取最终结果是没有必要的。它并没有为人服务,只是要达到“完美的目标”而已。
马老师: 我说得稍微保守一点,也只是说游戏AI这个部分,它近期的发展更有可能是在图像技术上的提升,比如说渲染算法、我这边在做的物理交互、以及环境模拟什么的,它在这一块更容易商业化,更容易形成具体的项目,玩家们在几年里就会看到这种进步。
张老师: 游戏AI在技术上的突破会更直观地被玩家感知到,就是创作者能够用更低的成本制作规模更大、效果更好的游戏,形成效率和品质方面的双重提升。
马老师: 说到不那么商业化的方面,就是有可能公共领域的AI模型会被引入到Indie Game的开发过程中,Indie Game 团队更愿意尝试新内容的探索和试错,未来游戏开发者有可能会以较低的成本得到一个优质AI的接口。那么独立游戏自身可以去实验很多超前的想法,会有更多形式上的创新,更多对游戏性和游戏体验的全新表达,做出爆款之后反过来推动游戏AI的进一步发展,这都是很值得期待的。
王老师: 我的观点是AI深度介入游戏,会让游戏的社会化属性会越来越强,另一方面就是游戏的创作效率上的改变。我可能会稍微偏乐观一些,我觉得如果AI技术进一步发展,就会让游戏的生产效率成百上千倍的提升,会让出现的游戏在数量与质量上都有飞跃的进步。这个时候在游戏开发方面或许就会出现全新的现象,因为几个游戏爱好者可能就很容易地做出一个以前需要高昂成本才能完成的游戏。而且这种技术的提升也不仅是单独某个点,而是涉及到游戏内容的方方面面,游戏会产生什么样的变化是值得玩家期待,也值得我们这些开发者期待的。
这个世代的游戏或许已经站在了技术变革的门口。AI在未来对游戏产生的影响,绝不仅仅局限于某种特定的环境或某种专门的类型。从底层技术到发展路径,从交互手段到体验方式,它可能为游戏的开发和创作带来超越原有领域局限的想象空间,也为玩家们开拓无尽的前景。
每一年的GDC上,我们总能看到对游戏有热情和有才能的开发者们分享着彼此的成就与进步,也帮助有志于游戏开发事业的人们加入行列。或许有一天,当技术的成本足够低,完成度足够高的时候,我们每个玩家都会成为真正意义上的游戏创作者,为彼此创造充满无尽乐趣的游戏世界。
评论区
共 7 条评论热门最新