在过去的一月中,我参加了百度千帆举办的一个AI游戏开发大赛,作为评委组的成员之一,看到了不少有意思的作品。
本次活动提供给参赛者的是百度文心一言4.0的API,以及千帆平台的部分能力(包括文生图等其他类型的AI,以及LLM微调等方案)。官方虽然给了参赛选手一两周的时间准备,但是因为这次比赛主要是百度用来宣传文心一言和千帆大模型的活动,所以总体来说重在参与。对于一百多队参赛者来说,这个活动更像是一次线上Game Jam。
本文也旨在以这个活动中的部分作品为例,描述一些游戏相关应用场景,帮助大家开一些脑洞。我会按照我的理解对这些游戏进行分类。也当我为一些我觉得可圈可点但是没有被选中优胜的作品做个宣传吧(因为所有的作品都可以在B站上看到,所以我就直接引用这些作品的内容做一些应用层面的总结。)
LLM作为一个“聊天”AI,其最直接的应用就是“角色扮演”。这也是这次比赛中最主流的应用方式。我们可以看到有相当多数量的应用。
配合游戏逻辑说话,主要辅助表现角色的性格和语气。例如这个:
如上图这个Case,开发者用LLM作为游戏回合切换操作引导,让LLM以牌桌对手的“嘴巴”的方式提醒玩家:到你了。
但实际从应用角度来说,这么做是很浪费的。毕竟在这类游戏中,角色会面临的情况是可以被枚举的,于是完全可以用预生成的方式,把可能用到的语料先准备好,减少游戏运行时带来的体验问题(LLM回复时间较慢)和运营成本问题。
这次活动中看到了好几个数字人,因为大多数团队本身美术能力有限,所以有些眼熟能详的资源被多个作品使用。
Y1S1,数字人的Chat如果交给LLM来做,那么几乎就是LLM原生能力的“包壳”应用。对LLM本身的能力和LLM驯兽师的调教水平要求很高。从这次比赛的作品中来看,现在对于角色扮演这个领域里,LLM成体系的应用还是较少的。
我本身非常希望可以看到对于角色表演能力、记忆管理、情感培养上的精致应用案例。但实际上参赛选手可能把更多的时间花在LLM和游戏引擎的对接,以及如何让角色播放语音、动作和口型表情。而这些因为需要足够好的美术资源,或者对表演类的AI进行更多的训练才能做得更出彩,反而并没有体现出AI应用能力。
2.3 略有认知的NPC,作为逻辑驱动的角色的嘴替
有些团队把LLM应用到游戏实际内容的角色扮演环节里,但因为本身不承载游戏功能,只是“包装”,让美术表现更加立体化。
比如这个项目,基本就是在VR数字人项目中,给一个性格奇怪的NPC加上了LLM。至于这个角色的逻辑和AI有什么关系,也没太看出来。这样所呈现的结果就是,AI不能说与核心玩法无关,但也雀食没有为玩法带来更多增益。所以我也将其归在数字人范畴里。如果要突破这个界限,游戏开发者就需要让LLM认知游戏内的各种角色状态。同时,游戏内容也需要想办法承接LLM返回的内容。
对于游戏NPC来说,仅仅可以正常回复玩家的说话并不足以支撑人设,玩家希望的这个NPC产生足够的代入感。在传统游戏中,一个NPC的一切表演都是被设计的,能在合适的时机说合适的话,做合适的表演,执行合适的交互。在AI游戏中,玩家对它的期待会更高。而如果表现的还不如预生成的,玩家是否会有足够的包容度就不好说了。
这里特指在游戏中承载了“功能”的LLM应用于NPC的方式。而在这个分类下,有些游戏作品的完整度立刻就高起来了。
《Im Here2》是一个基于Unity开发的探索解密类游戏,LLM被应用于机器人助手、传送门解锁两个主要部分,配合交互物的说明提示作为引导。这个项目在AI应用方面可以说是比较讲究了,从包装到整体应用都很一致:
小机器人始终伴随玩家左右飞行。玩家可以主动和它说话,向它咨询问题,也可以胡说八道。为了让它显得“活“,有时候会由触发器或其他的交互导致它“主动发言”。
这类NPC设计的也很有意思。每个NPC都承载着解锁机关,引导玩家去下一个地方的使命。玩家要解锁需要答对NPC提的问题。而因为问题有些属于自然科学常识,有些是游戏内容。于是,“答对问题”的方式也就分为了两种:通过输入回答问题;从游戏内获得答案。
游戏中的谜题分为科学知识、常识和游戏内的知识。于是答案的获取途径也就多种多样了。包括直接询问自己身边的小机器人。
这个项目的视频作者起的名字是:【AIGC】《Im Here2》。从作者自己的分类就可以看出来,比起LLM的实时回复,作者(可能)将很多语料作为AI的预生成内容放在了游戏的知识库中,NPC可以直接检索知识进行回复。
而且这个项目同时也应用到了文字转语音和语音转文字的AI技术,让玩家可以和NPC真正的“对话”,让整个体验更加更加舒服。这个作品可以说作为一个益智类游戏的Demo还是可以的,虽然可玩性有多高有待商榷,但是在AI应用的角度来说已经不错了。
在一个“正常”的游戏中,把LLM应用到商店功能中应该也是一个很容易想到的应用方式,如果游戏本身的经济是核心玩法的一环,那么“讨价还价”就可以成为一个玩点。
这个项目想到了将AI用在商店这个点子。作为一个塔防游戏,合理利用货币显然是非常重要的。但是这个项目仅仅是“用”了LLM,而没有“好好用”。
我们完全可以让AI知道战局的情况,并且影响玩家讨价还价的成功率以及成功的程度。甚至如果开发者喜欢,还可以让AI更“奸商”一些,在知道玩家有钱但是处于劣势的时候涨价,在玩家没钱但是急于用钱的时候放贷。
而且,纯粹用打字的方式来做这种游戏的商店显然体验是不好的。核心玩法的部分都用不到键盘,反倒是买东西需要用键盘,而且目前还只是给常规商店加了个LLM的壳而已,可以说是想法很好,但是实际的结果可能是个负优化。
同样是交易类NPC应用,我们将前一个项目于这个项目做对比:
《帝国谈判官》,这个Demo从游戏名称到核心玩法都非常统一:谈判。游戏的所有内容都是服务于核心玩法谈判的。
虽然这个项目的包装还比较粗糙,但是核心玩法是成立的。而且可以看到驯兽师对LLM做了一定程度的控制,让NPC对手有自己的坚持和想法。并且作者打通了游戏内容和LLM之间的联系,让NPC可以结合游戏内容进行沟通。算是这次比赛中让我眼前一亮的作品了。
与之对应的,是另一个以“说服”为主的作品。在这个项目中,我们可以看到作者将故事中的关键NPC在特定时刻交给AI。玩家可以通过与之进行对话,通过“说服“来完成任务目标。而这个项目的应用方式应该可以让我们产生很多其他的联想。
说服是很多RPG游戏中会有的核心玩法之一,而且如果做的好的话,可以实现一个任务的多种解法,甚至可以产生多条不同的剧情线。作为一个JRPG、CRPG的爱好者,我在看这个作品的时候感觉毫无违和感。但是如果希望体验更好一些,我们完全可以让AI再帮玩家生成几个回复选项,并且允许玩家自己输入,可能体验会更好一些。
不过Y1S1,这类作品在本次大赛中还有那么五六七八个,每一个都不完整。充分说明了这类作品就算有了AI,也并不省策划不省技术不省美术,反而因为要让AI NPC每一个都乖乖的安分守己,还有了传统游戏所不需要的工作量。至于是否能起到超越传统游戏的效果,和做“策划”的开发者有莫大的关系。比如这个:
AI剧本杀也是很多游戏AI游戏开发者探索了很久的游戏品类了。而且很多开发者还在用这个品类测试自己训练的LLM。所以在这次比赛中,AI剧本杀的出场比较频繁,而且大多品质不算差。因为这类游戏有不少都是以纯文字为主,所以在竞争角逐的时候,就真的有点拼游戏本体和AI应用的好不好了。比如这个:
作为基础的AI剧本杀品类,固定的案情、固定的NPC身份,单一玩家,完全靠“盘话”来了解情况。AI在过程中需要做的,就是通过玩家的问题,将自己知道的信息说出来。至于说多少,怎么说,要么听驯兽师的,要么自己“主观判断”。最后让玩家自己的分析决定谁是凶手,简直和LLM太契合了。
这是本次大赛中“完整度”最高的作品之一,也是本次大赛中为数不多可以直接体验的的作品了。简单了解了下发现这是个专业的游戏开发团队。甚至他们用的工具链都是在对外提供商业化服务的。有一种正规军下场卷民间的感觉,不得不说,确实从素材到整合的结果都在线。
不过也正因为此,我对这个作品有更高的期待。我更希望看到一些“动态”的东西和“不完全依靠LLM”的东西。这个目前还不多,这就会导致这类作品作为一个非常烧Token的品类,其运营成本变得不可控。而我们也看到显然开发团队想到了这一点,所以每个NPC只能聊30句,估计超出了就要花钱或者看广告了。但这样的做法又会严重影响这种对思路连贯有要求的核心玩法。所以,这类游戏需要尽可能考虑如何降低Token消耗和运营成本,亦或者想到一种可以持续运营产生运营收入的方式。
我们可以从他的作品中看到,NPC的说话方式更加严谨,也更有性格。但是代价是更多的Token成本和更长的AI思考时间。不知道他后面会如何进行优化。
我之所以将【角色扮演】即AI-NPC作为本次大赛分享的第一篇,是因为这是目前许多游戏团队都在尝试探索的类型。很多非常有意思的脑洞在伴随着AI自身能力和驯兽师们的能力逐步落地。相信2024年我们会看到越来越多有意思的应用方案。
但是,在这次大赛中,因为所有的LLM消耗都是由赞助商提供的,而且参赛的结果展示是视频。这就导致了很多作品本身存在的问题是不会被暴露出来的。最大的几个问题就是:耗时、烧钱、幻觉。
而这几乎是所有作品的共性。我们看到有些开发者为了规训AI的输出,让它呈现“复合预期的出乎意料”,有些作者选择用更多的AI形成一个决策Agent,这进一步提高了运营成本,也大幅度增加了玩家等待的时间。就是用烧钱+延长耗时的方式来解决幻觉。这既不理想,也不复合实际商业化需求。
这次比赛的参赛作品还有一些其他的游戏品类,敬请期待下一篇分享。
【《Im Here2》基于LLM驱动的环境叙事解谜Unity3D游戏】
【《穿越秦朝·荆轲刺秦王》AI NPC的剧情触发游戏!】
评论区
共 2 条评论热门最新