去年《斯坦福小镇》demo发布时,我就想过传统游戏行业要如何利用大型语言模型(LLM)和 智能体(AI Agent)进行玩法创新。本该在去年就写下这些想法,但拖了很久没发。今天就浅浅用几个游戏的例子进行说明,总结一下这两者在现有游戏中的应用。(如果有理解有误的地方,欢迎指出)
1️⃣ LLM:根据大模型语义理解特点在游戏机制方面做创新
LLM在游戏方面最普遍的应用方向是让NPC更自然地与玩家对话。例如,《逆水寒》通过训练不同性格的大模型,使得NPC与玩家的交互更具沉浸感。
还有一类游戏,例如《病娇猫娘》和《我被LLM包围了》,则主要围绕LLM在语义理解方面的特点设计关卡。我们知道,LLM是通过Embedding来理解语义的。简单来说,Embedding是将词语转换为空间向量的技术,语义相似的词语在向量空间中会更接近。Embedding根据输入词语的空间关系来预测下一个词语。
由于是基于预测,LLM可能会出错。这两款游戏利用这一特点设计了核心玩法。玩家需要“骗”大模型,诱导大模型说出某个关键词,以达到关卡目标。比如《病娇猫娘》里, 玩家要想办法在女友那边拿到钥匙,同事不引起女友的怀疑。《我被LLM包围了》则是需要玩家精心构思问题,让大模型说出特定形式的回答。
在AI Agent应用方面,《斯坦福小镇》是最具代表性的例子。一个公式可以解决大部分关于Agent的疑问:
Agent=LLM+memory+planning skills+tool use+...
从以上公式,我们可以看出AI Agent有两大突出的特点:
1. 记忆功能:比起LLM,Agent能够让NPC实现“记忆”功能,能将过去的对话、事件以空间向量或其他形式储存。例如,《斯坦福小镇》里几个NPC聚在一起对话,突然决定明天一起在咖啡馆开派对,NPC记住了这个事件。第二天NPC仍然记得这个消息,并将消息告诉了其他人。
2. 反思和决策能力:Agent可以一步步地、按照事情的不同优先级做计划,并决定使用哪个技能或工具。它们根据以往的经验、记忆和环境反馈来优化决策。例如,NPC在谈话中偶然提到了开派对,计划在明天举行。大部分NPC赴约了,而某些NPC有更重要的计划,例如开画展,于是拒绝了。
到此为止,我们或许觉得,AI Agent的应用或许让游戏看起来更加涌现式了。“涌现式”是最近游戏行业常提及的词语之一,可以理解为游戏的“自由度”或“不可预测性”。在《斯坦福小镇》中,NPC偶然触发的开派对的计划,就是非常涌现式的现象。
对AI Agent的反思:“涌现式”设计的真正核心在于游戏机制和行为模式的相互作用,而不仅仅依赖于Agent的“记忆”和“决策”
尽管《斯坦福小镇》是想创造一个Sim-like的游戏,我仍然不认为它实现了和《模拟人生》同等的自由度和涌现程度。即使在没有Agent的时代,传统游戏通过复杂的机制设计也能实现“涌现式”效果,例如《矮人要塞》和《模拟人生》。在《矮人要塞》中,每个矮人都有独特的个性、爱好和情绪,这些属性的相互作用产生了复杂的社会关系。例如,如果玩家将一个区域规划为神殿,矮人会去那里祷告;矮人甚至可以自己造陷阱,陷阱成功困住敌人后,造陷阱的矮人还会被同伴表扬。这些复杂的行为模式设计让矮人的社会高度动态、不可预测。
我认为“涌现式”的核心不只是“记忆”或“决策”,而是让游戏机制与行为模式产生相互作用,使得游戏产生不可预测的结果,从而充满惊喜和挑战。光有Agent的应用并不会让游戏的自由度产生质的变化,最核心的仍然是设计行为模式。NPC触发偶然派对事件并且赴约,显然是不够的。从玩家的角度来说,这款游戏的涌现式体验也就体现在NPC的随机聊天内容上了。(在这里我呼吁一下Agent的开发者能多和游戏设计师合作。)
同样是开派对,《模拟人生》中NPC的行为模式要复杂的多。在派对上不同NPC会根据他们的性格特征和关系网络表现出不同的举动。有些NPC是社牛,而另一些社恐则会选择安静地独处。这让游戏的涌现不止于文本内容的随机,而是能让NPC的行为产生连锁反应,大大丰富了游戏的体验。
其次,Agent的开发成本较高,与其花大价钱开发一个Agent,我认为不如琢磨如何优化游戏机制和循环来的实际和有效。
综上所述,我个人认为LLM在传统游戏行业的应用很有潜力,不光能让NPC与玩家产生更自然的对话,还能在游戏机制上带来创新,成本也较Agent的开发更低。而Agent的开发还道阻且长,需要更多在游戏机制上的探索和改进。(再次呼吁一下Agent的开发者能多和游戏设计师合作。)
评论区
共 2 条评论热门最新