纵观历史,我们一直在技术的帮助下,不断以新的方式和世界进行交互,从而获得更全面的认知来了解这个世界和我们自己。
过往的经验让我们深刻地认识到,无论是从学术界还是产业界来看,使用当前的方法在短期内实现通用人工智能(AGI),是一件颇有难度的事情。机器不仅需要学习来自于各行各业的海量数据,也需要有新的算法和其他方式才能更好地理解人类的知识本身。
在以游戏为主的数字娱乐领域中,我们看到了人工智能的应用场景和机会。游戏本身就具备高度结构化的数据,能为人工智能提供非常多的限定场景进行训练。
玩家在进行游戏体验时,也会在与数字内容交互时产生大量的行为数据,从而为人工智能的进一步迭代和优化,提供了必不可少的动力。
从上世纪 60 年代以《龙与地下城》为代表的真人跑团游戏,到以《GTA 5》和《荒野大镖客 2》为代表的开放世界游戏,很多游戏玩家和开发者就一直有一个梦想,就是在电子游戏中实现《龙与地下城》里,充满无限可能的自由交互,以及动态的个性化剧情和叙事体验。
当然,我们也不例外。从成立至今的 2 年里,我们不断地从世界各地的游戏公司和全球游戏市场中吸收意见与反馈,进行技术积累和迭代,并逐渐地摸索出一套可以在游戏中实时且动态地生成能与玩家产生个性化交互内容的方法和对应的产品。
我们将这套核心技术命名为混沌球(Chaos Box),它是一个基于深度强化学习的 AI 叙事引擎,在不需要任何脚本的情况下,它就能控制游戏中虚拟⻆色的行为逻辑,并让其自发地产生非常智能的行为。
混沌球不仅实现了更加个性化且动态的剧情探索,能够针对固定目标或结局智能地生成剧本和多线剧情,也能够在游戏内大规模地生成具有不同行为模式和台词对话的智能 NPC,智能生物体以及智能环境。
在传统的游戏生产流程中,人们需要通过决策树和状态机技术,针对性地为每一个事件中的对象、行为和结果进行明确的定义与设计,才能在一定程度上实现内容的多样性与复杂性。
为了更好的吸引玩家,游戏需要不断地更新内容。如果人们希望在现有的决策树基础上增加新的物品、交互方式、事件情况等,就得对所有相关的决策树进行修改和调整。
然而,开发者花费了非常多的人力和时间才打造出来的少量内容,用户会在短时间内以非常惊人的速度将其消耗完毕。
与决策树不同的是,混沌球为游戏中的内容提供了能够自主决策的 “大脑”,智能地生成和控制游戏内容本身以及和玩家的交互逻辑。
在简单的规则和设定下,游戏开发者就可以快速地生成动态且个性化的剧情和事件、能够与玩家进行智能对话和行为交互的 NPC 等数字内容。
与此同时,混沌球能够与传统的决策树进行任意的结合。
游戏开发者可以选择将已有决策树的某些节点替换成一个个的混沌球,在局部场景中打造无限的内容交互可能;或者也可以使用混沌球覆盖所有的游戏场景,从而制作完全开放且自动生成的动态内容。
为了让内容创意者和开发者能更以简单且高效的方式使用混沌球智能生成动态的数字内容,我们将混沌球集成到了一个云原生的平台:梦境云(Morpheus Cloud)
梦境云是基于混沌球算法打造的云原生服务。当游戏接入了混沌球算法后,梦境云能在玩家与游戏内容进行交互的过程中,实时生成智能的动态内容。
玩家和游戏的交互方式包括但不限于文本、语音以及所有在游戏里允许发生的交互行为,根据这些不同的交互,游戏内所有虚拟⻆色、生物以及环境内的物体,都可以实时地生成不同的内容。
当游戏开发者使用梦境云进行开发时,仅需要在某个场景中,对玩家能够交互的对象进行非常简单的设定,比如角色、物体、行为等,并将所有的交互关系明确,即可在混沌球算法的帮助下进行训练,从而该场景中实现动态且个性化的剧情、智能 NPC 等交互内容。
事实上,前沿的游戏技术为行业带来了全新的可能性,梦境云和AI能帮助我们实现更多之前无法实现的效果和体验。
在游戏中,梦境云除了能简单、自动、高效地生成个性化的智能剧情、叙事、NPC 等交互内容,也能通过对角色动作的动态预测,实时生成运动的动画和效果。
为了让内容生成更加智能且有效,梦境云也能帮助开发者将文字和自然语言转换成实时的动画。它能以非常快的速度,把剧本、小说、新闻等文字类创意,转换成视觉化的图像和动画效果。
除此之外,梦境云还能根据不同游戏的特点和玩家的交互情况,动态地生成不同风格的节奏的音乐和关卡。
同时,在不断地对游戏进行自动化的测试过程中,梦境云也能基于玩家和游戏交互的数据分析,持续地帮助游戏开发者优化运营策略,比如自动平衡游戏内的经济体系、智能生成各种类型的游戏活动等。
随着虚拟世界的不断发展,游戏会作为用户与数字内容交互的主要形式而存在;而游戏化的内容交互,也会在其他领域逐渐渗透,从而在改变用户和泛内容领域的交互方式的同时,也带来用户对于大量且个性化的实时内容交互的新需求。
梦境云除了能在游戏中带来高效且智能的内容生成,也能在媒体、社交、直播、电商、教育等其他领域带来全新的可能性。
无论是为各种虚拟形象打造不同的智能大脑,还是为直播或电商提供更加丰富的内容交互形式,梦境云都能让数字内容的生产变得更加自动化和高效,进一步地为虚拟世界的发展带来更具交互性和个性化的动态体验。
在这一系列的产品的背后,其实是我们对这件事情的理解和认知。
在过去的 6 个月里,我们不仅将人工智能等前沿技术落地到了具体的场景中,也进行了非常深度的研究和系统性思考。
与此同时,我们完成了将近 14 万字的研究和分析,从不同的角度对游戏、内容、科技和虚拟世界展开了全面的阐述。
怀着对虚拟世界发展趋势的坚定信心,我们在意识到游戏在作为能够提供开放、自由、个性化的动态数字内容的同时,也是通往虚拟世界和元宇宙的最佳载体和实验场所。
接下来,我们将全面地阐述整个系统性思考的过程,并通过动态和发展的视角来看待人与世界的关系,以及整个世界本身的变化趋势。我们尽可能地将这 14 万字的思考不断地精炼,最终形成了下面长图。它包含了我们对于游戏、人工智能和虚拟世界的整个认知框架,以及对应的关键点信息。
同时,在后面的描述和解释中,我们也将之前发布的内容和本文中相关的信息,通过点击跳转的方式连接了起来,方便大家进一步理解。
简单来说,人作为地球上的碳基物种,要解决的终极需求是生存和繁衍。在这基础上,我们有两种解决思路:一直是向外探索,通过星际旅行不断发现新居住地,最终成为星际物种;另一种是向内探索,以数据化的方式生存在虚拟世界,最终成为云端物种。
《机器学习、虚拟世界与元宇宙 Metaverse》 在这个过程中,我们思维结构同时具备感性和理性,因此我们会使用不同的认知系统,包括逻辑、类比、联想等方式来理解世界和我们自己。但数学上的哥德尔不完备,到物理上的量子不确定和哲学上二律背反,会导致我们的逻辑系统存在天然的缺陷,从而无法从任何系统内了解和认知整个系统本身的全貌。因此,如果想更全面地了解这个世界,我们需要从已有认知系统外来获取信息。
《禁锢与永恒:从世界尽头到元宇宙》 我们知道,信息是连接人与世界的桥梁,它的存在只与信息的载体有关,信息的组合方式形成了我们的理解途径。在信息的传播和接受过程中,我们会直接和信息接触,也会通过和他人交互获得信息。在接触了信息后,我们既会使用认知系统内的逻辑,也会使用系统外的类比与联想处理信息。这不仅带来了共识,也带来了不同语境引发的认知差异。正是由于这种认知差异的存在,人们无法持续且稳定的获取与传播信息,从而对价值创造和发展造成了影响。
《发现新大陆:虚拟世界的大航海时代》 在人们利用信息创造价值与发展的过程中,土地提供了价值创造的空间,技术则提高了价值创造的效率。同时,真实世界也从这两方面带来了明显的限制,空间的有限性限制了人类的生存和发展区域,资源的有限性则限制了人们的生存和发展可利用的能源。
《发现新大陆:虚拟世界的大航海时代》 经过几百年的探索和发展,信息技术打破了真实世界的限制,也基于二进制规则打造了虚拟的世界。总的来说,虚拟世界和真实世界的发展是一个相互交织与促进的过程,并且我们将其又分为了四个不同的部分,他们分别是原生的真实世界、现实化的虚拟世界、数字化的真实世界和原生的虚拟世界。
《发现新大陆:虚拟世界的大航海时代》 在原生的真实世界中,我们利用真实资源,生产和消耗有型产品。随着人们利用数字化的方式,将真实世界中的文字、图像等信息传入虚拟世界,数字化的真实世界也就出现了。与此同时,人们又开始在计算机中直接进行创作与生产,成为了原生的虚拟世界。当人们把虚拟世界中的形象和内容,用真实世界中的物质来呈现时,这部分内容和信息也就形成了真实化的虚拟世界。
《发现新大陆:虚拟世界的大航海时代》 根据信息技术的发展,我们也将元宇宙划分为不同的发展阶段:Metaverse 0.1 版本:底层规则建立(1940s — 1970s)、Metaverse 0.2 版本:信息基础传递(1980s — 1990s)和 Metaverse 0.3 版本:信息高频交互(2000s — 至今)。在未来,元宇宙对真实世界的反哺也到达一个前所未有的高度,人们在真实世界中产生的价值,将会被大规模地投入到虚拟世界中,并更多地在虚拟世界完成经济和社会意义上的循环与迭代。
《禁锢与永恒:从世界尽头到元宇宙》 在技术的驱动下,游戏将会迎来产业革命,从内容的生产到运营和迭代都将会在云端发生,这不仅能提高数字内容的生产效率,也能实时地为玩家和用户带来个性化的动态交互,从而在虚拟世界中实现无限的可能。
《释放创造力:云游戏背后的产业革命》 因此,打造虚拟世界与元宇宙的关键则是智能内容的自动生成。我们也将内容的生产分为了四个不同的阶段:专业化的内容生产(PGC)、用户生产内容(UGC)、AI 协助的内容生成和全 AI 生产的内容。技术的发展将不仅会在内容的逻辑端提供合理的信息组合方式,也会在图像端提供丰富的信息展现形式。
《内容生成与消费科技:媒体、游戏和社交》 数字内容的种类和体量都及其庞大,而仅靠人工的方式去标记和实现这套逻辑系统并不现实,我们需要人工智能的协助,才从大量的结构化内容数据中,找到内容的内在逻辑。在所有的内容领域中,游戏有着高度结构化的数据,也在不同的限定场景下具有用户与内容的实时交互数据,从而为人工智能学习和理解数字内容的生成逻辑,提供了得天独厚的优势。与此同时,与其他形式的内容相比,游戏能够提供更加沉浸、自由、个性化和可动态交互的数字内容。
《内容生成与消费科技:媒体、游戏和社交》
《机器学习、虚拟世界与元宇宙 Metaverse》 这些丰富的内容,会在媒体、游戏与社交领域上表现出现的非常独特的交互体验。在媒体的角度来看,数字内容本身就具有媒体的属性,同时人工智能等技术将会驱动更具交互性的内容生成。当前的媒体内容更多是在内容的外部进行智能生成,比如推荐算法会根据用户的标签,不断地推荐下一个媒体内容。不过,我们也可以将其看成一种讨巧的交互方式。所谓内容内部的生成,其实就是剧情、叙事的生成。过去并没有技术能实现内容内部的智能生成,现在我们可以通过混沌球(Chaos Box)技术来实现。
《内容生成与消费科技:媒体、游戏和社交》 正是由于这种在内容的内部所产生的动态交互,让传统的数字内容带有了游戏的交互属性。同时,能够根据用户的交互而智能生成的数字内容,比如智能 NPC、动态剧情、虚拟形象等,也会为人们提供新的场景的对应的交互方式,从而在虚拟世界中形成社交关系的新媒介。
《内容生成与消费科技:媒体、游戏和社交》 在此基础上,我们的社会和生活将会进入到下一个时代,一个有着更加动态的数字交互内容的时代。
综上,这些是我们对于人、思维、认知、信息、真实世界、虚拟世界、元宇宙、游戏、媒体、社交、内容、逻辑、图像、技术、AI、智能生成等多个方面的思考,也是我们对于这件事情的系统性认知。
事实上,无论是我们设计并打造的人工智能算法、云服务产品、视觉效果,还是我们进行的深度研究分析和商业化合作,我们从骨子里就始终在追求真正的创新,并且在反复的思考中不断地进行自我迭代。
我们相信,在人工智能的协助下,虚拟世界的发展将会越来越快。与此同时,在下一代的游戏、媒体和社交等领域中,数字内容将给用户带来更动态、更自由、更开放的交互体验。
rct 成立于 2018 年,Y Combinator W19 成员,汇聚了来自人工智能、游戏、设计和商业化等领域的人才。rct 致力于使用人工智能打造下一代交互式娱乐体验,我们的使命是帮助人类更多地了解自己。至今 rct 已获得来自星瀚资本、Y Combinator 和 Makers Fund 的投资。
评论区
共 16 条评论热门最新