本文首先讨论了在信息技术出现前,社会发展的核心驱动因素: 新土地的发现和新技术的发明 。新土地的发现为人们提供了 价值创造的空间 ,而新技术的发明帮助人们进一步地发现土地,同时提高了 价值创造的效率 。在这个过程中,人们也发明了信息技术,打开了虚拟世界的大门,也打通了真实世界与虚拟世界之间的连接。
总的来说,真实世界与虚拟世界的发展是 相互交织、相互促进 的动态发展,同时也通过几个不同的阶段实现 循环式发展 :
在真实世界中,人们利用资源与技术,以 有型产品 的方式进行生产与消耗;
技术的发展,带来了真实世界的 数字化 ,积累了虚拟世界的 原始信息 ;
图像端和逻辑端的技术突破,创造了虚拟世界的 原生信息 ,进一步增加了 数字信息体量 ;
虚拟世界和真实世界的边界 逐渐模糊 ,两个世界 相互渗透和影响 ;
不同的产业和领域,在真实世界和虚拟世界两端受到 不同路径的冲击和挤压 ;
个人、组织、公司和社会在真实世界和虚拟世界诞生了 新的连接方式 ;
新的连接方式产生新的数据,加速了 边界的模糊化 ,进一步推进虚拟世界的发展。
我们又将真实世界和虚拟世界进一步地分为“原生的真实世界”、“现实化的虚拟世界”、“数字化的真实世界”和“原生的虚拟世界”,并分别对它们进行了描述,同时也讨论了真实世界和虚拟世界之间的动态关系,并辅以产业和市场的发展做了进一步的推演。
目前我们处在虚拟世界发展的 初级阶段 ,有以下两个特征:
真实世界的数字化: 将真实世界的信息传输到“虚拟的真实世界”。比如,使用工具将真实世界数字化,具体应用在拍照片、录视频、电商、社区、人脸识别、物联网等等。
虚拟世界的原生化: 在虚拟世界中创造原生的信息。比如,使用创意类工具进行数字化设计与开发,具体应用在游戏、影视、动画、设计、特效、虚拟形象等等。
在未来,虚拟世界的原生信息会大量增加,既来源于人们将创意在虚拟世界中实现,也来源于虚拟世界中的信息能够自主地生产。
前者的实现,需要基础设施来铺设通道并提供支持,也需要更有效率的工具来将创意实现;而后者的实现,则需要“智能体”的参与,在虚拟世界中智能、高效地生产大量的信息。
除此之外,真实世界的人们也需要更有效的方式来与虚拟世界中的原生信息进行交互,并会诞生新的入口、新的应用、新的硬件等等,从而改变现有生产流程与结构,逐渐形成新的领域与产业。
在人类的历史长河中,15 世纪到 17 世纪是一个非常特殊的时期,以哥伦布、达伽马为代表的欧洲航海家,扮演了地理大发现的主角。在过去,对天文与地理知识的缺乏,导致人们认为大地是平的,越过大地尽头则是无底深渊。再加上没有精确的定位系统及坚固可靠的航海设备,远洋航行无疑是一种极具风险的行为。
随着香料与金银的交易逐渐扩大,对于财富的渴望源源不断地为欧洲的探险者们注入了探索的动力。然而对于欧洲来说,不仅通过陆地到达亚洲的路途十分遥远,而且商队也需要穿越多个地区才能到达;同时,在大部分时期里,通往亚洲的各条商路也被穆斯林和其他势力所控制,欧洲急需开拓一条新的贸易之路。随后欧洲人通过海洋的远行发现了美洲新大陆,也因此开启了下一个时代。
文明的延续与发展,需要持续且稳定的物理环境作为基础。虽然海洋和天空会比陆地更加广阔,但由于人类躯体和技术发展的双重限制,目前来看,陆地是最适合的一种方式支持着文明的延续。
事实上,如果仅限于“真实”的价值对象,随着人口增加,作为人类社会所诞生的大部分价值的最终杠杆,陆地上的土地和资源所能撬动的价值是非常有限的。在真实世界中,我们可以用来生存且正常生活的土地面积也十分有限,同时人们也尚未找到在海洋、天空甚至太空中的可稳定、可持续、规模化的生活方式。
广义地来看,土地、海洋、天空都是空间的一部分,所以我们可以得出第一个结论:
另外,有了生存的空间,我们需要消耗资源产生能源,再将能源以各种方式进行利用,满足必要的生存和多样化的生活需求。事实上,我们也可以将“生命”理解为 一场对抗熵增的运动 ,在热力学第二定律的基础上,薛定谔也曾表达过,生命的存在就是在对抗熵增定律,它以负熵为生。
以热力学的角度来看,人类文明在消耗资源维持有序时,会将熵转移给被消耗的资源,使其增大。同时,资源的丰富程度直接决定了可以被转移熵的上限,这就诞生了第二个结论:
对于一个文明来说,能源变革的历史,也是人类社会历史的 缩影 之一。当然,我们能通过技术突破,将真实世界中的资源利用效率不断提高,比如可控核聚变。如果能实现的话,我们的能源几乎是取之不尽用之不竭的。因此,我们还有第三个结论:
在信息技术出现前,旧时代的社会发展本质上来源于两点:
事实上,科学理论是人类心智的自由发明(invention),而在理论物理的根本方法中,根本就没有发现(discovery)这个词。因此,新技术的发明帮助我们以一种新的方式来对认知世界,在这个过程中,可以发现新的可利用资源,也能获取新的利用效率。
信息技术令人兴奋的点在于,二进制规则的发明,为人类打开了数字化的虚拟世界大门。让我们看到了几乎无限的虚拟生存空间,以及几乎无限的虚拟资源。虽然虚拟世界的信息技术仍然依赖于真实世界的资源,但从利用效率来看,如果在虚拟世界中达成一个特定目标,则其消耗真实资源的量会小于在真实世界中达成相似目标所需要消耗的资源。
举个例子,如果要在真实世界中,从北京去洛杉矶,需要选择交通工具,而它们又会以有限的能源利用效率消耗着资源;但如果在虚拟世界中,只需要“传送”即可,这仅会消耗几秒钟的电力;如果想按照真实的交通时长来体验路途,虚拟世界中的能源消耗也仅仅是真实世界中的很少的一部分。
当然我们也知道,论述一件事情发生的合理性,会有很多角度和因素,比如互联网的诞生最初是来源于军事目的;但当人们将第一个代码传输到地球上的另一侧时,也就正式地开始了全人类对虚拟世界的探索与建设。
关于虚拟世界的定义与描述,各类人士已经对其进行了充分的描述与想象。来自牛津大学互联网研究所(Oxford Internet Institute, OII)的 Ralph Schroeder 给出过这样的一个描述:
在他的描述中,虚拟世界是一种持续的虚拟环境,在其中人们可以如同真实世界般和其他人或事物发生交互。而这种虚拟环境,或者说成虚拟现实,是通过计算机生成的,可以让人们和虚拟环境中的“人”进行交互;同时也可以让人们和这种虚拟环境本身进行交互。
事实上,这样的定义会更加强调“感官体验”。如果仅仅是描述一种“与他人或环境交互”的感觉,那文字、书籍、文字多人游戏(MUD, Multiple User Domain)、做梦或者其他现象所带来的体验也能称为虚拟世界吗?严格来说,我们认为不是这样的。
因此,在讨论虚拟世界的构建和具体表现前,我们需要区分“虚拟环境”和“虚拟世界”。其实它们代表的是两类不同的概念与领域,虽然可能会被大家经常混用,但本质上二者描述的对象具有非常强的相关性。
虚拟环境是一个相对静态的概念。 多数情况下,我们使用“虚拟环境”来表述一种空间的属性,比如大脑看到文字、图片和其他物体时所想象出来的环境、数字化技术所构造的图像环境等。一切不是真实世界中存在的环境,事实上都可以被称为虚拟环境。虽然说,一切都是绝对动态的,但虚拟环境则指的是相对静态的一种框架和结构。
虚拟世界是一个相对动态的概念。 事实上,虚拟世界会带有社会属性,人们可以在其中不断地和其他人进行社交,因此它也强调了 动态性(dynamic) 。同时在空间层面,它也强调了 持续性(persistency) 。除此之外,更全面意义上的虚拟世界还应该包含 在线(online) 这一属性,现代信息技术所打造的虚拟世界,全是建立在代码规则上的,而一个离线的虚拟世界是无法让参与其中的对象实时地参与到社交活动中的。
基于这样的区分和描述,虚拟世界其实包含了虚拟环境的概念。而我们经常说的电子游戏,事实上也只是虚拟世界的一部分,或者说是虚拟世界的子集,对于“游戏中的世界是虚拟世界”这种观点,从逻辑上来看也是没问题的。也就是说,网络游戏是虚拟世界的一个子集。
我们可以将虚拟世界视为,与在线游戏所区分开来的“第三空间”,也就是在线的社交场所(Steinkuehler and Williams, 2006)。这样的“第三空间”,也正是目前正在模糊真实世界和虚拟世界边缘的推手之一;而在它背后的原动力,则是基础科学的突破所带来的技术进步。
从第一台个人计算机到几乎每人都有的手机和其他终端设备,从显示屏中的几行代码再到一张张自拍和逼真的虚拟形象,在这一系列的变化和创新背后,其实代表的是技术驱动下的数字化文明的进程变得越来越快,并以循环前进的方式发生:
在真实世界中,人们利用资源与技术,以 有型产品 的方式进行生产与消耗;
技术的发展,带来了真实世界的 数字化 ,积累了虚拟世界的 原始信息 ;
图像端和逻辑端的技术突破,创造了虚拟世界的 原生信息 ,进一步增加了 数字信息的体量;
虚拟世界和真实世界的边界逐渐模糊,两个世界 相互渗透和影响 ;
不同的产业和领域,在真实世界和虚拟世界两端受到 不同路径的冲击和挤压 ;
个人、组织、公司和社会在真实世界和虚拟世界诞生了 新的连接方式 ;
新的连接方式产生新的数据,加速了边界的模糊化,进一步推进虚拟世界的发展。
从完备性的角度看来,一开始只有真实世界;计算机和代码的出现又标志着虚拟世界的诞生;随着人们利用数字化的方式,将真实世界中的文字、图像等信息传入虚拟世界,数字化的真实世界也就出现了;与此同时,人们又开始在计算机中直接进行创作与生产,成为了原生的虚拟世界。
建立在相互影响的前提下,一共有最核心的四种世界形式:原生的真实世界、现实化的虚拟世界、数字化的真实世界、原生的虚拟世界。他们各自代表了不同的场景,也对应了不同的需求,从而诞生了不同的产业。也就是说,技术的突破不仅能优化原有需求,更能创造新的需求。
同时,由于这几个世界之间的关系会带来一种“迁移效应”,使得其中一个世界的场景可以被迁移到另外一个世界中,并与其中的场景进行结合。这种结构性影响的本质,同样是需求的迁移,而带来的结果是,行业获得了新的发展思路。
基于这样的视角,为了更形象的理解上面提到的概念与其中的关系,我们用一张“光谱图”来形象表示其内容:
这里的定义指的是在信息技术出现前,真实世界中人们使用真实的资源,生产并消耗真实的物品。在这一阶段中,我们发生的所有交互都是建立在真实世界中的。
从信息的流动方向来看,我们的信息来源于真实世界,最后输出的方向也是真实世界。比如,我们消耗矿石冶炼金属,再使用这些金属进行劳动、开采、战斗、运输等等。其最终的作用对象则是真实世界中的对象。
从直立人到智人,再从智人到信息技术出现前的人类,这个过程中,动物和人类一直都是在和真实世界中的物体发生交互,也就是说,信息的提取和传递都是来源于真实世界、终止于真实世界并沉淀于真实世界。
举个例子,人们在过去会从大自然中获取原材料,使用它们制作工具用来做饭、生产衣服、打造货币进行交易等等;到了信息技术出现前的时代,我们仍然是按照这样的方式和真实世界交互。不同点在于,由于过去的技术积累和组织方式的改变,我们能更加有效地消耗、组织与生产信息,对应到输出层面就是,我们可以制作更加细致且有差异化的物体和产品。
而这样的结果则是,我们能够以新的方式获取信息,也能以新的方式对信息进行组合。来源于真实世界中的信息利用效率获得了提升,从而让我们的需求发生了所谓的“升级”。本质上来说,是我们对于信息的需求提高了。
当我们对于信息量的需求越来越高,来源于真实世界的信息量越来越大,就会涉及到一个信息的获取效率问题。对于“获取”这个行为来说,它有两个阶段分别是:传播和接受。
广义地来看,信息本身的存在,并不会依赖于信息的传播方式、路径和对象,信息本身只和信息载体有关。也就是说,在我们从真实世界获取信息时,我们仅仅是通过某种合理的方式,获取了原本就存在的信息。因此,信息的获取效率,本质上是这两个效率:
真实世界中的信息生产指的是:我们从真实世界中的对象获取原生或处理过的信息。我们看到太阳、扔出石头、升起火堆、收获粮食等等,都是在和真实世界的对象发生交互过程中获取了原生的信息;而处理过的真实世界信息则是,人与人之间发生的对话、文字、绘画、声乐等交流。
同时,不同物体有着不同的信息,比如石头、矿石等是由不同化学元素构成的物体,同时也具有不同的形状、坚硬程度、色泽等特征,这些都是信息。但不是所有的这些信息我们一开始就可以直接获取,需要一定的工具和方式,这也就涉及到信息的传播。
除了真实世界自带的信息传播方式,比如刮风、下雨、日夜更替,更多的情况是:人类打造了某种工具或发现了某种途径,可以让原本就存在的信息可以被接触到。
事实上,在真实世界中,有两种传播方式,一种是人们直接接触物体传播的信息,另外一种传播是建立在与其他人的交互中。第一种方式相对来说比较简单,只要有对的途径就能接触到;而第二张方式则需要交互过程的发生。
但并不是我们发现了某种信息,就能“理解”它为我们所用,因此会存在信息接受的问题。就比如我们知道了不同矿石的信息,但如果想要利用它们,我们需要一种类似于“翻译器”的东西让我们了解到,基于这样的信息,我们应该做出什么样的决策来和其发生对应的交互,例如使用、抛弃等。
建立在共识和知识积累的基础上,人们通过第一种传播方式能有效地让信息被接受;但第二种传播方式则会遇到维特根斯坦的“语境问题”:在面对同样的表达时,人们会由于信息背景的不同,以及和信息发生交互的场景不同,产生不一样的信息接受程度。这也就影响了信息的接受效率。
只有当获得了一定的限制后,信息的接受效率才会显著的提高,从而在信息被接受后人们才有可能获得某些能被称为“共识”的理论或者知识,帮助人们推进第一种传播方式下的信息接受效率,进一步更有效率地认识世界。
与此同时,我们知道真实世界信息本身的存在是一定的,因此与其说是“我们发现了信息”,不如说是“信息发现了我们”,只不过为了信息可以发现我们,人们使用了各种工具和方式去构造具体的途径。
基于宇宙大爆炸理论,宇宙在奇点发生前具有无限大的质量和物质,也有无限大的信息。事实上,物质和信息是对应的。真实世界的信息本身就存在,我们对于真实世界的发现越来越深,从而获取的信息就会越来越多,信息本身并不会因为我们做了什么组合而改变。
当我们没有使用正确的方式去发现,这些更“深”的信息也就不会传播到我们这里;同时,就算信息传播到了我们这里,我们也需要以正确的方式才能理解。
由于广义的相关性,这些信息每时每刻都在进行组合。在这个过程中,我们会对这些组合创造新的理解方式,比如逻辑体系。信息本身只和它的载体有关,组合方式是我们理解信息的途径。
人类已经使用了很久的文字来理解、表达和传递信息。某一句话的载体,看起来是文字,其实是人们大脑里的化学物质在那个时刻的组合方式。文字是我们理解信息的途径,正因为我们找到了文字这种途径去理解这种物质组合所代表的信息,且长时间被我们验证有一定程度合理性,所以我们认为文字可以作为一个“近似的载体”用于传递信息。举个例子,ABC 三个字母的排列组合,就是它们就是传递的信息。
再比如数字,如果把数字也看作为一种“近似的载体”,它能让我们在接受信息的过程中,更好地理解信息,也能方便传播,所以流传了下来。不管是二进制、十进制还是其他的方式,在面对同样的一个物体是,人们会有不同的表达方式,但想表达的是同一个信息。
比如,当我们把 5 个苹果放到另外 5 个苹果中,使用十进制的阿拉伯人觉得一共会是10个,使用二进制的代码会觉得是1010个。
假设我们确认了弦理论的正确,我们想在真实世界中添加信息,则只用增加物质就可以,方式则是增加弦或者其他形式的物质,让它和真实世界中已有的物质和信息发生组合,信息就增加了。
当信息技术出现后,我们获取信息的起点和终点就发生了变化,我们可以从真实世界获取信息,也可以从虚拟世界获取信息。而前提是我们往虚拟世界中已经输入了信息,或者是虚拟世界里自己产生了信息。这两种方式事实上是作为“存在”的意义,为虚拟世界提供了信息的源头。
我们先讨论这个问题:为什么原生的真实世界有了发展后,人们首先接触的是数字化的真实世界呢?原因在于,数字化的真实世界,事实上是人类通过信息技术手段,将真实世界中的部分或全部信息,移植到数字化空间里,再通过不同的媒介来获取数字化信息。
这里其实是有一个隐含的过程,也就是人类发明了真实世界和虚拟世界之间的信息沟通方式,也就是二进制编码,同时它也是两个世界之间信息的翻译规则和方式。真实世界的信息,在机械和电力等可重复且稳定消耗的资源消耗下,被解构成1和0这样的可被计算机所快速理解的信息。
事实上,这种编码规则建立了两个世界间的信息传输方式,因此真实世界的各类信息都可以被转化为代码的方式,输入到计算机中呈现。当然,仅仅有这一个底层规则是远远不够的,还有另外两方面的原因:
以人为作为分析的中心,我们在真实世界中接受到的主要信息类型,来源于我们的五大感官:视觉、听觉、触觉、嗅觉、味觉。其中,视觉信息占了大脑获取所有信息的 80% 以上,如果不考虑大脑内在的信息处理逻辑,数字化的视觉信息是让我们“感知”到虚拟世界的最直观且最有效率的方式。
因此,当我们“创造”出真实世界和虚拟世界间的信息交换方式时,为了更好的认知虚拟世界,我们一开始会将视觉端的呈现放在优先突破的位置,同时为了实现这样的视觉效果,我们也会在底层硬件和相关软件设施上进行突破,从而尽可能地将真实世界的信息输入进去。
按照把真实世界的信息展示在虚拟世界中的逻辑,首先我们需要提取出真实世界的信息,然后让计算机通过“转换机制”将这个信息传输到虚拟世界,再通过其他方式让在虚拟世界中的信息被真实世界中的我们所接受到。
对于我们看到的视觉图像信息来说,这个过程其实就是“计算机视觉”和“计算机图像”技术的结合应用。而对于文字来说,虽然在信息传输或储存层面它本身包含的信息则比图像所少挺多,但事实上文字包含的信息非常大,它是人类进行有效语言交流的载体之一。
站在信息传递的角度来看,图像和文字都可以代表人们对于真实世界和虚拟世界的表达。只不过由于技术的限制,在虚拟世界中,最早的视觉信息是通过代码、文字的方式呈现的,后来才出现了图像、视觉等技术,我们才能逐渐地在虚拟世界还原真实世界的信息。
从互联网到移动互联网,再到物联网,我们在社交、媒体、电商、物流、协作办公等非常多的领域中正在加速地将真实世界映射到虚拟世界中。
我们在使用浏览器看的网页,是人们对于真实世界信息的整理和组合(当然现在也有关于游戏这种原生的虚拟世界的信息);我们使用的各种 App 都会包含账户信息,这种账户信息不一定会包含真实世界中我们每一个人的全部信息,但多少会有一些代表性的信息,比如头像、昵称、性别、简介等;我们使用的流媒体(同样,随着虚拟世界的发展,电影、游戏等创意信息也会出现在各处),也是人们将真实世界中的信息以图片、长短视频的方式,发送到虚拟世界中;我们使用的电商平台,更是将真实世界中的商品信息数字化;对应的物流体系,同样是将真实世界中物品自身参数、地理位置、配送状态等信息传递到了虚拟世界中……
同时,“移动互联网”和“互联网”的一个重要区别,则是“移动”的形式提高了我们将真实世界信息向虚拟世界中的输入效率。如果将每一个联网的节点视为一个信息入口,那么在移动互联网时代,不仅入口的数据大量增加,入口本身“移动”了起来,从而能以更高的效率覆盖真实世界的信息,并传输到虚拟世界中。
基于逻辑的完备性,我们知道虚拟世界中其实可以分为两个部分,一个是真实世界的映射,另一个是更加虚拟且原生的虚拟世界。在这个世界中,一切物体都是原生于虚拟世界且一直在虚拟世界中存在。
从信息的角度来看,我们知道:信息本身的存在,并不会依赖于信息的传播方式、路径和对象,信息本身只和信息载体有关。同时,虚拟世界中的信息来源有两种:
一种是来源于真实世界映射的这部分信息,既受到真实世界中人们对于其本身信息获取的限制,也受到传输方式的限制。比如地球上某些角落就是没人知道,很难有机会通过各种终端被传输进入虚拟世界;同时就算是广为人所知的一些物品,人们也无法严格地将组成它的内部结构数字化。所以这部分信息,在数字化的过程中一定会有部分丢失。
另一种是虚拟世界原生的这部分信息,它们本来就是诞生在虚拟世界中的,不会收到任何在传输的限制。也就是说,这部分信息是完完整整的通过数据的方式进行呈现的。对于虚拟世界内的任意角落、物体,都可以被代码的方式所定位与表现。因此,这种原生的信息是绝对数字化的,同时也可以通过代码和各种来完整地获取它们。
整体上讨论完虚拟世界的信息来源后,我们也会发现在“原生的虚拟世界”中,信息也有两种不同的来源:
因此,如果需要一个更加明确的定义来描述原生的虚拟世界,也许是这样的:在这个虚拟世界中的所有信息都是虚拟原生的,这些信息要么不存在于真实世界,要么是由其他虚拟信息所“创造”的。
对于“原生的虚拟世界”来说,第一个虚拟更多指的是“数字化”,第二个虚拟更多指的是“在真实世界中不存在的、虚构的”。
举个例子,创意设计师使用各种数字化工具进行创作时,在虚拟世界里构造出来的各种形象、场景、特效等,事实上都是虚构的;大部分电子游戏其实也是属于原生的虚拟世界,它们的生产和消耗都是在虚拟世界中完成的,同时几乎每个电子游戏世界都是和真实世界不一样的。
相比起更加通用和普遍的生活场景,游戏由于海量且结构化的数据,往往是许多人工智能和大数据相关技术的应用和落地场景。同时游戏化和其他领域的结合也迸发出了新的活力与可能性,针对不同产业中所结合的游戏化发展方式,将其定义为“虚拟化的发展路径”会更加准确。
同时,在虚拟化发展的背景下,人们意识到了虚拟内容的巨大体量和发展前景,也在不同的虚拟内容生成领域,有了对应的技术支持。由于视觉是人们获取信息的最重占比,因此在图像和视觉领域的技术率先发展下,我们能以过去不能想象的效率在虚拟世界中产生图像信息,并让它们被我们直接观察且体验到。
比如,2D/3D 设计领域的动画、建模、shader、渲染、特效、摄像机等,在配合 GPU 的图像性能,让我们能“看着自己在原生的虚拟世界里进行交互”。如果还能配合 VR、AR 等设备,这种极强的沉浸式体验感,就能更强烈地冲击着我们的主要感官,让我们“认为”自己真的已经在虚拟世界中了。
回到信息的获取逻辑,从信息的存在、传播和接受三个层面继续分析,我们会发现:在虚拟世界中,一切都是由代码组成的,无论是空间地址还是具体的颜色、形状或动作等内容,都可以用二进制的表达方式来进行精确表现。因此,虽然真实世界中不一定所有信息都是可获取的,但虚拟世界信息的可获取程度几乎是 100% 。
上文我们提到,真实世界的物质和信息是有限的,并决定了我们在真实世界中能获得的信息本身。由于我们暂时无法了解到真实世界中的底层规则,也就无法在真实世界中添加物质和信息。但虚拟世界则不一样,我们创造的编译方法定义了虚拟世界的底层规则,数字化内容都是建立在 1 和 0 之上。如果我们想在虚拟世界中增加物质或信息,我们只需要增加数字化内容即可,也就是增加 1 和 0 的个数以及它们的排列组合方式。
当然,这里也必须讨论另外一个问题:如果真实世界的物质和信息是有限的,那么由真实世界的物质组成的人类,使用了由真实世界物质组成的计算机,创造出了一种逻辑层面的编码规则,在计算机中打造了数字化信息,它们是否还属于真实世界的物质和信息呢?
这里又得引用爱因斯坦的观点:科学理论是人类心智的自由发明,在理论物理的根本方法中,没有发现这个词。结合信息的角度,既然在真实世界中物质和信息是一定的,我们对于真实世界的认知取决于我们是否能找到一个正确且合理的路径,从而去接触到不同的信息组合。
对于科学理论来说,发现信息之间的组合关系属于发明,发明的内容则是:不同信息组合的认知路径。也就是说,作为人类,我们发明了科学理论,获得了信息组合的认知路径,从而可以发现信息本身。比如,“逻辑系统”是一个发明,而利用推理找出逻辑关系就属于发现,发现的对象是真实世界的信息。
按照这样的分析方法,“二进制编码系统”首先是一个发明,对同一个真实世界的对象,除了日常的描述方式,我们可以用另一个逻辑体系去描述。也就是说,我们发明了基于二进制编码的逻辑方式,去理解真实世界的信息组合。从这个角度来说,我们仍然是在真实世界里进行信息的发现。
另一方面,“二进制编码系统”在解释已有的真实世界信息时,也带来了另外的信息。举个例子,假如 110101010101 代表一个苹果,事实上我们是将“苹果”这两个字翻译成二进制表达方式,使用先验的逻辑达成对真实世界信息的共识;但 110101010101 本身代表什么信息呢?
在真实世界中,它代表的是“苹果”这个对象的信息,但由于代码本身在虚拟世界中才有具体的指向,因此这段代码指向的是虚拟世界里的物质和信息,只不过我们偶然创造了一个“逻辑系统”发现了虚拟世界。也就是说,虚拟世界本身就存在。
这也解释了上文我们所说的,虚拟世界中的原生信息要么不存在于真实世界,要么是由其他虚拟信息所“创造”的。
同时非常有趣的一点是,真实世界无法创造新的物质和信息,因为我们不知道最底层的规则是什么;但虚拟世界中,底层规则是我们创造的,因此逻辑上来看,我们可以在虚拟世界中创造任何我们想要的物质和信息。实现的方式也很直接,我们只需要增加 1 和 0 的数量,它就会自然而然地增加非常多的信息组合。
既然数字的重复计算就能产生新的虚拟物质和信息,如果我们能教会计算机学习去创造物质和信息,那么虚拟世界就是一个具有高度创造性的无限世界了。因此,为了将这一类能够“自主生产信息”的信息和“来源于真实世界的数字化信息”信息分开,我们才将整个虚拟世界做了上文的区分。
按照上文讨论的范畴,“现实化的虚拟世界”本质上还是属于真实世界的,只不过在这个分类里,现实化的虚拟世界里的对象是将虚拟世界里的形象给实体化了。
举个例子,最传统意义上的书籍,里面有非常丰富的虚构世界和故事,最后以文字和纸的方式呈现;电子书籍则都是虚拟世界中的物体,如果是关于真实世界中的内容,则该电子书属于数字化的真实世界,如果是纯粹的虚构或者架空世界,则属于原生的虚拟世界;桌游也是一个代表,狼人杀、龙与地下城、各种剧本杀等,都是在真实世界体验虚拟的故事;另外还有众多手办、海报、Cosplay 等等,都是将虚拟世界的形象或内容在真实世界中呈现,完成“实体化”的过程。
这部分的信息逻辑比较简单,在真实世界的信息获取逻辑上,多了一个信息来源:虚拟世界里的数字化信息。但是由于真实世界的信息表达受限于真实的物质,因此这部分物质和信息仍然没有对真实世界中物质和信息的整体体量造成影响。
现在我们已经对这四个世界进行了描述和讨论,接下来我们以更宏观的视角来描述真实世界和虚拟世界之间的动态关系,并辅以产业和市场的发展来进一步讨论。
按照上文讨论的范畴,“现实化的虚拟世界”本质上还是属于真实世界的,只不过在这个分类里,现实化的虚拟世界里的对象是将虚拟世界里的形象给实体化了。
当前我们存在且生活的这个世界,是一个随时都在动态变化的复杂结构体。在我们所接触到和没有接触到的物体表象背后,存在一些内在的规律在驱动着我们的世界持续地运转。无论是相对论、量子力学还是弦理论,它们都是朝向那个“终极规则”前行。有一些科学家们相信,在未来的某一天,我们能在宏观和微观层面统一我们的认知逻辑,从而了解这个世界的原始规则。
这样的探索路径其实假设了“终极规则”的存在,如果按照人类发明的逻辑体系来进行推导,这个“终极规则”诞生了一系列的物质。在现有的技术水平下,我们已经不断地突破了对物质组成的认知,不断有更小的物质被发现。
在这里,我们关注的重点,不是物质能被分到多小从而接近那个“终极规则”,而是物质经过组合成为了各种物体。在千万年的发展过程中,世界上出现了各种物体:有些是有生命的,有些却没有(至少暂时被我们这样认为)。在这些物体里,我们又认为生物的基本特征是:生物能够新陈代谢及遗传。
事实上,有很多方式可以对世界上的物体进行分类,这里我们选择了一个并不是很常见的分类方式:根据物体是否能进行“主观决策”,分为能够“主观决策的物体”和“其他物体”。原因在于,能够主观决策的物体,在底层的“终极规则”的约束下,能根据自己的判断和决策,主动地参与到整个空间的信息改变中。
目前看来,人、动物和其他我们尚未发现的物体(也许这里说成生物会更合适,但不能排除没有生命的物体就无法主观决策),是能够进行主观决策的,而我们所关注的重点在于我们自己,所以在这个图中,我们仅讨论人。
人们做的研究和经验表明,作为个体的人,会表现经济学中“理性人”的决策特征;但作为群体和社会的人,既会表现出单人的决策特征,也会表现出群体效应。在这里,我们关注的是,人的主观决策的能力,会受到群体效应的影响;至于具体多少人算群体,多少群体可以被认为是社会,不是这里的重点。
另一方面,无法主观决策的物体就形成了空间。在一定的空间内,人与物体的集合则成为了交互的场景。同时,作为个体的人、群体的人和社会的人,也会出现不同类型的需求。比如,虚荣和认可这一类需求,只有在个人可以连接到群体或社会时才会出现。
总的来说,不同类型、不同数量的物体和不同数量的人,就会产生不同类型的交互场景和对应的需求,从而诞生各种市场并形成产业。
在信息技术出现前的真实世界中,人们通过发现或组合物体,获取“新”的信息,并在不同的场景下,将这一类信息传递给不同需求的人、群体或者社会,从而产生信息的发现价值和信息的传递价值。在这个过程中,技术的进步提高了人们发现、传递和接受信息的效率,也因此获得了信息的传递价值和信息的接受价值。
基于上文中信息的获取逻辑:发现、传递和接受,人们获取了这三种对应的价值后,又将其转化为技术突破,进一步地推进真实世界的发展,并逐渐接触到了虚拟世界的边缘。
在虚拟世界中,最底层的规则是 1 和 0 组成的,然后在此基础上形成了代码和各种技术框架,接着人们利用这些代码,打造了一系列的数字化对象。我们所看到的各种电子游戏、音乐、图片、浏览器等等,都是虚拟世界里的数字化对象。
同样,我们参考真实世界中物体的分类方法,通过判断数字化对象是否能“主观”决策,来对它们进行区分。事实上,这样分类的意义,不仅为了和真实世界中的方式保持统一,也符合了人们对于数字化智能体的探索与期望。
在 1950 年的这篇 Computing machinery and intelligence 论文里,数学家 Alan Turing 详细讨论了“机器能否拥有智能”的问题。事实上,图灵成功定义了什么是机器,但他却不能定义什么是智能。同时,他自己也说过“人类自己就无法反过来成功伪装成机器”,并提出了一个反问“难道被认为拥有智能的机器,就不能表现出和人类不同的行为吗?”。
与此同时,大部分的人工智能相关研究,都是在关注:如何模拟人类的纯粹智能活动,而不是全部的脑力活动。或者我们可以理解为,我们对于智能体的期望是:能像人一样去创造。但反过来看我们自己,人类能进行创造的前提是可以按照自己的意愿进行决策,也就是主观决策。
因此,我们将虚拟世界中的对象分为“可以主观决策的物体”和“不能主观决策的物体”,从而区分其智能性。
理想状态下,可以进行“主观”决策的智能体能够在虚拟世界中自主地创造信息和物质,而其他的非智能体既可以是来源于人为设计,也可以是来源于智能体的主动生成。因此,这些非智能体的组合,也就构成了虚拟世界的“空间”。这里的空间更多指的是:我们在虚拟世界中可以感受的物理空间,而不是数字空间。
但现实是,我们目前的 AI 技术还没有实现上面所提到的可以“主观”决策的智能体,因此会存在一些弱化版本的成果。最弱化版本的智能体是“镜像体”,也就是人们在虚拟世界中的形象映射。
之前在数字化的真实世界中也提到了,我们在互联网上的各种账号就是一种“镜像体”,这种虚拟形象多以数据呈现,比如姓名、年龄这些比较直观的描述,就是由用户自己往虚拟世界中提供信息;而关于一些喜好、偏好等描述,就是通过给用户打标签的方式完成,比如浏览过什么类型的商品、退出后的路径是什么等等。
事实上,这就是大数据和推荐算法的效果,同时这部分信息可以理解为是一种逻辑层面的信息。通过数据来将真实世界中人的各种维度信息,形成一系列的逻辑结构,上传到虚拟世界中,逐渐丰富“镜像体”的信息。
另一方面,除了逻辑端信息,一个完整的“镜像体”还需要有图像端信息,就像了解一个人不仅需要听他说的话、看他做的事,也需要更加直接地知道他的体型、长相等。在人们最开始进入虚拟世界时,技术水平限制了“镜像体”的表现程度。连游戏这种需要非常强的沉浸式体验效果的虚拟体验,都只能在一开始用非常简单的图像来表示虚拟的形象和内容;其他领域应用就更加不会过多考虑图像了。
但随着技术的突破与进步,我们可以在虚拟世界中实现更好、更精致的图像了,也就是说我们在虚拟世界里创造了新的信息。根据上文我们知道,新的信息会满足新的需求,从而带来新的价值,这也是驱动行业发展的重要原因之一。
在这个过程中,我们不断的把自己在真实世界中的信息输入到虚拟世界中。与真实世界不同的是,在虚拟世界中,我们可以有很多个虚拟形象。如果这些虚拟形象的信息是和真实世界的信息完全一致,那就是属于数字化的真实世界;如果是完全不一致,那就是属于原生的虚拟世界;而一部分相同,一部分不同时,则属于两个世界之间的过渡阶段。
因此,我们也将从“镜像体”到“智能体”这一部分,统称为“虚拟形象”。只不过由于技术的发展,限制了“虚拟形象”的呈现方式与信息。一开始的虚拟形象是静态的,后来变成了可以动态呈现的,但需要消耗非常多人力和物力。
事实上,静态图像是“虚拟形象”的最初阶段,那基于人工预先设定的动态交互规则所打造的“动态形象”则是“虚拟形象”的进一步发展。
人们只需要针对不同的用户和场景,设定不同的交互反应,比如对话、动作等,就能让虚拟形象动起来。但这无法做到真正的动态,因为这种交互是基于规则和设定来驱动的,只要用户没有按照预先设定好的方式进行交互,则虚拟形象就无法有对应的反应。
例如,玩家和游戏中 NPC 对话或者发生动作交互时,NPC 们只会有固定的几种反应方式;各种虚拟偶像在和用户交互时,用户说了超出设定的对话时,虚拟偶像则会很“讨巧”地用一些固定应答来糊弄过关。
之前我们提到了,信息的增加会带来价值,如果能让虚拟形象产生更多的信息,则会创造更多的价值。从“镜像体”到“智能体”的这条发展路径,是由于技术的突破来驱动的。如果人工智能可以让用户和虚拟形象的交互变得非常动态,这个过程也一定会诞生非常多的信息和价值。同时,这样的动态虚拟形象也更加偏向于“智能体”,从而可以在虚拟世界中进行主观决策。
在这条发展路径中,每一个阶段的“智能体”都会产生不同量级的信息,结合不同的交互场景,进一步产生更多的信息。
当我们用同样的假设条件和推理逻辑对真实世界和虚拟世界的结构进行讨论后,我们会发现目前虚拟世界的信息正在加速增加,它们不仅来源于真实世界的信息,也来源于虚拟世界原生的信息。
在这个过程中,需要信息传递的渠道,也需要对应的工具,才能提高虚拟世界中信息的生产效率。同时考虑到不同场景的交互方式,任何能增加信息传输效率的方式都会产生价值。
比如,Agora 声网就是打造了通往虚拟世界的高速公路,让真实世界的信息能更高效的传输到虚拟世界;Adobe、Autodesk 等创作工具,也是连接真实世界和虚拟世界的通道。使用他们创造出来的作品,无论是 Photoshop 这种可以在照片上修改创作,为“数字化的真实世界”增加信息,还是 Unity Engine、Unreal Engine 这种直接在“原生的虚拟世界”中进行创作,从而增加信息……
现在我们的发展处在“数字化的真实世界”和“原生的虚拟世界”之间,需要依靠“智能体”的结合才能进一步地靠近“原生的虚拟世界”。在数字化的真实世界这个部分中,我们能在常见的一些领域中看到一些不是很完整的“智能体”的出现,带动了人们新的需求,从而产生新的价值。
比如在社交、社区、直播、电商等领域的 Lil Miquela、Zepeto、默默酱、洛天依等,就获得了非常不错的反响。
当然这仅仅是一个开始,在未来会有更多的“智能体”融入目前的场景中,从而帮助我们进一步地走向“原生的虚拟世界”。
人类的好奇心驱动着我们不断地探索这个世界和宇宙,我们我们也经常会对目前的这个世界进行一些猜想。在二进制规则的帮助下,我们创造或发现了虚拟世界,然后进一步地在虚拟世界中增加信息,从而又反过来帮助我们加速地探索真实世界。
事实上,如果按照假设认为“我们目前生活的这个真实世界,具有一个最底层的规则”,那么正是这样的规则构成现实世界中的所有物质和物体。最前沿的探索中,有一个理论叫做弦理论。之所以它会吸引这么多注意,大部分的原因是因为它很有可能会成为大统一理论。
将弦理论和宇宙学联系起来后,就出现了平行宇宙或多宇宙模型。我们目前的“真实”宇宙就生长在一个三维的膜上,同时这个膜其实是存在于一个更高维的超空间(hyperspace)中。
另外,针对目前我们生活在的这个真实宇宙中的虚拟世界,以同样的方式分析的推演后,会得到之前我们讨论过的元宇宙(Metaverse)模型。在未来我们会有非常多的虚拟世界,产生非常多的信息,从而反哺真实世界。不同的虚拟世界在被联通后,又会成为元宇宙。
当然,这只是一个猜想,并没有经过严格地科学验证后的依据;但这并不影响这个世界的有趣,更不会停止我们的好奇心和持续探索的脚步。
本文也提到了这套分析框架的一个核心点: 物体是否具备自由意志? 正因为有这样分类方式,才有后面一系列的推理、分析和结论。
我们都相信自己在 先天 是完全自由的,甚至涵盖个人行动,而且认为在任何时间他都可以开始另一种生活方式;但在 后天 ,我们发现自己并不自由,而是受制于各种规则和物品。
在真实世界中,我们也许无法知道: 绝对的自由是否存在,或仅是一个形而上的思考方式。 但在虚拟世界中,站在“ 智能体 ”的角度来看,当他们能自主地创造虚拟世界里的信息和物质时,他们确实有主观决策的能力,但他们是否有自由意志?
在我们看来,虚拟世界中“智能体”的主观能动性其实也是 受限于虚拟世界的底层规则 ,那推及到我们自己,我们的自由意志是否也受限于真实世界的底层规则呢?
如果按照我们的归纳和演绎法去推理,至少也需要让虚拟世界中的“智能体”能够 创造出下一层嵌套的虚拟世界 ,才能有一定依据。从技术上来说,也许是可以实现的。但如果这样的话,是不是又反过来暗示了,我们目前生活的这个真实世界,其实也是一个模拟的虚拟世界呢?
一个很重要的点在于, 人类的大脑是有认知缺陷的 ,我们认识到的逻辑系统既帮助我们一步步地认识目前这个世界,同时也限制我们认识这个世界的其他方式,同时我们也无法理解为什么会有逻辑这个东西存在。
也许,在探索虚拟世界的过程中,我们不仅能知道什么叫做“ 自由意志 ”,更能知道我们从哪里来,要到哪里去。
我们逆流而上,被不断推回。直至回到往昔岁月
Arnold, D., 2002. Th e age of discovery, 1400-1600. Psychology Press.
Becker, K., Becker, M. and Schwarz, J.H., 2006. String theory and M-theory: A modern introduction. Cambridge University Press.
Bethke, E., 2003. Game development and production. Wordware Publishing, Inc..
Campbell, J., 1982. Grammatical man: Information, entropy, language, and life (p. 265). New York: Simon and Schuster.
Einstein, A., 1934. On the method of theoretical physics. Philosophy of science, 1( 2), pp.163-169.
Fitzgerald, F.S., 2007. The great gatsby. Broadview Press.
Gamow, G., 1948. The evolution of the universe. Nature , 162(4122), pp.680-682.
Gray, R.M., 2011. Entropy and information theory. Springer Science & Business Media.
Leiner, B.M., Cerf, V.G., Clark, D.D., Kahn, R.E., Kleinrock, L., Lynch, D.C., Postel, J., Roberts, L.G. and Wolff, S.S., 1997. The past and future history of the Internet. Communications of the ACM, 40 (2 ) , pp.102-108.
Lestringant, F., 2016. Mapping the Renaissance world: the geographical imagination in the age of discovery. John Wiley & Sons.
Maslow, A.H., 2013. Toward a psychology of being. Simon and Schuster.
Schroeder, R., 2008. Defining virtual worlds and virtual environments. Journal For Virtual Worlds Research, 1 (1 ) .
Salmon, W.C., 1984. Scientific explanation and the causal structure of the world. Princeton University Press.
Schopenhauer, A. and Saunders, T.B., 2004. The wisdom of life. Courier Corporation.
Schopenhauer, A., 2012. The world as will and representation (Vol. 1). Courier Corporation.
Schopenhauer, A., 2013. Über die Freiheit des menschlichen Willens/Über die Grundlage der Moral: Die beiden Grundprobleme der Ethik. Kröner, A.
Sivak, M., 1996. The information that drivers use: is it indeed 90% visual?. Perception, 25 (9), pp.1081-1089.
Steinkuehler, C.A. and Williams, D., 2006. Where everybody knows your (screen ) name: Online games as “third places”. Journal of computer-mediated communication, 11 (4 ) , pp.885-909.
Turing, A.M., 2004. Computing machinery and intelligence (1950). The Essential Turing: The Ideas that Gave Birth to the Computer Age. Ed. B. Jack Copeland. Oxford: Oxford UP , pp.433-64.
评论区
共 10 条评论热门最新