从一年前开始听魔兽故事电台,我玩过《魔兽世界》,但不敢自称老玩家,因为从没有深入过。虽然觉得也乐在其中,但对比于一些雕琢表现力的单机游戏相比不够细腻。不过自从听了这系列电台节目,突然感觉之前游玩的一幕幕都被赋予了意义。逆向的冲击往往并不像正向体验一般循序渐见,而是信息量很大。
这种感觉有点像一个失忆的人,迷茫中经历了很多不明所以的事情后,突然间恢复记忆了,原来经历的种种都是这么一回事。
听台过程很漫长啊,陪着我日复一日的做着公司的“垃圾手游”,伴着我看网上对国内从业者的种种质疑,逐渐萌生了不计成本做一个精致的魔兽角色的情绪,致敬一下这个被我误会的伟大游戏,同时也为自己心中尚未磨灭的游戏梦正名。
但是因为诸多原因,就如同魔兽电台拖更一样,我这个作品也迟迟未能最终完成。现在终于有些可以拿出来看的东西了,分享给大家,感兴趣的朋友可以多多交流,也借此激励自己不要半途而废(目前进度大概80%)。
我本身有着多年的影视游戏开发经验,知道国内行业上层水平其实并非如玩家感官的样子,只是有时候七颗龙珠真的很难凑齐。所以这个作品的最初想法就是不计成本地展现技术,之所以说不计成本也不是说我做的有多好,而是我想做一个完成的角色,包括从模型,材质,绑定,肌肉,表情,动画都以我自己所能地最高水平制作,尽可能不让任何一个环节瘸腿。我也仅借这个作品完成的过程,对一些普通玩家可能不明所以的部分做些小小的拓展科普。
很多玩家在玩国内外游戏,尤其是写实风格的时候,能很直观的感受国外3A的表情更为精致,国内的总差着点什么。所以很多行外的玩家就猜测这背后有什么高深的技术么,我们到底和人家差了多少呢。再加上国外一些大公司展示技术的视频其实经常遮遮掩掩,很容易让人得出一些错误的概念。
早期国内硬件设备较差的时候,经常有一种解释,说国内表情,动作差,是因为我们没有动捕设备。然而现在动捕设备也烂大街了,怎么还是有那么大差距了,到底差在哪里呢?动捕动捕,到底动的什么,又是捕的什么呢(这里指表情捕捉)?
例如下面这张图,大家看到的就是一个人脸上布满了标记点,有摄像头来采集这些点的位移。于是人们很容易猜测一个原理,把真人标记点的位移信息记录下来在输入给角色的脸部模型的顶点,让他跟着动不就行了吧。
错!并不是这样,因为你想每个人的脸部的结构都是不一样的,千差万别,提法小姐姐和隔壁王大婶,王大婶一笑嘴角横跨左耳到右耳,这个位移信息要是放到提法脸上,emmm,还记得生化里表情值500%的样子么。
而实际原理是这样的,老外呢,其实都比较轴,中国传统绘画中会觉得有些东西之所以传神,那定是些意会不可言传的感悟。但是老外偏偏要较真,觉得人的表情一定是有一个底层逻辑支撑的。
没错,最终老外还真就研究出来了一套基于生物学的理论基础。就是大名鼎鼎的FACS,全名角Facial Action Coding Syetem,翻译过来叫面部行为编码系统。
了解过《Lie to me》美剧的朋友也许会知道这个理论。其实这个理论最开始诞生也不是为了做表情捕捉的,而是用来审讯犯人的,后来应用才延伸。
简单说呢,他们就是把人的面部所有肌肉脂肪表皮进行详细的研究,拆分成了若干个运动单元,然后做了大量的统计归纳之后。对每个运动单元都有了非常严谨的形态表述,给他们都编上号,并且进行了参数化处理。而这个参数化就是关键信息了,它把那些原本只能用传神,精妙等形容词描述的表情,传化成了具体的可量化的系统。
那么问题来了参数化是个什么东西呢,他又是怎么帮助我们进行表情制作和捕捉的呢。举个例子也许就清晰了。例如我们常做的皱眉运动,在FACS中这个运动的代号叫AU4,从AU4刚刚可以被观察到,到AU4做到极致一共分为5个强度。对于我们普通认知会觉得不就是皱眉和不皱眉两个强度么,中间过程是很模糊的概念。
但是科学家们经过统计和研究,把这个运动的外观变换拆分了5个阶段,每个阶段都有标志性的特征改变,这些改变包括皮肤得隆起,凹陷,拉扯,聚集,以及皱纹的产生条件等等。
那么有了这些参数化的基础,表情捕捉的逻辑也就呈现出来了。
采集:摄像头把演员的表情标记点的位移信息记录下来。
结算翻译:计算机经过算法翻译,把这些位移信息翻译成,类似运动单元AU4— 强度0.75这样的参数化信息。
输入传递:然后输入给我们的目标角色,而目标角色本身也已经设置好了每AU信息所对应的面部形态,接收之后,例如也把角色对应的AU4运动单元调节至0.75。这样就完成了一个完整的传递
于是在此也可以回答我们之前提出的问题了,动捕,捕的是什么,动的又是什么。从逻辑得角度讲,捕捉的是演员的每个面部运动单元的参数化信息,而不是位移。动的是角色面部的AU形态,而不是直接驱动骨骼或者顶点。
确实有很多大作游戏是以骨骼为驱动对象,但是他的骨骼其实是由AU形态映射过去的,以此来节约一些机能开销,这是另外一个话题,有机会可以展开讲。
说到这里其实对于有一定了解的人来说可能觉得并非新奇,但是为什么国内很多厂商做不好呢。总结以下几点吧:
首先成本。通过上面的概念,我们知道游戏角色想应用FACS原理制作,就得把每个独立的AU形态做一遍,这些AU形态有多少呢,做全了拆分下来,差不多300多个。不拆分的形态也有150以上。所以想想国内一些游戏资产的制作周期,实现起来还是很难的。
第二是质量标准,150个AU光是记住理解就很难了。然而角色做表情时,是多个复合AU组合运动而且连续变化的,你还要保证他们之间的组合和过度自然流畅,互不冲突。除了满足动捕输入,还要方便动画师后期修补动画,合理的整合到控制器上。
然后是项目需求,其实所有的技术都是应对项目而生的,国内游戏行业在之前很长一段时间产生了一种内卷效应。凭借着庞大的体量,在一个很低的技术水平就可以维持运转。导致对于技术尝试的风险无人愿意买单,所以相应的人员锻炼也有所欠缺。部门之间对于需求的沟通不畅也是重要的原因。
表情制作流程上其实还有很多关键的细节制作技术,以此来让角色表情更加真实可信,如果有机会再给大家更多的展开吧。限于篇幅就介绍这些。
除了表情部分,对于裸露部分肌肤的角色,合理得身体肌肉运动也是体现真实感必要条件。尤其是国外的一些大厂CG几乎都采用类似得技术,让角色看起来有骨有肉,重量感十足。
在此我演示一下目前这个兽人身体使用的ZIVA肌肉系统,如果大家感兴趣有机会可以展开来讲。
第一次发稿,枯燥的罗嗦了不少,就先到这了。大家可以期待最终的成品,会有更加完整的演示。感谢大家观看,谢谢!
评论区
共 41 条评论热门最新