2023年11月28日,龙芯中科在北京国家会议中心举办了盛大的发布会,会上发布了一系列龙芯产品,其中就包括了采用完全自主研发LoongArch指令集和龙芯第四代微架构的龙芯3A6000处理器。同时,知名主板厂商华硕也在会上发布了旗下第一款龙芯主板XC-LS3A6M。相信很多朋友都非常关心国产自研处理器的实际表现到底如何,那么本次测试我们将给大家带来详细的解答。
龙芯3A6000+华硕XC-LS3A6M主板规格介绍
龙芯3A6000采用了自主研发的LoongArch指令集,和我们平常接触最多的X86指令集是并列关系,而且不能直接兼容,如果要在LoongArch平台上运行X86应用程序,需要通过二进制转译。当然,正是因为LoongArch指令集以及处理器重要IP都是完全自主研发的缘故,也就不用担心授权的限制,同时龙芯中科还将CPU核IP逐渐免费开放授权给业界使用,目前首批与龙芯中科签订CPU核IP授权协议的企业已经达到10家。
芯片微架构部分,龙芯3A6000采用了最新的LA664。作为龙芯第四代微架构,LA664的规格已经完全不输当前主流的X86处理器,它的发射宽度达到了6,ROB项数达到256,定点物理寄存器和向量物理寄存器的数量也高达192个,Load与Store队列项数分别为80和64,也都达到了当前X86主流处理器的水平。表格中我们还列出了Skylake S与Zen3微架构的部分规格,可以看到LA664微架构的IPC设计确实是具有超前性的。当然,这里只是部分规格的对比,而影响处理器微架构IPC的因素并不只有这些规格,因此仅作参考。
核心配置部分,龙芯3A6000支持SMT2技术,具备4核8线程;制程工艺部分,龙芯3A6000使用了12nm工艺,核心频率从2GHz到2.5GHz自动调整,满载的情况下可以实现全核心2.5GHz加速频率。当然,这并不是它的极限频率,通过主板BIOS超频它还可以在更高的频率下运行,后面我们也会进行更详细的超频测试。TDP方面,龙芯3A6000官方标称的典型功耗为38W,供电要求不高,同时普通风冷即可搞定散热,所以配套的散热器也比较小巧。
缓存部分,可以看到它其实相比现有主流处理器也毫不逊色,特别是三级缓存更是高达16M。内存部分,它支持JEDEC标准双通道DDR4 3200,注意不是XMP标准,如果使用XMP标准的DDR4 3200,在龙芯3A6000平台上只会以SPD内保存的最高JEDEC标准频率运行。因此,我们测试使用的也是一对JEDEC标准的威刚DDR4 3200内存。
龙芯3A6000处理器采用了FCBGA 1190封装,是直接焊接在主板上的,而它对于所有设备的连接都要通过主板上的7A2000显卡来完成,处理器与显卡之间则通过HyperTransport 3.0总线来传输信号——没错,就是DIY资深玩家非常熟悉的那个HT总线。此外,7A2000显卡不但内置了各种I/O控制器,还内置了龙芯中科自研的集显,并自带了2GB DDR4显存。
那么说到主板,本次与龙芯3A6000整合的主板是来自上海华硕定制的XC-LS3A6M,它板载7A2000显卡,配备DrMOS供电,提供两条DDR4内存插槽,支持双通道DDR4 3200(最高64GB),拥有一条PCIe ×16(×8通道)插槽、一条PCIe ×8插槽和一条PCIe ×4插槽,全都支持PCIe 3.0标准。存储部分,板载了M.2插槽和4个SATA接口,主板还提供了双千兆有线网卡,COM口、VGA+HDMI视频输出、前置Type-C扩展等实用接口,完全能够满足日常办公娱乐需求。
特别值得一提的是,华硕XC-LS3A6M的BIOS中还提供了超频的“狂暴模式”,最高可以将龙芯3A6000解锁到3GHz的频率。当然,要超到这样的频率也需要更加极致的散热方案。易用性方面,华硕XC-LS3A6M还板载了DEBUG灯和物理网络开关、配备多重硬件防护,这些都是华硕主板的常备功能,也是非常成熟的技术了。
接下来就让我们看看龙芯3A6000平台实测的情况。
处理器:龙芯3A6000/Intel酷睿i3 10100F/ Intel酷睿i5 12400/ AMD锐龙5 3400G
主板:华硕XC-LS3A6M/ROG STRIX B460-G GAMING/华硕TX GAMING B760M WIFI D4/ ROG STRIX B450-I GAMING
内存:威刚万紫千红DDR4 3200 8GB×2
显卡:华硕DUAL- RX580-8G
硬盘:闪迪至尊高速Ultra 1TB SATA
电源:ROG雷神THOR 1200W
操作系统:Windows 11专业版23H2/UOS AMD64 V1060/UOS LoongArch64 V1060/Loongnix 20.5
我们知道,龙芯3A6000采用了自主研发的LoongArch指令集,因此不能直接运行Windows操作系统,所以龙芯平台的测试都在UOS LoongArch版和Loongnix操作系统上完成。此外,我们也选择了一些常见的X86处理器来进行对比,其中的酷睿i5 12400手动关闭两个核心保持4核8线程的规格进行测试。
在发布会上,龙芯中科展示了龙芯3A6000与酷睿i3 10100的部分测试数据对比,这里我们另外补充了一些项目的测试数据供大家参考,虽然使用的是酷睿i3 10100F,但它和酷睿i3 10100相比只是没有核显,处理器部分是完全相同的。
从测试数据来看,在UnixBench中,龙芯3A6000单线程得分2112,多线程得分8988,分别大约相当于酷睿i3 10100F的75%和83%,不过我们知道酷睿i3 10100F的单核频率是4.3GHz,全核频率也高达4.1GHz,都是远高于龙芯3A6000的,因此IPC方面龙芯3A6000未必有劣势。
7Zip的压缩解压测试中,可以看到龙芯3A6000相比酷睿i3 10100F,单线程差距要比多线程差距稍大,其中压缩性能的差距又小于解压缩性能的差距。然后是Coremark,这个软件考查的是单线程性能。2.5GHz的龙芯3A6000大概是4.3GHz酷睿i3 10100F得分的64%。最后是FFmpeg的转码测试,我们将一个45.5 GB的YUV格式的视频转码为MP4格式,此测试中龙芯3A6000要比酷睿i3 10100F多用40%的时间。
从这几个基准测试项目来看,龙芯3A6000的性能表现与官方数据比较相符,总的来说龙芯3A6000还是达到了性能预期,比想象中的还是要好不少,虽然绝对性能相对酷睿i3 10100F有差距,但毕竟后者的频率已经超过了4GHz,比龙芯3A6000的2.5GHz高出太多。
那么如果对比的处理器都保持全核2.5GHz的工作频率,测试结果又是如何呢?我们将酷睿i3 10100F、锐龙5 3400G以及酷睿i5 12400都手动设置为全核2.5GHz与龙芯3A6000进行对比,结果令人十分惊喜。从表中可以看到,同为全核2.5GHz的情况下,龙芯3A6000所有的测试成绩都明显超越了酷睿i3 10100F,其中UnixBench单线程领先幅度甚至高达24%,多线程更是领先36%,7zip的单线程与多线程总分也分别领先了20%和28%之多,相对锐龙5 3400G的领先幅度甚至更大,和酷睿i5 12400(4C8T)也打了个有来有回。由此可见,在2.5GHz频率下,龙芯3A6000的IPC已经完全赶上了主流处理器的水准,相对较早的X86处理器优势还很明显。
我们还额外对比了龙芯3A6000使用UOS系统和Loongnix系统的性能差异,从测试结果来看,Loongnix系统下龙芯3A6000的各项测试成绩表现都更好一些,毕竟是自家的系统,优化方面也许更加到位一些。
统信UOS和龙芯Loongnix都带有图形化GUI界面,常规的操作逻辑和大家平时用Windows差不多。从个人体验上来看,统信UOS对新手更友好一些,更符合大家的日常习惯,而Loongnix则更加“极客”一些,有些操作会繁琐一点。它们都自带了应用程序商店,从数量来看都非常丰富,常用的办公娱乐上网软件都有,直接点下载安装即可。
LinuxQQ使用的是重构后用Electron框架实现多端合一的UI,界面清爽,用起来也比较流畅。使用体验和Windows版没有什么区别。微信相对体验差一些,毕竟这是一个通过Wine使用的Windows版,版本较低,很多功能都没有,明显开发进度不及QQ。
腾讯会议有原生版应用,从功能来看视频、投屏和录屏都很OK,用起来也很流畅,对于有网络会议、上网课之类的用户来说完全可以满足需求。
办公软件部分,有 WPS的龙芯版,虽然版本晚于Windows版,但基本功能用起来是没有什么问题的。我们还特意分别打开了一个40万字的Word文档、一个200MB的Excel文件和一个160页的PPT,龙芯3A6000都表现得很流畅,标签切换、缩放、拖动等操作都没有卡顿。
网页浏览部分,相比之下感觉龙芯浏览器比UOS的更好用一点,速度更快一些。在浏览器中看B站4K视频比较流畅,处理器占用率也不算太高,完全可以接受。
此外我们还体验了GIMP图像处理器工具、百度网盘(原生版)、钉钉、OBS、SMPlayer和VLC播放器等常用的工具软件,以及PyCharm、VS Code、中望CAD等生产力工具,龙芯3A6000的总体表现都是令人满意的,软件都可以正常运行,效率也比较OK。
最后,我们还模拟了一下日常办公的实际情况:先打开十几个不同的网页,比如在B站看视频;接下来打开音乐网站听听歌;再打开前面测试用的Word、Excel、PPT文件;再启动GIMP编辑图片。这种状态下处理器占用大概是40%多,内存占用81%,此时切换各个应用窗口还是比较流畅的。这样来看的话,龙芯3A6000满足日常工作的性能需求是没有什么问题的,甚至比一些还在使用的4核8线程办公机体验更好。
对于一般消费者来讲,游戏应用显然也是有需求的。原生支持龙芯的游戏并不多,但跑在JAVA上的《我的世界》是可以原生支持龙芯的,毕竟龙芯有原生的JAVA JDK。从测试来看,龙芯3A6000的流畅度非常不错,从截图可以看到,定点测试场景中可以达到350fps左右,复杂场景的璃月地图也有超过100fps。
那么,如果不是原生支持龙芯的游戏怎么办呢?龙芯提供了LAT二进制翻译系统,包括翻译X86的LATX和翻译ARM的LATA,因此我们可以通过LATX来运行X86的游戏,如果再加上Wine,就可以运行一些Windows下的X86游戏了。
先来看看Linux下的X86游戏。《死亡细胞》《群星》《异星工厂》都是没有问题的,流畅度也非常不错。《雷神之锤4》可以运行,只是帧率不太稳定,高的地方超过80fps,低的地方不到20fps。《消逝的光芒》载入完会闪退,只有等LATX更新了。除了PC游戏,Mednaffe、RetroArch和PPSSPP等模拟器也是可以正常运行的,这样算起来游戏就比较丰富了。
再看看LATX+Wine兼容Windows游戏的情况。老版的《暗黑破坏神2》是可以运行的,只是开了小地图有一定掉帧。《古墓丽影9》也可以正常运行,只不过帧率较低,平均只有25fps。《生化危机4》《生化危机:启示录2》都可以运行,但帧率也是较低,可能是Wine版本的问题。Windows版的Mame Plus街机模拟器运行起来就没什么问题了,流畅度是 OK的。
此外还有很多龙芯3A6000可以运行的游戏,这里就不一一体验了,大家有兴趣可以去看看爱好者整理的游戏列表。总的来说,龙芯3A6000平台游戏是有的玩的,平时简单娱乐一下是没有问题的,优化方面可以期待未来慢慢加强。
功耗方面,我们分别搭配RX 580独显和集显进行测试。从测试结果来看,在使用集显的情况下,龙芯3A6000整个平台运行FFmpeg转码功耗不到90W,比较符合预设的功耗水平。当然,搭配独显后整机功耗大幅提升,这也是因为RX 580本身的待机功耗就比较高的原因,和龙芯3A6000无关。
华硕XC-LS3A6M可以对龙芯3A6000进行超频,经过我们的尝试,在电压增加到1.2V的情况下,处理器可以稳定运行在2.8GHz频率下,而且此时满载最高温度也不到60℃。超频后龙芯3A6000的性能进一步提升了10%~12%,比较符合频率的增长幅度。如此看来,如果下一代龙芯处理器可以将频率进一步提升,那么性能也会有着线性的增长规律。
最后简单总结一下。从基准测试来看,在默认频率设置下,龙芯3A6000性能达到了设计预期,比较符合官方给出的数据,虽然相对酷睿i3 10100F有一定的性能差距,但这主要是因为后者的工作频率远高于龙芯3A6000的缘故。而同频测试的结果已经证明龙芯3A6000的IPC实际上已经大幅度超越了2.5GHz下的酷睿i3 10100F、锐龙5 3400G,甚至能和酷睿i5 12400(4C8T模式)打个有来有回,可见龙芯3A6000的LA664架构在IPC方面已经赶上了主流X86处理器的水准。如果未来进一步升级制造工艺,提升工作频率,那么龙芯赶超主流X86处理器的脚步必将大幅加快。当然,由于多方面的原因,未来较长时间内龙芯可能都要以提升IPC为主要设计方向,制造工艺方面并不会把步子迈得太大,从而绕开来自制造工艺方面的封锁。
从实际体验来看,龙芯3A6000现有的应用生态环境是可以满足日常办公生产力和轻度娱乐需求的,在同时进行办公多任务的时候龙芯3A6000表现出来的流畅度令人惊喜,体验甚至明显好于现有的一些4核8线程处理器Windows主机,游戏方面的支持度也在不断优化提升,LATX+Wine的兼容性、效率也会不断升级,未来的体验也会更好。目前电商平台可以轻松买到龙芯3A6000的板U套装和整机,价格也比较合理,这也从侧面证明了龙芯3A6000的实用性已经达到相当可靠的水准了。
从更高的层面来看,龙芯中科自研处理器指令集和架构突破了来自国外的封锁,打破了在国外架构授权、IP授权以及专利授权控制下成长的桎梏,并且使用了境内可控的制造工艺,建立了全面使用国产设备的芯片封装测试厂,与国内EDA软件企业也进行了深入的合作,更是将龙芯架构IP逐步免费开放打造更强大的生态圈,由此也凸显了龙芯未雨绸缪、居安思危的长远眼光。
总而言之,龙芯3A6000的出现,意味着国产自研处理器已经正式进入反击赶超的阶段,而龙芯能有今天的成就,与它脚踏实地、自强不息的精神不无关系,而我们也相信龙芯能够在未来成为国产自研芯片中的中流砥柱。
评论区
共 1 条评论热门最新