龙芯在2020年推出了自主指令系统LoongArch,2021年到2022年以来陆续发布了面向桌面的龙芯3A5000、面向服务器的龙芯3C5000,分别是4核、16核架构,这次发布的龙芯3D5000则是2个3C5000封装,做到了32核,主要面向高性能计算。龙芯3D5000依然采用龙芯自主指令集LoongArch,这是龙芯100%自主指令,无需国外授权。
龙芯官方表示,龙芯3D5000具备超强算力,性能卓越的特点,可满足通用计算、大型数据中心、云计算中心的计算需求。龙芯3D5000的推出,标志着龙芯中科在服务器CPU芯片领域进入国内领先行列。
具体架构上,龙芯3D5000内部集成了32个高性能LA464内核,频率2.0GHz,支持动态频率及电压调节,片内64MB L3共享缓存,8通道DDR4-3200 ECC内存,5个HT 3.0高速接口,实现了双路、四路CPU扩展支持。龙芯3D5000采用LGA-4129封装,TDP功耗为300W,不过典型功耗只有150W,算下来每个CPU大约是5W功耗左右。
性能方面,龙芯3D5000的SPEC 2006分数超过425,浮点部分采用了双256bit向量单元,双精度浮点性能可达1TFLOPS((1万亿次),是典型ARM核心性能的4倍。龙芯3D5000还可以搭配自研的龙芯7A2000桥片支持2路、4路CPU,单台服务器可以做到128核,4路CPU2006定浮点性能实测可达1500分以上,并行效率很高。此外,龙芯3D5000的8通道DDR4内存的Stream性能也超过50GB,桥片龙芯7A2000比上代性能提升400%。
国产CPU的一大优势还有安全,龙芯3D5000在这方面也做足了功夫,专有机制可以防止Meltedown、Spectre等漏洞攻击,还在芯片内集成了安全可信模块,可以取代外置可信芯片。龙芯3D5000还支持国密算法,内嵌独立安全模块,高性能加密解密效率可达5Gbps以上,足以替代高性能密码机。
基于龙芯3D5000,龙芯还推出了2路、4路服务器参考设计,CPU2006性能可达800、1500分以上,浮点性能可达2T、4TFLOPS。服务器使用的BMC(服务器远程管理控制芯片)现在也依赖国外厂商,龙芯这次还推出了自研的BMC芯片2K0500,LA264架构,频率500MHz,集成2D GDP、32bit DDR3等,支持1920×1080 60hz输出,支持多种管理协议,可以平替国外BMC芯片,助力服务器100%国产化。
龙芯还推出了LoongArch云平台,基于龙芯3D5000、龙芯7A2000、BMC控制芯片等自主芯片支持打印云、教育云、国密、混合云等场景,实现大数据、分布式存储、人工智能、物联网、区块链、云安全及高性能计算等能力。