日前,在2022 RISC-V中国峰会上,平头哥半导体副总裁孟建熠公布了 无剑600,一个高性能RISC-V芯片设计平台。不仅仅是打造终端产品,平头哥推出这样的工具类产品,无疑极大地推动了RISC-V生态发展。不但帮助芯片公司降低开发芯片成本和风险,也面向第三方IP和基础软件公司开放。提供软硬件全栈支持,显著缩短芯片从研发到量产的时间,推动更多面向不同行业的高性能RISC-V芯片出现。
据孟建熠分享,无剑600已经实现与国产开源云端操作系统龙蜥的适配,并成功运行了大型桌面级软件和基于JAVA的应用。
RISC-V正成为主流CPU框架之一
RISC-V增长十分迅速,已经与x86、Arm一起,成为主流CPU框架。RISC-V具有开源开放、灵活、低功耗等特性,没有历史包袱、没有高昂授权费用、开发成本更低、无需担忧“断供”风险等优势,被视作发展自主可控本土芯片生态的关键路径之一。平头哥在RISC-V领域一直十分活跃,不断投入软硬件研发和生态连接,推动国内RISC-V生态快速壮大。
无剑600是一个高性能RISC-V异构芯片的软硬件全栈平台,拥有高性能、高内存带宽、异构计算、人工智能(AI)加速的特点,同时兼具高安全、多模态感知和软硬一体的能力。借助该平台,开发者和企业能够快速开发性能更高、主频更高、内存更大、边缘AI计算能力更强的SoC芯片。
无剑600平台设计图
无剑600的默认处理器是玄铁C910,即平头哥在2019年发布的主频2.5GHz的高性能RISC-V核。在AI加速方面,无剑600平台中,最新版的玄铁C910集成了矢量Vector处理器,支持FP16等新型数据类型,并可提供高达4TOPs的Int8 AI算力,方便AI加速类应用的开发。无剑600平台还重点实现了CPU+XPU异构架构设计,从运行功耗、内存带宽和软件栈方面都进行了优化,并支持适配GPU、NPU、VPU、DSP、ASIC等多种不同功能的第三方IP。
也就是说,半导体IP公司可以用无剑600来打造RISC-V整体生态上的能力,下游厂商进入了系统级、体系化的框架,可更高效地开发芯片。平头哥基于无剑600平台成功“打样”——SoC原型曳影1520。
SoC原型曳影1520
这是一颗多模态AI处理器SoC,内置4核玄铁C910,最高吞吐率4266MT,AI峰值算力达到4TOPS,支持全链路安全防护,具有4K视频处理能力,同时包含丰富的异构计算和高速IO资源,软硬件都已完成应用的适配。开发者和企业也可以在定制个性化芯片的同时,先在曳影1520上开发自己的系统,缩短产品从研发到量产上市的时间。
软硬协同,RISC-V商用范围进一步扩大
RISC-V芯片的参数迈进了高性能的大门,下一步,就是考察实际跑应用的表现,也就是软件能力。
在曳影1520上,平头哥与龙蜥社区、中科院软件所PLCT实验室,联合打造从芯片平台到龙蜥操作系统、再到上层应用软件的全链路能力,已实现了龙蜥Linux操作系统的兼容。曳影1520帮助RISC-V架构搭载更重的操作系统和应用,完成了3000多个基础组件的适配,并首次运行FireFox浏览器、LibreOffice等大型桌面级软件,以及Hexo和Open Rocket等基于NodeJS和JAVA的应用,这为更大型应用程序的适配奠定了基础。
当前,无剑600平台针对的市场主要包括平板、智慧大屏、智能NVR、AR/VR和低速UGV等这类高性能旗舰级的产品,也支持医疗成像、视频会议、家用机器人、无人机等中高端应用。基于无剑600平台现已能运行龙蜥社区的多种云上应用,OpenJDK、NodeJS、Python等上游社区常见应用,以及NCNN等AI应用。
RISC-V架构创新,助力边缘AI
AI加速是当前一大主流DSA方向。随着AI计算在端侧应用愈发普及,AI开发友好性正成为芯片的一大核心竞争力。国内很多硬件加速器已经能做到较高的性能,但输在“用不起来”。而RISC-V的开放性,使其相较于Arm芯片有更大的底层创新和扩展空间,能设计出更适合跑AI算法的系统,并能兼顾到不断推陈出新的AI算法对灵活可扩展性的要求。
平头哥正通过矢量扩展和全链路软硬件能力的提升,持续优化其RISC-V处理器的AI加速能力。今年4月,权威AI基准测试MLPerf Tiny V0.7推理性能榜单显示,基于平头哥RISC-V处理器的软硬件联合优化方案,在视觉唤醒、图像分类、语音唤醒、异常监测等4个典型端侧AI任务中均取得第一,遥遥领先于第二名。
平头哥在MLPerf Tiny V0.7测试拿下4个第一
平头哥近两年也在力推为RISC-V准备的AI部署工具HHB,它支持各种类型的模型和算法,通过更好地实现AI算子与硬件的适配,帮助开发者完成AI模型的高效编译及部署。对于1TOPs以下的端侧AI算力需求,平头哥现有的RISC-V处理器足以胜任,不需要再额外加专用加速器;对于超过1TOPs的算力需求,平头哥既提供基于RISC-V的扩展,也支持用户自定义的第三方AI加速IP。
例如在过去两年,平头哥与Imagination在GPU和AI方面进行深度合作,已经能提供硬件IP到优化的软硬件异构计算方案。这也是RISC-V领域最成熟的可量产的方案。
终端落地不多,RISC-V仍需努力构建生态
RISC-V处理器的作战阵地,正从中低端IoT市场,扩展对高性能、可靠性有更高要求的云计算、边缘计算、车载智能计算等应用场景。过去一年,全球RISC-V生态进展飞速,并出现很多标志性事件:在IoT(物联网)领域的应用规模超过100亿颗,中国公司的出货量占到50%;SPECint性能首次超过10分,进入高性能计算的行列。但相比Arm逾2000亿颗芯片的出货量、几乎圈入全球主流科技公司的成熟生态,RISC-V在应用规模、行业渗透率、生态多样性上,都还有很长的路要走。
无剑600平台通过打牢软硬件全栈地桩和联通更多的第三方IP,让企业能基于RISC-V开发出满足其特定应用需求的高性能稳定可靠的SoC芯片产品。平头哥已实现RISC-V与Anolis、AliOSThings、FreeRTOS、RT-Thread、Linux、安卓等操作系统的适配,并在商业量产芯片中得到了应用。今年4月,平头哥玄铁C910处理器成功运行TensorFlow Lite,首次实现了RISC-V在安卓12新系统上的AI支持,进一步提高了RISC-V处理的适应性。
结语:
RISC-V的热度主要还停留在上游厂商,终端用户的认知程度不高。造轮子,完善生态是RISC-V联盟目前的首要任务。无剑600平台的发布对RISC-V生态发展会有巨大的推动作用,希望RISC-V能够早日获得终端用户的认可。