在此之前AMR就已经发布了N77这款旗舰NPU,不过全新的 Ethos-N77 的规格已有所变更和加强,支持分配 1~4MB 的静态随机存储器(SRAM)。对此,ARM 的解释是,客户需要更多的内存带宽,去处理网状网络的 NPU 。因为动态随机存储器(DRAM)的带宽,无法像核心数量一样快地扩展到高端市场。
N77是一款旗舰NPU,可在 1GHz 时种下提供高达 4 TOPS 的运算能力、且每瓦特能效可达的5TOPS,ARM 宣称其能够在不同 IP 上使用相同的构造块。所有 NPU 共享相同的 MAC 计算引擎(MCE)和可编程层引擎(PLE)。前者由去年公布的 128 个 MAC 单元组成,并与 PLE 配对。MCE、PLE、加上 SRAM,则组成了计算引擎(CE)。作为可缩放的模块,其在 N77、N57 和 N37 之间略有不同。就 CE 数量而言,它就有 16 倍、8 倍和 4 倍的配置。
相比瑞芯微、华为、晶晨以及联发科等国产NPU,ARM此次的动作可以说是相当迟钝,不过各大SoC对ARM的架构设计依赖性极强。此次虽然晚了一年多,但凭借庞大的市场基础,ARM的 Ethos系列NPU将会快速推广,目前新 NPU IP 已交付给许多授权客户。
Mali-G57 是 ARM 首款基于Valhall的中端GPU。在今年早些时候的 Mali-G77 发布活动期间,ARM 已经透露过G57的相关信息,预计G57将在2020年落地产品。与基于 Bifrost 的 GPU 相比,新的Valhall GPU 架构有了更大的变化,ARM 彻底重建了其 图形 ISA 和计算的微体系架构。与具有每核三个执行引擎(3EE)的 G52 相比,改进后的 G57 可保证将性能提升至 1.3 倍左右、同时能效提升 30%、硅密度也提高了 30%(因为性能更强了)。
Mali-D37是面向深度学习的运算单元(DPU),算是一款中端产品。在今年早些时候,ARM 在发布 Mali-D77 时宣布了新的 DPU IP,并在 Mali-D71 及后续产品中首次引入了“Komeda”架构。然后新的 DPU 将瞄准 2K 和 FHD 分辨率应用,承诺即使在使用 16nm 制程的情况下,其核芯面积的占用也不到 1 mm²。
从ARM此次发布的芯片阵容来看,面向人工智能的处理器芯片成为了重点,不论是NPU还是DPU都是面向人工智能领域的专用产品。随着数据爆发,大数据时代的到来,任何场景应用都离不开人工智能的支持。传统芯片因运行AI模型算法时效率低下,因此AI专用芯片成为新的选择。不得不说,在人工智能芯片领域,我国确实走在了前列,早早的就推出了集成独立NPU的通用型SoC。而且就目前ARM公布的参数来看,其NPU性能并不具有优势。并且越来越多的芯片设计商都在转向开源的RISC-V架构产品开发,ARM接下来的市场表现充满了不确定性。