日前,上海初创公司天数智芯发布了旗舰GPGPU(通用型GPU)云端训练芯片BI,主要面向机器学习领域,采用台积电7nm制程工艺。BI芯片能以竞品50%的芯片面积、更低的功耗,提供主流厂商产品近2倍的峰值性能。基于BI的加速卡也一并以实体形式发布,即将进入批量生产和商用交付。
作为天数智芯首款旗舰产品,BI采用台积电7nm FinFET工艺、2.5D CoWoS封装,基于全自研GPGPU架构,容纳240亿个晶体管,与主流GPGPU生态兼容,支持主流机器学习框架。该芯片内建FP32、FP16/BF16、INT32/16/8等多精度数据混合训练,FP16精度下其单芯峰值算力达147TFLOPS。
天数智芯全自研GPGPU架构基于SIMT架构的可伸缩分层计算引擎,自主定义的丰富指令集支持标量、向量和张量操作,并支持GPU通用并行编程模型,能有效对接现有软件生态,易于扩展支持新的算法和应用领域,便于用户轻松迁移。BI芯片还提供1.2TB/s HBM2内存带宽、32GB存储容量,片间互连带宽达64GB/s@16x PCIe4,支持虚拟化方式。其基于开放计算项目组(OCP)的标准加速模块组(OAM)支持单卡最大300W-450W的系统解决方案,配合OAM服务器,进一步提升数据处理整体性能。
为了方便开发者使用,天数智芯还打造了兼容主流深度学习框架的软件栈,可帮助用户实现无痛迁移。同时,天数智芯软件栈结合硬件性能对HPC和区块链等应用提供细粒度的优化和更大的算力支持,包括能对接各种互联网应用平台的资源管理和监控插件、机器学习加速库、兼容多种语言的编译器、调优工具等。在量产后,天数智芯BI芯片及产品卡能为AI训练及推理、认知型AI、高性能数据分析、基因组研究、金融预测分析等高负载工作提供算力支持,服务于教育、互联网、金融、自动驾驶、医疗、安防等各相关行业。
不得不说,BI的发布意义重大。近几年人工智能的应用飞速发展,而人工智能发展的三大要素数据、算力、算法,对本土企业来说只有数据有优势,软件框架、机器学习芯片大都由国外公司提供。国外的硬件有着很高的使用成本,也为了避免外企垄断,本土的的机器学习芯片和软件生态的建设显得尤为重要。目前不少本土企业尤其是创业公司都在努力进入这一领域,任重道远。