日前,在2021世界人工智能大会期间,燧原科技发布了第二代人工智能训练产品——“邃思2.0”芯片,并且发布了基于该芯片的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”,产品性能大幅提升。燧原科技向客户提供完整的芯到端的产品服务,包括芯片、模组和软件平台,有利于项目的开发落地。
邃思2.0是迄今中国最大的AI计算芯片,采用日月光2.5D封装的极限,在国内率先支持TF32精度,单精度张量TF32算力可达160TFLOPS。同时,邃思2.0也是首个支持最先进内存HBM2E的产品。邃思2.0进行了大规模的架构升级,新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,并成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS,均为国内第一。
经过全新升级迭代后,邃思2.0的计算能力、存储和带宽、互联能力较第一代训练产品有巨大提升,对超大规模的模型支持能力获得显著增强。而同步升级的驭算TopsRider软件平台,成为燧原科技构建原始创新软件生态的基石。完全自研的软硬件架构,助力燧原科技在知识产权和产品升级迭代上可以自主掌控方向和节奏。驭算TopsRider是燧原科技自主知识产权的计算及编程平台,通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。
面向人工智能领域的专用芯片是许多创业者看好的赛道,在传统芯片领域我国与世界先进企业的差距较大,但是在人工智能芯片领域,我国有着大量的企业参与进来。依托强大的市场需求和丰富的数据储备,可以说这些企业目前发展势头良好,正在逐步建立自己的品牌效应和技术壁垒。随着人工智能技术的发展,强大的算力需求成为刚需,也是复杂应用的基础,期待有更多优秀的人工智能芯片面市。