2021年12月20日,在珠海举办的第十六届“中国芯”集成电路产业促进大会上,燧原科技第二代人工智能训练芯片“邃思2.0”获“中国芯 年度重大创新突破产品”。这已是燧原科技第二次获此殊荣。
本届大会以“链上中国芯,成就中国造”为主题,在“中国芯”优秀产品征集中,共有来自217家芯片企业,累计319款芯片产品报名。
“中国芯”评选活动是国内集成电路领域最具影响力和权威性的行业会议之一,16年来持续鼓励中国集成电路行业产品创新、技术创新和应用创新,推动国内集成电路企业实现关键技术的突破,并积极影响和带动了中国半导体行业的整体发展。
燧原科技在今年7月发布的第二代人工智能训练芯片“邃思2.0”基础上进行了全新升级迭代,与第一代芯片相比,邃思2.0将FP32算力提升了1.6倍、存储容量提升了4倍、存储带宽提升了3.5倍、互联带宽提升了1.5倍,并因此从319款芯片产品中脱颖而出,获得专业评委的肯定和认可,并再度获评“年度重大创新突破产品”奖。
燧原科技创始人兼COO张亚林表示,“今年凭借邃思2.0能够再次荣获“中国芯 年度重大创新突破产品”奖,对我们而言既是肯定和认可,也同样是激励和鞭策。以邃思系列芯片为核心的第二代训练和推理产品大幅提升了性能指标,升级后的驭算软件平台也更加便捷易用和客户友好,将针对客户的业务场景提供原始创新、具有高性能及性价比的‘训练+推理’完整解决方案。”
图:燧原科技蝉联“中国芯 年度重大创新突破产品”奖
邃思2.0通过大规模的架构升级实现了算力飞跃,新一代全自研的GCU-CARA全域计算架构,支持全面的计算精度;数据流计算加速引擎,可提供数据流传输中计算的能力;单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS。
与此同时,邃思2.0是存储HBM2E的芯片,显著增强了对于超大规模模型的训练能力,最高支持64 GB内存,峰值存储带宽可达1.8 TB/s。
GCU-LARE全域互联技术是燧原专为人工智能训练集群研发的互联技术,提供双向300 GB/s互联带宽,支持数千张云燧T20训练加速卡互联,实现优异的线性加速比。
自主研发的软件全栈“驭算TopsRider 2.0”通过软硬件协同架构设计,可以充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;开放升级的编程模型和可扩展的算子接口,可为客户模型的优化提供快捷的自定义算子开发能力;全面优化动态性模型支持,绝大多数模型可无缝迁移到驭算TopsRider 2.0平台,对开发者友好;完善的编译器和工具链支持,提供开箱即用的图形化整合开发环境支持,对客户的部署和运维更加友好。
图:邃思2.0
12月初,全新一代针对云端的人工智能推理芯片“邃思2.5”再度问世,其单精度FP32峰值算力达到32TFLOPS,整型INT8峰值算力达到256TOPS。
与第一代推理产品相比,邃思2.5将浮点算力提升到1.8倍,整型算力提升到3.6倍。同时创新性地采用了高带宽HBM2E存储,实现了高达819GB/s的超大带宽,为各类云端推理业务提供高吞吐、低延时的性能,保障其准确、平稳、高效的运行。这也标志着燧原科技在云端AI算力加速领域,从训练到推理的完整产品线已全面迭代到第二代,能够以更有竞争力的产品,为互联网、智慧城市、智慧政务,以及金融、交通、能源等传统行业客户提供更优更完整的AI计算方案。
“未来,我们将用5年3代芯片,在AI芯片领域拉近与世界先进产品的距离,燧原正在有节奏、按计划、持续保持强有力的执行力,加速芯片和产品迭代。我们将继续坚持泛互联网、传统行业以及新基建三大业务方向,以全新更具竞争力的产品,服务市场和客户,全面且持续为客户创造价值。”张亚林说。
(文中图片由品牌方授权使用)