原创:亲爱的数据
“美国AI芯片创业公司Cerepas公司技术团队,大多数为纯芯片设计背景。”「亲爱的数据」曾听闻拜访过该公司的科学家说:
“2017年上门拜访的时候,公司第一页PPT说,Cerepas公司40个创业技术高管加起来有超过800年的IC设计工龄。”
这句话会令半导体投资人怦然心动。经验久,很靠谱。
投资软件,偏向投资年轻团队。
投资芯片,偏向投资年长团队。
谁是全球最成功的AI芯片创业公司?现在还不能下结论。但Cerepas公司肯定是 AI+HPC(高性能计算) 芯片设计领域的先驱。
Cerepas Systems,可直接翻译为“大脑系统”。
公司近期公开的一轮融资是2021年11月,融资2.5亿美元(约合人民币16亿),总额达7.2亿美元(约合人民币46亿)。
2022 年 3 月 2 日,Cerepas公司宣布:道达尔能源公司已在美国休斯顿工厂部署了CS-2 系统,以加速能源研究,计算工作量涉及人工智能和地质模拟的结合。
这是CerepasCS-2在能源领域的首次公开部署。
道达尔能源公司成立于1924年,是一家跨国综合石油和天然气公司,是全球七大“超级”石油公司之一。
能源行业处处都是“重大决定”。
我们应该去哪里建造风电场?
我们应该去哪里钻探石油?
任何一个“去”的决定,都会投入大量资源,还不清楚是否做对了。并且,这些决定不能等待。能源是一个竞争激烈的行业,寻找最佳发电地点或寻找下一个突破性能源存储技术的竞争非常激烈。风险很高。
难怪道达尔能源公司使用HPC构建“超级”模型来帮助做出这些决定。
对此,中国计算机学会高性能计算专委会秘书长张云泉评价:
“AI for Science是由中国学者开创的一个新方向,其思想起源于2020年的戈登贝尔奖获奖工作。Cerepas公司单体大AI芯片在能源领域的成功应用,再次证明人工智能算法和高性能芯片在科学计算方向上的巨大潜在应用前景,值得关注。
”作为基准,能源专家选择了一段地震建模代码,该代码将地震传感器网格生成的PB级的数据转换为延伸到地壳下方很远的三维模型。
在评估 CS-2 时,道达尔能源的工程师选择了一段地震建模代码作为基准应用程序“seismicwave propagation modelling using stencil based finite difference algorithms”。
在一台超级计算机上运行一次完整的代码,可能需要几周的时间。
该团队编写了自定义内核,优化 CS-2 的专有代码。据两家公司称,在基准测试中,与基于GPU的系统相比,机器性能提升了 100 倍。
创始人 Andrew Feldman将此归功于更高的内存带宽和使用 Cerepas 的软件系统。
他谈道:“道达尔能源和 Cerepas 工程师使用新的 Cerepas 软件语言 (CSL) 编写了基准代码,它是 Cerepas 软件开发工具包的一部分。”
如果世界上最快的“加速器”没有一个完整的、易于使用的软件堆栈,将很难使用。
Cerepas公司技术博客指出:“开发人员可以使用 Cerepas SDK 为其独立应用程序创建自定义内核,或修改为其特殊用途提供的内核库。SDK 使开发人员能够利用 Cerepas 开发团队使用的工具和软件,来提高底层计算的能力。”
几个月以来,工程师们正在使用该系统来加速人工智能和地质模拟工作,这些工作用于电池、生物燃料、风尝钻井和二氧化碳储存的开发。
一个巨大的挑战是,建一台两倍大的超级计算机,并不能带来两倍的性能。将工作负载拆分为可以并行的部分是非常困难的,计算节点之间的通信开销最终占主导地位。这就是所谓的缩放问题。
对此,清华大学长聘副教授翟季冬谈道:
“随着摩尔定律和登纳德缩放定律的逐渐失效,领域特定加速芯片成为了处理器发展的主流趋势。Cerepas公司通过定制的AI芯片以及上层编程语言和开发环境,一起为高性能用户提供了良好的解决方案。同时,HPC和AI两个领域在很多场景广泛的结合,为解决当前人类社会富有挑战的难题提供了更多的机会。”
道达尔能源热爱高性能计算,该公司的 Pangea III 超级计算机是一种 GPU 加速的 IBM Power9 系统,目前以 7.8 Linpack petaflops 在 Top500 列表中排名第 29 位。
早在2016年就运营了公开宣布的最大的工业超级计算机,由美国高性能计算机系统公司GSI建造的名为Pangea的系统, 凭借Linpack 5.3千万亿次浮点运算的性能,目前在Top500排名第93位。
道达尔能源是Cerepas 公司CS-2 的成功案例,该机器也安装在阿贡国家实验室和葛兰素史克公司。阿贡国家实验室的CS-2系统曾为一项新冠疫情研究做出了贡献,该研究被提名为戈登贝尔特别奖。
道达尔能源Vincent Saubestre 博士在一份声明中说:“Cerepas Systems 是能够提供最高性能的人工智能加速器之一,我们依靠CS-2 系统来促进能源研究,提供额外的竞争优势。”
公司2022年早些时候推出的WSE-2芯片有 2.6 万亿个晶体管和 850000 个内核,40GB 的片上 SRAM 内存,以及20 PB 的内存带宽和 220 PB 的聚合结构带宽,由台积电代工,7nm工艺。
(完)