雷刚 发自 凹非寺
量子位 报道 | 公众号 QbitAI
AI超算怎么搞?老黄祭出联谊招。
在国际超算大会上,英伟达宣布正式支持Arm CPU,为高性能计算行业开辟了一条全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。
具体方面,英伟达将在年内为Arm态系统提供全堆栈的AI和HPC软件。
该堆栈为600多个HPC应用程序和所有AI框架提供加速。
其中包括了所有英伟达CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。
堆栈优化完成后,英伟达将为所有主要CPU架构提供加速,包括x86、POWER和ARM。
英伟达创始人黄仁勋说,英伟达CUDA加速和ARM的高效能CPU架构结合,一定可以推动超算的大幅提升,目标是百万兆级。
据称英伟达和ARM CPU联手的超算,将率先在预测气候变化和核武器系统建模等领域展开试水。
英伟达官方还专门提到了节能,Arm CPU的开放性之外,节能也是这次联手的题中之义。
在最新发布的Green500排行榜,全球最节能的25款超级计算机中,有22款都得益于英伟达的支持。
需要说明的是,这也不是英伟达和Arm首次联手。
之前英伟达用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品,其实都采用了ARM。
One more thing
最后,也还是在法兰克福超算大会。
英伟达还发布了一款专为自动驾驶汽车打造的超算:DGX SuperPOD。
全球最新排名第22.
整个系统搭建只需要3星期,采用96台NVIDIA DGX-2H超级计算机与Mellanox互联技术。其处理能力高达9.4 petaflops,能够用于训练安全自动驾驶汽车所需要的海量深度神经网络。
DGX SuperPOD内含1,536颗NVIDIA V100 Tensor Core GPU。
英伟达方面称,该套系统能够不间断运行,优化自动驾驶软件,并以前所未有的周转时间(turnaround time)反复训练神经网络。
例如,DGX SuperPOD软硬件平台能够在不到2分钟的时间之内完成ResNet-50训练。
此外,具备同等性能的其他TOP500超级计算机系统都由数千台服务器构建而成,而DGX SuperPOD占地面积更少,其体积比这些同等系统小400倍左右。