展会信息港展会大全

192核!这家初创公司的芯片想以“多”取胜,称AI推理能力优于AMD
来源:互联网   发布日期:2023-06-08 18:15:29   浏览:7852次  

导读:界面新闻记者 | 彭新 界面新闻编辑 | 发布192核Arm服务器芯片后,芯片初创公司Ampere希望拓展更多CPU市场份额,并在AI能力上战胜竞争对手。 近日,Ampere首席产品官Jeff Wittich接受了包括界面新闻在内的媒体采访,解析芯片架构并展望产品路线图。 AmpereOne...

界面新闻记者 | 彭新

界面新闻编辑 |

发布192核Arm服务器芯片后,芯片初创公司Ampere希望拓展更多CPU市场份额,并在AI能力上战胜竞争对手。

近日,Ampere首席产品官Jeff Wittich接受了包括界面新闻在内的媒体采访,解析芯片架构并展望产品路线图。

AmpereOne采用小芯片(Chiplet)设计,使用5纳米工艺制造,并首次采用Ampere自研内核,还扩展了内存容量、带宽和IO带宽等,支持PCIe 5.0和DDR5规格。

据Jeff Wittich介绍,该芯片为云原生设计,意味着在芯片设计环节,从核心到SoC,均考虑到云计算场景,以实现最好的能效。“它不是其他产品稍加更改而来的衍生产品线,更不是我们去利用所谓的传统架构,来打造出适应市场变化的产品。”

192核心(Core)是此次AmpereOne处理器的核心特点,为业内最高,远超同期英特尔、AMD两大x86架构厂商处理器核心数量。通常而言,处理器核心数量越多,可同时处理任务的能力越强。Ampere宣称,192核心的AmpereOne处理器在云端环境时,可运行虚拟机的数量要远大于同期的旗舰x86处理器,也拥有更好的能效表现。

随着AmpereOne处理器的推出,Ampere已拥有Altra、AmpereOne两大产品线系列,覆盖不同计算需求。Jeff Wittich举例,在边缘计算场景,客户仅需部署32核、功耗40瓦的Ampere Altra处理器。而对于在大规模数据中心环境、有更大算力需求的客户,AmpereOne认为更高核心数可以提供更好性能。

Jeff Wittich称,边缘作为云端的延伸,也是Ampere关注的领域,其许多需求与云类似。但在部署边缘算力上,由于供电、制冷、网络、部署条件等限制,资源的限制更多。Ampere Altra高性能、低能耗的特点,可以在冷却设备受限的场景下工作,“许多边缘场景为了规避能耗的增加,可能还在使用原来的低性能产品。”他认为,Ampere处理器将改变现状。

在云端,诸如英特尔至强、AMD霄龙等处理器用于AI推理工作,是AI计算的一大主流负载,Ampere芯片同样可应用于此。“Ampere的产品不只适用于当前常见的大型语言模型,也适用于过去几年相对旧的模型。”Jeff Wittich称,云厂商在AI计算中追求高能效以降低成本,而GPU服务器功耗极大,成本高昂,扩展和可部署的服务器数量受到限制,Ampere可以满足云厂商需求。

AI是当前芯片厂商重要的负载类型,生成式AI的流行加速了厂商投入。Jeff Wittich分析称,AI训练发生在服务器上的CPU、GPU,而AI推理在整个云端基础设施中均有涉及,在负载特征上需要不断地进行重复推理,并向用户快速交付结果。他称,Ampere两年多前就组建了AI团队。此次AmpereOne针对流媒体推荐、商品智能推荐、生成式AI等AI负载进行优化。

根据Ampere展示的产品性能对比,在生成式AI负载的文本提示生成图像模型Stable Diffusion推理中,AmpereOne以每机架性能高出2.3倍优势领先AMD霄龙9654处理器。Ampere未提供与英特尔芯片对比数据。

Ampere介绍称,包括谷歌、微软、甲骨文、阿里巴巴、腾讯在内的云服务厂商,以及慧与、Supermicro等服务器厂商已经与Ampere合作,测试或使用Ampere产品。

基于成本、性能考虑,云计算厂商对不同架构处理器保持开放态度。2018年11月,亚马逊发布基于Arm架构的首款服务器芯片Graviton,主打性价比。亚马逊宣称,与主流的英特尔x86架构CPU(中央处理器)相比,基于Graviton芯片的云服务在处理一些简单的工作负载时,成本可最多降低45%。随后该芯片多次迭代,性能提升数倍,可应付更多、更复杂的工作类型,至今已经迭代多代。

赞助本站

人工智能实验室
相关内容
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港