展会信息港展会大全

第五代英特尔至强可扩展处理器,以更高效的算力助力AI无处不在
来源:互联网   发布日期:2023-12-20 09:56:20   浏览:26611次  

导读:人工智能已成为推动经济结构优化、增长动能转换的一大关键动力,其正在帮助企业利用先进的语言、文本生成图像和代码生成 AI 模型等新模式,实现降本增效,并创造新商机。Grand View Research的研究显示 ,至2030 年,全球 AI 市场的年复合增长率将达37%,此...

人工智能已成为推动经济结构优化、增长动能转换的一大关键动力,其正在帮助企业利用先进的语言、文本生成图像和代码生成 AI 模型等新模式,实现降本增效,并创造新商机。Grand View Research的研究显示

,至2030 年,全球 AI 市场的年复合增长率将达37%,此外40% 的高管表示企业正在投资于生成式 AI,而69% 的企业和机构将在生产中采用 AI。

在中国市场,据报告显示

,2023年中国智能算力规模同比增长超59%,有超六成中国企业已探索应用AIGC,且将更多地使用已有的人工智能数据中心设施和生成式AI服务器集群,并将更加关注效率、可靠性、时延、训练时间和成本等因素。这无疑表明,人工智能的广泛应用在为算力服务市场带来新机会的同时,也对服务商提出了更高、更多元化的要求。

应用户拥抱AI、创造新商机并加速价值实现所需,英特尔在近日全新推出第五代至强可扩展处理器。第五代至强专为AI加速而设计,通过增强型架构、内置AI加速技术,实现了卓越的性能,能够帮助用户更高效地应对要求严苛的 AI工作负载,让智能开发及应用无处不在。

第五代英特尔至强可扩展处理器,以更高效的算力助力AI无处不在

架构增强,让AI更高效

算力、数据、算法是智能世界三要素,其中算力平台是核心基矗有专家指出,算力的成本将关系到AI模型的“价格”

。人工智能的突破,除了技术提升之外,通过提供强劲且高效的算力,平衡计算成本也是必不可少。

为了改善工作负载的性能,第五代至强可扩展处理器通过架构增强,实现了算力的全面优化。较上一代产品,第五代至强在相同 TDP 下平均性能提升高达21%,内存带宽提升高达 16%,三级缓存容量提升近 3倍,能够为AI训练和推理提供更高的支持,AI推理性能提升高达 42%,且更适用于大型模型。

借助第五代英特尔至强可扩展处理器提升的基础性能以及AI训练与推理能力,用户无疑可继续使用 CPU 将 AI 应用到各个领域,从而解决GPU挑战,帮助广泛的产业用户将AI融入业务逻辑各环节,并应对部署中可能遭遇的硬件可用性、成本、集成和扩展方面的挑战,实现在通用的服务器基础架构上高效运行AI应用,提升性能成本收益。

内置AI加速器,促进应用落地与优化

英特尔至强可扩展处理器内置AI加速器,有助于提高性能和效率,减少另行添置专用硬件的需求,在云端和本地环境中,可支持AI等目前最为常见的严苛工作负载,促进应用落地与优化。

第五代英特尔至强

可扩展

处理器每个内核都具备 AI 加速功能,英特尔 AVX-512及英特尔 AMX 助力用户无需添加独立加速器,就可处理要求严苛的 AI 工作负载,帮助用户在使用生成式 AI ,例如从大语言模型 (LLM) 和文本到图像生成模型时,都拥有更顺畅的体验,且可满足多种 SLA、

提供实时用户体验等要求。

其在运行参数量低于 200 亿的大语言模型时,词元处理时延不超过 100 毫秒,非常适合运行 GPT-J 等特定域专用模型或更小的模型时使

用。

另外,英特尔AMX可大幅提升深度学习训练和推理性能,避免了使用独立加速器带来的成本和复杂性。借助在自然语言处理 (NLP) 推理方面的性能飞跃,英特尔AMX能够更高效支持智能助手、聊天机器人、预测性文本、语言翻译等工作负载,使得响应速度更快,用户体验更顺畅;且在迁移学习和再训练方面同样出色,无需额外添置硬件即让用户模型保持最新状态。

基于第五代英特尔至强可扩展处理器,京东云推出新一代服务器,实现整机性能代际提升23%,AI视觉类通用模型推理性能提升38%,通用大语言模型LlaMA v2 13B推理性能提升51%;在11.11大促用户访问峰值同比提升170%、智能客服咨询服务量超14亿次的情况下,以AI赋能产业,为百姓的实惠生活保“价”护航。阿里云采用第五代至强,打造了“生成式AI模型及数据保护”的创新实践,使第八代ECS实例在安全性和AI性能上都获得显著提升,其推理和数据库性能双双提升25%,同时基于英特尔TDX,实现数据全流程保护。

出色的软件工具和生态系统,助力AI更快普及

为了帮助开发者、用户应对算法开发效率低、场景之间迁移能力差,以及难以满足泛化性、安全性要求等挑战,满足AI应用场景多样化、开发和部署逐步走向深水区、日益多样化等需求,英特尔构建起庞大的生态系统、丰富的工具集,支持用户可跨云、数据中心和边缘采用最新第五代至强可扩展处理器,快速开发和部署 AI。

英特尔至强可扩展处理器拥有广受欢迎的软件库和框架加持,具备数十个经过优化的预训练 AI 模型,提供开箱即用的出色 AI 性能,且让开发人员能够在不同硬件架构和供应商间自由迁移代码,从而提高效率和减少投资。

英特尔oneAPI 深度神经网络库(英特尔oneDNN)的软件优化已集成到 TensorFlow 和 PyTorch 的主流发行版中,开发人员可以更轻松地使用内置 AI 加速功能。

英特尔是开源社区的重要贡献者,有 90% 的开发人员都在使用由英特尔开发或优化的软件。特别是在 AI 方面,英特尔构建的开源 AI 参考套件可帮助加速各个行业的模型开发和 AI 创新。

人工智能正在渗透到社会经济各个领域,刺激和驱动企业加速技术创新和业务重塑,打造新优势,但面对降低成本和风险等压力,部署 AI 时选择更信赖的 CPU应该是更明智之眩目前,大多数据中心的 AI 推理都在英特尔至强可扩展处理器上运行,英特尔至强处理器的部署规模已超 1 亿。第五代英特尔至强可扩展处理器的推出,无疑可帮助企业充分应用其多项更优异的特性,抓住AIGC、大语言模型等应用新机遇,加速创新,创造无限可能。

作者丨沈丛

编辑丨

张心怡

美编丨马利亚

监制丨连晓东

赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港