展会信息港展会大全

英特尔开源 NPU 加速库,方便使开发人员优化其 AI 应用
来源:互联网   发布日期:2024-03-04 14:53:49   浏览:4332次  

导读:IT之家 3 月 3 日消息,@Tony Mongkolsmai 发现,英特尔已经在 GitHub 上开源了其 NPU 加速库,支持 Windows 和 Linux。 开发人员可以按照相应文档对其软件进行优化,从而适配新一代 AI 模型,包括TinyLlama 和 Gemma-2b-it。 根据官方描述:英特尔 NPU 加速...

IT之家 3 月 3 日消息,@Tony Mongkolsmai 发现,英特尔已经在 GitHub 上开源了其 NPU 加速库,支持 Windows 和 Linux。

开发人员可以按照相应文档对其软件进行优化,从而适配新一代 AI 模型,包括TinyLlama 和 Gemma-2b-it。

英特尔开源 NPU 加速库,方便使开发人员优化其 AI 应用

根据官方描述:英特尔 NPU 加速库是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大性能在兼容硬件上执行高速计算,从而提高应用的效率。

英特尔还表示其 NPU 加速库目前不断开发中,后续将推出各种能显著提高性能的功能,截至IT之家发稿已经实现了 8bit 量化、Float16 支持、torch.compile 支持等,后续还将支持 NPU / GPU 异构计算等功能。

英特尔开源 NPU 加速库,方便使开发人员优化其 AI 应用

赞助本站

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港