展会信息港展会大全

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署
来源:互联网   发布日期:2025-02-06 10:39:24   浏览:109次  

导读:DeepSeek AI最新发布的多模态大模型Janus-Pro,以及之前发布的大型语言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一经发布,就在AI领域引起了热烈反响,多项创新技术显著提升了模型的性能与效率。DeepSeek系列模型首发即支持昇腾平台,神州数码旗下神州鲲泰推理服务器产品搭载昇腾硬件,可全面支持DeepSeek系列模型的快速部署,可为用户带来更快、更高效、更便捷的AI开发和应用体验 ......

DeepSeek AI最新发布的多模态大模型Janus-Pro,以及之前发布的大型语言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一经发布,就在AI领域引起了热烈反响,多项创新技术显著提升了模型的性能与效率。DeepSeek系列模型首发即支持昇腾平台,神州数码旗下神州鲲泰推理服务器产品搭载昇腾硬件,可全面支持DeepSeek系列模型的快速部署,可为用户带来更快、更高效、更便捷的AI开发和应用体验。

2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验,欢迎广大开发者体验使用。

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

下面以Deepseek-V3为例,

演示在昇腾社区如何高效获取模型及使用

1硬件要求

部署DeepSeek-V3模型需配置4台KunTai A924推理服务器(每台搭载8张昇腾推理卡)

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

2模型调用实践

一、 权重转换

GPU:

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

NPU:

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

二、 加载镜像

在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包:

mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

完成之后,请使用docker images命令确认查找具体镜像名称与标签。

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

三、 容器启动

提供的MindIE镜像预置了DeepSeek-V3模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为1001,执行权限为750,启动容器。

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

四、 服务化测试

配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性。

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

修改服务化参数

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

拉起服务化

神州数码旗下神州鲲泰推理服务器全面支撑DeepSeek系列模型部署

图片出现“Daemon start success!”,则认为服务成功启动。

更深入了解DeepSeek系列模型在昇腾上的使用方法及指导文档,可登录昇腾社区模型库专区学习了解!



赞助本站

相关内容
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港