快科技2月5日消息,今日,華為宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區,支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用。
據了解,DeepSeek-V3首個版本于2024年上線并同步開源,為自研MoE模型,671B 參數,激活37B,在14.8T token上進行了預訓練。
據DeepSeek介紹,DeepSeek-V3多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B 等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
以下以Deepseek-V3為例,演示在昇騰社區如何高效獲取模型及使用
一、硬件要求
部署DeepSeek-V3模型需配置4臺Atlas 800I A2(8*64G)服務器資源
二、模型調用實踐
1、權重轉換
GPU:
NPU:
2、加載鏡像
在昇騰社區/開發資源下載適配DeepSeek-V3的鏡像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,請使用docker images命令確認查找具體鏡像名稱與標簽。
3、容器啟動
提供的MindIE鏡像預置了DeepSeek-V3模型推理腳本,從您信任的來源自行獲取權重后,放置在從上述下載的模型代碼的主目錄下,修改模型文件夾屬組為1001,執行權限為750,啟動容器。
4、服務化測試
配置服務化環境變量,expandable_segments-使能內存池擴展段功能,即虛擬內存特性。
修改服務化參數
拉起服務化
出現“Daemon start success!”,則認為服務成功啟動。
本文鏈接:http://www.www897cc.com/showinfo-22-128874-0.html華為官宣!DeepSeek系列模型正式上線昇騰社區
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com