2 月 4 日消息,中科曙光國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心有限公司昨日發(fā)文宣布,海光信息技術(shù)團(tuán)隊(duì)成功完成 DeepSeek V3 和 R1 模型與海光 DCU(深度計(jì)算單元)國(guó)產(chǎn)化適配,并正式上線。
用戶在“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關(guān)模型,或登錄光源官網(wǎng)搜索“DeepSeek”,即可基于 DCU 平臺(tái)部署和使用相關(guān)模型。
據(jù)介紹,DeepSeek V3 和 R1 模型基于 Transformer 架構(gòu),采用了 Multi-Head Latent Attention(MLA)和 DeepSeek MoE 兩大核心技術(shù)。MLA 通過減少 KV 緩存顯著降低了內(nèi)存占用,提升了推理效率;DeepSeek MoE 則通過輔助損失(auxiliary loss)實(shí)現(xiàn)了專家負(fù)載的智能平衡,進(jìn)一步優(yōu)化了模型性能。
查詢獲悉,DCU 是海光信息推出的高性能 GPGPU 架構(gòu) AI 加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用 AI 加速計(jì)算解決方案。目前,DCU 已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個(gè)領(lǐng)域?qū)崿F(xiàn)規(guī)模化應(yīng)用。
本文鏈接:http://www.www897cc.com/showinfo-45-10488-0.htmlDeepSeek V3 和 R1 模型完成海光 DCU 國(guó)產(chǎn)化適配并正式上線
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: OpenAI 阿爾特曼:公司沒有起訴 DeepSeek 計(jì)劃,將繼續(xù)打造出色的產(chǎn)品