日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

摩爾線程成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe

來源: 責編: 時間:2025-03-02 09:07:16 90觀看
導讀 2 月 27 日消息,在 DeepSeek 開源周第四日,摩爾線程宣布已成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe,并發(fā)布相關開源代碼倉庫:MT-DeepEP 和 MT-DualPipe。據(jù)介紹,DeepEP 是一個用于 MoE(混合專家)模

2 月 27 日消息,在 DeepSeek 開源周第四日,摩爾線程宣布已成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe,并發(fā)布相關開源代碼倉庫:MT-DeepEP 和 MT-DualPipe。2RW28資訊網(wǎng)——每日最新資訊28at.com

2RW28資訊網(wǎng)——每日最新資訊28at.com

據(jù)介紹,DeepEP 是一個用于 MoE(混合專家)模型訓練和推理的開源 EP(expert parallelism,專家并行)通信庫,主要適用于大模型訓練,特別是需要 EP 的集群訓練。它通過優(yōu)化通信信道的使用率,提升了訓練效率。摩爾線程基于 MUSA Compute Capability 3.1 全功能 GPU 適配了 DeepEP,并支持以下特性:2RW28資訊網(wǎng)——每日最新資訊28at.com

高效優(yōu)化的 All-to-All 通信,支持 dispatch & combine2RW28資訊網(wǎng)——每日最新資訊28at.com

支持 MTLink + GPU(MUSA Compute Capability 3.1)節(jié)點內(nèi)通信2RW28資訊網(wǎng)——每日最新資訊28at.com

訓練及推理預填充階段的高吞吐量計算核心2RW28資訊網(wǎng)——每日最新資訊28at.com

推理解碼階段的低延遲計算核心2RW28資訊網(wǎng)——每日最新資訊28at.com

原生支持 FP8 數(shù)據(jù)分發(fā)2RW28資訊網(wǎng)——每日最新資訊28at.com

靈活控制 GPU 資源,實現(xiàn)計算與通信的高效重疊2RW28資訊網(wǎng)——每日最新資訊28at.com

DualPipe 是 DeepSeek-V3 提出的雙向流水線并行算法,通過前向計算與后向計算階段的計算與通信完全重疊,減少了“流水線氣泡”(設備空閑等待)。摩爾線程依托深度學習框架 Torch-MUSA(已開源)和 MUSA 軟件棧全方位的兼容性,實現(xiàn)了對 DualPipe 這一算法的支持。2RW28資訊網(wǎng)——每日最新資訊28at.com

目前,MT-DualPipe 可以完整接入摩爾線程 MT-Megatron 框架和 MT-TransformerEngine 框架(即將開源),實現(xiàn) DeepSeek V3 訓練流程完整復現(xiàn)。此外,MT-DualPipe 結合 MT-Megatron 可實現(xiàn)完整 DeepSeek V3 模型 MLP-FFN 分離以及 DW-DG 分離,進一步降低氣泡占比,優(yōu)化通信效率。同時,MT-DualPipe 與 MT-TranformerEngine 和 MT-DeepEP 的結合,可利用 MT-DeepEP 和異步通信引擎實現(xiàn)更高效的通信掩蓋,降低對計算資源損耗。2RW28資訊網(wǎng)——每日最新資訊28at.com

附 Torch-MUSA 開源地址如下:2RW28資訊網(wǎng)——每日最新資訊28at.com

https://github.com/MooreThreads/Torch_MUSA2RW28資訊網(wǎng)——每日最新資訊28at.com

相關閱讀:2RW28資訊網(wǎng)——每日最新資訊28at.com

《DeepSeek 開源進度 4/5:DualPipe、EPLB 優(yōu)化并行策略》2RW28資訊網(wǎng)——每日最新資訊28at.com

《DeepSeek 開源進度 3/5:深度學習利器 DeepGEMM》2RW28資訊網(wǎng)——每日最新資訊28at.com

《DeepSeek 開源進度 2/5:首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP》2RW28資訊網(wǎng)——每日最新資訊28at.com

《DeepSeek 代碼庫開源進度 1/5:為 Hopper GPU 優(yōu)化的高效 MLA 解碼內(nèi)核 FlashMLA》2RW28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-11260-0.html摩爾線程成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 騰訊混元新一代快思考模型 Turbo S 發(fā)布,支持“秒回”

下一篇: 地道表達 + 文化解讀:谷歌翻譯醞釀“追問”功能,打造你的專屬 AI 外教

標簽:
  • 熱門焦點
  • 內(nèi)容行業(yè)大變天,爆款全靠AI?

    出品 | 微果醬(wjam123456)作者 | 陳出木題圖 | 文心一格 AI的發(fā)展之快出乎所有人的預料,似乎一夜之間便呼嘯而來。無論是資本的風向標,抑或是生活工作的輔助、流量口,還是茶余飯
  • 元宇宙里賣酸奶,好炸裂的操作!

    作者 | 李東陽 來源 | 首席營銷官有沒有發(fā)現(xiàn),當下的熱搜出現(xiàn)一個有意思的現(xiàn)象,那就是“情懷”不知不覺成為了主流,爺青回話題討論性非常高。前有名偵探柯南和優(yōu)衣庫
  • 元宇宙步入暗夜

    撰文 | 文燁豪元宇宙的故事,似乎講不通了。 當下,刮起元宇宙熱潮的Roblox股價已跌去大半,帶頭大哥Meta也正因元宇宙虧損深陷泥潭。 再看國內(nèi),從字節(jié)“派對島&
  • “虛擬人”角斗場,基于“硬實力”下的人性平衡法則?

    在打工人“反內(nèi)卷”的當下,一眾虛擬人卻“內(nèi)卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》,央美畢業(yè)的虛擬人夏語冰登上央視節(jié)目《對話》,湖南
  • Terra鏈上TVL躍升至第二

    據(jù)DefiLlama數(shù)據(jù)顯示,當前,Terra鏈上應用鎖倉的加密資產(chǎn)價值(TVL)為172.1億美元,在公鏈板塊中已躍升至第二,超越了幣安智能鏈TVL的118億美元,TVL排名居首的仍為以太
  • 傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈場景下數(shù)據(jù)權利法律分析

    數(shù)據(jù)權益的復雜性在于數(shù)據(jù)涉及多環(huán)節(jié)多主體、內(nèi)容不同質(zhì)且與不同場景緊密聯(lián)系、對軟硬件技術環(huán)節(jié)緊密相關等方面的復雜性。在傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈模式下,數(shù)據(jù)處
  • 韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

    韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance(幣安)達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
  • NFT高玩必備:NFT分析工具大盤點

    NFT市場的火熱讓越來越多的投資者投身其中,但當前的 NFT 生態(tài)系統(tǒng)存在幾個問題卻困擾了大多數(shù)人,如難以準確評估 NFT 項目的資產(chǎn)價格、缺乏 NFT 市場動態(tài)信息、
  • 多位全國政協(xié)委員提交元宇宙提案,國金證券稱元宇宙仍處初期投資階段

    財聯(lián)社|區(qū)塊鏈日報2日訊 今日《元宇宙新鮮事》有:全國政協(xié)委員劉偉建議出臺“元宇宙中國”的頂層設計方案;國金證券稱元宇宙仍處初期投資龐大獲利不易階段;阿聯(lián)酋
Top 主站蜘蛛池模板: 石阡县| 兴安盟| 始兴县| 万州区| 英德市| 阿克陶县| 安义县| 广宗县| 汽车| 凌云县| 连云港市| 玉门市| 丹棱县| 福清市| 兴海县| 武夷山市| 舞钢市| 旬阳县| 台中县| 玛沁县| 大姚县| 日土县| 贡嘎县| 久治县| 田阳县| 长岭县| 姜堰市| 社会| 安陆市| 浮山县| 凤翔县| 永安市| 铜川市| 福建省| 陵水| 丹阳市| 锦屏县| 木里| 金华市| 泉州市| 毕节市|