日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

摩爾線程成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe

來源: 責編: 時間:2025-03-02 09:07:16 68觀看
導讀 2 月 27 日消息,在 DeepSeek 開源周第四日,摩爾線程宣布已成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe,并發(fā)布相關開源代碼倉庫:MT-DeepEP 和 MT-DualPipe。據介紹,DeepEP 是一個用于 MoE(混合專家)模

2 月 27 日消息,在 DeepSeek 開源周第四日,摩爾線程宣布已成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe,并發(fā)布相關開源代碼倉庫:MT-DeepEP 和 MT-DualPipe。bNC28資訊網——每日最新資訊28at.com

bNC28資訊網——每日最新資訊28at.com

據介紹,DeepEP 是一個用于 MoE(混合專家)模型訓練和推理的開源 EP(expert parallelism,專家并行)通信庫,主要適用于大模型訓練,特別是需要 EP 的集群訓練。它通過優(yōu)化通信信道的使用率,提升了訓練效率。摩爾線程基于 MUSA Compute Capability 3.1 全功能 GPU 適配了 DeepEP,并支持以下特性:bNC28資訊網——每日最新資訊28at.com

高效優(yōu)化的 All-to-All 通信,支持 dispatch & combinebNC28資訊網——每日最新資訊28at.com

支持 MTLink + GPU(MUSA Compute Capability 3.1)節(jié)點內通信bNC28資訊網——每日最新資訊28at.com

訓練及推理預填充階段的高吞吐量計算核心bNC28資訊網——每日最新資訊28at.com

推理解碼階段的低延遲計算核心bNC28資訊網——每日最新資訊28at.com

原生支持 FP8 數據分發(fā)bNC28資訊網——每日最新資訊28at.com

靈活控制 GPU 資源,實現計算與通信的高效重疊bNC28資訊網——每日最新資訊28at.com

DualPipe 是 DeepSeek-V3 提出的雙向流水線并行算法,通過前向計算與后向計算階段的計算與通信完全重疊,減少了“流水線氣泡”(設備空閑等待)。摩爾線程依托深度學習框架 Torch-MUSA(已開源)和 MUSA 軟件棧全方位的兼容性,實現了對 DualPipe 這一算法的支持。bNC28資訊網——每日最新資訊28at.com

目前,MT-DualPipe 可以完整接入摩爾線程 MT-Megatron 框架和 MT-TransformerEngine 框架(即將開源),實現 DeepSeek V3 訓練流程完整復現。此外,MT-DualPipe 結合 MT-Megatron 可實現完整 DeepSeek V3 模型 MLP-FFN 分離以及 DW-DG 分離,進一步降低氣泡占比,優(yōu)化通信效率。同時,MT-DualPipe 與 MT-TranformerEngine 和 MT-DeepEP 的結合,可利用 MT-DeepEP 和異步通信引擎實現更高效的通信掩蓋,降低對計算資源損耗。bNC28資訊網——每日最新資訊28at.com

附 Torch-MUSA 開源地址如下:bNC28資訊網——每日最新資訊28at.com

https://github.com/MooreThreads/Torch_MUSAbNC28資訊網——每日最新資訊28at.com

相關閱讀:bNC28資訊網——每日最新資訊28at.com

《DeepSeek 開源進度 4/5:DualPipe、EPLB 優(yōu)化并行策略》bNC28資訊網——每日最新資訊28at.com

《DeepSeek 開源進度 3/5:深度學習利器 DeepGEMM》bNC28資訊網——每日最新資訊28at.com

《DeepSeek 開源進度 2/5:首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP》bNC28資訊網——每日最新資訊28at.com

《DeepSeek 代碼庫開源進度 1/5:為 Hopper GPU 優(yōu)化的高效 MLA 解碼內核 FlashMLA》bNC28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-11260-0.html摩爾線程成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 騰訊混元新一代快思考模型 Turbo S 發(fā)布,支持“秒回”

下一篇: 地道表達 + 文化解讀:谷歌翻譯醞釀“追問”功能,打造你的專屬 AI 外教

標簽:
  • 熱門焦點
  • ChatGPT訪問量增速下滑,AI真的是一場泡沫嗎?

    來源:首席商業(yè)評論2023年,最火的莫過于ChatGPT,席卷全球的同時也引發(fā)了生成式AI(人工智能)的投資熱潮。在美股,ChatGPT相關概念股飆漲,以AI算力龍頭英偉達為例,其股價年內一度累計上
  • 亞馬遜AIGC全家桶來襲,巨頭AI大亂戰(zhàn)都有什么殺手锏

    此前,亞馬遜云科技發(fā)布多款AIGC產品,其中包括AI大模型服務Amazon Bedrock、人工智能計算實例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型、軟件
  • 字節(jié)跳動,剛剛投了一位虛擬女生

    今年第一筆虛擬人融資出爐了。投資界獲悉,杭州李未可科技有限公司顯示發(fā)生股東變更,新增字節(jié)跳動關聯(lián)公司北京量子躍動科技有限公司。今天公司方面正式確認,本輪
  • “虛擬人”角斗場,基于“硬實力”下的人性平衡法則?

    在打工人“反內卷”的當下,一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》,央美畢業(yè)的虛擬人夏語冰登上央視節(jié)目《對話》,湖南
  • 城市數字孿生標準化白皮書(2022版)

    當前,城市數字孿生已經發(fā)展成為支撐智慧城市的重要技術手段。城市數字孿生通過在數字空間對城市物理空間和社會空間進行全要素表達、全過程呈現、全周期可溯,實
  • 上海虹口成立10億元元宇宙基金,香港首只元宇宙ETF擬上市

    區(qū)塊鏈日報17日訊 今日《元宇宙新鮮事》有:上海虹口將成立總額約10億元的元宇宙產業(yè)基金;香港市場首只元宇宙主題ETF擬于2月21日上市;元宇宙平臺Roblox出現違禁游
  • 量子計算在未來能否提高區(qū)塊鏈技術的效率

    區(qū)塊鏈技術的主要成功之處在于對不透明的金融流程進行了去中心化的訪問量子計算機的內在目標是解決傳統(tǒng)計算機不可能解決的問題隨著區(qū)塊鏈技術的使用案例逐漸
  • MR——元宇宙平臺的下一代入口

    作為“元宇宙”的領頭羊,Meta的一舉一動都受到業(yè)內的高度關注。華爾街見聞提及,2月17日周四,Facebook母公司Meta在透露,其混合現實技術(MR)將在幾年后實現,讓人們對元
  • 3月份值得關注的5個NFT項目

    2021年,我們見證了一個新的創(chuàng)造者經濟的誕生。它是在區(qū)塊鏈上誕生的。自從NFT成為流行文化的中心舞臺以來,有些藝術家們已經成為了NFT的超級明星,在幾個月的時間
Top 主站蜘蛛池模板: 永兴县| 万源市| 体育| 大石桥市| 邵阳县| 大渡口区| 林芝县| 伊金霍洛旗| 阆中市| 虎林市| 云梦县| 越西县| 盐池县| 福安市| 电白县| 桐城市| 舒兰市| 灵台县| 芮城县| 龙山县| 甘洛县| 百色市| 德清县| 肥乡县| 江山市| 临江市| 平山县| 阳曲县| 灵寿县| 辉县市| 彰武县| 潢川县| 康马县| 洞口县| 马公市| 施甸县| 祁阳县| 达日县| 嘉禾县| 老河口市| 合江县|