當前位置：首頁 > 元宇宙 > AI

DeepSeek 開源進度 2 5：首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP

來源：責編：時間：2025-02-26 12:23:46 106觀看

導讀 2 月 25 日消息，DeepSeek 的“開源周”活動今日已經來到第二天，今天發布的是首個開源的用于 MoE 模型訓練和推理的 EP 通信庫 ——DeepEP。附開源地址：https://github.com/deepseek-ai/DeepEP官方表示其具備如下

2 月 25 日消息，DeepSeek 的“開源周”活動今日已經來到第二天，今天發布的是首個開源的用于 MoE 模型訓練和推理的 EP 通信庫 ——DeepEP。

附開源地址：https://github.com/deepseek-ai/DeepEP

官方表示其具備如下特征：

高效優化的全到全通信方式

支持節點內外通信，兼容 NVLink 和 RDMA 技術

提供高吞吐量的內核，提升訓練和推理前期填充效率

提供低延遲內核，優化推理解碼速度

完全支持 FP8 數據格式調度

提供靈活的 GPU 資源管理，支持計算與通信的重疊執行

詳細介紹的大意如下：

DeepEP 是一款專為混合專家（MoE）和專家并行（EP）設計的通信庫，提供了高吞吐量和低延遲的 all-to-all GPU 內核，常用于 MoE 派發和合并操作。該庫還支持低精度計算，包括 FP8。

為了與 DeepSeek-V3 論文中提出的組限制門控算法兼容，DeepEP 提供了一些針對不對稱帶寬轉發優化的內核，比如將數據從 NVLink 域轉發到 RDMA 域。這些優化的內核能夠提供高吞吐量，適合用于訓練和推理的預填充任務，同時支持 SM（流式多處理器）數量控制。

對于延遲敏感型的推理解碼任務，DeepEP 提供了一套低延遲內核，采用純 RDMA 技術以最大程度減少延遲。此外，該庫還采用了一種基于 Hook 的通信與計算重疊方法，不會占用任何 SM 資源。

需求：

Hopper GPUs (may support more architectures or devices later)

Python 3.8 及以上版本

CUDA 12.3 及以上版本

PyTorch 2.1 及以上版本

使用 NVLink 進行節點間通信

基于 RDMA 網絡的節點間通信

本文鏈接：http://www.www897cc.com/showinfo-45-11125-0.htmlDeepSeek 開源進度 2 5：首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：上海明星 AI 公司“瀾碼科技”曝“員工停薪社保停繳”，創始人周健回應稱“借錢賣房補償，正尋求被并購的可能性”

下一篇：阿里 Qwen Chat 平臺上線“深度思考”功能：基于 QwQ-Max-Preview 推理模型，支持聯網搜索

標簽：

熱門焦點

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

如果說2021年底什么最火熱，那元宇宙當之無愧。“萬物皆可元宇宙”似乎成為新的流行語，在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日，有消息傳
新款英特爾芯片將使NFT鑄造變得更加方便

科技巨頭和微處理器制造商英特爾（Intel）正在發布一款適用于 NFT 鑄造和挖礦的新芯片。新產品專注于效率、易操作性和可持續性，該公司的戰略是從加密興起與 NFT爆
從冰墩墩到無聊猿，解秘未來IP爆款的模因

打造IP，是建設元宇宙的剛需。NFT能直接讓IP的價值變現；虛擬人IP是元宇宙的第一入口，而元宇宙要搭建的，就是一個個品牌IP星球，考驗的是IP世界觀的建設能力。如果說在
元宇宙“概念股”集體崩塌，背后究竟發生了什么？

近期，Roblox和Meta公布了第四季度的財務報告，在財報發布一日后，股價大跌。作為市值一度超過1萬億美元的世界第六大公司Meta，股價大跌4%，市值降至5650億美元，甚至跌出
NFT自動售貨機來啦！

“紐約市有一臺售賣 Solana NFT 的自動售貨機，用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT，無需使用加密貨幣。由于基于 Solana 鏈的 N
在元宇宙開會是什么樣一種體驗

空間就是一切還記得面對面的會議嗎？就在不久前，與會者需要飛到遙遠的目的地，并進行鼓舞人心的對話、網絡、免費食物，甚至可能會有一兩個很好的小組討論。隨之而來
想進入web3.0？來看看哪些工作適合你

隨著對加密貨幣需求的增加，加密領域的工作的數量也在增加。以下是一些非技術性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導致區塊鏈領域的求職
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
大廠打造元宇宙平臺的業務重心是什么？

知名市場研究機構IDC發布《2022年中國元宇宙市場十大預測》報告，其中提出互聯網大廠各自獨立布局元宇宙平臺。事實上，在2021年的最后一個季度，包括Meta、英偉達、

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

DeepSeek 開源進度 2 5：首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

新款英特爾芯片將使NFT鑄造變得更加方便

從冰墩墩到無聊猿，解秘未來IP爆款的模因

元宇宙“概念股”集體崩塌，背后究竟發生了什么？

NFT自動售貨機來啦！

在元宇宙開會是什么樣一種體驗

想進入web3.0？來看看哪些工作適合你

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

大廠打造元宇宙平臺的業務重心是什么？

最新推薦

關于ChatGPT的10點思考

城市數字孿生標準化白皮書（2022版）

2021年中國元宇宙行業用戶行為分析熱點報告

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

元宇宙的應用行業研究：娛樂可能是元宇宙落地最快的場景之一

猜你喜歡

熱門推薦

相關資訊