日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

DeepSeek 開源進度 2 5:首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP

來源: 責編: 時間:2025-02-26 12:23:46 106觀看
導讀 2 月 25 日消息,DeepSeek 的“開源周”活動今日已經來到第二天,今天發布的是首個開源的用于 MoE 模型訓練和推理的 EP 通信庫 ——DeepEP。附開源地址:https://github.com/deepseek-ai/DeepEP官方表示其具備如下

2 月 25 日消息,DeepSeek 的“開源周”活動今日已經來到第二天,今天發布的是首個開源的用于 MoE 模型訓練和推理的 EP 通信庫 ——DeepEP。dyA28資訊網——每日最新資訊28at.com

附開源地址:https://github.com/deepseek-ai/DeepEPdyA28資訊網——每日最新資訊28at.com

dyA28資訊網——每日最新資訊28at.com

官方表示其具備如下特征:dyA28資訊網——每日最新資訊28at.com

高效優化的全到全通信方式dyA28資訊網——每日最新資訊28at.com

支持節點內外通信,兼容 NVLink 和 RDMA 技術dyA28資訊網——每日最新資訊28at.com

提供高吞吐量的內核,提升訓練和推理前期填充效率dyA28資訊網——每日最新資訊28at.com

提供低延遲內核,優化推理解碼速度dyA28資訊網——每日最新資訊28at.com

完全支持 FP8 數據格式調度dyA28資訊網——每日最新資訊28at.com

提供靈活的 GPU 資源管理,支持計算與通信的重疊執行dyA28資訊網——每日最新資訊28at.com

詳細介紹的大意如下:dyA28資訊網——每日最新資訊28at.com

DeepEP 是一款專為混合專家(MoE)和專家并行(EP)設計的通信庫,提供了高吞吐量和低延遲的 all-to-all GPU 內核,常用于 MoE 派發和合并操作。該庫還支持低精度計算,包括 FP8。dyA28資訊網——每日最新資訊28at.com

為了與 DeepSeek-V3 論文中提出的組限制門控算法兼容,DeepEP 提供了一些針對不對稱帶寬轉發優化的內核,比如將數據從 NVLink 域轉發到 RDMA 域。這些優化的內核能夠提供高吞吐量,適合用于訓練和推理的預填充任務,同時支持 SM(流式多處理器)數量控制。dyA28資訊網——每日最新資訊28at.com

對于延遲敏感型的推理解碼任務,DeepEP 提供了一套低延遲內核,采用純 RDMA 技術以最大程度減少延遲。此外,該庫還采用了一種基于 Hook 的通信與計算重疊方法,不會占用任何 SM 資源。dyA28資訊網——每日最新資訊28at.com

需求:dyA28資訊網——每日最新資訊28at.com

Hopper GPUs (may support more architectures or devices later)dyA28資訊網——每日最新資訊28at.com

Python 3.8 及以上版本dyA28資訊網——每日最新資訊28at.com

CUDA 12.3 及以上版本dyA28資訊網——每日最新資訊28at.com

PyTorch 2.1 及以上版本dyA28資訊網——每日最新資訊28at.com

使用 NVLink 進行節點間通信dyA28資訊網——每日最新資訊28at.com

基于 RDMA 網絡的節點間通信dyA28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-11125-0.htmlDeepSeek 開源進度 2 5:首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 上海明星 AI 公司“瀾碼科技”曝“員工停薪社保停繳”,創始人周健回應稱“借錢賣房補償,正尋求被并購的可能性”

下一篇: 阿里 Qwen Chat 平臺上線“深度思考”功能:基于 QwQ-Max-Preview 推理模型,支持聯網搜索

標簽:
  • 熱門焦點
  • 企業熱、用戶冷,元宇宙第一站將是“營銷場”?

    如果說2021年底什么最火熱,那元宇宙當之無愧。“萬物皆可元宇宙”似乎成為新的流行語,在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日,有消息傳
  • 新款英特爾芯片將使NFT鑄造變得更加方便

    科技巨頭和微處理器制造商英特爾(Intel)正在發布一款適用于 NFT 鑄造和挖礦的新芯片。新產品專注于效率、易操作性和可持續性,該公司的戰略是從加密興起與 NFT爆
  • 從冰墩墩到無聊猿,解秘未來IP爆款的模因

    打造IP,是建設元宇宙的剛需。NFT能直接讓IP的價值變現;虛擬人IP是元宇宙的第一入口,而元宇宙要搭建的,就是一個個品牌IP星球,考驗的是IP世界觀的建設能力。如果說在
  • 元宇宙“概念股”集體崩塌,背后究竟發生了什么?

    近期,Roblox和Meta公布了第四季度的財務報告,在財報發布一日后,股價大跌。作為市值一度超過1萬億美元的世界第六大公司Meta,股價大跌4%,市值降至5650億美元,甚至跌出
  • NFT自動售貨機來啦!

    “紐約市有一臺售賣 Solana NFT 的自動售貨機,用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT,無需使用加密貨幣。由于基于 Solana 鏈的 N
  • 在元宇宙開會是什么樣一種體驗

    空間就是一切還記得面對面的會議嗎?就在不久前,與會者需要飛到遙遠的目的地,并進行鼓舞人心的對話、網絡、免費食物,甚至可能會有一兩個很好的小組討論。隨之而來
  • 想進入web3.0?來看看哪些工作適合你

    隨著對加密貨幣需求的增加,加密領域的工作的數量也在增加。以下是一些非技術性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導致區塊鏈領域的求職
  • 韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

    韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance(幣安)達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
  • 大廠打造元宇宙平臺的業務重心是什么?

    知名市場研究機構IDC發布《2022年中國元宇宙市場十大預測》報告,其中提出互聯網大廠各自獨立布局元宇宙平臺。事實上,在2021年的最后一個季度,包括Meta、英偉達、
Top 主站蜘蛛池模板: 香格里拉县| 巨鹿县| 临漳县| 三河市| 英山县| 保靖县| 宁乡县| 佛山市| 靖安县| 嘉荫县| 娱乐| 柞水县| 江门市| 新巴尔虎左旗| 深泽县| 米脂县| 西乌珠穆沁旗| 泸水县| 兴义市| 通化县| 吉首市| 石柱| 河源市| 开平市| 长泰县| 绵阳市| 吉木萨尔县| 滨海县| 临颍县| 威海市| 赤水市| 绵阳市| 井研县| 菏泽市| 原阳县| 新乡县| 广河县| 文化| 开化县| 汤原县| 巴南区|