日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 資訊

摩爾線程GPU實力展現:快速適配DeepSeek開源庫,原生FP8計算能力引關注!

來源: 責編: 時間:2025-02-27 08:21:38 93觀看
導讀近日,DeepSeek宣布啟動“開源周”活動,并陸續釋放了三個重要的代碼庫資源。國產GPU領域的佼佼者摩爾線程迅速響應,成功完成了對FlashMLA和DeepGEMM兩大開源項目的適配工作。摩爾線程此番適配的GPU產品,基于其自主研發的MU

近日,DeepSeek宣布啟動“開源周”活動,并陸續釋放了三個重要的代碼庫資源。國產GPU領域的佼佼者摩爾線程迅速響應,成功完成了對FlashMLA和DeepGEMM兩大開源項目的適配工作。yT428資訊網——每日最新資訊28at.com

摩爾線程此番適配的GPU產品,基于其自主研發的MUSA Compute Capability 3.1計算架構。這一架構不僅提供了原生的FP8精度計算能力,還對高性能線性代數模板庫MUTLASS進行了全面升級,從而快速支持了FlashMLA的應用。yT428資訊網——每日最新資訊28at.com

不僅如此,摩爾線程還充分利用了MUTLASS的優勢,在新一代GPU架構上實現了FP8矩陣乘法的優化。這一成果使得摩爾線程的GPU能夠完美支持DeepGEMM的相關功能,進一步提升了其在大規模模型訓練和推理方面的性能。yT428資訊網——每日最新資訊28at.com

FlashMLA是一個專注于加速MLA推理的內核開源項目,特別適用于DeepSeek系列模型,如DeepSeek-V2、V3和R1等。而DeepGEMM則是一個專為密集矩陣與混合專家(MoE)矩陣乘法設計的FP8 GEMM庫,能夠為V3/R1的訓練與推理提供強大的計算支持。yT428資訊網——每日最新資訊28at.com

這兩個開源項目均基于高性能通用矩陣乘法(GEMM)的C++模板庫進行開發,具有極高的靈活性和可擴展性。摩爾線程能夠快速適配這些項目,得益于其GPU架構的創新設計和MUTLASS庫的強大支持。yT428資訊網——每日最新資訊28at.com

摩爾線程的新一代GPU不僅具備全新的Tensor計算引擎和數據搬運引擎,還提供了原生FP8計算能力。這使得摩爾線程的GPU在處理前沿算法時,能夠保持足夠高的累加精度,無需額外的二次精度修正。yT428資訊網——每日最新資訊28at.com

MUTLASS 0.2.0版本的發布,更是為摩爾線程的開源生態注入了新的活力。借助這一版本,摩爾線程推出了MT-FlashMLA開源倉庫,實現了對DeepSeek FlashMLA的快速兼容部署。同時,MUTLASS還提供了一個全新的參考實現,充分借鑒了FlashAttention3的先進算法思想,為摩爾線程GPU設計了高效的計算流水線。yT428資訊網——每日最新資訊28at.com

yT428資訊網——每日最新資訊28at.com

這一計算流水線的設計,有效隱藏了數據搬運的延遲和Softmax計算的開銷,充分發揮了摩爾線程MUSA Compute Capability 3.1全功能GPU的Tensor計算效率。這無疑為摩爾線程在AI計算領域的競爭力注入了強勁的動力。yT428資訊網——每日最新資訊28at.com

對于開發者而言,摩爾線程的開源資源無疑是一筆寶貴的財富。他們可以通過訪問以下鏈接,獲取MT-FlashMLA和MUTLASS的相關資源:yT428資訊網——每日最新資訊28at.com

MT-FlashMLA開源地址:https://github.com/MooreThreads/MT-flashMLAyT428資訊網——每日最新資訊28at.com

MUTLASS FlashAttention3地址:https://github.com/MooreThreads/mutlass/tree/main/experimental/mp31_flash_attention_fwdyT428資訊網——每日最新資訊28at.com

舉報 0收藏 0打賞 0評論 0  更多>同類資訊中科曙光FlashNexus刷新SPC-1基準測試紀錄,登頂全球存儲性能巔峰!02-26be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場02-26EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效02-26海南商業航天發射場二期:可復用火箭測控船項目正式簽約!02-26天智航2024年業績快報:營收下滑,凈虧損收窄至1.23億元02-26攀枝花光解水制氫項目落地,綠氫產業迎來商業化新篇章!02-26邁信林2024年凈利大增近2倍,業績快報亮點搶先看!02-26《哪吒2》IP衍生品火爆,品牌廠商加速生產沖刺“千戶千吒”市場02-26天智航2024年財報:手術機器人“第一股”業績初現曙光,凈虧損大幅收窄02-26RTX 5060 Ti即將發布:功耗升至180W,顯存配置仍為8GB/16GB02-26smart精靈#1黑金靈限量版來襲!21.99萬僅售500臺,你心動了嗎?02-26威高血凈IPO過會,年營收達36億,擬募資13.5億,華興資本持股其中02-26smart精靈#1黑金靈限量版來襲!21.99萬僅500臺,你會搶購嗎?02-26掌閱科技股東量子躍動計劃減持股份 不超過公司總股本1%02-26小米15 Ultra影像旗艦來襲!2億像素長焦+驍龍8 Elite,性能與影像巔峰對決?02-26點擊查看更多 +全站最新奇瑞艾瑞澤8 PRO新車型預售在即,A+級家轎外觀內飾全面升級!奇瑞艾瑞澤8 PRO新車型預售在即,A+級家轎外觀內飾全面升級!be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場極氪智能科技離線部署AI大模型,8295座艙平臺車型年內全落地極氪智能科技離線部署AI大模型,8295座艙平臺車型年內全落地上汽安吉物流“兩港三地”汽車吞吐量領跑全球,年吞吐363萬輛!上汽安吉物流“兩港三地”汽車吞吐量領跑全球,年吞吐363萬輛!無極SR250GT雙版本煥新來襲,DeepSeek大模型賦能,售價15980元起!無極SR250GT雙版本煥新來襲,DeepSeek大模型賦能,售價15980元起!EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效熱門內容
  • 《哪吒之魔童降世》票房破110億,全球影史排名第十二!《美國隊長4》上映票房如何?
  • 2025春節檔火爆!《哪吒之魔童鬧海》領跑,總票房直逼55億大關
  • 浙大智能體“浙大先生”上線,全國829所高校師生可免費共享DeepSeek
  • 《唐探1900》春節檔上映,豆瓣評分6.7,口碑兩極分化?
  • 金價飆升!847元/克金飾創新高,黃金牛市還能走多遠?
  • 浙大DeepSeek全國高校開放!829所學子免費用,告別系統繁忙
  • 《哪吒2》票房高歌猛進,全球動畫電影榜沖進前三!
  • 《哪吒之魔童鬧海》票房破20億,領跑春節檔,第三部還會遠嗎?
  • 《哪吒之魔童鬧海》春節檔大捷,單日票房破17億刷新動畫電影紀錄!
  • 《蛟龍行動》遇一星差評潮,于冬怒批豆瓣粉圈互黑,誓言影片絕不撤檔!
  • 美攝科技勝訴!字節跳動8款產品被判代碼抄襲賠償8266萬
  • 《熊出沒》動畫電影系列十一部齊發力,總票房突破80億大關!
  • 2025年春節檔電影盛宴:六部大片齊賀歲,哪部將成票房黑馬?
  • 導演票房榜大洗牌:餃子躋身前三,張藝謀緊隨其后
  • 短劇熱度榜揭曉!《行道者之劍二十四》登頂,大盤熱度破6000萬
本欄最新中科曙光FlashNexus刷新SPC-1基準測試紀錄,登頂全球存儲性能巔峰!中科曙光FlashNexus刷新SPC-1基準測試紀錄,登頂全球存儲性能巔峰!be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效海南商業航天發射場二期:可復用火箭測控船項目正式簽約!海南商業航天發射場二期:可復用火箭測控船項目正式簽約!天智航2024年業績快報:營收下滑,凈虧損收窄至1.23億元天智航2024年業績快報:營收下滑,凈虧損收窄至1.23億元攀枝花光解水制氫項目落地,綠氫產業迎來商業化新篇章!攀枝花光解水制氫項目落地,綠氫產業迎來商業化新篇章!

本文鏈接:http://www.www897cc.com/showinfo-16-134118-0.html摩爾線程GPU實力展現:快速適配DeepSeek開源庫,原生FP8計算能力引關注!

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 涂鴉智能Q4財報亮點:營收增27%,利息收入助盈利,派息達3700萬美元

下一篇: 中科曙光FlashNexus刷新SPC-1基準測試紀錄,登頂全球存儲性能巔峰!

標簽:
  • 熱門焦點
  • 5月iOS設備好評榜:iPhone 14僅排第43?

    來到新的一月,安兔兔的各個榜單又重新匯總了數據,像安卓陣營的榜單都有著比較大的變動,不過iOS由于設備的更新換代并沒有那么快,所以相對來說變化并不大,特別是iOS好評榜,老款設
  • iPhone賣不動了!蘋果股價創年內最大日跌幅:市值一夜蒸發萬億元

    8月5日消息,今天凌晨美股三大指數高開低走集體收跌,道指跌0.41%;納指跌0.36%;標普500指數跌0.52%。熱門科技股也都變化極大,其中蘋果報181.99美元,跌4.8%,創
  • 三言兩語說透設計模式的藝術-簡單工廠模式

    一、寫在前面工廠模式是最常見的一種創建型設計模式,通常說的工廠模式指的是工廠方法模式,是使用頻率最高的工廠模式。簡單工廠模式又稱為靜態工廠方法模式,不屬于GoF 23種設計
  • 企業采用CRM系統的11個好處

    客戶關系管理(CRM)軟件可以為企業提供很多的好處,從客戶保留到提高生產力。  CRM軟件用于企業收集客戶互動,以改善客戶體驗和滿意度。  CRM軟件市場規模如今超過580
  • 在線圖片編輯器,支持PSD解析、AI摳圖等

    自從我上次分享一個人開發仿造稿定設計的圖片編輯器到現在,不知不覺已過去一年時間了,期間我經歷了裁員失業、面試找工作碰壁,寒冬下一直沒有很好地履行計劃.....這些就放在日
  • 騰訊VS網易,最卷游戲暑期檔,誰能笑到最后?

    作者:無銹缽來源:財經無忌7月16日晚,上海1862時尚藝術中心。伴隨著幻象的精準命中,碩大的熒幕之上,比分被定格在了14:12,被寄予厚望的EDG戰隊以絕對的優勢戰勝了BLG戰隊,拿下了總決
  • 網紅炒股不為了賺錢,那就是耍流氓!

    來源:首席商業評論6月26日高調宣布入市,網絡名嘴大v胡錫進居然進軍了股市。在一次財經媒體峰會上,幾個財經圈媒體大佬就“胡錫進炒股是否知道認真報道”展開討論。有
  • iQOO 11S或7月上市:搭載“雞血版”驍龍8Gen2 史上最強5G Soc

    去年底,iQOO推出了“電競旗艦”iQOO 11系列,作為一款性能強機,iQOO 11不僅全球首發2K 144Hz E6全感屏,搭載了第二代驍龍8平臺及144Hz電競屏,同時在快充
  • 利用職權私自解除被封帳號 Meta開除20多名員工

    11月18日消息,據外媒援引知情人士表示,過去一年時間內,Facebook母公司Meta解雇或處罰了20多名員工以及合同工,指控這些人通過內部系統以不當方式重置用戶帳號,其
Top 主站蜘蛛池模板: 富川| 庆城县| 博乐市| 胶南市| 无极县| 河津市| 北宁市| 共和县| 宁陵县| 额尔古纳市| 县级市| 蒙城县| 西安市| 疏附县| 定陶县| 雅安市| 太保市| 河北区| 明星| 北辰区| 班玛县| 保康县| 舞阳县| 古田县| 海安县| 通道| 鹰潭市| 江源县| 台湾省| 大英县| 东阿县| 介休市| 云浮市| 西城区| 临泽县| 大安市| 舟山市| 临城县| 宾阳县| 保定市| 宿州市|