日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 數碼

國產GPU突破!摩爾線程發布Torch-MUSA v2.0.0:FP8原生支持

來源: 責編: 時間:2025-05-11 10:23:32 35觀看
導讀 快科技5月9日消息,近日,國產GPU廠商摩爾線程正式發布Torch-MUSA v2.0.0版本,這是其面向PyTorch深度學習框架的MUSA擴展庫的重要升級。在Torch-MUSA中,用戶只需指定torch.device("musa"),即可將現有的PyTorch模型

快科技5月9日消息,近日,國產GPU廠商摩爾線程正式發布Torch-MUSA v2.0.0版本,這是其面向PyTorch深度學習框架的MUSA擴展庫的重要升級。APQ28資訊網——每日最新資訊28at.com

在Torch-MUSA中,用戶只需指定torch.device("musa"),即可將現有的PyTorch模型遷移到MUSA架構的GPU上運行,無需大幅修改代碼,目前Torch-MUSA已完全開源,可通過GitHub獲取源代碼。APQ28資訊網——每日最新資訊28at.com

作為本次升級的核心亮點,Torch-MUSA v2.0.0率先在國產GPU上實現了對FP8數據類型的完整支持。APQ28資訊網——每日最新資訊28at.com

FP8是當前AI計算的一種低精度格式,在支持原生FP8的GPU上,大語言模型訓練采用FP8混合精度可大幅提高GPU算力,降低顯存占用。APQ28資訊網——每日最新資訊28at.com

摩爾線程基于新一代MUSA Compute Capability 3.1計算架構的全功能GPU原生支持FP8計算,為Torch-MUSA v2.0.0實現FP8矩陣乘法和分布式通信優化提供了基礎。APQ28資訊網——每日最新資訊28at.com

依托這一底層架構優勢,Torch-MUSA v2.0.0能夠充分發揮FP8的計算效能,顯著提升大語言模型訓練和推理的效率。APQ28資訊網——每日最新資訊28at.com

Torch-MUSA v2.0.0在MUSA計算平臺引入多項創新功能,進一步提升深度學習任務的執行效率,主要包括:APQ28資訊網——每日最新資訊28at.com

1、新增虛擬內存管理支持:APQ28資訊網——每日最新資訊28at.com

MUSA虛擬內存管理技術能夠有效緩解GPU內存碎片化問題,降低模型訓練過程中的峰值內存占用,特別適用于FSDP、DeepSpeed和Megatron-LM等主流大模型訓練框架。APQ28資訊網——每日最新資訊28at.com

2、新增MUSA Graph支持:APQ28資訊網——每日最新資訊28at.com

MUSA Graph技術將多個MUSA內核整合到一個圖中,通過單次CPU調度大幅減少啟動開銷,提升計算效率,同時與CUDA Graph接口高效兼容。APQ28資訊網——每日最新資訊28at.com

3、torch.compile增加Triton后端支持:APQ28資訊網——每日最新資訊28at.com

為torch.compile提供了Triton-MUSA后端支持,開發者可以直接使用PyTorch原生接口,獲得更高效的性能表現。APQ28資訊網——每日最新資訊28at.com

不僅如此,Torch-MUSA v2.0.0在完整支持PyTorch 2.2.0的基礎上,還新增了對PyTorch 2.5.0的支持,使開發者能夠在基于MUSA Compute Capability 3.1計算架構的全功能GPU上,無縫運行新版本的PyTorch。APQ28資訊網——每日最新資訊28at.com

未來Torch-MUSA還將繼續跟進PyTorch的版本更新,計劃支持更高版本的PyTorch。APQ28資訊網——每日最新資訊28at.com

國產GPU突破!摩爾線程發布Torch-MUSA v2.0.0:FP8原生支持APQ28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-24-148944-0.html國產GPU突破!摩爾線程發布Torch-MUSA v2.0.0:FP8原生支持

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 差了2GB/s!Intel酷睿Ultra 200S搭配Z890跑不滿PCIe5.0 SSD

下一篇: 便宜50系顯卡跳票!曝RTX 5060推遲上市:想買再等等

標簽:
  • 熱門焦點
  • MIX Fold3包裝盒泄露 新機本月登場

    小米的全新折疊屏旗艦MIX Fold3將于本月發布,近日該機的真機包裝盒在網上泄露。從圖上來看,新的MIX Fold3包裝盒在外觀設計方面延續了之前的方案,變化不大,這也是目前小米旗艦
  • 盧偉冰長文解析K60至尊版 對Redmi有著里程碑式的意義

    在今天的Redmi后性能時代戰略發布會結束之后,Redmi總經理盧偉冰又帶來了一篇長文,詳解了為什么 Redmi 要開啟后性能時代?為什么選擇和 MediaTek、Pixelworks 深度合作?以及后性
  • K60至尊版剛預熱 一加Ace2 Pro正面硬剛

    Redmi這邊剛如火如荼的宣傳了K60 Ultra的各種技術和硬件配置,作為競品的一加也坐不住了。一加中國區總裁李杰發布了兩條微博,表示在自家的一加Ace2上早就已經采用了和PixelWo
  • Mate60手機殼曝光 致敬自己的經典設計

    8月3日消息,今天下午博主數碼閑聊站帶來了華為Mate60的第三方手機殼圖,可以讓我們在真機發布之前看看這款華為全新旗艦的大致輪廓。從曝光的圖片看,Mate 60背后攝像頭面積依然
  • 太卷!Redmi MAX 100英寸電視便宜了:12999元買Redmi史上最大屏

    8月5日消息,從小米商城了解到,Redmi MAX 100英寸巨屏電視日前迎來官方優惠,到手價12999元,比發布價便宜了7000元,在大屏電視市場開卷。據了解,Redmi MAX 100
  • Golang 中的 io 包詳解:組合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是對Reader和Writer接口的組合,
  • JavaScript學習 -AES加密算法

    引言在當今數字化時代,前端應用程序扮演著重要角色,用戶的敏感數據經常在前端進行加密和解密操作。然而,這樣的操作在網絡傳輸和存儲中可能會受到惡意攻擊的威脅。為了確保數據
  • 10天營收超1億美元,《星鐵》比《原神》差在哪?

    來源:伯虎財經作者:陳平安即便你沒玩過《原神》,你一定聽說過的它的大名。恨它的人把《原神》開服那天稱作是中國游戲史上最黑暗的一天,有粉絲因為索尼在PS平臺上線《原神》,怒而
  • “買真退假” 這種“羊毛”不能薅

    □ 法治日報 記者 王春   □ 本報通訊員 胡佳麗  2020年初,還在上大學的小東加入了一個大學生兼職QQ群。群主“七王”在群里介紹一些刷單賺
Top 主站蜘蛛池模板: 汝南县| 石屏县| 农安县| 南皮县| 兴义市| 黄冈市| 寻乌县| 长白| 墨竹工卡县| 白水县| 乌鲁木齐县| 焉耆| 济阳县| 清镇市| 丹江口市| 罗山县| 石台县| 永定县| 祁阳县| 蒙山县| 尼玛县| 申扎县| 宁化县| 绵阳市| 明水县| 弥勒县| 离岛区| 元氏县| 江华| 咸阳市| 屏东市| 潞城市| 大埔区| 河源市| 万年县| 新竹市| 黎城县| 万安县| 嵊泗县| 游戏| 遂平县|