日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

微軟推出 FP8 混合精度訓練框架:比 BF16 快 64%,內存占用少 42%

來源: 責編: 時間:2023-11-15 17:03:06 247觀看
導讀 11 月 10 日消息,大語言模型(LLM)快速崛起,在語言生成和理解方面表現出光明的前景,影響超越了語言領域,延伸到邏輯、數學、物理學等領域。不過想要解鎖這些“非凡能量”,需要付出高額的代價,例如訓練 540B 模型,需要 P

11 月 10 日消息,大語言模型(LLM)快速崛起,在語言生成和理解方面表現出光明的前景,影響超越了語言領域,延伸到邏輯、數學、物理學等領域。e9W28資訊網——每日最新資訊28at.com

e9W28資訊網——每日最新資訊28at.com

不過想要解鎖這些“非凡能量”,需要付出高額的代價,例如訓練 540B 模型,需要 Project PaLM 的 6144 個 TPUv4 芯片;而訓練 175B 的 GPT-3,需要數千 Petaflop/s-day。e9W28資訊網——每日最新資訊28at.com

目前一個不錯的解決方案就是低精度訓練,可以提高處理速度,降低內存使用量和通信成本。包括 Megatron-LM、MetaSeq 和 Colossal-AI 等主流訓練系統,默認使用 FP16 / BF16 混合精度或 FP32 全精度來訓練大型語言模型。e9W28資訊網——每日最新資訊28at.com

雖然這些精度水平對于大語言模型來說是必不可少的,但它們的計算成本很高。e9W28資訊網——每日最新資訊28at.com

如果采用 FP8 低精度,可以將速度提高 2 倍、內存成本降低 50% 至 75%,并且可節省通信成本。e9W28資訊網——每日最新資訊28at.com

目前只有 Nvidia Transformer Engine 兼容 FP8 框架,主要利用這種精度進行 GEMM(通用矩陣乘法)計算,同時以 FP16 或 FP32 高精度保持主權重和梯度。e9W28資訊網——每日最新資訊28at.com

為了應對這一挑戰,來自 Microsoft Azure 和 Microsoft Research 的一組研究人員推出了一個高效的 FP8 混合精度框架,專為大型語言模型訓練量身定制。e9W28資訊網——每日最新資訊28at.com

e9W28資訊網——每日最新資訊28at.com

微軟引入了三個優化階段,利用 FP8 進行分布式和混合精度訓練。隨著這些層級的進展,FP8 集成程度的提高變得明顯,這表明對 LLM 訓練過程的影響更大。e9W28資訊網——每日最新資訊28at.com

此外為了克服數據溢出或下溢等問題,微軟研究人員提出自動采樣和精確解耦兩種關鍵方法,前者涉及對精度不敏感的組件降低精度,動態調整 Tensor 采樣因子,以確保梯度值保持在 FP8 表示范圍內。這可以防止全減少通信期間的下溢和溢流事件,確保培訓過程更加順暢。e9W28資訊網——每日最新資訊28at.com

微軟經過測試,與廣泛采用的 BF16 混合精度方法相比,內存占用減少 27% 至 42%,權重梯度通信開銷顯著降低 63% 至 65%。運行速度比廣泛采用的 BF16 框架(例如 Megatron-LM)快了 64%,比 Nvidia Transformer Engine 的速度快了 17%。e9W28資訊網——每日最新資訊28at.com

e9W28資訊網——每日最新資訊28at.com

在訓練 GPT-175B 模型時,混合 FP8 精度框架在 H100 GPU 平臺上節省 21% 的內存,而且相比較 TE(Transformer Engine),訓練時間減少 17%。e9W28資訊網——每日最新資訊28at.com

在此附上 GitHub 地址和論文地址:https://doi.org/10.48550/arXiv.2310.18313e9W28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-2519-0.html微軟推出 FP8 混合精度訓練框架:比 BF16 快 64%,內存占用少 42%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: GitHub Copilot Enterprise 明年 2 月推出,允許企業整合自家代碼模型創建專用 AI 助手

下一篇: Humane 可穿戴設備 Ai Pin 正式發布:手掌內投影、語音手勢交互,699 美元加月訂閱費

標簽:
  • 熱門焦點
  • VR/AR迷失元宇宙“硝煙”

    不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣,又隨著元宇宙回歸平靜。1月份,微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員,其中負責混合現實硬件(MR)的Holo
  • 搶先推出“元宇宙”飲料,可口可樂贏麻了

    試圖傍上元宇宙的品牌千千萬,但像可口可樂玩得這么花的,屬實不多。01 可口可樂盯上元宇宙1886年,可口可樂誕生于美國喬治亞州亞特蘭大市,至今已擁有136年的悠久歷
  • 元宇宙帶來沉浸式智能登錄?你學會了嗎?

    備受資本市場寵愛的元宇宙概念,正掀起一番番波瀾。元宇宙作為虛實相融的互聯網應用和社會形態,與沉浸式體驗緊密相關。 多重路徑,打造無感知沉浸式智能登錄《設計
  • 中文在線的“元宇宙”故事,資本聽膩了?

    被譽為“元宇宙”龍頭之一的中文在線,這下尷尬了。2022年1月11日,中國移動通信聯合會元宇宙產業委員會揭牌,接納涉足“元宇宙”的8家上市公司,包括中青寶、天下秀
  • 以太坊升級將會帶來的5個改變

    以太坊自2015年誕生以來就廣受歡迎,但最近其昂貴的交易費用和低可擴展性對執行復雜的應用程序產生了負面作用,用戶對以太坊改進的需求也日益急迫。以太坊2.0已進
  • 全面擁抱“虛擬世界”,摩登天空要打造“音樂元宇宙”

    作者:袁佳琦沈黎暉不怎么打游戲,但許多事兒在他眼里都“有意思”。好玩,有意思,是他的口頭禪,在接受娛樂獨角獸的采訪過程中,他多次提到,做虛擬音樂人,“是件挺好玩的
  • 元宇宙畫廊體驗報告:有點頭疼。

    2 月 10 日,Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強現實藝術品。“我們現在在虛擬世界中嗎?時間好像變長了” 我問身后排隊的人。我
  • 知名藝術家打造去中心化“好萊塢”:一部電影一個DAO

    根據市場追蹤網站 DappRadar 的數據,隨著 NFT 的“出圈”與加密貨幣的普及,NFT 市場在 2021 年的銷售額達到約 250 億美元,而 2020 年僅為 9490 萬美元,同比增超 2
  • 爆發在即的Layer2賽道百花齊放,誰將是領跑者?

    還記得幾年前最早我們提起ETH擴容,首先想到就是Layer2,而Layer2里,首先想到的是閃電網絡,狀態通道,Plasma…然后折騰了幾年,發現并沒有什么用,許多項目方和資本也等不
Top 主站蜘蛛池模板: 民丰县| 香河县| 武川县| 宝坻区| 南岸区| 常山县| 抚远县| 玉门市| 高平市| 青河县| 安达市| 汕尾市| 高唐县| 榆树市| 防城港市| 克东县| 仁化县| 万山特区| 沙坪坝区| 雷山县| 江源县| 陆良县| 滕州市| 鄄城县| 上林县| 五家渠市| 成都市| 柳州市| 江川县| 延寿县| 石屏县| 砚山县| 黄陵县| 拉孜县| 呈贡县| 双柏县| 肃南| 彩票| 黄龙县| 万宁市| 琼海市|