當前位置：首頁 > 元宇宙 > AI

Meta 推 LlamaRL 強化學習框架：全異步分布設計，訓練 AI 模型提速 10.7 倍

來源：責編：時間：2025-06-13 11:29:16 61觀看

導讀 6 月 11 日消息，科技媒體 marktechpost 昨日（6 月 10 日）發布博文，報道稱 Meta 公司推出 LlamaRL 框架，采用全異步分布式設計，在 405B 參數模型上，LlamaRL 將強化學習步驟時間從 635.8 秒縮短至 59.5 秒，速度提升 10.

6 月 11 日消息，科技媒體 marktechpost 昨日（6 月 10 日）發布博文，報道稱 Meta 公司推出 LlamaRL 框架，采用全異步分布式設計，在 405B 參數模型上，LlamaRL 將強化學習步驟時間從 635.8 秒縮短至 59.5 秒，速度提升 10.7 倍。

注：強化學習（Reinforcement Learning，RL）通過基于反饋調整輸出，讓模型更貼合用戶需求。隨著對模型精準性和規則適配性的要求不斷提高，強化學習在訓練后階段的重要性日益凸顯，持續優化模型性能，成為許多先進大語言模型系統的關鍵組成部分。

將強化學習應用于大語言模型，最大障礙在于資源需求。訓練涉及海量計算和多組件協調，如策略模型、獎勵評分器等。模型參數高達數百億，內存使用、數據通信延遲和 GPU 閑置等問題困擾著工程師。

Meta 推出的 LlamaRL 框架，采用 PyTorch 構建全異步分布式系統，簡化協調并支持模塊化定制。通過獨立執行器并行處理生成、訓練和獎勵模型，LlamaRL 大幅減少等待時間，提升效率。

LlamaRL 通過分布式直接內存訪問（DDMA）和 NVIDIA NVLink 技術，實現 405B 參數模型權重同步僅需 2 秒。

在實際測試中，LlamaRL 在 8B、70B 和 405B 模型上分別將訓練時間縮短至 8.90 秒、20.67 秒和 59.5 秒，速度提升最高達 10.7 倍。

MATH 和 GSM8K 基準測試顯示，其性能穩定甚至略有提升。LlamaRL 有效解決內存限制和 GPU 效率問題，為訓練大語言模型開辟了可擴展路徑。

本文鏈接：http://www.www897cc.com/showinfo-45-13679-0.htmlMeta 推 LlamaRL 強化學習框架：全異步分布設計，訓練 AI 模型提速 10.7 倍

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：蘋果 iOS 26 升級快捷指令：擴展引入 Apple 智能，AI 改變用戶日常體驗

下一篇：上線僅 1 周，Anthropic 終止 AI 博客 Claude Explains 項目

標簽：

熱門焦點

雷克薩斯高管，“受賄”5000萬？

來源：毒舌科技作者：潘磊雷克薩斯的高管，好像出事了。五六家日本小媒體，突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元（約合人民幣5000
內容行業大變天，爆款全靠AI？

出品 | 微果醬（wjam123456）作者 | 陳出木題圖 | 文心一格 AI的發展之快出乎所有人的預料，似乎一夜之間便呼嘯而來。無論是資本的風向標，抑或是生活工作的輔助、流量口，還是茶余飯
《蜘蛛俠》火了，超級英雄就該這么演

燃次元（ID:chaintruth）原創作者 | 陶淘編輯 | 曹拿下豆瓣8.8分、IMDB 9.1的高分，6月2日在全球同步上映的《蜘蛛俠：縱橫宇宙》（以下簡稱《蜘蛛俠》），上映不足一周，便在國內“
茅臺的元宇宙App火了，也被罵慘了

元宇宙從概念走向大眾生活，并不是一件簡單的事情。技術、世界觀、填充內容、載體形式，每一個環節都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

“兩日上漲千倍”并不存在，且冰墩墩NFT的市場熱度遠不及社交媒體所稱的那樣高。2月11日，獲得國際奧委會授權的2022冬奧會吉祥物冰墩墩相關NFT產品在nWayPlay上線
高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

擴展現實（XR）通過計算機將真實與虛擬相結合，打造了一個可人機交互的虛擬環境，將AR、VR、MR多種技術相融合，為體驗者帶來了虛擬世界與現實世界之間無縫轉換的“沉浸
a16z：元宇宙辦公會取代實體辦公室嗎？

6位不同的專家對未來的工作發表看法----元宇宙--沉浸式的、基于區塊鏈的虛擬世界，大多數日常活動最終會在這里發生--但仍然只是一個概念。但它是一個擁有寶貴不
從NFT數字收藏，洞察數字音樂版權市場發展趨勢

去年8月9日，騰訊音樂布局NFT數字收藏，在騰訊應用寶發布幻核app，騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
虛擬人行業研究報告

最早的虛擬人出現于 20 世紀 80 年代，受限于技術，當時的虛擬人制作以手繪為主。21 世紀初，隨著動捕、渲染等技術的逐步發展，虛擬人相關技術開始在影視領域逐漸普及

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

Meta 推 LlamaRL 強化學習框架：全異步分布設計，訓練 AI 模型提速 10.7 倍

雷克薩斯高管，“受賄”5000萬？

內容行業大變天，爆款全靠AI？

《蜘蛛俠》火了，超級英雄就該這么演

茅臺的元宇宙App火了，也被罵慘了

冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

a16z：元宇宙辦公會取代實體辦公室嗎？

從NFT數字收藏，洞察數字音樂版權市場發展趨勢

虛擬人行業研究報告

最新推薦

新周期，誰在堅守窄門？

網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

Shiba Inu布局元宇宙走出Meme局限

NFT 技術將傳世之作帶入博物館

Meta 呼吁行業合作建立元宇宙網絡基礎設施

猜你喜歡

熱門推薦

相關資訊