當前位置：首頁 > 元宇宙 > AI

螞蟻集團推出兩款 MoE 大模型，用國產芯片訓練成本顯著降低

來源：責編：時間：2025-03-26 10:57:19 96觀看

導讀 3 月 24 日消息，據證券時報報道，近日，螞蟻集團 Ling 團隊在預印版 Arxiv 平臺發表技術成果論文《每一個 FLOP 都至關重要：無需高級 GPU 即可擴展 3000 億參數混合專家 LING 大模型》，宣布推出兩款不同規模的 MoE （

3 月 24 日消息，據證券時報報道，近日，螞蟻集團 Ling 團隊在預印版 Arxiv 平臺發表技術成果論文《每一個 FLOP 都至關重要：無需高級 GPU 即可擴展 3000 億參數混合專家 LING 大模型》，宣布推出兩款不同規模的 MoE （混合專家）大語言模型 —— 百靈輕量版（Ling-Lite）與百靈增強版（Ling-Plus），并提出一系列創新方法，實現在低性能硬件上高效訓練大模型，顯著降低成本。

據了解，百靈輕量版參數規模為 168 億（激活參數 27.5 億），增強版基座模型參數規模高達 2900 億（激活參數 288 億），性能均達行業領先水平。實驗表明，其 3000 億參數的 MoE 大模型可在使用國產 GPU 的低性能設備上完成高效訓練，性能與完全使用英偉達芯片、同規模的稠密模型及 MoE 模型相當。

當前，MoE 模型訓練通常依賴英偉達 H100 / H800 等高性能 GPU，成本高昂且芯片短缺，限制了其在資源受限環境中的應用。螞蟻集團 Ling 團隊提出“不使用高級 GPU”擴展模型的目標，通過創新訓練策略，突破資源與預算限制。具體策略包括：架構與訓練策略革新，采用動態參數分配與混合精度調度技術；升級訓練異常處理機制，自適應容錯恢復系統縮短中斷響應時間；優化模型評估流程，自動化評測框架壓縮驗證周期超 50%；突破工具調用能力，基于知識圖譜的指令微調提升復雜任務執行精度。

在五種不同硬件配置下，Ling 團隊對 9 萬億個 token 進行 Ling-Plus 預訓練。結果顯示，使用高性能硬件配置訓練 1 萬億 token 的預訓練成本約 635 萬元人民幣，而采用螞蟻優化方法后，低規格硬件訓練成本降至 508 萬元左右，節省近 20%，且性能與阿里通義 Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat 相當。

此前，DeepSeek 通過算法創新及工程優化，使用英偉達 H800 訓練出性能頂尖的 V3 與 R1 模型，為降低成本、提高效率開辟新道路。螞蟻集團的技術成果若得到驗證推廣，將助力國產大模型尋找成本更低、效率更高的國產芯片或其他替代方案，進一步降低對英偉達芯片的依賴。

本文鏈接：http://www.www897cc.com/showinfo-45-11664-0.html螞蟻集團推出兩款 MoE 大模型，用國產芯片訓練成本顯著降低

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：海洋領域首個業務化垂直領域大語言模型“瀚海智語”發布：基于 360 智腦和 DeepSeek 開發

下一篇：不用寫代碼：百度全量上線國內首個對話式應用開發平臺“秒噠”

標簽：

熱門焦點

AI界地震！美國對OpenAI展開調查！監管風暴來襲！

來源：清元宇宙還記得5月OpenAI在國會山聽證會上的自信、坦誠、游刃有余的問答嗎？那時的Sam Altman可謂意氣風發，在耐心、友好的國會議員面前，就AI立法、大模型安全性問題侃侃而
ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

來源：首席商業評論2023年，最火的莫過于ChatGPT，席卷全球的同時也引發了生成式AI（人工智能）的投資熱潮。在美股，ChatGPT相關概念股飆漲，以AI算力龍頭英偉達為例，其股價年內一度累計上
內容行業大變天，爆款全靠AI？

出品 | 微果醬（wjam123456）作者 | 陳出木題圖 | 文心一格 AI的發展之快出乎所有人的預料，似乎一夜之間便呼嘯而來。無論是資本的風向標，抑或是生活工作的輔助、流量口，還是茶余飯
這場虛擬人爭奪戰，互聯網巨頭下場先贏一半？

撰文/ 孟會緣近兩年間，要論引得無數互聯網巨頭競折腰的一大熱門產業，莫過于元宇宙領域中的數字人了。作為繼數字藏品之后，開發元宇宙的又一重點落地項目，互聯網
Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

上周，外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項，暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中，Meta Reali
從NFT頂級公鏈到Web3.0基礎設施：帶你了解不一樣的Flow

對于大部分年輕人來說，剛剛過去的春節有一個詞語突然成為了品牌宣傳的流行語，作為從NFT中衍生出來的“數字藏品”一時間獲得了不少品牌青睞，他們紛紛推出自己的數
頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

作者：五火球教主提起Dfinity（ICP），你的第一感覺可能與我一樣，這是一個讓人十分糾結的項目。之所以糾結，一方面他的團隊陣容強大，各種來自前英特爾、IBM、coinbase、fa
NFT也有黃牛？這家公司專門對付外掛作弊機器人

澳大利亞前總理馬爾科姆·特恩布爾 (Malcolm Turnbull) 是支持薩姆·Crowther (Sam Crowther) 的人之一，Sam是一名出生于紐卡斯爾的黑客，他的職業生涯始于為國防
百度虛擬人——AI手語主播首次亮相冬奧會！

除了火遍全國的冰墩墩，虛擬人也成為這屆冬奧會的一大亮點元素。以體育明星谷愛凌為原型的數智人Meet Gu最先亮相。在2月5日谷愛凌首秀、2月7日谷愛凌首金的兩天

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

螞蟻集團推出兩款 MoE 大模型，用國產芯片訓練成本顯著降低

AI界地震！美國對OpenAI展開調查！監管風暴來襲！

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

內容行業大變天，爆款全靠AI？

這場虛擬人爭奪戰，互聯網巨頭下場先贏一半？

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

從NFT頂級公鏈到Web3.0基礎設施：帶你了解不一樣的Flow

頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

NFT也有黃牛？這家公司專門對付外掛作弊機器人

百度虛擬人——AI手語主播首次亮相冬奧會！

最新推薦

茅臺的元宇宙App火了，也被罵慘了

2022 區塊鏈 50 強榜單；垃圾NFT項目的十三個特性

冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

獨立故事片“Calladita”將使用 NFT 籌集資金

猜你喜歡

熱門推薦

相關資訊