當前位置：首頁 > 元宇宙 > AI

英偉達合作推出 Fast-dLLM 框架，AI 擴散模型推理速度最高飆升 27.6 倍

來源：責編：時間：2025-06-04 16:57:02 41觀看

導讀 6 月 3 日消息，科技媒體 marktechpost 昨日（6 月 2 日）發(fā)布博文，報道稱英偉達聯(lián)合麻省理工學院（MIT）、香港大學，合作推出 Fast-dLLM 框架，大幅提升擴散模型（Diffusion-based LLMs）的推理速度。擴散模型被認為是傳統(tǒng)自回

6 月 3 日消息，科技媒體 marktechpost 昨日（6 月 2 日）發(fā)布博文，報道稱英偉達聯(lián)合麻省理工學院（MIT）、香港大學，合作推出 Fast-dLLM 框架，大幅提升擴散模型（Diffusion-based LLMs）的推理速度。

擴散模型被認為是傳統(tǒng)自回歸模型（Autoregressive Models）的有力競爭者，采用雙向注意力機制（Bidirectional Attention Mechanisms），理論上能通過同步生成多個詞元（Multi-token Generation）加速解碼過程。

不過在實際應用中，擴散模型的推理速度往往無法媲美自回歸模型，每次生成步驟都需要重復計算全部注意力狀態(tài)，導致計算成本高昂。此外，多詞元同步解碼時，詞元間的依賴關系易被破壞，生成質量下降，讓其難以滿足實際需求。

援引博文介紹，英偉達組建的聯(lián)合團隊為解決上述瓶頸，研發(fā)了 Fast-dLLM 框架。該框架引入兩大創(chuàng)新：塊狀近似 KV 緩存機制和置信度感知并行解碼策略。

KV 緩存通過將序列劃分為塊（Blocks），預計算并存儲其他塊的激活值（KV Activations），在后續(xù)解碼中重復利用，顯著減少計算冗余。其 DualCache 版本進一步緩存前后綴詞元（Prefix and Suffix Tokens），利用相鄰推理步驟的高相似性提升效率。

而置信度解碼則根據(jù)設定的閾值（Confidence Threshold），選擇性解碼高置信度的詞元，避免同步采樣帶來的依賴沖突，確保生成質量。

Fast-dLLM 在多項基準測試中展現(xiàn)了驚人表現(xiàn)。在 GSM8K 數(shù)據(jù)集上，生成長度為 1024 詞元時，其 8-shot 配置下實現(xiàn)了 27.6 倍加速，準確率達 76.0%；在 MATH 基準測試中，加速倍數(shù)為 6.5 倍，準確率約為 39.3%；在 HumanEval 和 MBPP 測試中，分別實現(xiàn)了 3.2 倍和 7.8 倍加速，準確率維持在 54.3% 和基線水平附近。

整體來看，F(xiàn)ast-dLLM 在加速的同時，準確率僅下降 1-2 個百分點，證明其有效平衡速度與質量。這項研究通過解決推理效率和解碼質量問題，讓擴散模型在實際語言生成任務中具備了與自回歸模型競爭的實力，為未來廣泛應用奠定了基礎。

附上參考地址

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding論文

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding項目界面

本文鏈接：http://www.www897cc.com/showinfo-45-13399-0.html英偉達合作推出 Fast-dLLM 框架，AI 擴散模型推理速度最高飆升 27.6 倍

聲明：本網(wǎng)頁內容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：蘋果A20芯片大升級！iPhone 18 Pro將首發(fā)2nm工藝，性能如何？

下一篇：任天堂《塞爾達傳說》手機伴侶應用被指使用生成式 AI 配音

標簽：

熱門焦點

內容行業(yè)大變天，爆款全靠AI？

出品 | 微果醬（wjam123456）作者 | 陳出木題圖 | 文心一格 AI的發(fā)展之快出乎所有人的預料，似乎一夜之間便呼嘯而來。無論是資本的風向標，抑或是生活工作的輔助、流量口，還是茶余飯
元宇宙時代NFT的價值衡量

有人認為NFT的高昂價格只是炒作的產(chǎn)物，并不具有其對等的價值，但其實NFT并不是空中樓閣，只是區(qū)塊鏈數(shù)字分類賬中的一種形式。誠然，目前的NFT仍處于灰色地帶，相關的法
虛擬數(shù)字人：元宇宙的主角破圈而來

虛擬數(shù)字人市場逐步進入成熟期，商業(yè)化進程加速。1982年世界第一位虛擬歌姬林明美誕生，虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破，制
NFT也有黃牛？這家公司專門對付外掛作弊機器人

澳大利亞前總理馬爾科姆·特恩布爾 (Malcolm Turnbull) 是支持薩姆·Crowther (Sam Crowther) 的人之一，Sam是一名出生于紐卡斯爾的黑客，他的職業(yè)生涯始于為國防
NFT藝術家Hayley Rincon 專訪：我的迷幻數(shù)字藝術之路

Hayley Rincon是一位令人印象深刻才華橫溢的創(chuàng)作者，她的作品呈現(xiàn)出迷幻的氣息。今天就來聊聊她的藝術作品，和她自己的數(shù)字藝術之路。Hayley是加利福尼亞灣區(qū)的有
用戶可以把自己的醫(yī)療健康數(shù)據(jù)做成NFT出售給醫(yī)藥公司掙錢

你可能聽說過不可偽造的代幣，或NFTs。NFTs是數(shù)字代幣，代表完全獨特的項目的所有權；存儲在區(qū)塊鏈中并可追蹤，它們不能被修改、替換或復制。作為NFT鑄造的資產(chǎn)在數(shù)字
藝術創(chuàng)作者能否永久收取版稅？

NFTs正在改變我們理解互聯(lián)網(wǎng)所有權的方式，社區(qū)管理的所有權有很多好處，但如果創(chuàng)作者想為他/她的創(chuàng)作獲得永久的收益（版稅），會發(fā)生什么？這不是一個容易解決的問題，版稅
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
如何在元宇宙中建立品牌忠誠度

Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點？他們都投資于元宇宙的房地產(chǎn)。除了我們在屏幕上看到的二維世界--手機、筆記本電腦、臺式機或iPad--他們決

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

英偉達合作推出 Fast-dLLM 框架，AI 擴散模型推理速度最高飆升 27.6 倍

內容行業(yè)大變天，爆款全靠AI？

元宇宙時代NFT的價值衡量

虛擬數(shù)字人：元宇宙的主角破圈而來

NFT也有黃牛？這家公司專門對付外掛作弊機器人

NFT藝術家Hayley Rincon 專訪：我的迷幻數(shù)字藝術之路

用戶可以把自己的醫(yī)療健康數(shù)據(jù)做成NFT出售給醫(yī)藥公司掙錢

藝術創(chuàng)作者能否永久收取版稅？

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

如何在元宇宙中建立品牌忠誠度

最新推薦

數(shù)字虛擬人23年最新變化！

2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價值？

超級碗的加密時刻：是主流信號還是“網(wǎng)絡超級碗2.0”？

虛擬數(shù)字人：元宇宙的主角破圈而來

NFTs正迎來數(shù)十億美元的繁榮--NFT零工經(jīng)濟從業(yè)者開始暴賺

全球十大元宇宙概念游戲

猜你喜歡

熱門推薦

相關資訊