日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

英偉達合作推出 Fast-dLLM 框架,AI 擴散模型推理速度最高飆升 27.6 倍

來源: 責編: 時間:2025-06-04 16:57:02 41觀看
導讀 6 月 3 日消息,科技媒體 marktechpost 昨日(6 月 2 日)發(fā)布博文,報道稱英偉達聯(lián)合麻省理工學院(MIT)、香港大學,合作推出 Fast-dLLM 框架,大幅提升擴散模型(Diffusion-based LLMs)的推理速度。擴散模型被認為是傳統(tǒng)自回

6 月 3 日消息,科技媒體 marktechpost 昨日(6 月 2 日)發(fā)布博文,報道稱英偉達聯(lián)合麻省理工學院(MIT)、香港大學,合作推出 Fast-dLLM 框架,大幅提升擴散模型(Diffusion-based LLMs)的推理速度。fsZ28資訊網(wǎng)——每日最新資訊28at.com

擴散模型被認為是傳統(tǒng)自回歸模型(Autoregressive Models)的有力競爭者,采用雙向注意力機制(Bidirectional Attention Mechanisms),理論上能通過同步生成多個詞元(Multi-token Generation)加速解碼過程。fsZ28資訊網(wǎng)——每日最新資訊28at.com

不過在實際應用中,擴散模型的推理速度往往無法媲美自回歸模型,每次生成步驟都需要重復計算全部注意力狀態(tài),導致計算成本高昂。此外,多詞元同步解碼時,詞元間的依賴關系易被破壞,生成質量下降,讓其難以滿足實際需求。fsZ28資訊網(wǎng)——每日最新資訊28at.com

援引博文介紹,英偉達組建的聯(lián)合團隊為解決上述瓶頸,研發(fā)了 Fast-dLLM 框架。該框架引入兩大創(chuàng)新:塊狀近似 KV 緩存機制和置信度感知并行解碼策略。fsZ28資訊網(wǎng)——每日最新資訊28at.com

fsZ28資訊網(wǎng)——每日最新資訊28at.com

KV 緩存通過將序列劃分為塊(Blocks),預計算并存儲其他塊的激活值(KV Activations),在后續(xù)解碼中重復利用,顯著減少計算冗余。其 DualCache 版本進一步緩存前后綴詞元(Prefix and Suffix Tokens),利用相鄰推理步驟的高相似性提升效率。fsZ28資訊網(wǎng)——每日最新資訊28at.com

而置信度解碼則根據(jù)設定的閾值(Confidence Threshold),選擇性解碼高置信度的詞元,避免同步采樣帶來的依賴沖突,確保生成質量。fsZ28資訊網(wǎng)——每日最新資訊28at.com

Fast-dLLM 在多項基準測試中展現(xiàn)了驚人表現(xiàn)。在 GSM8K 數(shù)據(jù)集上,生成長度為 1024 詞元時,其 8-shot 配置下實現(xiàn)了 27.6 倍加速,準確率達 76.0%;在 MATH 基準測試中,加速倍數(shù)為 6.5 倍,準確率約為 39.3%;在 HumanEval 和 MBPP 測試中,分別實現(xiàn)了 3.2 倍和 7.8 倍加速,準確率維持在 54.3% 和基線水平附近。fsZ28資訊網(wǎng)——每日最新資訊28at.com

fsZ28資訊網(wǎng)——每日最新資訊28at.com

整體來看,F(xiàn)ast-dLLM 在加速的同時,準確率僅下降 1-2 個百分點,證明其有效平衡速度與質量。這項研究通過解決推理效率和解碼質量問題,讓擴散模型在實際語言生成任務中具備了與自回歸模型競爭的實力,為未來廣泛應用奠定了基礎。fsZ28資訊網(wǎng)——每日最新資訊28at.com

fsZ28資訊網(wǎng)——每日最新資訊28at.com

附上參考地址fsZ28資訊網(wǎng)——每日最新資訊28at.com

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding論文fsZ28資訊網(wǎng)——每日最新資訊28at.com

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding項目界面fsZ28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-13399-0.html英偉達合作推出 Fast-dLLM 框架,AI 擴散模型推理速度最高飆升 27.6 倍

聲明:本網(wǎng)頁內容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 蘋果A20芯片大升級!iPhone 18 Pro將首發(fā)2nm工藝,性能如何?

下一篇: 任天堂《塞爾達傳說》手機伴侶應用被指使用生成式 AI 配音

標簽:
  • 熱門焦點
  • 內容行業(yè)大變天,爆款全靠AI?

    出品 | 微果醬(wjam123456)作者 | 陳出木題圖 | 文心一格 AI的發(fā)展之快出乎所有人的預料,似乎一夜之間便呼嘯而來。無論是資本的風向標,抑或是生活工作的輔助、流量口,還是茶余飯
  • 元宇宙時代NFT的價值衡量

    有人認為NFT的高昂價格只是炒作的產(chǎn)物,并不具有其對等的價值,但其實NFT并不是空中樓閣,只是區(qū)塊鏈數(shù)字分類賬中的一種形式。誠然,目前的NFT仍處于灰色地帶,相關的法
  • 虛擬數(shù)字人:元宇宙的主角破圈而來

    虛擬數(shù)字人市場逐步進入成熟期,商業(yè)化進程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破,制
  • NFT也有黃牛?這家公司專門對付外掛作弊機器人

    澳大利亞前總理馬爾科姆·特恩布爾 (Malcolm Turnbull) 是支持薩姆·Crowther (Sam Crowther) 的人之一,Sam是一名出生于紐卡斯爾的黑客,他的職業(yè)生涯始于為國防
  • NFT藝術家Hayley Rincon 專訪:我的迷幻數(shù)字藝術之路

    Hayley Rincon是一位令人印象深刻才華橫溢的創(chuàng)作者,她的作品呈現(xiàn)出迷幻的氣息。今天就來聊聊她的藝術作品,和她自己的數(shù)字藝術之路。Hayley是加利福尼亞灣區(qū)的有
  • 用戶可以把自己的醫(yī)療健康數(shù)據(jù)做成NFT出售給醫(yī)藥公司掙錢

    你可能聽說過不可偽造的代幣,或NFTs。NFTs是數(shù)字代幣,代表完全獨特的項目的所有權;存儲在區(qū)塊鏈中并可追蹤,它們不能被修改、替換或復制。作為NFT鑄造的資產(chǎn)在數(shù)字
  • 藝術創(chuàng)作者能否永久收取版稅?

    NFTs正在改變我們理解互聯(lián)網(wǎng)所有權的方式,社區(qū)管理的所有權有很多好處,但如果創(chuàng)作者想為他/她的創(chuàng)作獲得永久的收益(版稅),會發(fā)生什么?這不是一個容易解決的問題,版稅
  • 韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

    韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance(幣安)達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
  • 如何在元宇宙中建立品牌忠誠度

    Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點?他們都投資于元宇宙的房地產(chǎn)。除了我們在屏幕上看到的二維世界--手機、筆記本電腦、臺式機或iPad--他們決
Top 主站蜘蛛池模板: 城固县| 丹东市| 富蕴县| 林州市| 钦州市| 虞城县| 绥江县| 长乐市| 清丰县| 克拉玛依市| 仪陇县| 彩票| 突泉县| 余江县| 西乡县| 潼关县| 景谷| 景东| 长治县| 五台县| 互助| 湟中县| 新津县| 内江市| 潍坊市| 太仆寺旗| 贵溪市| 翁牛特旗| 武山县| 德兴市| 宁城县| 班戈县| 武冈市| 姜堰市| 平谷区| 汉源县| 寿阳县| 麻阳| 永安市| 祁东县| 资源县|