當前位置：首頁 > 元宇宙 > AI

騰訊攜手創(chuàng)新“無監(jiān)督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率

來源：責編：時間：2025-03-04 15:06:33 94觀看

導讀 3 月 2 日消息，科技媒體 marktechpost 昨日（3 月 1 日）發(fā)布博文，報道稱騰訊 AI Lab 攜手香港中文大學，提出名為“無監(jiān)督前綴微調”（UPFT）的創(chuàng)新方法，顯著提升了大型語言模型的推理效率。該方法無需處理完整的推理過程

3 月 2 日消息，科技媒體 marktechpost 昨日（3 月 1 日）發(fā)布博文，報道稱騰訊 AI Lab 攜手香港中文大學，提出名為“無監(jiān)督前綴微調”（UPFT）的創(chuàng)新方法，顯著提升了大型語言模型的推理效率。

該方法無需處理完整的推理過程，只需關注模型輸出的前 8 至 32 個詞元（token），即可有效改進模型的推理能力。UPFT 抓住了不同推理路徑中共同的關鍵早期步驟，在降低計算開銷的同時，實現了推理性能的提升。

大型語言模型在語言理解和生成方面表現出色，但提升其推理能力仍然是一項挑戰(zhàn)。傳統微調方法依賴大量標注數據或復雜的拒絕采樣，資源消耗巨大。UPFT 則另辟蹊徑，通過聚焦模型輸出的初始 tokens，解決了效率和對昂貴監(jiān)督的依賴問題。

研究發(fā)現，針對同一問題，模型生成的各種推理路徑的初始步驟往往高度相似，UPFT 正是基于這種“前綴自洽性”，無需完整推理軌跡或大量標注數據，僅使用這些初始標記進行訓練。

UPFT 采用貝葉斯推理原理，將正確推理的概率分解為“覆蓋率”和“準確性”兩部分。通過訓練早期 tokens，UPFT 在探索多樣化推理路徑的同時，確保了結果的可靠性。實驗表明，UPFT 可將訓練中處理的 tokens 數量減少高達 95%，并顯著降低時間和內存需求。

UPFT 在 GSM8K、MATH500、AIME2024 和 GPQA 等推理基準測試中表現優(yōu)異。例如，在 Qwen2.5-Math-7B-Instruct 模型上，UPFT 在減少訓練和推理 tokens 的同時，提升了平均準確率。在復雜推理任務中，UPFT 的性能提升尤為顯著，表明早期推理步驟包含解決問題的關鍵信息。

附上參考地址

The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning Models

Tencent AI Lab Introduces Unsupervised Prefix Fine-Tuning (UPFT): An Efficient Method that Trains Models on only the First 8-32 Tokens of Single Self-Generated Solutions

本文鏈接：http://www.www897cc.com/showinfo-45-11338-0.html騰訊攜手創(chuàng)新“無監(jiān)督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：清華大學 2025 年將適度擴招本科生，重點培養(yǎng)“AI+”拔尖創(chuàng)新人才

下一篇： GPT-4.5 性能提升有限、成本卻激增 30 倍，OpenAI 面臨性價比質疑

標簽：

熱門焦點

VR/AR迷失元宇宙“硝煙”

不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣，又隨著元宇宙回歸平靜。1月份，微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員，其中負責混合現實硬件（MR）的Holo
在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

上周，外媒UploadVR在Quest 2開發(fā)者文檔中發(fā)現了從未被公布過的“身體追蹤支持”選項，暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環(huán)節(jié)中，Meta Reali
國內涌現70余家數字藏品平臺：合規(guī)、流量與利潤在博弈

作者：楊鄭君2月16日，迅雷鏈企業(yè)數字藏品服務平臺正式上線，繼阿里、騰訊、京東、百度、網易等之后，又一家互聯網企業(yè)正式加入到火熱的數字藏品平臺的競爭中。除互聯
NFT世界的藝術家名單

我們匯編了以下藝術家的名單，它包括每個藝術家的簡短概述。當然，這份名單肯定不全面，還有很多很多藝術家、哲學家和商業(yè)領袖為世界貢獻了不可估量的價值。而他們
藝術創(chuàng)作者能否永久收取版稅？

NFTs正在改變我們理解互聯網所有權的方式，社區(qū)管理的所有權有很多好處，但如果創(chuàng)作者想為他/她的創(chuàng)作獲得永久的收益（版稅），會發(fā)生什么？這不是一個容易解決的問題，版稅
融資千萬美元的元宇宙平臺UGC到底是什么？

據獲悉，全球化元宇宙社交平臺BUD Technologies, Inc.（以下簡稱“BUD”）宣布完成1500萬美元A+輪融資，本輪融資由啟明創(chuàng)投領投，老股東源碼資本、GGV紀源資本、云九資
售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

Everydays: the First 5000 Days/Beeple去年三月，一件藝術品被著名拍賣行佳士得以6930萬美元的高價售出。而讓人們感到震驚的是，這個拍賣作品不是出自哪位藝術大
我們離元宇宙的實現只差一副眼鏡？

近日的蘋果春季新品發(fā)布會，想必許多人都守在了屏幕前，就為等待傳說中的首款AR Glass。在發(fā)布會之前，蘋果全球營銷主管Greg Joswiak曾在Twitter上分享了一段短視頻

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

騰訊攜手創(chuàng)新“無監(jiān)督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率

VR/AR迷失元宇宙“硝煙”

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

國內涌現70余家數字藏品平臺：合規(guī)、流量與利潤在博弈

NFT世界的藝術家名單

藝術創(chuàng)作者能否永久收取版稅？

融資千萬美元的元宇宙平臺UGC到底是什么？

售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

我們離元宇宙的實現只差一副眼鏡？

最新推薦

Layer1的新以太坊，更好的以太坊？

吸金31億美元，誰在催火2021年的鏈游？

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

與元宇宙美少女藝術家的對話

新聞業(yè)在元宇宙的現狀和未來

從概念到落地 Web3.0初具雛形

猜你喜歡

熱門推薦

相關資訊