日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

可令 AI 自我判斷輸出內容正確性,谷歌公布模型訓練框架 ASPIRE

來源: 責編: 時間:2024-01-26 17:02:30 235觀看
導讀 1 月 23 日消息,谷歌日前發布新聞稿,介紹了一款專為大語言模型設計的 ASPIRE 訓練框架,該框架號稱可以增強 AI 模型的選擇性預測能力。谷歌提到,當下大語言模型在自然語言理解和生成內容方面發展迅速,已被用于構建

1 月 23 日消息,谷歌日前發布新聞稿,介紹了一款專為大語言模型設計的 ASPIRE 訓練框架,該框架號稱可以增強 AI 模型的選擇性預測能力。sNW28資訊網——每日最新資訊28at.com

sNW28資訊網——每日最新資訊28at.com

谷歌提到,當下大語言模型在自然語言理解和生成內容方面發展迅速,已被用于構建各種創新應用,但要應用于高風險決策類場合依然不妥。這是由于模型預測具有不確定性及“幻覺”可能,因此谷歌開發了一款 ASPIRE 訓練框架,為系列模型引入了“可信度”機制,即 —— 模型會輸出一系列答案,每個答案都會具有正確概率評分。sNW28資訊網——每日最新資訊28at.com

sNW28資訊網——每日最新資訊28at.com

▲ 圖源 谷歌新聞稿(下同)

在技術層面,注意到該訓練框架主要分為三階段,分別為“特定任務調整”、“答案采樣”和“自我評估學習”。sNW28資訊網——每日最新資訊28at.com

其中“特定任務調整”階段是對已接受過基礎訓練的大型語言模型進行深入訓練,專注于強化模型的預測能力。研究人員主要為模型引入一系列可調參數,在特定任務的訓練數據集上微調預訓練語言模型,從而提升模型預測性能,讓模型能夠更好地解決特定問題。sNW28資訊網——每日最新資訊28at.com

sNW28資訊網——每日最新資訊28at.com

第二階段為“答案采樣”,經過特定微調后,模型可以利用先前學習到的可調參數,為每個訓練問題生成不同的答案,并創建用于自我評估學習的數據集,生成一系列可信度較高的答案。研究人員同時使用“集束搜索(Beam Search)”方法及 Rouge-L 算法來評估答案的質量,并將生成的答案及評分重新輸入給模型開啟第三階段。sNW28資訊網——每日最新資訊28at.com

sNW28資訊網——每日最新資訊28at.com

而在第三階段“自我評估學習”中,研究人員為模型添加一組可調參數,專門用于提升模型自我評估能力。該階段的目標是讓模型學會“自己判斷輸出的答案準確性”,從而讓大語言模型在生成答案時,還會附上答案的正確概率評分。sNW28資訊網——每日最新資訊28at.com

谷歌研究人員使用 CoQA、TriviaQA 和 SQuAD 三個問答數據集來驗證 ASPIRE 訓練框架的成果,據稱“經過 ASPIRE 調整的 OPT-2.7B 小模型,表現遠超更大的 OPT-30B 模型”。而這項實驗結果也同時表明,只要經過適當的調整,即使是小語言模型,在部分場景下也可以超越大語言模型。sNW28資訊網——每日最新資訊28at.com

sNW28資訊網——每日最新資訊28at.com

研究人員總結稱,ASPIRE 框架訓練能夠顯著提升大語言模型輸出準確率,即使是較小的模型,也可以在經過微調后進行“準確且有自信”的預測。sNW28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3386-0.html可令 AI 自我判斷輸出內容正確性,谷歌公布模型訓練框架 ASPIRE

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 大模型應用 GPT- BI 在中國一汽上線,自然語言查詢準確率近 90%

下一篇: 免費邀請部分用戶體驗,微軟 Copilot 上線 ChatGPT GPT 功能

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 宁蒗| 金华市| 铁力市| 子长县| 宁化县| 肥城市| 金昌市| 镇原县| 泰州市| 南开区| 兴山县| 汾西县| 芦山县| 宕昌县| 宜城市| 高碑店市| 武功县| 宝山区| 淮滨县| 贺兰县| 伊金霍洛旗| 长汀县| 永修县| 洪江市| 大埔县| 兴海县| 三江| 绍兴市| 东台市| 巴彦县| 鲜城| 平和县| 牡丹江市| 怀远县| 陵川县| 康乐县| 平定县| 奎屯市| 绥中县| 韩城市| 浮山县|