日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

OpenAI 把 GPT-4 原始版給了瑞士洛桑聯邦理工團隊:研究不微調只靠提示詞能走多遠

來源: 責編: 時間:2024-06-06 17:36:04 211觀看
導讀 除了 OpenAI 自己,居然還有別人能用上 GPT-4-Base 版??也就是未經微調的預訓練版,還不會對話聊天,只會補全句子的模型。EPFL(瑞士洛桑聯邦理工)團隊申請到了訪問權限,用于研究“上下文學習足以讓大模型跟隨指令嗎?”。

除了 OpenAI 自己,居然還有別人能用上 GPT-4-Base 版??也就是未經微調的預訓練版,還不會對話聊天,只會補全句子的模型。EgC28資訊網——每日最新資訊28at.com

EPFL(瑞士洛桑聯邦理工)團隊申請到了訪問權限,用于研究“上下文學習足以讓大模型跟隨指令嗎?”。EgC28資訊網——每日最新資訊28at.com

也就是不用監督微調、也不用 RHLF 或其他強化學習對齊方法,只靠提示詞能走多遠?EgC28資訊網——每日最新資訊28at.com

預訓練模型,究竟能不能一步登天,直接改造成聊天機器人或 AI 助手?EgC28資訊網——每日最新資訊28at.com

EgC28資訊網——每日最新資訊28at.com

如果可行,將大大降低類 ChatGPT 大模型的開發難度。EgC28資訊網——每日最新資訊28at.com

免微調對齊靠譜嗎?

免微調對齊,讓剛出爐的預訓練模型不止會“文本補全”,只從提示詞中學會和用戶對話、跟隨指令,一直是業界關注的研究方向。EgC28資訊網——每日最新資訊28at.com

目前的 SOTA 方法(指某個領域在之前的研究中效果最好的方法)URIAL 來自艾倫研究所,使用系統提示詞 + 少數風格示例就能達到不錯的效果。EgC28資訊網——每日最新資訊28at.com

EgC28資訊網——每日最新資訊28at.com

但 EPFL 團隊發現,URIAL 仍無法完全彌補與指令微調模型的差距,尤其在多輪對話中的表現更差一些。EgC28資訊網——每日最新資訊28at.com

實驗中,在 Llama 系列、Mistral 系列和一般人接觸不到的 GPT-4-Base 都觀察到這種現象。EgC28資訊網——每日最新資訊28at.com

其中 GPT-4-Base 的 API 訪問權限從 OpenAI Researcher Access Program 項目中申請到。EgC28資訊網——每日最新資訊28at.com

EgC28資訊網——每日最新資訊28at.com

EPFL 團隊從這里出發,嘗試了各種辦法來提升上下文學習的效果。EgC28資訊網——每日最新資訊28at.com

首先他們增加示例的數量,但發現幫助不大,沒有隨著例子數目增加性能就提升的趨勢。這一點跟圖像分類、機器翻譯等任務還不太一樣。EgC28資訊網——每日最新資訊28at.com

EgC28資訊網——每日最新資訊28at.com

然后他們使用了貪心搜索算法,從一大堆示例中選擇最佳的添加到上下文。EgC28資訊網——每日最新資訊28at.com

這種方法可以進一步提高性能,但與指令微調模型的差距仍然存在,特別是在 AlpacaEval 2.0 基準測試中。EgC28資訊網——每日最新資訊28at.com

EgC28資訊網——每日最新資訊28at.com

此外他們還發現,貪心搜索為某個特定模型找到的最佳示例,對于其他模型不能可靠地遷移。EgC28資訊網——每日最新資訊28at.com

也就是說,不同的示例適合不同的模型。EgC28資訊網——每日最新資訊28at.com

EgC28資訊網——每日最新資訊28at.com

團隊還進行了一系列消融實驗(指移除或變換某個組件,來研究該組件對系統功能的影響),以更多地了解上下文學習的工作原理。EgC28資訊網——每日最新資訊28at.com

他們發現,在 MT-Bench 這樣的綜合評測中,示例包含正確的“問題-答案對”至關重要。EgC28資訊網——每日最新資訊28at.com

這與此前大模型在分類任務中,只要有大量示例,部分標簽錯了也無所謂的發現非常不同。EgC28資訊網——每日最新資訊28at.com

EgC28資訊網——每日最新資訊28at.com

所以最終得出的結論是:EgC28資訊網——每日最新資訊28at.com

即使采用更多復雜的改進方法,完全縮小上下文學習和指令微調之間的差距也有挑戰,即使對于非常長上下文的大模型也是如此。EgC28資訊網——每日最新資訊28at.com

論文最后分析,大語言模型可能通過上下文學習只學會了如何模仿例子里的回答風格,但還沒有真正理解執行指令的邏輯。EgC28資訊網——每日最新資訊28at.com

指令跟隨任務相對還是比較復雜和開放的,沒那么容易掌握。EgC28資訊網——每日最新資訊28at.com

想讓 AI 助手更“聽話”,暫時還是很難有捷徑可走。EgC28資訊網——每日最新資訊28at.com

論文地址:EgC28資訊網——每日最新資訊28at.com

https://arxiv.org/abs/2405.19874EgC28資訊網——每日最新資訊28at.com

參考鏈接:EgC28資訊網——每日最新資訊28at.com

[1]https://x.com/maksym_andr/status/1796574297894318136EgC28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:夢晨EgC28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4512-0.htmlOpenAI 把 GPT-4 原始版給了瑞士洛桑聯邦理工團隊:研究不微調只靠提示詞能走多遠

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: Zoom 創始人談視頻會議未來:數字人“代勞”參會,本人可抽出時間陪伴家人

下一篇: “全球首創”單臺 RTX 4090 服務器推理,昆侖萬維開源 2 千億稀疏大模型天工 MoE

標簽:
  • 熱門焦點
  • 從科幻走進現實,元宇宙概念逐漸清晰

    2021年,元宇宙概念如同一顆炸彈投進互聯網行業,掀起了一場數字海嘯,眾多企業紛紛入局,在此新領域展開新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻紅,元宇宙走進資本圈2021年3
  • 【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

    虛擬數字人行業未來的主要驅動力包括:用戶代際變化,新一代消費者對內容消費和虛擬世界更為渴求;虛擬數字人相關技術門檻相對降低,成本有所回落;資本熱度上升,受Metav
  • 韓國主權基金增加對硅谷初創公司投資 押注元宇宙和人工智能

    韓國投資公司(KIC)CEO Seoungho Jin預計,該公司在舊金山的辦事處今年將擴招人手,探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
  • Layer1的新以太坊,更好的以太坊?

    以太坊作為區塊鏈基礎設施地位看起來已不可動搖,但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
  • Meta證實Quest 2無法實現全身追蹤,未來將為虛擬化身配備“假腿”

    上周,外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項,暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中,Meta Reali
  • 影響元宇宙土地價格的五個因素

    參考來源 | cryptonews編譯 | Ciel@iNFTnews.com元宇宙中的房地產價格主要取決于使用它的人數,以及為所有者創造收益的能力。專注于數字資產的投資公司LedgerPr
  • Web 3如何改變傳統HR

    互聯網自誕生以來,經歷了三次迭代。Web1是第一階段,包括ISP服務器上的個人網頁或免費的虛擬主機服務。然后Web2出現了,它引入了動態的用戶生成內容、互操作性、增
  • GameFi 深度解析,元宇宙內容雛形顯現

    GameFi=Game(游戲)+Defi(去中心化金融),核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能,GameFi 游戲資產化身為NFT 和代幣上鏈,具備了可驗證性和流通性;開
  • 我們離元宇宙的實現只差一副眼鏡?

    近日的蘋果春季新品發布會,想必許多人都守在了屏幕前,就為等待傳說中的首款AR Glass。在發布會之前,蘋果全球營銷主管Greg Joswiak曾在Twitter上分享了一段短視頻
Top 主站蜘蛛池模板: 盈江县| 衡南县| 河北区| 易门县| 大渡口区| 荆门市| 福州市| 礼泉县| 云龙县| 萝北县| 张掖市| 二连浩特市| 旺苍县| 巴林左旗| 寿光市| 阆中市| 长武县| 璧山县| 绵竹市| 乐昌市| 普兰县| 曲靖市| 景洪市| 吉木乃县| 铜川市| 崇左市| 嘉祥县| 辽阳县| 锦屏县| 临沂市| 深泽县| 张家界市| 嘉祥县| 邮箱| 岚皋县| 土默特右旗| 昌图县| 松溪县| 湟源县| 巍山| 镇江市|