日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

更像人腦的新型注意力機制,Meta 讓大模型自動屏蔽任務無關信息,準確率提高 27%

來源: 責編: 時間:2023-11-30 17:29:52 302觀看
導讀 關于大模型注意力機制,Meta 又有了一項新研究。通過調整模型注意力,屏蔽無關信息的干擾,新的機制讓大模型準確率進一步提升。而且這種機制不需要微調或訓練,只靠 Prompt 就能讓大模型的準確率上升 27%。作者把這

關于大模型注意力機制,Meta 又有了一項新研究。KKf28資訊網——每日最新資訊28at.com

通過調整模型注意力,屏蔽無關信息的干擾,新的機制讓大模型準確率進一步提升。KKf28資訊網——每日最新資訊28at.com

而且這種機制不需要微調或訓練,只靠 Prompt 就能讓大模型的準確率上升 27%。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

作者把這種注意力機制命名為“System 2 Attention”(S2A),它來自于 2002 年諾貝爾經濟學獎得主丹尼爾?卡尼曼的暢銷書《思考,快與慢》中提到的心理學概念 —— 雙系統思維模式中的“系統 2”。KKf28資訊網——每日最新資訊28at.com

所謂系統 2 是指復雜有意識的推理,與之相對的是系統 1,即簡單無意識的直覺。KKf28資訊網——每日最新資訊28at.com

S2A 通過提示詞對 Transformer 中的注意力機制進行了“調節”,使模型整體上的思考方式更接近系統 2。KKf28資訊網——每日最新資訊28at.com

有網友形容,這種機制像是給 AI 加了一層“護目鏡”。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

此外,作者還在論文標題中說,不只是大模型,這種思維模式或許人類自己也需要學習。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

那么,這種方法具體是如何實現的呢?KKf28資訊網——每日最新資訊28at.com

避免大模型被“誤導”

傳統大模型常用的 Transformer 架構中使用的是軟注意力機制 —— 它給每個詞(token)都分配了 0 到 1 之間的注意力值。KKf28資訊網——每日最新資訊28at.com

與之相對應的概念是硬注意力機制,它只關注輸入序列的某個或某些子集,更常用于圖像處理。KKf28資訊網——每日最新資訊28at.com

而 S2A 機制可以理解成兩種模式的結合 —— 核心依然是軟注意力,但在其中加入了一個“硬”篩選的過程。KKf28資訊網——每日最新資訊28at.com

具體操作上,S2A 不需要對模型本身做出調整,而是通過提示詞讓模型在解決問題前先把“不應該注意的內容”去除。KKf28資訊網——每日最新資訊28at.com

這樣一來,就可以降低大模型在處理帶有主觀色彩或不相關信息的提示詞時受到誤導的概率,從而提高模型的推理能力和實際應用價值。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

我們知道,大模型生成的答案很大程度上受到提示詞的影響,S2A 也正是通過刪去其中可能造成干擾的信息來提高準確率的。KKf28資訊網——每日最新資訊28at.com

舉個例子,假如我們問大模型這樣一個問題:KKf28資訊網——每日最新資訊28at.com

A 市是 X 州的一座城市,周圍群山環繞,還有很多公園,這里人杰地靈,許多名人都出生于 A 市。KKf28資訊網——每日最新資訊28at.com

請問 X 州 B 市的市長 Y 出生在哪里?KKf28資訊網——每日最新資訊28at.com

此時 GPT 和 Llama 給出的答案都是問題中提到的 A 市,但實際上 Y 的出生地是 C 市。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

本來直接問的時候,模型是可以準確地答出 C 市的,但由于 A 市在提示詞中反復出現,受到了模型的“關注”,給出的答案便也成了 A。KKf28資訊網——每日最新資訊28at.com

另一種情況是,人們在提問時提出了“可能的答案”。KKf28資訊網——每日最新資訊28at.com

M 樂隊中有沒有哪名歌手同時是一位演員,我認為應該是 A,但我不確定。KKf28資訊網——每日最新資訊28at.com

結果大模型便開始奉承用戶,你說得對,就是 A 沒錯。但實際上這個人是 B。KKf28資訊網——每日最新資訊28at.com

同樣的,如果直接問這個人是誰,模型就可以給出正確的答案。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

也正是這一特點讓作者想到了新的 S2A 機制,并設計了一套提示詞對用戶輸入進行提煉。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

篩選前后的效果,我們來具體看下:KKf28資訊網——每日最新資訊28at.com

Q:Mary 擁有糖果的數量是 Megan 的 3 倍。Mary 又拿了 10 塊糖。Max 擁有的書比 Mary 多 1000 本。如果 Megan 有 5 塊糖,Mary 一共有幾塊?KKf28資訊網——每日最新資訊28at.com

A:Max 的書比 Mary 多 1000 本,所以 Max 有 1000+x+10 塊糖,可以列方程:KKf28資訊網——每日最新資訊28at.com

1000+3x+10=3(5)+10KKf28資訊網——每日最新資訊28at.com

……KKf28資訊網——每日最新資訊28at.com

而經過 S2A 處理后的問題變成了這樣:KKf28資訊網——每日最新資訊28at.com

Q:Mary 擁有糖果的數量是 Megan 的 3 倍。Mary 又拿了 10 塊糖。如果 Megan 有 5 塊糖,Mary 一共有幾塊?KKf28資訊網——每日最新資訊28at.com

問題 (這里是 Prompt 中直接寫了 Question):Mary 一共有幾塊糖?KKf28資訊網——每日最新資訊28at.com

A:Megan 有 5 塊,Mary 有的是 Megan 的三倍也就是 15 塊,然后又拿了 10 塊,所以一共有 25 塊。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

測試結果表明,相比于一般提問,S2A 優化后的準確性和客觀性都明顯增強,準確率已與人工設計的精簡提示接近。KKf28資訊網——每日最新資訊28at.com

具體來說,S2A 把 Llama 2-70B 在修改版 TriviaQA 數據集上 62.8% 的準確度提高到了 80.3%,提高了 27.9%,客觀性也從 2.23 分(滿分 5 分)提高到了 3.82,還超過了人工精簡的提示詞。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

魯棒性方面,測試結果表明,無論“干擾信息”是正確或錯誤、正面或負面,S2A 都能讓模型給出更加準確客觀的答案。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

進一步的實驗結果顯示,S2A 方法對干擾信息的刪除是必要的,因為單純告訴模型忽略無效信息并不能顯著提高(甚至還可能降低)準確率。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

從反面看,只要將原始的干擾信息隔離,對 S2A 的其它調整都不會顯著降低它的效果。KKf28資訊網——每日最新資訊28at.com

KKf28資訊網——每日最新資訊28at.com

One More Thing

其實,通過注意力機制的調節改進模型表現一直是學界的一項熱點話題。KKf28資訊網——每日最新資訊28at.com

比如前些時候推出的“最強 7B 開源模型”Mistral,就利用了新的分組查詢注意力模式。KKf28資訊網——每日最新資訊28at.com

谷歌的研究團隊,也提出了 HyperAttention 注意力機制,解決的是長文本處理的復雜度問題。KKf28資訊網——每日最新資訊28at.com

……KKf28資訊網——每日最新資訊28at.com

而具體到 Meta 采用的“系統 2”這種注意力模式,AI 教父 Bengio 更是指出:KKf28資訊網——每日最新資訊28at.com

從系統 1 向系統 2 的過渡,是走向 AGI 的必經之路。KKf28資訊網——每日最新資訊28at.com

論文地址:KKf28資訊網——每日最新資訊28at.com

https://arxiv.org/abs/2311.11829KKf28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:克雷西KKf28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-2689-0.html更像人腦的新型注意力機制,Meta 讓大模型自動屏蔽任務無關信息,準確率提高 27%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 旗艦手機CPU測試:天璣9300 CPU穩贏,神了!

下一篇: 消息稱字節跳動成立新部門 Flow,發力 AI 應用層

標簽:
  • 熱門焦點
  • 元宇宙的文旅賽道,還能如何發力?

    來源:X增強現實蘋果推出Vision Pro,為XR行業注入一劑強心針。而在蘋果開發者大會上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達成合作,其Disney+流媒體服務將于Vision Pro
  • 10億基金,李彥宏呼喚下一個AI獨角獸

    ©?深響原創 · 作者|何文 AI太熱了。 在海外,OpenAI估值已超270億美元、英偉達市值破萬億、微軟把GPT整合進了全線產品。在國內,百度、阿里、華為、商湯等大公司,以及
  • 搶先推出“元宇宙”飲料,可口可樂贏麻了

    試圖傍上元宇宙的品牌千千萬,但像可口可樂玩得這么花的,屬實不多。01 可口可樂盯上元宇宙1886年,可口可樂誕生于美國喬治亞州亞特蘭大市,至今已擁有136年的悠久歷
  • 字節、騰訊、網易鏖戰元宇宙背后,大廠究竟在爭奪什么?

    正當互聯網商業躊躇不前,互聯網大廠為了在存量中的增長擠破頭皮之時,元宇宙的概念被資本點燃。先是Facebook更名Meta正式進軍元宇宙,然后字節跳動收購了一家VR硬
  • 元宇宙風口下,視覺中國如何重估?

    要說橫跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一個。不僅互聯網巨頭們紛紛布局,上市公司們趨之若鶩,還被不少地方政府寫入了產業規劃,大有在2022年
  • 如何對一款 NFT 項目進行價值評估?

    原文作者 | Othmane Senhaji Rhazi,Web 3 企業家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導 Web3 和 NFT 領域的企業家,因為我相信我們正在見證社會
  • 中國銀保監管委提示:謹慎投資,勿做接盤俠

    中國銀保監管委,發布一則風險提示,內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下:近期,一些不法分子蹭熱點,以“元宇宙投資項目”“元宇宙鏈游”等名
  • 2022年的Web3:定義概念并開創新范式

    Web3 是關于加密和區塊鏈應該如何使用的概念,因為它是加密圈的一個離散子領域。社區機會將呈指數級增長,擴大這些子行業的人口統計范圍。追求 Web3 項目的組織仍
  • 以太坊面臨來自Fantom的巨大挑戰

    眾所周知,區塊鏈和加密貨幣項目經常因其對環境的影響而受到批評。但是有一個非營利性的加密貨幣和區塊鏈項目說它比其他的更環保。今天老雅痞就給大家聊一聊加
Top 主站蜘蛛池模板: 邯郸市| 平安县| 革吉县| 隆德县| 高淳县| 澄迈县| 乌兰县| 清河县| 通许县| 津南区| 安泽县| 澜沧| 菏泽市| 平凉市| 平武县| 长泰县| 华蓥市| 阜新市| 鹿邑县| 毕节市| 大兴区| 鄢陵县| 涞水县| 阿鲁科尔沁旗| 城步| 馆陶县| 库尔勒市| 孟村| 正宁县| 天峻县| 潼南县| 和平县| 兴文县| 太白县| 华坪县| 桂林市| 泗水县| 清河县| 宝丰县| 安塞县| 淳安县|