日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

中山大學團隊“梗王”大模型,靠講笑話登上 CVPR

來源: 責編: 時間:2024-04-15 18:07:35 269觀看
導讀 誰能想到,只是讓大模型講笑話,論文竟入選了頂會 CVPR(國際計算機視覺與模式識別會議)!沒開玩笑,這還真真兒的是一項正兒八經的研究。例如看下面這張圖,如果讓你根據它來講個笑話或梗,你會想到什么?現在的大模型看完后

誰能想到,只是讓大模型講笑話,論文竟入選了頂會 CVPR(國際計算機視覺與模式識別會議)!AMl28資訊網——每日最新資訊28at.com

沒開玩笑,這還真真兒的是一項正兒八經的研究。例如看下面這張圖,如果讓你根據它來講個笑話或梗,你會想到什么?AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

現在的大模型看完后會說:AMl28資訊網——每日最新資訊28at.com

腦子短路。AMl28資訊網——每日最新資訊28at.com

再看一眼蜘蛛俠的海報,大模型會配一句“剛擦的玻璃不能弄臟”。AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

李云龍、奧本海默也被玩得飛起:AMl28資訊網——每日最新資訊28at.com

導師讀了我的論文之后……AMl28資訊網——每日最新資訊28at.com

真男人不回頭看爆炸。AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

還有醬紫的:AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

不得不說,大模型這腦洞還是挺大的。AMl28資訊網——每日最新資訊28at.com

這項研究正是來自中山大學 HCP 實驗室林倞教授團隊、Sea AI Lab 和哈佛大學等單位,主打的就是打破常規思維思考(Think Outside the Box),探索多模態大模型的創造力。AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

要知道,同樣的圖要是“喂”給 ChatGPT(GPT-4)等主流大模型,讓它們講笑話或梗,畫風可并非如此:AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

太正經了!So boring~~~~AMl28資訊網——每日最新資訊28at.com

那么中山大學等單位的這個“梗王大模型”,是怎么煉成的呢?AMl28資訊網——每日最新資訊28at.com

先讓大模型看搞笑的數據

在數據的選擇上,團隊 pick 的是來自日本的“大喜利”(Oogiri)創新響應游戲。AMl28資訊網——每日最新資訊28at.com

“大喜利”本來是指一系列日本傳統戲劇游戲,隨著時代的快速發展。現代的“大喜利”,目前一般是指一種叫 Tonchi (頓智)的游戲,通常以游戲節目或智力問答節目的形式呈現。AMl28資訊網——每日最新資訊28at.com

玩家被提供各種多模態內容,可以是簡單的問題、隨機圖像等,然后提示玩家想出幽默的、有創意的反應,以達到令人驚訝的喜劇效果。AMl28資訊網——每日最新資訊28at.com

例如下面這個“圖文到文”的例子:AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

玩家要求閱讀圖像,和上面對應的文字,嘗試想出一段文字填入對應的問號“?”位置,使得整個圖文可以展示出幽默且有創意的效果。AMl28資訊網——每日最新資訊28at.com

在第一個例子中,老人向年輕人尋求幫助,從正常的思維來看,可能的填寫方式可以是“請問 xxx 路怎么走?”或者是“可以帶我回家嗎,我迷路了”之類的。AMl28資訊網——每日最新資訊28at.com

然而,所給出的“你… 你能幫我解開手銬嗎?”的寫法具有沖擊感、幽默感,且看起來確實是這么一回事,讓人忍俊不禁。AMl28資訊網——每日最新資訊28at.com

再看下“圖到文”的例子:AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

玩家要求看圖配文,并使得圖文搭配起來具有幽默效果。AMl28資訊網——每日最新資訊28at.com

這張圖看起來是一個很普通的拖車的圖片(需要注意的是,在“大喜利”游戲中,一般圖片都是很普通的日常圖片)。AMl28資訊網——每日最新資訊28at.com

配文“快讓開!我的兄弟傷得很嚴重”讓傾斜著身體 45° 向上的車看起來像是一個奄奄一息的車子;在道路上快速的馳騁也確實體現了位于下方的車很著急,急著送兄弟去醫院。AMl28資訊網——每日最新資訊28at.com

還有第三種“文到文”的例子:AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

玩家被要求根據所給的文字進行回復,使得回復和問題合在一起具備幽默感。AMl28資訊網——每日最新資訊28at.com

這個例子中的回復似乎在調侃程序員的日常工作主要就是代碼的“復制 + 粘貼”(注:CV 工程師除了可以表示 computer vision 工程師也可以表示 ctrl+c / ctrl+v 工程師 )。AMl28資訊網——每日最新資訊28at.com

這項工作主要關注的就是這三種類型的“大喜利”游戲,相關數據 Oogiri-GO如下表所示,含中英日三種語言:AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

至于為什么要選擇“大喜利”這個游戲,是因為團隊認為它是用于探索多模態大模型創新能力的理想平臺。具體原因如下:AMl28資訊網——每日最新資訊28at.com

“大喜利”游戲是天然的創新響應任務。如上所提到的,現代“大喜利”也被稱為 Tonchi (頓智)。“頓”在日文和中文中都表示“突然”,而“智”的意思是“智力、洞察力或直覺”,該游戲天然地要求玩家給出令人眼前一亮、靈光一閃的創新響應;AMl28資訊網——每日最新資訊28at.com

“大喜利”的數據格式是高度合適的。不管是“圖文到文”、“圖到文”還是“文到文”,這些類型都天然地和目前多模特大模型的輸入輸出格式吻合,即輸入為“圖文”,輸出僅為“文”。AMl28資訊網——每日最新資訊28at.com

“大喜利”數據質量高。創新是一件很難的事情,即使是人類,因此能作為“創新”相關的數據集并不多。鑒于該游戲長期在互聯網上非常活躍(在中文社區中,一般也叫日式神吐槽 / 冷吐槽),而且帶有大量點評數據,比如點贊數等等。正好積累了大量高質量人類創新幽默響應可以被用于研究。AMl28資訊網——每日最新資訊28at.com

再讓大模型打破常規思考

傳統的鏈式思考(Chain-of-Thought,CoT)方法是一種順序思考過程,通過逐步推理指導大模型進行邏輯推理,每個后續的思考都建立在前一個思考的基礎上:AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

這一思考過程一定程度上確保了精確性和嚴謹性,但對于創造性問題表現不佳。AMl28資訊網——每日最新資訊28at.com

因此,團隊探索了一種新的非順序、創造性思維范式 —— 跳躍思維 Leap-of-Thought(LoT)。AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

這種范式涉及到思考關聯性和知識跳躍。遠距離的思考也被認為是聯想。AMl28資訊網——每日最新資訊28at.com

與 CoT 強調邏輯緊密的思維鏈不同,LoT 強調打破常規思維思考問題,激發模型的創造力。AMl28資訊網——每日最新資訊28at.com

基于此,團隊在 Oogiri-GO 數據集基礎之上,進一步提出了一套激發多模態大模型創造力的訓練方法 CLoT。AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

具體而言,CLoT 包括兩個階段。AMl28資訊網——每日最新資訊28at.com

首先是關聯性指令微調。AMl28資訊網——每日最新資訊28at.com

在這一階段,本文設計生成式和判別式模板,將 Oogiri-GO 數據集轉換為指令微調的訓練數據,用于訓練多模態大模型,使得模型具備初步的創新響應能力。AMl28資訊網——每日最新資訊28at.com

其次是探索性自我調整。AMl28資訊網——每日最新資訊28at.com

在這一階段中,本文首先通過設計遠關聯的條件詞,促使(1)中的模型生成多樣化且與輸入遠關聯的回答,并設計篩選流程,獲得可靠的新 LoT 數據。隨后,新數據被轉換成指令微調的訓練數據,用于進一步微調模型。AMl28資訊網——每日最新資訊28at.com

這一階段可以再細分為兩個步驟:AMl28資訊網——每日最新資訊28at.com

探索性遠程關聯:這一步驟鼓勵 LLM 在給定的弱關聯條件下產生創新的回應。通過這種方式,LLM 學習在看似不相關的概念之間建立聯系,從而生成多樣化的創意內容。AMl28資訊網——每日最新資訊28at.com

自我精煉:在探索性遠程關聯的基礎上,通過設計一系列篩選流程,收集到的創意回應被用來進一步訓練 LLM。這樣做可以提高 LLM 在處理創造性任務時的表現,使其能夠生成更高質量和多樣性的內容。AMl28資訊網——每日最新資訊28at.com

性能評估

為了盡可能全面評估 CLoT,這項研究基于 Oogiri-GO 數據集,設計了選擇題和排序題作為量化評估方式。AMl28資訊網——每日最新資訊28at.com

實驗結果表明,CLoT 能夠顯著提高多模態大模型(如 Qwen 和 CogVLM)的性能,顯著超越包括 GPT4v 在內的先進模型。AMl28資訊網——每日最新資訊28at.com

另外,與其他先進推理框架 CoT 等相比,在各項量化指標下也是有顯著優勢的。AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

此外,研究團隊還通過用戶調查,證實了 CLoT 幫助模型生成了更好的幽默內容。AMl28資訊網——每日最新資訊28at.com

AMl28資訊網——每日最新資訊28at.com

研究團隊還考慮到了 CLoT 的泛化性,用“看云猜物 CGG”和“發散思維測試 DAT”兩個其他任務評估 CLoT 的性能,實驗結果顯示 CLoT 相對于基準模型具有更好的準確度,說明 CLoT 具備不錯的泛化能力。AMl28資訊網——每日最新資訊28at.com

DAT 是一種用于評估人類聯想創造能力的測試。AMl28資訊網——每日最新資訊28at.com

團隊介紹

中山大學人機物智能融合實驗室 (HCP Lab) 由林倞教授于 2010 年創辦,近年來在多模態內容理解、因果及認知推理、具身學習等方面取得豐富學術成果,數次獲得國內外科技獎項及最佳論文獎,并致力于打造產品級的 AI 技術及平臺。AMl28資訊網——每日最新資訊28at.com

論文:https://arxiv.org/ abs / 2312.02439AMl28資訊網——每日最新資訊28at.com

Project:https://zhongshsh.github.io/CLoT/AMl28資訊網——每日最新資訊28at.com

Code:https://github.com/sail-sg/CLoTAMl28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:關注前沿科技AMl28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3991-0.html中山大學團隊“梗王”大模型,靠講笑話登上 CVPR

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 國家網信辦發布第五批深度合成服務算法備案信息,理想汽車 MindGPT 等 394 個算法在列

下一篇: 報告:79.8% 受訪美國公民希望對人工智能實施嚴格法律監管

標簽:
  • 熱門焦點
  • 歐盟人工智能法案:四種AI系統風險類型的劃分及監管措施

    作者:趙志東 蔡佳雯來源:區塊鏈日報該法案采用風險分級的規制路徑,將人工智能系統的風險劃分成不可接受的風險、高風險、有限風險和輕微風險四種類型,并針對不同類型施加了不同
  • 一份全面清單:Web3行業高薪酬的13種工作

    來源:區塊鏈騎士這可能會讓許多人感到震驚,但除了成為開發人員之外,Web3還有其他高薪工作。Web3可能是現代就業市場中跨學科最多的領域,換句話說,它由許多個在不同領域中具有不同
  • 元宇宙里賣酸奶,好炸裂的操作!

    作者 | 李東陽 來源 | 首席營銷官有沒有發現,當下的熱搜出現一個有意思的現象,那就是“情懷”不知不覺成為了主流,爺青回話題討論性非常高。前有名偵探柯南和優衣庫
  • VR/AR迷失元宇宙“硝煙”

    不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣,又隨著元宇宙回歸平靜。1月份,微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員,其中負責混合現實硬件(MR)的Holo
  • 2022 區塊鏈 50 強榜單;垃圾NFT項目的十三個特性

    本期關鍵字TerraZero在Decentraland完成元宇宙住房抵押貸款;騰訊發行齊白石畫作數字藏品;Ripple成為數字歐元協會成員;Gem上線稀有度排名功能;2022 區塊鏈 50 強榜
  • 冰墩墩還能火多久?

    作者:田巧云題圖源自北京2022年冬奧會官方微博如果要問2022年的開年明星是誰,冰墩墩當仁不讓。幾乎所有人都被那個抖雪的動作實力圈粉。在社交媒體的助推,以及日
  • 2022年去中心化交易所會崛起嗎?

    “在某個時候,去中心化衍生品的交易量可能會超過去中心化現貨交易所。”DEX 越來越多地轉向第二層解決方案。“數字化金融市場的概念以及如何沿著以用戶為中心
  • NFT也有黃牛?這家公司專門對付外掛作弊機器人

    澳大利亞前總理馬爾科姆·特恩布爾 (Malcolm Turnbull) 是支持薩姆·Crowther (Sam Crowther) 的人之一,Sam是一名出生于紐卡斯爾的黑客,他的職業生涯始于為國防
  • 對諷刺無動于衷,Nori將碳市場放在區塊鏈上

    當我們聊氣候問題的解決方案時,以太坊區塊鏈應該不是最首想到的,但這正是Nori所選擇的方案,它建立了一個引擎,鼓勵農民使用負碳耕作方法,將空氣中的碳抽出并放回地
Top 主站蜘蛛池模板: 安康市| 衡山县| 类乌齐县| 大理市| 镶黄旗| 泸西县| 广灵县| 翼城县| 博白县| 汪清县| 青冈县| 闸北区| 涡阳县| 通海县| 鄢陵县| 色达县| 鲁甸县| 青河县| 白玉县| 濮阳市| 沂水县| 南丹县| 和龙市| 汝阳县| 永德县| 正定县| 苏州市| 沂南县| 余干县| 汽车| 大化| 合川市| 广德县| 张掖市| 读书| 望江县| 资源县| 句容市| 永川市| 宜良县| 太仆寺旗|