日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

弱智吧竟成最佳中文 AI 訓(xùn)練數(shù)據(jù)?中科院等:8 項(xiàng)測試第一,遠(yuǎn)超知乎豆瓣小紅書

來源: 責(zé)編: 時(shí)間:2024-04-09 17:17:48 195觀看
導(dǎo)讀 離大譜了,弱智吧登上正經(jīng) AI 論文,還成了最好的中文訓(xùn)練數(shù)據(jù)??具體來說,使用弱智吧數(shù)據(jù)訓(xùn)練的大模型,跑分超過百科、知乎、豆瓣、小紅書等平臺(tái),甚至是研究團(tuán)隊(duì)精心挑選的數(shù)據(jù)集。在問答、頭腦風(fēng)暴、分類、生成、總結(jié)

離大譜了,弱智吧登上正經(jīng) AI 論文,還成了最好的中文訓(xùn)練數(shù)據(jù)??GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

具體來說,使用弱智吧數(shù)據(jù)訓(xùn)練的大模型,跑分超過百科、知乎、豆瓣、小紅書等平臺(tái),甚至是研究團(tuán)隊(duì)精心挑選的數(shù)據(jù)集。GCB28資訊網(wǎng)——每日最新資訊28at.com

在問答、頭腦風(fēng)暴、分類、生成、總結(jié)、提取等 8 項(xiàng)測試中取得最高分。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

沒錯(cuò),論文中的 Ruozhiba 就是指百度貼吧弱智吧,一個(gè)充滿荒謬、離奇、不合常理發(fā)言的中文社區(qū),畫風(fēng)通常是這樣的:GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

最離譜的是,弱智吧 AI 代碼能力也超過了使用專業(yè)技術(shù)問答社區(qū)思否數(shù)據(jù)訓(xùn)練的 AI,這下吧友自己都鬧不明白了。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

其他平臺(tái)圍觀網(wǎng)友也紛紛蚌埠住。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

這項(xiàng)研究來自中科院深圳先進(jìn)技術(shù)研究院、中科院自動(dòng)化研究所,滑鐵盧大學(xué)等眾多高校、研究機(jī)構(gòu)聯(lián)合團(tuán)隊(duì)。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

作者之一也現(xiàn)身評(píng)論區(qū),透露使用弱智吧數(shù)據(jù)訓(xùn)練 AI 屬于靈機(jī)一動(dòng),以前只用來測試。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

弱智吧數(shù)據(jù)究竟如何達(dá)成這一成就,具體到論文中看。GCB28資訊網(wǎng)——每日最新資訊28at.com

弱智發(fā)言成指令微調(diào)神器

這項(xiàng)研究起初為解決中文大模型訓(xùn)練中的諸多問題:GCB28資訊網(wǎng)——每日最新資訊28at.com

中文數(shù)據(jù)集很多是從英文翻譯過來的,沒有很好地契合中文的語言習(xí)慣和文化背景GCB28資訊網(wǎng)——每日最新資訊28at.com

不少數(shù)據(jù)集是用 AI 生成的,質(zhì)量難以保證,容易出現(xiàn)事實(shí)性錯(cuò)誤GCB28資訊網(wǎng)——每日最新資訊28at.com

即使是人工標(biāo)注的數(shù)據(jù)集,也存在數(shù)據(jù)量小、覆蓋領(lǐng)域不全面等問題GCB28資訊網(wǎng)——每日最新資訊28at.com

為了解決這些痛點(diǎn),團(tuán)隊(duì)從中文互聯(lián)網(wǎng)的各種知識(shí)源頭直接收集數(shù)據(jù),比如知乎、豆瓣、百科、小紅書等,經(jīng)過一系列嚴(yán)格的清洗和人工審核,打造成高質(zhì)量、多樣化的中文指令微調(diào)數(shù)據(jù)集 COIG-CQIA。GCB28資訊網(wǎng)——每日最新資訊28at.com

除了探索不同數(shù)據(jù)源的作用,團(tuán)隊(duì)還專門從中抽取出一個(gè)精華子集 CQIA-Subset。GCB28資訊網(wǎng)——每日最新資訊28at.com

在眾多數(shù)據(jù)來源中,弱智吧成了最特別的一個(gè)。GCB28資訊網(wǎng)——每日最新資訊28at.com

由 500 個(gè)點(diǎn)贊最高的帖子標(biāo)題 + 人工或 GPT-4 的回復(fù)組成指令微調(diào)數(shù)據(jù)集,經(jīng)過人工審核后,最終留下了 240 組指令-回復(fù)數(shù)據(jù)對(duì)。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

分別用各種數(shù)據(jù)集訓(xùn)練零一萬物 Yi 系列開源大模型,在 BELLE-Eval 測試集上使用 GPT-4 評(píng)分得到結(jié)果。GCB28資訊網(wǎng)——每日最新資訊28at.com

在規(guī)模較小的 Yi-6B 模型上,純?nèi)踔前砂姹究偡峙琶谌€不算太突出。GCB28資訊網(wǎng)——每日最新資訊28at.com

看來小模型還沒能領(lǐng)悟弱智的精髓。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

到了 Yi-34B,弱智吧版本表現(xiàn)就一騎絕塵了。GCB28資訊網(wǎng)——每日最新資訊28at.com

只有在改寫和數(shù)學(xué)任務(wù)上沒能取得最高分,但成績也比較靠前。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

另外,在安全評(píng)估上弱智吧版本也能排上第二。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

對(duì)于這類現(xiàn)象,研究人員在分析中也給出簡單猜測:GCB28資訊網(wǎng)——每日最新資訊28at.com

可能是弱智吧問題增強(qiáng)了 AI 的邏輯推理能力,從而使指令遵循任務(wù)受益。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)然弱智吧并不是這項(xiàng)研究的全部,它的真正貢獻(xiàn)在于為中文大模型開發(fā)提供了一個(gè)高質(zhì)量的指令微調(diào)數(shù)據(jù)集 COIG-CQIA。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

通過對(duì)各種中文互聯(lián)網(wǎng)數(shù)據(jù)源的探索,這項(xiàng)研究為構(gòu)建中文指令數(shù)據(jù)集提供了很多有益的啟示。比如社交媒體數(shù)據(jù)雖然開放多樣,但也存在不少有害信息風(fēng)險(xiǎn);而百科類數(shù)據(jù)專業(yè)性強(qiáng),但覆蓋面可能不夠廣。GCB28資訊網(wǎng)——每日最新資訊28at.com

弱智吧上大分

這項(xiàng)研究一發(fā),網(wǎng)友集體笑不活。除了“XSWL、思路開闊了”這樣的純圍觀,也有網(wǎng)友認(rèn)真討論起了弱智吧有如此奇效的原因。GCB28資訊網(wǎng)——每日最新資訊28at.com

大伙兒都比較認(rèn)可的一個(gè)原因是弱智吧題目的“異質(zhì)”。GCB28資訊網(wǎng)——每日最新資訊28at.com

像腦筋急轉(zhuǎn)彎,增加了指令多樣性,所以提升了模型最終性能:GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

通用數(shù)據(jù)集多半已經(jīng)在 pretrain 階段見過了,再訓(xùn)一遍只會(huì)加重 overfitting。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

另一個(gè)原因是弱智吧數(shù)據(jù)文本質(zhì)量很高,用詞準(zhǔn)確且簡潔。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

千言萬語匯成一句話:把弱智吧只當(dāng)簡單的段子合集真的是嚴(yán)重低估了它的價(jià)值!GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

雀食,要不此前弱智吧問題也經(jīng)常被大伙兒用來測試大模型呢。GCB28資訊網(wǎng)——每日最新資訊28at.com

事實(shí)上從 ChatGPT 誕生之初,弱智吧就深度參與了大模型的發(fā)展,可以算是這一波 AI 浪潮的重要見證者了。GCB28資訊網(wǎng)——每日最新資訊28at.com

一開始只是網(wǎng)友拿來拷打 AI,搞搞節(jié)目效果。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

后來大家發(fā)現(xiàn),弱智吧問題中充滿陷阱,剛好可以用來分辨 AI 能力高低。GCB28資訊網(wǎng)——每日最新資訊28at.com

還記得 23 年初那會(huì)兒,各家大模型第一版還不太能很好應(yīng)對(duì)這類問題,如 2023 年 3 月的文心一言:GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

后續(xù)版本也漸入佳境了,如 2023 年 8 月的文心一言:GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

直到今天,弱智吧問題都是每個(gè)新發(fā)布大模型都必須要過的一關(guān),被戲稱為弱智吧 Benchmark。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

▲秘塔寫作貓

GCB28資訊網(wǎng)——每日最新資訊28at.com

▲Inspo

再后來,AI 公司們自己也開始重視起來,如百度官方就搞過聯(lián)動(dòng)直播。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)初網(wǎng)友為了調(diào)戲大模型專門搜集的弱智吧問題測試集,沒想到有一天也能搖身一變,成了訓(xùn)練集。GCB28資訊網(wǎng)——每日最新資訊28at.com

GCB28資訊網(wǎng)——每日最新資訊28at.com

思路確實(shí)是被打開了~GCB28資訊網(wǎng)——每日最新資訊28at.com

論文地址:GCB28資訊網(wǎng)——每日最新資訊28at.com

https://arxiv.org/abs/2403.18058GCB28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:GCB28資訊網(wǎng)——每日最新資訊28at.com

[1]https://x.com/9hills/status/1775358963724554410GCB28資訊網(wǎng)——每日最新資訊28at.com

[2]https://zhuanlan.zhihu.com/p/690640864GCB28資訊網(wǎng)——每日最新資訊28at.com

[3]https://tieba.baidu.com/p/8964992247GCB28資訊網(wǎng)——每日最新資訊28at.com

本文來自微信公眾號(hào):量子位 (ID:QbitAI),作者:夢晨 西風(fēng)GCB28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3906-0.html弱智吧竟成最佳中文 AI 訓(xùn)練數(shù)據(jù)?中科院等:8 項(xiàng)測試第一,遠(yuǎn)超知乎豆瓣小紅書

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 新動(dòng)態(tài):改善微調(diào) API,擴(kuò)展定制模型計(jì)劃

下一篇: 馬斯克:特斯拉大模型Grok 2.0版本的性能將好于ChatGPT-4

標(biāo)簽:
  • 熱門焦點(diǎn)
  • B端難做:留給魔琺科技的時(shí)間不多了

    來源:零態(tài)LT元宇宙泡沫正在碎裂,進(jìn)入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個(gè)月的工業(yè)元宇宙部門;今年3月,該公司2017年收購的虛擬現(xiàn)實(shí)社交平臺(tái)AltspaceVR
  • 中國銀保監(jiān)管委提示:謹(jǐn)慎投資,勿做接盤俠

    中國銀保監(jiān)管委,發(fā)布一則風(fēng)險(xiǎn)提示,內(nèi)容圍繞防范以“元宇宙”名義進(jìn)行的非法集資風(fēng)險(xiǎn)。原文如下:近期,一些不法分子蹭熱點(diǎn),以“元宇宙投資項(xiàng)目”“元宇宙鏈游”等名
  • 餐桌上怎么變出元宇宙?

    作者:星影“元宇宙讓餐飲業(yè)脫胎換骨。”實(shí)體的餐飲與虛擬的元宇宙,看起來風(fēng)馬牛不相及,但最近全世界的餐飲企業(yè)都掀起了一股注冊(cè)元宇宙商標(biāo)的熱潮。2月初,全球最大
  • Meta展示AI系統(tǒng)Builder Bot;《Pistol Whip》增加派對(duì)模式

    今日熱點(diǎn):Meta展示AI系統(tǒng)Builder Bot;招聘信息顯示Meta正在探索具有蜂窩連接功能的VR/AR頭顯;英國VR工作室Coatsink Games正在為PSVR 2開發(fā)新游戲;VR節(jié)奏射擊游戲
  • 虛擬數(shù)字人:元宇宙的主角破圈而來

    虛擬數(shù)字人市場逐步進(jìn)入成熟期,商業(yè)化進(jìn)程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級(jí)和成長四個(gè)階段。隨技術(shù)逐年突破,制
  • 解決NFT流動(dòng)性問題:一文了解Floor DAO

    流動(dòng)性是證券市場上的一個(gè)術(shù)語,流動(dòng)性是指資產(chǎn)在不影響其市場價(jià)格的情況下可以轉(zhuǎn)換為現(xiàn)成現(xiàn)金的效率,流動(dòng)性最強(qiáng)的資產(chǎn)是現(xiàn)金本身。現(xiàn)在讓我們?cè)囍鴱牧鲃?dòng)性的角
  • HTC Vive推出元宇宙平臺(tái)Viverse;騰訊投資小米生態(tài)鏈AR眼鏡廠商

    今日熱點(diǎn):HTC Vive正式推出元宇宙平臺(tái)Viverse;騰訊投資小米生態(tài)鏈AR眼鏡廠商北京蜂巢科技;面部追蹤和眼動(dòng)追蹤是Quest下一版本的“重點(diǎn)”;索尼PSVR 2將推遲至2023
  • 初探元宇宙

    2021年可以被稱為“元宇宙”元年。繼2021年3月沙盒游戲平臺(tái)Roblox將“元宇宙”概念放入招股書中,被稱為“元宇宙”第一股后,F(xiàn)acebook更名為Meta, 引發(fā)全球范圍內(nèi)
  • 虛擬偶像行業(yè)的商用價(jià)值逐漸凸顯,IP生態(tài)圈也逐漸成型

    六月的第一個(gè)周六,一場虛擬偶像七海Nana7mi的個(gè)人3D演唱會(huì)在萬代南夢宮上海文化中心舉行,相較于洛天依、百大UP主泠鳶yousa等,這位虛擬Up主在B站上的粉絲數(shù)43.6萬
Top 主站蜘蛛池模板: 中山市| 宜兴市| 嘉义市| 阳山县| 寿光市| 大理市| 井研县| 沙湾县| 东海县| 万全县| 石门县| 漾濞| 防城港市| 都兰县| 永丰县| 台湾省| 承德市| 彭水| 山东省| 敖汉旗| 玉林市| 巫溪县| 五河县| 霍林郭勒市| 岑溪市| 囊谦县| 泰顺县| 凤山市| 临朐县| 湟中县| 延边| 辽阳市| 长岭县| 民丰县| 敦煌市| 增城市| 紫云| 伊春市| 萍乡市| 大城县| 利川市|