日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

弱智吧竟成最佳中文 AI 訓練數據?中科院等:8 項測試第一,遠超知乎豆瓣小紅書

來源: 責編: 時間:2024-04-09 17:17:48 219觀看
導讀 離大譜了,弱智吧登上正經 AI 論文,還成了最好的中文訓練數據??具體來說,使用弱智吧數據訓練的大模型,跑分超過百科、知乎、豆瓣、小紅書等平臺,甚至是研究團隊精心挑選的數據集。在問答、頭腦風暴、分類、生成、總結

離大譜了,弱智吧登上正經 AI 論文,還成了最好的中文訓練數據??PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

具體來說,使用弱智吧數據訓練的大模型,跑分超過百科、知乎、豆瓣、小紅書等平臺,甚至是研究團隊精心挑選的數據集。PSp28資訊網——每日最新資訊28at.com

在問答、頭腦風暴、分類、生成、總結、提取等 8 項測試中取得最高分。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

沒錯,論文中的 Ruozhiba 就是指百度貼吧弱智吧,一個充滿荒謬、離奇、不合常理發言的中文社區,畫風通常是這樣的:PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

最離譜的是,弱智吧 AI 代碼能力也超過了使用專業技術問答社區思否數據訓練的 AI,這下吧友自己都鬧不明白了。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

其他平臺圍觀網友也紛紛蚌埠住。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

這項研究來自中科院深圳先進技術研究院、中科院自動化研究所,滑鐵盧大學等眾多高校、研究機構聯合團隊。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

作者之一也現身評論區,透露使用弱智吧數據訓練 AI 屬于靈機一動,以前只用來測試。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

弱智吧數據究竟如何達成這一成就,具體到論文中看。PSp28資訊網——每日最新資訊28at.com

弱智發言成指令微調神器

這項研究起初為解決中文大模型訓練中的諸多問題:PSp28資訊網——每日最新資訊28at.com

中文數據集很多是從英文翻譯過來的,沒有很好地契合中文的語言習慣和文化背景PSp28資訊網——每日最新資訊28at.com

不少數據集是用 AI 生成的,質量難以保證,容易出現事實性錯誤PSp28資訊網——每日最新資訊28at.com

即使是人工標注的數據集,也存在數據量小、覆蓋領域不全面等問題PSp28資訊網——每日最新資訊28at.com

為了解決這些痛點,團隊從中文互聯網的各種知識源頭直接收集數據,比如知乎、豆瓣、百科、小紅書等,經過一系列嚴格的清洗和人工審核,打造成高質量、多樣化的中文指令微調數據集 COIG-CQIA。PSp28資訊網——每日最新資訊28at.com

除了探索不同數據源的作用,團隊還專門從中抽取出一個精華子集 CQIA-Subset。PSp28資訊網——每日最新資訊28at.com

在眾多數據來源中,弱智吧成了最特別的一個。PSp28資訊網——每日最新資訊28at.com

由 500 個點贊最高的帖子標題 + 人工或 GPT-4 的回復組成指令微調數據集,經過人工審核后,最終留下了 240 組指令-回復數據對。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

分別用各種數據集訓練零一萬物 Yi 系列開源大模型,在 BELLE-Eval 測試集上使用 GPT-4 評分得到結果。PSp28資訊網——每日最新資訊28at.com

在規模較小的 Yi-6B 模型上,純弱智吧版本總分排名第三,還不算太突出。PSp28資訊網——每日最新資訊28at.com

看來小模型還沒能領悟弱智的精髓。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

到了 Yi-34B,弱智吧版本表現就一騎絕塵了。PSp28資訊網——每日最新資訊28at.com

只有在改寫和數學任務上沒能取得最高分,但成績也比較靠前。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

另外,在安全評估上弱智吧版本也能排上第二。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

對于這類現象,研究人員在分析中也給出簡單猜測:PSp28資訊網——每日最新資訊28at.com

可能是弱智吧問題增強了 AI 的邏輯推理能力,從而使指令遵循任務受益。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

當然弱智吧并不是這項研究的全部,它的真正貢獻在于為中文大模型開發提供了一個高質量的指令微調數據集 COIG-CQIA。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

通過對各種中文互聯網數據源的探索,這項研究為構建中文指令數據集提供了很多有益的啟示。比如社交媒體數據雖然開放多樣,但也存在不少有害信息風險;而百科類數據專業性強,但覆蓋面可能不夠廣。PSp28資訊網——每日最新資訊28at.com

弱智吧上大分

這項研究一發,網友集體笑不活。除了“XSWL、思路開闊了”這樣的純圍觀,也有網友認真討論起了弱智吧有如此奇效的原因。PSp28資訊網——每日最新資訊28at.com

大伙兒都比較認可的一個原因是弱智吧題目的“異質”。PSp28資訊網——每日最新資訊28at.com

像腦筋急轉彎,增加了指令多樣性,所以提升了模型最終性能:PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

通用數據集多半已經在 pretrain 階段見過了,再訓一遍只會加重 overfitting。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

另一個原因是弱智吧數據文本質量很高,用詞準確且簡潔。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

千言萬語匯成一句話:把弱智吧只當簡單的段子合集真的是嚴重低估了它的價值!PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

雀食,要不此前弱智吧問題也經常被大伙兒用來測試大模型呢。PSp28資訊網——每日最新資訊28at.com

事實上從 ChatGPT 誕生之初,弱智吧就深度參與了大模型的發展,可以算是這一波 AI 浪潮的重要見證者了。PSp28資訊網——每日最新資訊28at.com

一開始只是網友拿來拷打 AI,搞搞節目效果。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

后來大家發現,弱智吧問題中充滿陷阱,剛好可以用來分辨 AI 能力高低。PSp28資訊網——每日最新資訊28at.com

還記得 23 年初那會兒,各家大模型第一版還不太能很好應對這類問題,如 2023 年 3 月的文心一言:PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

后續版本也漸入佳境了,如 2023 年 8 月的文心一言:PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

直到今天,弱智吧問題都是每個新發布大模型都必須要過的一關,被戲稱為弱智吧 Benchmark。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

▲秘塔寫作貓

PSp28資訊網——每日最新資訊28at.com

▲Inspo

再后來,AI 公司們自己也開始重視起來,如百度官方就搞過聯動直播。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

當初網友為了調戲大模型專門搜集的弱智吧問題測試集,沒想到有一天也能搖身一變,成了訓練集。PSp28資訊網——每日最新資訊28at.com

PSp28資訊網——每日最新資訊28at.com

思路確實是被打開了~PSp28資訊網——每日最新資訊28at.com

論文地址:PSp28資訊網——每日最新資訊28at.com

https://arxiv.org/abs/2403.18058PSp28資訊網——每日最新資訊28at.com

參考鏈接:PSp28資訊網——每日最新資訊28at.com

[1]https://x.com/9hills/status/1775358963724554410PSp28資訊網——每日最新資訊28at.com

[2]https://zhuanlan.zhihu.com/p/690640864PSp28資訊網——每日最新資訊28at.com

[3]https://tieba.baidu.com/p/8964992247PSp28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:夢晨 西風PSp28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3906-0.html弱智吧竟成最佳中文 AI 訓練數據?中科院等:8 項測試第一,遠超知乎豆瓣小紅書

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 新動態:改善微調 API,擴展定制模型計劃

下一篇: 馬斯克:特斯拉大模型Grok 2.0版本的性能將好于ChatGPT-4

標簽:
  • 熱門焦點
  • 藍標虧錢、Meta裁員:天下秀還值得砸錢元宇宙嗎?

    日前,天下秀數字科技集團正式公布了2022年報及2023年一季報。報告顯示,2022年天下秀實現營收41.29億元,同比下滑8.48%;歸母凈利潤1.8億元,同比下滑49.2%,幾乎出現了盈利腰斬的態勢
  • 汽車元宇宙,是概念還是未來?

    作者|何文 元宇宙是未來趨勢已經無需驗證。 從概念上來看,元宇宙是兩種存在多年的概念的融合:虛擬現實和數字第二人生。這也就意味著,元宇宙所代表的是一種新的數
  • 【東方證券】虛擬世界照進現實,元宇宙中有什么? | 元宇宙Meta洞見

    元宇宙的表現形式大多以游戲為起點,并逐漸整合互聯網、數字化娛樂、社交網絡等功能,長期來看甚至可以整合社會經濟與商業活動。元宇宙的發展最關鍵的部分在于元
  • 元宇宙風口下,視覺中國如何重估?

    要說橫跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一個。不僅互聯網巨頭們紛紛布局,上市公司們趨之若鶩,還被不少地方政府寫入了產業規劃,大有在2022年
  • 餐桌上怎么變出元宇宙?

    作者:星影“元宇宙讓餐飲業脫胎換骨。”實體的餐飲與虛擬的元宇宙,看起來風馬牛不相及,但最近全世界的餐飲企業都掀起了一股注冊元宇宙商標的熱潮。2月初,全球最大
  • Kitten Coup社區反轉Cool Kittens NFT騙局

    當狂熱的加密愛好者將金錢投入到NFT圖片時,渾水摸魚的騙局隨之而來,Cool Kittens NFT便是其中一個作惡者,該項目于去年11月在Sonala鏈上啟動小貓形象的NFT鑄造及
  • NFT:新騙局的狩獵場

    騙局的自動化需要更好的防御,從數字身份開始。前幾天我在OpenSea上購買了一個NFT,是才華橫溢的藝術家海倫·福爾摩斯 (Helen Holmes) 的漫畫,來自她的 "原作 "收
  • 融資千萬美元的元宇宙平臺UGC到底是什么?

    據獲悉,全球化元宇宙社交平臺BUD Technologies, Inc.(以下簡稱“BUD”)宣布完成1500萬美元A+輪融資,本輪融資由啟明創投領投,老股東源碼資本、GGV紀源資本、云九資
  • 從NFT數字收藏,洞察數字音樂版權市場發展趨勢

    去年8月9日,騰訊音樂布局NFT數字收藏,在騰訊應用寶發布幻核app,騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
Top 主站蜘蛛池模板: 五常市| 南皮县| 米泉市| 阳朔县| 石嘴山市| 冷水江市| 贺州市| 安化县| 定安县| 涿鹿县| 永新县| 静安区| 寿光市| 疏附县| 英超| 兴化市| 昌乐县| 江源县| 枞阳县| 太和县| 平阳县| 元朗区| 任丘市| 青川县| 河源市| 修水县| 石家庄市| 汾西县| 应用必备| 周至县| 博兴县| 锡林郭勒盟| 鄂托克旗| 丰台区| 淮北市| 平安县| 昆山市| 蓬安县| 临高县| 成都市| 镇沅|