日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 網(wǎng)絡(luò)

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AI

來源: 責(zé)編: 時(shí)間:2023-08-14 22:01:29 371觀看
導(dǎo)讀 用AI生成的指令微調(diào)羊駝大模型,數(shù)學(xué)能力超ChatGPT——微軟新開源大模型WizardMath來了。如下圖所示,經(jīng)過GSM8k數(shù)據(jù)集測試,WizardMath數(shù)學(xué)能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一

用AI生成的指令微調(diào)羊駝大模型,數(shù)學(xué)能力超ChatGPT——cls28資訊網(wǎng)——每日最新資訊28at.com

微軟新開源大模型WizardMath來了。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

如下圖所示,經(jīng)過GSM8k數(shù)據(jù)集測試,WizardMath數(shù)學(xué)能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——cls28資訊網(wǎng)——每日最新資訊28at.com

并且是在參數(shù)只有700億,遠(yuǎn)不及后三者的情況之下。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

HuggingFace已上線3個(gè)在線可玩版本(分別為7B、13B和70B參數(shù)),各種數(shù)學(xué)題可以直接丟進(jìn)去試一試。cls28資訊網(wǎng)——每日最新資訊28at.com

比如解決下面這道四次多項(xiàng)式方程:cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

或者是一道簡單的微積分:cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

亦或者是稍微修改過的拉格朗日方程推導(dǎo):cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

它都全部正確(過程也不需要等太久)。cls28資訊網(wǎng)——每日最新資訊28at.com

有網(wǎng)友向作者表示:cls28資訊網(wǎng)——每日最新資訊28at.com

效果真的很驚人,感謝你們對開源LLM的貢獻(xiàn)。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

目前,相關(guān)代碼、復(fù)現(xiàn)方式以及論文也都開源或上線,GitHub短短幾天已攬獲4.8k標(biāo)星。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

那么,WizardMath究竟是如何做到的?cls28資訊網(wǎng)——每日最新資訊28at.com

用AI生成的指令增強(qiáng)大模型能力cls28資訊網(wǎng)——每日最新資訊28at.com

OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執(zhí)行各種復(fù)雜和多樣化的任務(wù),一部分原因是使用了真實(shí)人類用戶生成的開放域指令數(shù)據(jù)進(jìn)行了微調(diào)。cls28資訊網(wǎng)——每日最新資訊28at.com

然而,不是誰都能像這家公司一樣獲得這樣的指令數(shù)據(jù)集。cls28資訊網(wǎng)——每日最新資訊28at.com

一是因?yàn)檎麄€(gè)注釋過程極其昂貴且耗時(shí),二是人工難以創(chuàng)建出足夠比例的高難度指令。cls28資訊網(wǎng)——每日最新資訊28at.com

因此,開發(fā)出一種成本相對較低的、大規(guī)模開放域指令自動生產(chǎn)方法,成為當(dāng)下指令調(diào)優(yōu)語言模型的關(guān)鍵。cls28資訊網(wǎng)——每日最新資訊28at.com

在此,作者將他們的方法命名為Evol Instruction。cls28資訊網(wǎng)——每日最新資訊28at.com

它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。cls28資訊網(wǎng)——每日最新資訊28at.com

具體而言,Evol Instruction分為指令進(jìn)化器和指令消除器。cls28資訊網(wǎng)——每日最新資訊28at.com

其中指令進(jìn)化器可通過深度進(jìn)化(藍(lán)線)或廣度進(jìn)化(紅線)兩種路徑,將簡單指令升級為更復(fù)雜的指令或創(chuàng)建一條全新指令。cls28資訊網(wǎng)——每日最新資訊28at.com

具體執(zhí)行哪一條?隨機(jī)選擇就好。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

其中,深度進(jìn)化的具體“進(jìn)化法”,則是通過五種類型的操作來完成,包括:cls28資訊網(wǎng)——每日最新資訊28at.com

添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復(fù)雜化(complicate input)。cls28資訊網(wǎng)——每日最新資訊28at.com

由于所有指令均由AI完成,有時(shí)難免會出現(xiàn)錯(cuò)誤。因此,指令消除器就是用于過濾失敗指令的。cls28資訊網(wǎng)——每日最新資訊28at.com

以下是一個(gè)具體示例,該方法從“1+1=?”開始,終通過以上步驟自動生成了相當(dāng)多的新指令。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

通過重復(fù)這一生成過程,終我們就能得到足夠多的指令,然后將它們合并并隨機(jī)打亂,組成一個(gè)難度級別均勻分布的指令集,就可以對基礎(chǔ)大模型進(jìn)行微調(diào)了。cls28資訊網(wǎng)——每日最新資訊28at.com

在此,作者選擇Alpaca的訓(xùn)練數(shù)據(jù)(僅由175條人工創(chuàng)建的種子指令生成)作為初始數(shù)據(jù)集,然后使用ChatGPT的API執(zhí)行了四個(gè)進(jìn)化周期,終獲得25萬條指令。cls28資訊網(wǎng)——每日最新資訊28at.com

為了與Vicuna的70k真實(shí)用戶數(shù)據(jù)(ShareGPT)進(jìn)行公平比較,作者從這25萬條數(shù)據(jù)中抽取了等量的樣本,訓(xùn)練LLaMA 7B模型,終得到WizardLM,結(jié)果WizardLM的性能明顯優(yōu)于Vicuna。cls28資訊網(wǎng)——每日最新資訊28at.com

(Alpaca:斯坦福在LLaMa-7B基礎(chǔ)上微調(diào)出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎(chǔ)上微調(diào)得來)cls28資訊網(wǎng)——每日最新資訊28at.com

此外,在更為復(fù)雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復(fù)雜指令的能力。cls28資訊網(wǎng)——每日最新資訊28at.com

基于此,作者又利用Evol Instruction生成了很多數(shù)學(xué)領(lǐng)域相關(guān)的指令,然后微調(diào)羊駝大模型,得到了WizardMath。cls28資訊網(wǎng)——每日最新資訊28at.com

其效果如開頭所示,在GSM8k數(shù)據(jù)集上測得其數(shù)學(xué)能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數(shù)的Flan-PaLM 2之后。cls28資訊網(wǎng)——每日最新資訊28at.com

以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

團(tuán)隊(duì)介紹本文共9位作者,全華人。cls28資訊網(wǎng)——每日最新資訊28at.com

一作有3位:cls28資訊網(wǎng)——每日最新資訊28at.com

Can Xu,微軟亞洲互聯(lián)網(wǎng)工程院S+D NLP組高級應(yīng)用科學(xué)家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機(jī)器人系統(tǒng)工作;cls28資訊網(wǎng)——每日最新資訊28at.com

Qingfeng Sun, Microsoft Research科學(xué)家,研究方向?yàn)樽匀徽Z言處理和信息檢索,精通構(gòu)建高效搜索系統(tǒng),為Microsoft Bing和Office 365貢獻(xiàn)了核心深度模型;cls28資訊網(wǎng)——每日最新資訊28at.com

Kai Zheng,Microsoft Research科學(xué)家,研究方向?yàn)樽匀徽Z言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻(xiàn)了核心深度模型。cls28資訊網(wǎng)——每日最新資訊28at.com

數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AIcls28資訊網(wǎng)——每日最新資訊28at.com

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學(xué)家,在微軟工作16年有余、曾作為微軟必應(yīng)搜索引擎和Cortana智能助手自然語言理解負(fù)責(zé)人,日前已被曝離職投身大模型創(chuàng)業(yè)。cls28資訊網(wǎng)——每日最新資訊28at.com

另還有一位作者Jiazhan Feng,是北大學(xué)生,這篇合著論文是TA在微軟實(shí)習(xí)時(shí)產(chǎn)出的。cls28資訊網(wǎng)——每日最新資訊28at.com

項(xiàng)目主頁: https://github.com/nlpxucan/WizardLM/tree/main/WizardMathcls28資訊網(wǎng)——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.www897cc.com/showinfo-17-5471-0.html數(shù)學(xué)能力超ChatGPT 70B開源大模型火了:用AI微調(diào)AI

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 車輛被高速路石子砸了下 博主:成功向高速路政索賠了1600元

下一篇: 這款“讀博模擬器”太逼真!玩過的人都要崩潰了:你敢試試?

標(biāo)簽:
  • 熱門焦點(diǎn)
  • JavaScript 混淆及反混淆代碼工具

    介紹在我們開始學(xué)習(xí)反混淆之前,我們首先要了解一下代碼混淆。如果不了解代碼是如何混淆的,我們可能無法成功對代碼進(jìn)行反混淆,尤其是使用自定義混淆器對其進(jìn)行混淆時(shí)。什么是混
  • 每天一道面試題-CPU偽共享

    前言:了不起:又到了每天一到面試題的時(shí)候了!學(xué)弟,最近學(xué)習(xí)的怎么樣啊 了不起學(xué)弟:最近學(xué)習(xí)的還不錯(cuò),每天都在學(xué)習(xí),每天都在進(jìn)步! 了不起:那你最近學(xué)習(xí)的什么呢? 了不起學(xué)弟:最近在學(xué)習(xí)C
  • 本地生活這塊肥肉,拼多多也想吃一口

    出品/壹覽商業(yè) 作者/李彥編輯/木魚拼多多也看上本地生活這塊蛋糕了。近期,拼多多在App首頁“充值中心”入口上線了本機(jī)生活界面。壹覽商業(yè)發(fā)現(xiàn),該界面目前主要
  • 重估百度丨大模型,能撐起百度的“今天”嗎?

    自象限原創(chuàng) 作者|程心 羅輯2023年之前,對于自己的“今天”,百度也很迷茫。“新業(yè)務(wù)到 2022 年底還是 0,希望 2023 年出來一個(gè) 1。”這是2022年底,李彥宏
  • 華為Mate 60系列用上可變靈動島:正式版體驗(yàn)將會更出色

    這段時(shí)間以來,關(guān)于華為新旗艦的爆料日漸密集。據(jù)此前多方爆料,今年華為將開始恢復(fù)一年雙旗艦戰(zhàn)略,除上半年推出的P60系列外,往年下半年的Mate系列也將
  • 三星電子Q2營收60萬億韓元 存儲業(yè)務(wù)營收同比仍下滑超過50%

    7月27日消息,據(jù)外媒報(bào)道,從三星電子所發(fā)布的財(cái)報(bào)來看,他們主要利潤來源的存儲芯片業(yè)務(wù)在今年二季度仍不樂觀,營收同比仍在大幅下滑,所在的設(shè)備解決方案
  • Windows 11發(fā)布,微軟一改往常對老機(jī)型開放的態(tài)度

    距離 Windows 11 發(fā)布已經(jīng)過去一周,在過去一周里,很多數(shù)碼愛好者圍繞其對 Android 應(yīng)用的支持、對老機(jī)型的升級問題展開了激烈討論。與以往不同的是,在這次大
  • 蘋果140W USB-C充電器:采用氮化鎵技術(shù)

    據(jù)10 月 30 日 9to5 Mac 消息報(bào)道,當(dāng)蘋果推出新的 MacBook Pro 2021 時(shí),該公司還推出了新的 140W USB-C 充電器,附贈在 MacBook Pro 16 英寸機(jī)型的盒子里,也支
  • 三翼鳥智能家居亮相電博會,讓用戶體驗(yàn)更真實(shí)

    2021電博會在青島國際會展中心開幕中,三翼鳥直接把“家”搬到了現(xiàn)場,成為了展會的一大看點(diǎn)。這也是三翼鳥繼9月9日發(fā)布了行業(yè)首個(gè)一站式定制智慧家平臺后的
Top 主站蜘蛛池模板: 将乐县| 沧源| 大安市| 齐齐哈尔市| 湖南省| 桦南县| 牙克石市| 大英县| 曲阜市| 璧山县| 宣武区| 册亨县| 开平市| 湘西| 本溪市| 广州市| 克拉玛依市| 钦州市| 阿克陶县| 磴口县| 齐齐哈尔市| 沂源县| 屯门区| 浪卡子县| 栾城县| 承德县| 穆棱市| 社旗县| 宁德市| 老河口市| 慈溪市| 巨鹿县| 启东市| 临武县| 鹿邑县| 兰州市| 濮阳市| 永泰县| 永善县| 济阳县| 改则县|