日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

谷歌研究:合成數(shù)據(jù)使大模型數(shù)學(xué)推理能力提升八倍

來源: 責(zé)編: 時(shí)間:2025-04-09 07:26:12 64觀看
導(dǎo)讀 4 月 7 日消息,最近,來自谷歌、卡內(nèi)基梅隆大學(xué)和 MultiOn 的聯(lián)合研究團(tuán)隊(duì)發(fā)表了一項(xiàng)關(guān)于合成數(shù)據(jù)在大型模型訓(xùn)練中應(yīng)用的新研究。據(jù)專注于人工智能發(fā)展的研究機(jī)構(gòu) Epoch AI 報(bào)告顯示,目前全球約有 300 萬億個(gè)公

4 月 7 日消息,最近,來自谷歌、卡內(nèi)基梅隆大學(xué)和 MultiOn 的聯(lián)合研究團(tuán)隊(duì)發(fā)表了一項(xiàng)關(guān)于合成數(shù)據(jù)在大型模型訓(xùn)練中應(yīng)用的新研究。TbN28資訊網(wǎng)——每日最新資訊28at.com

TbN28資訊網(wǎng)——每日最新資訊28at.com

據(jù)專注于人工智能發(fā)展的研究機(jī)構(gòu) Epoch AI 報(bào)告顯示,目前全球約有 300 萬億個(gè)公開可用的高質(zhì)量文本訓(xùn)練標(biāo)記。然而,隨著類似 ChatGPT 這樣的大模型的迅猛發(fā)展,對(duì)訓(xùn)練數(shù)據(jù)的需求呈指數(shù)級(jí)增長(zhǎng),預(yù)計(jì)到 2026 年之前,這些數(shù)據(jù)將被耗盡。因此,合成數(shù)據(jù)成為了至關(guān)重要的替代方案。TbN28資訊網(wǎng)——每日最新資訊28at.com

據(jù)了解,研究人員主要探索了兩種合成數(shù)據(jù)類型:正向數(shù)據(jù)和負(fù)向數(shù)據(jù)。正向數(shù)據(jù)是指由高性能大模型(如 GPT-4 和 Gemini 1.5 Pro)生成的正確問題解決方案,為模型提供解決數(shù)學(xué)問題的示例。但僅依靠正向數(shù)據(jù)進(jìn)行訓(xùn)練存在局限性。一方面,這種方法可能無法完全揭示問題解決過程背后的邏輯,模型可能會(huì)通過模式匹配來學(xué)習(xí),而缺乏真正的理解;另一方面,隨著訓(xùn)練數(shù)據(jù)量的增加,模型可能會(huì)學(xué)到虛假的相關(guān)性,導(dǎo)致在處理新問題時(shí)泛化能力下降。TbN28資訊網(wǎng)——每日最新資訊28at.com

TbN28資訊網(wǎng)——每日最新資訊28at.com

鑒于此,研究人員引入了負(fù)向數(shù)據(jù),即經(jīng)過驗(yàn)證為錯(cuò)誤的問題解決步驟。這有助于模型識(shí)別并避免錯(cuò)誤,從而增強(qiáng)其邏輯推理能力。盡管使用負(fù)向數(shù)據(jù)存在挑戰(zhàn),因?yàn)殄e(cuò)誤的步驟可能包含誤導(dǎo)性信息,但研究人員通過直接偏好優(yōu)化(DPO)方法成功地使模型能夠從錯(cuò)誤中學(xué)習(xí),強(qiáng)調(diào)了每個(gè)問題解決步驟的重要性。TbN28資訊網(wǎng)——每日最新資訊28at.com

DPO 方法為每個(gè)問題解決步驟分配一個(gè)優(yōu)勢(shì)值,反映其相對(duì)于理想解決方案的價(jià)值。研究表明,高優(yōu)勢(shì)步驟是正確解決方案的關(guān)鍵,而低優(yōu)勢(shì)步驟可能表明模型推理中存在問題。利用這些優(yōu)勢(shì)值,模型可以在強(qiáng)化學(xué)習(xí)框架內(nèi)動(dòng)態(tài)調(diào)整其策略,從而更高效地從合成數(shù)據(jù)中學(xué)習(xí)和改進(jìn)。TbN28資訊網(wǎng)——每日最新資訊28at.com

為了驗(yàn)證合成數(shù)據(jù)的有效性,研究團(tuán)隊(duì)使用 DeepSeek-Math-7B 和 LLaMa2-7B 等模型,在 GSM8K 和 MATH 數(shù)據(jù)集上進(jìn)行了全面測(cè)試。結(jié)果顯示,經(jīng)過正向和負(fù)向合成數(shù)據(jù)預(yù)訓(xùn)練的大模型在數(shù)學(xué)推理任務(wù)上的性能實(shí)現(xiàn)了八倍的提升。這一研究充分展示了合成數(shù)據(jù)在增強(qiáng)大模型邏輯推理能力方面的巨大潛力。TbN28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12052-0.html谷歌研究:合成數(shù)據(jù)使大模型數(shù)學(xué)推理能力提升八倍

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 非法獲取學(xué)生信息并用 AI 技術(shù)發(fā)送騷擾短信,在校大學(xué)生被抓

下一篇: 中國(guó)自主量子計(jì)算機(jī)“本源悟空”全球首次運(yùn)行十億級(jí) AI 微調(diào)大模型

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 三院士三教授熱聊元宇宙&——AIGC,學(xué)術(shù)界怎么看?

    來源:清元宇宙在近日舉辦的中國(guó)江寧2023元宇宙產(chǎn)業(yè)·人才高峰論壇暨AIGC發(fā)展大會(huì)上,中國(guó)工程院院士譚建榮、劉韻潔、鄭緯民出席并發(fā)表了主旨演講。除了三
  • 8個(gè)最適合藝術(shù)家發(fā)行NFT的交易市場(chǎng)

    近年來,加密風(fēng)靡全球。加密圈最令人興奮的方面之一是它能夠用于創(chuàng)建稱為NFT 的數(shù)字資產(chǎn)。從 CyberKitties 到 Cyber Galleries,NFT 已成為藝術(shù)家和藝術(shù)鑒賞家的
  • Terra鏈上TVL躍升至第二

    據(jù)DefiLlama數(shù)據(jù)顯示,當(dāng)前,Terra鏈上應(yīng)用鎖倉(cāng)的加密資產(chǎn)價(jià)值(TVL)為172.1億美元,在公鏈板塊中已躍升至第二,超越了幣安智能鏈TVL的118億美元,TVL排名居首的仍為以太
  • 量子計(jì)算在未來能否提高區(qū)塊鏈技術(shù)的效率

    區(qū)塊鏈技術(shù)的主要成功之處在于對(duì)不透明的金融流程進(jìn)行了去中心化的訪問量子計(jì)算機(jī)的內(nèi)在目標(biāo)是解決傳統(tǒng)計(jì)算機(jī)不可能解決的問題隨著區(qū)塊鏈技術(shù)的使用案例逐漸
  • 想進(jìn)入web3.0?來看看哪些工作適合你

    隨著對(duì)加密貨幣需求的增加,加密領(lǐng)域的工作的數(shù)量也在增加。以下是一些非技術(shù)性加密貨幣工作簡(jiǎn)介。加密貨幣在主流市場(chǎng)獲得的可信度提升。導(dǎo)致區(qū)塊鏈領(lǐng)域的求職
  • 韓國(guó)流行音樂巨頭SM與Binance達(dá)成NFT合作伙伴關(guān)系

    韓國(guó)流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance(幣安)達(dá)成“Play2Create”NFT 合作伙伴關(guān)系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
  • Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

    Facebook 的母公司 Meta呼吁,建立必要的全球合作的基礎(chǔ)設(shè)施,以支持其蓬勃發(fā)展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一,這在很大程度上是由 Facebo
  • 元宇宙存在的意義和價(jià)值

    科技公司目前都在猶豫,看誰能在元宇宙上押下更大的賭注。然而,除了巨額的資金投入,到底要怎樣才能獲勝在很大程度上還沒有得到證實(shí)。它是否僅僅是對(duì)當(dāng)前數(shù)字景觀
  • 從概念到落地 Web3.0初具雛形

    加密資產(chǎn)熱潮催生出的鏈上應(yīng)用中,除了DeFi、NFT、鏈游GameFi等場(chǎng)景外,還有一個(gè)熱詞叫「Web3.0」。Web3.0的概念最早出現(xiàn)在2014年,由以太坊聯(lián)合創(chuàng)始人及波卡創(chuàng)建者
Top 主站蜘蛛池模板: 湘潭县| 高密市| 信宜市| 苏尼特右旗| 定安县| 龙陵县| 南雄市| 阜宁县| 乌恰县| 永城市| 镶黄旗| 嘉禾县| 孟津县| 阳高县| 乌恰县| 辽中县| 钟祥市| 应用必备| 江陵县| 石泉县| 屏东市| 正镶白旗| 普兰店市| 靖江市| 福建省| 徐州市| 绍兴市| 安庆市| 博野县| 多伦县| 黔西县| 广元市| 阿坝| 青神县| 朝阳市| 西乡县| 温州市| 绥中县| 蓬安县| 旬阳县| 辽阳市|