當(dāng)前位置：首頁 > 元宇宙 > AI

聲稱“媲美人類專家”，谷歌 Gemini 1.5 Pro 數(shù)學(xué)版“提智”：MATH 基準(zhǔn)準(zhǔn)確率 91.1%

來源：責(zé)編：時(shí)間：2024-05-23 08:30:51 225觀看

導(dǎo)讀 5 月 21 日消息，谷歌公司上周發(fā)布技術(shù)報(bào)告，表示 Gemini 1.5 Pro 模型在經(jīng)過專門的數(shù)學(xué)領(lǐng)域訓(xùn)練之后，大幅提高了數(shù)學(xué)成績，并成功解決了國際數(shù)學(xué)奧林匹克競賽的部分問題。谷歌針對數(shù)學(xué)場景有針對性地訓(xùn)練 Gemini 1.

5 月 21 日消息，谷歌公司上周發(fā)布技術(shù)報(bào)告，表示 Gemini 1.5 Pro 模型在經(jīng)過專門的數(shù)學(xué)領(lǐng)域訓(xùn)練之后，大幅提高了數(shù)學(xué)成績，并成功解決了國際數(shù)學(xué)奧林匹克競賽的部分問題。

谷歌針對數(shù)學(xué)場景有針對性地訓(xùn)練 Gemini 1.5 Pro 模型，并通過 MATH 基準(zhǔn)、美國數(shù)學(xué)邀請考試（ AIME) 和谷歌內(nèi)部的 HiddenMath 基準(zhǔn)進(jìn)行測試。

根據(jù)谷歌的數(shù)據(jù)，數(shù)學(xué)型 Gemini 1.5 Pro 在數(shù)學(xué)基準(zhǔn)測試中的表現(xiàn)“與人類專家的表現(xiàn)相當(dāng)”，與標(biāo)準(zhǔn)的非數(shù)學(xué)型 Gemini 1.5 Pro 相比，數(shù)學(xué)型 Gemini 1.5 Pro 在 AIME 基準(zhǔn)測試中解決的問題明顯增多，在其他基準(zhǔn)測試中的得分也有所提高。

谷歌官方分享的三個(gè)示例中，兩個(gè)是由數(shù)學(xué)專用的 Gemini 1.5 Pro 解決的，而一個(gè)是由標(biāo)準(zhǔn)的 Gemini 1.5 Pro 變體錯(cuò)誤解決的。這些問題通常要求解題者回憶代數(shù)中的基本數(shù)學(xué)公式，并依靠它們的分段和其他數(shù)學(xué)規(guī)則得出正確答案。附上相關(guān)截圖如下：

除了問題之外，谷歌還分享了 Gemini 1.5 Pro 基準(zhǔn)測試的重要細(xì)節(jié)。這些數(shù)據(jù)表明，在所有五項(xiàng)基準(zhǔn)測試成績中，Gemini 1.5 Pro 都領(lǐng)先于 GPT-4 Turbo 和亞馬遜的 Claude。

谷歌表示數(shù)學(xué)衍生版 Gemini 1.5 Pro 單個(gè)樣本 MATH 基準(zhǔn)準(zhǔn)確率為 80.6%，在對 256 個(gè)解決方案進(jìn)行采樣并選擇一個(gè)候選答案時(shí)（rm@256），準(zhǔn)確率達(dá)到 91.1%。

參考

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

本文鏈接：http://www.www897cc.com/showinfo-45-4373-0.html聲稱“媲美人類專家”，谷歌 Gemini 1.5 Pro 數(shù)學(xué)版“提智”：MATH 基準(zhǔn)準(zhǔn)確率 91.1%

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：火山豆包大模型價(jià)格清單公布：支持“預(yù)付后付”雙模式，號稱“國內(nèi)最高并發(fā)標(biāo)準(zhǔn)”

下一篇：振興鄉(xiāng)村發(fā)展助力青少年教育中國三星連續(xù)十一年蟬聯(lián)企業(yè)社會責(zé)任榜外企第一

標(biāo)簽：

熱門焦點(diǎn)

沉寂3年，大模型激活小度天貓精靈？

Tech星球（微信ID：tech618）文 | 何煦陽沉寂了許久的智能音箱，在今年大模型橫空出世之后，又再次燃起了新的希望。 2月9日，小度宣布將融合文心一言，打造針對智能設(shè)備場景的AI模型&ldq
一個(gè)視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

當(dāng)數(shù)字人成為一種生意，我們更關(guān)心的是，他們?nèi)绾钨嵉藉X，以及這意味著什么？01#“柳夜熙”爆火之后不知道大家還記不記得，去年10月31日萬圣節(jié)，有一位虛擬美妝
有人狂賺千倍，資金盤游戲日進(jìn)上億，元宇宙泡沫還能吹多久？

你還不知道元宇宙？沒關(guān)系。看看微軟、Meta、英偉達(dá)的雄心壯志，便可領(lǐng)略元宇宙的遼闊。1月18日，微軟宣布將以687億美元收購動視暴雪，這是有史以來互聯(lián)網(wǎng)領(lǐng)域最大的
銀保監(jiān)會：打擊以“元宇宙”為名義的違法行為

今日，銀保監(jiān)會發(fā)布《關(guān)于防范以“元宇宙”名義進(jìn)行非法集資的風(fēng)險(xiǎn)提示》，全文如下：近期，一些不法分子蹭熱點(diǎn)，以“元宇宙投資項(xiàng)目”“元宇宙鏈游”等名目吸收資金，涉
新款英特爾芯片將使NFT鑄造變得更加方便

科技巨頭和微處理器制造商英特爾（Intel）正在發(fā)布一款適用于 NFT 鑄造和挖礦的新芯片。新產(chǎn)品專注于效率、易操作性和可持續(xù)性，該公司的戰(zhàn)略是從加密興起與 NFT爆
2021年中國元宇宙行業(yè)用戶行為分析熱點(diǎn)報(bào)告

元宇宙網(wǎng)絡(luò)熱度高漲，中國網(wǎng)民對虛擬生態(tài)興趣濃厚。艾媒咨詢數(shù)據(jù)顯示，超六成的網(wǎng)民對“元宇宙”了解程度較高，在元宇宙較基礎(chǔ)的游戲領(lǐng)域，超九成的人對VR游戲更感興
餐桌上怎么變出元宇宙？

作者：星影“元宇宙讓餐飲業(yè)脫胎換骨。”實(shí)體的餐飲與虛擬的元宇宙，看起來風(fēng)馬牛不相及，但最近全世界的餐飲企業(yè)都掀起了一股注冊元宇宙商標(biāo)的熱潮。2月初，全球最大
音樂NFT平臺里的下一匹黑馬是誰？

NFT 銷售額在 2021 年開始暴漲，從 2018 年的僅 4069 萬美元的交易量，到 2021 年，NFT 交易量飆升至 442 億美元以上，并不斷刷新記錄并達(dá)到新的高度。預(yù)測到2025 年N
知識產(chǎn)權(quán)可能在元宇宙中“消失”？

開篇老雅痞先來劃重點(diǎn)：一些公司開始采取積極的方式來保護(hù)他們在元宇宙的知識產(chǎn)權(quán)。耐克、愛馬仕和米拉麥克斯最近提起訴訟，聲稱NFT侵犯了他們的知識產(chǎn)權(quán)。Inside

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

聲稱“媲美人類專家”，谷歌 Gemini 1.5 Pro 數(shù)學(xué)版“提智”：MATH 基準(zhǔn)準(zhǔn)確率 91.1%

沉寂3年，大模型激活小度天貓精靈？

一個(gè)視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

有人狂賺千倍，資金盤游戲日進(jìn)上億，元宇宙泡沫還能吹多久？

銀保監(jiān)會：打擊以“元宇宙”為名義的違法行為

新款英特爾芯片將使NFT鑄造變得更加方便

2021年中國元宇宙行業(yè)用戶行為分析熱點(diǎn)報(bào)告

餐桌上怎么變出元宇宙？

音樂NFT平臺里的下一匹黑馬是誰？

知識產(chǎn)權(quán)可能在元宇宙中“消失”？

最新推薦

關(guān)于年度熱詞NFT，除了錢，我們還可以聊點(diǎn)啥？

比特幣的價(jià)格越高，使用價(jià)值越大

美國一區(qū)塊鏈風(fēng)投公司宣布成立2.5億美元web3投資新基金

《刀劍神域》VR展開幕；《Puzzling Places》發(fā)布第二個(gè)付費(fèi)DLC

NFT行業(yè)的三大區(qū)塊鏈之一引起了Snoop Dogg的強(qiáng)烈興趣，究竟有何潛力？

從概念到落地 Web3.0初具雛形

猜你喜歡

熱門推薦

相關(guān)資訊