日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

聲稱“媲美人類專家”,谷歌 Gemini 1.5 Pro 數學版“提智”:MATH 基準準確率 91.1%

來源: 責編: 時間:2024-05-23 08:30:51 203觀看
導讀 5 月 21 日消息,谷歌公司上周發布技術報告,表示 Gemini 1.5 Pro 模型在經過專門的數學領域訓練之后,大幅提高了數學成績,并成功解決了國際數學奧林匹克競賽的部分問題。谷歌針對數學場景有針對性地訓練 Gemini 1.

5 月 21 日消息,谷歌公司上周發布技術報告,表示 Gemini 1.5 Pro 模型在經過專門的數學領域訓練之后,大幅提高了數學成績,并成功解決了國際數學奧林匹克競賽的部分問題。yiT28資訊網——每日最新資訊28at.com

yiT28資訊網——每日最新資訊28at.com

谷歌針對數學場景有針對性地訓練 Gemini 1.5 Pro 模型,并通過 MATH 基準、美國數學邀請考試( AIME) 和谷歌內部的 HiddenMath 基準進行測試。yiT28資訊網——每日最新資訊28at.com

根據谷歌的數據,數學型 Gemini 1.5 Pro 在數學基準測試中的表現“與人類專家的表現相當”,與標準的非數學型 Gemini 1.5 Pro 相比,數學型 Gemini 1.5 Pro 在 AIME 基準測試中解決的問題明顯增多,在其他基準測試中的得分也有所提高。yiT28資訊網——每日最新資訊28at.com

yiT28資訊網——每日最新資訊28at.com

yiT28資訊網——每日最新資訊28at.com

谷歌官方分享的三個示例中,兩個是由數學專用的 Gemini 1.5 Pro 解決的,而一個是由標準的 Gemini 1.5 Pro 變體錯誤解決的。這些問題通常要求解題者回憶代數中的基本數學公式,并依靠它們的分段和其他數學規則得出正確答案。附上相關截圖如下:yiT28資訊網——每日最新資訊28at.com

yiT28資訊網——每日最新資訊28at.com

yiT28資訊網——每日最新資訊28at.com

yiT28資訊網——每日最新資訊28at.com

除了問題之外,谷歌還分享了 Gemini 1.5 Pro 基準測試的重要細節。這些數據表明,在所有五項基準測試成績中,Gemini 1.5 Pro 都領先于 GPT-4 Turbo 和亞馬遜的 Claude。yiT28資訊網——每日最新資訊28at.com

谷歌表示數學衍生版 Gemini 1.5 Pro 單個樣本 MATH 基準準確率為 80.6%,在對 256 個解決方案進行采樣并選擇一個候選答案時(rm@256),準確率達到 91.1%。yiT28資訊網——每日最新資訊28at.com

參考yiT28資訊網——每日最新資訊28at.com

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of contextyiT28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4373-0.html聲稱“媲美人類專家”,谷歌 Gemini 1.5 Pro 數學版“提智”:MATH 基準準確率 91.1%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 火山豆包大模型價格清單公布:支持“預付 后付”雙模式,號稱“國內最高并發標準”

下一篇: 振興鄉村發展 助力青少年教育 中國三星連續十一年蟬聯企業社會責任榜外企第一

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 铁岭市| 通城县| 桦甸市| 江达县| 沙湾县| 金山区| 石首市| 安义县| 固阳县| 古交市| 乌什县| 元谋县| 卫辉市| 榆林市| 乐陵市| 屯门区| 武夷山市| 内江市| 东台市| 遂宁市| 定边县| 白河县| 军事| 高阳县| 广饶县| 巨野县| 德保县| 大竹县| 广元市| 蓬安县| 永修县| 北辰区| 若羌县| 茶陵县| 琼中| 兴文县| 明星| 宝应县| 施秉县| 壶关县| 东安县|