當前位置：首頁 > 元宇宙 > AI

蘋果 AI 研究：“獼猴桃”簡單算術(shù)考倒 o1 和 Llama 等 20 多個最先進模型

來源：責編：時間：2024-11-05 08:16:51 82觀看

導讀 11 月 2 日消息，《洛杉磯時報》昨日（11 月 1 日）發(fā)布博文，報道稱蘋果研究團隊測試了 20 個最先進的 AI 模型，發(fā)現(xiàn)在有干擾項存在的情況下，它們處理簡單的算術(shù)問題時表現(xiàn)不佳，甚至不如小學生。蘋果公司用以下這道簡單

11 月 2 日消息，《洛杉磯時報》昨日（11 月 1 日）發(fā)布博文，報道稱蘋果研究團隊測試了 20 個最先進的 AI 模型，發(fā)現(xiàn)在有干擾項存在的情況下，它們處理簡單的算術(shù)問題時表現(xiàn)不佳，甚至不如小學生。

蘋果公司用以下這道簡單的算術(shù)題測試 20多個最先進的 AI 模型，附上題目如下：

Oliver 在星期五采摘了 44 個獼猴桃、然后他在星期六采摘了 58 個獼猴桃，星期日采摘的數(shù)量是星期五的兩倍，不過其中有 5 個獼猴桃的塊頭要比平均值要小，請問 Oliver 這三天共摘了多少個獼猴桃？

正確答案是 190 個，計算公式為 44（星期五）+58（星期六）+88（44*2，星期日）。

不過測試的 20 多個最先進 AI 模型無法排除干擾項，通常不理解獼猴桃的大小和數(shù)量無關(guān)，大部分的結(jié)果是 185 個。

蘋果團隊發(fā)現(xiàn)，當問題包含看似相關(guān)但實際上無關(guān)的信息時，AI 模型的表現(xiàn)急劇下降。對此研究認為，AI 模型主要依賴于訓練數(shù)據(jù)中的語言模式，而非真正理解數(shù)學概念。

蘋果的研究表明，目前的 AI 模型“無法進行真正的邏輯推理”。這一發(fā)現(xiàn)提醒我們，盡管 AI 在某些任務上表現(xiàn)出色，但其智能并不如表面看起來那樣可靠。

蘋果團隊指出，簡單地擴展數(shù)據(jù)或計算能力并不能根本解決這個問題，蘋果的論文并非旨在削弱對 AI 能力的熱情，而是提供一種理性的認知。

本文鏈接：http://www.www897cc.com/showinfo-45-9394-0.html蘋果 AI 研究：“獼猴桃”簡單算術(shù)考倒 o1 和 Llama 等 20 多個最先進模型

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：迪士尼成立新 AI 部門，探索人工智能、混合現(xiàn)實等新型技術(shù)的潛力

下一篇：克服獎勵欺騙：Meta 發(fā)布全新后訓練方式 CGPO 編程水平直升 5%，打破 RLHF 瓶頸

標簽：

熱門焦點

搶先推出“元宇宙”飲料，可口可樂贏麻了

試圖傍上元宇宙的品牌千千萬，但像可口可樂玩得這么花的，屬實不多。01 可口可樂盯上元宇宙1886年，可口可樂誕生于美國喬治亞州亞特蘭大市，至今已擁有136年的悠久歷
在數(shù)字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
NFT的未來：傳統(tǒng)企業(yè)與去中心化機構(gòu)之間的競賽

傳統(tǒng)企業(yè)和去中心化機構(gòu)一直存在分歧，但最近NFT的爆炸式增長讓他們產(chǎn)生了共同的興趣，雙方都在競相讓用戶更輕松、更方便地使用NFT。毫無疑問，NFT 市場正在增長。
“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現(xiàn)嗎？

作者| 赤木瓶子如何終結(jié)“曇花一現(xiàn)”的命運，是潮流社交產(chǎn)品的長期命題，如今，在元宇宙浪潮的洗禮下，這一命題正在迎來新的可能性。近段時間，一款名為“啫喱”的社交A
元宇宙社交啫喱、希壤爆款迭出，騰訊慌了嗎？

文 | 陳橋輝沒想到騰訊超級QQ秀的20周年歸來首秀，被一款名不見經(jīng)傳的產(chǎn)品搶了風頭。1月15日，一款名為“啫喱”的社交App迅速在各個互聯(lián)網(wǎng)的社交圈內(nèi)火爆起來，引起
Kitten Coup社區(qū)反轉(zhuǎn)Cool Kittens NFT騙局

當狂熱的加密愛好者將金錢投入到NFT圖片時，渾水摸魚的騙局隨之而來，Cool Kittens NFT便是其中一個作惡者，該項目于去年11月在Sonala鏈上啟動小貓形象的NFT鑄造及
這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發(fā)揮作用

前米高梅首席執(zhí)行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一個新的好萊塢工作室，提供 NFT，讓持有者在制作中發(fā)揮作用Electromagnetic Productions 創(chuàng)始
Steam 禁止NFT和加密貨幣原因曝光

近日，Valve（V社）總裁Gabe Newell接受PC Gamer采訪時解釋了該平臺禁止NFT和加密貨幣的原因。早在2021年10月18日，PC Gamer就報道Steam推出的新規(guī)：使用區(qū)塊鏈或允許交
PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

PayPal 近年來一直是加密行業(yè)的倡導者。這個本身擁有超過 3.5 億名活躍用戶的支付巨頭，已經(jīng)允許美國和英國的用戶交易或持有比特幣（BTC）、以太坊（ETH）、比特現(xiàn)金（BCH

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

蘋果 AI 研究：“獼猴桃”簡單算術(shù)考倒 o1 和 Llama 等 20 多個最先進模型

搶先推出“元宇宙”飲料，可口可樂贏麻了

在數(shù)字世界再造世界杯，元宇宙體育正變得越來越豐滿

NFT的未來：傳統(tǒng)企業(yè)與去中心化機構(gòu)之間的競賽

“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現(xiàn)嗎？

元宇宙社交啫喱、希壤爆款迭出，騰訊慌了嗎？

Kitten Coup社區(qū)反轉(zhuǎn)Cool Kittens NFT騙局

這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發(fā)揮作用

Steam 禁止NFT和加密貨幣原因曝光

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

最新推薦

AI網(wǎng)紅能年賺百萬，普通人的新機會來了？

區(qū)塊鏈產(chǎn)業(yè)人才發(fā)展報告

元宇宙風歸何處？

2022年元宇宙系列報告：UGC當?shù)溃琗R帶來新交互體驗

全球十大元宇宙概念游戲

虛擬人行業(yè)研究報告

猜你喜歡

熱門推薦

相關(guān)資訊