11 月 2 日消息,《洛杉磯時報》昨日(11 月 1 日)發(fā)布博文,報道稱蘋果研究團隊測試了 20 個最先進的 AI 模型,發(fā)現(xiàn)在有干擾項存在的情況下,它們處理簡單的算術(shù)問題時表現(xiàn)不佳,甚至不如小學生。
蘋果公司用以下這道簡單的算術(shù)題測試 20多個最先進的 AI 模型,附上題目如下:
Oliver 在星期五采摘了 44 個獼猴桃、然后他在星期六采摘了 58 個獼猴桃,星期日采摘的數(shù)量是星期五的兩倍,不過其中有 5 個獼猴桃的塊頭要比平均值要小,請問 Oliver 這三天共摘了多少個獼猴桃?
正確答案是 190 個,計算公式為 44(星期五)+58(星期六)+88(44*2,星期日)。
不過測試的 20 多個最先進 AI 模型無法排除干擾項,通常不理解獼猴桃的大小和數(shù)量無關(guān),大部分的結(jié)果是 185 個。
蘋果團隊發(fā)現(xiàn),當問題包含看似相關(guān)但實際上無關(guān)的信息時,AI 模型的表現(xiàn)急劇下降。對此研究認為,AI 模型主要依賴于訓練數(shù)據(jù)中的語言模式,而非真正理解數(shù)學概念。
蘋果的研究表明,目前的 AI 模型“無法進行真正的邏輯推理”。這一發(fā)現(xiàn)提醒我們,盡管 AI 在某些任務上表現(xiàn)出色,但其智能并不如表面看起來那樣可靠。
蘋果團隊指出,簡單地擴展數(shù)據(jù)或計算能力并不能根本解決這個問題,蘋果的論文并非旨在削弱對 AI 能力的熱情,而是提供一種理性的認知。
本文鏈接:http://www.www897cc.com/showinfo-45-9394-0.html蘋果 AI 研究:“獼猴桃”簡單算術(shù)考倒 o1 和 Llama 等 20 多個最先進模型
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com