11 月 2 日消息,《洛杉磯時(shí)報(bào)》昨日(11 月 1 日)發(fā)布博文,報(bào)道稱蘋(píng)果研究團(tuán)隊(duì)測(cè)試了 20 個(gè)最先進(jìn)的 AI 模型,發(fā)現(xiàn)在有干擾項(xiàng)存在的情況下,它們處理簡(jiǎn)單的算術(shù)問(wèn)題時(shí)表現(xiàn)不佳,甚至不如小學(xué)生。
蘋(píng)果公司用以下這道簡(jiǎn)單的算術(shù)題測(cè)試 20多個(gè)最先進(jìn)的 AI 模型,附上題目如下:
Oliver 在星期五采摘了 44 個(gè)獼猴桃、然后他在星期六采摘了 58 個(gè)獼猴桃,星期日采摘的數(shù)量是星期五的兩倍,不過(guò)其中有 5 個(gè)獼猴桃的塊頭要比平均值要小,請(qǐng)問(wèn) Oliver 這三天共摘了多少個(gè)獼猴桃?
正確答案是 190 個(gè),計(jì)算公式為 44(星期五)+58(星期六)+88(44*2,星期日)。
不過(guò)測(cè)試的 20 多個(gè)最先進(jìn) AI 模型無(wú)法排除干擾項(xiàng),通常不理解獼猴桃的大小和數(shù)量無(wú)關(guān),大部分的結(jié)果是 185 個(gè)。
蘋(píng)果團(tuán)隊(duì)發(fā)現(xiàn),當(dāng)問(wèn)題包含看似相關(guān)但實(shí)際上無(wú)關(guān)的信息時(shí),AI 模型的表現(xiàn)急劇下降。對(duì)此研究認(rèn)為,AI 模型主要依賴于訓(xùn)練數(shù)據(jù)中的語(yǔ)言模式,而非真正理解數(shù)學(xué)概念。
蘋(píng)果的研究表明,目前的 AI 模型“無(wú)法進(jìn)行真正的邏輯推理”。這一發(fā)現(xiàn)提醒我們,盡管 AI 在某些任務(wù)上表現(xiàn)出色,但其智能并不如表面看起來(lái)那樣可靠。
蘋(píng)果團(tuán)隊(duì)指出,簡(jiǎn)單地?cái)U(kuò)展數(shù)據(jù)或計(jì)算能力并不能根本解決這個(gè)問(wèn)題,蘋(píng)果的論文并非旨在削弱對(duì) AI 能力的熱情,而是提供一種理性的認(rèn)知。
本文鏈接:http://www.www897cc.com/showinfo-45-9394-0.html蘋(píng)果 AI 研究:“獼猴桃”簡(jiǎn)單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)最先進(jìn)模型
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 迪士尼成立新 AI 部門,探索人工智能、混合現(xiàn)實(shí)等新型技術(shù)的潛力
下一篇: 克服獎(jiǎng)勵(lì)欺騙:Meta 發(fā)布全新后訓(xùn)練方式 CGPO 編程水平直升 5%,打破 RLHF 瓶頸