當前位置：首頁 > 元宇宙 > AI

蘋果研究員質疑AI：簡單數學題一改就出錯？

來源：責編：時間：2024-10-12 16:25:52 119觀看

導讀【ITBEAR】近年來，人工智能（AI）在各個領域取得了顯著進展，尤其是大型語言模型（LLM），它們能夠生成人類水平的文本，甚至在某些任務上超越人類。然而，一項新研究對LLM的推理能力提出了質疑。蘋果公司的一組研究人員發現，這些模型在

【ITBEAR】近年來，人工智能（AI）在各個領域取得了顯著進展，尤其是大型語言模型（LLM），它們能夠生成人類水平的文本，甚至在某些任務上超越人類。然而，一項新研究對LLM的推理能力提出了質疑。蘋果公司的一組研究人員發現，這些模型在解決簡單數學問題時，只要問題稍有變動，就容易出錯，暗示它們可能并不具備真正的邏輯推理能力。

研究人員在一篇名為《理解大型語言模型中數學推理的局限性》的論文中揭示了LLM在解決數學問題時易受干擾的現象。他們通過對數學問題進行微小改動，例如添加無關信息，來測試LLM的推理能力。結果發現，面對這樣的變化，模型的表現急劇下降。

例如，當給出一個簡單的數學問題：“奧利弗星期五摘了44個奇異果，星期六摘了58個。星期日，他摘的是星期五的兩倍。他一共摘了多少個？”LLM能正確回答。但若添加無關細節：“星期日摘的是星期五的兩倍，其中5個比平均小。”LLM的回答則出錯。GPT-o1-mini的回答是：“...星期日，其中5個奇異果比平均小。我們需要從總數中減去它們：88 - 5 = 83個。”

這只是一個例子，研究人員修改了數百個問題，幾乎所有改動都導致模型回答成功率大幅下降。他們認為，這表明LLM并未真正理解數學問題，而只是根據訓練數據中的模式進行預測。一旦需要真正的“推理”，如是否計算小的奇異果，它們就會產生不合常理的結果。

這一發現對AI的發展具有啟示意義。盡管LLM在許多領域表現出色，但其推理能力仍有局限。未來，研究人員需進一步探索如何提高LLM的推理能力，使其更好地理解和解決復雜問題。

本文鏈接：http://www.www897cc.com/showinfo-45-8549-0.html蘋果研究員質疑AI：簡單數學題一改就出錯？

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：方程豹豹8預售開啟，40-50萬元，年內上市交付！

下一篇：上海交大新突破！AI預警平臺，首次實現孕前預測流產風險？

標簽：

熱門焦點

元宇宙的文旅賽道，還能如何發力？

來源：X增強現實蘋果推出Vision Pro，為XR行業注入一劑強心針。而在蘋果開發者大會上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達成合作，其Disney+流媒體服務將于Vision Pro
元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

來源：清元宇宙炎炎夏日努力工作的Q仔的電腦都冒煙兒啦～今天要給大家介紹兩個新小伙伴——小元和小媧，他們將給大家解讀元媧2.7版本重磅更新內容～大家掌聲歡迎～～～本次更
錯過了BRC20還有eths,eth銘文協議

來源：三頭鳥NFT大家好，我是鳥哥，了解鳥哥的人都知道鳥哥擅擼空投，說實話擼毛雖然回報大但周期還是有點長的，所以除了擼毛我們自己也在研究早期項目，打新，比如BRC20協議ordi當時就有
傳騰訊已推出全新XR業務；摩托羅拉正打造5GXR頸戴式計算組件

今日熱點：傳騰訊已推出全新XR業務；摩托羅拉與Verizon合作打造5G XR頸戴式計算組件；小米AR購物導航專利獲授權；VR一體機Simula One放棄眾籌并開放直接預訂；VR游戲《
江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

《元宇宙新鮮事》有：江西將探索成立元宇宙聯盟，支持南昌規劃建設元宇宙試驗區；韓國金融監督局將加強對NFT和元宇宙的監管；任天堂社長表示暫時不打算加入元宇宙。【
權限風波過后 X2Y2如何挑戰OpenSea？

繼LooksRare之后，又一個OpenSea挑戰者X2Y2來了。上周，X2Y2宣布向超過86萬個OpenSea交易用戶發放X2Y2通證空投，并啟動了「掛單挖礦」的獎勵機制。這場早期激勵活動
2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

UGC作為元宇宙的主要內容創作模式，已經越來越多的呈現于游戲、娛樂、社交、傳媒等方面，UGC模式勾勒了元宇宙的邊界，現今元宇宙UGC模式的主要呈現方式以元宇宙概念
用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

你可能聽說過不可偽造的代幣，或NFTs。NFTs是數字代幣，代表完全獨特的項目的所有權；存儲在區塊鏈中并可追蹤，它們不能被修改、替換或復制。作為NFT鑄造的資產在數字
NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

Block-810多個區塊鏈吸引了希望創建單個NFT或整個集合的用戶的注意。Tezos是其中因其低費用和低碳排放方式而備受贊譽的區塊鏈，就連Snoop Dogg也希望通過公開他

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

蘋果研究員質疑AI：簡單數學題一改就出錯？

元宇宙的文旅賽道，還能如何發力？

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

錯過了BRC20還有eths,eth銘文協議

傳騰訊已推出全新XR業務；摩托羅拉正打造5GXR頸戴式計算組件

江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

權限風波過后 X2Y2如何挑戰OpenSea？

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

最新推薦

這場虛擬人爭奪戰，互聯網巨頭下場先贏一半？

汽車元宇宙，是概念還是未來？

關于年度熱詞NFT，除了錢，我們還可以聊點啥？

獨立故事片“Calladita”將使用 NFT 籌集資金

MR——元宇宙平臺的下一代入口

在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

猜你喜歡

熱門推薦

相關資訊