當前位置：首頁 > 元宇宙 > AI

蘋果研究員親測6款大模型，揭開4大不為人知的真相！

來源：責編：時間：2024-10-14 16:23:04 85觀看

導讀【ITBEAR】近期，蘋果公司在生成式AI領域的動向引起了業界關注。據報道，蘋果研究員發布了一篇質疑大語言模型數學推理能力的論文，引發了一場關于AI技術實力的討論。為了驗證這些質疑，一系列大語言模型接受了嚴格的測試。在

【ITBEAR】近期，蘋果公司在生成式AI領域的動向引起了業界關注。據報道，蘋果研究員發布了一篇質疑大語言模型數學推理能力的論文，引發了一場關于AI技術實力的討論。為了驗證這些質疑，一系列大語言模型接受了嚴格的測試。

在測試中，首先面對的是一個關于奇異果數量計算的問題。結果顯示，多數大模型能夠正確回答，但文心3.5卻給出了錯誤答案，將體型較小的奇異果排除在外。然而，當問題復雜度提升，如涉及公交車發車時間計算時，文心3.5卻意外地成為唯一給出正確答案的模型，顯示其在某些特定場景下的優勢。

隨后的運動員參與項目數量的計算問題，更是成為了大模型的“滑鐵盧”。除了付費版的OpenAI o1-preview大模型外，其余包括GPT-4o、訊飛星火、豆包、Kimi以及文心3.5等在內的大模型均未能給出正確答案。這一結果揭示了，盡管大模型在某些方面表現出色，但在面對復雜數學問題時仍顯力不從心。

從測試結果來看，大語言模型的性能與其參數量密切相關。例如，GPT-4o mini由于參數量較少，在計算推理時頻繁出錯。而付費版的大模型由于擁有更多的資源和更高的參數量，往往能提供更準確的答案。

測試還顯示出大語言模型在理解人類語言和邏輯方面的局限性。盡管它們在處理基礎數學問題時表現良好，但面對具有歧義或復雜性的問題時，它們的推理能力就顯得捉襟見肘。這再次證明，盡管AI技術取得了顯著進步，但要達到人類智能的水平，還有很長的路要走。

蘋果研究員的質疑，一方面揭示了大語言模型在數學推理方面的不足，另一方面也反映了蘋果在生成式AI領域的焦慮。與其質疑他人，蘋果或許更應該專注于提升自身的AI技術實力，加速布局生成式AI，以免在未來的市場競爭中再次落敗。

本文鏈接：http://www.www897cc.com/showinfo-45-9383-0.html蘋果研究員親測6款大模型，揭開4大不為人知的真相！

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌 Agent 首次發現真實世界代碼漏洞：搶救全球數億設備，有望挽回數十億美元損失

下一篇： vivo X200系列上新！影像續航AI全面進階，新機皇來了？

標簽：

熱門焦點

數字人的新革命，BAT的“沖高”戰場

來源：劉曠ChatGPT橫空出世，讓人們看到了數字人的另一種可能，將ChatGPT與虛擬數字人融合，研發出更加智能化、擬人化的虛擬數字人成為數字人廠商的新命題、新方向。2月份，嶺南股份
上、中、下游加深融合，搭建元宇宙產業全景

元宇宙產業鏈涉及多種技術和多個領域。在上游，聚集著大量的技術廠商，提供元宇宙相關的硬件和軟件支持；在中游，內容運營與分發領域也吸引著越來越多的企業以VR內容
元宇宙步入暗夜

撰文 | 文燁豪元宇宙的故事，似乎講不通了。當下，刮起元宇宙熱潮的Roblox股價已跌去大半，帶頭大哥Meta也正因元宇宙虧損深陷泥潭。再看國內，從字節“派對島&
“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

在打工人“反內卷”的當下，一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》，央美畢業的虛擬人夏語冰登上央視節目《對話》，湖南
Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

今日熱點：迪士尼任命新高管負責元宇宙業務；iFixit成為Valve Index VR頭顯和Steam Deck首家零件銷售商；Niantic與索尼達成合作，將為AR游戲《Ingress》帶來音頻體驗；V
餐桌上怎么變出元宇宙？

作者：星影“元宇宙讓餐飲業脫胎換骨。”實體的餐飲與虛擬的元宇宙，看起來風馬牛不相及，但最近全世界的餐飲企業都掀起了一股注冊元宇宙商標的熱潮。2月初，全球最大
元宇宙是數字共識生態的集成邏輯表達

作者: 李鳴元宇宙是數字共識生態的集成邏輯表達，是以區塊鏈技術為核心的可信數字化價值交互網絡，是基于Web3.0技術體系和運作機制支撐下的數字新生態。本體論是
Staking 收益翻倍？

以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計，在 1 月份以太坊網絡合并后，持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
元宇宙的應用行業研究：娛樂可能是元宇宙落地最快的場景之一

近日，畢馬威正式發布其《初探元宇宙》報告，這也是畢馬威在元宇宙領域發布的首份報告。報告指出，元宇宙在以下十個領域的應用場景尤其值得期待，包括娛樂、社交、零

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

蘋果研究員親測6款大模型，揭開4大不為人知的真相！

數字人的新革命，BAT的“沖高”戰場

上、中、下游加深融合，搭建元宇宙產業全景

元宇宙步入暗夜

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

餐桌上怎么變出元宇宙？

元宇宙是數字共識生態的集成邏輯表達

Staking 收益翻倍？

元宇宙的應用行業研究：娛樂可能是元宇宙落地最快的場景之一

最新推薦

區塊鏈產業人才發展報告

多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

元宇宙“概念股”集體崩塌，背后究竟發生了什么？

2030年的元宇宙產業將會如何發展？

扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

融資千萬美元的元宇宙平臺UGC到底是什么？

猜你喜歡

熱門推薦

相關資訊