日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 網絡

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊

來源: 責編: 時間:2025-05-20 10:04:03 54觀看
導讀 拷打AI的難度還在升級?這不,圖像推理又出現了新難題。該問題在Reddit上引起熱議:目前沒有任何AI能真正解決復雜推理問題。問題定義其實非常簡單——在下圖中還需要添加多少個小立方體能形成一個完整

拷打AI的難度還在升級?這不,圖像推理又出現了新難題。Hi128資訊網——每日最新資訊28at.com

該問題在Reddit上引起熱議:目前沒有任何AI能真正解決復雜推理問題。Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

問題定義其實非常簡單——在下圖中還需要添加多少個小立方體能形成一個完整的大立方體?Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

針對這一難題,國內外支持圖像輸入的大模型紛紛給出了不同的答案。Hi128資訊網——每日最新資訊28at.com

其中,o3給出的答案是45個,Gemini 2.5Pro給出的答案僅有10個。Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

而國內大模型,如DeepSeek、Qwen3的答案分別為14和9。Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

出現這些不同答案的原因是什么呢?請往下看。Hi128資訊網——每日最新資訊28at.com

為什么會出現不同的答案Hi128資訊網——每日最新資訊28at.com

核心原因:大模型對組成的大立方體的規格理解不同。Hi128資訊網——每日最新資訊28at.com

o3將終組成的大立方體的規格理解為5x5x5,但它對于缺失的小立方體的數目仍舊給出了錯誤答案,用人類視覺來看,要形成5x5x5的大立方體需要125個小立方體,而圖中已經給出了46個,所以答案應該為79。Hi128資訊網——每日最新資訊28at.com

而AI的錯誤源于它對圖片中小立方體的結構和數目的分析錯誤。Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

Gemini 2.5 Pro將終組成的大立方體的規格理解為4x4x4。Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

而DeepSeek和Qwen都將終的大立方體規格設定為了3x3x3。Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

對于終要組成的大立方體的規模理解不同,各大模型自然而然就會給出不同的答案。Hi128資訊網——每日最新資訊28at.com

不過,結合提示多次嘗試,也有大模型能夠漸漸找準方向。Hi128資訊網——每日最新資訊28at.com

網友針對這些錯誤答案提供了一些解決辦法:Hi128資訊網——每日最新資訊28at.com

例如用o3進行測試,在前兩次嘗試時給出一些小提示,雖然這樣也得到錯誤答案,但第三次,即使沒有提示也得到了正確的結果。Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

網友認為是由于ChatGPT的長期記憶功能,讓它記住了前兩次嘗試的提示(比如考慮長運行中有多少個立方體,專注于嚴格計數而不是估計),考慮到了失敗的經驗,并將它們全部整合在一起。Hi128資訊網——每日最新資訊28at.com

因此,可以說o3會通過記憶來學習。而這道難題也會成為未來的訓練數據。Hi128資訊網——每日最新資訊28at.com

網友:人類也會困惑Hi128資訊網——每日最新資訊28at.com

有人說,這根本就不是一個推理問題,而是一個視覺理解問題。Hi128資訊網——每日最新資訊28at.com

出現作者認為的錯誤答案是由于問題表述不清楚導致AI的分析過程出現了偏差。Hi128資訊網——每日最新資訊28at.com

甚至人類面對這種問題也會出現類似的困惑,比如題目的要求到底是以原來的排列結構為基礎還是可以打亂結構重新排列?Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

并且,如果能夠更清晰地為AI解釋圖片內容(告知其圖片中小立方體的排列結構):Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

那么o3得到的答案也是正確的:Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

無論是3x3x3、4x4x4還是5x5x5,或者是NxNxN,人類自己都無法統一答案的問題,對AI來說是不是太難了點!Hi128資訊網——每日最新資訊28at.com

網友:Hi128資訊網——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊Hi128資訊網——每日最新資訊28at.com

AI:或許我需要一個更科學的訓練方式!Hi128資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.www897cc.com/showinfo-17-151740-0.htmlAI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 黃仁勛重磅演講:Q3推出下一代GB300 將向合作者授權NVLink技術

下一篇: 中國AI大廠 被Deepseek掀了牌桌之后

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 湛江市| 驻马店市| 溧水县| 岗巴县| 青川县| 小金县| 阳原县| 通河县| 东丽区| 双峰县| 铁岭市| 寿光市| 武胜县| 邢台市| 南安市| 广东省| 太保市| 延吉市| 成武县| 南充市| 若羌县| 于田县| 莫力| 静海县| 山丹县| 武功县| 水城县| 治县。| 连城县| 吴桥县| 灵丘县| 太白县| 龙州县| 哈尔滨市| 佳木斯市| 巴南区| 阿拉善盟| 贡山| 苏尼特左旗| 武冈市| 松潘县|