當(dāng)前位置：首頁(yè) > 元宇宙 > AI

AI 答 IMO 難題坦承“不會(huì)”，OpenAI 稱(chēng)“這就是自我意識(shí)”

來(lái)源：責(zé)編：時(shí)間：2025-08-05 09:21:14 40觀看

導(dǎo)讀這一次，“不會(huì)”竟成了大模型的高光時(shí)刻。雖然在 IMO 第 6 題上得了零分，OpenAI 的金牌模型卻展現(xiàn)了“高智商的誠(chéng)實(shí)”。正如 OpenAI 研究員 Noam Brown 在最新訪談中所揭示的：當(dāng) IMO 推理模型會(huì)在缺乏有效證據(jù)時(shí)

這一次，“不會(huì)”竟成了大模型的高光時(shí)刻。

雖然在 IMO 第 6 題上得了零分，OpenAI 的金牌模型卻展現(xiàn)了“高智商的誠(chéng)實(shí)”。

正如 OpenAI 研究員 Noam Brown 在最新訪談中所揭示的：

當(dāng) IMO 推理模型會(huì)在缺乏有效證據(jù)時(shí)表示“我不確定”，這會(huì)顯著減少隱藏錯(cuò)誤。

在 AI 摘下 IMO 金牌后，OpenAI 金牌小分隊(duì)成員 Alex Wei、Sheryl Hsu 和 Noam Brown 參與了紅杉資本組織的一場(chǎng)對(duì)話，揭秘模型攻克精英數(shù)學(xué)難題的底層突破。

有網(wǎng)友幫忙總結(jié)了個(gè)太長(zhǎng)不看版：

與過(guò)去那些“看起來(lái)完美，實(shí)則錯(cuò)誤”的幻覺(jué)式答案不同，這一代大模型開(kāi)始學(xué)會(huì)“承認(rèn)自己不會(huì)”。

它標(biāo)志著模型正在從胡編亂造的幻覺(jué)式回答，轉(zhuǎn)向更加可靠且具有“自我認(rèn)意識(shí)”的全新階段。

三位成員還在這場(chǎng)對(duì)話中，分享了更多關(guān)于沖刺 IMO 的有趣細(xì)節(jié)。

IMO 金牌模型能承認(rèn)自己不知道

盡管數(shù)學(xué)家與計(jì)算機(jī)科學(xué)家一致認(rèn)可 IMO 金牌模型的價(jià)值。

但他們常常抱怨，當(dāng)模型遇到知識(shí)盲區(qū)時(shí)，它總會(huì)輸出一個(gè)令人信服但錯(cuò)誤的答案。

他們不得不耗費(fèi)大量精力逐行驗(yàn)算，才能甄別那些幻覺(jué)陷阱。

IMO 第 6 題讓大模型全軍覆沒(méi)，當(dāng)然，OpenAI 也對(duì)其進(jìn)行了大量計(jì)算。

有一個(gè)由 2025×2025 個(gè)單位正方形組成的網(wǎng)格。Matilda 希望在網(wǎng)格上放置一些矩形圖塊，這些圖塊的大小不同，但每個(gè)圖塊的每一條邊都位于網(wǎng)格線上，并且每個(gè)單位正方形最多被一個(gè)圖塊覆蓋。

網(wǎng)格的每一行和每一列都恰好有一個(gè)未被任何瓷磚覆蓋的單位正方形，求出 Matilda 需要放置的最少瓷磚數(shù)量。

雖然投入海量算力最終僅得到一句“我無(wú)法回答”令人有些失望，但 Alex Wei 表示：

能看到模型避免產(chǎn)生幻覺(jué)是很好的。

Noam Brown 也對(duì)模型的這一轉(zhuǎn)變表示贊賞，“如果它不知道，它就會(huì)承認(rèn)它不知道。”

這代表模型開(kāi)始具備“自我意識(shí)”。

這種“自我意識(shí)”可以幫助模型在面對(duì)困難問(wèn)題時(shí)，承認(rèn)自己的無(wú)能為力，而不是生成一個(gè)看似合理實(shí)則錯(cuò)誤的解決方案。

有趣的是，在 Alex Wei 2024 年剛加入 OpenAI 一周時(shí)，Noam Brown 就曾問(wèn)過(guò)他，團(tuán)隊(duì)何時(shí)能獲得 IMO 金牌。

當(dāng)時(shí) Alex Wei 認(rèn)為 2025 年不太可能實(shí)現(xiàn)。

但令人驚嘆的是，這個(gè)三人團(tuán)隊(duì)僅用了兩月，就完成了他們一直在追求的目標(biāo) ——IMO 金牌。

Noam Brown 還表示：

OpenAI 有一個(gè)很棒的地方，就是研究人員有很大的自主權(quán)去做他們認(rèn)為有影響力的研究。

Alex 還強(qiáng)調(diào)，他們的團(tuán)隊(duì)“真正優(yōu)先考慮通用技術(shù)”，而不是專(zhuān)門(mén)開(kāi)發(fā)用于數(shù)學(xué)競(jìng)賽的系統(tǒng)。

OpenAI IMO 金牌核心團(tuán)隊(duì)

OpenAI IMO 核心團(tuán)隊(duì)僅由三名研究人員構(gòu)成。

Alex Wei，本碩均就讀于哈佛大學(xué)，隨后在加州大學(xué)伯克利分校獲得計(jì)算機(jī)科學(xué)博士學(xué)位。

Alex 還曾在谷歌、微軟和 Meta 實(shí)習(xí)，后于 2024 年 1 月加入 OpenAI，現(xiàn)任研究科學(xué)家。他曾是 FAIR 團(tuán)隊(duì)成員，參與開(kāi)發(fā)了首個(gè)用于外交游戲的人類(lèi)級(jí)人工智能 ——CICERO。

Sheryl Hsu，畢業(yè)于斯坦福大學(xué)計(jì)算機(jī)科學(xué)專(zhuān)業(yè)，是斯坦福 AI 實(shí)驗(yàn)室中 IRIS 實(shí)驗(yàn)室的研究員，于 2025 年 3 月加入 OpenAI。

Noam Brown，本科就讀于美國(guó)羅格斯新澤西州立大學(xué)新布朗斯維克分校，隨后在卡內(nèi)基?梅隆大學(xué)獲碩士和博士學(xué)位。他曾任職于 DeepMind 和 Meta，于 2023 年 6 月加入 OpenAI。

參考鏈接：

[1]https://x.com/chatgpt21/status/1950606890758476264

[2]https://www.youtube.com/watch?v=EEIPtofVe2Q

本文來(lái)自微信公眾號(hào)：量子位（ID：QbitAI），作者：時(shí)令

本文鏈接：http://www.www897cc.com/showinfo-45-25816-0.htmlAI 答 IMO 難題坦承“不會(huì)”，OpenAI 稱(chēng)“這就是自我意識(shí)”

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI 教育負(fù)責(zé)人呼吁：學(xué)生應(yīng)將 ChatGPT 視為工具而非“答題機(jī)器”

下一篇：昆侖萬(wàn)維發(fā)布并開(kāi)源全新推理大模型 MindLink，基于 Qwen3-32B 和 Qwen2.5-72B 進(jìn)行后訓(xùn)練

標(biāo)簽：

熱門(mén)焦點(diǎn)

內(nèi)容行業(yè)大變天，爆款全靠AI？

出品 | 微果醬（wjam123456）作者 | 陳出木題圖 | 文心一格 AI的發(fā)展之快出乎所有人的預(yù)料，似乎一夜之間便呼嘯而來(lái)。無(wú)論是資本的風(fēng)向標(biāo)，抑或是生活工作的輔助、流量口，還是茶余飯
“平均時(shí)代”：ChatGPT模仿秀的隱喻

來(lái)源：錦緞如果你問(wèn)ChatGPT，Instagram上最美的女人是誰(shuí)？它很可能會(huì)給你一個(gè)名字，叫卡戴珊。如果你觀察過(guò)Instagram這個(gè)美版小紅書(shū)：平臺(tái)上的所有網(wǎng)紅，展現(xiàn)的幾乎是統(tǒng)一面孔：統(tǒng)一的醫(yī)
字節(jié)、騰訊、網(wǎng)易鏖戰(zhàn)元宇宙背后，大廠究竟在爭(zhēng)奪什么？

正當(dāng)互聯(lián)網(wǎng)商業(yè)躊躇不前，互聯(lián)網(wǎng)大廠為了在存量中的增長(zhǎng)擠破頭皮之時(shí)，元宇宙的概念被資本點(diǎn)燃。先是Facebook更名Meta正式進(jìn)軍元宇宙，然后字節(jié)跳動(dòng)收購(gòu)了一家VR硬
傳騰訊已推出全新XR業(yè)務(wù)；摩托羅拉正打造5GXR頸戴式計(jì)算組件

今日熱點(diǎn)：傳騰訊已推出全新XR業(yè)務(wù)；摩托羅拉與Verizon合作打造5G XR頸戴式計(jì)算組件；小米AR購(gòu)物導(dǎo)航專(zhuān)利獲授權(quán)；VR一體機(jī)Simula One放棄眾籌并開(kāi)放直接預(yù)訂；VR游戲《
中國(guó)區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報(bào)告（2021）

區(qū)塊鏈?zhǔn)羌夹g(shù)整合創(chuàng)新、金融創(chuàng)新、組織方式創(chuàng)新、產(chǎn)業(yè)應(yīng)用創(chuàng)新的多維度創(chuàng)新，以服務(wù)實(shí)體經(jīng)濟(jì)、政務(wù)民生以及公共服務(wù)等領(lǐng)域?yàn)槁淠_點(diǎn)，以期實(shí)現(xiàn)整個(gè)地區(qū)和產(chǎn)業(yè)的資
以太坊倫敦升級(jí)后，隨之生效的以太坊EIP-1559是什么？

作者：三黎過(guò)去的一年里，除了 BTC 一如既往穩(wěn)坐王位，DEFI 則是貫穿一整年的狂歡熱點(diǎn)。 DeFi 在讓 ETH 實(shí)現(xiàn)價(jià)值增長(zhǎng)的同時(shí)，也使得其網(wǎng)絡(luò)日漸擁堵、交易費(fèi)用增高，成為
NFT教育要從娃娃抓起！這些青少年藝術(shù)家已經(jīng)賺取了幾千萬(wàn)美金

一些藝術(shù)家通過(guò)將他們的創(chuàng)作作為NFT出售而獲得了巨大收益。令人驚訝的是，許多賺取了數(shù)百萬(wàn)美元的藝術(shù)家們?nèi)栽谧x高中。這可能有點(diǎn)讓人難以置信。然而，請(qǐng)記住，在短
Interface正大光明的“跑路”，社區(qū)成員贊格局大

今日凌晨，一個(gè)廣泛受社區(qū)期待的潛力藍(lán)籌項(xiàng)目Interfaces突然發(fā)文宣布項(xiàng)目停止運(yùn)營(yíng)，后續(xù)也不會(huì)有鑄造NFT系列的活動(dòng)。這對(duì)社區(qū)來(lái)說(shuō)就是一重磅炸彈，大多數(shù)人完全不明
電影工業(yè)巨頭好萊塢計(jì)劃進(jìn)軍元宇宙，將會(huì)對(duì)行業(yè)帶來(lái)什么影響？

元宇宙聽(tīng)起來(lái)像不像是科幻小說(shuō)中出現(xiàn)的術(shù)語(yǔ)？事實(shí)確實(shí)如此。小說(shuō)家尼爾·斯蒂芬森在1992年的小說(shuō)《雪崩》中首次用這個(gè)詞來(lái)定義了一個(gè)多連接的虛擬宇宙，它能夠模

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁(yè)

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

AI 答 IMO 難題坦承“不會(huì)”，OpenAI 稱(chēng)“這就是自我意識(shí)”

內(nèi)容行業(yè)大變天，爆款全靠AI？

“平均時(shí)代”：ChatGPT模仿秀的隱喻

字節(jié)、騰訊、網(wǎng)易鏖戰(zhàn)元宇宙背后，大廠究竟在爭(zhēng)奪什么？

傳騰訊已推出全新XR業(yè)務(wù)；摩托羅拉正打造5GXR頸戴式計(jì)算組件

中國(guó)區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報(bào)告（2021）

以太坊倫敦升級(jí)后，隨之生效的以太坊EIP-1559是什么？

NFT教育要從娃娃抓起！這些青少年藝術(shù)家已經(jīng)賺取了幾千萬(wàn)美金

Interface正大光明的“跑路”，社區(qū)成員贊格局大

電影工業(yè)巨頭好萊塢計(jì)劃進(jìn)軍元宇宙，將會(huì)對(duì)行業(yè)帶來(lái)什么影響？

最新推薦

字節(jié)跳動(dòng)，剛剛投了一位虛擬女生

NFT的未來(lái)：傳統(tǒng)企業(yè)與去中心化機(jī)構(gòu)之間的競(jìng)賽

頭頂光環(huán)無(wú)數(shù)卻估值極低，以太坊這位&——quot;最強(qiáng)殺手&——quot;有望涅槃重生？

NFT藝術(shù)家Hayley Rincon 專(zhuān)訪：我的迷幻數(shù)字藝術(shù)之路

元宇宙的應(yīng)用行業(yè)研究：娛樂(lè)可能是元宇宙落地最快的場(chǎng)景之一

超級(jí)賬本Julian Gordon：聯(lián)盟鏈與公鏈的競(jìng)爭(zhēng)不是非此即彼

猜你喜歡

熱門(mén)推薦

相關(guān)資訊