日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

新研究:人類讀指針鐘準確率近九成,頂尖AI模型準確率僅一成多

來源: 責編: 時間:2025-09-15 11:51:32 36觀看
導讀一項名為“ClockBench”的全新測試揭示,人類在讀取指針式時鐘方面的準確率高達89.1%,而當前最先進的人工智能模型準確率僅為13.3%。這一差距凸顯了AI在視覺推理能力上與人類的顯著差異,尤其是在處理復雜視覺信息時,AI的表

一項名為“ClockBench”的全新測試揭示,人類在讀取指針式時鐘方面的準確率高達89.1%,而當前最先進的人工智能模型準確率僅為13.3%。這一差距凸顯了AI在視覺推理能力上與人類的顯著差異,尤其是在處理復雜視覺信息時,AI的表現(xiàn)遠未達到預期水平。yvM28資訊網(wǎng)——每日最新資訊28at.com

yvM28資訊網(wǎng)——每日最新資訊28at.com

該測試由研究者阿萊克·薩法爾設(shè)計,旨在通過定制化的指針式時鐘數(shù)據(jù)集,評估AI在視覺推理任務中的表現(xiàn)。測試中,來自6家企業(yè)的11個大型語言模型與5名人類參與者展開對比。數(shù)據(jù)集包含180個獨特的指針式時鐘,涵蓋36種鐘面設(shè)計,融合了羅馬數(shù)字與阿拉伯數(shù)字、不同朝向、時針標識、鏡像布局及彩色背景等元素,確保測試的復雜性和多樣性。yvM28資訊網(wǎng)——每日最新資訊28at.com

每個時鐘需通過四類問題測試:讀取時間、時間計算、按特定角度調(diào)整指針及時區(qū)轉(zhuǎn)換。為保證公平性,數(shù)據(jù)集從零構(gòu)建,避免與模型訓練數(shù)據(jù)重疊。測試結(jié)果顯示,AI模型在讀取時間時的中位誤差達1小時,而人類的中位誤差僅為3分鐘。性能最差的AI模型誤差甚至接近3小時,幾乎與隨機猜測無異。yvM28資訊網(wǎng)——每日最新資訊28at.com

在參與測試的AI模型中,谷歌旗下的Gemini 2.5 Pro以13.3%的準確率位居榜首,Gemini 2.5 Flash和GPT-5分別以10.5%和8.4%的準確率緊隨其后。然而,Grok 4模型的表現(xiàn)令人意外,其準確率僅0.7%,且將63.3%的時鐘判定為“無效”,遠高于實際無效時鐘的比例(180個中僅37個)。這種過度謹慎的策略雖在技術(shù)上增加了正確答案數(shù)量,但并未真正提升模型能力。yvM28資訊網(wǎng)——每日最新資訊28at.com

yvM28資訊網(wǎng)——每日最新資訊28at.com

測試還發(fā)現(xiàn),鐘面特征對AI判斷影響顯著。當鐘面采用羅馬數(shù)字時,AI準確率驟降至3.2%;采用圓形數(shù)字時,準確率也僅為4.5%。秒針、彩色背景及鏡像布局均會干擾AI的判斷。相比之下,僅含時針的時鐘(準確率23.6%)和采用阿拉伯數(shù)字的標準時鐘,能讓AI取得相對更好的成績。yvM28資訊網(wǎng)——每日最新資訊28at.com

一個意外發(fā)現(xiàn)是,AI模型在成功讀取時間后,能正確完成時間計算、指針調(diào)整或時區(qū)轉(zhuǎn)換任務。這表明,AI的挑戰(zhàn)并非在于時間相關(guān)的數(shù)學運算,而在于從視覺信息中提取時間的初始步驟。薩法爾分析,原因可能包括:指針式時鐘讀取對視覺推理能力要求極高;罕見或特殊的鐘面設(shè)計在訓練數(shù)據(jù)中極少出現(xiàn);以及將視覺信息轉(zhuǎn)化為文字描述對當前AI模型而言難度較大。yvM28資訊網(wǎng)——每日最新資訊28at.com

ClockBench被定位為長期基準測試,其完整數(shù)據(jù)集目前保密,以避免污染未來AI的訓練過程,但已有一個公開版本供測試使用。盡管AI在該測試中得分普遍較低,薩法爾認為,性能最佳的模型已展現(xiàn)出基礎(chǔ)的視覺推理能力,優(yōu)于隨機猜測。然而,這些能力能否通過擴大現(xiàn)有方法規(guī)模提升,還是需要全新技術(shù)路徑突破,仍是一個待解的問題。yvM28資訊網(wǎng)——每日最新資訊28at.com

此前,中國一項研究也曾發(fā)現(xiàn)多模態(tài)語言模型存在類似短板,但當時GPT-4o模型在包含“讀時鐘、讀儀表”的任務中準確率達54.8%。此次ClockBench測試中,AI最高準確率僅為13.3%,既表明新基準測試難度顯著提升,也反映出AI在時鐘讀取能力上并未取得明顯進步。yvM28資訊網(wǎng)——每日最新資訊28at.com

   更多>同類資訊?OpenAI未來六年算力與研發(fā)投入或達3500億美元,2030年盈利穩(wěn)定性存疑?09-14海馬emoji是否存在?ChatGPT等AI深陷“記憶迷局”反復糾錯難自明09-14螞蟻開源聯(lián)合Inclusion AI發(fā)布大模型生態(tài)全景圖,呈現(xiàn)AI開源新特征與三大開發(fā)趨勢09-14OpenAI稱GPT-5有博士級能力,谷歌DeepMind CEO:尚缺全面博士能力,AGI或需5到10年09-14缺錢仍具洞察:陶哲軒直指AI在數(shù)學研究中隱性目標被忽視之困09-14谷歌DeepMind CEO:當前AI系統(tǒng)難達博士級,GPT-5綜合能力被指差距大09-14OpenAI 2024-2030年擬投巨資:算力租賃與研發(fā)成本高企,盈利前景存疑09-14岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數(shù)字生態(tài)如何崛起?09-14谷歌DeepMind CEO:當前AI系統(tǒng)難達博士級,GPT-5能力被指夸大09-14新學期新氣象!北京1400余所中小學全學段開設(shè)人工智能通識課09-14宇樹王興興福耀科大開講:AI時代機遇均等,新生當懷熱忱逐夢前行09-14螞蟻開源2025外灘大會發(fā)布大模型全景圖,AI開發(fā)現(xiàn)三大趨勢:工具、路線與生態(tài)分化月 13 日,在 2025 Inclusion·外灘大會AI開源見解論壇上,螞蟻開源聯(lián)合Inclusion AI 發(fā)布了全新的《全球大模型開源開發(fā)生態(tài)全景與趨勢告》。本次發(fā)布的大模型開源開發(fā)生態(tài)全景圖共收錄了…09-14?對話京東方陳炎順:AI驅(qū)動產(chǎn)業(yè)升級,未來三年500億研發(fā)攜手伙伴共拓新局?“早在2024年初,京東方就將AI提高到了企業(yè)的整體發(fā)展戰(zhàn)略”,陳炎順對作者表示,“一方面我們成立了AI+創(chuàng)新與應用委員會,要求以營業(yè)收入的0.5%來用于AI的研發(fā)。 陳炎順指出,從CES到SID等國際展會上…09-14OpenAI奧爾特曼坦言:ChatGPT問世后,模型細微調(diào)整牽動數(shù)億人思維行為致其難眠9月14日消息,據(jù)《財富》報道,OpenAI CEO 薩姆·奧爾特曼在接受采訪時表示,“自從 ChatGPT 推出以來,我就沒睡過一個好覺。” 奧爾特曼描述了監(jiān)管這項如今每天有數(shù)億人使用的技術(shù)的壓力,他擔憂的…09-14上海創(chuàng)智學院:90后導師領(lǐng)航 博士CEO逐夢 機器人奇境挑戰(zhàn)未來2023年,劉鵬飛完成美國博后工作回國加盟上海交通大學,去年以雙聘的形式加盟創(chuàng)智學院,他深深感受時代的機遇正在眼前——“三個低概率事件”交匯:智能革命的發(fā)生、創(chuàng)智學院模式的獨一無二,學院對師生資源的傾斜。就…09-14點擊查看更多 +全站最新鴻蒙智行MPV新車諜照現(xiàn)身 智界品牌或迎新成員 明年上半年有望上市鴻蒙智行MPV新車諜照現(xiàn)身 智界品牌或迎新成員 明年上半年有望上市岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數(shù)字生態(tài)如何崛起?岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數(shù)字生態(tài)如何崛起?抖音圖文創(chuàng)作新思路:精選素材+用心運營,輕松開啟自媒體變現(xiàn)路!抖音圖文創(chuàng)作新思路:精選素材+用心運營,輕松開啟自媒體變現(xiàn)路!方形CMOS加持!iPhone 17前置攝像頭如何打破自拍構(gòu)圖限制?方形CMOS加持!iPhone 17前置攝像頭如何打破自拍構(gòu)圖限制??杭州全球農(nóng)創(chuàng)客大賽落幕:AI養(yǎng)豬、超濾凈水,青年科技繪就農(nóng)業(yè)新藍圖??杭州全球農(nóng)創(chuàng)客大賽落幕:AI養(yǎng)豬、超濾凈水,青年科技繪就農(nóng)業(yè)新藍圖?億級賣家吞吞揭秘:TikTok美區(qū)直播如何選渠道、控成本、定布局?億級賣家吞吞揭秘:TikTok美區(qū)直播如何選渠道、控成本、定布局?熱門內(nèi)容
  • 熱度攀升!千億科技龍頭頻獲機構(gòu)調(diào)研,業(yè)務增長透露哪些行業(yè)新動向?
  • 蘋果加速AI布局,或收購兩家法國AI初創(chuàng)企業(yè)
  • DeepSeek V3.1大模型升級,適配國產(chǎn)新芯片,性能顯著提升
  • 蘋果秋季發(fā)布會亮相iPhone 17系列:"史上最薄"Air登場,Pro Max 2TB版定價17999元
  • ?小米16系列或提前登場,首發(fā)驍龍8 Elite Gen5,9月機圈大戰(zhàn)一觸即發(fā)?
  • 蘋果AI布局加速,或?qū)⒊饩拶Y收購歐洲兩大AI初創(chuàng)企業(yè)
  • 紅米Note15系列前瞻:7s芯片、7000mAh大電池,防水新標桿即將登場
  • 華為智能手表登頂全球,蘋果需直面挑戰(zhàn)求變革
  • 科創(chuàng)板AI基金8月22日凈值飆升7.79%,重倉股表現(xiàn)搶眼
  • vivo X300系列新機入網(wǎng):首發(fā)LYT-828+2億像素,衛(wèi)通版支持北斗衛(wèi)星短信
  • ?字節(jié)跳動千人芯片團隊架構(gòu)調(diào)整,轉(zhuǎn)至新加坡子公司Picoheart引關(guān)注?
  • 蘋果加速布局中國市場!Apple Intelligence和新版Siri或年底至明年上線
  • OpenAI沖刺5000億估值,GPT-5遇冷:資本狂歡與技術(shù)瓶頸的碰撞
  • 華為云重組風暴:多部門整合,聚焦AI領(lǐng)域引發(fā)關(guān)注
  • 科大訊飛2026秋招啟動,畢業(yè)兩年內(nèi)可投,多樣崗位等你來選!
本欄最新岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數(shù)字生態(tài)如何崛起?岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數(shù)字生態(tài)如何崛起?新學期新氣象!北京1400余所中小學全學段開設(shè)人工智能通識課新學期新氣象!北京1400余所中小學全學段開設(shè)人工智能通識課宇樹王興興福耀科大開講:AI時代機遇均等,新生當懷熱忱逐夢前行宇樹王興興福耀科大開講:AI時代機遇均等,新生當懷熱忱逐夢前行螞蟻開源2025外灘大會發(fā)布大模型全景圖,AI開發(fā)現(xiàn)三大趨勢:工具、路線與生態(tài)分化螞蟻開源2025外灘大會發(fā)布大模型全景圖,AI開發(fā)現(xiàn)三大趨勢:工具、路線與生態(tài)分化?對話京東方陳炎順:AI驅(qū)動產(chǎn)業(yè)升級,未來三年500億研發(fā)攜手伙伴共拓新局??對話京東方陳炎順:AI驅(qū)動產(chǎn)業(yè)升級,未來三年500億研發(fā)攜手伙伴共拓新局?OpenAI奧爾特曼坦言:ChatGPT問世后,模型細微調(diào)整牽動數(shù)億人思維行為致其難眠OpenAI奧爾特曼坦言:ChatGPT問世后,模型細微調(diào)整牽動數(shù)億人思維行為致其難眠

本文鏈接:http://www.www897cc.com/showinfo-45-27565-0.html新研究:人類讀指針鐘準確率近九成,頂尖AI模型準確率僅一成多

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 美國最大出版商CEO控訴谷歌:用單一爬蟲抓內(nèi)容助力AI,卻讓出版商陷入困境

下一篇: ?OpenAI未來六年算力與研發(fā)投入或達3500億美元,2030年盈利穩(wěn)定性存疑?

標簽:
  • 熱門焦點
  • 歐盟人工智能法案:四種AI系統(tǒng)風險類型的劃分及監(jiān)管措施

    作者:趙志東 蔡佳雯來源:區(qū)塊鏈日報該法案采用風險分級的規(guī)制路徑,將人工智能系統(tǒng)的風險劃分成不可接受的風險、高風險、有限風險和輕微風險四種類型,并針對不同類型施加了不同
  • 元宇宙里掀起回憶殺?這波虛擬懷舊營銷主打一個極限反差

    來源:首席品牌官從被稱為“元宇宙元年”的2021年開始,幾乎所有品牌都在迫不及待地“入駐”元宇宙。而一提及品牌們的元宇宙玩法,相信多數(shù)人腦海里首先浮現(xiàn)
  • 元宇宙帶來沉浸式智能登錄?你學會了嗎?

    備受資本市場寵愛的元宇宙概念,正掀起一番番波瀾。元宇宙作為虛實相融的互聯(lián)網(wǎng)應用和社會形態(tài),與沉浸式體驗緊密相關(guān)。 多重路徑,打造無感知沉浸式智能登錄《設(shè)計
  • 如何對一款 NFT 項目進行價值評估?

    原文作者 | Othmane Senhaji Rhazi,Web 3 企業(yè)家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導 Web3 和 NFT 領(lǐng)域的企業(yè)家,因為我相信我們正在見證社會
  • 權(quán)限風波過后 X2Y2如何挑戰(zhàn)OpenSea?

    繼LooksRare之后,又一個OpenSea挑戰(zhàn)者X2Y2來了。上周,X2Y2宣布向超過86萬個OpenSea交易用戶發(fā)放X2Y2通證空投,并啟動了「掛單挖礦」的獎勵機制。這場早期激勵活動
  • 2022年去中心化交易所會崛起嗎?

    “在某個時候,去中心化衍生品的交易量可能會超過去中心化現(xiàn)貨交易所。”DEX 越來越多地轉(zhuǎn)向第二層解決方案。“數(shù)字化金融市場的概念以及如何沿著以用戶為中心
  • 趙長鵬預測SoicalFi為今年主要驅(qū)動力,新的機會在哪里?

    作者:五火球教主前不久,趙長鵬在《財富》雜志印度版塊刊登評論。他表示:“DeFi 在 2021 年出現(xiàn)了快速創(chuàng)新,我們可能會在 2022 年看到蓬勃發(fā)展的興趣和創(chuàng)新,其中 Soc
  • 元宇宙平臺會是上世紀末的互聯(lián)網(wǎng)嗎?

    “元宇宙”火了好幾個月,互聯(lián)網(wǎng)大廠忙于布局,資本市場熱烈追捧。然而很多人還是看不明白,更多的人覺得這是一場泡沫,一場騙局。一開始接觸這個怪里怪氣的名詞,感覺
  • 全球十大元宇宙概念游戲

    A股市場中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發(fā)布一款元宇宙概念的模擬經(jīng)營類游戲,盡管游戲尚在研發(fā)中,這一消息已經(jīng)讓中青寶的股價在51個交易
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
国产日韩欧美日韩大片| 免费观看日韩| 夜夜夜精品看看| 99精品国产在热久久| 亚洲免费婷婷| 久久精品日韩欧美| 欧美成人一品| 国产精品人人做人人爽人人添| 国产亚洲一级高清| 亚洲欧洲免费视频| 亚洲欧美日韩另类| 美女久久一区| 国产精品久久久久9999| 一色屋精品视频免费看| 一二三四社区欧美黄| 久久er精品视频| 欧美精品粉嫩高潮一区二区 | 亚洲欧美日韩成人| 美女诱惑一区| 国产精品免费在线| 一区二区在线观看av| 一区二区动漫| 免费看精品久久片| 国产精品久久国产愉拍| 亚洲国产成人av在线| 亚洲一区二区三区精品在线| 久久久精品日韩欧美| 欧美日韩另类视频| 黄色亚洲网站| 亚洲一区二区三区乱码aⅴ蜜桃女| 久久色在线观看| 国产精品vvv| 亚洲国产精品久久91精品| 亚洲欧美制服另类日韩| 欧美成人免费小视频| 国产欧美日韩亚洲| 在线亚洲一区二区| 欧美 亚欧 日韩视频在线| 欧美大尺度在线| 国产视频精品xxxx| 一区二区三区免费看| 老司机亚洲精品| 国产视频精品免费播放| 国产精品99久久久久久有的能看| 欧美成年人视频网站欧美| 国产亚洲精品自拍| 亚洲手机在线| 欧美另类极品videosbest最新版本 | 欧美成人中文字幕| 韩国欧美一区| 欧美一级理论性理论a| 国产精品va在线| 一级成人国产| 欧美国产欧美亚洲国产日韩mv天天看完整| 国产伦精品一区二区三区免费 | 国产精品视区| 中文网丁香综合网| 欧美日韩国产一区二区| 亚洲精品乱码久久久久| 裸体女人亚洲精品一区| 国外精品视频| 欧美专区在线观看一区| 国产精品久久久久久久久动漫 | 久久亚洲欧洲| 韩国一区二区三区在线观看| 午夜精品福利电影| 国产精品久久久久久妇女6080| 一个色综合导航| 欧美日韩日本视频| 一本色道久久综合亚洲精品按摩 | 欧美高清一区二区| 亚洲国产导航| 欧美69视频| 亚洲国产裸拍裸体视频在线观看乱了中文 | 欧美激情视频在线免费观看 欧美视频免费一 | 欧美制服丝袜第一页| 国产精品亚洲网站| 性欧美激情精品| 国产一区91| 久久一区国产| 亚洲国产精品一区二区第四页av | 免费观看成人鲁鲁鲁鲁鲁视频| 伊人成综合网伊人222| 噜噜噜噜噜久久久久久91| 亚洲国产激情| 欧美久久久久久久久| 亚洲作爱视频| 欧美丝袜一区二区三区| 亚洲永久免费视频| 国产亚洲成人一区| 久久性色av| 亚洲日本在线观看| 欧美日韩一区二区三区四区五区| 国产精品99久久久久久人| 国产精品视频精品视频| 久久大综合网| 影音先锋亚洲电影| 欧美成人一品| 一本色道久久88综合日韩精品| 国产精品theporn| 欧美在线观看一区| 在线观看亚洲精品视频| 欧美精品在线免费观看| 欧美精品在线免费播放| 亚洲午夜av电影| 国产日韩在线亚洲字幕中文| 久久亚洲春色中文字幕| 亚洲精品一区二区在线| 国产精品久久| 久久婷婷国产麻豆91天堂| 亚洲精品日韩综合观看成人91| 欧美性猛交xxxx乱大交退制版| 午夜一区不卡| 亚洲高清一区二| 国产精品jvid在线观看蜜臀 | 国产精品久久久久久久7电影 | 国产精品午夜av在线| 久久婷婷综合激情| 一本一本久久| 黄色成人av网| 欧美午夜精品伦理| 久久久午夜电影| 一区二区三区日韩在线观看 | 亚洲国产婷婷香蕉久久久久久| 欧美性开放视频| 久久久久久久久伊人| 99re在线精品| 韩国成人福利片在线播放| 欧美日韩精品三区| 久久精品国产亚洲aⅴ| 日韩午夜av在线| 国产日产亚洲精品系列| 欧美精品久久天天躁| 欧美亚洲视频在线观看| 亚洲精品国产欧美| 国产午夜精品理论片a级探花| 欧美激情精品久久久久久久变态 | 国产精品美女久久久浪潮软件 | 国产欧美日本在线| 欧美激情一区二区三区 | 欧美成人精品影院| 亚洲欧美综合精品久久成人| 亚洲激情视频网| 国产偷国产偷亚洲高清97cao| 欧美精品一区二区三区久久久竹菊| 亚洲综合色在线| 亚洲日本中文字幕区| 国产日韩欧美一区二区三区在线观看 | 韩国欧美国产1区| 欧美日韩岛国| 久久精品视频在线免费观看| 中国日韩欧美久久久久久久久| 在线播放日韩欧美| 国产欧美精品| 欧美日韩亚洲不卡| 美日韩在线观看| 久久aⅴ乱码一区二区三区| 亚洲视频精品| 亚洲精品乱码久久久久久蜜桃麻豆 | 欧美色图五月天| 蜜臀久久久99精品久久久久久| 国产精品视频yy9099| 欧美福利小视频| 久久久人成影片一区二区三区观看| 亚洲在线观看| 99精品欧美一区| 亚洲国产精品一区二区www在线| 国产一区二区三区免费不卡| 国产精品伦理| 欧美日韩国产一区二区| 欧美激情按摩| 久热爱精品视频线路一| 久久精品国产亚洲5555| 午夜精品久久久久久久久久久 | 久久尤物电影视频在线观看| 性欧美大战久久久久久久久| 亚洲视频成人| 一区二区免费看| 日韩午夜在线播放| 亚洲青色在线| 亚洲国产一区二区视频| 亚洲第一成人在线| 影音先锋日韩精品| 今天的高清视频免费播放成人 | 午夜精品久久久久影视| 亚洲视频在线观看三级| 夜夜狂射影院欧美极品| 亚洲毛片av| 亚洲乱码精品一二三四区日韩在线| 亚洲国产精品尤物yw在线观看| 影音先锋成人资源站| 1024欧美极品| 亚洲电影免费| 亚洲激情网站| 亚洲精品乱码| 99xxxx成人网| 99精品欧美一区二区蜜桃免费| 日韩视频免费观看| 一本色道久久综合亚洲91| 一区二区欧美精品| 亚洲午夜久久久| 亚洲欧美中文日韩v在线观看| 香蕉免费一区二区三区在线观看| 欧美一区二区成人6969|