日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

AI讀不懂時鐘,也算不出星期幾?基礎(chǔ)時間認(rèn)知成挑戰(zhàn)

來源: 責(zé)編: 時間:2025-05-18 16:00:30 38觀看
導(dǎo)讀近期,一項關(guān)于人工智能(AI)能力邊界的研究引起了廣泛關(guān)注。據(jù)LiveScience報道,盡管AI在編程、圖像生成、文本創(chuàng)作乃至部分標(biāo)準(zhǔn)化測試中表現(xiàn)出色,但在執(zhí)行日常生活中看似簡單的“讀時鐘”和“算日子”等任務(wù)時,卻頻頻失誤。

近期,一項關(guān)于人工智能(AI)能力邊界的研究引起了廣泛關(guān)注。據(jù)LiveScience報道,盡管AI在編程、圖像生成、文本創(chuàng)作乃至部分標(biāo)準(zhǔn)化測試中表現(xiàn)出色,但在執(zhí)行日常生活中看似簡單的“讀時鐘”和“算日子”等任務(wù)時,卻頻頻失誤。xed28資訊網(wǎng)——每日最新資訊28at.com

這項研究在2025年的“國際學(xué)習(xí)表征會議”(ICLR)上被詳細(xì)介紹,相關(guān)論文已在arXiv平臺上發(fā)布,盡管尚未完成同行評審。愛丁堡大學(xué)的研究員Rohit Saxena是論文的主要作者,他指出,人類對時間和日歷概念的掌握幾乎是本能的,而AI在這方面的欠缺應(yīng)被視為一個需要重視的問題。xed28資訊網(wǎng)——每日最新資訊28at.com

為了驗證這一點,研究團(tuán)隊設(shè)計了一系列專門測試時鐘識別和日歷計算的圖像,并將它們輸入到多個具備圖文處理能力的大型語言模型中,包括meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4。然而,測試結(jié)果顯示,這些模型在判斷時鐘時間和推算日期星期上的準(zhǔn)確率均未超過50%。xed28資訊網(wǎng)——每日最新資訊28at.com

Saxena進(jìn)一步解釋,AI在處理時鐘問題時,不僅需要識別指針的位置,還要理解角度和分辨不同風(fēng)格的表盤,如羅馬數(shù)字或藝術(shù)化設(shè)計,這遠(yuǎn)比簡單的物體識別復(fù)雜得多。而日歷問題同樣困擾著AI,特別是在處理如“每年第153天是星期幾”這類問題時,錯誤率依然很高。xed28資訊網(wǎng)——每日最新資訊28at.com

研究數(shù)據(jù)顯示,AI在讀時鐘上的正確率僅為38.7%,而在判斷日歷上的準(zhǔn)確率更是低至26.3%。Saxena強(qiáng)調(diào),AI的推理過程并不基于固定的算法規(guī)則,而是依賴于從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的模式,這導(dǎo)致它們的推理過程缺乏一致性和準(zhǔn)確性。xed28資訊網(wǎng)——每日最新資訊28at.com

研究還發(fā)現(xiàn),當(dāng)AI的訓(xùn)練樣本中缺乏某些特定現(xiàn)象,如閏年或復(fù)雜的日歷規(guī)則時,它們的表現(xiàn)會進(jìn)一步下降。即使模型已經(jīng)理解了“閏年”這一概念,它們也很難將這個知識正確地應(yīng)用到具體的視覺判斷中。xed28資訊網(wǎng)——每日最新資訊28at.com

針對這些問題,研究提出了兩個改進(jìn)方向:一是增加訓(xùn)練數(shù)據(jù)中的代表性示例,以確保AI能夠接觸到更多樣化的情境;二是重新審視AI如何整合邏輯推理與空間感知能力,特別是在處理不常遇到的任務(wù)時。這些發(fā)現(xiàn)不僅揭示了AI的當(dāng)前局限,也為未來的研究和開發(fā)提供了重要的指導(dǎo)。xed28資訊網(wǎng)——每日最新資訊28at.com

舉報 0收藏 0打賞 0評論 0
 
 
更多>同類資訊
點擊查看更多 +
全站最新
新疆夜空驚現(xiàn)神秘飛行物,目擊者:與月爭輝,瞬間加速消失
新疆夜空驚現(xiàn)神秘飛行物,目擊者:與月爭輝,瞬間加速消失
吉利私有化極氪背后的財務(wù)賬本:年省百億,劍指高質(zhì)量發(fā)展
吉利私有化極氪背后的財務(wù)賬本:年省百億,劍指高質(zhì)量發(fā)展
50歲大姐考駕照遇挫,教練態(tài)度惡劣還學(xué)時造假?駕校回應(yīng)
50歲大姐考駕照遇挫,教練態(tài)度惡劣還學(xué)時造假?駕校回應(yīng)
九號電動:700萬臺銷量突破,一季度凈利暴漲,智能兩輪車新王者崛起?
九號電動:700萬臺銷量突破,一季度凈利暴漲,智能兩輪車新王者崛起?
電車智駕普及快,為何高價油車卻落后?
電車智駕普及快,為何高價油車卻落后?
浪漫啟航!自治區(qū)總工會助力單身職工尋覓北疆良緣
浪漫啟航!自治區(qū)總工會助力單身職工尋覓北疆良緣
熱門內(nèi)容
  • 夸克AI新升級:深度搜索賦能,信息獲取更高效智能
  • 英偉達(dá)全球總部或?qū)⒙鋺糁袊_灣,黃仁勛下周宣布這一重大決定?
  • ChatGPT喊你名字了?用戶反應(yīng)不一,個性化嘗試遭遇“恐怖谷”
  • 夸克AI新升級“深度搜索”,解鎖高效獲取信息新技能
  • 螞蟻集團(tuán)慷慨分紅,單季凈利達(dá)136億,阿里持股33%共享成果
  • 教育部新規(guī):學(xué)生禁直接復(fù)制AI作業(yè),強(qiáng)化獨(dú)立思考與批判性思維
  • 通義千問3重磅登場!全球頂尖開源模型,通義App與網(wǎng)頁版等你來體驗
  • 中國首部規(guī)范AI氣象服務(wù)規(guī)章6月施行,氣象領(lǐng)域?qū)⒂瓉硇伦兏铮?/li>
  • 小米5月下旬新品爆發(fā):手機(jī)平板眼鏡手表,你期待哪一款?
  • TIOBE 5月編程語言榜:Python強(qiáng)勢領(lǐng)跑,占比創(chuàng)歷史新高
  • 蘋果新款A(yù)pple TV 4K即將發(fā)布,四大升級能否重塑智能客廳體驗?
  • AI長片《海上女王鄭一嫂》登陸新加坡院線,影視創(chuàng)作新時代來臨?
  • 小米16曝光:或?qū)⑿略龆喙δ馨存I,輕薄機(jī)身年底亮相?
  • 教育部新規(guī):中小學(xué)分階段用AI,嚴(yán)禁復(fù)制答案強(qiáng)化獨(dú)立思考
  • 360納米AI新推MCP萬能箱,打造個性化智能體提升效率
本欄最新
小米Civi 5 Pro:輕薄機(jī)身里的影像與性能王者?
小米Civi 5 Pro:輕薄機(jī)身里的影像與性能王者?
廣東移動AI秘書上線:漏接電話不再怕,智能代答新體驗!
廣東移動AI秘書上線:漏接電話不再怕,智能代答新體驗!
火石國際AIGC戰(zhàn)略升級,攜手蘭大文學(xué)院開啟校企合作新篇章
火石國際AIGC戰(zhàn)略升級,攜手蘭大文學(xué)院開啟校企合作新篇章
AI閨蜜醫(yī)生:科學(xué)解答女性健康疑惑,守護(hù)全生命周期
AI閨蜜醫(yī)生:科學(xué)解答女性健康疑惑,守護(hù)全生命周期
中國信息通信網(wǎng)絡(luò)全球領(lǐng)先,5G應(yīng)用廣泛推動數(shù)字經(jīng)濟(jì)深度融合
中國信息通信網(wǎng)絡(luò)全球領(lǐng)先,5G應(yīng)用廣泛推動數(shù)字經(jīng)濟(jì)深度融合
中國移動AI速記來襲,通話內(nèi)容秒變文字記錄,信息獲取更便捷!
中國移動AI速記來襲,通話內(nèi)容秒變文字記錄,信息獲取更便捷!

本文鏈接:http://www.www897cc.com/showinfo-45-12974-0.htmlAI讀不懂時鐘,也算不出星期幾?基礎(chǔ)時間認(rèn)知成挑戰(zhàn)

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 王樹國:人文社科在新技術(shù)時代不可或缺,文科不會消亡

下一篇: 廣州移動攜手生態(tài)伙伴,共繪大灣區(qū)AI落地新藍(lán)圖

標(biāo)簽:
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

Top 主站蜘蛛池模板: 高清| 壶关县| 南汇区| 双鸭山市| 阳城县| 武宁县| 安平县| 城步| 陇南市| 东乌| 孟村| 宝山区| 湘乡市| 怀来县| 邵武市| 尖扎县| 通州区| 高平市| 锡林浩特市| 南雄市| 洛扎县| 彩票| 康保县| 呈贡县| 麦盖提县| 隆尧县| 吴桥县| 平利县| 江门市| 朝阳市| 科技| 祁东县| 辽源市| 绥阳县| 德江县| 二手房| 卢氏县| 特克斯县| 山东省| 武隆县| 宜兰县|