日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

新研究發現 AI 無法讀懂模擬時鐘,還不能告訴你某天是周幾

來源: 責編: 時間:2025-05-20 10:02:12 71觀看
導讀 5 月 17 日消息,根據外媒 LiveScience 今日報道,有些人類能輕松完成的任務,AI 卻無法勝任。譬如,AI 能編程、畫出逼真的圖像、生成接近人類語氣的文本,甚至在部分考試中取得不錯成績,但在日常生活中最基礎的“看鐘

5 月 17 日消息,根據外媒 LiveScience 今日報道,有些人類能輕松完成的任務,AI 卻無法勝任。譬如,AI 能編程、畫出逼真的圖像、生成接近人類語氣的文本,甚至在部分考試中取得不錯成績,但在日常生活中最基礎的“看鐘”“算日子”這類事情上,卻頻繁出錯 —— 要么讀不準指針位置,要么算不出星期幾。qOW28資訊網——每日最新資訊28at.com

研究人員在 2025 年“國際學習表征會議”( ICLR )上介紹了這項發現,有關的論文已經在 arXiv 上發布,目前尚未通過同行評審。qOW28資訊網——每日最新資訊28at.com

愛丁堡大學研究員、論文作者 Rohit Saxena 表示:“人類從小就能掌握時間與日歷概念,而 AI 在這方面的不足,是一個值得警惕的信號。”他指出,若要將 AI 應用于現實生活中對時間敏感的場景,比如排班、自動化流程或輔助技術,這類基本能力的缺陷必須解決。qOW28資訊網——每日最新資訊28at.com

qOW28資訊網——每日最新資訊28at.com

研究團隊向多個具備圖文處理能力的大語言模型輸入了一組專門制作的時鐘與日歷圖像,受測模型包括 Meta 的 Llama 3.2-Vision、Anthropic 的 Claude-3.5 Sonnet、谷歌的 Gemini 2.0 和 OpenAI 的 GPT-4o。測試結果顯示,這些模型在判斷時鐘時間或推算日期星期的任務上,正確率都未超過一半。qOW28資訊網——每日最新資訊28at.com

Saxena 表示:“過去的 AI 訓練依賴大量帶標簽的例子,而讀時鐘需要的是空間推理。模型不僅要識別指針是否重疊,還要理解角度、分辨各種風格的表盤,比如羅馬數字或藝術化設計。這遠比單純識別‘這是一個時鐘’更復雜。”qOW28資訊網——每日最新資訊28at.com

日歷問題同樣難住了 AI。例如在“每年第 153 天是星期幾”這類問題上,錯誤率依然居高不下。研究顯示,AI 讀時鐘的正確率僅為 38.7%,判斷日歷的準確率更低,只有 26.3%。qOW28資訊網——每日最新資訊28at.com

Saxena 解釋道:“對傳統計算機來說,算術輕而易舉,但對大模型而言則不然。AI 并不執行算法,而是依靠從訓練數據中學到的模式來預測答案。”他指出,雖然 AI 有時能答對問題,但其推理過程缺乏一致性,也不基于固定規則,這正是研究所揭示的差距。qOW28資訊網——每日最新資訊28at.com

研究還揭示了另一個問題,即當 AI 的訓練樣本缺乏某類現象時,比如閏年或復雜的日歷規則,其表現往往更差。Saxena 表示:“即使模型了解‘閏年’這一概念,也不代表它們能將這個知識正確應用到具體的視覺判斷中。”qOW28資訊網——每日最新資訊28at.com

從報道中獲悉,研究強調了兩個方面的改進方向:一是訓練數據應包含更多具有代表性的示例;二是應重新審視 AI 如何整合邏輯推理與空間感知,尤其是在處理不常遇到的任務時。qOW28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-13008-0.html新研究發現 AI 無法讀懂模擬時鐘,還不能告訴你某天是周幾

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI攜手G42,擬在阿布扎比沙漠打造超摩納哥規模AI數據中心

下一篇: 螞蟻集團 CTO 何征宇:大模型幻覺的源頭是缺乏數據

標簽:
  • 熱門焦點
  • 數字虛擬人23年最新變化!

    作者:小資來源:米塔之家自2021年元宇宙“爆炸”后,作為現實世界連接元宇宙的媒介之一,大批虛擬人跑步入場。到了2022年底,據天眼查數據顯示,我國目前企業名稱或經營范圍
  • 風口已至,多領域平臺融入社交元素!

    在眾多領域平臺中,社交元素都扮演著重要角色,如直播營銷帶貨、線上配對聽歌、游戲局內互動等。隨著元宇宙時代的來臨,社交產品不斷升級,社交元素推動流量變現,多平臺領域融入社交
  • 元宇宙社交啫喱、希壤爆款迭出,騰訊慌了嗎?

    文 | 陳橋輝沒想到騰訊超級QQ秀的20周年歸來首秀,被一款名不見經傳的產品搶了風頭。1月15日,一款名為“啫喱”的社交App迅速在各個互聯網的社交圈內火爆起來,引起
  • 2022年最具關注的9個頭像NFT項目

    什么是 PFP NFT 項目?PFP NFT (個人資料圖片NFT)是一組獨特的數字收藏品,人們用來在互聯網平臺上代表自己。這些數字藝術作品通常是一系列可作為頭像的角色,在 Twit
  • 中國銀保監管委提示:謹慎投資,勿做接盤俠

    中國銀保監管委,發布一則風險提示,內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下:近期,一些不法分子蹭熱點,以“元宇宙投資項目”“元宇宙鏈游”等名
  • “我沒搞懂元宇宙,但一天能賺9w塊”

    作者:鄭宇軒最近幾個月,“元宇宙”爆火,除了 Facebook 改名為 Meta 高調進軍元宇宙外, BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間,元宇宙成為新風口,除了
  • 趙長鵬預測SoicalFi為今年主要驅動力,新的機會在哪里?

    作者:五火球教主前不久,趙長鵬在《財富》雜志印度版塊刊登評論。他表示:“DeFi 在 2021 年出現了快速創新,我們可能會在 2022 年看到蓬勃發展的興趣和創新,其中 Soc
  • 淺聊DAO圖景和未來

    DAO是什么?DAO (Decentralized Autonomous Organizations),去中心化自治組織,是基于區塊鏈技術,由社區通過透明的決策過程運行和管理的組織形態。DAO使得社區成為
  • 我們離元宇宙的實現只差一副眼鏡?

    近日的蘋果春季新品發布會,想必許多人都守在了屏幕前,就為等待傳說中的首款AR Glass。在發布會之前,蘋果全球營銷主管Greg Joswiak曾在Twitter上分享了一段短視頻
Top 主站蜘蛛池模板: 临城县| 浦县| 湄潭县| 温州市| 千阳县| 宽城| 清徐县| 嵊州市| 南平市| 怀集县| 碌曲县| 阳新县| 福泉市| 茂名市| 阳谷县| 威远县| 兴和县| 平阳县| 禄丰县| 永德县| 汶川县| 绵阳市| 桐乡市| 温泉县| 大丰市| 浦城县| 温州市| 台东市| 新蔡县| 兰坪| 武川县| 马山县| 新邵县| 赫章县| 迭部县| 馆陶县| 陇西县| 宣城市| 定南县| 泰州市| 历史|