在人工智能領域的最新動態中,meta首席人工智能科學家楊立昆在巴黎舉辦的AI Action Summit上發表了引人深思的見解。他指出,盡管人工智能在多個領域已展現出驚人的能力,但仍未能掌握理解物理世界、持久記憶、邏輯推理以及分層規劃這四大人類智能的核心特征。
楊立昆,這位圖靈獎得主,與IBM AI負責人安東尼·安農齊亞塔共同探討了智能行為的基準定義。他們一致認為,從相對聰明的動物到人類,都具備這四種基本智能特征。然而,當前的AI,尤其是大語言模型,尚未觸及這一門檻。楊立昆認為,要實現這些能力,必須對訓練范式進行根本性的變革。
據他所述,目前科技巨頭們為現有AI模型添加的種種功能,如為理解物理世界而訓練的獨立視覺系統,或為實現記憶功能而采用的檢索增強生成技術等,都只是權宜之計。楊立昆倡導的“世界模型”架構,則是一種更具前瞻性的解決方案。這種架構通過現實場景的訓練,具備比傳統模式識別AI更高的認知水平。
“世界模型”能夠獲取某一時間點的世界狀態,并預測采取特定行動后的新狀態。然而,由于現實世界的演化充滿無限不可預測性,楊立昆認為,抽象化是訓練“世界模型”的唯一途徑。meta開源的V-JEPA模型正在進行相關實驗,通過預測視頻缺失片段來學習,關鍵在于構建視頻的抽象表征,而非進行像素級的預測。
在硅谷舉行的Google I/O 2025開發者大會上,谷歌也透露了打造AI時代操作系統的計劃,這一操作系統能夠理解物理環境并代人類進行推理決策,本質上也是一個“世界模型”。自2024年末以來,DeepMind首席執行官德米斯·哈薩比斯一直在完善“世界模型→通用AI助手”的理論體系。此次I/O大會上,谷歌CEO桑達爾·皮查伊與Gemini負責人喬希·伍德沃德共同強調了這一愿景。
谷歌的這一舉措,不僅展現了其對“世界模型”的重視,更將其與短期戰略緊密結合,獨樹一幟。若能成功打造出理解物理環境的“通用AI助手”,谷歌或將成為連接用戶、企業與技術的關鍵橋梁。對于追求尖端AI技術的企業而言,利用谷歌的“世界模型”研究、多模態能力及其AGI發展路徑,將開啟全新的創新篇章。
楊立昆揭示的AI四大能力鴻溝,不僅揭示了現有模型的局限性,更為技術突破指明了方向。meta通過V-JEPA模型探索抽象表征訓練,谷歌將“世界模型”納入操作系統級戰略,這些行動本質上都在重構AI與物理世界的交互方式。這場角逐的深層意義在于,將AI從模式識別的工具升級為具備物理世界理解能力的認知主體。隨著行業從“打補丁”式優化轉向架構級創新,我們或許正站在通用人工智能(AGI)發展的關鍵節點上。
本文鏈接:http://www.www897cc.com/showinfo-45-13253-0.htmlAI距人類智能有多遠?楊立昆:缺失四大核心,世界模型成破局之道
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com