當前位置：首頁 > 元宇宙 > AI

清華大學合作推出看圖答題小能手 CogAgent：可告知《原神》游戲操作步驟等

來源：責編：時間：2024-01-02 09:26:41 275觀看

導讀 12 月 27 日消息，清華 KEG 實驗室近日和智譜 AI 合作，聯合推出了新一代圖像理解大模型 CogAgent。該模型基于此前推出的 CogVLM，通過視覺 GUI Agent，使用視覺模態（而非文本）對 GUI 界面進行更全面直接的感知，從而作

12 月 27 日消息，清華 KEG 實驗室近日和智譜 AI 合作，聯合推出了新一代圖像理解大模型 CogAgent。

該模型基于此前推出的 CogVLM，通過視覺 GUI Agent，使用視覺模態（而非文本）對 GUI 界面進行更全面直接的感知，從而作出規劃和決策。

CogAgent 可以接受 1120×1120 的高分辨率圖像輸入，具備視覺問答、視覺定位（Grounding）、GUI Agent 等多種能力，在 9 個經典的圖像理解榜單上（含 VQAv2，STVQA, DocVQA，TextVQA，MM-VET，POPE 等）取得了通用能力第一的成績。

例如，用戶輸入一張關于 CogVLM 項目的 GitHub 的圖片，然后詢問如何給這個項目點“Star”，然后 CogAgent 就會反饋出結果。

圖源：中國網科學

例如用戶輸入一張原神游戲的截圖，可以詢問“當前任務中的隊友是誰？”，CogAgent 會給出相關的回答。

附上相關信息地址如下：

論文：https://arxiv.org/abs/2312.08914

Demo：Streamlit

代碼：https://github.com/THUDM/CogVLM

本文鏈接：http://www.www897cc.com/showinfo-45-3084-0.html清華大學合作推出看圖答題小能手 CogAgent：可告知《原神》游戲操作步驟等

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：韓國首爾明年將啟用無人機及人工智能監控交通狀況

下一篇：算力巨獸能耗驚人：英偉達 H100 AI 芯片總耗電量將超歐洲小國

標簽：

熱門焦點

AI大模型“戰火”燒到了教育領域

作者：劉曠自2023年開年以來，AI大模型這股風是越吹越猛烈了。隨著ChatGPT的出圈爆火，再度掀起了一波AI熱浪，無論是在國內還是國外都有不少企業宣布入局或者跟進AI大模型領域。與
關于ChatGPT的10點思考

作者：晏濤三壽近日ChatGPT又有大動作。5月19日，OpenAI在官網宣布正式發布App應用，并登錄蘋果應用商店。與網頁版的聊天機器人相比，iOS應用程序的發布有望讓更多人接觸到ChatGPT
完美世界被元宇宙“拒之門外”

春節期間，游戲是消磨時間最好的方式，完美世界的《幻塔》作為選擇的首要目標，倒不是因為它的吸引力有多大，純粹是廣大網友的吐槽。繼《原神》之后，進擊元宇宙的游戲
“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

今日《元宇宙新鮮事》有：“元宇宙第一股”Roblox首份年報未達預期致盤后股價暴跌15.28%；YouTube宣布進軍區塊鏈和元宇宙；摩根大通成為首家進入元宇宙的銀行。【中
借VR產業東風，江西搶灘布局“元宇宙”

自2016年起就在VR上傾注了大量精力的江西省，迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口，使人們可以在數字空間和物理空間自由穿梭。自2016年起
解決NFT流動性問題：一文了解Floor DAO

流動性是證券市場上的一個術語，流動性是指資產在不影響其市場價格的情況下可以轉換為現成現金的效率，流動性最強的資產是現金本身。現在讓我們試著從流動性的角
從4個方面解析2022年加密行業趨勢

作者：去月球基礎設施瓶頸仍然存在盡管2021年公鏈基礎設施之間的競爭顯著升溫，但關鍵瓶頸仍需解決。例如，以太坊作為DApp開發的頂級公鏈，仍然遭受網絡擁塞和高額交
如何在元宇宙中建立品牌忠誠度

Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點？他們都投資于元宇宙的房地產。除了我們在屏幕上看到的二維世界--手機、筆記本電腦、臺式機或iPad--他們決
元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

GameFi=Game（游戲）+DEFI（去中心化金融），核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能，GameFi 游戲資產化身為NFT 和代幣上鏈，具備了可驗證性和流通性；開

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

清華大學合作推出看圖答題小能手 CogAgent：可告知《原神》游戲操作步驟等

AI大模型“戰火”燒到了教育領域

關于ChatGPT的10點思考

完美世界被元宇宙“拒之門外”

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

借VR產業東風，江西搶灘布局“元宇宙”

解決NFT流動性問題：一文了解Floor DAO

從4個方面解析2022年加密行業趨勢

如何在元宇宙中建立品牌忠誠度

元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

最新推薦

元宇宙這一年：技術加速落地，助傳統行業走向新階段

超級碗的加密時刻：是主流信號還是“網絡超級碗2.0”？

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

猜你喜歡

熱門推薦

相關資訊