當(dāng)前位置：首頁 > 元宇宙 > AI

智譜視覺推理模型 GLM-4.5V 上線并開源，號稱“全球 100B 級效果最佳”

來源：責(zé)編：時間：2025-08-13 16:02:54 59觀看

導(dǎo)讀 8 月 11 日消息，智譜 AI 今日推出全球 100B 級效果最佳的開源視覺推理模型 GLM-4.5V（總參數(shù) 106B，激活參數(shù) 12B），并同步在魔搭社區(qū)與 Hugging Face 開源。此外，API 調(diào)用價格低至輸入 2 元 / M tokens，輸出 6 元 / M

8 月 11 日消息，智譜 AI 今日推出全球 100B 級效果最佳的開源視覺推理模型 GLM-4.5V（總參數(shù) 106B，激活參數(shù) 12B），并同步在魔搭社區(qū)與 Hugging Face 開源。此外，API 調(diào)用價格低至輸入 2 元 / M tokens，輸出 6 元 / M tokens。

從官方介紹獲悉，GLM-4.5V 基于智譜新一代旗艦文本基座模型 GLM-4.5-Air，延續(xù) GLM-4.1V-Thinking 技術(shù)路線，在 41 個公開視覺多模態(tài)榜單中綜合效果達(dá)到同級別開源模型 SOTA 性能，涵蓋圖像、視頻、文檔理解以及 GUI Agent 等常見任務(wù)。

在多模態(tài)榜單之外，其更重視模型在真實場景下的表現(xiàn)與可用性。GLM-4.5V 通過高效混合訓(xùn)練，具備覆蓋不同種視覺內(nèi)容的處理能力，實現(xiàn)全場景視覺推理，包括：

圖像推理（場景理解、復(fù)雜多圖分析、位置識別）

視頻理解（長視頻分鏡分析、事件識別）

GUI 任務(wù)（屏幕讀取、圖標(biāo)識別、桌面操作輔助）

復(fù)雜圖表與長文檔解析（研報分析、信息提取）

Grounding 能力（精準(zhǔn)定位視覺元素）

同時，模型新增“思考模式”開關(guān)，用戶可靈活選擇快速響應(yīng)或深度推理，平衡效率與效果。為幫助開發(fā)者直觀體驗 GLM-4.5V 的模型能力，打造專屬于自己的多模態(tài)應(yīng)用，智譜 AI 同步開源了一款桌面助手應(yīng)用。

該桌面應(yīng)用可實時截屏、錄屏獲取屏幕信息，并依托 GLM-4.5V 處理多種視覺推理任務(wù)，日常處理如代碼輔助、視頻內(nèi)容分析、游戲解答、文檔解讀等多類視覺任務(wù)，成為一個能看著屏幕和你一起工作娛樂的伙伴。我們也希望通過模型開源和 API 服務(wù)，賦能更多有想法的開發(fā)者，基于多模態(tài)基座模型發(fā)揮創(chuàng)意和想象，把過去科幻電影中的場景變?yōu)楝F(xiàn)實。

本文鏈接：http://www.www897cc.com/showinfo-45-26014-0.html智譜視覺推理模型 GLM-4.5V 上線并開源，號稱“全球 100B 級效果最佳”

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：高通：OpenAI 最小開源模型 gpt-oss-20b 可在驍龍終端運(yùn)行

下一篇： AI大模型爭霸：硅谷挖角華爾街量化精英，新戰(zhàn)爭序幕拉開

標(biāo)簽：

熱門焦點

AI網(wǎng)紅能年賺百萬，普通人的新機(jī)會來了？

來源｜運(yùn)營研究社作者 | 張知白編輯 | 楊佩汶設(shè)計 | 晏談夢潔2023 年，數(shù)字人成為了當(dāng)紅的“流量話題”和“商業(yè)機(jī)會"。不管是 AI 孫燕姿走紅網(wǎng)絡(luò)，還是 AI 數(shù)字
人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構(gòu)師 / 毛自聰出品 / 巨頭財經(jīng)5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯(lián)網(wǎng)圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯(lián)網(wǎng)巨頭展現(xiàn)
Terra鏈上TVL躍升至第二

據(jù)DefiLlama數(shù)據(jù)顯示，當(dāng)前,Terra鏈上應(yīng)用鎖倉的加密資產(chǎn)價值（TVL）為172.1億美元，在公鏈板塊中已躍升至第二，超越了幣安智能鏈TVL的118億美元，TVL排名居首的仍為以太
暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

NFT Worlds 系列產(chǎn)品于 2021 年 10 月 5 日免費(fèi)鑄造，該NFT系列是將傳統(tǒng)的中心化電子游戲minecraft 與去中心化資產(chǎn)相結(jié)合。傳統(tǒng)游戲Minecraft 對用戶定制非常開
NFTs正迎來數(shù)十億美元的繁榮--NFT零工經(jīng)濟(jì)從業(yè)者開始暴賺

當(dāng)Stefan Prodanovic在13歲時開始嘗試平面設(shè)計，與一位從事編程工作的學(xué)校朋友共同創(chuàng)作數(shù)字游戲時，他從未料到這個愛好會在他成年后變成一個相當(dāng)有利可圖的生意。
新聞業(yè)在元宇宙的現(xiàn)狀和未來

“美聯(lián)社有毛病吧，這真的過分了！”，一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一，之后取消了此次銷售，因為該視頻呈現(xiàn)了移民穿越地中海的苦
NFT行業(yè)周報：NBA巨星勒布朗·詹姆斯申請NFT相關(guān)商標(biāo)

1. “無聊猿”BAYC交易總額突破14億美元3月10日，據(jù)DappRader最新數(shù)據(jù)顯示，“無聊猿”Bored Ape Yacht Club（BAYC）交易總額已突破14億美元，創(chuàng)下歷史新高，本文撰寫時為
電影工業(yè)巨頭好萊塢計劃進(jìn)軍元宇宙，將會對行業(yè)帶來什么影響？

元宇宙聽起來像不像是科幻小說中出現(xiàn)的術(shù)語？事實確實如此。小說家尼爾·斯蒂芬森在1992年的小說《雪崩》中首次用這個詞來定義了一個多連接的虛擬宇宙，它能夠模
虛擬人行業(yè)研究報告

最早的虛擬人出現(xiàn)于 20 世紀(jì) 80 年代，受限于技術(shù)，當(dāng)時的虛擬人制作以手繪為主。21 世紀(jì)初，隨著動捕、渲染等技術(shù)的逐步發(fā)展，虛擬人相關(guān)技術(shù)開始在影視領(lǐng)域逐漸普及

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

智譜視覺推理模型 GLM-4.5V 上線并開源，號稱“全球 100B 級效果最佳”

AI網(wǎng)紅能年賺百萬，普通人的新機(jī)會來了？

人間誠實周鴻祎：360 All in 大模型的六個解讀

Terra鏈上TVL躍升至第二

暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

NFTs正迎來數(shù)十億美元的繁榮--NFT零工經(jīng)濟(jì)從業(yè)者開始暴賺

新聞業(yè)在元宇宙的現(xiàn)狀和未來

NFT行業(yè)周報：NBA巨星勒布朗·詹姆斯申請NFT相關(guān)商標(biāo)

電影工業(yè)巨頭好萊塢計劃進(jìn)軍元宇宙，將會對行業(yè)帶來什么影響？

虛擬人行業(yè)研究報告

最新推薦

三院士三教授熱聊元宇宙&——AIGC，學(xué)術(shù)界怎么看？

超跑與NFT的首次結(jié)合，蘭博基尼能否破局？

冰墩墩還能火多久？

智能人機(jī)交互技術(shù)的春晚大考

2021年中國元宇宙行業(yè)用戶行為分析熱點報告

NFT世界的藝術(shù)家名單

猜你喜歡

熱門推薦

相關(guān)資訊