當(dāng)前位置：首頁 > 科技 > 芯片

微軟 OmniParser 升級至 V2.0

來源：責(zé)編：時間：2025-02-18 12:19:04 121觀看

導(dǎo)讀微軟 OmniParser 作為一款獨具特色的基于純視覺的 GUI 智能體，能夠精準(zhǔn)解析和識別屏幕上可交互圖標(biāo)，此前與 GPT-4V 搭配時，其識別能力便得到顯著增強，在行業(yè)內(nèi)備受關(guān)注。2 月 12 日，微軟在官方網(wǎng)站正式發(fā)布了 OmniParser

微軟 OmniParser 作為一款獨具特色的基于純視覺的 GUI 智能體，能夠精準(zhǔn)解析和識別屏幕上可交互圖標(biāo)，此前與 GPT-4V 搭配時，其識別能力便得到顯著增強，在行業(yè)內(nèi)備受關(guān)注。

2 月 12 日，微軟在官方網(wǎng)站正式發(fā)布了 OmniParser 的最新版本 ——V2.0。這一版本實現(xiàn)了重大突破，它能夠?qū)?OpenAI（4o /o1 /o3-mini）、DeepSeek（R1）、Qwen（2.5VL）和 Anthropic（Sonnet）等多種模型，巧妙轉(zhuǎn)化為可操控計算機的 AI 智能體。這意味著，開發(fā)者和用戶能夠借助更多不同類型的模型，拓展 AI 智能體的應(yīng)用場景與功能邊界。

與舊版本 V1 相比，OmniParser V2 在技術(shù)層面進行了深度優(yōu)化。它采用了規(guī)模更為龐大的交互元素檢測數(shù)據(jù)以及圖標(biāo)功能標(biāo)題數(shù)據(jù)開展訓(xùn)練。如此一來，在檢測較小的可交互 UI 元素時，新版本展現(xiàn)出了卓越的性能。不僅準(zhǔn)確率得到大幅提升，推理速度也顯著加快，延遲降低幅度高達 60%。

在高分辨率 Agent 基準(zhǔn)測試 ScreenSpot Pro 中，V2 版本搭配 GPT-4o 的組合，準(zhǔn)確率飆升至 39.6%，而 GPT-4o 原始狀態(tài)下的準(zhǔn)確率僅為 0.8%，對比之下，V2 版本的優(yōu)勢一目了然。

為了進一步推動 AI 智能體技術(shù)的發(fā)展，方便開發(fā)者更快地對不同智能體設(shè)置進行實驗，微軟還開源了 OmniTool。

本文鏈接：http://www.www897cc.com/showinfo-27-131395-0.html微軟 OmniParser 升級至 V2.0

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：英國《在線安全法案》引爭議，科技巨頭與政府博弈升級

下一篇： SK 海力士加速推進 M15X 工廠投產(chǎn)

標(biāo)簽：

熱門焦點

K60 Pro官方停產(chǎn) 第三方瞬間漲價

雖然沒有官方宣布，但Redmi的一些高管也已經(jīng)透露了，Redmi K60 Pro已經(jīng)停產(chǎn)且不會補貨，這一切都是為了即將到來的K60 Ultra鋪路，屬于廠家的正常操作。但有意思的是該機在停產(chǎn)之后
一加Ace2 Pro真機揭曉鈦空灰配色質(zhì)感拉滿

終于，在經(jīng)過了幾波預(yù)熱之后，一加Ace2 Pro的外觀真機圖在網(wǎng)上出現(xiàn)了。還是博主數(shù)碼閑聊站曝光的，這次的外觀設(shè)計還是延續(xù)了一加11的方案，只是細(xì)節(jié)上有了調(diào)整，例如新加入了鈦空灰
2023年Q2用戶偏好榜：12+256G版本成新主流

3月份的性能榜、性價比榜和好評榜之后，就要輪到2023年的第二季度偏好榜了，上半年的新機潮已經(jīng)過去，最明顯的肯定就是大內(nèi)存和存儲的機型了，另外部分中端機也取消了屏幕塑料支架
從 Pulsar Client 的原理到它的監(jiān)控面板

背景前段時間業(yè)務(wù)團隊偶爾會碰到一些 Pulsar 使用的問題，比如消息阻塞不消費了、生產(chǎn)者消息發(fā)送緩慢等各種問題。雖然我們有個監(jiān)控頁面可以根據(jù) topic 維度查看他的發(fā)送狀態(tài)，
不容錯過的MSBuild技巧，必備用法詳解和實踐指南

一、MSBuild簡介MSBuild是一種基于XML的構(gòu)建引擎，用于在.NET Framework和.NET Core應(yīng)用程序中自動化構(gòu)建過程。它是Visual Studio的構(gòu)建引擎，可在命令行或其他構(gòu)建工具中使用
自動化在DevOps中的力量：簡化軟件開發(fā)和交付

自動化在DevOps中扮演著重要角色，它提升了DevOps的效能。通過自動化工具和方法，DevOps團隊可以實現(xiàn)以下目標(biāo)：消除手動和重復(fù)性任務(wù)。簡化流程。在整個軟件開發(fā)生命周期中實現(xiàn)更
為什么你不應(yīng)該使用Div作為可點擊元素

按鈕是為任何網(wǎng)絡(luò)應(yīng)用程序提供交互性的最常見方式。但我們經(jīng)常傾向于使用其他HTML元素，如 div span 等作為 clickable 元素。但通過這樣做，我們錯過了許多內(nèi)置瀏覽器的功能。
滴滴違法違規(guī)被罰80.26億共存在16項違法事實

滴滴違法違規(guī)被罰80.26億存在16項違法事實開始于2121年7月，歷經(jīng)一年時間，網(wǎng)絡(luò)安全審查辦公室對“滴滴出行”網(wǎng)絡(luò)安全審查終于有了一個暫時的結(jié)束。據(jù)“網(wǎng)信
外交部：美方應(yīng)停止在網(wǎng)絡(luò)安全問題上不負(fù)責(zé)任地指責(zé)他國

　中國外交部今天（16日）舉行例行記者會。會上，有記者問，美國情報官員稱，他們正在阻攔來自中國以及其他國家的黑客獲取相關(guān)科研成果。中方對此有何評論？對此

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

微軟 OmniParser 升級至 V2.0

K60 Pro官方停產(chǎn) 第三方瞬間漲價

一加Ace2 Pro真機揭曉鈦空灰配色質(zhì)感拉滿

2023年Q2用戶偏好榜：12+256G版本成新主流

從 Pulsar Client 的原理到它的監(jiān)控面板

不容錯過的MSBuild技巧，必備用法詳解和實踐指南

自動化在DevOps中的力量：簡化軟件開發(fā)和交付

為什么你不應(yīng)該使用Div作為可點擊元素

滴滴違法違規(guī)被罰80.26億共存在16項違法事實

外交部：美方應(yīng)停止在網(wǎng)絡(luò)安全問題上不負(fù)責(zé)任地指責(zé)他國

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊