當前位置：首頁 > 元宇宙 > AI

力壓群雄：谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型，可精確引用

來源：責編：時間：2025-04-24 14:45:58 65觀看

導讀 4 月 22 日消息，最新報告指出，谷歌旗下的 Gemini 2.5 Pro 模型能準確解析 PDF 文檔的視覺結構，實現精準的視覺引用功能，成為首款能完全理解 PDF 布局的 AI 模型。注：谷歌于 3 月 25 日向付費用戶和開發者發布 Gemi

4 月 22 日消息，最新報告指出，谷歌旗下的 Gemini 2.5 Pro 模型能準確解析 PDF 文檔的視覺結構，實現精準的視覺引用功能，成為首款能完全理解 PDF 布局的 AI 模型。

注：谷歌于 3 月 25 日向付費用戶和開發者發布 Gemini 2.5 Pro 實驗模型，僅隔 4 天時間，谷歌便通過免費 Web 應用向全球用戶開放。

Gemini 2.5 Pro 不僅能提取 PDF 文檔中的文本內容，還能理解其視覺布局，包括圖表、表格和整體排版。

谷歌在開發者文檔中表示，該模型具備“原生視覺”（Native Vision）能力，支持處理最多 3000 個 PDF 文件（每個文件上限為 1000 頁或 50MB），同時擁有 100 萬 token 的超大上下文窗口，未來計劃擴展至 200 萬 token。

AI 初創公司 Matrisk 的聯合創始人 Sergey Filimonov 特別贊揚了 Gemini 2.5 Pro 在 PDF 視覺引用上的表現。

Filimonov 指出，傳統的文本分割方法會切斷用戶與原文的視覺聯系，導致無法直觀驗證信息的來源。甚至在 ChatGPT 中，點擊引用也只能下載 PDF，迫使用戶自行判斷模型是否“幻覺”，這嚴重損害了用戶信任。

過去，引用文檔內容往往只能高亮大段無關文本，精準度極低。Gemini 2.5 徹底改變這一現狀，它不僅能將提取的文本片段映射回原始 PDF 的確切位置，還能以前所未有的精度鎖定特定句子、表格單元甚至圖像。

這種技術突破為用戶提供了直觀的視覺反饋，例如在詢問房屋費率變化時，系統能直接高亮文檔中相關數據（如 15.4% 的費率變化），并標注來源依據。

這種清晰度和交互性是現有工具無法企及的。Gemini 2.5 不僅優化了現有流程，更開啟了全新的文檔交互模式。

相比之下，Gemini 2.5 以 0.804 的 IoU（交并比）精度大幅領先其他模型，如 OpenAI 的 GPT-4o（0.223）和 Claude 3.7 Sonnet（0.210），展現出驚人的空間理解能力。

提供商模型IOU簡評Gemini2.5 Pro0.804非常優秀Gemini2.5 Flash0.614有時表現不錯Gemini2.0 Flash0.395OpenAIgpt-4o0.223OpenAIgpt-4.10.268OpenAIgpt-4.1-mini0.253Claude3.7 Sonnet0.210

Gemini 2.5 的潛力遠不止于文本定位。它還能從 PDF 中提取結構化數據，同時明確標注每個數據的來源位置，解決下游決策中因數據來源不明而產生的信任障礙。

本文鏈接：http://www.www897cc.com/showinfo-45-12558-0.html力壓群雄：谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型，可精確引用

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： AI時代瀏覽器大戰：Chrome命運懸而未決，OpenAI欲收入囊中？

下一篇：智能軟體仿生觀賞魚“金鱗”亮相，在水族館、公園有望“以假亂真”

標簽：

熱門焦點

新周期，誰在堅守窄門？

來源：錦緞今日的投資者恐怕已經忘記了，在OpenAI創造出ChatGPT這一殺器的前夜，生成式AI也曾經是一道窄門，窄到連馬斯克都差點失去了信心。在當時的輿論眼中，AGI的道路不夠性感，不夠
雷克薩斯高管，“受賄”5000萬？

來源：毒舌科技作者：潘磊雷克薩斯的高管，好像出事了。五六家日本小媒體，突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元（約合人民幣5000
從科幻走進現實，元宇宙概念逐漸清晰

2021年，元宇宙概念如同一顆炸彈投進互聯網行業，掀起了一場數字海嘯，眾多企業紛紛入局，在此新領域展開新探索。那么，加速狂奔的元宇宙究竟是什么？概念翻紅，元宇宙走進資本圈2021年3
智能人機交互技術的春晚大考

1月初的一個早晨，京東智能客戶服務產品部緊急開會，進行關于尚未對外公布的“X項目”的初討論。1月5日，這個神秘的X項目對外公布，京東成為央視2022年春晚獨家互動合
Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

目前來看元宇宙不會影響到小型企業的發展，但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞，你一定或
暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

NFT Worlds 系列產品于 2021 年 10 月 5 日免費鑄造，該NFT系列是將傳統的中心化電子游戲minecraft 與去中心化資產相結合。傳統游戲Minecraft 對用戶定制非常開
a16z：元宇宙辦公會取代實體辦公室嗎？

6位不同的專家對未來的工作發表看法----元宇宙--沉浸式的、基于區塊鏈的虛擬世界，大多數日常活動最終會在這里發生--但仍然只是一個概念。但它是一個擁有寶貴不
知識產權可能在元宇宙中“消失”？

開篇老雅痞先來劃重點：一些公司開始采取積極的方式來保護他們在元宇宙的知識產權。耐克、愛馬仕和米拉麥克斯最近提起訴訟，聲稱NFT侵犯了他們的知識產權。Inside
超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

在2021年《福布斯》區塊鏈50強榜單中，29家企業使用Hyperledger超級賬本技術，占比近60%。同年，研究機構Blockdata發布了的調查報告顯示，訪問Top100上市公司中，有 81

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

力壓群雄：谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型，可精確引用

新周期，誰在堅守窄門？

雷克薩斯高管，“受賄”5000萬？

從科幻走進現實，元宇宙概念逐漸清晰

智能人機交互技術的春晚大考

Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

a16z：元宇宙辦公會取代實體辦公室嗎？

知識產權可能在元宇宙中“消失”？

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

最新推薦

猜你喜歡

熱門推薦

相關資訊