日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

力壓群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精確引用

來源: 責編: 時間:2025-04-24 14:45:58 65觀看
導讀 4 月 22 日消息,最新報告指出,谷歌旗下的 Gemini 2.5 Pro 模型能準確解析 PDF 文檔的視覺結構,實現精準的視覺引用功能,成為首款能完全理解 PDF 布局的 AI 模型。注:谷歌于 3 月 25 日向付費用戶和開發者發布 Gemi

4 月 22 日消息,最新報告指出,谷歌旗下的 Gemini 2.5 Pro 模型能準確解析 PDF 文檔的視覺結構,實現精準的視覺引用功能,成為首款能完全理解 PDF 布局的 AI 模型。ilz28資訊網——每日最新資訊28at.com

注:谷歌于 3 月 25 日向付費用戶和開發者發布 Gemini 2.5 Pro 實驗模型,僅隔 4 天時間,谷歌便通過免費 Web 應用向全球用戶開放。ilz28資訊網——每日最新資訊28at.com

Gemini 2.5 Pro 不僅能提取 PDF 文檔中的文本內容,還能理解其視覺布局,包括圖表、表格和整體排版。ilz28資訊網——每日最新資訊28at.com

谷歌在開發者文檔中表示,該模型具備“原生視覺”(Native Vision)能力,支持處理最多 3000 個 PDF 文件(每個文件上限為 1000 頁或 50MB),同時擁有 100 萬 token 的超大上下文窗口,未來計劃擴展至 200 萬 token。ilz28資訊網——每日最新資訊28at.com

AI 初創公司 Matrisk 的聯合創始人 Sergey Filimonov 特別贊揚了 Gemini 2.5 Pro 在 PDF 視覺引用上的表現。ilz28資訊網——每日最新資訊28at.com

Filimonov 指出,傳統的文本分割方法會切斷用戶與原文的視覺聯系,導致無法直觀驗證信息的來源。甚至在 ChatGPT 中,點擊引用也只能下載 PDF,迫使用戶自行判斷模型是否“幻覺”,這嚴重損害了用戶信任。ilz28資訊網——每日最新資訊28at.com

過去,引用文檔內容往往只能高亮大段無關文本,精準度極低。Gemini 2.5 徹底改變這一現狀,它不僅能將提取的文本片段映射回原始 PDF 的確切位置,還能以前所未有的精度鎖定特定句子、表格單元甚至圖像。ilz28資訊網——每日最新資訊28at.com

這種技術突破為用戶提供了直觀的視覺反饋,例如在詢問房屋費率變化時,系統能直接高亮文檔中相關數據(如 15.4% 的費率變化),并標注來源依據。ilz28資訊網——每日最新資訊28at.com

這種清晰度和交互性是現有工具無法企及的。Gemini 2.5 不僅優化了現有流程,更開啟了全新的文檔交互模式。ilz28資訊網——每日最新資訊28at.com

ilz28資訊網——每日最新資訊28at.com

相比之下,Gemini 2.5 以 0.804 的 IoU(交并比)精度大幅領先其他模型,如 OpenAI 的 GPT-4o(0.223)和 Claude 3.7 Sonnet(0.210),展現出驚人的空間理解能力。ilz28資訊網——每日最新資訊28at.com

提供商模型IOU簡評Gemini2.5 Pro0.804非常優秀Gemini2.5 Flash0.614有時表現不錯Gemini2.0 Flash0.395OpenAIgpt-4o0.223OpenAIgpt-4.10.268OpenAIgpt-4.1-mini0.253Claude3.7 Sonnet0.210

Gemini 2.5 的潛力遠不止于文本定位。它還能從 PDF 中提取結構化數據,同時明確標注每個數據的來源位置,解決下游決策中因數據來源不明而產生的信任障礙。ilz28資訊網——每日最新資訊28at.com

ilz28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12558-0.html力壓群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精確引用

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AI時代瀏覽器大戰:Chrome命運懸而未決,OpenAI欲收入囊中?

下一篇: 智能軟體仿生觀賞魚“金鱗”亮相,在水族館、公園有望“以假亂真”

標簽:
  • 熱門焦點
  • 新周期,誰在堅守窄門?

    來源:錦緞今日的投資者恐怕已經忘記了,在OpenAI創造出ChatGPT這一殺器的前夜,生成式AI也曾經是一道窄門,窄到連馬斯克都差點失去了信心。在當時的輿論眼中,AGI的道路不夠性感,不夠
  • 雷克薩斯高管,“受賄”5000萬?

    來源:毒舌科技作者:潘磊雷克薩斯的高管,好像出事了。五六家日本小媒體,突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元(約合人民幣5000
  • 從科幻走進現實,元宇宙概念逐漸清晰

    2021年,元宇宙概念如同一顆炸彈投進互聯網行業,掀起了一場數字海嘯,眾多企業紛紛入局,在此新領域展開新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻紅,元宇宙走進資本圈2021年3
  • 智能人機交互技術的春晚大考

    1月初的一個早晨,京東智能客戶服務產品部緊急開會,進行關于尚未對外公布的“X項目”的初討論。1月5日,這個神秘的X項目對外公布,京東成為央視2022年春晚獨家互動合
  • Meta、谷歌、微軟競相涌入元宇宙,小型企業該如何伺機而動?

    目前來看元宇宙不會影響到小型企業的發展,但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞,你一定或
  • 暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎?

    NFT Worlds 系列產品于 2021 年 10 月 5 日免費鑄造,該NFT系列是將傳統的中心化電子游戲minecraft 與去中心化資產相結合。傳統游戲Minecraft 對用戶定制非常開
  • a16z:元宇宙辦公會取代實體辦公室嗎?

    6位不同的專家對未來的工作發表看法----元宇宙--沉浸式的、基于區塊鏈的虛擬世界,大多數日常活動最終會在這里發生--但仍然只是一個概念。但它是一個擁有寶貴不
  • 知識產權可能在元宇宙中“消失”?

    開篇老雅痞先來劃重點:一些公司開始采取積極的方式來保護他們在元宇宙的知識產權。耐克、愛馬仕和米拉麥克斯最近提起訴訟,聲稱NFT侵犯了他們的知識產權。Inside
  • 超級賬本Julian Gordon:聯盟鏈與公鏈的競爭不是非此即彼

    在2021年《福布斯》區塊鏈50強榜單中,29家企業使用Hyperledger超級賬本技術,占比近60%。同年,研究機構Blockdata發布了的調查報告顯示,訪問Top100上市公司中,有 81
Top 主站蜘蛛池模板: 海淀区| 牙克石市| 苍南县| 安多县| 长岭县| 昌宁县| 浪卡子县| 项城市| 黄浦区| 茌平县| 宜川县| 长丰县| 濮阳县| 宝坻区| 舒城县| 苍梧县| 宜川县| 高邑县| 温泉县| 古田县| 沙洋县| 安义县| 晋江市| 凤阳县| 乌拉特后旗| 河曲县| 宁波市| 颍上县| 正蓝旗| 平安县| 中卫市| 南投县| 田东县| 射洪县| 禹城市| 策勒县| 涟源市| 乌鲁木齐市| 辉县市| 凤山市| 兴化市|