日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

力壓群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精確引用

來源: 責(zé)編: 時(shí)間:2025-04-24 14:45:58 45觀看
導(dǎo)讀 4 月 22 日消息,最新報(bào)告指出,谷歌旗下的 Gemini 2.5 Pro 模型能準(zhǔn)確解析 PDF 文檔的視覺結(jié)構(gòu),實(shí)現(xiàn)精準(zhǔn)的視覺引用功能,成為首款能完全理解 PDF 布局的 AI 模型。注:谷歌于 3 月 25 日向付費(fèi)用戶和開發(fā)者發(fā)布 Gemi

4 月 22 日消息,最新報(bào)告指出,谷歌旗下的 Gemini 2.5 Pro 模型能準(zhǔn)確解析 PDF 文檔的視覺結(jié)構(gòu),實(shí)現(xiàn)精準(zhǔn)的視覺引用功能,成為首款能完全理解 PDF 布局的 AI 模型。qEl28資訊網(wǎng)——每日最新資訊28at.com

注:谷歌于 3 月 25 日向付費(fèi)用戶和開發(fā)者發(fā)布 Gemini 2.5 Pro 實(shí)驗(yàn)?zāi)P?,僅隔 4 天時(shí)間,谷歌便通過免費(fèi) Web 應(yīng)用向全球用戶開放。qEl28資訊網(wǎng)——每日最新資訊28at.com

Gemini 2.5 Pro 不僅能提取 PDF 文檔中的文本內(nèi)容,還能理解其視覺布局,包括圖表、表格和整體排版。qEl28資訊網(wǎng)——每日最新資訊28at.com

谷歌在開發(fā)者文檔中表示,該模型具備“原生視覺”(Native Vision)能力,支持處理最多 3000 個(gè) PDF 文件(每個(gè)文件上限為 1000 頁或 50MB),同時(shí)擁有 100 萬 token 的超大上下文窗口,未來計(jì)劃擴(kuò)展至 200 萬 token。qEl28資訊網(wǎng)——每日最新資訊28at.com

AI 初創(chuàng)公司 Matrisk 的聯(lián)合創(chuàng)始人 Sergey Filimonov 特別贊揚(yáng)了 Gemini 2.5 Pro 在 PDF 視覺引用上的表現(xiàn)。qEl28資訊網(wǎng)——每日最新資訊28at.com

Filimonov 指出,傳統(tǒng)的文本分割方法會(huì)切斷用戶與原文的視覺聯(lián)系,導(dǎo)致無法直觀驗(yàn)證信息的來源。甚至在 ChatGPT 中,點(diǎn)擊引用也只能下載 PDF,迫使用戶自行判斷模型是否“幻覺”,這嚴(yán)重?fù)p害了用戶信任。qEl28資訊網(wǎng)——每日最新資訊28at.com

過去,引用文檔內(nèi)容往往只能高亮大段無關(guān)文本,精準(zhǔn)度極低。Gemini 2.5 徹底改變這一現(xiàn)狀,它不僅能將提取的文本片段映射回原始 PDF 的確切位置,還能以前所未有的精度鎖定特定句子、表格單元甚至圖像。qEl28資訊網(wǎng)——每日最新資訊28at.com

這種技術(shù)突破為用戶提供了直觀的視覺反饋,例如在詢問房屋費(fèi)率變化時(shí),系統(tǒng)能直接高亮文檔中相關(guān)數(shù)據(jù)(如 15.4% 的費(fèi)率變化),并標(biāo)注來源依據(jù)。qEl28資訊網(wǎng)——每日最新資訊28at.com

這種清晰度和交互性是現(xiàn)有工具無法企及的。Gemini 2.5 不僅優(yōu)化了現(xiàn)有流程,更開啟了全新的文檔交互模式。qEl28資訊網(wǎng)——每日最新資訊28at.com

qEl28資訊網(wǎng)——每日最新資訊28at.com

相比之下,Gemini 2.5 以 0.804 的 IoU(交并比)精度大幅領(lǐng)先其他模型,如 OpenAI 的 GPT-4o(0.223)和 Claude 3.7 Sonnet(0.210),展現(xiàn)出驚人的空間理解能力。qEl28資訊網(wǎng)——每日最新資訊28at.com

提供商模型IOU簡(jiǎn)評(píng)Gemini2.5 Pro0.804非常優(yōu)秀Gemini2.5 Flash0.614有時(shí)表現(xiàn)不錯(cuò)Gemini2.0 Flash0.395OpenAIgpt-4o0.223OpenAIgpt-4.10.268OpenAIgpt-4.1-mini0.253Claude3.7 Sonnet0.210

Gemini 2.5 的潛力遠(yuǎn)不止于文本定位。它還能從 PDF 中提取結(jié)構(gòu)化數(shù)據(jù),同時(shí)明確標(biāo)注每個(gè)數(shù)據(jù)的來源位置,解決下游決策中因數(shù)據(jù)來源不明而產(chǎn)生的信任障礙。qEl28資訊網(wǎng)——每日最新資訊28at.com

qEl28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12558-0.html力壓群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精確引用

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: AI時(shí)代瀏覽器大戰(zhàn):Chrome命運(yùn)懸而未決,OpenAI欲收入囊中?

下一篇: 智能軟體仿生觀賞魚“金鱗”亮相,在水族館、公園有望“以假亂真”

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 主站蜘蛛池模板: 湖州市| 会泽县| 光山县| 界首市| 定远县| 黄大仙区| 镶黄旗| 大方县| 察哈| 东宁县| 泰来县| 呼图壁县| 七台河市| 墨竹工卡县| 巫溪县| 广丰县| 措勤县| 朝阳市| 龙井市| 裕民县| 永泰县| 来凤县| 廉江市| 获嘉县| 桐城市| 茌平县| 凉城县| 张家港市| 深水埗区| 南京市| 乌兰察布市| 柏乡县| 永城市| 中江县| 札达县| 上思县| 辽中县| 新竹市| 南城县| 庄河市| 措美县|