當前位置：首頁 > 元宇宙 > AI

百度發布新一代文字識別 AI 模型 PP-OCRv5：僅 0.07B，部分測試超 GPT-4o

來源：責編：時間：2025-09-16 16:49:04 34觀看

導讀 IT 之家 9 月 13 日消息，百度于 9 月 10 日在 Hugging Face 發布新一代文字識別解決方案 PP-OCRv5。百度介紹稱，PP-OCRv5 是一個為緩解大型視覺語言模型（VLMs）局限性而設計的專用 OCR 模型，它提供了一種高效、準確

IT 之家 9 月 13 日消息，百度于 9 月 10 日在 Hugging Face 發布新一代文字識別解決方案 PP-OCRv5。

百度介紹稱，PP-OCRv5 是一個為緩解大型視覺語言模型（VLMs）局限性而設計的專用 OCR 模型，它提供了一種高效、準確且輕量級的解決方案。

PP-OCRv5 通過保持模塊化、兩階段的流程，專門針對高速、精確的文本檢測和識別，解決了大型 VLMs 的精確文本定位和邊界框精度局限性問題。

PP-OCRv5 的亮點如下：

效率：該模型參數量僅為 0.07B，能夠在 CPU 和邊緣設備上實現更高性能，其移動版本在英特爾 Xeon Gold 6271C CPU 上每秒可處理超過 370 個字符。

性能：PP-OCRv5 在 OCR 特定基準測試中優于通用型 VLM 模型，如 Gemini 2.5 Pro、Qwen2.5-VL 和 GPT-4o，包括手寫和印刷的中英文以及拼音文本。

定位：PP-OCRv5 旨在提供精確的文本行邊界框坐標，這對于結構化數據提取和內容分析是關鍵要求。

多語言支持：該模型支持五種文字類型 —— 簡體中文、繁體中文、英文、日文和拼音，并能識別超過 40 種語言。

PP-OCRv5 由四個核心組件構成：

圖像預處理：處理圖像的旋轉和畸變，以標準化輸入。

文本檢測：識別圖像中文本行的精確位置。

文本行方向：分類檢測到的文本方向，以確保其正確對齊以進行識別。

文本識別：將每行文本中的字符解碼為文本字符串。

IT 之家附 PP-OCRv5 下載地址如下：

https://huggingface.co/collections/PaddlePaddle/pp-ocrv5-684a5356aef5b4b1d7b85e4b

本文鏈接：http://www.www897cc.com/showinfo-45-27580-0.html百度發布新一代文字識別 AI 模型 PP-OCRv5：僅 0.07B，部分測試超 GPT-4o

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：北京：1400 多所中小學已開設人工智能通識課，每學年不少于 8 個課時

下一篇： OpenAI 奧爾特曼稱 AI 給自己帶來重壓：ChatGPT 上線后就沒睡過一個好覺

標簽：

熱門焦點

《從營銷AIGC化到AIGC營銷化》報告發布

來源：清元宇宙7月2日上午，清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中，清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
VR/AR迷失元宇宙“硝煙”

不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣，又隨著元宇宙回歸平靜。1月份，微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員，其中負責混合現實硬件（MR）的Holo
時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

想象一個你的數字身份與現實身份同樣重要的世界。想象一個你需要為虛擬自我準備資產和物資的地方——你需要金錢（Crypto）、房屋（可能建在Minecraft上）和衣物。隨著
紐約街頭出現NFT自動販賣機

一家初創公司宣布在紐約市開放一臺NFT自動售貨機，允許任何人——即使是沒有加密資產的人也能購買NFT。該交易平臺名為Neon，上個月完成了一輪300萬美元的種子募捐
「國產良心」NFT嘲諷了誰？

2月23日，一個名為「國產良心」的NFT項目被許多活躍的加密用戶注意到。該項目的官網風格尤為「不正經」，它絲毫沒有避諱自己的小作坊出身，還將「中國人不騙中國人
NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

Block-806NFT的增長值得關注。許多人愿意為數字藝術支付數百萬美元，世界正在走向數字化。報告顯示，NFT市場和NFT收藏從2020年的1.06億美元增加到了2021年的442億
紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

2 月 22 日，紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布，它將持有私人數字證券市場 tZERO 的所有權。根據公告，ICE 將成為 tZero 的“重要”少數股東，但
元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

GameFi=Game（游戲）+DEFI（去中心化金融），核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能，GameFi 游戲資產化身為NFT 和代幣上鏈，具備了可驗證性和流通性；開
在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最近一段時間，豆瓣可謂命途多舛：APP屢次下架，平臺也被相關部門約談、處罰，國家網信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續關閉“小組”功能：這個曾經小

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

百度發布新一代文字識別 AI 模型 PP-OCRv5：僅 0.07B，部分測試超 GPT-4o

《從營銷AIGC化到AIGC營銷化》報告發布

VR/AR迷失元宇宙“硝煙”

時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

紐約街頭出現NFT自動販賣機

「國產良心」NFT嘲諷了誰？

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最新推薦

藍標虧錢、Meta裁員：天下秀還值得砸錢元宇宙嗎？

林俊杰、余文樂等明星相繼入局，元宇宙虛擬土地究竟有何魔力？

本周NFT領域重要資訊回顧

對諷刺無動于衷，Nori將碳市場放在區塊鏈上

NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

Meta 呼吁行業合作建立元宇宙網絡基礎設施

猜你喜歡

熱門推薦

相關資訊

百度發布新一代文字識別 AI 模型 PP-OCRv5：僅 0.07B，部分測試超 GPT-4o

最新推薦

猜你喜歡

熱門推薦

相關資訊

百度發布新一代文字識別 AI 模型 PP-OCRv5：僅 0.07B，部分測試超 GPT-4o