當前位置：首頁 > 元宇宙 > AI

面壁智能推出 MiniCPM-Llama3-V 2.5 開源端側多模態模型：8B 參數、高效部署手機

來源：責編：時間：2024-05-23 17:06:22 225觀看

導讀 5 月 21 日消息，面壁智能昨晚推出并開源 MiniCPM 系列最新的端側多模態模型 MiniCPM-Llama3-V 2.5，支持 30+ 種語言，宣稱可實現：最強端側多模態綜合性能：超越 Gemini Pro 、GPT-4VOCR 能力 SOTA（注：State-of-the-Art

5 月 21 日消息，面壁智能昨晚推出并開源 MiniCPM 系列最新的端側多模態模型 MiniCPM-Llama3-V 2.5，支持 30+ 種語言，宣稱可實現：

最強端側多模態綜合性能：超越 Gemini Pro 、GPT-4V

OCR 能力 SOTA（注：State-of-the-Art）：9 倍像素更清晰，難圖長圖長文本精準識別

圖像編碼快 150 倍：首次端側系統級多模態加速

▲OpenCompass 模型量級對比

MiniCPM-Llama3-V 2.5 總參數量為 8B，多模態綜合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用閉源模型，OCR 能力及指令跟隨能力得到進一步提升，可精準識別難圖、長圖、長文本，并支持超過 30 種語言的多模態交互。

▲官方測試結果

在 OpenCompass 測試中，MiniCPM-Llama3-V 2.5綜合性能超越多模態“巨無霸”GPT-4V 和 Gemini Pro；在 OCRBench 上，超越了 GPT-4o、GPT-4V、Claude 3V Opus、Gemini Pro 等標桿模型。

▲OpenCompass 測試

▲OCRBench 測試

▲Object HalBench 測試

▲RealWorldQA 測試

此外，在圖像編碼方面，MiniCPM-Llama3-V 2.5 首次整合 NPU 和 CPU 加速框架，并結合顯存管理、編譯優化技術，實現了 150 倍加速提升。

在語言模型推理方面，經過 CPU、編譯優化、顯存管理等優化方式，MiniCPM-Llama3-V 2.5 在手機端的語言解碼速度由 Llama 3 的 0.5 token / s 上下提升到 3-4 token / s，并可支持 30 多種語言，包括德語、法語、西班牙語、意大利語、俄語等主流語言，基本覆蓋一帶一路國家。

▲LLaVABench 評測結果

OCR 技術方面，MiniCPM-Llama3-V 2.5 實現高效編碼及無損識別 180 萬高清像素圖片，并且支持任意長寬比、甚至 1:9 極限比例圖像。

本文鏈接：http://www.www897cc.com/showinfo-45-4381-0.html面壁智能推出 MiniCPM-Llama3-V 2.5 開源端側多模態模型：8B 參數、高效部署手機

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌 DeepMind 推出 AI 安全框架 Frontier Safety Framework，可檢測優化降低大模型風險性

下一篇：振興鄉村發展助力青少年教育中國三星連續十一年蟬聯企業社會責任榜外企第一

標簽：

熱門焦點

人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯網圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯網巨頭展現
冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

“兩日上漲千倍”并不存在，且冰墩墩NFT的市場熱度遠不及社交媒體所稱的那樣高。2月11日，獲得國際奧委會授權的2022冬奧會吉祥物冰墩墩相關NFT產品在nWayPlay上線
中國區塊鏈產業生態地圖報告（2021）

區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新，以服務實體經濟、政務民生以及公共服務等領域為落腳點，以期實現整個地區和產業的資
2021年中國智慧城市行業概覽：AI慧眼獨具，賦能“雙碳”目標

中國智慧城市試點項目主要集中于東南地區以及華中地區，受制于應用場景分散以及行業地域建設差異，目前中國智慧城市存在較多弊端，未來數量有望持續突破。中國智慧
索尼公布PSVR 2頭顯渲染圖；社區開發者發布Quest版《我的世界》

近日熱點：索尼正式公布PSVR 2頭顯及控制器官方渲染圖；入局元宇宙，鴻海科技與XRSPACE簽訂合作備忘錄；研究人員表示面部追蹤可增強VR操控體驗；社區開發者QuestCraft發
以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

作者：三黎過去的一年里，除了 BTC 一如既往穩坐王位，DEFI 則是貫穿一整年的狂歡熱點。 DeFi 在讓 ETH 實現價值增長的同時，也使得其網絡日漸擁堵、交易費用增高，成為
Meta 在衰落嗎？

扎克伯格已經很久沒有出現在公眾視野里了，近日，他罕見的接受播客采訪，在兩個小時的時間里暢談了Meta、Facebook、Instagram、元宇宙的未來。正方觀點：是的阿倫·達
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
淺聊DAO圖景和未來

DAO是什么？DAO (Decentralized Autonomous Organizations),去中心化自治組織，是基于區塊鏈技術，由社區通過透明的決策過程運行和管理的組織形態。DAO使得社區成為

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

面壁智能推出 MiniCPM-Llama3-V 2.5 開源端側多模態模型：8B 參數、高效部署手機

人間誠實周鴻祎：360 All in 大模型的六個解讀

冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

中國區塊鏈產業生態地圖報告（2021）

2021年中國智慧城市行業概覽：AI慧眼獨具，賦能“雙碳”目標

索尼公布PSVR 2頭顯渲染圖；社區開發者發布Quest版《我的世界》

以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

Meta 在衰落嗎？

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

淺聊DAO圖景和未來

最新推薦

中國虛擬數字人如何橫向拓展市場需求，探索發展場景?

Meta元宇宙女性安全問題頻發，元宇宙中相關問題該如何解決？

美國一區塊鏈風投公司宣布成立2.5億美元web3投資新基金

吸金31億美元，誰在催火2021年的鏈游？

美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

這場虛擬發布會，當面“造假”！

猜你喜歡

熱門推薦

相關資訊