當(dāng)前位置：首頁(yè) > 元宇宙 > AI

面壁智能MiniCPM4：端側(cè)模型極限提速，8B性能超12B競(jìng)品引關(guān)注

來(lái)源：責(zé)編：時(shí)間：2025-06-09 09:39:16 84觀看

導(dǎo)讀在近期舉辦的2025智源大會(huì)上，面壁智能這家北京的大模型創(chuàng)新企業(yè)，推出了其開(kāi)源模型MiniCPM 4.0的兩個(gè)新版本，分別為0.5B和8B，內(nèi)部代號(hào)“前進(jìn)四”。這一發(fā)布引起了業(yè)內(nèi)廣泛關(guān)注。據(jù)悉，MiniCPM4-0.5B的訓(xùn)練成本僅為Qwen3-0.6B

在近期舉辦的2025智源大會(huì)上，面壁智能這家北京的大模型創(chuàng)新企業(yè)，推出了其開(kāi)源模型MiniCPM 4.0的兩個(gè)新版本，分別為0.5B和8B，內(nèi)部代號(hào)“前進(jìn)四”。這一發(fā)布引起了業(yè)內(nèi)廣泛關(guān)注。

據(jù)悉，MiniCPM4-0.5B的訓(xùn)練成本僅為Qwen3-0.6B的2.7%，卻以一半的參數(shù)量實(shí)現(xiàn)了性能翻倍，綜合得分平均分高達(dá)52.06分，遠(yuǎn)超同類模型。更為出色的是，面壁智能還推出了一個(gè)0.5B的三級(jí)量化版本，平均得分更是達(dá)到了56分，這一成績(jī)實(shí)屬不易。

而MiniCPM4-8B的表現(xiàn)同樣令人矚目。其訓(xùn)練開(kāi)銷僅為22%，并加入了長(zhǎng)上下文稀疏化版本，使得同等參數(shù)下性能更強(qiáng)。在同類端側(cè)模型排行榜中，MiniCPM4-8B的綜合得分甚至超越了Gemma3-12B，與Qwen3-8B比肩，位居榜首。

面壁智能CEO李大海在會(huì)上表示，MiniCPM4模型的最大特點(diǎn)就是速度快。在處理極端場(chǎng)景下的140K上下文時(shí)，需要極大的端側(cè)內(nèi)存。而在Jetson Orin AGX（64G）或RTX 4090（24G）硬件上運(yùn)行128K長(zhǎng)文本時(shí)，像Qwen3-8B這樣未進(jìn)行上下文稀疏化的模型，顯存往往不夠用，需要借助CPU內(nèi)存，這會(huì)導(dǎo)致速度急劇下降。而MiniCPM4-8B則通過(guò)快速稀疏化工作，將占用的低長(zhǎng)文本緩存降至1/4，在常規(guī)場(chǎng)景中至少可以取得3-5倍的速度優(yōu)勢(shì)。

李大海進(jìn)一步透露，在顯存受限的極限場(chǎng)景中，MiniCPM4的測(cè)試數(shù)據(jù)甚至可以達(dá)到220倍的速度提升。面壁智能的MiniCPM4-MCP模型在端側(cè)利用MCP協(xié)議，支持15個(gè)主流應(yīng)用，綜合評(píng)測(cè)表現(xiàn)得分頗高。而另一個(gè)MiniCPM4-Survey端側(cè)版則可在AI PC上構(gòu)建深度研究服務(wù)，成為離線可用的隨身研究報(bào)告工具，有助于保護(hù)本地隱私數(shù)據(jù)。

值得注意的是，面壁智能與英特爾緊密合作，首次在端側(cè)解鎖了128K長(zhǎng)上下文窗口。在英特爾平臺(tái)上，基于InfLLM 2.0稀疏注意力結(jié)構(gòu)，實(shí)現(xiàn)了3.8倍加速的推理優(yōu)化效果。同時(shí)，MiniCPM4已經(jīng)可以在華為昇騰、聯(lián)發(fā)科、高通等主流芯片上流暢運(yùn)行，并支持vLLM、AutoGPT等推理框架，歐拉版也正在積極適配中。

那么，面壁智能是如何實(shí)現(xiàn)MiniCPM4又快又好的表現(xiàn)的呢？李大海分享了背后的技術(shù)細(xì)節(jié)。他提到，這是行業(yè)首個(gè)全開(kāi)源系統(tǒng)級(jí)上下級(jí)稀疏化高效創(chuàng)新。MiniCPM4采用了InfLLM 2.0混合稀疏注意力結(jié)構(gòu)，通過(guò)分塊分區(qū)域處理文本，只對(duì)最具相關(guān)性的重點(diǎn)區(qū)域進(jìn)行注意力計(jì)算，從而大大提高了效率。同時(shí)，面壁智能還創(chuàng)新地采用了高效的自動(dòng)雙頻換擋技術(shù)，長(zhǎng)文本用稀疏方案，短文本用稠密方案，進(jìn)一步提升了性能。

在推理方面，面壁智能自研了全套端側(cè)高性能推理框架，包括實(shí)現(xiàn)稀疏、投機(jī)和量化的高效結(jié)合的CPM.cu，極致低位寬量化的BitCPM，以及面向多平臺(tái)端側(cè)芯片極致優(yōu)化的Arkinfer。這些創(chuàng)新使得MiniCPM4在端側(cè)的表現(xiàn)更加出色。

舉報(bào) 0收藏 0打賞 0評(píng)論 0

更多>同類資訊

AI助力高考志愿填報(bào)，夸克百度訊飛誰(shuí)更懂你的心？

06-07

數(shù)禾科技：自研反詐技術(shù)亮相網(wǎng)安博覽會(huì)，守護(hù)用戶數(shù)據(jù)安全獲好評(píng)

06-07

蘋(píng)果iPadOS 26大改版：新界面、手寫(xiě)筆升級(jí)，AI與應(yīng)用全面進(jìn)化！

06-07

喜臨門(mén)榮獲中國(guó)專利優(yōu)秀獎(jiǎng)，智能睡眠技術(shù)創(chuàng)新實(shí)力獲國(guó)家級(jí)認(rèn)可

06-07

小碼王與黑龍江工程學(xué)院強(qiáng)強(qiáng)聯(lián)手，打造信息學(xué)創(chuàng)新人才培育新高地

06-07

抖音重拳出擊：高考季嚴(yán)查AI押題、虛假志愿規(guī)劃等營(yíng)銷騙局

06-07

抖音高考護(hù)航：嚴(yán)查AI押題、作弊服務(wù)等違規(guī)行為

06-07

AI爭(zhēng)霸賽，谷歌何以從領(lǐng)跑者變追趕者？

Bard初期表現(xiàn)不佳，與ChatGPT存在明顯差距，未能贏得用戶和市場(chǎng)的廣泛認(rèn)可；看似能打的Gemini系列模型，實(shí)際使用卻引發(fā)不小爭(zhēng)議，圖像生成功能因出現(xiàn)種族偏見(jiàn)被迫下線；谷歌內(nèi)部，搜索、Android、…

06-07

抖音嚴(yán)打高考作弊與虛假營(yíng)銷，守護(hù)考生權(quán)益

06-07

AI高考作文大比拼：誰(shuí)才是真正的“狀元”之才？

06-07

2025高考作文大比拼，DeepSeek、豆包、文心一言誰(shuí)最亮眼？

它們不是悠揚(yáng)的牧歌，而是生命在重壓下迸發(fā)的絕唱，是靈魂在荊棘中綻放的薔薇，讓我們看見(jiàn)：真正的歌唱從不在于聲音的完美，而在于生命最本真的震顫。嫦娥四號(hào)傳回的每一張照片，都是人類向宇宙發(fā)出的詰問(wèn)與宣言，讓探索的火…

06-07

蘋(píng)果WWDC25或?qū)⒅赝朴螒驊?zhàn)略，AI能力進(jìn)展緩慢成隱憂？

06-07

Win11照片應(yīng)用大升級(jí)！AI光線調(diào)控與自然語(yǔ)義搜索來(lái)襲

06-07

周鴻祎豪言：?jiǎn)翁?60市場(chǎng)部，一人撐起新品發(fā)布會(huì)，AI智能體能否成真？

06-07

蘋(píng)果WWDC25或重推游戲戰(zhàn)略，AI進(jìn)展緩慢是背后原因？

06-07

點(diǎn)擊查看更多 +

全站最新

雷軍親證：購(gòu)買小米YU7，一視同仁需自費(fèi)

極氪001榮膺中國(guó)外觀設(shè)計(jì)金獎(jiǎng)，展現(xiàn)中國(guó)高端豪華新能源設(shè)計(jì)魅力

蘋(píng)果iPhone 17配置大曝光：120Hz屏幕、A18芯片等亮點(diǎn)搶先看

全球首位QQ256級(jí)用戶誕生，解鎖“時(shí)光企鵝”等級(jí)圖標(biāo)

東風(fēng)本田銷量斷崖式下滑，新能源戰(zhàn)略失誤成主因？

輕型動(dòng)力新紀(jì)元！全國(guó)首分鐘級(jí)超充產(chǎn)業(yè)聯(lián)盟廬江啟航

熱門(mén)內(nèi)容

榮耀“鯤鵬”照片事件真相大白，造謠者道歉遭刑拘
騰訊阿里AI to C戰(zhàn)場(chǎng)“雙吳”爭(zhēng)霸，誰(shuí)將問(wèn)鼎AI搜索之巔？
英偉達(dá)全球總部或?qū)⒙鋺糁袊?guó)臺(tái)灣，黃仁勛下周宣布這一重大決定？
教育部新規(guī)：學(xué)生禁直接復(fù)制AI作業(yè)，強(qiáng)化獨(dú)立思考與批判性思維
聯(lián)發(fā)科天璣9400e發(fā)布：天璣9300+升級(jí)版，藍(lán)牙升級(jí)至6.0
TIOBE 5月編程語(yǔ)言榜：Python強(qiáng)勢(shì)領(lǐng)跑，占比創(chuàng)歷史新高
中國(guó)知網(wǎng)CNKI AI：重塑知識(shí)服務(wù)新生態(tài)，四大核心力引領(lǐng)未來(lái)
中國(guó)GPU市場(chǎng)競(jìng)爭(zhēng)激烈，英偉達(dá)獨(dú)占7成，華為昇騰緊追其后！
華為Mate 40系列（5G）已支持5G-A網(wǎng)絡(luò)，性能再升級(jí)！
華為nova 14系列震撼登場(chǎng)！鴻蒙5直板機(jī)領(lǐng)銜，nova 14僅售2699元起
教育部新規(guī)：中小學(xué)分階段用AI，嚴(yán)禁復(fù)制答案強(qiáng)化獨(dú)立思考
華為nova14 Ultra震撼登場(chǎng)！鴻蒙5系統(tǒng)加持，售價(jià)4199元起
vivo領(lǐng)跑！2025第18周中國(guó)手機(jī)份額華為小米緊追其后
DeepSeek新論文揭秘：梁文鋒領(lǐng)銜探索AI訓(xùn)練推理成本效益之道
華為昇騰超節(jié)點(diǎn)技術(shù)突破：384卡高速互聯(lián)，引領(lǐng)AI模型訓(xùn)練新紀(jì)元

本欄最新

AI助力高考志愿填報(bào)，夸克百度訊飛誰(shuí)更懂你的心？

蘋(píng)果iPadOS 26大改版：新界面、手寫(xiě)筆升級(jí)，AI與應(yīng)用全面進(jìn)化！

喜臨門(mén)榮獲中國(guó)專利優(yōu)秀獎(jiǎng)，智能睡眠技術(shù)創(chuàng)新實(shí)力獲國(guó)家級(jí)認(rèn)可

小碼王與黑龍江工程學(xué)院強(qiáng)強(qiáng)聯(lián)手，打造信息學(xué)創(chuàng)新人才培育新高地

AI爭(zhēng)霸賽，谷歌何以從領(lǐng)跑者變追趕者？

AI高考作文大比拼：誰(shuí)才是真正的“狀元”之才？

本文鏈接：http://www.www897cc.com/showinfo-45-13565-0.html面壁智能MiniCPM4：端側(cè)模型極限提速，8B性能超12B競(jìng)品引關(guān)注

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：大模型高考作文比拼，騰訊墊底百度ChatGPT并列第一，幻覺(jué)問(wèn)題成關(guān)鍵

下一篇： AI助力高考志愿填報(bào)，夸克百度訊飛誰(shuí)更懂你的心？

標(biāo)簽：

熱門(mén)焦點(diǎn)

SQL Error: select * from ***_ecms_news13 where id in(203,14,182,139,155,75,114,,32) limit 9

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁(yè)

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

面壁智能MiniCPM4：端側(cè)模型極限提速，8B性能超12B競(jìng)品引關(guān)注

最新推薦

10億基金，李彥宏呼喚下一個(gè)AI獨(dú)角獸

這場(chǎng)虛擬人爭(zhēng)奪戰(zhàn)，互聯(lián)網(wǎng)巨頭下場(chǎng)先贏一半？

一個(gè)視頻漲粉百萬(wàn)，柳夜熙們能成為元宇宙的“船票”嗎？

網(wǎng)易音樂(lè)、理想申請(qǐng)?jiān)钪嫔虡?biāo)被駁回，“啫喱”暫停新用戶進(jìn)入

元宇宙社交時(shí)代，華麗歸來(lái)的超級(jí)QQ秀重構(gòu)虛擬社交場(chǎng)景

Terra鏈上TVL躍升至第二

猜你喜歡

熱門(mén)推薦

相關(guān)資訊