日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

面壁智能發布端側大模型“前進四”MiniCPM 4.0,號稱性能大小王

來源: 責編: 時間:2025-06-10 09:16:05 19觀看
導讀 6 月 7 日消息,面壁智能 6 日晚發布端側大模型 MiniCPM 4.0。該公司稱新模型通過自研 CPM.cu 推理框架,在極限場景下實現最高 220 倍提速,常規 5 倍提速,支持在 vLLM、SGLang、LlamaFactory 等框架部署。此次發布

6 月 7 日消息,面壁智能 6 日晚發布端側大模型 MiniCPM 4.0。該公司稱新模型通過自研 CPM.cu 推理框架,在極限場景下實現最高 220 倍提速,常規 5 倍提速,支持在 vLLM、SGLang、LlamaFactory 等框架部署。wMD28資訊網——每日最新資訊28at.com

wMD28資訊網——每日最新資訊28at.com

此次發布的一款 8B 閃電稀疏版,采用創新稀疏架構掀起高效風暴;另一款 0.5B 則被稱作“輕巧靈動的最強小小鋼炮”。wMD28資訊網——每日最新資訊28at.com

據官方介紹,此次面壁推出的 MiniCPM 4.0 系列 LLM 模型擁有 8B、0.5B 兩種參數規模,針對單一架構難以兼顧長、短文本不同場景的技術難題,MiniCPM 4.0-8B 采用「高效雙頻換擋」機制,能夠根據任務特征自動切換注意力模式:在處理高難度的長文本、深度思考任務時,啟用稀疏注意力以降低計算復雜度,在短文本場景下切換至稠密注意力以確保精度,實現了長、短文本切換的高效響應。wMD28資訊網——每日最新資訊28at.com

wMD28資訊網——每日最新資訊28at.com

wMD28資訊網——每日最新資訊28at.com

據了解,MiniCPM 4.0 可在 vLLM、SGLang、LlamaFactory、XTuner 等開源框架部署。其內置自研 CPM.cu 極速端側推理框架,從投機采樣創新、模型壓縮量化創新、端側部署框架創新幾方面,帶來 90% 的模型瘦身和速度提升,官方宣稱將實現端側推理“從天生到終生”的絲滑。wMD28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-13568-0.html面壁智能發布端側大模型“前進四”MiniCPM 4.0,號稱性能大小王

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 香港特區政府將資助逾百億港元發展人工智能

下一篇: 每天自動獲取日歷郵件摘要:谷歌 Gemini 安卓版應用新增“Scheduled Actions”功能

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 邓州市| 开原市| 株洲市| 沂水县| 彰武县| 鄄城县| 密云县| 三江| 营山县| 兖州市| 永昌县| 瓦房店市| 宁强县| 桦川县| 会宁县| 阿拉尔市| 和龙市| 剑河县| 建昌县| 通榆县| 河西区| 左权县| 余干县| 渑池县| 莆田市| 平潭县| 上蔡县| 遂川县| 江北区| 玛曲县| 西充县| 漠河县| 湖口县| 磐石市| 志丹县| 临武县| 台前县| 浪卡子县| 安达市| 邹平县| 潞城市|