5 月 6 日消息,小米官方今日介紹了 Mi-BRAG 知識庫問答框架,該框架通過四大核心技術體系重構知識處理范式,已在公司多個場景中落地應用,包括小愛同學的個人信息問答、汽車問答助手、商品問答等。
全格式兼容:搭載智能解析引擎,可無損處理 PDF、Word、Excel 等十余種文檔格式,為企業構建統一知識庫奠定基礎;
全模態解析:突破傳統文本局限,精準解析復雜圖片、表格、圖文混排等多元信息;
多語種問答:支持主流語言的文檔解析與交互問答,打破知識流通的語種壁壘;
細粒度溯源:采用動態溯源定位技術,對每個生成結果標注原始文檔及引用位置,一鍵追溯信息源頭,構建可信知識生態。
小米官方介紹稱,大模型(LLM)雖具備強大的生成能力,但仍面臨諸多挑戰:知識更新成本高、企業私有知識理解不足、數據安全隱患等。RAG(Retrieval-Augmented Generation,檢索增強生成)技術的引入為這些問題提供了有效的解決方案。
彌補大模型的時新性:大模型基于歷史數據進行訓練,無法獲取最新信息。RAG 通過檢索最新的文檔或數據庫,可為生成過程注入實時信息,確保輸出內容的準確性與時效性;
增強特定領域知識的準確性:大模型基于互聯網公開數據,難以涵蓋特點領域或者企業私有知識。RAG 技術通過構建外部知識庫,實現特定知識注入,從而增強其在特定領域的表現;
數據隱私與安全性:大模型直接處理企業敏感數據(如內部文檔)可能引發隱私泄露風險。RAG 通過檢索階段調用私有數據庫(如本地化存儲的企業知識庫),在生成答案時僅基于檢索到的相關片段進行加工,避免原始數據被模型存儲或泄露。
小米在場景上 TOC(小愛個人信息問答、智能文檔問答等)和 TOB(集團內部提效:新產品研發、員工助手、智能客服)等大量應用場景亟須自研的 RAG 框架提供領域安全高可靠的智能知識中樞提升產品的智能化及用戶體驗。
小米大模型團隊認為,一個完整的知識問答框架應該包含如上圖所示的四個部分:知識庫創建(B)、知識檢索(R)、知識增強(A)和回復生成(G)。而知識庫創建(B)模塊其實特別重要,對問答效果會產生至關重要的影響,不應被忽視,所以小米大模型團隊將框架命名為 Mi-BRAG 。Mi-BRAG 支持多種格式文檔解析和圖文混合的多模態問答,為用戶提供更多應用選項。
在 RAG 的基礎框架下,自研框架 Mi-BRAG 的技術創新主要分布在:
知識庫創建(B):跨模態的知識融合及構建“金字塔型”動態知識體系等;
知識檢索(R-A):用戶 Query 理解的增強,多維語義增強等;
回復生成(G):為知識注入場景定制模型,強化無關信息的拒答、精細化的溯源的能力。
第三方評測機構 SuperCLUE 通過單文檔問答、多文檔問答及搜索問答三大典型場景的綜合評估,小米 2025 年 4 月在 SuperCLUE-RAG 生成能力評測中登上榜首。這主要歸功于 Mi-BRAG 在抗噪聲數據處理與信息整合方面的創新數據構建方法,以及其突破性的模型訓練范式。
ASQA 是一個長格式的事實類數據集,測試集中的每個問題,需要多個簡短答案來涵蓋對問題的不同解釋。因此,模型要綜合多份文件中的信息進行回答。小米團隊測試了 Mi-BRAG 和業界大模型在 ASQA 測試集上的表現,評測過程主要關注多文檔生成溯源準召率。
從小米官方公告獲悉,目前小米 Mi-BRAG 已在小愛同學個人信息問答,汽車問答助手,商品問答等場景落地,未來小米大模型團隊將持續攻堅端側算力優化與云邊協同架構,內存壓縮、功耗控制等關鍵技術領域實現突破;同時將深化多模態技術整合,打造覆蓋文本、語音、視覺的全模態智能問答體系,持續拓展智能家居、汽車問答等應用場景,全面賦能小米「人車家全生態」戰略體系。
本文鏈接:http://www.www897cc.com/showinfo-45-12742-0.html小米 Mi-BRAG 智能引擎亮相:用 AI 問答代替產品說明書,登上評測榜首
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: Kimi 長思考模型 API 發布