5 月 6 日消息,小米官方今日介紹了 Mi-BRAG 知識庫問答框架,該框架通過四大核心技術體系重構知識處理范式,已在公司多個場景中落地應用,包括小愛同學的個人信息問答、汽車問答助手、商品問答等。
全格式兼容:搭載智能解析引擎,可無損處理 PDF、Word、Excel 等十余種文檔格式,為企業(yè)構建統(tǒng)一知識庫奠定基礎;
全模態(tài)解析:突破傳統(tǒng)文本局限,精準解析復雜圖片、表格、圖文混排等多元信息;
多語種問答:支持主流語言的文檔解析與交互問答,打破知識流通的語種壁壘;
細粒度溯源:采用動態(tài)溯源定位技術,對每個生成結果標注原始文檔及引用位置,一鍵追溯信息源頭,構建可信知識生態(tài)。
小米官方介紹稱,大模型(LLM)雖具備強大的生成能力,但仍面臨諸多挑戰(zhàn):知識更新成本高、企業(yè)私有知識理解不足、數(shù)據(jù)安全隱患等。RAG(Retrieval-Augmented Generation,檢索增強生成)技術的引入為這些問題提供了有效的解決方案。
彌補大模型的時新性:大模型基于歷史數(shù)據(jù)進行訓練,無法獲取最新信息。RAG 通過檢索最新的文檔或數(shù)據(jù)庫,可為生成過程注入實時信息,確保輸出內容的準確性與時效性;
增強特定領域知識的準確性:大模型基于互聯(lián)網(wǎng)公開數(shù)據(jù),難以涵蓋特點領域或者企業(yè)私有知識。RAG 技術通過構建外部知識庫,實現(xiàn)特定知識注入,從而增強其在特定領域的表現(xiàn);
數(shù)據(jù)隱私與安全性:大模型直接處理企業(yè)敏感數(shù)據(jù)(如內部文檔)可能引發(fā)隱私泄露風險。RAG 通過檢索階段調用私有數(shù)據(jù)庫(如本地化存儲的企業(yè)知識庫),在生成答案時僅基于檢索到的相關片段進行加工,避免原始數(shù)據(jù)被模型存儲或泄露。
小米在場景上 TOC(小愛個人信息問答、智能文檔問答等)和 TOB(集團內部提效:新產(chǎn)品研發(fā)、員工助手、智能客服)等大量應用場景亟須自研的 RAG 框架提供領域安全高可靠的智能知識中樞提升產(chǎn)品的智能化及用戶體驗。
小米大模型團隊認為,一個完整的知識問答框架應該包含如上圖所示的四個部分:知識庫創(chuàng)建(B)、知識檢索(R)、知識增強(A)和回復生成(G)。而知識庫創(chuàng)建(B)模塊其實特別重要,對問答效果會產(chǎn)生至關重要的影響,不應被忽視,所以小米大模型團隊將框架命名為 Mi-BRAG 。Mi-BRAG 支持多種格式文檔解析和圖文混合的多模態(tài)問答,為用戶提供更多應用選項。
在 RAG 的基礎框架下,自研框架 Mi-BRAG 的技術創(chuàng)新主要分布在:
知識庫創(chuàng)建(B):跨模態(tài)的知識融合及構建“金字塔型”動態(tài)知識體系等;
知識檢索(R-A):用戶 Query 理解的增強,多維語義增強等;
回復生成(G):為知識注入場景定制模型,強化無關信息的拒答、精細化的溯源的能力。
第三方評測機構 SuperCLUE 通過單文檔問答、多文檔問答及搜索問答三大典型場景的綜合評估,小米 2025 年 4 月在 SuperCLUE-RAG 生成能力評測中登上榜首。這主要歸功于 Mi-BRAG 在抗噪聲數(shù)據(jù)處理與信息整合方面的創(chuàng)新數(shù)據(jù)構建方法,以及其突破性的模型訓練范式。
ASQA 是一個長格式的事實類數(shù)據(jù)集,測試集中的每個問題,需要多個簡短答案來涵蓋對問題的不同解釋。因此,模型要綜合多份文件中的信息進行回答。小米團隊測試了 Mi-BRAG 和業(yè)界大模型在 ASQA 測試集上的表現(xiàn),評測過程主要關注多文檔生成溯源準召率。
從小米官方公告獲悉,目前小米 Mi-BRAG 已在小愛同學個人信息問答,汽車問答助手,商品問答等場景落地,未來小米大模型團隊將持續(xù)攻堅端側算力優(yōu)化與云邊協(xié)同架構,內存壓縮、功耗控制等關鍵技術領域實現(xiàn)突破;同時將深化多模態(tài)技術整合,打造覆蓋文本、語音、視覺的全模態(tài)智能問答體系,持續(xù)拓展智能家居、汽車問答等應用場景,全面賦能小米「人車家全生態(tài)」戰(zhàn)略體系。
本文鏈接:http://www.www897cc.com/showinfo-45-12742-0.html小米 Mi-BRAG 智能引擎亮相:用 AI 問答代替產(chǎn)品說明書,登上評測榜首
聲明:本網(wǎng)頁內容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
下一篇: 消息稱 AI 編程工具 Cursor 開發(fā)商 Anysphere 完成 9 億美元融資,估值達 90 億美元