3 月 16 日消息,百度今日正式發布文心大模型 4.5 和文心大模型 X1,兩款模型已在文心一言官網上線,免費向用戶開放。
文心大模型 4.5 已上線百度智能云千帆大模型平臺,企業用戶和開發者登錄即可調用 API;文心大模型 X1 也即將在千帆上線,百度搜索、文小言 App 等產品也將陸續接入文心大模型 4.5 和文心大模型 X1。
據了解,文心大模型 4.5 是百度首個原生多模態大模型,在多模態理解、文本和邏輯推理等方面有顯著提升,多項測試表現優于 GPT4.5,API 調用價格僅為 GPT4.5 的 1%;文心大模型 X1 則是一款性能上對標 DeepSeek-R1 的深度思考模型,同時還支持多模態、多工具調用能力,API 調用價格約為 R1 的一半。
官方表示,文心大模型 4.5 具備如下關鍵技術:
FlashMask 動態注意力掩碼:加速大模型靈活注意力掩碼計算,有效提升長序列建模能力和訓練效率,優化長文處理能力和多輪交互表現;
多模態異構專家擴展技術:根據模態特點構建模態異構專家,結合自適應模態感知損失函數,解決不同模態梯度不均衡問題,提升多模態融合能力;
時空維度表征壓縮技術:在時空維度對圖片和視頻的語義表征進行高效壓縮,大幅提升多模態數據訓練效率,增強了從長視頻中吸取世界知識的能力;
基于知識點的大規模數據構建技術:基于知識分級采樣、數據壓縮與融合、稀缺知識點定向合成技術,構建高知識密度預訓練數據,提升模型學習效率,大幅降低模型幻覺;
基于自反饋的 Post-training 技術:融合多種評價方式的自反饋迭代式后訓練技術,全面提升強化學習穩定性和魯棒性,大幅提升預訓練模型對齊人類意圖能力。
文心大模型 X1 則具備如下技術:
遞進式強化學習訓練方法:創新性地應用遞進式強化學習方法,在創作、搜索、工具調用、推理等場景全面提升模型的綜合應用能力;
基于思維鏈和行動鏈的端到端訓練:針對深度搜索、工具調用等場景,根據結果反饋進行端到端的模型訓練,顯著提升訓練效果;
多元統一的獎勵系統:建立了統一的獎勵系統,融合多種類型的獎勵機制,為模型訓練提供更加魯棒的反饋。
據此前報道,在百度 2024 年 Q4 及全年財報電話會上,百度創始人、董事長兼首席執行官李彥宏透露,文心大模型 4.5 將開源,4.5 將是百度有史以來最強大的大模型,“希望客戶和用戶能比之前更方便地體驗這款模型”。
百度更早前曾表示,隨著文心大模型的迭代升級和成本不斷下降,文心一言將于 4 月 1 日零時起全面免費,所有 PC 端和 App 端用戶均可體驗文心系列最新模型。此外,即日起,文心一言上線深度搜索功能;該功能也將于 4 月 1 日起免費開放使用。
本文鏈接:http://www.www897cc.com/showinfo-45-11553-0.html百度發布“史上最強”文心大模型 4.5 及支持深度思考的文心大模型 X1,免費開放
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com