當前位置：首頁 > 科技 > 軟件

豆包 1.5?深度思考模型發布！效果好、低延遲、多模態

來源：責編：時間：2025-04-18 06:47:48 87觀看

導讀隨著 AI 技術的快速發展，AI 已從過去的感知 AI、生成式 AI，快速邁入 Agentic AI 時代。AI 正在進化出端到端的自主決策和執行能力，走向核心生產環節。火山引擎總裁譚待今天，在 FORCE LINK AI 創新巡展?杭州站，火

隨著 AI 技術的快速發展，AI 已從過去的感知 AI、生成式 AI，快速邁入 Agentic AI 時代。AI 正在進化出端到端的自主決策和執行能力，走向核心生產環節。

火山引擎總裁譚待

今天，在 FORCE LINK AI 創新巡展?杭州站，火山引擎公布了模型、Agent 工具、云基礎設施的最新進展，旨在幫助企業更快、更省地構建和部署 Agent 應用：發布豆包 1.5?深度思考模型，升級豆包?文生圖模型 3.0、豆包?視覺理解模型。同時，面向 Agent 服務，發布 OS Agent 解決方案、GUI Agent 大模型 —— 豆包 1.5?UI-TARS 模型；面向大規模推理，發布 AI 云原生?ServingKit 推理套件。

截至 2025 年 3 月底，豆包大模型日均 tokens 調用量已超過 12.7 萬億，是 2024 年 12 月的 3 倍，是一年前剛剛發布時的 106 倍。IDC 報告顯示，2024 年中國公有云大模型調用量激增，火山引擎以 46.4% 的市場份額位居中國市場第一。

深度思考模型能夠讓 AI 模擬人類的思維過程，對復雜問題進行精準分析和邏輯推導。

全新發布的豆包 1.5?深度思考模型，在數學、代碼、科學等專業領域推理任務中表現出色，已經達到或接近全球第一梯隊水平；在創意寫作等非推理任務中，模型也展示出優秀的泛化能力，能夠勝任更廣泛和復雜的使用場景。

為了提升模型的通用能力，模型團隊優化了數據處理策略，把可驗證數據與創意性數據進行融合處理，滿足各類任務的需求。此外，大規模強化學習是訓練推理模型的關鍵技術，通過采用創新的雙軌獎勵機制，兼顧“對錯分明”和“見仁見智”的任務，有效實現了算法的可靠優化。

豆包 1.5?深度思考模型采用 MoE 架構，總參數為 200B，激活參數僅 20B，具備顯著的訓練和推理成本優勢。基于高效算法，豆包 1.5?深度思考模型在提供行業極高并發承載能力的同時，實現 20 毫秒極低延遲。

在解決生活生產中的具體問題時，大模型要能夠查詢互聯網信息，進行多輪搜索和思考。與其他推理模型“先搜索再思考”的模式不同，豆包 App 基于豆包 1.5?深度思考模型進行了定向訓練，可以“邊想邊搜”。

例如，讓豆包 App 推薦露營裝備：一對夫妻帶兩個孩子去露營，溫度低，有雨，希望把裝備買齊，預算 4,000 元以內，還要兼顧便攜性和安全性。豆包 1.5?深度思考模型可以拆解每個具體需求的注意事項，規劃信息，然后經過 3 輪搜索，給出了預算范圍內、細致周到的推薦。

此外，豆包 1.5?深度思考模型還具備視覺理解能力，可以像人類一樣，不光基于文字思考，更能基于所見畫面思考，思考更立體，讓模型同時擁有“大腦”和“眼睛”。

更好的模型性能、更低的延遲、加上視覺推理能力，將為深度思考模型打開更廣泛的應用空間、解決更復雜的問題。即日起，企業用戶可以在火山方舟平臺使用豆包 1.5?深度思考模型。

此次全新升級的豆包?文生圖模型 3.0，能夠實現更好的文字排版表現、實拍級的圖像生成效果，以及 2K 的高清圖片生成方式。可以廣泛應用于影視、海報、繪畫、玩偶設計等營銷、電商、設計場景。

小字與長文本生成、排版更美觀

在最新的文生圖領域權威榜單 Artificial Analysis 競技場中，豆包?文生圖 3.0 模型已超越業界諸多主流模型，排名全球第一梯隊。

新版本的豆包?視覺理解模型具備更強的視覺定位能力，支持多目標、小目標、通用目標的框定位和點定位，并支持定位計數、描述定位內容、3D 定位。可應用于線下門店的巡檢場景、GUI agent、機器人訓練、自動駕駛訓練等。

同時，新版本在視頻理解能力上也有大幅提升，比如記憶、總結理解、速度感知、長視頻理解等。豆包?視覺理解模型結合向量搜索，可直接對視頻進行語義搜索，廣泛適用于安防、家庭看護等商業化場景。

更強的模型為我們打開了更廣闊的應用空間。未來，AI Agent 將同時在“應用 Agent”和“OS Agent”兩個方向上并行發展。

應用 Agent 具備更強的專業性，如客服 Agent、數據 Agent、代碼 Agent 等，可以專注于完成特定領域的任務。

比如在代碼 Agent 領域，相比于傳統的 AI 插件產品，國內首個 AI IDE（AI 原生的集成開發環境工具）——Trae 可以讓開發者和 AI 更智能的協作，實現軟件開發的交付化（交付軟件而不僅是代碼）、智能化（意圖理解-自主規劃-調用工具-自主開發）、協作化（與用戶在各個維度上進行協作）。

OS Agent 則擁有跨場景的通用性和靈活性，能夠直接操作瀏覽器、電腦、手機或其他 Agent，完成復雜任務。今年 Manus 等通用 Agent 的火爆也點燃了市場對 OS Agent 的熱情。

大會上，火山引擎正式發布 OS Agent 解決方案，未來兩周將陸續上線火山引擎官網。

該解決方案通過火山引擎 veFaaS 平臺對豆包大模型能力進行封裝，可以讓企業和開發者輕松構建輕量級的 Code use 和 Browser use。而針對任務相對復雜的 Computer Use 和 Mobile Use Agent，則可以通過 ECS 或云手機等調用豆包 1.5?UI-TARS 模型，驅動圖形用戶界面交互，精準識別用戶的任務需求，進行感知、自主推理并準確行動。

想做出好的 Agent 同樣離不開好的大模型。針對復雜的 OS Agent，火山引擎正式發布 GUI Agent 大模型 —— 豆包 1.5?UI-TARS 模型。該模型將屏幕視覺理解、邏輯推理、界面元素定位和操作整合在單一模型中，突破了傳統自動化工具依賴預設規則的局限。目前，豆包 1.5?UI-TARS 模型已在火山方舟平臺上線。

好的模型和工具能夠加速 Agent 的落地，但 Agent 也會帶來更大量的推理消耗，因此 AI 時代需要更好的云原生架構來支持。

為此，火山引擎推出 ServingKit 推理套件，幫助企業實現模型的快速部署、推理優化、運維可觀測。

ServingKit 推理套件可在 2 分鐘內完成 671B DeepSeek R1 下載和預熱，13 秒完成推理引擎的加載。

同時，為了降低推理過程中的時延、提高資源利用率，火山引擎 EIC 將KV cache 命中率提高了 10 倍，在 100% cache 命中場景下TPS 吞吐量可提高至 5 倍以上；而通過對算子、AI 網關、VKE 編排調度的優化和升級，可以大幅度降低 GPU 消耗。

本文鏈接：http://www.www897cc.com/showinfo-26-144987-0.html豆包 1.5?深度思考模型發布！效果好、低延遲、多模態

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：英偉達 CEO 黃仁勛：堅定不移服務中國市場

下一篇：聯想智會三大場景解決方案亮相 InfoComm 展，三包 plus 服務升級 3.0

標簽：

熱門焦點

紅魔電競平板評測：大屏幕硬實力

前言：三年的疫情因為要上網課的原因激活了平板市場，如今網課的時代已經過去，大家的生活都恢復到了正軌，這也就意味著，真正考驗平板電腦生存的環境來了。也就是面對著這種殘酷的
6月安卓手機性價比榜：Note 12 Turbo斷層式碾壓

6月份有一個618，雖然這是京東周年慶的日子，但別的電商也都不約而同的跟進了，反正促銷沒壞處，廠商和用戶都能滿意。618期間一些產品也出現了歷史低價，那么各個價位段的產品性價比
一篇文章帶你了解 CSS 屬性選擇器

屬性選擇器對帶有指定屬性的 HTML 元素設置樣式。可以為擁有指定屬性的 HTML 元素設置樣式，而不僅限于 class 和 id 屬性。一、了解屬性選擇器CSS屬性選擇器提供了一種簡單而
認真聊聊東方甄選：如何告別低垂的果實

來源：山核桃作者：財經無忌爆火一年后，俞敏洪和他的東方甄選依舊是頗受外界關心的“網紅”。7月5日至9日，為期5天的東方甄選“甘肅行”首次在自有App內直播，
華為和江淮汽車合作開發百萬元問界MPV？雙方回應來了

8月1日消息，郭明錤今天在社交平臺發文稱，華為正在和江淮汽車合作，開發售價在100萬元的問界MPV，預計在2024年第2季度量產，銷量目標為上市首年交付5萬輛。
機構稱Q2全球智能手機出貨量同比下滑11% 蘋果份額依舊第2

7月20日消息，據外媒報道，研究機構的報告顯示，由于需求下滑，今年二季度全球智能手機的出貨量，同比下滑了11%，三星、蘋果等主要廠商的銷量，較去年同期均有下
OPPO K11樣張首曝：千元機影像“卷”得真不錯！

一直以來，OPPO K系列機型都保持著較為均衡的產品體驗，歷來都是2K價位的明星機型，去年推出的OPPO K10和OPPO K10 Pro兩款機型憑借各自的出色配置，堪稱有
onebot M24巧系列一體機采用輕薄機身設計，現已在各平臺開售

onebot M24 巧系列一體機目前已在線上線下各平臺同步開售。onebot M24 巧系列采用一體化輕薄機身設計，最薄處為 10.15mm，擁有寶石紅、午夜藍、石墨綠、雅致
微軟發布Windows 11新版引入全新任務欄狀態

近日，微軟發布了Windows 11新版，而Build 22563更新主要引入了幾周前曝光的平板模式任務欄等，系統更流暢了。更新中，Windows 11加入了專門針對平板優化的任務欄

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

豆包 1.5?深度思考模型發布！效果好、低延遲、多模態

紅魔電競平板評測：大屏幕硬實力

6月安卓手機性價比榜：Note 12 Turbo斷層式碾壓

一篇文章帶你了解 CSS 屬性選擇器

認真聊聊東方甄選：如何告別低垂的果實

華為和江淮汽車合作開發百萬元問界MPV？雙方回應來了

機構稱Q2全球智能手機出貨量同比下滑11% 蘋果份額依舊第2

OPPO K11樣張首曝：千元機影像“卷”得真不錯！

onebot M24巧系列一體機采用輕薄機身設計，現已在各平臺開售

微軟發布Windows 11新版引入全新任務欄狀態

最新推薦

猜你喜歡

熱門推薦

相關資訊