在人工智能技術(shù)的浪潮中,AI已從早期的感知與生成階段,大步邁入Agentic AI的新紀(jì)元。這一階段的AI正逐漸展現(xiàn)出端到端的自主決策與執(zhí)行能力,深入到各個(gè)生產(chǎn)環(huán)節(jié)的核心。
火山引擎總裁譚待在近期的FORCE LINK AI創(chuàng)新巡展·杭州站活動(dòng)中,分享了火山引擎在AI模型、Agent工具以及云基礎(chǔ)設(shè)施方面的最新進(jìn)展。這些進(jìn)展旨在幫助企業(yè)以更高效、更經(jīng)濟(jì)的方式構(gòu)建和部署Agent應(yīng)用。
火山引擎發(fā)布了豆包1.5·深度思考模型,并對(duì)豆包·文生圖模型3.0和豆包·視覺理解模型進(jìn)行了升級(jí)。還推出了面向Agent服務(wù)的OS Agent解決方案,以及GUI Agent大模型——豆包1.5·UI-TARS模型。同時(shí),針對(duì)大規(guī)模推理需求,火山引擎還發(fā)布了AI云原生·ServingKit推理套件。
據(jù)統(tǒng)計(jì),截至2025年3月底,豆包大模型的日均tokens調(diào)用量已超過12.7萬億,這一數(shù)字是2024年12月的三倍,更是其發(fā)布之初的106倍。IDC的報(bào)告顯示,2024年中國公有云大模型調(diào)用量大幅增長,火山引擎憑借46.4%的市場份額,位居中國市場首位。
深度思考模型能夠模擬人類的思維過程,對(duì)復(fù)雜問題進(jìn)行精準(zhǔn)分析和邏輯推導(dǎo)。新發(fā)布的豆包1.5·深度思考模型在數(shù)學(xué)、代碼、科學(xué)等專業(yè)領(lǐng)域表現(xiàn)出色,已達(dá)到或接近全球領(lǐng)先水平。同時(shí),在創(chuàng)意寫作等非推理任務(wù)中,該模型也展現(xiàn)出強(qiáng)大的泛化能力,適用于多種復(fù)雜場景。
為了提升模型的通用性,火山引擎優(yōu)化了數(shù)據(jù)處理策略,將可驗(yàn)證數(shù)據(jù)與創(chuàng)意性數(shù)據(jù)進(jìn)行融合處理。通過采用創(chuàng)新的雙軌獎(jiǎng)勵(lì)機(jī)制,大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù)得以有效優(yōu)化,兼顧了“對(duì)錯(cuò)分明”和“見仁見智”的任務(wù)。
豆包1.5·深度思考模型采用MoE架構(gòu),總參數(shù)達(dá)到200B,但激活參數(shù)僅為20B,具有顯著的成本優(yōu)勢。該模型在提供高并發(fā)承載能力的同時(shí),實(shí)現(xiàn)了20毫秒的極低延遲。豆包APP基于豆包1.5·深度思考模型進(jìn)行了定向訓(xùn)練,能夠“邊想邊搜”,解決了生活生產(chǎn)中的具體問題。
例如,在推薦露營裝備時(shí),豆包1.5·深度思考模型能夠綜合考慮溫度、天氣、預(yù)算、便攜性和安全性等多個(gè)因素,經(jīng)過多輪搜索和思考,給出細(xì)致周到的推薦方案。同時(shí),該模型還具備視覺理解能力,能夠基于所見畫面進(jìn)行思考,使思考更加立體。
此次升級(jí)的豆包·文生圖模型3.0在文字排版、圖像生成效果以及高清圖片生成方面均有顯著提升。該模型可廣泛應(yīng)用于影視、海報(bào)、繪畫、玩偶設(shè)計(jì)等營銷、電商和設(shè)計(jì)場景,為用戶帶來更好的視覺體驗(yàn)。
在最新的文生圖領(lǐng)域權(quán)威榜單Artificial Analysis競技場中,豆包·文生圖3.0模型超越了眾多主流模型,排名全球領(lǐng)先。同時(shí),新版本的豆包·視覺理解模型在視覺定位和視頻理解能力上也有大幅提升,可應(yīng)用于線下門店巡檢、GUI agent、機(jī)器人訓(xùn)練、自動(dòng)駕駛訓(xùn)練以及安防、家庭看護(hù)等商業(yè)化場景。
火山引擎還發(fā)布了OS Agent解決方案,該方案通過火山引擎veFaaS平臺(tái)對(duì)豆包大模型能力進(jìn)行封裝,讓企業(yè)和開發(fā)者能夠輕松構(gòu)建輕量級(jí)的Code use和Browser use。同時(shí),針對(duì)任務(wù)相對(duì)復(fù)雜的Computer Use和Mobile Use Agent,可以通過ECS或云手機(jī)等調(diào)用豆包1.5·UI-TARS模型,實(shí)現(xiàn)精準(zhǔn)的感知、自主推理和行動(dòng)。
為了支持大規(guī)模的推理需求,火山引擎推出了ServingKit推理套件,幫助企業(yè)實(shí)現(xiàn)模型的快速部署、推理優(yōu)化和運(yùn)維可觀測。該套件可在極短時(shí)間內(nèi)完成大模型的下載和預(yù)熱,以及推理引擎的加載。同時(shí),通過優(yōu)化算子、AI網(wǎng)關(guān)和VKE編排調(diào)度,可以大幅度降低GPU消耗,提高資源利用率。
火山引擎還發(fā)布了國內(nèi)首個(gè)AI IDE——Trae。這款A(yù)I原生的集成開發(fā)環(huán)境工具可以讓開發(fā)者和AI進(jìn)行更智能的協(xié)作,實(shí)現(xiàn)軟件開發(fā)的交付化、智能化和協(xié)作化。未來,AI Agent將在“應(yīng)用Agent”和“OS Agent”兩個(gè)方向上并行發(fā)展,為企業(yè)和開發(fā)者帶來更多創(chuàng)新和機(jī)遇。
本文鏈接:http://www.www897cc.com/showinfo-45-12378-0.html火山引擎豆包1.5深度思考模型:高效能、低延遲,引領(lǐng)AI新紀(jì)元
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com