百度智能云千帆平臺近日宣布,面向企業級多模態應用場景的全新視覺理解大模型Qianfan-VL正式開源。該系列模型包含3B、8B、70B三種參數規格,通過深度優化設計,在基礎通用能力與產業垂直場景中均展現出顯著優勢。目前8B與70B版本已開放免費體驗,企業用戶和開發者可在10月10日前登錄平臺進行試用。
研發團隊基于開源架構進行創新開發,依托百度自研的昆侖芯P800芯片構建了超大規模分布式計算系統。該系統支持單任務5000卡并行計算,通過優化并行策略與算子設計,顯著提升了模型處理復雜算法與海量數據的效率。這種軟硬件協同的創新模式,使模型在通用與垂類任務評測中均達到行業領先水平。
模型設計采用四階段能力增強訓練方案,在保持通用性能的同時,針對產業落地需求進行專項強化。通過構建覆蓋文檔識別、數學解題、圖表理解等核心任務的高精度數據合成管線,實現了高質量訓練數據的規模化生產。這種訓練策略使模型參數規模與性能呈現顯著正相關,70B版本在專業領域問答中展現出更強的推理能力。
在OCR全場景識別方面,模型可精準處理手寫體、數學公式、自然場景文字等多種類型,并能對卡證票據進行結構化信息提取。復雜版面文檔理解能力尤為突出,可自動解析表格圖表、實現文檔智能問答與結構化解析。基準測試顯示,其在OCRBench等專業評測中的表現隨參數規模提升持續優化,為金融、醫療等領域的文檔處理提供了高效解決方案。
8B與70B版本特有的思維鏈激活功能,通過特殊token設計支持復雜場景的組合推理。在數學解題領域,模型可實現幾何推理、公式識別與分步求解;在圖表分析方面,能完成數據趨勢預測、關聯推理及統計計算。測試數據顯示,這兩個版本在MathVista-mini等數學視覺基準測試中的準確率較主流模型有顯著提升。
該系列模型的多尺寸設計充分考慮到不同規模企業的應用需求。3B版本適用于輕量級部署場景,8B版本在性能與效率間取得平衡,70B版本則能滿足高精度要求的復雜任務。這種分級設計使教育、金融、工業等領域的用戶都能找到適配方案,有效降低了企業應用AI技術的門檻。
目前,模型已在OCR識別、文檔理解等場景形成典型應用案例。在票據處理場景中,可自動提取關鍵信息并完成結構化錄入;在學術文檔分析場景,能精準解析復雜版面并支持智能問答。研發團隊透露,后續將持續優化視頻理解、三維場景解析等能力,推動模型在更多產業領域的深度應用。
更多>同類資訊Orange Research DivMerge技術:智能拼裝AI模型,解鎖多任務處理新境界09-23復旦大學AgentGym-RL框架:小模型大智慧,AI智能體學會復雜任務長期規劃09-23Meta實驗室新突破:AI模型開啟"自我對弈"模式,不依賴數據也能持續進化09-23聯發科天璣9500首推雙NPU架構,讓AI常駐手機開啟主動服務新體驗09-23DeepSeek-V3.1升級至Terminus版 優化語言一致性及Agent能力09-23斯坦福等高校聯手:用LMEnt套件追蹤AI語言模型知識學習軌跡09-23AI搜索的數學邊界:當最強大模型遇上"簡單問題"的隱秘困局09-23中科院團隊創新CARVE法:破解AI視覺“分心”難題,助模型精準聚焦09-23Plaud攜三款AI紀要新品入局大陸市場,多模態交互與長續航成亮點09-23DeepSeek線上模型升級至V3.1-Terminus,輸出更穩Agent能力再提升09-23DeepSeek-V3.1升級至V3.1-Terminus:語言更一致,代理更強大,輸出更穩定09-23上海人工智能實驗室牽頭!科學智能戰略科技力量聯盟正式成立09-23DeepSeek-V3.1-Terminus發布:修復Bug,編程與搜索智能體能力再升級09-23科學智能戰略科技力量聯盟成立 共探AI賦能多學科創新發展路徑09-23中國電信引領6G新突破:首個6G計費項目獲3GPP正式批準09-23點擊查看更多 +全站最新
?9月狹義乘用車零售預計達215萬輛,新能源車滲透率或超58%引關注?
6.88萬起極狐T1實測:空間越級配置足,小電車市場殺出“全能王”?
?雷軍官宣小米17系列9月25日發布,盧偉冰稱產品力跨代升級且對標iPhone17?
?小米17系列9月25日發布在即,雷軍年度演講《改變》將揭秘芯片與汽車故事?
?雷軍宣布:9月25日小米17系列發布,同期將舉辦第6次年度演講聊芯片與汽車故事?
小米SU7標準版11.7萬輛召回:OTA升級背后的智能駕駛安全與行業新挑戰熱門內容
第22屆東博會AI元素亮眼:數字智能體引路 機器人炫技展風采
AI云競爭下半場:華為以超節點、企業Agent等破局,誰能領跑產業?
2025網安周:每日互動劉宇談AI時代,知識安全成關鍵,共筑數字新未來
中國大模型DeepSeek首登Nature封面,R1訓練成本僅約208萬引關注
華為全聯接大會2025啟幕,發布全球最強算力超節點與集群
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.www897cc.com/showinfo-45-27962-0.html百度智能云Qianfan-VL視覺理解模型開源,多尺寸適配多場景助力AI產業落地
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com