7 月 9 日消息,昆侖萬維剛剛發布公告,宣布推出最新的Skywork-R1V 3.0 版本并開源。
據昆侖萬維介紹,Skywork-R1V 3.0 在后訓練階段通過強化學習策略深度激發模型的跨模態推理能力,在復雜邏輯建模與跨學科泛化方面實現雙重飛躍。
Skywork-R1V 3.0 基于上一代推理模型 Skywork-R1V 2.0 蒸餾數據進行“冷啟動”,通過拒絕采樣構建高質量多模態推理訓練集,指導開源視覺大模型 InternVL-38B(38B 參數)學會多模態推理的基本格式和方法。
隨后引入強化學習算法 GRPO(Group Relative Policy Optimization)深度激發模型的推理潛能,成功實現推理能力在圖像和文本模態之間的遷移,顯著提升其跨模態、多學科場景下的理解與分析表現。
據介紹,Skywork R1V 3.0 僅依賴約 1.2 萬條監督微調樣本和 1.3 萬條強化學習樣本,便實現高效訓練,充分體現了“小數據激發大能力”的優勢。
性能方面,該模型在權威的綜合性多模態評測 MMMU 中取得了 76.0 的開源模型最高成績,超越了 Claude-3.7-Sonnet(75.0)和 GPT-4.5(74.4)等閉源模型,逼近人類初級專家水平(76.2)。
昆侖萬維表示,R1V 3.0 的高考數學突出成績,接近多款頂尖閉源模型,達到了開源多模態推理模型的最優結果,證明了其卓越的實戰解題表現和跨場景泛化的穩定性。
在更考驗視覺推理的EMMA-Mini(CoT)上,以開源領先的40.3分超過更大尺寸的 Qwen2.5-VL-72B-Instruct 和 InternVL3-78B 等模型,并縮小了與閉源模型 Claude-3.7-Sonnet 的差距。
在覆蓋中小學知識點的MMK12上,R1V 3.0 以78.5分再度領跑開源陣營,超越 Qwen2.5-VL-72B-Instruct、InternVL3-78B 等開源模型以及 GPT-4.5 和 GPT-4o 等閉源模型。
較上一代模型而言,Skywork-R1V 3.0 在物理、邏輯等多個關鍵領域取得了顯著性能提升,成為當前開源領域最強勁的多模態推理模型之一:
物理推理:在物理領域的權威評測PhyX-MC-Text-Minimal和SeePhys中,Skywork-R1V 3.0 分別取得52.8分和31.5分的開源最優成績,充分展現了其在多模態物理推理方面的卓越能力。模型不僅能夠精準理解力學、電磁學等基礎物理概念,還擅長處理圖文結合的復雜物理問題(例如解析受力分析圖、電路示意圖等專業圖表),其物理推理水平已顯著超過當前主流開源模型以及 GPT-4.5 和 Gemini 2 Flash 等部分閉源模型。
邏輯推理:Skywork-R1V 3.0 在多項權威邏輯推理評測中同樣表現卓越:在LogicVista測試中取得59.7分,在VisuLogic測試中取得28.5分。在MME-Reasoning中,Skywork-R1V 3.0 更是獲得42.8分的佳績,超越了閉源模型 Claude-4-Sonnet。這充分體現了 Skywork-R1V 3.0 在多模態邏輯一致性、條件推理和跨模態因果建模方面的領先能力。
數學推理:在數學類問題上,R1V 3.0 展現出卓越的解題能力。在權威數學評測基準 MathVista、MathVerse 和 MathVision 上,R1V 3.0 分別取得了 77.1 分、59.6 分和 52.6 分的優異成績,領先于 Qwen2.5-VL-72B-Instruct、InternVL3-78B、QVQ-72B-Preview 等開源模型。
Skywork-R1V 3.0 下載:
HuggingFace 地址:https://huggingface.co/ Skywork / Skywork-R1V3-38B
GitHub 地址:https://github.com/SkyworkAI/Skywork-R1V
技術報告:https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V3.pdf
本文鏈接:http://www.www897cc.com/showinfo-45-14480-0.html昆侖萬維發布并開源 Skywork-R1V 3.0,多模態推理能力逼近人類專家水平
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com