當前位置：首頁 > 元宇宙 > AI

昆侖萬維發布并開源 Skywork-R1V 3.0，多模態推理能力逼近人類專家水平

來源：責編：時間：2025-07-11 10:12:38 29觀看

導讀 7 月 9 日消息，昆侖萬維剛剛發布公告，宣布推出最新的Skywork-R1V 3.0 版本并開源。據昆侖萬維介紹，Skywork-R1V 3.0 在后訓練階段通過強化學習策略深度激發模型的跨模態推理能力，在復雜邏輯建模與跨學科泛化方面

7 月 9 日消息，昆侖萬維剛剛發布公告，宣布推出最新的Skywork-R1V 3.0 版本并開源。

據昆侖萬維介紹，Skywork-R1V 3.0 在后訓練階段通過強化學習策略深度激發模型的跨模態推理能力，在復雜邏輯建模與跨學科泛化方面實現雙重飛躍。

Skywork-R1V 3.0 基于上一代推理模型 Skywork-R1V 2.0 蒸餾數據進行“冷啟動”，通過拒絕采樣構建高質量多模態推理訓練集，指導開源視覺大模型 InternVL-38B（38B 參數）學會多模態推理的基本格式和方法。

隨后引入強化學習算法 GRPO（Group Relative Policy Optimization）深度激發模型的推理潛能，成功實現推理能力在圖像和文本模態之間的遷移，顯著提升其跨模態、多學科場景下的理解與分析表現。

據介紹，Skywork R1V 3.0 僅依賴約 1.2 萬條監督微調樣本和 1.3 萬條強化學習樣本，便實現高效訓練，充分體現了“小數據激發大能力”的優勢。

性能方面，該模型在權威的綜合性多模態評測 MMMU 中取得了 76.0 的開源模型最高成績，超越了 Claude-3.7-Sonnet（75.0）和 GPT-4.5（74.4）等閉源模型，逼近人類初級專家水平（76.2）。

昆侖萬維表示，R1V 3.0 的高考數學突出成績，接近多款頂尖閉源模型，達到了開源多模態推理模型的最優結果，證明了其卓越的實戰解題表現和跨場景泛化的穩定性。

在更考驗視覺推理的EMMA-Mini(CoT)上，以開源領先的40.3分超過更大尺寸的 Qwen2.5-VL-72B-Instruct 和 InternVL3-78B 等模型，并縮小了與閉源模型 Claude-3.7-Sonnet 的差距。

在覆蓋中小學知識點的MMK12上，R1V 3.0 以78.5分再度領跑開源陣營，超越 Qwen2.5-VL-72B-Instruct、InternVL3-78B 等開源模型以及 GPT-4.5 和 GPT-4o 等閉源模型。

較上一代模型而言，Skywork-R1V 3.0 在物理、邏輯等多個關鍵領域取得了顯著性能提升，成為當前開源領域最強勁的多模態推理模型之一：

物理推理：在物理領域的權威評測PhyX-MC-Text-Minimal和SeePhys中，Skywork-R1V 3.0 分別取得52.8分和31.5分的開源最優成績，充分展現了其在多模態物理推理方面的卓越能力。模型不僅能夠精準理解力學、電磁學等基礎物理概念，還擅長處理圖文結合的復雜物理問題（例如解析受力分析圖、電路示意圖等專業圖表），其物理推理水平已顯著超過當前主流開源模型以及 GPT-4.5 和 Gemini 2 Flash 等部分閉源模型。

邏輯推理：Skywork-R1V 3.0 在多項權威邏輯推理評測中同樣表現卓越：在LogicVista測試中取得59.7分，在VisuLogic測試中取得28.5分。在MME-Reasoning中，Skywork-R1V 3.0 更是獲得42.8分的佳績，超越了閉源模型 Claude-4-Sonnet。這充分體現了 Skywork-R1V 3.0 在多模態邏輯一致性、條件推理和跨模態因果建模方面的領先能力。

數學推理：在數學類問題上，R1V 3.0 展現出卓越的解題能力。在權威數學評測基準 MathVista、MathVerse 和 MathVision 上，R1V 3.0 分別取得了 77.1 分、59.6 分和 52.6 分的優異成績，領先于 Qwen2.5-VL-72B-Instruct、InternVL3-78B、QVQ-72B-Preview 等開源模型。

Skywork-R1V 3.0 下載：

HuggingFace 地址：https://huggingface.co/ Skywork / Skywork-R1V3-38B

GitHub 地址：https://github.com/SkyworkAI/Skywork-R1V

技術報告：https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V3.pdf

本文鏈接：http://www.www897cc.com/showinfo-45-14480-0.html昆侖萬維發布并開源 Skywork-R1V 3.0，多模態推理能力逼近人類專家水平

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：美的副總裁王建國：未來三年計劃投入 500 億元以上布局 AI 大模型

下一篇：具身智能機器人公司星海圖再獲超 1 億美元融資，美團龍珠、今日資本領投

標簽：

熱門焦點

聚焦虛擬數字人技術，這三大商機要抓??！

關于虛擬數字人，企業可以從三個方面入局，分別是ToG（To Government，面向政府），即為數字政府和數字城市提供支持服務；ToB（To Business，面向企業），即為企業提供虛擬員工解決方案；ToC（To Cons
中國區塊鏈產業生態地圖報告（2021）

區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新，以服務實體經濟、政務民生以及公共服務等領域為落腳點，以期實現整個地區和產業的資
元宇宙時代NFT的價值衡量

有人認為NFT的高昂價格只是炒作的產物，并不具有其對等的價值，但其實NFT并不是空中樓閣，只是區塊鏈數字分類賬中的一種形式。誠然，目前的NFT仍處于灰色地帶，相關的法
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
Meta正在研發元宇宙語音助手；廣東省462家企業申請元宇宙商標

今日《元宇宙新鮮事》有：扎克伯格透露正在為元宇宙研發語音助手；完美世界聲明稱不會以“元宇宙投資項目”等名義吸收資金。廣東省申請元宇宙商標的企業達462家位
2022年去中心化交易所會崛起嗎？

“在某個時候，去中心化衍生品的交易量可能會超過去中心化現貨交易所。”DEX 越來越多地轉向第二層解決方案?！皵底只鹑谑袌龅母拍钜约叭绾窝刂杂脩魹橹行?/span>
元宇宙風歸何處？

元宇宙持續大火，在過去一段時間內，其屢次登上熱點，吸引了一波又一波投資者。近期，在“2022中國·金魚嘴元宇宙生態賦能大會”上，南京建鄴區金魚嘴基金街區宣布計劃
元宇宙需要的5個重要安全功能

元宇宙的可能用途使其成為一個令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發，以保護用戶
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

昆侖萬維發布并開源 Skywork-R1V 3.0，多模態推理能力逼近人類專家水平

聚焦虛擬數字人技術，這三大商機要抓??！

中國區塊鏈產業生態地圖報告（2021）

元宇宙時代NFT的價值衡量

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

Meta正在研發元宇宙語音助手；廣東省462家企業申請元宇宙商標

2022年去中心化交易所會崛起嗎？

元宇宙風歸何處？

元宇宙需要的5個重要安全功能

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

最新推薦

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

2022 區塊鏈 50 強榜單；垃圾NFT項目的十三個特性

2022年中國元宇宙系列報告：底層架構研究：虛擬引擎，擎動未來

NFT世界的藝術家名單

Steam 禁止NFT和加密貨幣原因曝光

Ceramic：為Web3.0社交應用打造的中間件

猜你喜歡

熱門推薦

相關資訊

昆侖萬維發布并開源 Skywork-R1V 3.0，多模態推理能力逼近人類專家水平

最新推薦

猜你喜歡

熱門推薦

相關資訊

昆侖萬維發布并開源 Skywork-R1V 3.0，多模態推理能力逼近人類專家水平