7 月 26 日消息,在 2025 世界人工智能大會(簡稱“WAIC 2025”)開幕前夕,階躍星辰昨天在上海正式發布了新一代基礎大模型 ——Step 3,將于 7 月 31 日面向全球企業和開發者開源。
據官方介紹,Step 3 是階躍星辰首個全尺寸、原生多模態推理模型,兼顧模型效果與推理成本,是在模型架構創新、算法工程協同設計上的一次大膽嘗試與 Scale Up。Step 3 采用 MoE 架構,總參數量 321B,激活參數量 38B。
Step 3 擁有強大的視覺感知和復雜推理能力,可準確完成跨領域的復雜知識理解、數學與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。
Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜單上取得了開源多模態推理模型的 SOTA 成績。
官方稱,目前,主流開源模型雖然針對解碼進行了大量優化,但其優化方案主要適配國際高端芯片,在中端及國產芯片上的解碼效率仍有提升空間。在架構設計階段,Step 3 便充分考量系統與硬件的特性,實現廣泛硬件平臺上的高效推理。憑借系統和架構創新,Step 3 實現了行業領先的推理解碼效率。
根據原理分析,Step 3 在國產芯片上的推理效率最高可達 DeepSeek-R1 的 300%,且對所有芯片友好。在基于 NVIDIA Hopper 架構的芯片進行分布式推理時,實測 Step 3 相較于 DeepSeek-R1 的吞吐量提升超 70%。這些都是在不犧牲激活參數量、不降低注意力容量的條件下實現的。
階躍星辰宣布聯合近 10 家芯片及基礎設施廠商,共同發起“模芯生態創新聯盟”,首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。目前,華為昇騰芯片已首先實現 Step 3 的搭載和運行。沐曦、天數智芯和燧原等也已初步實現運行 Step 3。其它聯盟廠商的適配工作正在開展。
本文鏈接:http://www.www897cc.com/showinfo-45-14943-0.html階躍星辰發布新一代基礎大模型 Step 3,華為昇騰芯片已首先實現搭載
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 奧爾特曼警告:把 ChatGPT 當作心理治療師并不安全,對話內容不受法律保護
下一篇: 性能比肩 Gemini-2.5 pro、o4-mini:阿里通義千問 Qwen 3 推理模型超級進化,現已開源