階躍星辰公司近期震撼發布了其傾力打造的開源端到端語音大模型——Step-Audio2mini。這款模型在國際多項基準測試中脫穎而出,刷新了SOTA記錄,將語音理解、音頻推理與生成融為一體,展現了卓越的全方位能力。無論是在音頻理解、語音識別,還是在跨語種翻譯、情感解析及語音對話等應用場景中,Step-Audio2mini均展現出了非凡的實力。
尤為Step-Audio2mini在音頻處理領域的多個核心測試中,表現遠超Qwen-Omni、Kimi-Audio等同類開源模型,甚至在多數任務上超越了GPT-4o Audio。在通用多模態音頻理解測試集MMAU上,它以73.2的高分傲視群雄;在口語對話能力評估平臺URO Bench的基礎與專業賽道上,Step-Audio2mini同樣奪得了開源端到端語音模型的最高分。在中英互譯任務中,它在CoVoST2和CVSS評測集上的分數分別為39.3和29.1,大幅領先競爭對手。而在語音識別方面,Step-Audio2mini在多語言和多方言測試中均排名第一,其中中文測試集的平均字錯誤率為3.19%,英文測試集的平均詞錯誤率為3.50%,性能超出其他開源模型15%以上。
Step-Audio2mini之所以能在眾多模型中脫穎而出,得益于其創新的架構設計。它摒棄了傳統的ASR+LLM+TTS三級結構,采用了真端到端多模態架構,實現了從原始音頻輸入到語音響應輸出的直接轉換,不僅架構更加簡潔,時延也大幅降低。同時,該模型還能有效理解副語言信息和非人聲信號,進一步提升了其綜合性能。Step-Audio2mini還首次在端到端語音模型中引入了鏈式思維推理(CoT)與強化學習的聯合優化技術,使其能夠更精細地理解、推理情緒、語調、音樂等副語言和非語音信號,并作出自然回應。
Step-Audio2mini的實際應用能力同樣令人印象深刻。它能夠準確識別大自然的聲音和精湛的配音,還能實時搜索行業最新資訊,為用戶提供有價值的信息。同時,該模型還支持控制語速,輕松適應不同場景的對話需求。在一次測試中,當面對一個復雜的哲學問題時,Step-Audio2mini展現出了強大的邏輯推理能力,將抽象問題轉化為極簡方法論,給出了令人信服的答案。
目前,Step-Audio2mini模型已在GitHub、Hugging Face和ModelScope等平臺上線,供用戶下載、試用并反饋。感興趣的用戶可以訪問以下鏈接獲取更多信息:
GitHub鏈接:https://github.com/stepfun-ai/Step-Audio2
Hugging Face鏈接:https://huggingface.co/stepfun-ai/Step-Audio-2-mini
ModelScope鏈接:https://www.modelscope.cn/models/stepfun-ai/Step-Audio-2-mini
舉報 0收藏 0打賞 0評論 0分享 0 更多>同類資訊科大訊飛灣區總部及產業加速中心深圳啟動,賦能區域數字化轉型每經AI快訊,據深圳發布,近日,科大訊飛灣區總部及深圳產業加速中心在深圳龍華正式啟動,邁出在粵港澳大灣區深化布局的關鍵一步。產業加速中心依托科大訊飛核心技術能力和國家新一代人工智能開放創新平臺集聚的開發者資源…09-01
阿里:AI與消費雙輪驅動,財報超預期展現強勁增長力過去四個季度,我們已經在 AI 基礎設施以及 AI 產品研發上累計投入超過 1000 億元”,吳泳銘說,阿里對 AI的投入已開始顯現成果,無論是阿里云在客戶的 AI 需求下恢復高速增長,還是廣泛的 to C…09-01
2025數智化轉型論壇:AI大模型與AI Agent引領破界反卷新篇章正是在這樣的背景之下,由數智猿×數據猿聯合主辦,中關村科學城公司協辦,新華社中國經濟信息社×北京軟件和信息服務業協會×中國互聯網協會數字化轉型與發展工作委員會×上海大數據聯盟作為支持單位的的“2025第五屆…09-01科大訊飛灣區總部啟航龍華,深圳產業加速中心賦能創新生態產業加速中心依托科大訊飛核心技術能力和國家新一代人工智能開放創新平臺集聚的開發者資源,打造“線上+線下”相融合的創新創業服務加速平臺,為開發者、創業企業和區域產業數字化轉型提供線下賦能,通過創業孵化、產業聚…09-01科大訊飛灣區總部啟動深圳加速中心,全方位賦能中小微企業轉型升級來源:證券時報e公司 人民財訊8月31日電,據深圳發布,近日,科大訊飛灣區總部及深圳產業加速中心在深圳龍華正式啟動,邁出在粵港澳大灣區深化布局的關鍵一步。產業加速中心依托科大訊飛核心技術能力和國家新一代人工智…09-01
科大訊飛再傳捷報:中標安徽稅務智能咨詢子系統運行維護項目證券之星消息,根據天眼查APP-財產線索數據整理,根據國家稅務總局安徽省稅務局月8日28發布的《國家稅務總局安徽省稅務局安徽稅務2025年12366納稅繳費服務熱線系統(智能咨詢子系統)運行維護項目(二次)中…09-01
科大訊飛灣區總部深圳龍華啟航,生態企業集群入駐共促AI產業發展來源:IT之家 【科大訊飛灣區總部落戶深圳,與龍華區共建產業加速中心整合上下游產業鏈資源】科大訊飛灣區總部及深圳產業加速中心項目在深圳龍華正式啟動,已吸引15家生態企業入駐,8家簽約。中心將整合上下游資源,助…09-01
微軟AI自研大模型亮相,語音模型定制化程度高,CEO談與OpenAI關系MustafaSuleyman:我認為世界上最優秀的人才,想要做的是那些真正有影響力的工作,能帶來改變、能做出優秀產品,同時解決如何高效實現目標的技術挑戰。Mustafa Suleyman:是的,我們已…08-31微信新規:AI生成內容將加顯式隱式標識,提升信息透明度08-31
區域算力網研究報告貴陽首發:探索構建全國算力“一張網”新路徑8月29日,由國家信息中心和華為公司牽頭,聯合政產學研30余家相關機構共同編寫的《區域算力網:高速互聯篇研究報告》(簡稱《研究報告》)在貴陽發布。 據悉,2024年,國家信息中心與華為等單位,圍繞城市算力專…08-31
中國移動2025數博會展全棧AI實力,筑基算力網絡引領數智化新篇章能力中臺作為中國移動“兩個新型”“BASIC6”“AI+”三大計劃的重要組成部分,匯聚涵蓋了AI、大數據、物聯網等領域的1300余項內外部優質數智能力,為企業客戶提供數據技術支持、模型訓練、智能應用開發等一…08-31
華為AI SSD新品亮相,全球存儲產業HBM、NAND閃存、CXL技術王牌競相角逐2025年8月27日,華為存儲又結新果,華為在數據存儲AI SSD新品發布會上正式推出三款針對AI存儲的新產品。 在AI大模型訓練、多模態數據處理需求爆發的當下,除華為之外,全球存儲領域的更多玩家,爭相競逐H…08-31馬斯克xAI公司狀告前工程師,指控其盜取AI機密投奔OpenAI08-30
百度智能云升級AI平臺,引領企業步入智能經濟新時代從十年前我們開始探索AI云的全棧布局,到今天見證整個AI產業生態的全面爆發,我們很高興的看到,越來越多的同行開始加大智能投入,豐富了從底層基礎設施、到大模型以及開發平臺的選擇;也看到,越來越多的客戶和伙伴也…08-30
AI云賽道領航,百度智能云何以成為企業轉型升級首選伙伴?從2015年正式對外提供云服務,百度智能云明確了“三位一體”人工智能(AI)、大數據(Big Data)與云計算(Cloud Computing)的發展策略,到2020年確立“云智一體”理念,再到如今,百…08-30點擊查看更多 +全站最新
汽車行業下半場:智駕時代,大咖共探換擋新機遇
格力電器二季度營收下滑,多元化之路成破局關鍵
日資房產市場升溫,外資涌入創新高,中國樓市對比顯冷清
萬事利上半年營收增長8.29%,AI技術引領絲綢產業轉型升級
德力佳傳動上市路:客戶采銷數據差異大,研發占比低卻毛利率高,關聯交易頻現
牛散章建平被誤認,緊急澄清:未買寒武紀股票,網傳照片系他人熱門內容
阿里:AI與消費雙輪驅動,財報超預期展現強勁增長力
2025數智化轉型論壇:AI大模型與AI Agent引領破界反卷新篇章
科大訊飛再傳捷報:中標安徽稅務智能咨詢子系統運行維護項目
科大訊飛灣區總部深圳龍華啟航,生態企業集群入駐共促AI產業發展
微軟AI自研大模型亮相,語音模型定制化程度高,CEO談與OpenAI關系
區域算力網研究報告貴陽首發:探索構建全國算力“一張網”新路徑
本文鏈接:http://www.www897cc.com/showinfo-45-27224-0.html階躍星辰推出Step-Audio2mini,端到端語音大模型刷新多項國際基準測試成績
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com