當前位置：首頁 > 元宇宙 > AI

阿里云通義千問開源兩款語音基座模型，識別效果優于 OpenAI Whisper

來源：責編：時間：2024-07-12 08:25:23 213觀看

導讀 7 月 9 日消息，阿里云通義千問開源了兩款語音基座模型 SenseVoice（用于語音識別）和 CosyVoice（用于語音生成）。SenseVoice 專注于高精度多語言語音識別、情感辨識和音頻事件檢測，有以下特點：多語言識別：采用超過 40

7 月 9 日消息，阿里云通義千問開源了兩款語音基座模型 SenseVoice（用于語音識別）和 CosyVoice（用于語音生成）。

SenseVoice 專注于高精度多語言語音識別、情感辨識和音頻事件檢測，有以下特點：

多語言識別：采用超過 40 萬小時數據訓練，支持超過 50 種語言，識別效果上優于 Whisper 模型

富文本識別：具備優秀的情感識別，能夠在測試數據上達到和超過目前最佳情感識別模型的效果；支持聲音事件檢測能力，支持音樂、掌聲、笑聲、哭聲、咳嗽、噴嚏等多種常見人機交互事件進行檢測

高效推理：SenseVoice-Small 模型采用非自回歸端到端框架，推理延遲極低，10s 音頻推理僅耗時 70ms，15 倍優于 Whisper-Large

微調定制：具備便捷的微調腳本與策略，方便用戶根據業務場景修復長尾樣本問題

服務部署：具有完整的服務部署鏈路，支持多并發請求，支持的客戶端語言有 python、c++、html、java 與 c#等

與開源情感識別模型進行對比，SenseVoice-Large 模型可以在幾乎所有數據上都達到了最佳效果，而 SenseVoice-Small 模型同樣可以在多數數據集上取得超越其他開源模型的效果。

CosyVoice 模型同樣支持多語言、音色和情感控制，該模型在多語言語音、零樣本語音生成、跨語言語音克隆和指令跟隨等功能方面表現出色。

附相關鏈接：

SenseVoice：https://github.com/FunAudioLLM/SenseVoice

CosyVoice：https://github.com/FunAudioLLM/CosyVoice

本文鏈接：http://www.www897cc.com/showinfo-45-5094-0.html阿里云通義千問開源兩款語音基座模型，識別效果優于 OpenAI Whisper

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： “國內首款破局性 AI 開發工具”，中國電信發布星辰軟件工廠：產品文檔生成代碼

下一篇：振興鄉村發展助力青少年教育中國三星連續十一年蟬聯企業社會責任榜外企第一

標簽：

熱門焦點

新周期，誰在堅守窄門？

來源：錦緞今日的投資者恐怕已經忘記了，在OpenAI創造出ChatGPT這一殺器的前夜，生成式AI也曾經是一道窄門，窄到連馬斯克都差點失去了信心。在當時的輿論眼中，AGI的道路不夠性感，不夠
借VR產業東風，江西搶灘布局“元宇宙”

自2016年起就在VR上傾注了大量精力的江西省，迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口，使人們可以在數字空間和物理空間自由穿梭。自2016年起
DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

Block-807DAO要么是定義虛擬未來、無領導組織的革命性概念，要么是充滿存在主義和自我毀滅挑戰的反烏托邦結構，取決于你在與誰交談。近幾個月來， DAO已經從Crypto
傳統互聯網與區塊鏈場景下數據權利法律分析

數據權益的復雜性在于數據涉及多環節多主體、內容不同質且與不同場景緊密聯系、對軟硬件技術環節緊密相關等方面的復雜性。在傳統互聯網與區塊鏈模式下，數據處
暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

NFT Worlds 系列產品于 2021 年 10 月 5 日免費鑄造，該NFT系列是將傳統的中心化電子游戲minecraft 與去中心化資產相結合。傳統游戲Minecraft 對用戶定制非常開
Steam 禁止NFT和加密貨幣原因曝光

近日，Valve（V社）總裁Gabe Newell接受PC Gamer采訪時解釋了該平臺禁止NFT和加密貨幣的原因。早在2021年10月18日，PC Gamer就報道Steam推出的新規：使用區塊鏈或允許交
3月份值得關注的5個NFT項目

2021年，我們見證了一個新的創造者經濟的誕生。它是在區塊鏈上誕生的。自從NFT成為流行文化的中心舞臺以來，有些藝術家們已經成為了NFT的超級明星，在幾個月的時間
元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

GameFi=Game（游戲）+DEFI（去中心化金融），核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能，GameFi 游戲資產化身為NFT 和代幣上鏈，具備了可驗證性和流通性；開
TX加入的NFT數字收藏品，元宇宙的破圈之路?

3月7日，澳大利亞 NFT 初創公司 Immutable 在新加坡淡馬錫牽頭的R資中以估值 25 億美元完成2億美元R資，騰訊參投。想必國人最熟知的應該就是TX，作為國內四大互聯網

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

阿里云通義千問開源兩款語音基座模型，識別效果優于 OpenAI Whisper

新周期，誰在堅守窄門？

借VR產業東風，江西搶灘布局“元宇宙”

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

傳統互聯網與區塊鏈場景下數據權利法律分析

暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

Steam 禁止NFT和加密貨幣原因曝光

3月份值得關注的5個NFT項目

元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

TX加入的NFT數字收藏品，元宇宙的破圈之路?

最新推薦

元宇宙風口下，視覺中國如何重估？

百度元宇宙希壤是什么？（附下載）

美國一區塊鏈風投公司宣布成立2.5億美元web3投資新基金

NFT世界的藝術家名單

在元宇宙開會是什么樣一種體驗

元宇宙不完全是想出來的，而是實打實做出來的

猜你喜歡

熱門推薦

相關資訊