日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

阿里云通義千問開源兩款語音基座模型,識別效果優于 OpenAI Whisper

來源: 責編: 時間:2024-07-12 08:25:23 176觀看
導讀 7 月 9 日消息,阿里云通義千問開源了兩款語音基座模型 SenseVoice(用于語音識別)和 CosyVoice(用于語音生成)。SenseVoice 專注于高精度多語言語音識別、情感辨識和音頻事件檢測,有以下特點:多語言識別:采用超過 40

7 月 9 日消息,阿里云通義千問開源了兩款語音基座模型 SenseVoice(用于語音識別)和 CosyVoice(用于語音生成)。0xc28資訊網——每日最新資訊28at.com

0xc28資訊網——每日最新資訊28at.com

SenseVoice 專注于高精度多語言語音識別、情感辨識和音頻事件檢測,有以下特點:0xc28資訊網——每日最新資訊28at.com

多語言識別:采用超過 40 萬小時數據訓練,支持超過 50 種語言,識別效果上優于 Whisper 模型0xc28資訊網——每日最新資訊28at.com

富文本識別:具備優秀的情感識別,能夠在測試數據上達到和超過目前最佳情感識別模型的效果;支持聲音事件檢測能力,支持音樂、掌聲、笑聲、哭聲、咳嗽、噴嚏等多種常見人機交互事件進行檢測0xc28資訊網——每日最新資訊28at.com

高效推理:SenseVoice-Small 模型采用非自回歸端到端框架,推理延遲極低,10s 音頻推理僅耗時 70ms,15 倍優于 Whisper-Large0xc28資訊網——每日最新資訊28at.com

微調定制:具備便捷的微調腳本與策略,方便用戶根據業務場景修復長尾樣本問題0xc28資訊網——每日最新資訊28at.com

服務部署:具有完整的服務部署鏈路,支持多并發請求,支持的客戶端語言有 python、c++、html、java 與 c#等0xc28資訊網——每日最新資訊28at.com

與開源情感識別模型進行對比,SenseVoice-Large 模型可以在幾乎所有數據上都達到了最佳效果,而 SenseVoice-Small 模型同樣可以在多數數據集上取得超越其他開源模型的效果。0xc28資訊網——每日最新資訊28at.com

0xc28資訊網——每日最新資訊28at.com

CosyVoice 模型同樣支持多語言、音色和情感控制,該模型在多語言語音、零樣本語音生成、跨語言語音克隆和指令跟隨等功能方面表現出色。0xc28資訊網——每日最新資訊28at.com

附相關鏈接:0xc28資訊網——每日最新資訊28at.com

SenseVoice:https://github.com/FunAudioLLM/SenseVoice0xc28資訊網——每日最新資訊28at.com

CosyVoice:https://github.com/FunAudioLLM/CosyVoice0xc28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-5094-0.html阿里云通義千問開源兩款語音基座模型,識別效果優于 OpenAI Whisper

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: “國內首款破局性 AI 開發工具”,中國電信發布星辰軟件工廠:產品文檔生成代碼

下一篇: 振興鄉村發展 助力青少年教育 中國三星連續十一年蟬聯企業社會責任榜外企第一

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 嘉黎县| 正宁县| 四会市| 弥勒县| 兴业县| 遵化市| 灵石县| 方正县| 汶上县| 静海县| 余姚市| 家居| 南京市| 乐业县| 新沂市| 泌阳县| 海丰县| 崇义县| 五华县| 鹰潭市| 含山县| 夏邑县| 仁怀市| 汕尾市| 平塘县| 安龙县| 资源县| 丰都县| 德化县| 南宫市| 永兴县| 平定县| 祥云县| 海伦市| 泾源县| 永康市| 商丘市| 略阳县| 东丰县| 高密市| 武山县|