9 月 18 日消息,今天下午,面壁智能宣布“小鋼炮”系列迎新:推出 0.5B 參數(shù)尺寸的語音生成基座模型 VoxCPM。
該模型由面壁智能與清華大學(xué)深圳國際研究生院人機(jī)語音交互實(shí)驗(yàn)室(THUHCSI)聯(lián)合研發(fā)。官方表示,VoxCPM 在合成語音的自然度、音色相似度及韻律表現(xiàn)力方面均達(dá)到了 SOTA 水平。目前,VoxCPM 已在 GitHub、Hugging Face 等平臺開源。

根據(jù)介紹,在詞錯率方面,VoxCPM 在 Seed-TTS-EVAL 正常樣本下達(dá)到極低水平,在困難樣本上也取得不錯表現(xiàn)。在音色相似度方面,尤其在 Zero-shot 音色克隆任務(wù)中,VoxCPM 同樣展示出頂尖性能。

面壁智能表示,VoxCPM 無論是文本理解和表達(dá)、極少樣本的聲音復(fù)刻、公式及符號音頻輸出等能力,都展現(xiàn)了出色效果。實(shí)際聽感上,VoxCPM 生成的語音號稱在情緒、音色、口音、停頓、韻律等方面表現(xiàn)“與真人無異”。
VoxCPM 可根據(jù)對文本內(nèi)容的超強(qiáng)理解,自主選擇合適的聲音、腔調(diào)、韻律風(fēng)格生成音頻,帶來“聲”臨其境的聽覺體驗(yàn)。
附模型有關(guān)鏈接如下:
Github:https://github.com/OpenBMB/VoxCPM/
Hugging Face:https://huggingface.co/openbmb/VoxCPM-0.5B
ModelScope:https://modelscope.cn/models/OpenBMB/VoxCPM-0.5B
PlayGround 體驗(yàn):https://huggingface.co/spaces/OpenBMB/VoxCPM-Demo
音頻樣例頁面地址:https://openbmb.github.io/VoxCPM-demopage
本文鏈接:http://www.www897cc.com/showinfo-45-27859-0.html面壁智能發(fā)布語音生成基座“小鋼炮”模型 VoxCPM:0.5B 參數(shù)號稱媲美真人
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com