【ITBEAR】趣丸科技與香港中文大學(xué)(深圳)近日攜手宣布,其共同研發(fā)的語(yǔ)音大模型“MaskGCT”已在Amphion系統(tǒng)中開源,供全球用戶使用。這一創(chuàng)新模型融合了掩碼生成與語(yǔ)音表征解耦編碼技術(shù),展現(xiàn)了在聲音克隆、跨語(yǔ)種合成等領(lǐng)域的卓越性能。
MaskGCT在多個(gè)TTS基準(zhǔn)數(shù)據(jù)集上均達(dá)到了頂尖水平,超越了當(dāng)前最先進(jìn)的同類模型。其獨(dú)特之處體現(xiàn)在秒級(jí)超逼真的聲音克隆、精細(xì)可控的語(yǔ)音生成以及基于全球最大且多樣的高質(zhì)量多語(yǔ)種語(yǔ)音數(shù)據(jù)集Emilia的訓(xùn)練。
MaskGCT的研發(fā)團(tuán)隊(duì)在語(yǔ)音領(lǐng)域擁有深厚積累,依托趣丸科技的音頻技術(shù)服務(wù)和香港中文大學(xué)(深圳)的師資力量,實(shí)現(xiàn)了技術(shù)范式的創(chuàng)新。該模型采用非自回歸掩碼生成Transformer,無(wú)需文本與語(yǔ)音對(duì)齊,突破了傳統(tǒng)TTS模型的限制。
MaskGCT已在多個(gè)領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景,特別是在短劇出海、數(shù)字人、智能助手等方面。趣丸科技推出的多語(yǔ)種速譯智能視聽平臺(tái)“趣丸千音”,便是基于MaskGCT技術(shù)的實(shí)際應(yīng)用,旨在降低翻譯成本,加速內(nèi)容出海。
隨著MaskGCT技術(shù)的不斷成熟和應(yīng)用,中國(guó)AI企業(yè)在全球舞臺(tái)上的競(jìng)爭(zhēng)力將進(jìn)一步提升,同時(shí)推動(dòng)中華文化在全球的傳播。
本文鏈接:http://www.www897cc.com/showinfo-45-9805-0.html趣丸科技與港中大(深圳)聯(lián)手,語(yǔ)音大模型效果領(lǐng)先入全球一梯隊(duì)!
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com