日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 科技  > 軟件

11個(gè)優(yōu)秀開(kāi)源TTS引擎

來(lái)源: 責(zé)編: 時(shí)間:2024-01-03 11:36:19 243觀看
導(dǎo)讀TTS引擎用于實(shí)現(xiàn)文本到語(yǔ)音的轉(zhuǎn)換。隨著人工智能的普及以及數(shù)字設(shè)備應(yīng)用的增加,相關(guān)系統(tǒng)對(duì)語(yǔ)音識(shí)別以及文語(yǔ)轉(zhuǎn)換技術(shù)日益依賴,TTS正在變得越來(lái)越重要。在這項(xiàng)技術(shù)的幫助下,可以將文本內(nèi)容轉(zhuǎn)換為錄音??梢詭椭曈X(jué)障礙的

TTS引擎用于實(shí)現(xiàn)文本到語(yǔ)音的轉(zhuǎn)換。隨著人工智能的普及以及數(shù)字設(shè)備應(yīng)用的增加,相關(guān)系統(tǒng)對(duì)語(yǔ)音識(shí)別以及文語(yǔ)轉(zhuǎn)換技術(shù)日益依賴,TTS正在變得越來(lái)越重要。0bV28資訊網(wǎng)——每日最新資訊28at.com

在這項(xiàng)技術(shù)的幫助下,可以將文本內(nèi)容轉(zhuǎn)換為錄音。可以幫助視覺(jué)障礙的人理解文本內(nèi)容,可以讓開(kāi)車(chē)的人聽(tīng)取一個(gè)文本工作報(bào)告,甚至模擬某個(gè)人的聲音播報(bào)一段內(nèi)容、演唱一個(gè)歌曲,實(shí)現(xiàn)虛擬主播、虛擬歌手。0bV28資訊網(wǎng)——每日最新資訊28at.com

本文主要查找收集了一些較好的開(kāi)源TTS引擎。這些項(xiàng)目有助于我們更加了解TTS的功能。0bV28資訊網(wǎng)——每日最新資訊28at.com

0bV28資訊網(wǎng)——每日最新資訊28at.com

1.CoQui TTS

https://github.com/coqui-ai/TTS0bV28資訊網(wǎng)——每日最新資訊28at.com

這是一個(gè)在研究和生產(chǎn)中經(jīng)過(guò)了實(shí)戰(zhàn)考驗(yàn)的TTS深度學(xué)習(xí)工具包,可以以200毫秒的延遲進(jìn)行流傳輸,支持13種語(yǔ)言(包括中文)。0bV28資訊網(wǎng)——每日最新資訊28at.com

2.mozilla TTS

https://github.com/mozilla/TTS0bV28資訊網(wǎng)——每日最新資訊28at.com

TTS是一個(gè)用于文本到語(yǔ)音生成的高級(jí)庫(kù)。旨在實(shí)現(xiàn)易于訓(xùn)練、高速度和高質(zhì)量的最佳平衡。 提供預(yù)訓(xùn)練模型,以及用于測(cè)量數(shù)據(jù)集質(zhì)量的工具,支持用于產(chǎn)品和研究的20多種語(yǔ)言,包括支持中文。0bV28資訊網(wǎng)——每日最新資訊28at.com

3.OpenTTS

https://github.com/synesthesiam/opentts0bV28資訊網(wǎng)——每日最新資訊28at.com

OpenTTS是TTS最有效的開(kāi)源模型之一。因?yàn)樵撃P椭С职ㄖ形脑趦?nèi)的多種語(yǔ)言。0bV28資訊網(wǎng)——每日最新資訊28at.com

4.MaryTTS

https://github.com/marytts/marytts0bV28資訊網(wǎng)——每日最新資訊28at.com

MARY Text-to-Speech 語(yǔ)音合成是一個(gè)多語(yǔ)言TTS平臺(tái),支持英語(yǔ)(英國(guó)和美國(guó))、法語(yǔ)、德語(yǔ)、意大利語(yǔ)、俄語(yǔ)等語(yǔ)言。0bV28資訊網(wǎng)——每日最新資訊28at.com

產(chǎn)品特點(diǎn):0bV28資訊網(wǎng)——每日最新資訊28at.com

  • 使用預(yù)處理技術(shù),如tokenizer和數(shù)值擴(kuò)展。
  • 它采用多線程網(wǎng)絡(luò)架構(gòu),并行處理多個(gè)請(qǐng)求。
  • 它本質(zhì)上是靈活的,因此您可以使用純Java模型和外部模型。
  • 它使用XML結(jié)構(gòu)來(lái)提高透明度,并且對(duì)于普通用戶來(lái)說(shuō)易于理解。

5.eSpeak

https://github.com/espeak-ng/espeak-ng0bV28資訊網(wǎng)——每日最新資訊28at.com

eSpeak是一個(gè)緊湊的開(kāi)源TTS引擎,可運(yùn)行于Windows和Linux。支持100多種語(yǔ)種和語(yǔ)音(包括中文普通話)。0bV28資訊網(wǎng)——每日最新資訊28at.com

產(chǎn)品特點(diǎn):0bV28資訊網(wǎng)——每日最新資訊28at.com

  • 這個(gè)平臺(tái)可以很容易地完成文本到語(yǔ)音的轉(zhuǎn)換。這有助于系統(tǒng)理解文本的含義。
  • 它帶有兩個(gè)合成器:eSpeakinG合成器,通過(guò)聲音添加技術(shù)轉(zhuǎn)換元音和響亮的輔音,以完成聲音。Klatt合成器使用類似的技術(shù),但使用減法合成。它使用數(shù)字濾波器來(lái)理解輔音、元音和響音之間的區(qū)別。
  • 因?yàn)樗牟町惢夹g(shù)和將文本轉(zhuǎn)換為語(yǔ)音的速度優(yōu)勢(shì),這個(gè)工具在2010年被谷歌翻譯使用。
  • 聲音的音質(zhì)清晰悅耳。

6.Mimic

https://github.com/MycroftAI/mimic30bV28資訊網(wǎng)——每日最新資訊28at.com

Mimic是一個(gè)快如閃電的開(kāi)源TTS引擎。0bV28資訊網(wǎng)——每日最新資訊28at.com

產(chǎn)品特點(diǎn):0bV28資訊網(wǎng)——每日最新資訊28at.com

  • 由于它基于FLITE技術(shù),您可以自定義語(yǔ)音的聲音。
  • 它是一個(gè)低延遲平臺(tái),并且只占用少量的資源。
  • 它可以在Linux、Android和Windows上無(wú)縫運(yùn)行。

目前,該工具正在為患有語(yǔ)言障礙的人帶來(lái)逼真的聲音。0bV28資訊網(wǎng)——每日最新資訊28at.com

0bV28資訊網(wǎng)——每日最新資訊28at.com

7.CMU Flite TTS

https://github.com/festvox/flite0bV28資訊網(wǎng)——每日最新資訊28at.com

Festival Lite通常被稱為Flite。它是一個(gè)小型的運(yùn)行時(shí)引擎,被認(rèn)為是最快的TTS引擎之一。0bV28資訊網(wǎng)——每日最新資訊28at.com

由于它是一個(gè)開(kāi)源引擎,并且是免費(fèi)的,可以基于這個(gè)項(xiàng)目做許多自定義功能。因此,許多公司都選擇了這個(gè)TTS引擎。0bV28資訊網(wǎng)——每日最新資訊28at.com

核心特點(diǎn):0bV28資訊網(wǎng)——每日最新資訊28at.com

  • 可以用于小型和大型文件。
  • 它是線程安全的,其最新版本提供了一個(gè)輕松的TTS轉(zhuǎn)換。
  • 它與Windows、Linux和Android兼容。
  • 它還提供多種語(yǔ)言版本。

0bV28資訊網(wǎng)——每日最新資訊28at.com

8.MBROLA

https://github.com/numediart/MBROLA0bV28資訊網(wǎng)——每日最新資訊28at.com

MBROLA是Multi-Band Resynthesis OverLap Add的縮寫(xiě),也是最常用的開(kāi)源TTS引擎之一。它支持多種語(yǔ)言。0bV28資訊網(wǎng)——每日最新資訊28at.com

功能特點(diǎn):0bV28資訊網(wǎng)——每日最新資訊28at.com

  • 提供多語(yǔ)種數(shù)據(jù)庫(kù)。
  • 它對(duì)于內(nèi)部文本到語(yǔ)音的轉(zhuǎn)換非常有用。
  • 它以前是一個(gè)非商業(yè)軟件,但現(xiàn)在作為開(kāi)源TTS引擎推出。
  • 它提供了令人愉快的音質(zhì),具有一致性、準(zhǔn)確性的聲音音高。

0bV28資訊網(wǎng)——每日最新資訊28at.com

9.mandarin-tts

https://github.com/ranchlai/mandarin-tts0bV28資訊網(wǎng)——每日最新資訊28at.com

這是一個(gè)模塊化的中文普通話TTS語(yǔ)音合成框架,旨在支持研究和快速產(chǎn)品開(kāi)發(fā)。0bV28資訊網(wǎng)——每日最新資訊28at.com

主要功能包括:0bV28資訊網(wǎng)——每日最新資訊28at.com

  • 所有模塊都可通過(guò)YAML配置,
  • 支持并可配置說(shuō)話者嵌入/韻律嵌入/多流文本嵌入,
  • 適配器支持各種聲碼器(VocGAN、hifi-GAN、waveglow、melGAN),從而可以容易地進(jìn)行不同聲碼器之間的比較,
  • 支持持續(xù)時(shí)間/音調(diào)/能量方差預(yù)測(cè)器,并且可以容易地添加其他方差,

0bV28資訊網(wǎng)——每日最新資訊28at.com

10.FCH-TTS

https://github.com/atomicoo/FCH-TTS0bV28資訊網(wǎng)——每日最新資訊28at.com

一個(gè)快速語(yǔ)音合成模型,適用于英語(yǔ)、普通話/中文、日語(yǔ)、韓語(yǔ)、俄語(yǔ)和藏語(yǔ)。0bV28資訊網(wǎng)——每日最新資訊28at.com

11.rhasspy piper

https://github.com/rhasspy/piper0bV28資訊網(wǎng)——每日最新資訊28at.com

0bV28資訊網(wǎng)——每日最新資訊28at.com

piper是一個(gè)快速的本地語(yǔ)音合成系統(tǒng),并針對(duì)Raspberry Pi 4(樹(shù)莓)進(jìn)行了優(yōu)化。 支持包括中文在內(nèi)的多種語(yǔ)言。0bV28資訊網(wǎng)——每日最新資訊28at.com

使用DEMO如:0bV28資訊網(wǎng)——每日最新資訊28at.com

echo 'Welcome to the world of speech synthesis!' | /  ./piper --model en_US-lessac-medium.onnx --output_file welcome.wav

本文鏈接:http://www.www897cc.com/showinfo-26-56598-0.html11個(gè)優(yōu)秀開(kāi)源TTS引擎

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: Prometheus Go client library 詳解

下一篇: 去測(cè)試化真的可行嗎?

標(biāo)簽:
  • 熱門(mén)焦點(diǎn)
Top 主站蜘蛛池模板: 共和县| 延津县| 景宁| 沅陵县| 正蓝旗| 汝城县| 江口县| 丹棱县| 安国市| 漾濞| 湾仔区| 中牟县| 延长县| 曲周县| 天全县| 宜君县| 岳阳市| 鄂伦春自治旗| 洛南县| 双柏县| 天柱县| 繁峙县| 桐庐县| 乐都县| 河北区| 静乐县| 土默特右旗| 汉沽区| 韶关市| 宜宾市| 新乐市| 祥云县| 莲花县| 哈巴河县| 淮北市| 辛集市| 镇巴县| 伊吾县| 荆门市| 安新县| 宝清县|