TTS引擎用于實現文本到語音的轉換。隨著人工智能的普及以及數字設備應用的增加,相關系統對語音識別以及文語轉換技術日益依賴,TTS正在變得越來越重要。EKs28資訊網——每日最新資訊28at.com
在這項技術的幫助下,可以將文本內容轉換為錄音。可以幫助視覺障礙的人理解文本內容,可以讓開車的人聽取一個文本工作報告,甚至模擬某個人的聲音播報一段內容、演唱一個歌曲,實現虛擬主播、虛擬歌手。EKs28資訊網——每日最新資訊28at.com
本文主要查找收集了一些較好的開源TTS引擎。這些項目有助于我們更加了解TTS的功能。EKs28資訊網——每日最新資訊28at.com
EKs28資訊網——每日最新資訊28at.com
1.CoQui TTS
https://github.com/coqui-ai/TTSEKs28資訊網——每日最新資訊28at.com
這是一個在研究和生產中經過了實戰考驗的TTS深度學習工具包,可以以200毫秒的延遲進行流傳輸,支持13種語言(包括中文)。EKs28資訊網——每日最新資訊28at.com
2.mozilla TTS
https://github.com/mozilla/TTSEKs28資訊網——每日最新資訊28at.com
TTS是一個用于文本到語音生成的高級庫。旨在實現易于訓練、高速度和高質量的最佳平衡。 提供預訓練模型,以及用于測量數據集質量的工具,支持用于產品和研究的20多種語言,包括支持中文。EKs28資訊網——每日最新資訊28at.com
3.OpenTTS
https://github.com/synesthesiam/openttsEKs28資訊網——每日最新資訊28at.com
OpenTTS是TTS最有效的開源模型之一。因為該模型支持包括中文在內的多種語言。EKs28資訊網——每日最新資訊28at.com
4.MaryTTS
https://github.com/marytts/maryttsEKs28資訊網——每日最新資訊28at.com
MARY Text-to-Speech 語音合成是一個多語言TTS平臺,支持英語(英國和美國)、法語、德語、意大利語、俄語等語言。EKs28資訊網——每日最新資訊28at.com
產品特點:EKs28資訊網——每日最新資訊28at.com
- 使用預處理技術,如tokenizer和數值擴展。
- 它采用多線程網絡架構,并行處理多個請求。
- 它本質上是靈活的,因此您可以使用純Java模型和外部模型。
- 它使用XML結構來提高透明度,并且對于普通用戶來說易于理解。
5.eSpeak
https://github.com/espeak-ng/espeak-ngEKs28資訊網——每日最新資訊28at.com
eSpeak是一個緊湊的開源TTS引擎,可運行于Windows和Linux。支持100多種語種和語音(包括中文普通話)。EKs28資訊網——每日最新資訊28at.com
產品特點:EKs28資訊網——每日最新資訊28at.com
- 這個平臺可以很容易地完成文本到語音的轉換。這有助于系統理解文本的含義。
- 它帶有兩個合成器:eSpeakinG合成器,通過聲音添加技術轉換元音和響亮的輔音,以完成聲音。Klatt合成器使用類似的技術,但使用減法合成。它使用數字濾波器來理解輔音、元音和響音之間的區別。
- 因為它的差異化技術和將文本轉換為語音的速度優勢,這個工具在2010年被谷歌翻譯使用。
- 聲音的音質清晰悅耳。
6.Mimic
https://github.com/MycroftAI/mimic3EKs28資訊網——每日最新資訊28at.com
Mimic是一個快如閃電的開源TTS引擎。EKs28資訊網——每日最新資訊28at.com
產品特點:EKs28資訊網——每日最新資訊28at.com
- 由于它基于FLITE技術,您可以自定義語音的聲音。
- 它是一個低延遲平臺,并且只占用少量的資源。
- 它可以在Linux、Android和Windows上無縫運行。
目前,該工具正在為患有語言障礙的人帶來逼真的聲音。EKs28資訊網——每日最新資訊28at.com
EKs28資訊網——每日最新資訊28at.com
7.CMU Flite TTS
https://github.com/festvox/fliteEKs28資訊網——每日最新資訊28at.com
Festival Lite通常被稱為Flite。它是一個小型的運行時引擎,被認為是最快的TTS引擎之一。EKs28資訊網——每日最新資訊28at.com
由于它是一個開源引擎,并且是免費的,可以基于這個項目做許多自定義功能。因此,許多公司都選擇了這個TTS引擎。EKs28資訊網——每日最新資訊28at.com
核心特點:EKs28資訊網——每日最新資訊28at.com
- 可以用于小型和大型文件。
- 它是線程安全的,其最新版本提供了一個輕松的TTS轉換。
- 它與Windows、Linux和Android兼容。
- 它還提供多種語言版本。
EKs28資訊網——每日最新資訊28at.com
8.MBROLA
https://github.com/numediart/MBROLAEKs28資訊網——每日最新資訊28at.com
MBROLA是Multi-Band Resynthesis OverLap Add的縮寫,也是最常用的開源TTS引擎之一。它支持多種語言。EKs28資訊網——每日最新資訊28at.com
功能特點:EKs28資訊網——每日最新資訊28at.com
- 提供多語種數據庫。
- 它對于內部文本到語音的轉換非常有用。
- 它以前是一個非商業軟件,但現在作為開源TTS引擎推出。
- 它提供了令人愉快的音質,具有一致性、準確性的聲音音高。
EKs28資訊網——每日最新資訊28at.com
9.mandarin-tts
https://github.com/ranchlai/mandarin-ttsEKs28資訊網——每日最新資訊28at.com
這是一個模塊化的中文普通話TTS語音合成框架,旨在支持研究和快速產品開發。EKs28資訊網——每日最新資訊28at.com
主要功能包括:EKs28資訊網——每日最新資訊28at.com
- 所有模塊都可通過YAML配置,
- 支持并可配置說話者嵌入/韻律嵌入/多流文本嵌入,
- 適配器支持各種聲碼器(VocGAN、hifi-GAN、waveglow、melGAN),從而可以容易地進行不同聲碼器之間的比較,
- 支持持續時間/音調/能量方差預測器,并且可以容易地添加其他方差,
EKs28資訊網——每日最新資訊28at.com
10.FCH-TTS
https://github.com/atomicoo/FCH-TTSEKs28資訊網——每日最新資訊28at.com
一個快速語音合成模型,適用于英語、普通話/中文、日語、韓語、俄語和藏語。EKs28資訊網——每日最新資訊28at.com
11.rhasspy piper
https://github.com/rhasspy/piperEKs28資訊網——每日最新資訊28at.com
EKs28資訊網——每日最新資訊28at.com
piper是一個快速的本地語音合成系統,并針對Raspberry Pi 4(樹莓)進行了優化。 支持包括中文在內的多種語言。EKs28資訊網——每日最新資訊28at.com
使用DEMO如:EKs28資訊網——每日最新資訊28at.com
echo 'Welcome to the world of speech synthesis!' | / ./piper --model en_US-lessac-medium.onnx --output_file welcome.wav
本文鏈接:http://www.www897cc.com/showinfo-26-56598-0.html11個優秀開源TTS引擎
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: Prometheus Go client library 詳解
下一篇: 去測試化真的可行嗎?