近日OpenAI宣布推出一項創新的聲音克隆技術——“Voice Engine”。該技術能夠在極短的時間內,通過簡單的文本輸入和15秒的音頻樣本,復刻出與原始說話者極為相似的語音,其情感表達豐富且自然逼真。
“Voice Engine”技術的研發始于2022年,目前已成功集成到OpenAI的文本轉語音API和Read Aloud功能中。該技術的核心優勢在于其高效率和高質量,僅需15秒的音頻樣本即可生成精準的語音復刻,極大地節省了傳統聲音復刻所需的時間和資源。
OpenAI認為,“Voice Engine”技術在多個領域都有著廣泛的應用前景。在閱讀輔助和語言翻譯領域,它能夠提供更為自然的語音輸出,極大地提升用戶的聽覺體驗。此外,對于言語障礙患者,該技術提供了一種全新的交流方式,幫助他們更好地融入社會。
OpenAI高度重視合成語音技術的潛在風險,目前僅對少數可信合作伙伴開放小規模測試。公司致力于深入了解技術的潛在應用,并積極評估可能帶來的風險。同時,OpenAI也倡導社會各界共同參與到合成語音技術負責任部署的討論中,探索適應這一新型技術的最佳途徑。
為了確保“Voice Engine”技術的安全使用,OpenAI采取了一系列嚴格的安全措施。其中包括使用水印技術追蹤音頻來源,以及對系統使用方式的主動監控。此外,公司計劃在產品正式推向市場時,設立一個“禁止語音列表”,以檢測并阻止與名人聲音過于相似的人工智能生成聲音,從而避免潛在的版權和隱私問題。
OpenAI將繼續致力于“Voice Engine”技術的研發和完善,旨在為用戶提供更加安全、高效和自然的聲音復刻體驗。公司期待與全球合作伙伴一起,推動這一技術在各個領域的廣泛應用,同時確保其負責任地服務于社會。
本文鏈接:http://www.www897cc.com/showinfo-16-80735-0.htmlOpenAI推出聲音克隆新技術:復刻你的聲音僅需15秒
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com