12 月 2 日消息,谷歌今天發布新聞稿,正式介紹推出了名為 Translatotron 3 的新 AI 模型,無需任何并行語音數據下,可以實現語音對語音的同聲傳譯翻譯。
谷歌于 2019 年推出了 Translatotron S2ST 系統,于 2021 年 7 月推出第 2 個版本,在 2023 年 5 月 27 日發布的一篇論文中,宣布正在部署新方法,訓練 Translatotron 3。
研究人員稱,Translatotron 2 已經提供了卓越的翻譯質量、語音魯棒性(Robust)和語音自然度,而 Translatotron 3 實現“第一個完全無監督直接語音到語音翻譯的端對端模型”。
傳統上的 S2ST 通過自動語音識別 + 機器翻譯 + 文本到語音合成的級聯方法來解決,但 Translatotron 3 依賴一種新穎的端對端架構,直接將源語言語音映射到目標語言,而不依賴中間文本表示。
Translatotron 3 模型還可用于創建幫助有語言障礙的人的工具,或者開發更具吸引力和有效性的個性化語言學習工具。
附上官方新聞稿地址,感興趣的用戶可以點擊深入閱讀。
本文鏈接:http://www.www897cc.com/showinfo-45-2769-0.htmlAI 同聲傳譯新突破,谷歌發布 Translatotron 3 模型:可繞過文本轉換步驟
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com