12 月 4 日消息,Meta 日前公布了 AI 翻譯套件 Seamless Communication,該套件由 4 款 AI 模型組成,Meta聲稱,該 AI 套件能夠“精準(zhǔn)再現(xiàn)說話者情緒”,可實(shí)現(xiàn)延遲僅 2 秒的同聲傳譯能力、并支持近百種語言輸入。
據(jù)悉,Seamless Communication 是 Meta 慶祝自家 AI 研究機(jī)構(gòu)“Fundamental AI Research”成立 10 周年所發(fā)表的研究成果。
Meta 介紹稱,該套件包含用于加速翻譯的“第二代 SeamlessM4T模型”、口譯模型“Seamless Expressive”、同聲翻譯模型“Seamless Streaming”,與綜合模型“Seamless”,整理相關(guān)信息如下:
SeamlessM4T 模型號稱能在翻譯時基于用戶說話內(nèi)容,自動聯(lián)想可能的后文,以加速翻譯。
Seamless Expressive 是一種口譯模型,號稱可以解決“傳統(tǒng) AI 翻譯無法抓住用戶語調(diào)、停頓、讀詞重輕度的問題”,能夠在維持翻譯品質(zhì)的基礎(chǔ)上,保存用戶情緒、風(fēng)格、說話速度、停頓和節(jié)奏,從而為翻譯內(nèi)容帶來更多“情感信息”。
Seamless Streaming 是同聲翻譯模型,主打 2 秒延遲的語音和文字翻譯,支持口譯(speech-to-speech translation)、聽寫翻譯(speech-to-text translation,S2TT)及自動語音識別功能(Automatic speech recognition,ASR)。
而綜合模型 Seamless,則是整合了上述三種語言模型,便于通用場景。
目前 Meta 已經(jīng)將示例視頻發(fā)布在 GitHub 以及 HuggingFace 網(wǎng)站上,感興趣的小伙伴們可以點(diǎn)此進(jìn)行查看。
本文鏈接:http://www.www897cc.com/showinfo-45-2803-0.htmlMeta 推出 Seamless Communication AI 翻譯套件:支持近百種語言輸入、同聲延遲僅 2 秒
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 被曝泄露隱私后,現(xiàn)在要求 ChatGPT 重復(fù)一個單詞可能違反其條款
下一篇: 微軟僅憑「提示工程」讓 GPT-4 成醫(yī)學(xué)專家!超過一眾高度微調(diào)模型,專業(yè)測試準(zhǔn)確率首次超 90%