亞馬遜公司(Amazon)在年度云科技盛會(huì)AWS re: Invent上宣布,其語(yǔ)音轉(zhuǎn)文字平臺(tái)Amazon Transcribe將支持100種口語(yǔ)語(yǔ)言,這一突破得益于生成式人工智能(Generative AI)技術(shù)的驅(qū)動(dòng)。同時(shí),AWS還推出了多項(xiàng)AI功能,包括通話轉(zhuǎn)錄(call transcription)等。
據(jù)The Verge報(bào)道,Amazon Transcribe是一種完全受管控的自動(dòng)語(yǔ)音識(shí)別(ASR)服務(wù)。它基于生成式AI和數(shù)十億個(gè)參數(shù)的語(yǔ)音基礎(chǔ)模型(speech foundation model),可以提供超過(guò)100種語(yǔ)言的語(yǔ)音轉(zhuǎn)文字服務(wù),同時(shí)提供更準(zhǔn)確的標(biāo)點(diǎn)和大小寫(xiě)格式,以提高可讀性。此外,對(duì)于電話語(yǔ)音轉(zhuǎn)文字的正確性提高了30-70%。
新的語(yǔ)音基礎(chǔ)模型是以數(shù)百萬(wàn)小時(shí)、超過(guò)100種語(yǔ)言的無(wú)標(biāo)記語(yǔ)音數(shù)據(jù)為基礎(chǔ)進(jìn)行訓(xùn)練的。這種模型通過(guò)自我監(jiān)督式演算法學(xué)習(xí)人們用不同語(yǔ)言和口音說(shuō)話的普遍模式。此外,為了確保非常規(guī)語(yǔ)言和常規(guī)語(yǔ)言的語(yǔ)音轉(zhuǎn)文字都能達(dá)到高正確性,AWS通過(guò)智能數(shù)據(jù)采樣最佳化訓(xùn)練數(shù)據(jù)以平衡各種語(yǔ)言的代表性。
在2022年后期,Amazon Transcribe支持的語(yǔ)言數(shù)量已經(jīng)達(dá)到了79種,還具備自動(dòng)語(yǔ)言識(shí)別、自動(dòng)標(biāo)點(diǎn)、定制化詞匯等功能。同時(shí),它能夠識(shí)別嘈雜環(huán)境以及音頻和視頻格式中的語(yǔ)音。根據(jù)AWS的統(tǒng)計(jì),語(yǔ)音基礎(chǔ)模型讓多數(shù)語(yǔ)言在Amazon Transcribe進(jìn)行語(yǔ)音轉(zhuǎn)文字的正確性顯著提升了20-50%。
此外,AWS還宣布了Amazon Personalization產(chǎn)品的兩項(xiàng)新功能,包括能夠根據(jù)用戶過(guò)去的觀看行為推薦新節(jié)目的Amazon Personalization以及能夠撰寫(xiě)傳送到主題建議列表的標(biāo)題或電子郵件主旨的Content Generation。
在競(jìng)爭(zhēng)激烈的市場(chǎng)中,Otter.ai主要面向普通消費(fèi)者和企業(yè)用戶提供AI語(yǔ)音轉(zhuǎn)文字服務(wù),并于2023年6月推出了總結(jié)工具;而Meta Platforms也在開(kāi)發(fā)一種基于生成式AI、能夠識(shí)別近100種口語(yǔ)語(yǔ)言的翻譯模型。
本文鏈接:http://www.www897cc.com/showinfo-27-35478-0.htmlAmazon Transcribe利用生成式AI支持100種語(yǔ)言
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com