9 月 6 日消息,西湖心辰昨日發(fā)布了心辰 Lingo 語(yǔ)音大模型,號(hào)稱是“國(guó)內(nèi)首個(gè)端到端通用語(yǔ)音大模型”。
官方表示,針對(duì)心辰 Lingo端到端語(yǔ)音大模型的能力,在多個(gè)領(lǐng)域和中文上進(jìn)行增強(qiáng),使得心辰 Lingo 的中文語(yǔ)音效果,相較 GPT-4o 更為出色。心辰 Lingo 于 8 月24 日開啟內(nèi)測(cè),至今已經(jīng)有超千家企業(yè)用戶預(yù)約測(cè)試。
相比較傳統(tǒng) TTS,端到端語(yǔ)音大模型則是一種更為全面的技術(shù),不僅可以語(yǔ)音識(shí)別,還集成了自然語(yǔ)言處理、意圖識(shí)別、對(duì)話管理以及語(yǔ)音合成等多個(gè)環(huán)節(jié),實(shí)現(xiàn)了從語(yǔ)音輸入到語(yǔ)音反饋的完整交互過(guò)程。
心辰 Lingo 語(yǔ)音模型技術(shù)能力上具備以下三個(gè)特點(diǎn):
原生的語(yǔ)音理解:能夠識(shí)別語(yǔ)音中的文字信息與其他重要特征,如情感、語(yǔ)氣、音調(diào)等
多種語(yǔ)音風(fēng)格表達(dá):可以根據(jù)上下文和用戶指令,自適應(yīng)調(diào)整語(yǔ)音的速度、高低、噪聲強(qiáng)度,并能夠生成對(duì)話、歌唱、相聲等多種風(fēng)格的語(yǔ)音響應(yīng)
語(yǔ)音模態(tài)超級(jí)壓縮:采用具有數(shù)百倍壓縮率的語(yǔ)音編解碼器,降低計(jì)算和存儲(chǔ)成本
注意到,目前心辰 Lingo 語(yǔ)音大模型仍需通過(guò)內(nèi)測(cè)申請(qǐng),申請(qǐng)鏈接如下:https://lingo.xinchenai.com/
本文鏈接:http://www.www897cc.com/showinfo-45-6945-0.html“國(guó)內(nèi)首個(gè)端到端通用語(yǔ)音 AI 大模型”心辰 Lingo 發(fā)布,號(hào)稱中文效果比 GPT-4o 更出色
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 騰訊邱躍鵬揭秘未來(lái)云:智能化、融合創(chuàng)新、國(guó)際化,你準(zhǔn)備好了嗎?