10 月 25 日消息,智譜今天宣布上線 GLM-4-Voice 端到端情感語(yǔ)音模型。官方表示,其能夠理解情感,有情緒表達(dá)、情感共鳴,可自助調(diào)節(jié)語(yǔ)速,支持多語(yǔ)言和方言,并且延時(shí)更低、可隨時(shí)打斷,用戶即日起可在“智譜清言”App 上體驗(yàn)。
據(jù)介紹,GLM-4-Voice 具備如下特點(diǎn):
情感表達(dá)和情感共鳴:聲音有不同的情感和細(xì)膩的變化,如高興、悲傷、生氣、害怕等。
調(diào)節(jié)語(yǔ)速:在同一輪對(duì)話中,可以要求 TA 快點(diǎn)說(shuō) or 慢點(diǎn)說(shuō)。
隨時(shí)打斷,靈活輸入指令:根據(jù)實(shí)時(shí)的用戶指令,調(diào)整語(yǔ)音輸出的內(nèi)容和風(fēng)格,支持更靈活的對(duì)話互動(dòng)。
多語(yǔ)言、多方言支持:目前 GLM-4-Voice 支持中英文語(yǔ)音以及中國(guó)各地方言,尤其擅長(zhǎng)粵語(yǔ)、重慶話、北京話等。
結(jié)合視頻通話,能看也能說(shuō):即將上線視頻通話功能。
此外,智譜 AutoGLM 具備 phone use 能力,只需接收簡(jiǎn)單的文字 / 語(yǔ)音指令,它就可以模擬人類操作手機(jī)。其不受限于簡(jiǎn)單的任務(wù)場(chǎng)景或 API 調(diào)用,也不需要用戶手動(dòng)搭建復(fù)雜繁瑣的工作流,操作邏輯與人類類似。
GLM-4-Voice 同期對(duì)外開(kāi)源,官方稱其為智譜首個(gè)開(kāi)源的端到端多模態(tài)模型。附地址:
代碼倉(cāng)庫(kù):
https://github.com/THUDM/GLM-4-Voice
本文鏈接:http://www.www897cc.com/showinfo-45-9270-0.html智譜清言上線情感語(yǔ)音模型 GLM-4-Voice:可理解情感,有情緒表達(dá)和共鳴
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com