日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 軟件

大模型超擬人合成技術(shù) PK 賽上演 微軟、訊飛誰是“王者”?

來源: 責(zé)編: 時間:2024-04-15 18:06:08 162觀看
導(dǎo)讀 近期,微軟對其 Azure AI 語音服務(wù)進行了重要升級,新上線了 9 款更真實的 AI 語音。微軟提升了 AI 語音的自然度,在語調(diào)、節(jié)奏和情感上更好捕捉了人類語音的細(xì)微差別,讓合成的語音更加生動和真實,其逼真的效果引發(fā)

近期,微軟對其 Azure AI 語音服務(wù)進行了重要升級,新上線了 9 款更真實的 AI 語音。微軟提升了 AI 語音的自然度,在語調(diào)、節(jié)奏和情感上更好捕捉了人類語音的細(xì)微差別,讓合成的語音更加生動和真實,其逼真的效果引發(fā)大家的關(guān)注討論。jxQ28資訊網(wǎng)——每日最新資訊28at.com

jxQ28資訊網(wǎng)——每日最新資訊28at.com

▲微軟 Azure AI 語音合成體驗頁面

但這一次微軟并非領(lǐng)先者,早在 2 個月前,科大訊飛就在訊飛星火 V3.5 發(fā)布會上,率先推出了超擬人語音合成技術(shù),并搭載在訊飛星火 App 中開放給全民體驗。其擬人度超過 83%,MOS 分達到 4.5 分(滿分 5 分,分?jǐn)?shù)越高表示語音質(zhì)量越好),體驗下來它的聲音流暢自然,表達已非常接近人類的真實聲音。jxQ28資訊網(wǎng)——每日最新資訊28at.com

可以看到,隨著大模型的發(fā)展如火如荼,作為重要的表達方式,超擬人合成技術(shù)成為國內(nèi)外 AI 巨頭爭相布局的重點,一場超擬人合成技術(shù) PK 賽正在上演。jxQ28資訊網(wǎng)——每日最新資訊28at.com

微軟 VS 科大訊飛:星火擬人度更優(yōu)jxQ28資訊網(wǎng)——每日最新資訊28at.com

語音合成技術(shù)在上世紀(jì)九十年代后快速發(fā)展,尤其是深度學(xué)習(xí)技術(shù)的出現(xiàn)推動語音合成進入全新階段,逐步走向規(guī)模化應(yīng)用落地、被大眾所熟知。相比字正腔圓的“播音腔”,現(xiàn)在語音合成的風(fēng)向標(biāo)更多指向貼近真人日常表達,也就是超擬人。jxQ28資訊網(wǎng)——每日最新資訊28at.com

普通人正常交流對話中會帶有一定的語氣、情感和口語化表達,也會出現(xiàn)重復(fù)、卡頓、嘆氣、呼吸、說錯字詞,還有吞音、輕聲等習(xí)慣說法。考量超擬人語音效果,不僅要看說話的自然度、流暢度,也要看這些口語化和副語言的頻率和細(xì)節(jié)是否更貼近真實,以及語音中的情感是否貼合說話內(nèi)容等維度。jxQ28資訊網(wǎng)——每日最新資訊28at.com

目前,微軟上新的 AI 語音可以在 Azure AI 服務(wù)頁面里進行試聽和調(diào)用,科大訊飛超擬人合成在訊飛星火 App 和訊飛開放平臺上均可體驗和使用。jxQ28資訊網(wǎng)——每日最新資訊28at.com

jxQ28資訊網(wǎng)——每日最新資訊28at.com

近日,也有媒體以相同的文本對兩者的超擬人合成技術(shù)進行了體驗評測,發(fā)現(xiàn)微軟和科大訊飛在超擬人合成的擬人度上相較傳統(tǒng)語音合成效果都有了顯著進步,克服了合成聲音“板正”、“一絲不茍”的“播音腔”問題;同時在停頓、語速變化等副語言上的表現(xiàn)也相當(dāng)自然,“哈哈”、“嗯”等常見的口語化詞語也和說話內(nèi)容進行了較好融合。jxQ28資訊網(wǎng)——每日最新資訊28at.com

對比來看,微軟上新的 9 款 AI 語音覆蓋了更多語種和說話風(fēng)格,說話的自然度和流暢度相對較好,但在語氣詞等口語化表達上稍顯突兀;科大訊飛的超擬人合成在整體的擬人化程度上略勝一籌,交互和表達效果更生活化、也更自然,口語化詞語的插入不突兀,遇到一些中英文混雜的詞語,也能做到發(fā)音自然。jxQ28資訊網(wǎng)——每日最新資訊28at.com

值得一提的是,科大訊飛超擬人合成在情感表達上表現(xiàn)更為突出。在輸入表達不同程度開心的相關(guān)文字后,訊飛超擬人合成的效果能夠根據(jù)程度不同展現(xiàn)出可感知的差別;而微軟在情感表達上稍遜一籌,合成效果與普通語氣基本沒有差異。綜合來看,科大訊飛的超擬人技術(shù)在擬人度與情感表達上更優(yōu)。jxQ28資訊網(wǎng)——每日最新資訊28at.com

通用大模型 + 語音大模型 讓語音合成更逼真jxQ28資訊網(wǎng)——每日最新資訊28at.com

今年 1 月 30 日科大訊飛發(fā)布超擬人合成時,也發(fā)布了最新的星火語音大模型,它可謂是讓語音合成聽起來更加自然和逼真的“殺手锏”。jxQ28資訊網(wǎng)——每日最新資訊28at.com

jxQ28資訊網(wǎng)——每日最新資訊28at.com

▲圖片來源于訊飛星火 V3.5 發(fā)布會內(nèi)容

它是如何做到的呢?首先,基于星火通用大模型的能力,來預(yù)測文本中的口語化現(xiàn)象、情感、停頓等細(xì)節(jié)信息,這對于傳達說話者的真實感受非常重要;然后,星火語音大模型學(xué)習(xí)人類的口語化表達方式后,對通用大模型預(yù)測的口語化信息進行還原,從而極大提高了合成的擬人化效果。jxQ28資訊網(wǎng)——每日最新資訊28at.com

之所以能夠抓住先機,在超擬人合成技術(shù)上率先突破并取得成效,這與訊飛多年來深厚的技術(shù)積累與持續(xù)創(chuàng)新緊密相關(guān)。jxQ28資訊網(wǎng)——每日最新資訊28at.com

在科大訊飛創(chuàng)立之初,就在 1998 年的國家“863”計劃語音合成比賽中奪得冠軍。此后,科大訊飛更是在國際語音合成界的“奧斯卡”Blizzard Challenge 評測賽事中拿下十四連冠,還實現(xiàn)了中英文語音合成業(yè)界首次超過普通人說話水平等一系列成就,可謂是 AI 語音“王者”。jxQ28資訊網(wǎng)——每日最新資訊28at.com

近年來,訊飛在多語種語音合成應(yīng)用、方言合成、合成語音情感上持續(xù)創(chuàng)新,并且推出全新語音合成系統(tǒng) SMART-TTS,實現(xiàn)多風(fēng)格、多情感合成,能夠根據(jù)需求對聲音進行調(diào)節(jié)和創(chuàng)作。超擬人合成技術(shù)的率先上線和驚艷效果,背后是科大訊飛多年如一日的積累與突破。jxQ28資訊網(wǎng)——每日最新資訊28at.com

隨著訊飛星火 App 上線了超擬人合成技術(shù)后,受到了許多用戶的喜愛,在訊飛開放平臺上也成為開發(fā)者的熱門選擇,并將在車載、機器人、智能客服等領(lǐng)域推出落地應(yīng)用。據(jù)了解,訊飛超擬人合成升級版本也會在近期推出,將進一步增強喜怒哀樂等各種類型的情感反饋能力。jxQ28資訊網(wǎng)——每日最新資訊28at.com

超擬人技術(shù)有望引爆萬物互聯(lián)時代的交互體驗jxQ28資訊網(wǎng)——每日最新資訊28at.com

萬物互聯(lián)時代,語音正在成為人機交互的主要入口。超擬人合成技術(shù)不僅能夠提供更加自然流暢的交互體驗,還能夠通過模擬人類的情感和行為,為用戶提供更加個性化和富有同理心的服務(wù),將變革我們的人機交互體驗。jxQ28資訊網(wǎng)——每日最新資訊28at.com

市場規(guī)模的增長也從側(cè)面印證了這一趨勢。據(jù)相關(guān)報告預(yù)測,全球生成式 AI 市場規(guī)模將從 2022 年的 400 億美元,擴大至 2032 年的 1.3 萬億美元。中國生成式 AI 商業(yè)應(yīng)用規(guī)模預(yù)計到 2025 年將達到 2070 億元,未來五年的年均增速 84%。超擬人技術(shù)作為生成式 AI 的重要表達方式,展現(xiàn)出巨大的市場潛力。jxQ28資訊網(wǎng)——每日最新資訊28at.com

而在這一技術(shù)上,以科大訊飛等為代表的中國 AI 企業(yè)已經(jīng)率先布局,實現(xiàn)了國際領(lǐng)先,有望在全球市場中占據(jù)重要地位。jxQ28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-83426-0.html大模型超擬人合成技術(shù) PK 賽上演 微軟、訊飛誰是“王者”?

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 順豐同城推出奢侈品專送服務(wù),已在北京、上海等城市上線

下一篇: 科技一周大事(4 月 8 日-14 日):暴雪游戲國服官宣夏季回歸;14 部門印發(fā)文件推動消費品以舊換新;運營時速提升至 400 公里,世界最快高鐵動車組 CR450 年內(nèi)下線

標(biāo)簽:
  • 熱門焦點
  • 官方承諾:K60至尊版將會首批升級MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版將會搭載天璣9200+處理器和獨顯芯片X7的同時,Redmi給出了官方承諾,K60至尊重大更新首批升級,會首批推送MIUI 15。也就是說雖然
  • 對標(biāo)蘋果的靈動島 華為帶來實況窗功能

    繼蘋果的靈動島之后,華為也在今天正式推出了“實況窗”功能。據(jù)今天鴻蒙OS 4.0的現(xiàn)場演示顯示,華為的實況窗可以更高效的展現(xiàn)出實時通知,比如鎖屏上就能看到外賣、打車、銀行
  • 線程通訊的三種方法!通俗易懂

    線程通信是指多個線程之間通過某種機制進行協(xié)調(diào)和交互,例如,線程等待和通知機制就是線程通訊的主要手段之一。 在 Java 中,線程等待和通知的實現(xiàn)手段有以下幾種方式:Object 類下
  • 摸魚心法第一章——和配置文件說拜拜

    為了能摸魚我們團隊做了容器化,但是帶來的問題是服務(wù)配置文件很麻煩,然后大家在群里進行了“親切友好”的溝通圖片圖片圖片圖片對比就對比,簡單對比下獨立配置中心和k8s作為配
  • 三言兩語說透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是兩種很有用的技術(shù),可以幫助我們寫出更加優(yōu)雅、泛用的函數(shù)。本文將首先介紹柯里化和反柯里化的概念、實現(xiàn)原理和應(yīng)用
  • 一個注解實現(xiàn)接口冪等,這樣才優(yōu)雅!

    場景碼猿慢病云管理系統(tǒng)中其實高并發(fā)的場景不是很多,沒有必要每個接口都去考慮并發(fā)高的場景,比如添加住院患者的這個接口,具體的業(yè)務(wù)代碼就不貼了,業(yè)務(wù)偽代碼如下:圖片上述代碼有
  • 小米公益基金會捐贈2500萬元馳援北京、河北暴雨救災(zāi)

    8月2日消息,今日小米科技創(chuàng)始人雷軍在其微博上發(fā)布消息稱,小米公益基金會宣布捐贈2500萬元馳援北京、河北暴雨救災(zāi)。攜手抗災(zāi),京冀安康!以下為公告原文
  • iQOO Neo8系列新品發(fā)布會

    旗艦雙芯 更強更Pro
  • 最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

    2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現(xiàn)在已經(jīng)可以購買了,這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆
Top 主站蜘蛛池模板: 偃师市| 波密县| 桂林市| 永福县| 神农架林区| 常熟市| 泗阳县| 长治市| 龙陵县| 农安县| 弥勒县| 湖口县| 环江| 临泉县| 石嘴山市| 临沭县| 涡阳县| 三亚市| 商南县| 旅游| 瓦房店市| 鄱阳县| 揭东县| 敦煌市| 久治县| 嘉义市| 广平县| 女性| 乌兰浩特市| 广水市| 太白县| 普格县| 黄冈市| 南昌市| 绥中县| 鄂温| 磴口县| 阜康市| 吉木乃县| 图木舒克市| 新余市|