OpenAI在近期的一次技術(shù)直播活動中,正式揭曉了其最新的語音模型——GPT-realtime。這款模型專為語音人工智能代理設(shè)計(jì),旨在提供前所未有的自然語音交互體驗(yàn)。
GPT-realtime以其卓越的多模態(tài)特性脫穎而出,不僅能生成流暢自然的語音,還能精準(zhǔn)模仿人類的語調(diào)、情感和語速變化。更重要的是,它能夠理解圖像內(nèi)容,并將圖像信息與語音或文本對話相結(jié)合,為客服、教育、金融、醫(yī)療等多個領(lǐng)域打造智能化語音交互體驗(yàn)。
GPT-realtime新增了Marin與Cedar兩種特色語音,并對原有8種語音進(jìn)行了全面優(yōu)化,使得語音選擇更加豐富多樣。該模型還能在語音中自動切換三種情緒,為用戶帶來更加豐富的聽覺享受。
與傳統(tǒng)語音模型相比,GPT-realtime的最大亮點(diǎn)在于其智力、推理和理解能力。它能夠敏銳捕捉笑聲等非語言信號,自如地在句子中切換語言,并根據(jù)場景需求靈活調(diào)整語氣,使對話更加自然真實(shí)。
在評估測試中,GPT-realtime展現(xiàn)出了強(qiáng)大的性能。在多種語言環(huán)境下,它對字母數(shù)字序列的檢測準(zhǔn)確率大幅提升。在BigBenchAudio評估中,該模型更是以82.8%的準(zhǔn)確率,成為目前最強(qiáng)的智能語音模型。
GPT-realtime在指令遵循能力方面也取得了顯著進(jìn)步。開發(fā)者可以對模型進(jìn)行指令自定義,包括說話方式、特定場景下的對話內(nèi)容等。經(jīng)過深度優(yōu)化,GPT-realtime對細(xì)微指令也能產(chǎn)生顯著的引導(dǎo)效果。在MultiChallenge音頻基準(zhǔn)測試中,其指令遵循準(zhǔn)確率從舊模型的20.6%提升至30.5%。
GPT-realtime在函數(shù)調(diào)用能力方面也進(jìn)行了全方位優(yōu)化。在ComplexFuncBench測試中,其得分從舊模型的49.7%飆升至66.5%。異步函數(shù)調(diào)用功能也得到了極大改進(jìn),使得長時間運(yùn)行的函數(shù)調(diào)用不再影響會話流程。
GPT-realtime還支持圖像輸入功能,開發(fā)者可以在Realtime API會話中自由添加圖像、照片、截圖等,與音頻或文本結(jié)合使用。這一功能使得模型能夠基于用戶實(shí)際所見內(nèi)容展開對話,大大提高了交互的個性化和精準(zhǔn)度。
與GPT-realtime同步上線的還有Realtime API的一系列全新功能。開發(fā)者只需在會話配置中傳入遠(yuǎn)程MCP服務(wù)器的URL,即可快速啟用MCP支持。這種配置方式大大簡化了智能體功能的擴(kuò)展過程,提高了開發(fā)效率。
Realtime API還新增了會話初始協(xié)議支持和可復(fù)用提示功能,進(jìn)一步提升了其集成便捷性和生產(chǎn)使用靈活性。會話初始協(xié)議支持使得Realtime API能夠與公共電話網(wǎng)絡(luò)、專用分組交換機(jī)系統(tǒng)等建立連接,拓展了應(yīng)用連接范圍。而可復(fù)用提示功能則允許開發(fā)者保存并在多個會話中重復(fù)使用提示,減少了重復(fù)性勞動。
在安全與隱私保障方面,Realtime API內(nèi)置了多層嚴(yán)密的防護(hù)措施。通過實(shí)時監(jiān)測對話內(nèi)容,一旦檢測到有害內(nèi)容,會立即終止會話,確保使用環(huán)境的安全與健康。開發(fā)者還可以借助Agents SDK添加自定義安全防護(hù)措施,實(shí)現(xiàn)更加精細(xì)化的安全管理。
在定價與可用性方面,GPT-realtime和Realtime API均已正式開放給所有開發(fā)者使用。與預(yù)覽版相比,GPT-realtime的價格降低了20%。同時,OpenAI還為對話上下文新增了精細(xì)控制功能,開發(fā)者可以靈活設(shè)置智能token限制,降低長會話成本。
舉報 0收藏 0打賞 0評論 0分享 0 更多>同類資訊拼多多發(fā)力短劇市場,高薪招聘制片人布局定制內(nèi)容08-29三只羊復(fù)出引熱議,辛巴退網(wǎng)成對比,市場信任度成復(fù)出關(guān)鍵08-29泡泡瑪特LABUBU熱銷背后的產(chǎn)能大考與供應(yīng)鏈升級之路08-29攜程財(cái)報超預(yù)期,股價大漲15%市值近500億美元08-29
22寸行李箱飛行指南:了解尺寸規(guī)定,讓旅行更輕松健康08-29
星空探索之旅:青年夜校星際漫游課程,帶你解鎖宇宙奧秘08-29
揭秘宇宙“紅色恒星搖籃”:天文學(xué)家發(fā)現(xiàn)星系演化新篇章08-29
眉山瑰寶:蘇東坡傳說與文化遺跡探秘08-29
嫦娥六號揭秘:月球“休眠”期火山噴發(fā)新發(fā)現(xiàn)08-29
美的荊州工廠:自研機(jī)器人全面上崗,生產(chǎn)效率平均提升超八成南方財(cái)經(jīng)8月27日電,記者走訪美的集團(tuán)(000333.SZ)洗衣機(jī)荊州工廠了解到,公司自研工業(yè)用人形機(jī)器人“美羅”已部署應(yīng)用,應(yīng)用場景包括注塑件拌勻、3D質(zhì)檢、巡檢、設(shè)備運(yùn)維等。此外該工廠還應(yīng)用了玉兔-AI巡…08-29
《天府工匠》第四季:未來科技城上演高科技救援挑戰(zhàn)挑戰(zhàn)中,無人機(jī)需在無GNSS環(huán)境下依靠3D激光雷達(dá)精準(zhǔn)定位與建圖,全程自主飛行,且僅有一塊電池,需在3分鐘內(nèi)完成任務(wù)才算成功。該挑戰(zhàn)高度模擬真實(shí)機(jī)場環(huán)境中的FOD探測場景,考驗(yàn)選手在復(fù)雜干擾下的探測算法與協(xié)同…08-29
農(nóng)用無人機(jī)選購指南:老農(nóng)人實(shí)戰(zhàn)經(jīng)驗(yàn)分享,助你精準(zhǔn)挑選省心神器如果現(xiàn)在讓我給你推薦,閉著眼買,那就在大疆和極飛這兩個牌子里面選,準(zhǔn)沒錯。但這不代表其他牌子就不能買,關(guān)鍵是要看誰更適合你。 如果你是第一次接觸農(nóng)用無人機(jī),追求穩(wěn)定和省心,或者你是一個飛防服務(wù)組織的負(fù)責(zé)人,…08-29
Z世代智能體趨勢洞察:2025中國白皮書深度解析中國智能體市場技術(shù)從工具向執(zhí)行者演進(jìn),有Embedding、Copilot、Agent三種人機(jī)協(xié)同模式,操作系統(tǒng)智能體、多模態(tài)交互等成趨勢,OpenAI、DeepSeek、智譜AI等企業(yè)有技術(shù)突破;2024年…08-29
浙江科學(xué)家研發(fā)微型渦輪發(fā)動機(jī),賦能無人機(jī)續(xù)航新高度有人搭載空中汽車上班,有人吃上了無人機(jī)送來的“空中外賣”,高山里的新鮮水果也因?yàn)榭罩羞\(yùn)輸而快速抵達(dá)餐桌……從科幻電影里的暢想,到新聞報道里的“關(guān)鍵詞”,到越來越深入我們的日常生活,“低空經(jīng)濟(jì)”是當(dāng)下不折不扣…08-29
上海環(huán)球金融中心:兩無人機(jī)400米風(fēng)洞相撞,飛手違規(guī)被罰據(jù)東方網(wǎng)報道,近日,網(wǎng)傳兩架無人機(jī)在上海環(huán)球金融中心400多米的頂部風(fēng)洞處對撞,隨后墜落在大廈96層平臺。 8月28日,上海環(huán)球金融中心工作人員告訴記者,事發(fā)當(dāng)日,其中一名無人機(jī)飛手主動聯(lián)系大廈方面,希望取…08-29點(diǎn)擊查看更多 +全站最新
中阿博覽會“外貿(mào)優(yōu)品中華行”:多地精品匯聚,共拓阿拉伯市場
張雪機(jī)車摩博會預(yù)告:三款新車亮相,復(fù)古街車、街車與林道車齊發(fā)
鴻蒙智行尚界H5新車發(fā)布:20萬內(nèi)中型SUV,續(xù)航強(qiáng)勁引發(fā)熱銷
沃爾沃XC70發(fā)布會:豪華超混新標(biāo)桿,BBA面臨挑戰(zhàn)
沃爾沃XC70超級混動:豪華新能源的穩(wěn)健選擇,定義出行新標(biāo)準(zhǔn)
經(jīng)典絕唱?大眾高爾夫R特別版或告別純?nèi)加停钶dRS3同款五缸機(jī)熱門內(nèi)容
嫦娥六號揭秘:月球“休眠”期火山噴發(fā)新發(fā)現(xiàn)
美的荊州工廠:自研機(jī)器人全面上崗,生產(chǎn)效率平均提升超八成
《天府工匠》第四季:未來科技城上演高科技救援挑戰(zhàn)
農(nóng)用無人機(jī)選購指南:老農(nóng)人實(shí)戰(zhàn)經(jīng)驗(yàn)分享,助你精準(zhǔn)挑選省心神器
Z世代智能體趨勢洞察:2025中國白皮書深度解析
浙江科學(xué)家研發(fā)微型渦輪發(fā)動機(jī),賦能無人機(jī)續(xù)航新高度
本文鏈接:http://www.www897cc.com/showinfo-45-27072-0.htmlGPT-Realtime發(fā)布:OpenAI引領(lǐng)AI語音智能體進(jìn)入逼真對話新紀(jì)元
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com