如今的 AI 看起來已經無所不能,不僅能夠勝任感知、學習、推理、決策等不同層面的任務,甚至可以打造虛擬數字分析,為人類帶來多模態(tài) AI 交互體驗。近日,新型社交平臺 Soul App 在 GITEX GLOBAL 海灣信息技術博覽會上展出了其最新自研的多模態(tài)大模型,該模型具備多模態(tài)理解、真實擬人、文字對話、語音通話、多語種等特性,實現打破次元壁的互動,讓現場的觀眾們驚艷不已。
3D 數字孿生,虛擬與現實的創(chuàng)新交互
Soul 作為國內較早將 AI 引入社交關系的互聯網平臺代表之一,此次攜最新自研的多模態(tài)大模型參展 GITEX GLOBAL 2024,向世界展現了中國企業(yè)在社交領域的最新應用實踐和數字娛樂的創(chuàng)新方案。此次是 Soul 首次亮相國際大型展會,其自研的多模態(tài)大模型集合文字、語音、動作交互等多模態(tài)方向,實現更接近人類模式的互動體驗和更高效、自然、豐富維度的信息傳遞。
大會上,現場觀眾可以實現高相似度的 3D 虛擬人的 AI 建模,通過包含人臉的 90 余個形狀參數和 6 個屬性參數,于幾秒鐘內,快速在 3D 世界精細化還原真實人臉的特征,打造專屬的虛擬化身。同時,基于實時的人體動作識別、數字還原以及多模態(tài)對話交互能力,實現 3D 虛擬人與真人的沉浸式互動。
多模態(tài)端到端大模型,超擬人的情感體驗
事實上,自成立以來 Soul 便一直聚焦于多模態(tài)大模型方向持續(xù)深耕。
在推出智能推薦引擎“靈犀”、以 AI 算法助力社交關系的發(fā)現沉淀環(huán)節(jié)后,2020 年,Soul 正式啟動對 AIGC 的技術研發(fā)工作,系統推進在智能對話、語音技術、3D 虛擬人等 AIGC 關鍵技術能力研發(fā)工作,并推動 AI 能力在社交場景的快速落地。
目前,Soul 已先后上線了自研語言大模型 Soul X,以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年 6 月,Soul 還在社交行業(yè)中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風格語言,實現更接近生活日常的交互對話和“類真人”的情感陪伴體驗。
多模態(tài)端到端大模型的推出標志著 Soul 對人機交互體驗的創(chuàng)新突破,同時,從文字、語音到視覺的模態(tài)升級,也意味著交互方式的顛覆式改變。在未來,Soul 將持續(xù)加大對 AI 技術的投入,致力于通過 AI 技術更好地幫助用戶進行社交破冰,助力人設搭建和認知決策,提升社交溝通效率。
本文鏈接:http://www.www897cc.com/showinfo-26-125072-0.htmlSoul App 自研多模態(tài)大模型,全面賦能用戶社交體驗
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com