7月5日消息,商湯科技今日正式發布了全新的“日日新 SenseNova5.5”大模型體系,并同時推出了國內首款所見即所得模型“日日新 5o”。該模型以其卓越的交互效果,直接對標業界領先的GPT-4o。
“日日新5o”通過深度整合聲音、文本、圖像和視頻等多種形式的跨模態信息,為用戶帶來了一種前所未有的AI交互體驗——實時的流式多模態交互。這種交互方式賦予了模型聽、看以及尋找話題的能力,使其在與用戶的溝通中表現得如同一個真實的對話伙伴。
據ITBEAR科技資訊了解,“日日新5o”的交互模式在實時對話和語音識別等領域具有廣泛的應用前景。其強大的多任務處理能力使得它可以在同一模型中同時處理多種任務,并且能夠根據不同的上下文環境靈活地調整其響應和行為。
作為國內首個流式原生多模態交互模型,“日日新5.5”的推出無疑是一個重要的里程碑。該模型基于超過10TB的高質量訓練數據,其中包括大量精心合成的人工數據,構建起了復雜而高效的高階思維鏈。通過采用創新的混合端云協同架構,“日日新5.5”擁有高達6000億的參數,從而確保了模型能夠在云端和邊緣端之間實現最佳協同,提供高達109.5字/秒的快速推理能力。
此外,商湯科技在本次發布會上還揭曉了另一項重要創新——可控人物視頻生成大模型Vimi。這款面向消費者用戶的大模型僅需一張任意風格的照片,便能生成與目標動作高度一致的人物視頻。Vimi支持通過多種方式進行驅動,包括現有的人物視頻、動畫、聲音以及文字等,為用戶提供了極大的創作靈活性。
本文鏈接:http://www.www897cc.com/showinfo-45-5930-0.html商湯“日日新 5o”模型發布,交互效果直追GPT-4o,開啟智能新紀元
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com