7 月 4 日消息,商湯科技在世界人工智能大會(WAIC)上發布了首個“可控”人物視頻生成大模型 Vimi,通過一張任意風格的照片就能生成和目標動作一致的人物類視頻,并支持多種驅動方式,可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動。
與圖片表情控制類技術只能控制頭部表情動作不同,商湯稱 Vimi 不但可以實現精準的人物表情控制,還可實現在半身區域內控制照片中人物的自然肢體變化,并自動生成與人物相符的頭發、服飾及背景變化。
同時 Vimi 可穩定生成 1 分鐘的單鏡頭人物類視頻,畫面效果不會隨著時間的變化而劣化或失真,滿足娛樂互動等需要長時間穩定視頻生成需求。
Vimi 將完全面向 C 端用戶開放使用,用戶只需上傳不同角度的高清人物圖片,即可自動生成數字分身和不同風格的寫真視頻。
由 Vimi 生成的視頻人物不再只是呆板的五官運動,而是搭配手勢、肢體、頭發等,形成更完整、統一的人物動作,讓創作者可基于生成的視頻素材進行剪輯和再創作。
商湯表示將在明日公布 Vimi 的更多細節,也會持續關注并帶來跟進報道。
本文鏈接:http://www.www897cc.com/showinfo-45-4969-0.html一張照片創造 1 分鐘人物視頻,商湯發布首個“可控”人物視頻生成大模型 Vimi
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com