4 月 1 日消息,人工智能(AI)初創公司 Runway 于本周一發布了其最新研發的 AI 視頻生成模型 Gen-4。該公司聲稱,這是目前為止保真度最高的 AI 驅動視頻生成工具之一。
新發布的 Gen-4 模型現已開始向 Runway 的個人及企業客戶推送。據 Runway 介紹,該模型的核心優勢在于能夠在不同的視頻場景中保持角色、地點和物體的高度一致性,維持“連貫的世界環境”,并且能夠從場景內的不同視角和位置重新生成元素。
Runway 在其官方博客文章中指出:“Gen-4 能夠有效利用視覺參考資料,并結合用戶的文本指令,創造出風格、主體、地點等要素保持一致的新圖像和視頻,整個過程無需進行模型微調或額外的專門訓練。”
Runway 公司獲得了包括 Salesforce、谷歌和英偉達在內的知名投資機構的支持,專注于提供包括 Gen-4 在內的一系列 AI 視頻創作工具。然而,在 AI 視頻生成這一競爭激烈的賽道上,Runway 面臨著來自 OpenAI 和谷歌等科技巨頭的強勁挑戰。為了在市場中脫穎而出,Runway 采取了差異化競爭策略,不僅與一家好萊塢大型電影制片廠達成了合作協議,還特別撥出數百萬美元資金,用于資助那些運用 AI 生成視頻技術進行創作的電影項目。
具體到 Gen-4 的功能,Runway 表示,用戶只需提供角色的參考圖像,模型便能在不同的光照條件下生成外觀持續一致的角色。在構建具體場景時,用戶可以上傳主體的圖像,并輔以文字描述,明確說明希望生成的鏡頭構圖要求。
Runway 在博客中進一步強調:“Gen-4 在生成具有高度動態感和逼真運動效果的視頻方面表現卓越,同時在主體、物體和風格的一致性、對用戶指令的精準遵循度以及對現實世界規律的理解方面,均達到了同類頂尖水平。”公司還宣稱,“Runway Gen-4 的發布,也標志著視覺生成模型在模擬真實世界物理規律的能力方面取得了一個重要的里程碑。”
如同當前所有的視頻生成模型一樣,Gen-4 也是通過對海量的視頻數據進行訓練而成的。通過學習這些數據中的模式,模型得以生成全新的合成視頻片段。然而,Runway 方面拒絕透露其訓練數據的具體來源,部分原因是出于保護商業競爭優勢的考量,但也因為訓練數據的細節往往是潛在知識產權訴訟的敏感地帶。
一個典型的例子是,Runway 目前正面臨一起由藝術家群體提起的訴訟。該訴訟指控 Runway 及其他幾家生成式 AI 公司,在未經授權的情況下,使用了受版權保護的藝術作品來訓練其 AI 模型。對此,Runway 主張其行為受到“合理使用”(Fair Use)原則的保護,應免于承擔法律責任。目前,該案的最終結果尚不明朗。
這場法律糾紛對于 Runway 來說風險頗高。據《The Information》報道,Runway 目前正在進行新一輪融資,此輪融資可能使其公司估值達到 40 億美元(注:現匯率約合 290.44 億元人民幣)。隨著其視頻生成模型 API(應用程序編程接口)等新產品的陸續推出,Runway 期望能在今年實現 3 億美元的年化收入目標。
無論這場官司走向如何,以 Gen-4 為代表的生成式 AI 視頻工具正對現有的電影和電視行業帶來顛覆性的挑戰。由代表好萊塢動畫師和漫畫家的動畫協會(Animation Guild)在 2024 年委托進行的一項研究顯示,在已經采用 AI 技術的電影制作公司中,高達 75% 的公司在引入該技術后,出現了裁減、合并崗位或直接取消職位的現象。該研究同時預測,到 2026 年,生成式 AI 可能會沖擊超過 10 萬個美國娛樂行業的工作崗位。
本文鏈接:http://www.www897cc.com/showinfo-45-11902-0.htmlRunway 發布 AI 視頻生成模型 Gen-4:可保持角色、場景高度一致性
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com