日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

Stability AI 開源上新:3D 生成引入視頻擴散模型,質量一致性 up,4090 可玩

來源: 責編: 時間:2024-03-22 08:52:24 195觀看
導讀 Stable Diffusion 背后公司 Stability AI 又上新了。這次帶來的是圖生 3D 方面的新進展:基于 Stable Video Diffusion 的 Stable Video 3D(SV3D),只用一張圖片就能生成高質量 3D 網格。Stable Video Diffusion(SVD

Stable Diffusion 背后公司 Stability AI 又上新了。Nvp28資訊網——每日最新資訊28at.com

這次帶來的是圖生 3D 方面的新進展:Nvp28資訊網——每日最新資訊28at.com

基于 Stable Video Diffusion 的 Stable Video 3D(SV3D),只用一張圖片就能生成高質量 3D 網格。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

Stable Video Diffusion(SVD)是 Stability AI 此前推出的高分辨率視頻生成模型。也就是說,此番登場的 SV3D 首次將視頻擴散模型應用到了 3D 生成領域。Nvp28資訊網——每日最新資訊28at.com

官方表示,基于此,SV3D 大大提高了 3D 生成的質量和視圖一致性。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

模型權重依然開源,不過僅可用于非商業用途,想要商用的話還得買個 Stability AI 會員~Nvp28資訊網——每日最新資訊28at.com

話不多說,還是來扒一扒論文細節。Nvp28資訊網——每日最新資訊28at.com

將視頻擴散模型用于 3D 生成

引入潛在視頻擴散模型,SV3D 的核心目的是利用視頻模型的時間一致性來提高 3D 生成的一致性。Nvp28資訊網——每日最新資訊28at.com

并且視頻數據本身也比 3D 數據更容易獲得。Nvp28資訊網——每日最新資訊28at.com

Stability AI 這次提供兩個版本的 SV3D:Nvp28資訊網——每日最新資訊28at.com

SV3D_u:基于單張圖像生成軌道視頻。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

SV3D_p:擴展了 SV3D_u 的功能,可以根據指定的相機路徑創建 3D 模型視頻。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

研究人員還改進了 3D 優化技術:采用由粗到細的訓練策略,優化 NeRF 和 DMTet 網格來生成 3D 對象。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

他們還設計了一種名為掩碼得分蒸餾采樣(SDS)的特殊損失函數,通過優化在訓練數據中不直接可見的區域,來提高生成 3D 模型的質量和一致性。Nvp28資訊網——每日最新資訊28at.com

同時,SV3D 引入了一個基于球面高斯的照明模型,用于分離光照效果和紋理,在保持紋理清晰度的同時有效減少了內置照明問題。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

具體到架構方面,SV3D 包含以下關鍵組成部分:Nvp28資訊網——每日最新資訊28at.com

UNet:SV3D 是在 SVD 的基礎上構建的,包含一個多層 UNet,其中每一層都有一系列殘差塊(包括 3D 卷積層)和兩個分別處理空間和時間信息的 Transformer 模塊。Nvp28資訊網——每日最新資訊28at.com

條件輸入:輸入圖像通過 VAE 編碼器嵌入到潛在空間中,會和噪聲潛在狀態合并,一起輸入到 UNet 中;輸入圖像的 CLIP 嵌入矩陣則被用作每個 Transformer 模塊交叉注意力層的鍵值對。Nvp28資訊網——每日最新資訊28at.com

相機軌跡編碼:SV3D 設計了靜態和動態兩種類型的軌道來研究相機姿態條件的影響。靜態軌道中,相機以規律間隔的方位角圍繞對象;動態軌道則允許不規則間隔的方位角和不同的仰角。Nvp28資訊網——每日最新資訊28at.com

相機的運動軌跡信息和擴散噪聲的時間信息會一起輸入到殘差模塊中,轉換為正弦位置嵌入,然后這些嵌入信息會被整合并進行線性變換,加入到噪聲時間步長嵌入中。Nvp28資訊網——每日最新資訊28at.com

這樣的設計旨在通過精細控制相機軌跡和噪聲輸入,提升模型處理圖像的能力。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

此外,SV3D 在生成過程中采用 CFG(無分類器引導)來控制生成的清晰度,特別是在生成軌道的最后幾幀時,采用三角形 CFG 縮放來避免過度銳化。Nvp28資訊網——每日最新資訊28at.com

研究人員在 Objaverse 數據集上訓練 SV3D,圖像分辨率為 575×576,視場角為 33.8 度。論文透露,所有三種模型(SV3D_u,SV3D_c,SV3D_p)在 4 個節點上訓練了 6 天左右,每個節點配備 8 個 80GB 的 A100 GPU。Nvp28資訊網——每日最新資訊28at.com

實驗結果

在新視角合成(NVS)和 3D 重建方面,SV3D 超過了現有其他方法,達到 SOTA。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

從定性比較的結果來看,SV3D 生成的多視角試圖,細節更豐富,更接近與原始輸入圖像。也就是說,SV3D 在理解和重構物體的 3D 結構方面,能夠更準確地捕捉到細節,并保持視角變換時的一致性。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

這樣的成果,引發了不少網友的感慨:Nvp28資訊網——每日最新資訊28at.com

可以想象,在未來 6-12 個月內,3D 生成技術將會被用到游戲和視頻項目中。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

評論區也總少不了一些大膽的想法……Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

并且項目開源嘛,已經有第一波小伙伴玩上了,在 4090 上就能跑起來。Nvp28資訊網——每日最新資訊28at.com

Nvp28資訊網——每日最新資訊28at.com

如果你也有第一手實測體會,歡迎在評論區分享~Nvp28資訊網——每日最新資訊28at.com

參考鏈接:Nvp28資訊網——每日最新資訊28at.com

[1]https://twitter.com/StabilityAI/status/1769817136799855098Nvp28資訊網——每日最新資訊28at.com

[2]https://stability.ai/news/introducing-stable-video-3dNvp28資訊網——每日最新資訊28at.com

[3]https://sv3d.github.io/index.htmlNvp28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:魚羊Nvp28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3659-0.htmlStability AI 開源上新:3D 生成引入視頻擴散模型,質量一致性 up,4090 可玩

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI CEO 阿爾特曼:GPT-4“有點糟糕”,今年將推出新模型

下一篇: 阿里大模型產品“通義聽悟”升級:超長視頻自由問,還會做思維導圖

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 襄城县| 阿瓦提县| 乌苏市| 南阳市| 昌邑市| 垫江县| 白城市| 龙陵县| 梨树县| 苍南县| 丹巴县| 平昌县| 韩城市| 察隅县| 湘潭市| 山阴县| 临沧市| 盱眙县| 宁德市| 镇康县| 奉新县| 定边县| 荔浦县| 贡觉县| 山阳县| 清丰县| 仪陇县| 洮南市| 察雅县| 九江市| 贵定县| 寿阳县| 宁明县| 龙海市| 凤城市| 偏关县| 永新县| 宁海县| 东平县| 博野县| 佛坪县|