<ul id="qmgkm"></ul>

<strike id="qmgkm"></strike>

當前位置：首頁 > 元宇宙 > AI

谷歌 DeepMind 新研究：利用 AI 模型為無聲視頻配音

來源：責編：時間：2024-06-21 08:32:51 201觀看

導讀 6 月 18 日消息，據谷歌DeepMind新聞稿，DeepMind 近日公布了一項利用AI為無聲視頻生成背景音樂的“video-to-audio”技術。獲悉，當前 DeepMind 這款AI模型依然存在局限性，需要開發者使用提示詞為模型預先“介紹”

6 月 18 日消息，據谷歌DeepMind新聞稿，DeepMind 近日公布了一項利用AI為無聲視頻生成背景音樂的“video-to-audio”技術。

獲悉，當前 DeepMind 這款AI模型依然存在局限性，需要開發者使用提示詞為模型預先“介紹”視頻可能的聲音，暫時不能直接根據視頻畫面添加具體音效。

據悉，該模型首先會將用戶輸入的視頻進行拆解，此后結合用戶的用戶文字提示，利用擴散模型反復運算，最終以生成與視頻畫面協調的背景聲音，例如輸入一條“在黑暗中行走”的無聲視頻，再添加“電影、恐怖片、音樂、緊張、混凝土上的腳步聲”等文字提示，相關模型就能生成恐怖風格的背景音效。

DeepMind同時表示，該“video-to-audio”模型可以為任何視頻生成無限數量的音軌，還能夠通過提示詞內容判斷生成的音頻“正向性”或“反向性”，從而令生成的聲音更貼近某些特定場景。

展望未來，DeepMind表示研究人員正進一步優化這款“video-to-audio”模型，計劃未來能夠讓模型直接根據視頻內容，無須通過提示詞即可生成視頻背景音，同時還將改善視頻中人物對白的口型同步能力。

本文鏈接：http://www.www897cc.com/showinfo-45-4701-0.html谷歌 DeepMind 新研究：利用 AI 模型為無聲視頻配音

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：風清、風雷、風順，中國氣象局發布三個 AI 氣象大模型系統

下一篇：金山辦公 WPS AI 海外版發布，海外月活設備數已超兩億

標簽：

熱門焦點

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

Block-807DAO要么是定義虛擬未來、無領導組織的革命性概念，要么是充滿存在主義和自我毀滅挑戰的反烏托邦結構，取決于你在與誰交談。近幾個月來， DAO已經從Crypto
音樂NFT平臺里的下一匹黑馬是誰？

NFT 銷售額在 2021 年開始暴漲，從 2018 年的僅 4069 萬美元的交易量，到 2021 年，NFT 交易量飆升至 442 億美元以上，并不斷刷新記錄并達到新的高度。預測到2025 年N
Meta 在衰落嗎？

扎克伯格已經很久沒有出現在公眾視野里了，近日，他罕見的接受播客采訪，在兩個小時的時間里暢談了Meta、Facebook、Instagram、元宇宙的未來。正方觀點：是的阿倫·達
對諷刺無動于衷，Nori將碳市場放在區塊鏈上

當我們聊氣候問題的解決方案時，以太坊區塊鏈應該不是最首想到的，但這正是Nori所選擇的方案，它建立了一個引擎，鼓勵農民使用負碳耕作方法，將空氣中的碳抽出并放回地
以太坊面臨來自Fantom的巨大挑戰

眾所周知，區塊鏈和加密貨幣項目經常因其對環境的影響而受到批評。但是有一個非營利性的加密貨幣和區塊鏈項目說它比其他的更環保。今天老雅痞就給大家聊一聊加
爆發在即的Layer2賽道百花齊放，誰將是領跑者？

還記得幾年前最早我們提起ETH擴容，首先想到就是Layer2，而Layer2里，首先想到的是閃電網絡，狀態通道，Plasma…然后折騰了幾年，發現并沒有什么用，許多項目方和資本也等不
虛擬人行業研究報告

最早的虛擬人出現于 20 世紀 80 年代，受限于技術，當時的虛擬人制作以手繪為主。21 世紀初，隨著動捕、渲染等技術的逐步發展，虛擬人相關技術開始在影視領域逐漸普及

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

谷歌 DeepMind 新研究：利用 AI 模型為無聲視頻配音

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

音樂NFT平臺里的下一匹黑馬是誰？

Meta 在衰落嗎？

對諷刺無動于衷，Nori將碳市場放在區塊鏈上

以太坊面臨來自Fantom的巨大挑戰

爆發在即的Layer2賽道百花齊放，誰將是領跑者？

虛擬人行業研究報告

最新推薦

數字人的AB面：在元宇宙中過氣，在AIGC中重生

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

“元宇宙第一股”Roblox緣何被資本市場看“低”？

NFT世界的藝術家名單

Staking 收益翻倍？

虛擬人行業研究報告

猜你喜歡

熱門推薦

相關資訊