日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

擴散模型就是自動編碼器!DeepMind研究學者提出新觀點并論證

來源: 責編: 時間:2023-08-07 16:29:52 288觀看
導讀 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。由于在圖像生成效果上可以與GAN媲美,擴散模型最近成為了AI界關注的焦點。谷歌、OpenAI過去一年都提出了自家的

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。4P828資訊網——每日最新資訊28at.com

由于在圖像生成效果上可以與GAN媲美,擴散模型最近成為了AI界關注的焦點。4P828資訊網——每日最新資訊28at.com

谷歌、OpenAI過去一年都提出了自家的擴散模型,效果也都非常驚艷。4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

另一邊,劍橋大學的學者David Krueger提出,自動編碼器會不會卷土重來成為研究熱潮。4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

就在最近,DeepMind的一位研究科學家Sander Dieleman基于以上兩股熱潮,提出了自己的觀點:4P828資訊網——每日最新資訊28at.com

擴散模型就是自動編碼器啊!4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

這一觀點立刻引起了不少網友的注意,大家看了Sander的闡述,都覺得說得很有道理,并且給了自己不少啟發。4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

那么,他到底是如何論證自己這一觀點的呢?4P828資訊網——每日最新資訊28at.com

我們一起來看。4P828資訊網——每日最新資訊28at.com

去噪自動編碼器=擴散模型4P828資訊網——每日最新資訊28at.com

想要看透這二者之間的聯系,首先要看看它們自身的特點。4P828資訊網——每日最新資訊28at.com

擴散模型是一種新的圖像生成方法,其名字中的“擴散”本質上是一個迭代過程。4P828資訊網——每日最新資訊28at.com

它最早于2015提出,是定義了一個馬爾可夫鏈,用于在擴散步驟中緩慢地向數據添加隨機噪聲,然后通過學習逆轉擴散過程從噪聲中構建所需的數據樣本。4P828資訊網——每日最新資訊28at.com

相比GAN、VAE和基于流的生成模型,擴散模型在性能上有不錯的權衡,最近已被證明在圖像生成方面有很大的潛力,尤其是與引導結合來兼得保真度和多樣性。4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

比如去年谷歌提出的級聯(Cacade)擴散模型SR3,就是以低分辨率圖像為輸入,從純噪聲中構建出對應的高分辨率圖像。4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

OpenAI的GLIDE、ADM-G也是用上了擴散模型,以此能生成更加更真實、多樣、復雜的圖像。4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

△GLIDE模型效果4P828資訊網——每日最新資訊28at.com

接下來,再來看自動編碼器的原理。4P828資訊網——每日最新資訊28at.com

自動編碼器可以理解為一個試圖去還原原始輸入的系統,模型如下所示:4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

它的主要目的是將輸入轉換為中間變量,然后再將中間變量轉化為輸出,最后對比輸入和輸出,使它們二者之間無限接近。4P828資訊網——每日最新資訊28at.com

當模型框架中存在瓶頸層或者輸入被損壞時,自動編碼器能夠學習輸入本質特征的特性,就可以大顯身手了。4P828資訊網——每日最新資訊28at.com

在這里,作者主要拿來和擴散模型對比的,便是去噪自動編碼器。4P828資訊網——每日最新資訊28at.com

它可以將損壞數據作為輸入,通過訓練來預測未損壞的原始數據作為輸出。4P828資訊網——每日最新資訊28at.com

看到這里是不是有點眼熟了?4P828資訊網——每日最新資訊28at.com

向輸入中加入噪聲,不就是一種破壞輸入的方法嗎?4P828資訊網——每日最新資訊28at.com

那么,去噪自動編碼器和擴散模型,原理上不就是有著異曲同工之妙嗎?4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

二者是如何等價的?4P828資訊網——每日最新資訊28at.com

為了驗證自己的這一想法,作者從原理方面對擴散模型進行了拆解。4P828資訊網——每日最新資訊28at.com

擴散模型的關鍵,在于一個分數函數 (score function)4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

。4P828資訊網——每日最新資訊28at.com

需要注意的是,這和4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

不同。(求梯度的參數不同)4P828資訊網——每日最新資訊28at.com

通過后者,我們可以知道如何改變模型參數來增加向下輸入的可能性,而前者能夠讓我們知道如何改變輸入本身來增加可能性。4P828資訊網——每日最新資訊28at.com

在訓練過程中,希望在去噪中的每一點都使用相同的網絡。4P828資訊網——每日最新資訊28at.com

為了實現這個,需要引入一個額外的輸入4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

,由此可以看到在去噪中進行到了哪一部分4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

。4P828資訊網——每日最新資訊28at.com

當t=0時,對應無噪聲數據;t=1時,對應純噪聲數據。4P828資訊網——每日最新資訊28at.com

訓練這個網絡的方法,就是用添加噪聲4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

來破壞輸入x。然后從4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

中預測4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

需要注意的是,在這里方差大小取決于t,因為它可以對應特定點的噪聲水平。損失函數通常使用均方誤差(MSE),有時會用 λ(t)進行加權,因此某些噪聲水平會優先于其他噪聲水平:4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

假設λ(t)=1時,一個關鍵的觀測值為4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

或 x(它們二者是等價的),在這里可以用公式:4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

為了確保它們是等價的,可以考慮使用訓練模型4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

來預測4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

,并加上一個新的殘差連接。從輸入到輸出的比例系數均為-1,這個調整后的模型則實現了:4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

由此,一個擴散模型便逐漸變成一個去噪自動編碼器了!4P828資訊網——每日最新資訊28at.com

One More Thing4P828資訊網——每日最新資訊28at.com

不過博客的作者也強調,雖然擴散模型和去噪自動編碼器的效果等價,但是二者之間不可完全互換。4P828資訊網——每日最新資訊28at.com

并且以上得到的這個去噪自動編碼器,和傳統類型也有不同:4P828資訊網——每日最新資訊28at.com

第一,附加輸入t可以使單個模型用一組共用參數來處理噪聲級別不同的情況;第二,因為更加關注模型的輸出,所以內部沒有瓶頸層,這可能會導致“弊大于利”的結果。4P828資訊網——每日最新資訊28at.com

而作者更想強調的是這二者之間存在的聯系。4P828資訊網——每日最新資訊28at.com

此外他還表示,模型效果好的關鍵應該在于共用參數,這種方法已經被廣泛應用在表示學習上。4P828資訊網——每日最新資訊28at.com

從這些成果中也能發現一個規律:4P828資訊網——每日最新資訊28at.com

噪聲含量越高的模型,往往更容易學習到圖像的特征;噪聲含量越低的模型,則會更專注于細節。4P828資訊網——每日最新資訊28at.com

4P828資訊網——每日最新資訊28at.com

作者認為以上規律值得進一步研究:4P828資訊網——每日最新資訊28at.com

這意味著隨著噪聲水平逐步降低,擴散模型能夠補充圖像細節也就越來越多。4P828資訊網——每日最新資訊28at.com

最后,我們再來介紹一下這一發現的提出者——Sander Dieleman。4P828資訊網——每日最新資訊28at.com

他現在是DeepMind的一位研究科學家,主要研究領域為生成模型和音樂合成。4P828資訊網——每日最新資訊28at.com

參與的主要研究工作有Spotify音樂平臺的內容推薦模型。4P828資訊網——每日最新資訊28at.com

 4P828資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2146-0.html擴散模型就是自動編碼器!DeepMind研究學者提出新觀點并論證

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 為了自動駕駛,谷歌用NeRF在虛擬世界中重建了舊金山市

下一篇: CNCF 報告:最新 Kubernetes 和容器采用現狀 譯文

標簽:
  • 熱門焦點
  • 消息稱迪士尼要拍真人版《魔發奇緣》:女主可能也找黑人演員

    8月5日消息,迪士尼確實有點忙,忙著將不少動畫改成真人版,繼《美人魚》后,真人版《白雪公主》、《魔發奇緣》也在路上了。據外媒消息稱,迪士尼將打造真人版
  • 自動化在DevOps中的力量:簡化軟件開發和交付

    自動化在DevOps中扮演著重要角色,它提升了DevOps的效能。通過自動化工具和方法,DevOps團隊可以實現以下目標:消除手動和重復性任務。簡化流程。在整個軟件開發生命周期中實現更
  • 為什么你不應該使用Div作為可點擊元素

    按鈕是為任何網絡應用程序提供交互性的最常見方式。但我們經常傾向于使用其他HTML元素,如 div span 等作為 clickable 元素。但通過這樣做,我們錯過了許多內置瀏覽器的功能。
  • 零售大模型“干中學”,攀爬數字化珠峰

    文/侯煜編輯/cc來源/華爾街科技眼對于絕大多數登山愛好者而言,攀爬珠穆朗瑪峰可謂終極目標。攀登珠峰的商業路線有兩條,一是尼泊爾境內的南坡路線,一是中國境內的北坡路線。相
  • 大廠卷向扁平化

    來源:新熵作者丨南枝 編輯丨月見大廠職級不香了。俗話說,兵無常勢,水無常形,互聯網企業調整職級體系并不稀奇。7月13日,淘寶天貓集團啟動了近年來最大的人力制度改革,目前已形成一
  • 重估百度丨大模型,能撐起百度的“今天”嗎?

    自象限原創 作者|程心 羅輯2023年之前,對于自己的“今天”,百度也很迷茫。“新業務到 2022 年底還是 0,希望 2023 年出來一個 1。”這是2022年底,李彥宏
  • 疑似小米14外觀設計圖曝光:后置相機模組變化不大

    下半年的大幕已經開啟,而誰將成為下半年手機圈的主角就成為了大家關注的焦點,其中被傳有望拿下新一代驍龍8 Gen3旗艦芯片的小米14系列更是備受大家矚
  • 由于成本持續增加,筆記本產品價格預計將明顯上漲

    根據知情人士透露,由于材料、物流等成本持續增加,筆記本產品價格預計將在2021年下半年有明顯上漲。進入6月下旬以來,全球半導體芯片缺貨情況加劇,顯卡、處理器
  • 利用職權私自解除被封帳號 Meta開除20多名員工

    11月18日消息,據外媒援引知情人士表示,過去一年時間內,Facebook母公司Meta解雇或處罰了20多名員工以及合同工,指控這些人通過內部系統以不當方式重置用戶帳號,其
Top 主站蜘蛛池模板: 安徽省| 东阿县| 吴堡县| 资源县| 安徽省| 长白| 阜康市| 英吉沙县| 岗巴县| 鞍山市| 滦南县| 胶州市| 安泽县| 中牟县| 收藏| 静安区| 葵青区| 胶州市| 临桂县| 郧西县| 眉山市| 罗甸县| 江川县| 汶川县| 大安市| 遂溪县| 十堰市| 固镇县| 同仁县| 班玛县| 白玉县| 长春市| 白城市| 大埔县| 竹北市| 临海市| 荆州市| 庐江县| 微山县| 延边| 左权县|