日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 知識百科

擴(kuò)散模型就是自動編碼器!DeepMind研究學(xué)者提出新觀點(diǎn)并論證

來源: 責(zé)編: 時間:2023-08-07 16:29:52 249觀看
導(dǎo)讀 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。由于在圖像生成效果上可以與GAN媲美,擴(kuò)散模型最近成為了AI界關(guān)注的焦點(diǎn)。谷歌、OpenAI過去一年都提出了自家的

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。BDo28資訊網(wǎng)——每日最新資訊28at.com

由于在圖像生成效果上可以與GAN媲美,擴(kuò)散模型最近成為了AI界關(guān)注的焦點(diǎn)。BDo28資訊網(wǎng)——每日最新資訊28at.com

谷歌、OpenAI過去一年都提出了自家的擴(kuò)散模型,效果也都非常驚艷。BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

另一邊,劍橋大學(xué)的學(xué)者David Krueger提出,自動編碼器會不會卷土重來成為研究熱潮。BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

就在最近,DeepMind的一位研究科學(xué)家Sander Dieleman基于以上兩股熱潮,提出了自己的觀點(diǎn):BDo28資訊網(wǎng)——每日最新資訊28at.com

擴(kuò)散模型就是自動編碼器啊!BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

這一觀點(diǎn)立刻引起了不少網(wǎng)友的注意,大家看了Sander的闡述,都覺得說得很有道理,并且給了自己不少啟發(fā)。BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

那么,他到底是如何論證自己這一觀點(diǎn)的呢?BDo28資訊網(wǎng)——每日最新資訊28at.com

我們一起來看。BDo28資訊網(wǎng)——每日最新資訊28at.com

去噪自動編碼器=擴(kuò)散模型BDo28資訊網(wǎng)——每日最新資訊28at.com

想要看透這二者之間的聯(lián)系,首先要看看它們自身的特點(diǎn)。BDo28資訊網(wǎng)——每日最新資訊28at.com

擴(kuò)散模型是一種新的圖像生成方法,其名字中的“擴(kuò)散”本質(zhì)上是一個迭代過程。BDo28資訊網(wǎng)——每日最新資訊28at.com

它最早于2015提出,是定義了一個馬爾可夫鏈,用于在擴(kuò)散步驟中緩慢地向數(shù)據(jù)添加隨機(jī)噪聲,然后通過學(xué)習(xí)逆轉(zhuǎn)擴(kuò)散過程從噪聲中構(gòu)建所需的數(shù)據(jù)樣本。BDo28資訊網(wǎng)——每日最新資訊28at.com

相比GAN、VAE和基于流的生成模型,擴(kuò)散模型在性能上有不錯的權(quán)衡,最近已被證明在圖像生成方面有很大的潛力,尤其是與引導(dǎo)結(jié)合來兼得保真度和多樣性。BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

比如去年谷歌提出的級聯(lián)(Cacade)擴(kuò)散模型SR3,就是以低分辨率圖像為輸入,從純噪聲中構(gòu)建出對應(yīng)的高分辨率圖像。BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

OpenAI的GLIDE、ADM-G也是用上了擴(kuò)散模型,以此能生成更加更真實(shí)、多樣、復(fù)雜的圖像。BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

△GLIDE模型效果BDo28資訊網(wǎng)——每日最新資訊28at.com

接下來,再來看自動編碼器的原理。BDo28資訊網(wǎng)——每日最新資訊28at.com

自動編碼器可以理解為一個試圖去還原原始輸入的系統(tǒng),模型如下所示:BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

它的主要目的是將輸入轉(zhuǎn)換為中間變量,然后再將中間變量轉(zhuǎn)化為輸出,最后對比輸入和輸出,使它們二者之間無限接近。BDo28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)模型框架中存在瓶頸層或者輸入被損壞時,自動編碼器能夠?qū)W習(xí)輸入本質(zhì)特征的特性,就可以大顯身手了。BDo28資訊網(wǎng)——每日最新資訊28at.com

在這里,作者主要拿來和擴(kuò)散模型對比的,便是去噪自動編碼器。BDo28資訊網(wǎng)——每日最新資訊28at.com

它可以將損壞數(shù)據(jù)作為輸入,通過訓(xùn)練來預(yù)測未損壞的原始數(shù)據(jù)作為輸出。BDo28資訊網(wǎng)——每日最新資訊28at.com

看到這里是不是有點(diǎn)眼熟了?BDo28資訊網(wǎng)——每日最新資訊28at.com

向輸入中加入噪聲,不就是一種破壞輸入的方法嗎?BDo28資訊網(wǎng)——每日最新資訊28at.com

那么,去噪自動編碼器和擴(kuò)散模型,原理上不就是有著異曲同工之妙嗎?BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

二者是如何等價的?BDo28資訊網(wǎng)——每日最新資訊28at.com

為了驗(yàn)證自己的這一想法,作者從原理方面對擴(kuò)散模型進(jìn)行了拆解。BDo28資訊網(wǎng)——每日最新資訊28at.com

擴(kuò)散模型的關(guān)鍵,在于一個分?jǐn)?shù)函數(shù) (score function)BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

需要注意的是,這和BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

不同。(求梯度的參數(shù)不同)BDo28資訊網(wǎng)——每日最新資訊28at.com

通過后者,我們可以知道如何改變模型參數(shù)來增加向下輸入的可能性,而前者能夠讓我們知道如何改變輸入本身來增加可能性。BDo28資訊網(wǎng)——每日最新資訊28at.com

在訓(xùn)練過程中,希望在去噪中的每一點(diǎn)都使用相同的網(wǎng)絡(luò)。BDo28資訊網(wǎng)——每日最新資訊28at.com

為了實(shí)現(xiàn)這個,需要引入一個額外的輸入BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

,由此可以看到在去噪中進(jìn)行到了哪一部分BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)t=0時,對應(yīng)無噪聲數(shù)據(jù);t=1時,對應(yīng)純噪聲數(shù)據(jù)。BDo28資訊網(wǎng)——每日最新資訊28at.com

訓(xùn)練這個網(wǎng)絡(luò)的方法,就是用添加噪聲BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

來破壞輸入x。然后從BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

中預(yù)測BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

需要注意的是,在這里方差大小取決于t,因?yàn)樗梢詫?yīng)特定點(diǎn)的噪聲水平。損失函數(shù)通常使用均方誤差(MSE),有時會用 λ(t)進(jìn)行加權(quán),因此某些噪聲水平會優(yōu)先于其他噪聲水平:BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

假設(shè)λ(t)=1時,一個關(guān)鍵的觀測值為BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

或 x(它們二者是等價的),在這里可以用公式:BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

為了確保它們是等價的,可以考慮使用訓(xùn)練模型BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

來預(yù)測BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

,并加上一個新的殘差連接。從輸入到輸出的比例系數(shù)均為-1,這個調(diào)整后的模型則實(shí)現(xiàn)了:BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

由此,一個擴(kuò)散模型便逐漸變成一個去噪自動編碼器了!BDo28資訊網(wǎng)——每日最新資訊28at.com

One More ThingBDo28資訊網(wǎng)——每日最新資訊28at.com

不過博客的作者也強(qiáng)調(diào),雖然擴(kuò)散模型和去噪自動編碼器的效果等價,但是二者之間不可完全互換。BDo28資訊網(wǎng)——每日最新資訊28at.com

并且以上得到的這個去噪自動編碼器,和傳統(tǒng)類型也有不同:BDo28資訊網(wǎng)——每日最新資訊28at.com

第一,附加輸入t可以使單個模型用一組共用參數(shù)來處理噪聲級別不同的情況;第二,因?yàn)楦雨P(guān)注模型的輸出,所以內(nèi)部沒有瓶頸層,這可能會導(dǎo)致“弊大于利”的結(jié)果。BDo28資訊網(wǎng)——每日最新資訊28at.com

而作者更想強(qiáng)調(diào)的是這二者之間存在的聯(lián)系。BDo28資訊網(wǎng)——每日最新資訊28at.com

此外他還表示,模型效果好的關(guān)鍵應(yīng)該在于共用參數(shù),這種方法已經(jīng)被廣泛應(yīng)用在表示學(xué)習(xí)上。BDo28資訊網(wǎng)——每日最新資訊28at.com

從這些成果中也能發(fā)現(xiàn)一個規(guī)律:BDo28資訊網(wǎng)——每日最新資訊28at.com

噪聲含量越高的模型,往往更容易學(xué)習(xí)到圖像的特征;噪聲含量越低的模型,則會更專注于細(xì)節(jié)。BDo28資訊網(wǎng)——每日最新資訊28at.com

BDo28資訊網(wǎng)——每日最新資訊28at.com

作者認(rèn)為以上規(guī)律值得進(jìn)一步研究:BDo28資訊網(wǎng)——每日最新資訊28at.com

這意味著隨著噪聲水平逐步降低,擴(kuò)散模型能夠補(bǔ)充圖像細(xì)節(jié)也就越來越多。BDo28資訊網(wǎng)——每日最新資訊28at.com

最后,我們再來介紹一下這一發(fā)現(xiàn)的提出者——Sander Dieleman。BDo28資訊網(wǎng)——每日最新資訊28at.com

他現(xiàn)在是DeepMind的一位研究科學(xué)家,主要研究領(lǐng)域?yàn)樯赡P秃鸵魳泛铣伞?span style="display:none">BDo28資訊網(wǎng)——每日最新資訊28at.com

參與的主要研究工作有Spotify音樂平臺的內(nèi)容推薦模型。BDo28資訊網(wǎng)——每日最新資訊28at.com

 BDo28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2146-0.html擴(kuò)散模型就是自動編碼器!DeepMind研究學(xué)者提出新觀點(diǎn)并論證

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 為了自動駕駛,谷歌用NeRF在虛擬世界中重建了舊金山市

下一篇: CNCF 報告:最新 Kubernetes 和容器采用現(xiàn)狀 譯文

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 一加Ace2 Pro官宣:普及16G內(nèi)存 引領(lǐng)24G

    一加官方今天繼續(xù)為本月發(fā)布的新機(jī)一加Ace2 Pro帶來預(yù)熱,公布了內(nèi)存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引領(lǐng),還有呢?#一加Ace2Pro#,2023 年 8 月,敬請期待。”同時
  • 一加Ace2 Pro真機(jī)揭曉 鈦空灰配色質(zhì)感拉滿

    終于,在經(jīng)過了幾波預(yù)熱之后,一加Ace2 Pro的外觀真機(jī)圖在網(wǎng)上出現(xiàn)了。還是博主數(shù)碼閑聊站曝光的,這次的外觀設(shè)計還是延續(xù)了一加11的方案,只是細(xì)節(jié)上有了調(diào)整,例如新加入了鈦空灰
  • 分布式系統(tǒng)中的CAP理論,面試必問,你理解了嘛?

    對于剛剛接觸分布式系統(tǒng)的小伙伴們來說,一提起分布式系統(tǒng),就感覺高大上,深不可測。而且看了很多書和視頻還是一臉懵逼。這篇文章主要使用大白話的方式,帶你理解一下分布式系統(tǒng)
  • 企業(yè)采用CRM系統(tǒng)的11個好處

    客戶關(guān)系管理(CRM)軟件可以為企業(yè)提供很多的好處,從客戶保留到提高生產(chǎn)力。  CRM軟件用于企業(yè)收集客戶互動,以改善客戶體驗(yàn)和滿意度。  CRM軟件市場規(guī)模如今超過580
  • 中國家電海外掘金正當(dāng)時|出海專題

    作者|吳南南編輯|胡展嘉運(yùn)營|陳佳慧出品|零態(tài)LT(ID:LingTai_LT)2023年,出海市場戰(zhàn)況空前,中國創(chuàng)業(yè)者在海外紛紛摩拳擦掌,以期能夠把中國的商業(yè)模式、創(chuàng)業(yè)理念、戰(zhàn)略打法輸出海外,他們依
  • 一條抖音4億人圍觀 ! 這家MCN比無憂傳媒還野

    作者:Hiu 來源:互聯(lián)網(wǎng)品牌官01 擦邊少女空降熱搜,幕后推手曝光被網(wǎng)友譽(yù)為“純欲天花板”的女網(wǎng)紅井川里予,近期因?yàn)橐唤M哥特風(fēng)照片登上熱搜,引發(fā)了一場互聯(lián)網(wǎng)世界關(guān)于
  • 國行版三星Galaxy Z Fold5/Z Flip5發(fā)布 售價7499元起

    2023年8月3日,三星電子舉行Galaxy新品中國發(fā)布會,正式在國內(nèi)推出了新一代折疊屏智能手機(jī)三星Galaxy Z Fold5與Galaxy Z Flip5,以及三星Galaxy Tab S9
  • iQOO 11S或7月上市:搭載“雞血版”驍龍8Gen2 史上最強(qiáng)5G Soc

    去年底,iQOO推出了“電競旗艦”iQOO 11系列,作為一款性能強(qiáng)機(jī),iQOO 11不僅全球首發(fā)2K 144Hz E6全感屏,搭載了第二代驍龍8平臺及144Hz電競屏,同時在快充
  • 英特爾Xe HPG游戲顯卡:擁有512EU,單風(fēng)扇版本

    據(jù)10 月 30 日外媒 TheVerge 消息報道,英特爾 Xe HPG Arc Alchemist 的正面實(shí)被曝光,不僅擁有 512 EU 版顯卡,還擁有 128EU 的單風(fēng)扇版本。另外,這款顯卡 PCB
Top 主站蜘蛛池模板: 讷河市| 汾阳市| 咸宁市| 永德县| 浦江县| 全南县| 平顶山市| 岑溪市| 仁化县| 美姑县| 兴安县| 邯郸县| 浏阳市| 竹山县| 凤冈县| 乌兰浩特市| 上饶市| 东乡| 宜阳县| 于田县| 杭锦后旗| 百色市| 吐鲁番市| 公主岭市| 玉林市| 资阳市| 兴海县| 馆陶县| 类乌齐县| 泽库县| 曲阜市| 三穗县| 德昌县| 南漳县| 大兴区| 罗城| 田阳县| 吴忠市| 铜山县| 习水县| 新闻|