日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

神經網絡為何越大越好?NeurIPS論文證明:魯棒性是泛化的基礎

來源: 責編: 時間:2023-08-07 16:29:56 245觀看
導讀 當神經網絡的研究方向逐漸轉為超大規模預訓練模型,研究人員的目標似乎變成了讓網絡擁有更大的參數量,更多的訓練數據,更多樣化的訓練任務。當然,這個措施確實很有效,隨著神經網絡

當神經網絡的研究方向逐漸轉為超大規模預訓練模型,研究人員的目標似乎變成了讓網絡擁有更大的參數量,更多的訓練數據,更多樣化的訓練任務。9qy28資訊網——每日最新資訊28at.com

當然,這個措施確實很有效,隨著神經網絡越來越大,模型了解和掌握的數據也更多,在部分特定任務上已經超越人類。9qy28資訊網——每日最新資訊28at.com

但在數學上,現代神經網絡的規模實際上有些過于臃腫了,參數量通常遠遠超過了預測任務的需求,這種情況也被稱為過度參數化(overparameterization)。9qy28資訊網——每日最新資訊28at.com

NeurIPS上的一篇論文中最近就這一現象提出了一種全新的解釋。他們認為這種比預期規模更大的神經網絡是完全有必要的,只有這樣才能避免某些基本問題,這篇論文中的發現也為這一問題提供一種更通用的見解。9qy28資訊網——每日最新資訊28at.com

9qy28資訊網——每日最新資訊28at.com

論文地址:https://arxiv.org/abs/2105.128069qy28資訊網——每日最新資訊28at.com

文章的第一作者Sébastien Bubeck在MSR Redmond管理機器學習基礎研究組,主要在機器學習和理論計算機科學中跨越各種主題進行交叉研究。9qy28資訊網——每日最新資訊28at.com

9qy28資訊網——每日最新資訊28at.com

神經網絡就該這么大9qy28資訊網——每日最新資訊28at.com

神經網絡的一項常見任務是識別圖像中的目標對象。9qy28資訊網——每日最新資訊28at.com

9qy28資訊網——每日最新資訊28at.com

為了創建一個能夠完成該任務的網絡,研究人員首先為其提供許多圖像和對應目標標簽,對其進行訓練以學習它們之間的相關性。之后,網絡將正確識別它已經看到的圖像中的目標。9qy28資訊網——每日最新資訊28at.com

換句話說,訓練過程使得神經網絡記住了這些數據。9qy28資訊網——每日最新資訊28at.com

并且,一旦網絡記住了足夠多的訓練數據,它還能夠以不同程度的準確度預測它從未見過的物體的標簽,這個過程稱為泛化。9qy28資訊網——每日最新資訊28at.com

網絡的大小決定了它能記憶多少東西。9qy28資訊網——每日最新資訊28at.com

9qy28資訊網——每日最新資訊28at.com

可以用圖形化的空間來理解。假設有兩個數據點,把它們放在一個XY平面上,可以用一條由兩個參數描述的線來連接這些點:線的斜率和它與縱軸相交時的高度。如果其他人也知道這條直線的參數,以及其中一個原始數據點的X坐標,他們可以通過觀察這條直線(或使用參數)來計算出相應的Y坐標。9qy28資訊網——每日最新資訊28at.com

也就是說,這條線已經記住了這兩個數據點,神經網絡做的就是差不多類似的事情。9qy28資訊網——每日最新資訊28at.com

例如,圖像是由成百上千的數值描述的,每個像素都有一個對應的值。可以把這個由許多自由值組成的集合在數學上相當于高維空間中一個點的坐標,坐標的數量也稱為維度。9qy28資訊網——每日最新資訊28at.com

傳統的數學結論認為,要用一條曲線擬合n個數據點,你需要一個有n個參數的函數。例如,在直線的例子中,兩個點是由一條有兩個參數的曲線描述的。9qy28資訊網——每日最新資訊28at.com

當神經網絡在20世紀80年代首次作為一種新模型出現時,研究人員也這么認為,應該只需要n個參數來適應n個數據點,而跟數據的維度無關。9qy28資訊網——每日最新資訊28at.com

德克薩斯大學奧斯汀分校的Alex Dimakis表示,現在實際情況已經不是這樣了,神經網絡的參數數量遠遠超過了訓練樣本的數量,這說明了教科書上的內容必須得重寫進行修正。9qy28資訊網——每日最新資訊28at.com

研究人員正在研究神經網絡的魯棒性(robustness),即網絡處理小變化的能力。例如,一個不魯棒的網絡可能已經學會了識別長頸鹿,但它會把一個幾乎沒有修改的版本誤標為沙鼠。9qy28資訊網——每日最新資訊28at.com

9qy28資訊網——每日最新資訊28at.com

2019年,Bubeck和同事們正在尋求證明關于這個問題的定理,當時他們就意識到這個問題與網絡的規模有關。9qy28資訊網——每日最新資訊28at.com

在他們的新證明中,研究人員表明,過度參數化對于網絡的魯棒性是必要的。他們提出平滑性(smoothness),來指出需要多少個參數才能用一條具有等同于魯棒性的數學特性的曲線來擬合數據點。9qy28資訊網——每日最新資訊28at.com

要想理解這一點,可以再次想象平面上的一條曲線,其中x坐標代表一個像素的顏色,y坐標代表一個圖像標簽。9qy28資訊網——每日最新資訊28at.com

由于曲線是平滑的,如果你稍微修改一下像素的顏色,沿著曲線移動一小段距離,相應的預測值只會有少量的變化。另一方面,對于一條鋸齒狀的曲線,X坐標(顏色)的微小變化會導致Y坐標(圖像標簽)的巨大變化,長頸鹿可以變成沙鼠。9qy28資訊網——每日最新資訊28at.com

Bubeck和Sellke在論文中證明,平滑擬合高維數據點不僅需要n個參數,而且需要n×d個參數,其中d是輸入的維度(例如,784個像素的圖像輸入維度為784)。9qy28資訊網——每日最新資訊28at.com

換句話說,如果你想讓一個網絡穩健地記住它的訓練數據,過度參數化不僅是有幫助的,而且是必須的。該證明依賴于一個關于高維幾何的事實,即隨機分布在球體表面的點幾乎都是彼此相距一個直徑的距離,點與點之間的巨大間隔意味著用一條光滑的曲線來擬合它們需要許多額外的參數。9qy28資訊網——每日最新資訊28at.com

9qy28資訊網——每日最新資訊28at.com

耶魯大學的Amin Karbasi稱贊論文中的證明是非常簡潔的,沒有大量的數學公式,而且它說的是非常通用的內容。9qy28資訊網——每日最新資訊28at.com

這一證明結果也為理解為什么擴大神經網絡的簡單策略如此有效提供了一個新的途徑。9qy28資訊網——每日最新資訊28at.com

其他研究揭示了過量參數化有幫助的其他原因。例如,它可以提高訓練過程的效率,也可以提高網絡的泛化能力。9qy28資訊網——每日最新資訊28at.com

雖然我們現在知道過量參數化對魯棒性是必要的,但還不清楚魯棒性對其他事情有多大必要。但通過將其與過度參數化聯系起來,新的證明暗示魯棒性可能比人們想象的更重要,這也可能為其他解釋大模型的益處研究做鋪墊。9qy28資訊網——每日最新資訊28at.com

魯棒性確實是泛化的一個先決條件,如果你建立了一個系統,只是輕微地擾動它,然后它就失控了,那是什么樣的系統?顯然是不合理的。9qy28資訊網——每日最新資訊28at.com

所以,Bubeck認為這是一個非常基礎和基本的要求。9qy28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2174-0.html神經網絡為何越大越好?NeurIPS論文證明:魯棒性是泛化的基礎

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 不可見,無安全!值得關注的十大國外SASE廠商(2022版)

下一篇: Akamai擬9億美元收購Linode 構建從邊到云的分布式計算平臺

標簽:
  • 熱門焦點
  • 影音體驗是真的強 簡單聊聊iQOO Pad

    大公司的好處就是產品線豐富,非常細分化的東西也能給你做出來,例如早先我們看到了新的vivo Pad2,之后我們又在iQOO Neo8 Pro的發布會上看到了iQOO的首款平板產品iQOO Pad。雖
  • 5月安卓手機好評榜:魅族20 Pro奪冠

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 帥氣純真少年!日本最帥初中生選美冠軍出爐

    日本第一帥哥初一生選美大賽冠軍現已正式出爐,冠軍是來自千葉縣的宗田悠良。日本一直熱衷于各種選美大賽,從“最美JK”起到“最美女星&r
  • 一文看懂為蘋果Vision Pro開發應用程序

    譯者 | 布加迪審校 | 重樓蘋果的Vision Pro是一款混合現實(MR)頭戴設備。Vision Pro結合了虛擬現實(VR)和增強現實(AR)的沉浸感。其高分辨率顯示屏、先進的傳感器和強大的處理能力
  • 一年經驗在二線城市面試后端的經驗分享

    忠告這篇文章只適合2年內工作經驗、甚至沒有工作經驗的朋友閱讀。如果你是2年以上工作經驗,請果斷劃走,對你沒啥幫助~主人公這篇文章內容來自 「升職加薪」星球星友 的投稿,坐
  • 東方甄選單飛:有些鳥注定是關不住的

    作者:彭寬鴻來源:華爾街科技眼‍‍‍‍‍‍‍‍‍‍東方甄選創始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一
  • Android 14發布:首批適配機型公布

    5月11日消息,谷歌在今天凌晨舉行了I/O大會,本次發布會谷歌帶來了自家的AI語言模型PaLM 2、谷歌Pixel Fold折疊屏、谷歌Pixel 7a手機,同時發布了Androi
  • 最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

    2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現在已經可以購買了,這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆
  • 親歷馬斯克血洗Twitter,硅谷的苦日子在后頭

    文/劉哲銘  編輯/李薇  馬斯克再次揮下裁員大刀。  美國時間11月14日,Twitter約4400名外包員工遭解雇,此次被解雇的員工的主要工作為內容審核等。此前,T
Top 主站蜘蛛池模板: 抚宁县| 长海县| 拉孜县| 达日县| 和龙市| 咸宁市| 寻乌县| 武平县| 南宫市| 峨眉山市| 工布江达县| 兴国县| 同德县| 常宁市| 和平区| 溧水县| 富民县| 甘南县| 天柱县| 玉树县| 维西| 通化县| 昌乐县| 浦北县| 南华县| 会东县| 彰化县| 靖州| 岳阳县| 大竹县| 衡东县| 襄垣县| 太白县| 水城县| 杭锦旗| 图木舒克市| 兰州市| 濮阳市| 迁安市| 安多县| 进贤县|