當前位置：首頁 > 科技 > 知識百科

九種深度學習算法簡介

來源：責編：時間：2023-08-07 16:30:00 275觀看

導讀一. 兩階段算法兩階段算法包含選擇候選框和修正目標分類/位置兩個階段，對這兩個階段的不同處理方式，構成了不同的算法方案。1. R-CNN算法2014年，R. Girshick等人提出了R-CNN算

一. 兩階段算法

兩階段算法包含選擇候選框和修正目標分類/位置兩個階段，對這兩個階段的不同處理方式，構成了不同的算法方案。

1. R-CNN算法

2014年，R. Girshick等人提出了R-CNN算法。R-CNN算法的思路非常簡單，首先基于Selective Search方法從原始圖像中篩選出若干候選框，然后將每個候選框中的圖像縮放的固定尺度送入卷積網絡提取特征，最后通過支持向量機（SVM）方法對特征進行分類，判斷候選框中的圖像是背景還是我們關注的目標類型。

在VOC2007數據集上，R-CNN算法相比之前的檢測算法，在性能有了顯著的提升（從33.7%提升到58.5%），是檢測算法的一個里程碑式的突破。

雖然R-CNN在算法性能上取得了巨大的進展，但弊端也非常明顯，因為需要分別從2000多個候選框中提取特征，所以效率非常低，后續各種算法正是為了解決這一問題而提出的一系列改進方案。

2. SPP-Net算法

2014年，何愷明等人提出了SPP-Net（Spatial Pyramid Pooling Networks，空間金字塔池化網絡）算法。

R-CNN算法要求輸入卷積網絡用來提取特征的子圖像尺寸固定，比如Alex-Net就要求輸入的圖像大小為固定的224像素×224像素，而SPP-Net算法則去掉了這一限制。SPP-Net算法基于一個空間金字塔池化層（SPP layer），無論輸入的子圖像大小如何，都會將子圖像采樣成固定大小的圖像。

在使用SPP-Net進行檢測的過程中，對原始圖像只需要進行一次卷積網絡計算，在得到整幅圖像的特征圖之后，通過空間金字塔池化層將每個候選框區域（ROI）都分別采樣成相同尺寸的子圖像，將相同尺寸的各個子圖像送入后續的網絡進行特征提取，提取的特征具有相同的維數，最后送入全連接層進行分類。

SPP-Net不需要進行多次卷積網絡計算，與R-CNN相比，在算法精度不變的情況下，算法的速度有了20倍的大幅提升。

3. Fast R-CNN算法

2015年，R. Girshick等人提出了Fast R-CNN算法，其本質是在R-CNN和SPP-Net的基礎上進行了進一步改進。Fast R-CNN可以在網絡里同時預測目標的分類概率和位置偏移。

在VOC2007數據集上，Fast R-CNN將mAP（mean Average Precision，平均精度均值）從58.5%提升至70.0%，算法速度也比R-CNN有了200倍的提升。雖然Fast R-CNN的性能和速度相比R-CNN和SPP-Net有了明顯的改善，但整體速度仍然受到候選框檢測算法的制約，為了解決這個問題，Faster R-CNN算法誕生了。

4. Faster R-CNN算法

2015年，S. Ren等人提出了Faster R-CNN算法，Faster R-CNN是第一個端到端算法，也是第一個接近實時深度學習的目標檢測算法。使用ZF-Net網絡骨架，在VOC2007數據集上，mAP達到了73.2%，算法速度達到了17fps。

Faster R-CNN最主要的貢獻是使用卷積網絡檢測候選框。檢測候選框、預測目標的類別、回歸目標位置的偏移量，共享底層卷積特征，整個算法流程融合成了一個完整的端到端學習框架。Faster R-CNN突破了候選框檢測的速度瓶頸，是一種十分重要的兩階段算法。

5. FPN算法

2017年，Lin等人在Faster R-CNN的基礎上提出了FPN（Feature Pyramid Net works，特征金字塔策略）算法。

在FPN之前，絕大多數深度學習檢測器都是基于卷積網絡最頂層的特征圖進行計算的。深層特征包含全局信息，卻弱化了細節信息，使用深層特征在小目標檢測，尤其是精準定位方面，有著較大的劣勢。FPN采用top-down結構以及側連方法，將深層特征和淺層特征進行融合，使得特征既包含全局信息又包含細節信息。

另外，檢測計算也基于特征金字塔的多層特征圖，具有更強的多尺度適應性。基于FPN的Faster R-CNN算法在COCO數據集上取得了最優的性能。當前，FPN已經成為構建檢測算法的基礎策略。

二. 一階段算法

一階段算法和兩階段算法最主要的區別，就是沒有單獨的候選框篩選階段，而是直接回歸目標的位置坐標和分類概率。常用的一階段算法如下。

1. YOLO算法

2015年，R. Joseph等人提出了YOLO（You Look Only Once）算法，這是首個深度學習領域的一階段算法。

從名字就可以看出，YOLO沒有兩階段算法中提取候選框和驗證分類兩個步驟，圖像送入一個神經網絡就能完成整個預測過程。YOLO算法的實現方案是，先把原始圖像劃分成網格，然后基于網格的每個單元格回歸目標的類別概率和位置坐標。

作為一階段算法，YOLO的一個最大優點就是速度快，在VOC2007數據集上，mAP為63.4%，檢測算法速度可以達到45fps；YOLO的加速版本mAP為52.7%，速度甚至可以達到驚人的155fps。

不過，YOLO也有不盡如人意的地方，在目標位置的精度上比兩階段算法有所降低，尤其是在對一些小目標的檢測方面，效果明顯變差。正因為存在這些問題，后續YOLO的版本以及其他一階段算法，都致力于更好地解決上述問題。

2. SSD算法

2015年，W. Liu等人提出了SSD（Single Shot MultiBox Detector）算法，這是深度學習領域的第二個一階段算法。

與僅使用最頂層特征圖進行預測的方法不同，SSD最主要的貢獻是引入了基于多尺度特征圖的檢測策略，顯著提升了算法的性能，尤其是在小目標檢測方面，相比YOLO有了明顯的改善，在VOC2007數據集上，mAP達到了76.8%。

3. Retina-Net算法

Retina-Net算法的主要目的是解決正負樣本不平衡的問題。常規的一階段算法在提取訓練樣本的過程中，背景樣本的比例遠大于目標樣本的比例。正負樣本的極度不平衡會導致訓練過程中模型較少關注目標樣本，這也是一階段算法的精度低于兩階段算法的主要原因。

Retina-Net算法引入了損失函數，其核心思想是在訓練過程中，對傳統的交叉熵損失加上權重，使得錯分的樣本產生的損失在最終損失中占有更大的比例。引入損失函數，使得一階段算法在保持速度優勢的前提下，保證了目標檢測的精度。

4. FCOS算法

2019年，沈春華團隊提出了FCOS（Fully Convolutional One-Stage）算法。和SSD等一階段算法不同，FCOS是一種“anchor free”方法，回歸目標位置不需要預先設定anchor，在待檢測目標尺度和形態變化較大的場景中有重要的應用。

另外，FCOS算法在具體實現的過程中也使用了FPN策略，對于多尺度的目標有更好的檢測效果。

關于作者：涂銘，資深數據架構師和人工智能技術專家，現就職于騰訊，曾就職于阿里。對大數據、自然語言處理、圖像識別、Python、Java等相關技術有深入的研究，積累了豐富的實踐經驗。

金智勇，計算機視覺算法專家，在計算機視覺領域深耕12年。現就職于百度，曾就職于阿里和三星等知名高新技術企業。業務領域涵蓋增強現實、人臉識別、圖像美化、智能交通、工業質檢等多個方向，具有豐富的算法研究與落地經驗。

本文鏈接：http://www.www897cc.com/showinfo-119-2210-0.html九種深度學習算法簡介

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：騙人還是文字強！MIT最新研究：DeepFake換臉還不如編輯動動筆

下一篇：云安全日報220310：IBM輕量級企業應用服務器發現執行任意代碼漏洞,需要盡快升級

標簽：

熱門焦點

一加Ace2 Pro真機揭曉鈦空灰配色質感拉滿

終于，在經過了幾波預熱之后，一加Ace2 Pro的外觀真機圖在網上出現了。還是博主數碼閑聊站曝光的，這次的外觀設計還是延續了一加11的方案，只是細節上有了調整，例如新加入了鈦空灰
太卷！Redmi MAX 100英寸電視便宜了：12999元買Redmi史上最大屏

8月5日消息，從小米商城了解到，Redmi MAX 100英寸巨屏電視日前迎來官方優惠，到手價12999元，比發布價便宜了7000元，在大屏電視市場開卷。據了解，Redmi MAX 100
微軟邀請 Microsoft 365 商業用戶，測試視頻編輯器 Clipchamp

8 月 1 日消息，微軟近日宣布即將面向 Microsoft 365 商業用戶，開放 Clipchamp 應用，邀請用戶通過該應用來編輯視頻。微軟于 2021 年收購 Clipchamp，隨后開始逐步整合到 Microsof
本地生活這塊肥肉，拼多多也想吃一口

出品/壹覽商業作者/李彥編輯/木魚拼多多也看上本地生活這塊蛋糕了。近期，拼多多在App首頁“充值中心”入口上線了本機生活界面。壹覽商業發現，該界面目前主要
華為發布HarmonyOS 4：更好玩、更流暢、更安全

在8月4日的華為開發者大會2023（HDC.Together）大會上，HarmonyOS 4正式發布。自2019年發布以來，HarmonyOS一直以用戶為中心，經歷四年多的發展HarmonyOS已
國行版三星Galaxy Z Fold5/Z Flip5發布售價7499元起

2023年8月3日，三星電子舉行Galaxy新品中國發布會，正式在國內推出了新一代折疊屏智能手機三星Galaxy Z Fold5與Galaxy Z Flip5，以及三星Galaxy Tab S9
引領旗艦級影像能力向中端機普及 OPPO K11 系列發布 1799 元起

7月25日，OPPO正式發布K系列新品—— OPPO K11 。此次 K11 在中端手機市場長期被忽視的影像板塊發力，突破性地搭載索尼 IMX890 旗艦大底主攝，支持 OIS
蘋果MacBook Pro 2021測試：仍不支持平滑滾動

據10月30日9to5 Mac 消息報道，蘋果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后獲得了不錯的評價，亮點包括行業領先的性能，令人印象深刻的電池續航，精美豐
中關村論壇11月25日開幕，15位諾獎級大咖將發表演講

11月18日，記者從2022中關村論壇新聞發布會上獲悉，中關村論壇將于11月25至30日在京舉行。本屆中關村論壇由科學技術部、國家發展改革委、工業和信息化部、國務

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

九種深度學習算法簡介

一加Ace2 Pro真機揭曉鈦空灰配色質感拉滿

太卷！Redmi MAX 100英寸電視便宜了：12999元買Redmi史上最大屏

微軟邀請 Microsoft 365 商業用戶，測試視頻編輯器 Clipchamp

本地生活這塊肥肉，拼多多也想吃一口

華為發布HarmonyOS 4：更好玩、更流暢、更安全

國行版三星Galaxy Z Fold5/Z Flip5發布售價7499元起

引領旗艦級影像能力向中端機普及 OPPO K11 系列發布 1799 元起

蘋果MacBook Pro 2021測試：仍不支持平滑滾動

中關村論壇11月25日開幕，15位諾獎級大咖將發表演講

最新推薦

猜你喜歡

熱門推薦

相關資訊