日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

九種深度學習算法簡介

來源: 責編: 時間:2023-08-07 16:30:00 275觀看
導讀 一. 兩階段算法兩階段算法包含選擇候選框和修正目標分類/位置兩個階段,對這兩個階段的不同處理方式,構成了不同的算法方案。1. R-CNN算法2014年,R. Girshick等人提出了R-CNN算

 一. 兩階段算法gJI28資訊網——每日最新資訊28at.com

兩階段算法包含選擇候選框和修正目標分類/位置兩個階段,對這兩個階段的不同處理方式,構成了不同的算法方案。gJI28資訊網——每日最新資訊28at.com

1. R-CNN算法gJI28資訊網——每日最新資訊28at.com

2014年,R. Girshick等人提出了R-CNN算法。R-CNN算法的思路非常簡單,首先基于Selective Search方法從原始圖像中篩選出若干候選框,然后將每個候選框中的圖像縮放的固定尺度送入卷積網絡提取特征,最后通過支持向量機(SVM)方法對特征進行分類,判斷候選框中的圖像是背景還是我們關注的目標類型。gJI28資訊網——每日最新資訊28at.com

在VOC2007數據集上,R-CNN算法相比之前的檢測算法,在性能有了顯著的提升(從33.7%提升到58.5%),是檢測算法的一個里程碑式的突破。gJI28資訊網——每日最新資訊28at.com

雖然R-CNN在算法性能上取得了巨大的進展,但弊端也非常明顯,因為需要分別從2000多個候選框中提取特征,所以效率非常低,后續各種算法正是為了解決這一問題而提出的一系列改進方案。gJI28資訊網——每日最新資訊28at.com

2. SPP-Net算法gJI28資訊網——每日最新資訊28at.com

2014年,何愷明等人提出了SPP-Net(Spatial Pyramid Pooling Networks,空間金字塔池化網絡)算法。gJI28資訊網——每日最新資訊28at.com

R-CNN算法要求輸入卷積網絡用來提取特征的子圖像尺寸固定,比如Alex-Net就要求輸入的圖像大小為固定的224像素×224像素,而SPP-Net算法則去掉了這一限制。SPP-Net算法基于一個空間金字塔池化層(SPP layer),無論輸入的子圖像大小如何,都會將子圖像采樣成固定大小的圖像。gJI28資訊網——每日最新資訊28at.com

在使用SPP-Net進行檢測的過程中,對原始圖像只需要進行一次卷積網絡計算,在得到整幅圖像的特征圖之后,通過空間金字塔池化層將每個候選框區域(ROI)都分別采樣成相同尺寸的子圖像,將相同尺寸的各個子圖像送入后續的網絡進行特征提取,提取的特征具有相同的維數,最后送入全連接層進行分類。gJI28資訊網——每日最新資訊28at.com

SPP-Net不需要進行多次卷積網絡計算,與R-CNN相比,在算法精度不變的情況下,算法的速度有了20倍的大幅提升。gJI28資訊網——每日最新資訊28at.com

3. Fast R-CNN算法gJI28資訊網——每日最新資訊28at.com

2015年,R. Girshick等人提出了Fast R-CNN算法,其本質是在R-CNN和SPP-Net的基礎上進行了進一步改進。Fast R-CNN可以在網絡里同時預測目標的分類概率和位置偏移。gJI28資訊網——每日最新資訊28at.com

在VOC2007數據集上,Fast R-CNN將mAP(mean Average Precision,平均精度均值)從58.5%提升至70.0%,算法速度也比R-CNN有了200倍的提升。雖然Fast R-CNN的性能和速度相比R-CNN和SPP-Net有了明顯的改善,但整體速度仍然受到候選框檢測算法的制約,為了解決這個問題,Faster R-CNN算法誕生了。gJI28資訊網——每日最新資訊28at.com

4. Faster R-CNN算法gJI28資訊網——每日最新資訊28at.com

2015年,S. Ren等人提出了Faster R-CNN算法,Faster R-CNN是第一個端到端算法,也是第一個接近實時深度學習的目標檢測算法。使用ZF-Net網絡骨架,在VOC2007數據集上,mAP達到了73.2%,算法速度達到了17fps。gJI28資訊網——每日最新資訊28at.com

Faster R-CNN最主要的貢獻是使用卷積網絡檢測候選框。檢測候選框、預測目標的類別、回歸目標位置的偏移量,共享底層卷積特征,整個算法流程融合成了一個完整的端到端學習框架。Faster R-CNN突破了候選框檢測的速度瓶頸,是一種十分重要的兩階段算法。gJI28資訊網——每日最新資訊28at.com

5. FPN算法gJI28資訊網——每日最新資訊28at.com

2017年,Lin等人在Faster R-CNN的基礎上提出了FPN(Feature Pyramid Net works,特征金字塔策略)算法。gJI28資訊網——每日最新資訊28at.com

在FPN之前,絕大多數深度學習檢測器都是基于卷積網絡最頂層的特征圖進行計算的。深層特征包含全局信息,卻弱化了細節信息,使用深層特征在小目標檢測,尤其是精準定位方面,有著較大的劣勢。FPN采用top-down結構以及側連方法,將深層特征和淺層特征進行融合,使得特征既包含全局信息又包含細節信息。gJI28資訊網——每日最新資訊28at.com

另外,檢測計算也基于特征金字塔的多層特征圖,具有更強的多尺度適應性。基于FPN的Faster R-CNN算法在COCO數據集上取得了最優的性能。當前,FPN已經成為構建檢測算法的基礎策略。gJI28資訊網——每日最新資訊28at.com

gJI28資訊網——每日最新資訊28at.com

二. 一階段算法gJI28資訊網——每日最新資訊28at.com

一階段算法和兩階段算法最主要的區別,就是沒有單獨的候選框篩選階段,而是直接回歸目標的位置坐標和分類概率。常用的一階段算法如下。gJI28資訊網——每日最新資訊28at.com

1. YOLO算法gJI28資訊網——每日最新資訊28at.com

2015年,R. Joseph等人提出了YOLO(You Look Only Once)算法,這是首個深度學習領域的一階段算法。gJI28資訊網——每日最新資訊28at.com

從名字就可以看出,YOLO沒有兩階段算法中提取候選框和驗證分類兩個步驟,圖像送入一個神經網絡就能完成整個預測過程。YOLO算法的實現方案是,先把原始圖像劃分成網格,然后基于網格的每個單元格回歸目標的類別概率和位置坐標。gJI28資訊網——每日最新資訊28at.com

作為一階段算法,YOLO的一個最大優點就是速度快,在VOC2007數據集上,mAP為63.4%,檢測算法速度可以達到45fps;YOLO的加速版本mAP為52.7%,速度甚至可以達到驚人的155fps。gJI28資訊網——每日最新資訊28at.com

不過,YOLO也有不盡如人意的地方,在目標位置的精度上比兩階段算法有所降低,尤其是在對一些小目標的檢測方面,效果明顯變差。正因為存在這些問題,后續YOLO的版本以及其他一階段算法,都致力于更好地解決上述問題。gJI28資訊網——每日最新資訊28at.com

2. SSD算法gJI28資訊網——每日最新資訊28at.com

2015年,W. Liu等人提出了SSD(Single Shot MultiBox Detector)算法,這是深度學習領域的第二個一階段算法。gJI28資訊網——每日最新資訊28at.com

與僅使用最頂層特征圖進行預測的方法不同,SSD最主要的貢獻是引入了基于多尺度特征圖的檢測策略,顯著提升了算法的性能,尤其是在小目標檢測方面,相比YOLO有了明顯的改善,在VOC2007數據集上,mAP達到了76.8%。gJI28資訊網——每日最新資訊28at.com

3. Retina-Net算法gJI28資訊網——每日最新資訊28at.com

Retina-Net算法的主要目的是解決正負樣本不平衡的問題。常規的一階段算法在提取訓練樣本的過程中,背景樣本的比例遠大于目標樣本的比例。正負樣本的極度不平衡會導致訓練過程中模型較少關注目標樣本,這也是一階段算法的精度低于兩階段算法的主要原因。gJI28資訊網——每日最新資訊28at.com

Retina-Net算法引入了損失函數,其核心思想是在訓練過程中,對傳統的交叉熵損失加上權重,使得錯分的樣本產生的損失在最終損失中占有更大的比例。引入損失函數,使得一階段算法在保持速度優勢的前提下,保證了目標檢測的精度。gJI28資訊網——每日最新資訊28at.com

4. FCOS算法gJI28資訊網——每日最新資訊28at.com

2019年,沈春華團隊提出了FCOS(Fully Convolutional One-Stage)算法。和SSD等一階段算法不同,FCOS是一種“anchor free”方法,回歸目標位置不需要預先設定anchor,在待檢測目標尺度和形態變化較大的場景中有重要的應用。gJI28資訊網——每日最新資訊28at.com

另外,FCOS算法在具體實現的過程中也使用了FPN策略,對于多尺度的目標有更好的檢測效果。gJI28資訊網——每日最新資訊28at.com

關于作者:涂銘,資深數據架構師和人工智能技術專家,現就職于騰訊,曾就職于阿里。對大數據、自然語言處理、圖像識別、Python、Java等相關技術有深入的研究,積累了豐富的實踐經驗。gJI28資訊網——每日最新資訊28at.com

金智勇,計算機視覺算法專家,在計算機視覺領域深耕12年。現就職于百度,曾就職于阿里和三星等知名高新技術企業。業務領域涵蓋增強現實、人臉識別、圖像美化、智能交通、工業質檢等多個方向,具有豐富的算法研究與落地經驗。gJI28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2210-0.html九種深度學習算法簡介

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 騙人還是文字強!MIT最新研究:DeepFake換臉還不如編輯動動筆

下一篇: 云安全日報220310:IBM輕量級企業應用服務器發現執行任意代碼漏洞,需要盡快升級

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 通榆县| 陈巴尔虎旗| 吉林市| 黄平县| 浦江县| 苍南县| 沂南县| 吕梁市| 贞丰县| 申扎县| 鄂伦春自治旗| 呼玛县| 黄龙县| 抚顺市| 桑日县| 清流县| 元谋县| 宁波市| 徐闻县| 尚义县| 长丰县| 巩义市| 越西县| 旬阳县| 正宁县| 富蕴县| 岳普湖县| 和硕县| 额敏县| 宣恩县| 邓州市| 黑河市| 临汾市| 边坝县| 蓬安县| 兴隆县| 永顺县| 北川| 甘洛县| 广灵县| 马山县|