日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

九種深度學習算法簡介

來源: 責編: 時間:2023-08-07 16:30:00 256觀看
導讀 一. 兩階段算法兩階段算法包含選擇候選框和修正目標分類/位置兩個階段,對這兩個階段的不同處理方式,構成了不同的算法方案。1. R-CNN算法2014年,R. Girshick等人提出了R-CNN算

 一. 兩階段算法f8928資訊網——每日最新資訊28at.com

兩階段算法包含選擇候選框和修正目標分類/位置兩個階段,對這兩個階段的不同處理方式,構成了不同的算法方案。f8928資訊網——每日最新資訊28at.com

1. R-CNN算法f8928資訊網——每日最新資訊28at.com

2014年,R. Girshick等人提出了R-CNN算法。R-CNN算法的思路非常簡單,首先基于Selective Search方法從原始圖像中篩選出若干候選框,然后將每個候選框中的圖像縮放的固定尺度送入卷積網絡提取特征,最后通過支持向量機(SVM)方法對特征進行分類,判斷候選框中的圖像是背景還是我們關注的目標類型。f8928資訊網——每日最新資訊28at.com

在VOC2007數據集上,R-CNN算法相比之前的檢測算法,在性能有了顯著的提升(從33.7%提升到58.5%),是檢測算法的一個里程碑式的突破。f8928資訊網——每日最新資訊28at.com

雖然R-CNN在算法性能上取得了巨大的進展,但弊端也非常明顯,因為需要分別從2000多個候選框中提取特征,所以效率非常低,后續各種算法正是為了解決這一問題而提出的一系列改進方案。f8928資訊網——每日最新資訊28at.com

2. SPP-Net算法f8928資訊網——每日最新資訊28at.com

2014年,何愷明等人提出了SPP-Net(Spatial Pyramid Pooling Networks,空間金字塔池化網絡)算法。f8928資訊網——每日最新資訊28at.com

R-CNN算法要求輸入卷積網絡用來提取特征的子圖像尺寸固定,比如Alex-Net就要求輸入的圖像大小為固定的224像素×224像素,而SPP-Net算法則去掉了這一限制。SPP-Net算法基于一個空間金字塔池化層(SPP layer),無論輸入的子圖像大小如何,都會將子圖像采樣成固定大小的圖像。f8928資訊網——每日最新資訊28at.com

在使用SPP-Net進行檢測的過程中,對原始圖像只需要進行一次卷積網絡計算,在得到整幅圖像的特征圖之后,通過空間金字塔池化層將每個候選框區域(ROI)都分別采樣成相同尺寸的子圖像,將相同尺寸的各個子圖像送入后續的網絡進行特征提取,提取的特征具有相同的維數,最后送入全連接層進行分類。f8928資訊網——每日最新資訊28at.com

SPP-Net不需要進行多次卷積網絡計算,與R-CNN相比,在算法精度不變的情況下,算法的速度有了20倍的大幅提升。f8928資訊網——每日最新資訊28at.com

3. Fast R-CNN算法f8928資訊網——每日最新資訊28at.com

2015年,R. Girshick等人提出了Fast R-CNN算法,其本質是在R-CNN和SPP-Net的基礎上進行了進一步改進。Fast R-CNN可以在網絡里同時預測目標的分類概率和位置偏移。f8928資訊網——每日最新資訊28at.com

在VOC2007數據集上,Fast R-CNN將mAP(mean Average Precision,平均精度均值)從58.5%提升至70.0%,算法速度也比R-CNN有了200倍的提升。雖然Fast R-CNN的性能和速度相比R-CNN和SPP-Net有了明顯的改善,但整體速度仍然受到候選框檢測算法的制約,為了解決這個問題,Faster R-CNN算法誕生了。f8928資訊網——每日最新資訊28at.com

4. Faster R-CNN算法f8928資訊網——每日最新資訊28at.com

2015年,S. Ren等人提出了Faster R-CNN算法,Faster R-CNN是第一個端到端算法,也是第一個接近實時深度學習的目標檢測算法。使用ZF-Net網絡骨架,在VOC2007數據集上,mAP達到了73.2%,算法速度達到了17fps。f8928資訊網——每日最新資訊28at.com

Faster R-CNN最主要的貢獻是使用卷積網絡檢測候選框。檢測候選框、預測目標的類別、回歸目標位置的偏移量,共享底層卷積特征,整個算法流程融合成了一個完整的端到端學習框架。Faster R-CNN突破了候選框檢測的速度瓶頸,是一種十分重要的兩階段算法。f8928資訊網——每日最新資訊28at.com

5. FPN算法f8928資訊網——每日最新資訊28at.com

2017年,Lin等人在Faster R-CNN的基礎上提出了FPN(Feature Pyramid Net works,特征金字塔策略)算法。f8928資訊網——每日最新資訊28at.com

在FPN之前,絕大多數深度學習檢測器都是基于卷積網絡最頂層的特征圖進行計算的。深層特征包含全局信息,卻弱化了細節信息,使用深層特征在小目標檢測,尤其是精準定位方面,有著較大的劣勢。FPN采用top-down結構以及側連方法,將深層特征和淺層特征進行融合,使得特征既包含全局信息又包含細節信息。f8928資訊網——每日最新資訊28at.com

另外,檢測計算也基于特征金字塔的多層特征圖,具有更強的多尺度適應性。基于FPN的Faster R-CNN算法在COCO數據集上取得了最優的性能。當前,FPN已經成為構建檢測算法的基礎策略。f8928資訊網——每日最新資訊28at.com

f8928資訊網——每日最新資訊28at.com

二. 一階段算法f8928資訊網——每日最新資訊28at.com

一階段算法和兩階段算法最主要的區別,就是沒有單獨的候選框篩選階段,而是直接回歸目標的位置坐標和分類概率。常用的一階段算法如下。f8928資訊網——每日最新資訊28at.com

1. YOLO算法f8928資訊網——每日最新資訊28at.com

2015年,R. Joseph等人提出了YOLO(You Look Only Once)算法,這是首個深度學習領域的一階段算法。f8928資訊網——每日最新資訊28at.com

從名字就可以看出,YOLO沒有兩階段算法中提取候選框和驗證分類兩個步驟,圖像送入一個神經網絡就能完成整個預測過程。YOLO算法的實現方案是,先把原始圖像劃分成網格,然后基于網格的每個單元格回歸目標的類別概率和位置坐標。f8928資訊網——每日最新資訊28at.com

作為一階段算法,YOLO的一個最大優點就是速度快,在VOC2007數據集上,mAP為63.4%,檢測算法速度可以達到45fps;YOLO的加速版本mAP為52.7%,速度甚至可以達到驚人的155fps。f8928資訊網——每日最新資訊28at.com

不過,YOLO也有不盡如人意的地方,在目標位置的精度上比兩階段算法有所降低,尤其是在對一些小目標的檢測方面,效果明顯變差。正因為存在這些問題,后續YOLO的版本以及其他一階段算法,都致力于更好地解決上述問題。f8928資訊網——每日最新資訊28at.com

2. SSD算法f8928資訊網——每日最新資訊28at.com

2015年,W. Liu等人提出了SSD(Single Shot MultiBox Detector)算法,這是深度學習領域的第二個一階段算法。f8928資訊網——每日最新資訊28at.com

與僅使用最頂層特征圖進行預測的方法不同,SSD最主要的貢獻是引入了基于多尺度特征圖的檢測策略,顯著提升了算法的性能,尤其是在小目標檢測方面,相比YOLO有了明顯的改善,在VOC2007數據集上,mAP達到了76.8%。f8928資訊網——每日最新資訊28at.com

3. Retina-Net算法f8928資訊網——每日最新資訊28at.com

Retina-Net算法的主要目的是解決正負樣本不平衡的問題。常規的一階段算法在提取訓練樣本的過程中,背景樣本的比例遠大于目標樣本的比例。正負樣本的極度不平衡會導致訓練過程中模型較少關注目標樣本,這也是一階段算法的精度低于兩階段算法的主要原因。f8928資訊網——每日最新資訊28at.com

Retina-Net算法引入了損失函數,其核心思想是在訓練過程中,對傳統的交叉熵損失加上權重,使得錯分的樣本產生的損失在最終損失中占有更大的比例。引入損失函數,使得一階段算法在保持速度優勢的前提下,保證了目標檢測的精度。f8928資訊網——每日最新資訊28at.com

4. FCOS算法f8928資訊網——每日最新資訊28at.com

2019年,沈春華團隊提出了FCOS(Fully Convolutional One-Stage)算法。和SSD等一階段算法不同,FCOS是一種“anchor free”方法,回歸目標位置不需要預先設定anchor,在待檢測目標尺度和形態變化較大的場景中有重要的應用。f8928資訊網——每日最新資訊28at.com

另外,FCOS算法在具體實現的過程中也使用了FPN策略,對于多尺度的目標有更好的檢測效果。f8928資訊網——每日最新資訊28at.com

關于作者:涂銘,資深數據架構師和人工智能技術專家,現就職于騰訊,曾就職于阿里。對大數據、自然語言處理、圖像識別、Python、Java等相關技術有深入的研究,積累了豐富的實踐經驗。f8928資訊網——每日最新資訊28at.com

金智勇,計算機視覺算法專家,在計算機視覺領域深耕12年。現就職于百度,曾就職于阿里和三星等知名高新技術企業。業務領域涵蓋增強現實、人臉識別、圖像美化、智能交通、工業質檢等多個方向,具有豐富的算法研究與落地經驗。f8928資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2210-0.html九種深度學習算法簡介

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 騙人還是文字強!MIT最新研究:DeepFake換臉還不如編輯動動筆

下一篇: 云安全日報220310:IBM輕量級企業應用服務器發現執行任意代碼漏洞,需要盡快升級

標簽:
  • 熱門焦點
  • 一加Ace2 Pro官宣:普及16G內存 引領24G

    一加官方今天繼續為本月發布的新機一加Ace2 Pro帶來預熱,公布了內存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引領,還有呢?#一加Ace2Pro#,2023 年 8 月,敬請期待。”同時
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質感拉滿

    終于,在經過了幾波預熱之后,一加Ace2 Pro的外觀真機圖在網上出現了。還是博主數碼閑聊站曝光的,這次的外觀設計還是延續了一加11的方案,只是細節上有了調整,例如新加入了鈦空灰
  • 小米降噪藍牙耳機Necklace分享:聽一首歌 讀懂一個故事

    在今天下午的小米Civi 2新品發布會上,小米還帶來了一款新的降噪藍牙耳機Necklace,我們也在發布結束的第一時間給大家帶來這款耳機的簡單分享。現在大家能見到最多的藍牙耳機
  • vivo TWS Air開箱體驗:真輕 臻好聽

    在vivo S15系列新機的發布會上,vivo的最新款真無線藍牙耳機vivo TWS Air也一同發布,本次就這款耳機新品給大家帶來一個簡單的分享。外包裝盒上,vivo TWS Air保持了vivo自家產
  • 如何使用JavaScript創建一只圖像放大鏡?

    譯者 | 布加迪審校 | 重樓如果您曾經瀏覽過購物網站,可能遇到過圖像放大功能。它可以讓您放大圖像的特定區域,以便瀏覽。結合這個小小的重要功能可以大大改善您網站的用戶體驗
  • 使用Webdriver-manager解決瀏覽器與驅動不匹配所帶來自動化無法執行的問題

    1、前言在我們使用 Selenium 進行 UI 自動化測試時,常常會因為瀏覽器驅動與瀏覽器版本不匹配,而導致自動化測試無法執行,需要手動去下載對應的驅動版本,并替換原有的驅動,可能還
  • 一個注解實現接口冪等,這樣才優雅!

    場景碼猿慢病云管理系統中其實高并發的場景不是很多,沒有必要每個接口都去考慮并發高的場景,比如添加住院患者的這個接口,具體的業務代碼就不貼了,業務偽代碼如下:圖片上述代碼有
  • 大廠卷向扁平化

    來源:新熵作者丨南枝 編輯丨月見大廠職級不香了。俗話說,兵無常勢,水無常形,互聯網企業調整職級體系并不稀奇。7月13日,淘寶天貓集團啟動了近年來最大的人力制度改革,目前已形成一
  • 半導體需求下滑 三星電子DS業務部門今年營業虧損預計超10萬億韓元

    7月17日消息,據外媒報道,去年下半年開始的半導體需求下滑,影響到了三星電子、SK海力士、英特爾等諸多廠商,營收明顯下滑,部分廠商甚至出現了虧損。作為
Top 主站蜘蛛池模板: 土默特左旗| 扬中市| 龙江县| 阜阳市| 临潭县| 武陟县| 渝中区| 汝阳县| 濮阳市| 邻水| 璧山县| 罗平县| 渝北区| 寿阳县| 兰溪市| 谢通门县| 西乌珠穆沁旗| 波密县| 晋州市| 樟树市| 资兴市| 兴义市| 天峻县| 时尚| 苍山县| 休宁县| 湘潭市| 平凉市| 青海省| 太仆寺旗| 绍兴县| 长海县| 周口市| 施秉县| 勃利县| 天门市| 巨鹿县| 寿宁县| 兰西县| 新津县| 胶州市|