日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

一文帶你了解機器人是如何通過視覺實現目標跟蹤的

來源: 責編: 時間:2023-08-07 16:30:08 245觀看
導讀 Abstract:視覺跟蹤技術是計算機視覺領域(人工智能分支)的一個重要課題,有著重要的研究意義。在軍事制導、視頻監控、機器人視覺導航、人機交互、以及醫療診斷等許多方面有著廣泛

Abstract:視覺跟蹤技術是計算機視覺領域(人工智能分支)的一個重要課題,有著重要的研究意義。在軍事制導、視頻監控、機器人視覺導航、人機交互、以及醫療診斷等許多方面有著廣泛的應用前景。隨著研究人員不斷地深入研究,視覺目標跟蹤在近十幾年里有了突破性的進展,使得視覺跟蹤算法不僅僅局限于傳統的機器學習方法,更是結合了近些年人工智能熱潮—深度學習(神經網絡)和相關濾波器等方法。本文主要介紹以下幾點:什么是視覺目標跟蹤(單目標跟蹤)、單目標跟蹤的基本結構(框架),目標跟蹤存在的挑戰,目標跟蹤經典相關方法及研究趨勢等。2y728資訊網——每日最新資訊28at.com

01 單目標跟蹤任務簡介2y728資訊網——每日最新資訊28at.com

目標跟蹤是計算機視覺領域的一個重要問題,目前廣泛應用在體育賽事轉播、安防監控和無人機、無人車、機器人等領域。下面是一些應用的例子。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

車輛跟蹤2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

足球比賽2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

田徑比賽2y728資訊網——每日最新資訊28at.com

視覺目標(單目標)跟蹤是指對圖像序列中的運動目標進行檢測、提取、識別和跟蹤,獲得運動目標的運動參數,如位置、速度、加速度和運動軌跡等,從而進行下一步的處理與分析,實現對運動目標的行為理解,以完成更高一級的檢測任務。 2y728資訊網——每日最新資訊28at.com

其具體任務即根據所跟蹤的視頻序列給定初始幀(第一幀)的目標狀態(位置、尺度),預測后續幀中該目標狀態。基本結構(框架)如下:2y728資訊網——每日最新資訊28at.com

基本流程:輸入初始幀并指定期望跟蹤的目標,通常用矩形框標定(Input Frame),在下一幀中產生眾多候選框(Motion Model)并提取這些候選框的特征(Feature Extractor),觀測模型(Observation Model)對這些候選框評分。最后在這些評分中找一個得分最高的候選框作為預測的目標(Prediction A),或者對多個預測值進行融合(Ensemble)得到更優的預測目標。至此算法完成了根據第一幀的信息對第二幀的預測,后續幀以此類推,同時根據指定規則更新模型(Model Updater)。2y728資訊網——每日最新資訊28at.com

根據如上的框架,將目標跟蹤劃分為五項主要的研究內容,流程圖下圖所示:2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

流程圖2y728資訊網——每日最新資訊28at.com

運動模型(Motion Model):如何產生眾多的候選樣本。特征提取(Feature Extractor):利用何種特征表示目標。觀測模型(Observe Model):如何對眾多候選樣本評分。模型更新(Model Updater):如何更新觀測模型使其適應目標的變化。集成方法(Ensemble):如何融合多個決策獲得一個更有的決策結構。2y728資訊網——每日最新資訊28at.com

下圖的總結可以幫助更好的理解目標跟蹤算法是如何完成跟蹤任務的。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

跟蹤任務流程2y728資訊網——每日最新資訊28at.com

02 目標跟蹤算法分類2y728資訊網——每日最新資訊28at.com

大多數的跟蹤方法主要集中對觀測模型的設計,根據觀測模型的不同可分為兩類:生成式模型(Generative Model)和判別式模型(Discriminative Model)。2y728資訊網——每日最新資訊28at.com

生成式模型:通過提取目標特征來構建表觀模型,然后在圖像中搜索與模型最匹配的區域作為跟蹤結果。不論采用全局特征還是局部特征,生成式模型的本質是在目標表示的高維空間中,找到與目標模型最相鄰的候選目標作為當前估計。此類方法的缺陷在于只關注目標信息,而忽略了背景信息,在目標外觀發生劇烈變化或者遮擋時候容易出現目標漂移(drift)或者目標丟失。2y728資訊網——每日最新資訊28at.com

舉例:跟蹤器從當前幀知道了目標區域80%是紅色,20%是綠色,在下一幀中搜索算法回去找最符合這個顏色比例的區域。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

生成式算法框架2y728資訊網——每日最新資訊28at.com

判別式方法:將目標跟蹤看做是一個二元分類問題,通過訓練關于目標和背景的分類器將目標從背景中分離出來,從候選目標中確定目標,該方法可以顯著的區分背景和目標,性能魯棒,漸漸成為目標跟蹤領域主流方法。且目前大多數基于深度學習的目標跟蹤算法也屬于判別式方法。2y728資訊網——每日最新資訊28at.com

舉例:在訓練時告訴跟蹤器,目標80%是紅色,20%是綠色,同時背景中有桔紅色,要格外注意,這樣分類器知道更多信息,效果也相對較好。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

判別式算法框架2y728資訊網——每日最新資訊28at.com

03 目標跟蹤任務的困難和挑戰2y728資訊網——每日最新資訊28at.com

雖然目標追蹤的應用前景非常廣泛,但還是有一些問題限制了它的應用,主要問題例舉如下:2y728資訊網——每日最新資訊28at.com

形態變化 - 姿態變化是目標跟蹤中常見的干擾問題。運動目標發生姿態變化時, 會導致它的特征以及外觀模型發生改變, 容易導致跟蹤失敗。例如:體育比賽中的運動員、馬路上的行人。尺度變化 - 尺度的自適應也是目標跟蹤中的關鍵問題。當目標尺度縮小時, 由于跟蹤框不能自適應跟蹤, 會將很多背景信息包含在內, 導致目標模型的更新錯誤:當目標尺度增大時, 由于跟蹤框不能將目標完全包括在內, 跟蹤框內目標信息不全, 也會導致目標模型的更新錯誤。因此, 實現尺度自適應跟蹤是十分必要的。遮擋與消失 - 目標在運動過程中可能出現被遮擋或者短暫的消失情況。當這種情況發生時, 跟蹤框容易將遮擋物以及背景信息包含在跟蹤框內, 會導致后續幀中的跟蹤目標漂移到遮擋物上面。若目標被完全遮擋時, 由于找不到目標的對應模型, 會導致跟蹤失敗。圖像模糊 - 光照強度變化, 目標快速運動, 低分辨率等情況會導致目標模糊, 尤其是在運動目標與背景相似的情況下更為明顯。因此, 選擇有效的特征對目標和背景進行區分非常必要。2y728資訊網——每日最新資訊28at.com

下圖是上述問題的一些實例。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

目標跟蹤任務中的困難與挑戰2y728資訊網——每日最新資訊28at.com

如上圖所示,目標跟蹤任務中的困難和挑戰包括:2y728資訊網——每日最新資訊28at.com

1.形變,2.光照變化,3.相似干擾,4.運動模糊,5.背景干擾,6.遮擋,7.超出畫面,8.尺度變化,9.平面外宣傳,10.平面內旋轉,11.背景相似2y728資訊網——每日最新資訊28at.com

04 目標跟蹤的數據庫2y728資訊網——每日最新資訊28at.com

嚴謹的數據集是驅動算法的關鍵,前幾年目標跟蹤方向的數據庫資源相對匱乏,這也是目標跟蹤的發展相對落后于目標檢測的重要原因之一。下面簡要介紹了兩個權威的目標跟蹤方向的數據庫。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

OTB50數據集2y728資訊網——每日最新資訊28at.com

OTB可以說是做單目標跟蹤必跑的數據庫了,2013年的OTB50包含50個人工標注的視頻序列。由于在此之前目標跟蹤方向沒有比較公認的數據庫,所有的單跟蹤算法沒有一個統一的衡量,所以這個數據庫的意義非常重大,直接促進了單目標跟蹤算法的發展。后來又擴展為OTB100發送到TPAMI,有100個序列,難度更大更加權威。如果想要了解近年來比較厲害的跟蹤算法,可以參考吳毅老師的論文(附后)。2y728資訊網——每日最新資訊28at.com

VOT數據庫2y728資訊網——每日最新資訊28at.com

VOT Challenge是目標跟蹤領域的賽事,類似于圖形識別領域中的ImageNet挑戰賽。這些賽事通常都是標準數據集的來源,所以VOT數據集是一個常用的目標跟蹤數據集,所有序列支持免費下載。VOT競賽已經舉辦了9屆,每年競賽都會出現很多新的算法和別致的思路,2022年的VOT競賽也即將開啟,由于每年的評測序列都會更新,且標注的精確度逐年提高,VOT競賽也被視為視覺跟蹤領域最難的競賽,所以結果相對更可靠。2y728資訊網——每日最新資訊28at.com

OTB和VOT區別:OTB包括25%的灰度序列,而VOT都是彩色序列,這也是造成很多顏色特征算法性能差異的原因。兩個庫的評價指標不盡相同,具體請參考論文和競賽官網。2y728資訊網——每日最新資訊28at.com

05 目標跟蹤經典算法2y728資訊網——每日最新資訊28at.com

前幾年最熱門的生成式跟蹤方法是稀疏編碼(Sparse Coding), 而近來判別式跟蹤方法逐漸占據了主流地位,以相關濾波(CF:Correlation Filter)和深度學習(DL:Deep Learning)為代表的判別式方法取得了令人滿意的效果。本節按年份順序對經典算法進行一個簡單地梳理,其中各個算法的年份以論文發表的年份或者參加benchmark的年份為依據,幫助理解單目標跟蹤算法的演變和發展趨勢。針對于不同的跟蹤任務的挑戰各個算法所提出的解決思想值得我們學習體會,跟蹤算法的發展趨勢可見一斑。2y728資訊網——每日最新資訊28at.com

1981LK Tracker 19812y728資訊網——每日最新資訊28at.com

LK Tracker應該是最早的目標跟蹤工作,它使用了光流的概念,如下圖所示,不同顏色表示光流不同的方向,顏色的深淺表示運動的速度。光流的計算非常簡單也非常快,但是它的魯棒性不好,基本上只能對平移且外觀不變的物體進行跟蹤。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

光流法2y728資訊網——每日最新資訊28at.com

2002Mean Shift2y728資訊網——每日最新資訊28at.com

Mean Shift采用均值漂移作為搜索策略,這是一種無參概率估計方法,該方法利用圖像特征直方圖構造空間平滑的概率密度函數,通過沿著概率密度函數的梯度方向迭代,搜索函數局部最大值。在當時成為了常用的目標跟蹤方法,簡單易實現,但魯棒性較低。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

MeanShift算法2y728資訊網——每日最新資訊28at.com

2010MOSSE2y728資訊網——每日最新資訊28at.com

MOSSE(Minimum Output Sum of Squared Error)使用相關濾波來做目標跟蹤(不是第一個,但由于思路清晰、算法完整稱為相關濾波跟蹤算法的鼻祖),其速度能夠達到600多幀每秒,但是效果一般,主要是因為它只使用了簡單的原始像素特征。2y728資訊網——每日最新資訊28at.com

大致流程:2y728資訊網——每日最新資訊28at.com

再入初始幀的groundtruth(包括中心點和矩形框的高寬)對當前目標框進行隨機仿射變換生成128個樣本,每個樣本經過高斯函數計算得出響應值,最終結合公式得出濾波器模版(圖13中的FILTER)。根據模版計算得出第二幀的響應圖,其中響應值最大的點為第二幀目標的中心點,并以此畫出目標框(圖13中的OUTPUT)。根據第二幀的目標區域更新濾波器模版重復3-4步2y728資訊網——每日最新資訊28at.com

 2y728資訊網——每日最新資訊28at.com

MOSSE算法2y728資訊網——每日最新資訊28at.com

2012CSK2y728資訊網——每日最新資訊28at.com

CSK的作者針對MOSSE做出了一些改進,作者認為循環移位能模擬當前正樣本的所有的轉換版本(除邊界以外),因此采用循環矩陣進行密集采樣(對比MOSSE的隨機仿射采樣),并通過核函數將低維線性空間映射到高維空間,提高了相關濾波器的魯棒性。2y728資訊網——每日最新資訊28at.com

循環矩陣是一種特殊的矩陣,它的一維形式就是由一個n維向量每次向右循環移動一個元素,直到生成一個n×n的矩陣,具體效果如下圖所示。2y728資訊網——每日最新資訊28at.com

循環矩陣示意圖2y728資訊網——每日最新資訊28at.com

2014KCF2y728資訊網——每日最新資訊28at.com

CSK的特征輸入是單通道的灰度像素,而KCF利用的是HOG多通道特征,核函數利用了高斯核函數。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

方向梯度特征效果圖2y728資訊網——每日最新資訊28at.com

可以說CSK和KCF的結合才是完整的核化相關濾波器的演變趨勢,既有循環矩陣及傅立葉對角化簡化計算,又有對單通道特種應用的拓展,可以適應更多優秀的特征描述。2y728資訊網——每日最新資訊28at.com

DSST2y728資訊網——每日最新資訊28at.com

DSST作者將跟蹤分為兩個部分——位置變化和尺度變化。在跟蹤過程中,作者定義了兩個濾波器分別用于確定新目標的位置和尺度評估,提高了算法的魯棒性。2y728資訊網——每日最新資訊28at.com

2015MDNet2y728資訊網——每日最新資訊28at.com

MDNet設計了一個輕量級的小型網絡學習卷積特征表示目標。作者提出了一個多域的網絡框架。2y728資訊網——每日最新資訊28at.com

在離線訓練時,特征提取網絡是共享的,同時針對每個視頻序列構建一個新的檢測分支進行訓練。這樣特征提取網絡可以學習到通用性更強的與域無關的特征。2y728資訊網——每日最新資訊28at.com

在跟蹤時,保留并固定特征提取網絡,針對跟蹤序列構建一個新的分支檢測部分,用第一幀樣本在線訓練檢測部分之后再利用跟蹤結果生成正負樣本來微調檢測分支。2y728資訊網——每日最新資訊28at.com

此外,MDNet在訓練中負樣本的生成用到了難例挖掘技術,隨著訓練的進行增大樣本的分類難度,從而使得網絡的判別能力越來越強。2y728資訊網——每日最新資訊28at.com

如下圖所示,負樣本越來越難分。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

難例挖掘2y728資訊網——每日最新資訊28at.com

SRDCF2y728資訊網——每日最新資訊28at.com

SRDCF的作者考慮到若僅使用單純的相關濾波會導致邊界效應,也就是相關濾波采用循環移位采樣導致當目標移位到邊緣時會被分割開,此時得到的樣本中就沒有完整的目標圖像從而失去效果。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

邊界效應2y728資訊網——每日最新資訊28at.com

于是,作者的思路是既然邊界效應發生在邊界附近,那就忽略所有移位樣本的邊界部分像素,或者說限制讓邊界附近濾波器系數接近0,具體做法是加入空間正則化,懲罰邊界區域的濾波器系數,效果如下圖。2y728資訊網——每日最新資訊28at.com

SRDCE空間正則化2y728資訊網——每日最新資訊28at.com

HCF2y728資訊網——每日最新資訊28at.com

HCF的主要貢獻是把相關濾波中的HOG特征換成了深度特征,它使用的是VGG的3、4、5三個層來提取特征,針對每層CNN訓練一個過濾器,并且按照從深到淺的順序使用相關濾波,然后利用深層得到的結果來引導淺層從而減少搜索空間。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

HCF算法提取深度特征2y728資訊網——每日最新資訊28at.com

上圖是使用卷積可視化得到的,如圖中所示,在conv3中的特征能夠比較清晰的看到目標的輪廓,但是在conv5中已經很難看到細節所在,但是,在conv5當中能夠看到的是,本層特征包含了較多的語義信息,左半部分的高亮區域就是目標位置的所在的大概區域范圍,所以在高層特征當中,能夠很容易的找到目標所在的大概區域范圍,然后逐步使用較低層次的特征對目標進行精確定位。2y728資訊網——每日最新資訊28at.com

2016Staple2y728資訊網——每日最新資訊28at.com

Staple提出了一種互補的方式。考慮到HOG特征對形變和運動模糊比較敏感,但是對顏色變化能夠達到很好的跟蹤效果,color特征對顏色比較敏感,但是對形變和運動模糊能夠有很好的跟蹤效果,因此作者認為若能將兩者互補就能夠解決跟蹤過程當中遇到的一些主要問題。于是,Staple使用HOG-KCF與color-KCF結合算法對目標進行跟蹤。2y728資訊網——每日最新資訊28at.com

此算法的創新思路簡單直白,但效果很驚艷。2y728資訊網——每日最新資訊28at.com

TCNN2y728資訊網——每日最新資訊28at.com

TCNN使用一個樹形的結構來處理CNN特征。作者利用可靠性來分配預測目標的權重,采用的更新策略是每10幀刪除最前的節點,同時創建一個新的CNN節點,選擇能夠使新節點的可靠性最高的節點作為其父節點。這樣一直保持一個active set,里面是10個最新更新的CNN模型,用這個active set來做跟蹤。但由于要更新網絡結構,速度較慢。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

TCNN樹形結構更新示例2y728資訊網——每日最新資訊28at.com

siamFC2y728資訊網——每日最新資訊28at.com

SiamFC方法的核心思想很簡單,就是將跟蹤過程規劃為一個相似性學習問題。即學習一個函數 f(z, x) 來比較樣本圖像 z 和搜索圖像 x 的相似性,如果兩個圖像相似度越高,則得分越高。為了找到在下一幀圖像中目標的位置,可以通過測試所有目標可能出現的位置,將相似度最大的位置作為目標的預測位置。2y728資訊網——每日最新資訊28at.com

在深度學習中處理相似度問題最典型的是采用Siamese架構,SiamFC的網絡結構如下圖:2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

SiamFC網絡結構2y728資訊網——每日最新資訊28at.com

2017 CFNet2y728資訊網——每日最新資訊28at.com

CFNet采用孿生網絡的架構,訓練樣本(這里指用來匹配的模板)和測試樣本(搜索的圖像區域)通過一個相同的網絡,然后只將訓練樣本做相關濾波操作,形成一個對變化有魯棒性的模板。為了抑制邊界效應,作者施加了余弦窗并在之后又對訓練樣本進行了裁剪。2y728資訊網——每日最新資訊28at.com

2018UPDT2y728資訊網——每日最新資訊28at.com

UPDT算法的主要思想是區別對待深度特征和淺層特征,深層特征能通過數據增強來提升效果,同時深層特征主打的是魯棒性而不是精度;相反,淺層特征經數據增強后反而降低了效果,但同時它能夠很好地保證精度。因此,作者得出了深度模型和淺層模型先分別獨立訓練,最后再融合的方案。2y728資訊網——每日最新資訊28at.com

SiamRPN2y728資訊網——每日最新資訊28at.com

SiamRPN在SiamFC的基礎上利用了Faster RCNN中的RPN,解決了之前深度學習跟蹤算法沒有domain specific(可理解為類間不區分)以及還需額外的尺度檢測與在線微調的問題。RPN回歸網絡的引入,一方面提高了精度,另一方面回歸過程代替多尺度檢測,使得速度有所提升。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

SiamRPN網絡結構2y728資訊網——每日最新資訊28at.com

2019SiamRCNN2y728資訊網——每日最新資訊28at.com

SiamRCNN發現重檢測很容易受到干擾物的影響從而產生模型漂移,從難例挖掘和運動軌跡動態規劃兩個角度入手,設計了一個利用第一幀和前一幀為模板的孿生網絡檢測結構,在短時跟蹤評價上效果驚人,在長時跟蹤評價上也有非常顯著的進步。2y728資訊網——每日最新資訊28at.com

其中軌跡動態規劃算法(TDPA)主要思想是通過重新檢測前一幀中所有的目標候選框,并將這些候選框隨時間分組到短目標軌跡中,同時跟蹤所有潛在的目標,包括干擾目標。然后根據視頻中所有目標對象和干擾對象的完整歷史軌跡選擇當前最佳對象。2y728資訊網——每日最新資訊28at.com

2020 RPT框架2y728資訊網——每日最新資訊28at.com

RPT算法框架由目標狀態估計網絡與在線分類網絡兩部分組成:2y728資訊網——每日最新資訊28at.com

目標狀態估計網絡將跟蹤目標狀態表示為特征點集,以提升對目標位姿變化、幾何結構變化的建模能力。在視覺目標跟蹤任務中,為了方便真值標注與特征提取,目標狀態通常用矩形框進行表示。矩形框一方面是對目標區域的一種粗略表示,包含多余的背景;另一方面不具備對目標位姿變化、幾何結構變化的建模能力,進而限制了回歸精度。因此,將跟蹤目標表示為一系列特征點,通過監督學習目標區域內的語義關鍵點與極值點,實現更精細的目標狀態估計。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

PRT目標狀態估計網絡2y728資訊網——每日最新資訊28at.com

在線分類網絡由輕量的兩層全卷積神經網絡構成,使得RPT框架具備對抗周邊相似干擾物的強魯棒性。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

 RPT在線分類網絡2y728資訊網——每日最新資訊28at.com

06 目標跟蹤的研究趨勢2y728資訊網——每日最新資訊28at.com

本節淺析近幾年來目標跟蹤領域各種算法主流的研究趨勢和發展方向。2y728資訊網——每日最新資訊28at.com

a) 信息提取深度特征2y728資訊網——每日最新資訊28at.com

在現實場景中,物體是在三維的運動場中移動的。而視頻或圖像序列都是二維的信息,這其實是一些難題的根本原因之一。一個比較極端的例子就是理發店門前經常會出現的旋轉柱,如果單純地從二維角度來看,柱子是向上運動的,可在實際的運動場中柱子是橫向運動的,觀測和實際的運動方向是完全垂直的。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

旋轉柱效果圖2y728資訊網——每日最新資訊28at.com

因此,為了能夠更好地跟蹤目標,我們需要提取盡可能好的特征,此外最好能從視頻或圖像序列中學到更多豐富的信息(尤其是含語義的)。2y728資訊網——每日最新資訊28at.com

時域和空間域結合2y728資訊網——每日最新資訊28at.com

由于CNN能夠在學習的過程中能夠產生對樣本中各個區域有區分的關注度,因此可以不考慮邊界效應。對邊界效應的處理主要是在相關濾波類等需要循環移位的算法中出現。2y728資訊網——每日最新資訊28at.com

事實上,目標跟蹤這一個任務本身就在利用時域信息,因為預測下一幀肯定需要上一幀的信息,然而僅僅利用上一幀的信息往往是不夠的,充分的利用時域信息在正則或者輔助記憶方面都可以取得一定的效果。2y728資訊網——每日最新資訊28at.com

b) 元學習2y728資訊網——每日最新資訊28at.com

當深度特征興起之后,目標跟蹤中的許多算法都選擇遷移目標分類任務中的一些預訓練模型來提取特征,這種遷移學習其實就包含了元學習的思想。例如MDNet將每個視頻看做一個域,在測試時新建一個域但同時保留了之前訓練時在其他域上學到的經驗,既能夠更快更好地在新的視頻序列上學習也避免了過擬合。2y728資訊網——每日最新資訊28at.com

孿生網絡實際上也是元學習領域一種比較常用的結構,它本身學習了如何去判斷輸入之間的相似度。2y728資訊網——每日最新資訊28at.com

c) 防止過擬合2y728資訊網——每日最新資訊28at.com

目標跟蹤中由于模版更新或目標形變等因素造成的過擬合問題也是一個比較重要的關注點,下面是一些比較常見的方法:2y728資訊網——每日最新資訊28at.com

采用稀疏更新的方式(隔幾幀更新一次),相當于將利用單幀信息的更新變成了批處理的形式。每次更新采用最近幾幀的信息而不是只用目前幀的信息,其原理類似上一條。利用初始幀或者質量比較好的幾幀存儲的樣本來進行時域正則。對不同的情況采用不同的更新或者初始化的策略。使用掩模去除不可靠的信息。07 學習目標跟蹤相關參考資料a) 入門相信本篇文章可以幫助大家了解“什么是目標跟蹤”“目標跟蹤要完成一件什么樣的事情”。下面這篇文章更加詳盡地介紹了目標跟蹤任務流程中的各個子問題(參照本文第一節的流程圖)。https://www.pianshen.com/article/54451671167/此外想要入門目標跟蹤(同樣適用計算機視覺的其他任務,如目標檢測等),可以從學習OpenCV入手,先掌握基本的圖像處理、提取圖像特征,以有效地去描述目標。推薦一個簡單好上手的OpenCV入門課程資源:https://www.bilibili.com/video/BV1Fo4y1d7JL?p=1b) 進階2y728資訊網——每日最新資訊28at.com

推薦大家深入地學習一種經典的目標跟蹤算法,由于具體算法的詳細原理內容較多,在此不做贅述,這里推薦幾種經典的跟蹤算法學習資料,也可以自行選取一兩種其他經典算法進行深入學習:2y728資訊網——每日最新資訊28at.com

基于相關濾波的目標跟蹤經典算法:KCF(源碼已收入OpenCV4):https://blog.csdn/crazyice521/article/details/53525366基于孿生網絡的目標跟蹤鼻祖算法:SiamFC(先理解孿生網絡):https://arxiv.org/pdf/1606.09549.pdf吳毅老師的論文,包含了2012年以前經典算法的對比Wu Y, Lim J, Yang M H. Online object tracking: A benchmark [C]// CVPR, 2013.Wu Y, Lim J, Yang M H. Object tracking benchmark [J]. TPAMI, 2015.c)前沿2y728資訊網——每日最新資訊28at.com

     以下資料鏈接可以了解最新的跟蹤算法和跟蹤思路:2y728資訊網——每日最新資訊28at.com

首先推薦一個在github上維護的Tracking Benchmark for Correlation Filters,總結了相關濾波的目標跟蹤算法并按每篇論文解決的問題進行分類:https://github.com/HEscop/TBCF下圖是中科院博士王強在github上總結的跟蹤算法的思維導圖,根據跟蹤算法發展進行了梳理,可以看到目標跟蹤算法主要往兩個大方向發展,分別是CF即相關濾波和DL即深度學習。同一個鏈接下還包括了各項成果的paper及code。長期更新和維護,值得收藏。2y728資訊網——每日最新資訊28at.com

2y728資訊網——每日最新資訊28at.com

目標跟蹤算法思維導圖2y728資訊網——每日最新資訊28at.com

VOT歷屆競賽地址,可以了解到每年大賽得獎算法的各項性能評分和原理 :https://www.votchallenge/challenges.html目標跟蹤方向的論文可以關注計算機視覺的三大頂會 CVPR (Computer Vision and Pattern Recognition)、ICCV (International Conference on Computer Vision) 、ECCV (European Conference on Computer Vision)。2y728資訊網——每日最新資訊28at.com

下面總結了19年20年的頂會論文:2y728資訊網——每日最新資訊28at.com

CVPR2020(共33篇) :https://bbs.cvmart/topics/2733ECCV2020(共26篇):https://bbs.cvmart/topics/3097CVPR2019(共19篇)https://bbs.cvmart/articles/523ICCV2019(共11篇):https://bbs.cvmart/articles/11902y728資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2264-0.html一文帶你了解機器人是如何通過視覺實現目標跟蹤的

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 像「毒液」一樣可變形、修復的機器人來了,輕松穿過1.5毫米細縫

下一篇: 云安全日報220407:VMware云計算解決方案發現遠程代碼執行漏洞,需要盡快升級

標簽:
  • 熱門焦點
  • Find N3入網:最高支持16+1TB

    OPPO將于近期登場的Find N3折疊屏目前已經正式入網,型號為PHN110。本次Find N3在外觀方面相比前兩代有很大的變化,不再是小號的橫向折疊屏,而是跟別的廠商一樣采用了較為常見的
  • 7月安卓手機性價比榜:努比亞+紅魔兩款新機入榜

    7月登場的新機有努比亞Z50S Pro和紅魔8S Pro,除了三星之外目前唯二的兩款搭載超頻版驍龍8Gen2處理器的產品,而且努比亞和紅魔也一貫有著不錯的性價比,所以在本次的性價比榜單
  • 把LangChain跑起來的三個方法

    使用LangChain開發LLM應用時,需要機器進行GLM部署,好多同學第一步就被勸退了,那么如何繞過這個步驟先學習LLM模型的應用,對Langchain進行快速上手?本片講解3個把LangChain跑起來
  • 分布式系統中的CAP理論,面試必問,你理解了嘛?

    對于剛剛接觸分布式系統的小伙伴們來說,一提起分布式系統,就感覺高大上,深不可測。而且看了很多書和視頻還是一臉懵逼。這篇文章主要使用大白話的方式,帶你理解一下分布式系統
  • 谷歌KDD'23工作:如何提升推薦系統Ranking模型訓練穩定性

    谷歌在KDD 2023發表了一篇工作,探索了推薦系統ranking模型的訓練穩定性問題,分析了造成訓練穩定性存在問題的潛在原因,以及現有的一些提升模型穩定性方法的不足,并提出了一種新
  • 微信語音大揭秘:為什么禁止轉發?

    大家好,我是你們的小米。今天,我要和大家聊一個有趣的話題:為什么微信語音不可以轉發?這是一個我們經常在日常使用中遇到的問題,也是一個讓很多人好奇的問題。讓我們一起來揭開這
  • JavaScript學習 -AES加密算法

    引言在當今數字化時代,前端應用程序扮演著重要角色,用戶的敏感數據經常在前端進行加密和解密操作。然而,這樣的操作在網絡傳輸和存儲中可能會受到惡意攻擊的威脅。為了確保數據
  • 虛擬鍵盤 API 的妙用

    你是否在遇到過這樣的問題:移動設備上有一個固定元素,當激活虛擬鍵盤時,該元素被隱藏在了鍵盤下方?多年來,這一直是 Web 上的默認行為,在本文中,我們將探討這個問題、為什么會發生
  • 當家的盒馬,加速謀生

    來源 | 價值星球Planet作者 | 歸去來自己“當家”的盒馬,開始加速謀生了。據盒馬官微消息,盒馬計劃今年開放生鮮供應鏈,將其生鮮商品送往食堂。目前,盒馬在上海已經與
Top 主站蜘蛛池模板: 察隅县| 高密市| 兴安县| 伊吾县| 舟山市| 黄骅市| 鄱阳县| 梨树县| 乌苏市| 巩留县| 台中县| 错那县| 义马市| 额济纳旗| 崇州市| 突泉县| 寿宁县| 剑阁县| 中宁县| 同德县| 肃北| 达拉特旗| 游戏| 包头市| 平和县| 洛扎县| 离岛区| 徐水县| 陈巴尔虎旗| 庐江县| 开原市| 梅州市| 西平县| 洮南市| 元氏县| 布拖县| 仙游县| 陇南市| 象州县| 张北县| 巨野县|