日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

ICRA 2022杰出論文:把自動駕駛2D圖像轉成鳥瞰圖,模型識別準確率立增15%

來源: 責編: 時間:2023-08-07 16:30:28 257觀看
導讀 對于自動駕駛中的許多任務來說,從自上而下、地圖或鳥瞰 (BEV) 幾個角度去看會更容易完成。由于許多自動駕駛主題被限制在地平面,所以俯視圖是一種更實用的低維表征,對于導航也

對于自動駕駛中的許多任務來說,從自上而下、地圖或鳥瞰 (BEV) 幾個角度去看會更容易完成。由于許多自動駕駛主題被限制在地平面,所以俯視圖是一種更實用的低維表征,對于導航也更加理想,能夠捕獲相關障礙和危險。對于像自主駕駛這樣的場景,語義分割的 BEV 地圖必須作為瞬時估計生成,以處理自由移動的對象和只訪問一次的場景。RUV28資訊網——每日最新資訊28at.com

要想從圖像推斷 BEV 地圖,就需要確定圖像元素與它們在環境中的位置之間的對應關系。此前的一些研究以稠密深度圖和圖像分割地圖指導這種轉換過程,還有研究延展了隱式解析深度和語義的方法。一些研究則利用了相機的幾何先驗,但并沒有明確地學習圖像元素和 BEV 平面之間的相互作用。RUV28資訊網——每日最新資訊28at.com

在近期一篇論文中,來自薩里大學的研究者引入了注意力機制,將自動駕駛的 2D 圖像轉換為鳥瞰圖,使得模型的識別準確率提升了 15%。這項研究在不久前落幕的 ICRA 2022 會議上獲得了杰出論文獎。RUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

論文鏈接:https://arxiv.org/pdf/2110.00966.pdfRUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

與以往的方法不同,這項研究將 BEV 的轉換視為一個「Image-to-World」的轉換問題,其目標是學習圖像中的垂直掃描線(vertical scan lines)和 BEV 中的極射線(polar ray)之間的對齊。因此,這種射影幾何對網絡來說是隱式的。RUV28資訊網——每日最新資訊28at.com

在對齊模型上,研究者采用了 Transformer 這種基于注意力的序列預測結構。利用其注意力機制,研究者明確地建模了圖像中垂直掃描線與其極性 BEV 投影之間的成對相互作用。Transformer 非常適合圖像到 BEV 的轉換問題,因為它們可以推理出物體、深度和場景照明之間的相互依賴關系,以實現全局一致的表征。RUV28資訊網——每日最新資訊28at.com

研究者將基于 Transformer 的對齊模型嵌入到一個端到端學習公式中,該公式以單目圖像及其固有矩陣為輸入,然后預測靜態和動態類的語義 BEV 映射。RUV28資訊網——每日最新資訊28at.com

本文構建了一個體系結構,有助于從對齊模型周圍的單目圖像預測語義 BEV 映射。如下圖 1 所示,它包含三個主要組成部分:一個標準的 CNN 骨干,用于提取圖像平面上的空間特征;編碼器 - 解碼器 Transformer 將圖像平面上的特征轉換為 BEV;最后一個分割網絡將 BEV 特征解碼為語義地圖。RUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

具體而言,這項研究的主要貢獻在于:RUV28資訊網——每日最新資訊28at.com

(1)用一組 1D 序列 - 序列的轉換從一幅圖像中生成一個 BEV 圖;(2)構建了一個受限制的數據高效的 Transformer 網絡,具備空間感知能力;(3)公式和語言領域單調注意力的結合表明,對于精確的映射來說,知道圖像中一個點下面是什么比知道它上面是什么更重要,盡管兩者都使用會導致最佳性能;(4)展示了軸向注意力如何通過提供時間意識來提高性能,并在三個大規模數據集上展示了最新的結果。實驗結果RUV28資訊網——每日最新資訊28at.com

在實驗中,研究者做了幾項評估:將圖像到 BEV 的轉換作為 nuScenes 數據集上的轉換問題評估其效用;在單調注意力中消融回溯方向,評估長序列水平上下文的效用和極位置信息(polar positional information)的影響。最后,將該方法與 nuScenes 、Argoverse 和 Lyft 數據集的 SOTA 方法進行比較。RUV28資訊網——每日最新資訊28at.com

消融實驗RUV28資訊網——每日最新資訊28at.com

如下表 2 的第一部分所示,研究者比較了軟注意力 (looking both ways)、圖像底部回溯(looking down) 的單調注意力、圖像頂部回溯 (looking up) 的單調注意力。結果表明,從圖像中的一個點向下看比向上看要好。RUV28資訊網——每日最新資訊28at.com

沿著局部的紋理線索——這與人類在城市環境中試圖確定物體距離的方法是一致的,我們會利用物體與地平面相交的位置。結果還表明,兩個方向的觀察都進一步提高了精度,使深度推理更具有識別力。RUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

長序列水平上下文的效用。此處的圖像 - BEV 轉換是作為一組 1D 序列 - 序列轉換進行的,因此一個問題是,當整個圖像被轉換成 BEV 時會發生什么。考慮到生成注意力地圖所需的二次計算時間和記憶力,這種方法的成本高得令人望而卻步。然而,可以通過在圖像平面特征上應用水平軸向注意力,取得近似使用整個圖像的上下文效益。借助通過圖像行的軸向注意力,垂直掃描線中的像素現在具備了長距離的水平上下文,之后像以前一樣,通過在 1D 序列之間轉換來提供長距離的垂直上下文。RUV28資訊網——每日最新資訊28at.com

如表 2 中間部分所示,合并長序列水平上下文并不會使模型受益,甚至略有不利影響。這說明了兩點:首先,每個轉換后的射線并不需要輸入圖像整個寬度的信息,或者更確切地說,比起已經通過前端卷積聚合的上下文,長序列上下文并沒有提供任何額外的好處。這表明,使用整個圖像執行轉換,不會讓模型精度提高以至超過 baseline 約束公式;此外,引入水平軸向注意力導致的性能下降意味著使用注意力訓練圖像寬度的序列的困難,可以看出,使用整個圖像作為輸入序列的話,會更難訓練。RUV28資訊網——每日最新資訊28at.com

Polar-agnostic vs polar-adaptive Transformers:表 2 最后一部分比較了 Po-Ag 與 Po-Ad 的變體。一個 Po-Ag 模型沒有極化位置信息,圖像平面的 Po-Ad 包括添加到 Transformer 編碼器中的 polar encodings,而對于 BEV 平面,這些信息會加入到解碼器中。在任何一個平面上添加 polar encodings 都比在不可知模型上添加更有益處,其中動態類的增加最多。將它添加到兩個平面會進一步強化這一點,但對靜態類的影響最大。RUV28資訊網——每日最新資訊28at.com

和 SOTA 方法的對比RUV28資訊網——每日最新資訊28at.com

研究者將本文方法與一些 SOTA 方法進行了比較。如下表 1 所示,空間模型的表現優于目前壓縮的 SOTA 方法 STA-S ,平均相對改善 15% 。在更小的動態類上,改善更加顯著,公共汽車、卡車、拖車和障礙物的檢測準確度都增加了相對 35-45% 。RUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

下圖 2 中得到的定性結果也支持了這一結論,本文模型顯示出更大的結構相似性和更好的形狀感。這種差異可以部分歸因于用于壓縮的全連接層(FCL) : 當檢測小而遙遠的物體時,圖像的大部分是冗余的上下文。RUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

此外,行人等物體往往部分被車輛擋住。在這種情況下,全連接層將傾向于忽略行人,而是保持車輛的語義。在這里,注意力方法展示出了它的優勢,因為每個徑向深度都可以獨立地注意到圖像ーー如此,更深的深度可以使行人的身體可見,而此前的深度只可以注意到車輛。RUV28資訊網——每日最新資訊28at.com

下表 3 中 Argoverse 數據集上的結果展示了類似的模式,其中本文方法對比 PON [8]提高了 30% 。RUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

如下表 4 所示,本文方法在 nuScenes 和 Lyft 上的表現優于 LSS [9]和 FIERY [20]。在 Lyft 上進行真正的對比是不可能的,因為它沒有規范的 train/val 分割,而且無法獲得 LSS 所使用的分割。RUV28資訊網——每日最新資訊28at.com

圖片RUV28資訊網——每日最新資訊28at.com

更多研究細節,可參考原論文。RUV28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2410-0.htmlICRA 2022杰出論文:把自動駕駛2D圖像轉成鳥瞰圖,模型識別準確率立增15%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 微軟云計算副總裁將離職:被指辱罵員工

下一篇: 云安全日報220707:思科Expressway系列和網真視頻通信服務器發現遠程攻擊漏洞,需要盡快升級

標簽:
  • 熱門焦點
  • Redmi Buds 4開箱簡評:才199還有降噪 可以無腦入

    在上個月舉辦的Redmi Note11T Pro系列新機發布會上,除了兩款手機新品之外,Redmi還帶來了兩款TWS真無線藍牙耳機產品,Redmi Buds 4和Redmi Buds 4 Pro,此前我們在Redmi Note11T
  • 5月安卓手機好評榜:魅族20 Pro奪冠

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 5月iOS設備好評榜:iPhone 14僅排第43?

    來到新的一月,安兔兔的各個榜單又重新匯總了數據,像安卓陣營的榜單都有著比較大的變動,不過iOS由于設備的更新換代并沒有那么快,所以相對來說變化并不大,特別是iOS好評榜,老款設
  • 容量越大越不壞?24萬塊硬盤故障率報告公布 這些產品零故障

    8月5日消息,云存儲服務商Backblaze發布了最新的硬盤故障率報告,年故障率有所上升。Backblaze發布的硬盤季度統計數據,其中包括故障率等重要方面。這些結
  • 一年經驗在二線城市面試后端的經驗分享

    忠告這篇文章只適合2年內工作經驗、甚至沒有工作經驗的朋友閱讀。如果你是2年以上工作經驗,請果斷劃走,對你沒啥幫助~主人公這篇文章內容來自 「升職加薪」星球星友 的投稿,坐
  • 破圈是B站頭上的緊箍咒

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之每年的暑期檔都少不了瞄準追劇女孩們的古偶劇集,2021年有優酷的《山河令》,2022年有愛奇藝的《蒼蘭訣》,今年卻輪到小破站抓住了追
  • 猿輔導與新東方的兩種“歸途”

    作者|卓心月 出品|零態LT(ID:LingTai_LT)如何成為一家偉大企業?答案一定是對“勢”的把握,這其中最關鍵的當屬對企業戰略的制定,且能夠站在未來看現在,即使這其中的
  • 三星獲批量產iPhone 15全系屏幕:蘋果史上最驚艷直屏

    按照慣例,蘋果將繼續在今年9月舉辦一年一度的秋季新品發布會,有傳言稱發布會將于9月12日舉行,屆時全新的iPhone 15系列將正式與大家見面,不出意外的話
  • 最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

    2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現在已經可以購買了,這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆
Top 主站蜘蛛池模板: 延寿县| 密山市| 崇左市| 枞阳县| 格尔木市| 安义县| 元江| 和林格尔县| 巴中市| 平乐县| 遂川县| 穆棱市| 大埔县| 时尚| 洱源县| 白山市| 衡阳市| 房产| 治县。| 高尔夫| 财经| 玉树县| 车致| 赫章县| 安龙县| 无棣县| 夏邑县| 平乐县| 宁波市| 洞头县| 西乡县| 黔西县| 乐安县| 盘锦市| 长子县| 定西市| 东莞市| 乐亭县| 定远县| 商水县| 江口县|