<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

地平線研發一種全新利用時空信息進行編碼解碼的層級網絡

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2022-07-05 11:19 ? 次閱讀

摘要:近年來自動駕駛場景中的預測任務逐漸興起一種新形式,即預測未來基于鳥瞰圖的空間占有柵格(occupancy)和光流(flow)。此類預測任務與傳統預測軌跡的任務相比在很多場景下會提供更多的信息,作為自動駕駛上下游的一環,有著更廣泛的應用場景。在今年的Waymo Open Dataset Challenge 2022上,Waymo推出了此任務的全新挑戰賽。地平線在這個項目上研發出了一種全新的利用時空信息進行編碼解碼的層級網絡,通過多重編碼網絡,多尺度時空融合,預測隱變量以及聯合柵格占有和光流的損失函數等創新性技術,將這一任務的精度推上新的高度。

背景

預測任務是自動駕駛場景中至關重要的一項任務,其目的是通過對運動物體的歷史軌跡和運動狀態的觀測,結合道路信息,推測其未來的行為,為下游的規劃控制提供更豐富的預測信息。其表征形式通常為多條未來可能的軌跡。近年來,越來越多的研究表明,基于鳥瞰圖的空間占有柵格和光流的表征形式相比多條軌跡預測有更強的表征能力。相比于軌跡的形式,占有柵格有更豐富的空間分布信息,能更好的表征動態物體的位置,形狀,身份的不確定性;其聯合概率分布的形式在一定程度上可以處理物體之間的交互的能力;同時,所有的動態物體可以同時并行處理,極大地提升了處理的效率;另外,此種方法還具有推測被遮擋物體的能力,能有效預防諸如“鬼探頭”等的情況;最后,其鳥瞰圖下的表征形式能更好地與上下游相結合?;谶@個趨勢,Waymo于今年推出了全新的自動駕駛挑戰賽項目,即Occupancy and Flow Prediction Challenge。此挑戰賽給定過去一秒中動態物體(車輛,自行車和行人)的運動軌跡,要求對未來八秒的可觀測物體的柵格占有、遮擋物體的柵格占有以及對應光流做預測。本方法結合了CNN、transformer、三維稀疏卷積等優勢,利用隱變量豐富了未來的信息,創新性地引入了層級時序解碼機制,在此次Waymo挑戰賽中取得了極佳的成績。

方法

e883bd60-fba9-11ec-ba43-dac502259ad0.png

輸入

模型的輸入包含了動態信息和靜態信息。其中動態信息包含了歷史幀和當前幀的動態物體(車輛,自行車和行人)的空間占有柵格信息以及對應物體的屬性信息(比如物體檢測框的長寬高和速度等信息),靜態信息包含了整個場景的路面相關信息(比如道路中線,道路邊緣,路面其他特征等)。所有信息都被處理成二維鳥瞰圖并進一步進行時間尺度上的聚合。我們同時使用了2D編碼器和3D編碼器,其中針對2D編碼器,動態信息輸入會直接在特征維上進行時間拼接;而針對3D編碼器,時間會作為額外的維度(靜態信息在每一幀上進行復制),并且輸入會作稀疏化處理。

編碼器

編碼器一共分為三種,分別是基本編碼器,注意力編碼器以及時空編碼器

基本編碼器:作為整個框架的基本編碼器,我們選擇使用了RegNet[1]模型。RegNet是一個設計完備且效率很高的模型。編碼器經過層層降采樣編碼,生成了5個維度上的特征,對應的尺度分別是輸入的1/2,1/4,1/8,1/16和1/32。

注意力編碼器:近年來,在檢測和分割任務中,SwinTransformer及其升級版SwinTransformerV2[2]取得了很好的結果?;谄洫毺氐木植看翱谧⒁饬C制,不僅能很好地編碼動態物體和路面間的交互,還大量地減少了網絡計算量,因此我們使用了SwinTransformerV2來作為整個網絡的注意力編碼器。為了可以和基本編碼器輸出特征的尺度相對應,我們將每個patch的尺寸由4改成了2,由此注意力編碼器可以輸出和基本編碼器尺度相同的5個特征。

e8a677ce-fba9-11ec-ba43-dac502259ad0.png

時空編碼器:為了更好地進行幀間信息交互提取,我們設計了一個3D時空編碼器來額外捕捉時間尺度上的信息。因為我們的輸入信息在鳥瞰圖上有著很高的稀疏度,我們選擇使用3D稀疏卷積和子流形稀疏卷積[3]來搭建網絡。這樣既可以大量地加速3D卷積的計算也可以有效防止稀疏特征在早期過快地膨脹(dilation)。我們對應其他編碼器,設計了5階段網絡,其中時間維在2和4階段進行下采樣。針對網絡的每個輸出特征,我們將時間維和特征維進行合并來使特征降維。

e8cd57ea-fba9-11ec-ba43-dac502259ad0.png

聚合器

聚合器由兩部分組成,在空間尺度上,我們利用BiFPN做多尺度的聚合;在時間尺度上,我們利用隱變量模型來豐富未來的信息。類比于條件變分器,我們在每一個尺度,每一個空間位置都對未來的概率進行建模。在訓練階段,我們基于現在時刻的概率分布做采樣。推理階段,我們直接采用概率分布均值。為了保證預測分布和已觀測分布的一致性,我們采用Kullback-Leibler divergence損失函數作為監督信號。

e8eebc50-fba9-11ec-ba43-dac502259ad0.jpg

解碼器

解碼器采用多層級多尺度的特征金字塔形式,基本的組成單元為3D卷積Bottleneck結構。3D bottleneck中采用了膨脹卷積和分組卷積,可以極大地擴大感受野并節省計算量。同時,為了將編碼后的2D特征做時序展開,我們引入了3D轉置卷積Bottleneck。這些堆疊的bottleneck通過上采樣進行多尺度的鏈接,有效地融合了多尺度的信息。同時,為了節省計算量,我們在輸出尺度上用ConvLSTM做時序上的修正。

e92a2dee-fba9-11ec-ba43-dac502259ad0.png

ec74a024-fba9-11ec-ba43-dac502259ad0.png

損失函數

對于可觀測占有柵格和被遮擋占有柵格的預測,我們采用Focal Loss作為其監督信號,兩者采用相同的權重進行加權。

eced00be-fba9-11ec-ba43-dac502259ad0.png

對于光流的預測,我們采用Smooth L1損失函數。為了將光流和占有率的預測解耦,我們利用占有率的真值做加權。

ecfe2f2e-fba9-11ec-ba43-dac502259ad0.png

為了保證柵格占有率和光流預測的一致性,我們采用跟蹤損失函數進行進一步監督。利用光流的預測,我們可以對前一幀的柵格占有率進行空間變形來得到當前幀的基于光流的空間占有預測。

ed39b922-fba9-11ec-ba43-dac502259ad0.png

最后將基于光流的空間占有預測和當前幀柵格占有預測相乘,來得到當前幀的空間占有-光流聯合預測,并用此聯合預測和當前幀的柵格占有真值來計算損失函數traced loss。我們同時采用Focal loss和交叉熵損失函數進行監督[4]。

ed5b9b00-fba9-11ec-ba43-dac502259ad0.png

為保證聚合器中隱變量中現在和未來的一致性,我們采用Kullback-Leibler divergence損失函數作為監督信號[5]來監督預測的概率分布函數參數。

ed7f3c72-fba9-11ec-ba43-dac502259ad0.png

ed9fec56-fba9-11ec-ba43-dac502259ad0.png

最后,所有的損失函數進行加權和作為最后的損失函數。

edb2da32-fba9-11ec-ba43-dac502259ad0.png

實驗結果

消融實驗

本表展示了在Waymo數據集上的消融實驗結果,灰色的一列為評測的主指標??梢钥闯?,loss的改進,如focal loss和traced loss分別帶來了2.01%和0.46%的提升。同時,更豐富的柵格化輸入帶來了1.23%的提升。同時,結構化的改進,包括隱變量,時空解碼器,以及解碼器的改進帶來了約1.21%的提升。最后TTA帶來了約0.40%的提升。值得一提的是,所有的實驗都是在十分之一的數據集上做的驗證。這些結果充分的說明了我們方法的有效性。

edcf1f94-fba9-11ec-ba43-dac502259ad0.png

測試集表現

下表展示了我們方法在waymo測試集上的排名,灰色的一列代表評測的主指標,可以看出,我們的結果在主指標上大幅領先對手,充分說明我們方法的優越性。

f11ff90c-fba9-11ec-ba43-dac502259ad0.png

結果可視化

下面展示我們的方法在特定場景下的對接下來8秒占有柵格(左)和光流(右)的可視化結果。下面列出了直行,紅綠燈路口左轉右轉掉頭,無保護左轉,4-way-stop,無保護左轉,自主避障,停車入庫,被遮擋物體的猜測等場景??梢钥闯?,我們的方法能有效地處理復雜場景,能實現多動態物體的交互,交通信息和規則的理解,自主避障,對被遮擋物體的推測等功能。

普通路面:主要展示對不同車速/加速減速情況的車流預測,可以看出HOPE能對未來軌跡的不確定性進行很好的建模

f13ebd88-fba9-11ec-ba43-dac502259ad0.gif

交叉路口:主要展示對不同轉彎,停車等待的車流預測

f1850d7e-fba9-11ec-ba43-dac502259ad0.gif

掉頭場景:復雜路口

f1a7a906-fba9-11ec-ba43-dac502259ad0.gif

不確定場景:直行、右轉兩條車道都有可能駛入

f212722c-fba9-11ec-ba43-dac502259ad0.gif

右轉:右轉車輛對直行車輛進行了避讓

f2433916-fba9-11ec-ba43-dac502259ad0.gif

左轉:根據路口紅綠燈、交通規則等綜合信息對路權進行判斷

f26a3b92-fba9-11ec-ba43-dac502259ad0.gif

無保護左轉:左轉車輛對直行車輛進行了避讓

f2b43cce-fba9-11ec-ba43-dac502259ad0.gif

2 way stop:可以看見車輛交互,處理先來后到順序

f5c80f76-fba9-11ec-ba43-dac502259ad0.gif

遮擋繞行:可以看見車輛對前方靜止車輛進行了繞行

f652d66a-fba9-11ec-ba43-dac502259ad0.gif

停車入庫:小樣本、低速場景預測,可以看見低速場景下軌跡的不確定性更高,模型可以有多種可能的軌跡預測

f98a4868-fba9-11ec-ba43-dac502259ad0.gif

遮擋物體的猜測:綠色的為被遮擋物體

f9b56b38-fba9-11ec-ba43-dac502259ad0.gif

原文標題:開發者說 | HOPE:基于自動駕駛場景Occupancy和Flow的運動預測

文章出處:【微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼解碼
    +關注

    關注

    0

    文章

    7

    瀏覽量

    7139
  • 自動駕駛
    +關注

    關注

    774

    文章

    13205

    瀏覽量

    163742
  • 地平線
    +關注

    關注

    0

    文章

    308

    瀏覽量

    14688

原文標題:開發者說 | HOPE:基于自動駕駛場景Occupancy和Flow的運動預測

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    地平線旭日X3派試用體驗】開箱與板載資源介紹視頻

    本視頻為地平線旭日X3派的開箱視頻,講解板載資源.
    發表于 07-10 00:14

    地平線旭日X3派試用體驗】燒錄鏡像與UBUNTU桌面環境初體驗視頻

    本視頻講解地平線旭日X3派開發板燒錄鏡像,以及體驗UBUNTU桌面系統。
    發表于 07-10 00:24

    地平線旭日X3派試用體驗】開箱+快速上手體驗

    首先很高興能夠成為地平線旭日X3派的新品體驗官,前不久開發板到了,目前玩了有個星期左右了,先來簡單發個開箱帖子?!鹃_箱】收到開發板的那瞬間感覺外盒挺有趣的。盒子里面配了
    發表于 07-17 22:31

    地平線旭日X3派試用體驗】開箱篇硬件介紹

    地平線旭日X3是夢寐以求的開發板,上圖,地平線家細心的公司,包裝都做得這么精致。還帶個散熱片。接口:個CSI的相機接口,板載USB有3個,包含1個USB3.0和2個USB2.0,
    發表于 07-26 19:13

    地平線旭日X3派試用體驗】 HHP環境搭建及簡單demo演示

    機器人平臺用戶手冊,地址如上鏈接。根據文檔一步進行做,這些都是直接在板端進行操作,非常方便。、 安裝HHP并驗證環境根據地平線機器人平
    發表于 07-31 20:18

    地平線旭日X3派試用體驗】地平線旭日X3派AGV智能車設計

    本項目是做個基于地平線旭日X3派ROS-SLAM激光雷達自主導航AGV機器人原型設計。地平線旭日X3派ROS主機、副控板及驅動、控制端,通過xrbase節點調用xrmiddleware中間件API
    發表于 09-12 19:25

    地平線機器人獲硅谷投資家yuri投資_地平線獲英特爾領投近億美金A+輪融資

    架構等方面展現的領先世界的技術實力,受到業界廣泛認可。地平線致力于打造基于深度神經網絡的人工智能“大腦”平臺-包括軟件和芯片
    發表于 01-04 14:23 ?2321次閱讀

    一種時空信息的kNN查詢處理方法

    理位置和時間信息的K近鄰查詢(ST-kNN查詢)處理方法,首先,利用時空相似度對數據對象的地理位置變量和時間變量進行映射變換,將數據對象映射到新的三維空間中,用三維空間中兩點之間的距離相似度來近似代替兩個對象之間實際的
    發表于 01-09 18:10 ?0次下載

    基于時空信息比較的溫室環境傳感器故障識別

    與基于時空信息比較的溫室環境監測系統傳感器故障識別方法。首先利用基于PCA的傳感器故障檢測方法,通過監控統計量T2和SPE的變化實現傳感器系統故障檢測;再針對檢測出故障的傳感器節點,對該時刻傳感器節點采用基于時空特性的節點
    發表于 02-09 11:04 ?0次下載

    地平線推出全新一代 AIoT 邊緣 AI 芯片平臺

    9 月 9 日,地平線釋放芯效能產品發布會于深圳舉辦,宣布推出全新一代 AIoT 邊緣 AI 芯片平臺地平線旭日 3。依托極致效能、開放易用的旭日 3 芯片,地平線在廣泛的 AIoT
    的頭像 發表于 09-24 11:55 ?2437次閱讀

    一種層級特征融合就的深度卷積網絡

    采用卷積神經網絡對單目圖像的深度進行估計時,存在深度信息不精確、邊緣模糊以及細節缺失等問題。為此,提出一種層級特征融合結構的深度卷積
    發表于 03-16 09:21 ?7次下載
    <b class='flag-5'>一種</b>多<b class='flag-5'>層級</b>特征融合就的深度卷積<b class='flag-5'>網絡</b>

    一種編碼解碼模式的肺分割算法

    CT成像技術是輔助醫生診斷肺部疾病的重要手段。針對肺部各組織結構復雜,難以準確地對肺部CT像中肺實質進行分割和提取的問題,提岀了一種編/解碼模弌的肺分割算法。為了獲得圖像的多尺度信息,
    發表于 04-13 10:46 ?11次下載
    <b class='flag-5'>一種</b><b class='flag-5'>編碼</b><b class='flag-5'>解碼</b>模式的肺分割算法

    包含時空信息特征的視頻指紋算法

    為滿足視頻拷貝檢測系統的魯棒性、獨特性和緊湊性,提出一種包含時空信息特征的視頻指紋算法。利用時空切片和關鍵幀構成時空信息,將包含視頻關鍵幀空域信息
    發表于 06-10 11:20 ?15次下載

    地平線獲得一汽紅旗全新車型項目應用

    將于2023年在一汽紅旗全新車型上實現量產,未來還將應用于更多紅旗車型。同時,雙方正在基于地平線征程2芯片推動輔助駕駛功能的研發應用,合作車型將于今年量產落地。
    的頭像 發表于 05-14 17:08 ?2044次閱讀

    地平線旭日X3M芯片賦能FITURE健身鏡

    健康生活方式品牌公司FITURE宣布新品健身鏡“FITURE魔鏡3”和“FITURE魔鏡3Plus”發售,這兩款健身鏡均搭載了地平線旭日X3M芯片(以下簡稱地平線X3M)。地平線X3M芯片的開放
    的頭像 發表于 07-06 10:27 ?2317次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>