<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于幾何單目3D目標檢測的密集幾何約束深度估計器

3D視覺工坊 ? 來源:自動駕駛之心 ? 作者:汽車人 ? 2022-10-09 15:51 ? 次閱讀

摘要

由于深度信息的缺失,從單目圖像估計物體的準確3D位置是一個具有挑戰性的問題。之前的工作表明,利用目標的關鍵點投影約束來估計多個候選深度可以提高檢測性能。然而,現有方法只能利用垂直邊緣作為深度估計的投影約束。所以這些方法只利用了少量的投影約束,產生的深度候選不足,導致深度估計不準確。論文提出了一種可以利用來自任何方向邊緣的密集投影約束方法。通過這種方式,論文使用了更多的投影約束并輸出了更多的候選深度。此外,論文提出了一個圖匹配加權模塊來合并候選深度。本文提出的方法名為DCD(Densely Constrained Detector),在 KITTI 和 WOD基準上實現了最先進的性能。

之前算法存在的問題在于它們的幾何約束不足。具體來說,一些現有的方法估計2D邊界框和3D邊界框的高度,然后利用2D到3D高度投影約束生成目標的深度候選。最終的深度是通過對所有候選深度進行加權來生成的。如下圖所示,該方法僅適用于垂直邊緣,這意味著它們只使用少量約束和3D先驗,導致深度估計的不準確。

65534d06-32f0-11ed-ba43-dac502259ad0.png

方法

DCD的框架的如下圖所示。DCD使用單階段檢測器從單目圖像中檢測目標。論文提出了密集幾何約束深度估計器(DGDE,Densely Geometric-constrained Depth Estimator),它可以計算任何方向的2D-3D邊緣的深度。DGDE可以有效地利用目標的語義關鍵點并產生更多的深度候選。此外,論文利用回歸得到的2D邊緣、3D邊緣和方向作為2D-3D邊緣圖匹配網絡的輸入。所提出的圖匹配加權模塊 (GMW,Graph Matching Weighting module) 匹配每個2D-3D邊緣并輸出匹配分數。通過將多個深度與其相應的匹配分數相結合,論文最終可以為目標生成一個穩健的深度。

65702e3a-32f0-11ed-ba43-dac502259ad0.png

Geometric-based 3D Detection Definition

基于幾何的單目3D目標檢測通過2D-3D投影約束估計目標的位置。具體來說,網絡預測目標的尺寸(),旋轉角。假設一個目標有n個語義關鍵點,論文回歸第i個關鍵點在圖像坐標中的2D坐標和object frame中的3D坐標。object frame的坐標原點是目標的中心點。給定n個語義2D-3D關鍵點投影約束,解決3D目標位置是一個超定問題,它是用于將點云將從object frame轉換到camera frame的平移向量。生成每個目標的語義關鍵點的方法改編自。論文通過PCA建立了一些汽車模型,并通過從點云和2D mask中分割出來的3D點云來細化模型。在獲得關鍵點后,就可以使用DGDE從關鍵點投影約束中估計目標的深度。

Densely Geometric-constrained Depth Estimation

雖然以前的深度估計方法[51]只考慮了垂直邊緣,但DGDE可以處理任意方向的邊緣。因此,論文能夠利用更多的約束來估計每個深度候選的深度。

該方法基于關鍵點從3D空間到2D圖像的投影關系。第i個關鍵點的3D坐標在object frame中定義,并通過以下等式投影到2D圖像平面上:

659994a0-32f0-11ed-ba43-dac502259ad0.png

其中是第i個關鍵點的深度,K是相機內參,K,R,t 表示為:

65b1dace-32f0-11ed-ba43-dac502259ad0.png

通過上述兩式,第i個關鍵點的投影約束方程記為:

65d49866-32f0-11ed-ba43-dac502259ad0.png

第j個關鍵點投影約束方程與上式類似,進一步可以從第i個、第 j 個關鍵點投影約束中得到深度估計:

65e973bc-32f0-11ed-ba43-dac502259ad0.png

這個方程表明深度可以通過任意方向邊緣的投影約束來計算。

給定n個關鍵點,論文生成m=n(n-1)/2 個深度候選。與此同時,不可避免地會遇到一些低質量的深度候選。因此,需要適當的加權方法來集成這些深度候選。

Depth Weighting by Graph Matching

利用DGDE估計目標的深度候選時,目標的最終深度可以根據根據估計質量進行加權:

65fc61f2-32f0-11ed-ba43-dac502259ad0.png

接下來介紹論文提出的新的加權方法——Graph Matching Weighting module (GMW)。

Graph Construction and Edge Feature extraction:論文構造了2D關鍵點圖和3D關鍵點圖。3D關鍵點圖與2D關鍵點圖基本一致,唯一的區別是頂點坐標是2D坐標還是3D坐標。2D和3D邊緣特征提取器[47]如下所示:

66120a66-32f0-11ed-ba43-dac502259ad0.png

FC、CN、BN、ReLU 分別表示全連接層、Context Normalization [47]、Batch Normalization 和 ReLU。值得一提的是,Context Normalization 提取了所有邊的全局信息。

Graph matching layer:給定提取的2D和3D邊緣特征,根據在邊緣s上的2D特征和邊緣t上的3D特征之間的L2距離計算如下損失:

662a3a3c-32f0-11ed-ba43-dac502259ad0.png

然后論文將M作為Sinkhorn layer[4]的輸入來獲得分配矩陣P。Sinkhorn layer通過最小化下述目標函數來迭代優化P:

6644d9e6-32f0-11ed-ba43-dac502259ad0.png

Loss function:設計如下所示的回歸損失來監督最終的加權深度,并使用分類損失來監督圖匹配:

66622ef6-32f0-11ed-ba43-dac502259ad0.png

實驗結果

KITTI上的實驗結果,優勢比較明顯。

667235ee-32f0-11ed-ba43-dac502259ad0.png

可視化:

66a4fcae-32f0-11ed-ba43-dac502259ad0.png

更多的實驗結果如下表所示:

66dbcda6-32f0-11ed-ba43-dac502259ad0.png

消融實驗

670c7190-32f0-11ed-ba43-dac502259ad0.png

DCD可以比基線更準確地估計深度。

673121fc-32f0-11ed-ba43-dac502259ad0.png

GMW和邊數量的消融實驗

674e04d4-32f0-11ed-ba43-dac502259ad0.png

關于DCD和AutoShape的討論

盡管DCD和AutoShape都利用多個關鍵點來估計目標的位置,但存在如下關鍵差異:

AutoShape直接使用所有2D-3D關鍵點投影約束來求解對象目標深度。DCD則從每個邊緣約束中求解一個深度候選。因此,DCD的邊緣約束不僅數量多,而且比關鍵點約束的階數更高;

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    812

    瀏覽量

    47318
  • 3D
    3D
    +關注

    關注

    9

    文章

    2760

    瀏覽量

    106516

原文標題:ECCV 2022 | 用于單目3D目標檢測的密集約束深度估計器

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    大尺寸幾何檢測的光電系統研究.pdf

    大尺寸幾何檢測的光電系統研究.pdf
    發表于 07-20 23:09

    3D光電傳感

    。在未來的第三階段,將開發出原型系統,并在飛行或地面上進行演示驗證。增強飛行與地面車輛的目標探測與跟蹤能力,對超出接收系統物理孔徑衍射極限的遠距離目標進行
    發表于 03-10 16:47

    使用英特爾實感SR300相機的3D掃描儀的幾何分辨率的含義是什么

    嗨,我有一臺3D系統的3D掃描儀,配有英特爾實感SR300攝像頭。我想知道是否有人知道掃描儀附帶的軟件中低到高幾何分辨率的含義。提前謝謝你花時間回答我的問題。以上來自于谷歌翻譯以下為原文Hi,I
    發表于 11-30 11:13

    請問0.13微米幾何設計規則與0.5微米幾何設計規則是什么

    0.13微米幾何設計規則與0.5微米幾何設計規則
    發表于 04-09 22:43

    如何通俗理解視覺定位?帶你看懂對極幾何與基本矩陣

    是Epipolarconstraint極線約束:X在右像面上的投影XR必然被約束在eR-XR極線上。對于OL-XL上的X,X1,X2,X3都受該約束。極線
    發表于 06-01 08:00

    最受歡迎的三種深度傳感

    時間(ToF)  TOF是Time of flight的簡寫,直譯為飛行時間。所謂飛行時間法3D成像,是通過給目標連續發送光脈沖,然后用傳感接收從物體返回的光,通過探測光脈沖的飛行(往返)時間來得到
    發表于 08-25 11:05

    3D視覺的測量原理

      要談3D視覺應用方案,就必須先弄清楚光學測量分類以及其原理。光學測量分為主動測距法和被動測距法?! ≈鲃訙y距方法的基本思想是利用特定的、人為控制光源和聲源對物體目標進行照射,根據物體表面的反射
    發表于 12-01 15:08

    3D設計太耗時?趕緊試試浩辰3D軟件中的幾何約束關系命令!

    。若存在幾何約束重疊,則可使用「快速選取」進行選擇式刪除。如何顯示和關閉幾何約束關系? 選擇工具欄「草圖」-「相關」-「保持關系」,該命令默認為自動開啟狀態。該命令開啟時,浩辰
    發表于 12-11 11:17

    3D設計軟件中怎么快速進行工程計算?

    成本、暢通各環節數據應用,成為了企業數字化變革的重要環節。針對上述問題,由浩辰CAD公司研發的浩辰3D設計軟件可以使用「目標搜尋」來解決常見的參數變量與工程計算問題,下面一起來看看吧!浩辰3D設計軟件中
    發表于 05-06 13:26

    基于深度學習和3D圖像處理的精密加工件外觀缺陷檢測系統

    檢測,檢測準確性和檢測穩定性較差、容易誤判。 基于深度學習和3D圖像處理的精密加工件外觀缺陷檢測
    發表于 03-08 13:59

    實時3D藝術最佳實踐-幾何指南

    為確保游戲在所有設備上運行良好, 游戲的幾何學考慮必須認真和盡可能優化。 本指南突出顯示三維資產中的幾何性能優化, 可以提高游戲效率。 這些優化有助于實現改善移動平臺上游戲表現的總體目標。 本指南也可以以Unity Learn
    發表于 08-02 08:05

    光學3D表面輪廓儀可以測金屬嗎?

    光學3D表面輪廓儀是基于白光干涉技術,結合精密Z向掃描模塊、3D 建模算法等快速、準確測量物體表面的形狀和輪廓的檢測儀器。它利用光學投射原理,通過光學傳感對物體表面進行掃描,并根據反
    發表于 08-21 13:41

    基于幾何約束的視頻幀間線段特征匹配算法

    針對線段因遮擋、斷裂以及端點提取不準確等原因造成的線段特征匹配困難問題,特別是現有匹配算法在匹配過程中出現多配多時直接采取最相似匹配而導致丟失大量真實匹配的問題,提出了一種基于多重幾何約束及0-1
    發表于 11-29 10:20 ?0次下載
    基于<b class='flag-5'>幾何</b><b class='flag-5'>約束</b>的視頻幀間線段特征匹配算法

    關于鋼塊3D幾何測量的實用性說明

    鋼塊3D幾何測量的實用性 3D幾何測量在鋼塊生產的兩個步驟中非常有用:(1)經過平方處理后,為拋光生成建議,以減少拋光工作量。(2)在最終檢查過程中,要確保
    發表于 07-05 15:56 ?331次閱讀

    一種利用幾何信息的自監督單目深度估計框架

    本文方法是一種自監督的單目深度估計框架,名為GasMono,專門設計用于室內場景。本方法通過應用多視圖幾何的方式解決了室內場景中幀間大旋轉和低紋理導致自監督深度
    發表于 11-06 11:47 ?192次閱讀
    一種利用<b class='flag-5'>幾何</b>信息的自監督單目<b class='flag-5'>深度</b><b class='flag-5'>估計</b>框架
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>