<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

SegRefiner:通過擴散模型實現高精度圖像分割

背景介紹

盡管圖像分割在過去得到了廣泛研究和快速發展，但獲得細節上非常準確的分割 mask 始終十分具有挑戰性。因為達成高精度的分割既需要高級語義信息，也需要細粒度的紋理信息，這將導致較大的計算復雜性和內存使用。而對于分辨率達到2K甚至更高的圖像，這一挑戰尤為突出。

由于直接預測高質量分割 mask 具有挑戰性，因此一些研究開始集中于 refine 已有分割模型輸出的粗糙 mask。為了實現高精度的圖像分割，來自北京交大、南洋理工、字節跳動等的研究者們引入了一種基于擴散模型Diffusion去逐步提高mask質量的方法。

現有方法

Model-Specific

一類常見的 Refinement 方法是 Model-Specific 的，其通過在已有分割模型中引入一些新模塊，從而為預測 Mask 補充了更多額外信息，從而增強了已有模型對于細節的感知能力。這一類方法中代表性的工作有 PointRend，RefineMask，MaskTransfiner等。然而，這些方法是基于特定模型的改進，因此不能直接用于 refine 其他分割模型輸出的粗糙 mask。

Model-Agnostic

另一類 Refinement 方法是 Model-Agnostic 的，其只使用原始圖像和粗糙mask作為輸入信息，如 BPR，SegFix，CascadePSP，CRM 等。由于這類方法在 Refinement 過程中未使用已有模型的中間特征，因此不依賴于特定分割模型，可以用于不同分割模型的 Refinement。然而，盡管這類方法能夠有效地提升分割準確度，但由于粗糙 mask 中存在多種多樣的錯誤預測（如下圖所示），導致模型無法穩定地修正粗糙 mask 中的全部預測錯誤。

實現目標

相比于 Model-Specific 的方法，Model-Agnostic 的方法能夠直接應用于不同分割模型的 Refinement，從而有著更高的實用價值。更進一步地，由于不同分割任務（語義分割，實例分割等）的結果都可以被表示為一系列 binary mask，具有相同的表征形式，在同一個模型中統一實現不同分割任務的 Refinement 同樣是可能的。因此，我們希望實現能夠應用于不同分割模型和分割任務的通用 Refinement 模型。

如前所述，已有分割模型產生的錯誤預測是多種多樣的，而想要通過一個通用模型一次性地更正這些多樣性的錯誤十分困難。面對這一問題，在圖像生成任務中取得巨大成功的擴散概率模型給予了我們啟發：擴散概率模型的迭代策略使得模型可以在每一個時間步中僅僅消除一部分噪聲，并通過多步迭代來不斷接近真實圖像的分布。這大大降低了一次性擬合出目標數據分布的難度，從而賦予了擴散模型生成高質量圖像的能力。

直觀地，如果將擴散概率模型的策略遷移到 Refinement 任務中，可以使得模型在進行 Refinement 時每一步僅關注一些“最明顯的錯誤”，這將降低一次性修正所有錯誤預測的難度，并可以通過不斷迭代來逐漸接近精細分割結果，從而使得模型能夠應對更具挑戰性的實例并持續糾正錯誤，產生精確分割結果。

在這一想法下，我們提出了一個新的視角：將粗糙 mask 視作 ground truth 的帶噪版本，并通過一個去噪擴散過程來實現粗糙 mask 的 Refinement，從而將 Refinement 任務表示為一個以圖像為條件，目標為精細 mask 的數據生成過程。

算法方案

擴散概率模型是一種由前向和反向過程表示的生成模型，其中前向過程通過不斷加入高斯噪聲得到不同程度的帶噪圖像，并訓練模型預測噪聲；而反向過程則從純高斯噪聲開始逐步迭代去噪，最終采樣出圖像。而將擴散概率模型遷移到 Refinement 任務中，數據形式的不同帶來了以下兩個問題：

(1) 由于自然圖像往往被視作高維高斯變量，將圖像生成的過程建模為一系列高斯過程是十分自然的，因此已有的擴散概率模型大多基于高斯假設建立；而我們的目標數據是 binary mask，通過高斯過程擬合這樣一個離散變量的分布并不合理。

(2) 作為一種分割 Refinement 方法，我們的核心思想是將粗糙 mask 視為帶有噪聲的 ground truth，并通過消除這種噪聲來恢復高質量的分割結果。這意味著我們擴散過程的結尾應當收斂到確定性的粗糙 mask（而非純噪聲），這也與已有的擴散概率模型不同。

針對上述問題，我們建立了如下圖所示的基于“隨機狀態轉移”的離散擴散過程。其中，前向過程將 ground truth 轉換為“不同粗糙程度”的 mask，并用于訓練；而反向過程用于模型推理，SegRefiner 從給出的粗糙 mask 開始，通過逐步迭代修正粗糙 mask 中的錯誤預測區域。以下將詳細介紹前向和反向過程。

前向過程

前向過程的目標是將 ground truth 提供的精細 mask 逐步消融為粗糙的 mask，記前向過程每一步的變量為，則前向過程應當滿足：

(1) 為 ground truth

(2) 為粗糙 mask

(3) 介于和之間，隨 t 增大逐漸向粗糙 mask 演變 ? ?

基于這些限制條件，我們用隨機狀態轉移來表述前向過程：假設變量中的每一個像素都有兩種可能的狀態：精細和粗糙，處于精細狀態的像素值與保持一致，處于粗糙狀態的像素則取的值（即使二者一致）。我們提出了一個“轉移采樣”模塊來進行這一過程，如上圖右側所示。在每一個時間步，其以當前 mask ，粗糙 mask 以及狀態轉移概率作為輸入。

在前向過程中，狀態轉移概率描述了當前 mask 中每個像素轉移到中的狀態的概率。根據狀態轉移概率進行采樣，可以得到后一個時間步每個像素的狀態，從而確定其取值。這一模塊確定了一個“單向”過程，即只會發生“轉移到目標狀態”的情況。這一單向性質確保了前向過程會收斂到（盡管每一步都是完全隨機的），從而滿足了上述限制條件(2)，(3)。

通過重參數技巧，我們引入了一個二元隨機變量來描述上述過程：我們將表示為一個 one-hot 向量，用來表示中間掩模中像素的狀態，同時設置和來表示精細狀態和粗糙狀態。因此，前向過程可以被表示為：

其中為超參數，而對應了上述的狀態轉移概率，是狀態轉移矩陣。則前向過程的邊緣分布可以表示為：

其中。從而我們可以直接獲取任何中間時間步的 mask 并用于訓練，而無需逐步采樣。

反向過程

反向擴散過程用于模型推理，目標是將粗糙 mask 逐漸修正為精細 mask 。由于此時精細 mask 和狀態轉移概率未知，類似 DDPM 的做法，我們訓練一個神經網絡，來預測精細 mask ，表示為：

其中是相應的圖像。和分別表示預測的精細 mask 和其置信度分數。這里表示了網絡對于預測準確與否的置信度，故同樣可以被視作中每個像素處于“精細狀態”的概率。為了獲得反向狀態轉移概率，根據前向過程的設定和貝葉斯定理，延續 DDPM 的做法，我們可以由前向過程的后驗概率和預測的得到反向過程的概率分布，為：? ?

其中為反向過程的狀態轉移概率。給定粗糙 mask 以及相應的圖像，我們首先將所有像素初始化為粗糙狀態，然后通過不斷迭代地狀態轉移，逐漸修正中預測值。下圖為一個推理過程的可視化展示。

模型結構

任意滿足形式的網絡均可滿足我們的要求，這里我們延續了之前工作的做法，采用 U-Net 作為我們的去噪網絡，將其輸入通道數修改為4（圖像和在通道維度上串聯），并輸出1通道的改進掩模。

算法評估

由于 Refinement 任務的核心是獲取細節精確的分割結果，在實驗中我們選取了三個代表性的高質量分割數據集，分別對應Semantic Segmentation，Instance Segmentation 和 Dichotomous Image Segmentation。

Semantic Segmentation

如表1所示，我們在 BIG 數據集上將提出的 SegRefiner 與四種已有方法：SegFix，CascadePSP，CRM 以及 MGMatting 進行了對比。其中前三個為語義分割的 Refinement 方法，而 MGMatting 使用圖像和 mask 進行 Matting 任務，也可以用于 Refinement 任務。結果表明，我們提出的 SegRefiner 在 refine 四個不同語義分割模型的粗糙 mask 時，都在 IoU 和 mBA 兩項指標上獲得了明顯提升，且超越了之前的方法。

? ?

Instance Segmentation

實例分割中，我們選擇了之前的工作廣泛使用的 COCO 數據集進行測試，并使用了 LVIS 數據集的標注。與原始 COCO 標注相比，LVIS 標注提供了更高質量和更詳細的結構，這使得 LVIS 標注更適合評估改進模型的性能。

首先，在表2中，我們將提出的SegRefiner與兩種 Model-Agnostic 的實例分割 Refinement 方法 BPR 和 SegFix 進行了比較。結果表明我們的 SegRefiner 在性能上明顯優于這兩種方法。

然后在表3中，我們將 SegRefiner 應用于其他7種實例分割模型。我們的方法在不同準確度水平的模型上都取得了顯著的增強效果。值得注意的是，當應用于三種 Model-Specific 的實例分割 Refinement 模型（包括PointRend、RefineMask 和 Mask TransFiner）時，SegRefiner 依然能穩定提升它們的性能，這說明 SegRefiner 具有更強大的細節感知能力。

Dichotomous Image Segmentation

Dichotomous Image Segmentation 是一個較新提出的任務，如下圖所示，其數據集包含大量具有復雜細節結構的對象，因此十分適合評估我們 SegRefiner 對細節的感知能力。

在本實驗中，我們將 SegRefiner 應用于6種分割模型，結果如表4所示?？梢钥吹?，我們的SegRefiner在 IoU 和 mBA 兩項指標上都明顯提升了每個分割模型的準確度。

可視化展示

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4576

瀏覽量
98873
CRM

CRM

+關注

關注
1

文章
143

瀏覽量
20992
圖像分割

圖像分割

+關注

關注
4

文章
173

瀏覽量
17865
高斯噪聲

高斯噪聲

+關注

關注
0

文章
11

瀏覽量
8330

原文標題：NeruIPS 2023 | SegRefiner：通過擴散模型實現高精度圖像分割

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

基于擴散模型的圖像生成過程

近年來，擴散模型在文本到圖像生成方面取得了巨大的成功，實現了更高圖像生成質量，提高了推理性能，也可以激發擴展創作靈感。不過僅憑文本來控制

的頭像

發表于 07-17 11:00 ?2123次閱讀

基于<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>的<b class='flag-5'>圖像</b>生成過程

基于GAC模型實現交互式圖像分割的改進算法

基于GAC模型實現交互式圖像分割的改進算法提出了一種改進的交互式圖像分割算法。采用全變分去噪

發表于 09-19 09:19

使用全卷積網絡模型實現圖像分割

OpenCv-C++-深度神經網絡（DNN）模塊-使用FCN模型實現圖像分割

發表于 05-28 07:33

什么是高精度地圖

，控制車輛行使，以實現自主做出駕駛決策。參考：（1）感知周圍環境（感知層）：由電子地圖和傳感器組成，電子地圖提供傳統的導航、導航電子地圖數據和高精度電子地圖數據，傳感器通過云服務平臺，將動態實時

發表于 10-07 14:24

高精度擴散硅絕對壓力計的研制

采用擴散硅絕對壓力傳感器為檢測部件,研制出高精度絕對壓力計,重點介紹絕對壓力計的工作原理及為提高儀表精確度所進行的溫度補償。關鍵詞: 絕對壓力計; 高精度; 溫度補償

發表于 06-30 10:31 ?17次下載

基于多級混合模型的圖像分割方法

本文研究了典型的基于區域的圖像分割方法主動形狀模型（Active Shape Model, ASM）和基于邊緣的圖像分割snake 算法，分

發表于 07-08 09:58 ?20次下載

圖像分割—基于圖的圖像分割

圖像分割—基于圖的圖像分割圖像分割—基于圖的圖像

發表于 11-19 16:17 ?0次下載

基于改進活動輪廓模型的圖像分割

基于改進活動輪廓模型的圖像分割_王芳

發表于 01-07 19:00 ?0次下載

基于多尺度局部特征的圖像分割模型_李軍

基于多尺度局部特征的圖像分割模型_李軍

發表于 03-19 19:19 ?0次下載

基于像素聚類進行圖像分割的算法

B型心臟超聲圖像分割是計算心功能參數前重要的一步。針對超聲圖像的低分辨率影響分割精度及基于模型的

發表于 12-06 16:44 ?0次下載

基于像素聚類進行<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>的算法

基于活動輪廓模型的圖像分割

到圖像分割的活動輪廓模型中，保留拉普拉斯擴散項的切線方向分量；再引入兩個權重參數控制切線方向和法線方向有偏的擴散，以提高

發表于 12-22 14:25 ?1次下載

一種高精度的肝臟圖像自動分割算法

在利用卷積神經網絡分割肝臟邊界較模糊的影像數據時容易丟失位置信息，導致分割精度較低。針對該問題，提出一種基于分水嶺修正與U-Net模型相結合的肝臟圖

發表于 05-27 15:17 ?2次下載

近期分割大模型發展情況

SAM（Segment Anything Model）Meta 的 FAIR 實驗室發布的一種最先進的圖像分割模型，該模型將自然語言處理領域的prompt范式引入計算機視覺領域，可以

發表于 05-22 16:26 ?534次閱讀

DDFM：首個使用擴散模型進行多模態圖像融合的方法

近來去噪擴散概率模型 Denoising diffusion probabilistic model (DDPM)在圖像生成中獲得很多進步，通過對一張noise-corrupted

發表于 09-19 16:02 ?1656次閱讀

基于Discrete Diffusion的模型不可知分割細化

SegRefiner 提出一種新的的任務解釋，將分割細化視為一個數據生成過程。因此，細化可以通過一系列去噪擴散步驟來實現，其中 Coarse

發表于 01-19 15:14 ?305次閱讀

CVer
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot DepGraph：任意架構的結構化剪枝，CNN、Transformer、GNN等都適用！
Hot StrucTexTv2：端到端文檔圖像理解預訓練框架

New Vision Mamba：速度與內存的雙重突破
New Adobe提出DMV3D：3D生成只需30秒！讓文本、圖像都動起來的新方法！

精選推薦
更多

文章

資料

帖子

鴻蒙開發接口Ability框架：【@ohos.application.Ability (Ability)】

jf_46214456
2天前

984 閱讀

工業4.0中的機器人向協作機器人演進

eeDesign
2天前

962 閱讀

HarmonyOS開發案例：【排行榜頁面】

jf_46214456
2天前

626 閱讀

仿真微調：提高電力電子電路的精度

半導體芯科技SiSC
2天前

643 閱讀

以全棧智算擁抱生態，為AIGC種一棵向上生長的巨榕

腦極體
2天前

607 閱讀

分壓式柵極偏置電路PPT

yezi888
40.1 KB

免費

53下載

Metrik自動化DevOps度量工具

h1654155216.9102
1.34 MB

免費

0下載

mcg-helper流程自動化工具

百靈千島醬
4.84 MB

免費

0下載

iMACcheck網口測試、MAC管控工具

廉鼎琮
0.26 MB

免費

0下載

Termshark tshark終端用戶界面

馬祥
0.44 MB

免費

1下載

Banana Pi 推出采用瑞芯微 RK3576芯片設計開源硬件：BPI-M5 Pro，比樹莓派5性能強大

sinovoip
23小時前

40 閱讀

基于FPGA的“俄羅斯方塊”系統設計

FPGA技術江湖
23小時前

63 閱讀

源碼系列：基于FPGA的紅外線遙控系統設計（附源工程）

FPGA技術江湖
1天前

100 閱讀

調試STM32H750的FMC總線讀寫PSRAM遇到的問題求解？

風之幻影
1天前

78 閱讀

基于樹莓派5的RTL仿真體驗

卿小小_9e6
2天前

405 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看