<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于DiAD擴散模型的多類異常檢測工作

CVer ? 來源:CVer ? 2024-01-08 14:55 ? 次閱讀

背景和動機

工業生產過程中,工業異常檢測是一個重要的環節,旨在及時發現和排除產品的制造異常,確保產品質量和安全性。近年來,隨著計算機視覺和圖像處理技術的快速發展,視覺技術被廣泛應用于工業異常檢測中。一般的單類異常檢測算法分別為不同類別的物體訓練不同的模型,非常消耗內存,并且也不適用于正常樣本表現出大的類內多樣性的情況,本文作者致力于用統一的框架從不同的物體類別中檢測異常。

現有的基于計算機視覺的工業異常檢測技術包括基于特征的、基于重構的和基于合成的技術。最近,擴散模型因其強大的生成能力而聞名,因此本文作者希望通過擴散模型將異常區域重構成正常。然而如下圖1所示,直接將擴散模型應用于多類異常檢測會存在幾點問題:對于DDPM來說,應用于多類異常檢測會出現類別錯誤的情況,因為在加入1000步噪聲后,圖像已變成隨機高斯噪聲,因為沒有其他限制條件,DDPM在去噪過程中從隨機高斯噪聲中去噪最終獲得隨機類別的圖像。LDM通過交叉注意力引入了條件約束,在多類異常檢測應用場景中,LDM可以通過引入類別條件解決了DDPM在多類異常檢測任務中類別錯誤的問題;然而LDM仍然無法解決在隨機高斯噪聲下去噪并保持圖像語義信息一致性的問題,比如釘子的方向、齒輪的方位等。因此,現有的擴散模型盡管展現了其強大的生成能力,但是無法很好的解決多類異常檢測的任務。

82b0c1b0-9976-11ee-8b88-92fbcf53809c.png

圖1:上圖展示了DDPM、LDM和Ours擴散模型去噪網絡的框架,下圖展示了三種模型對于同樣的輸入異常圖像的重構效果

所以本文作者提出了DiAD來解決多類異常檢測任務。在MVTec-AD、VisA等數據集上在圖像和像素級別的AUROC、AP、F1max和PRO共七個指標上實現了新的SoTA,超越了UniAD、RD4AD等模型。

網絡結構

本文作者提出一種基于擴散模型框架的多類異常檢測方法。本方法包含三個空間:Pixel Space、Latent Space和Feature Space。首先輸入圖像82b895de-9976-11ee-8b88-92fbcf53809c.jpg在Pixel Space中經過預訓練的Auto-encoder得到Latent Variable 82c6d9c8-9976-11ee-8b88-92fbcf53809c.jpg,隨后Latent Variable 82c6d9c8-9976-11ee-8b88-92fbcf53809c.jpg進入Latent Space經過向82c6d9c8-9976-11ee-8b88-92fbcf53809c.jpg一步步加入隨機高斯噪最終得到近隨機高斯噪聲,加噪后的Latent Variable 82e04c00-9976-11ee-8b88-92fbcf53809c.jpg輸入至SD Denoising Network的同時輸入圖像輸入至語義引導網絡(Semantic-Guided Network),經過Semantic-Guided Network的輸入圖像將會加入到SD Denoising Network的Decoder Blocks中,經過大量的去噪過程后得到重構的Latent Variable 82ebb41e-9976-11ee-8b88-92fbcf53809c.jpg,此時再進入Pixel Space中的Auto-decoder得到重構圖像82f9de5e-9976-11ee-8b88-92fbcf53809c.jpg,最終輸入圖像82b895de-9976-11ee-8b88-92fbcf53809c.jpg和重構圖像82f9de5e-9976-11ee-8b88-92fbcf53809c.jpg將同時輸入到Feature Space中,通過同一個預訓練的特征提取網絡提取不同尺度的特征,比較不同特征圖上的余弦相似度用于異常得分的計算與定位并將不同尺度得到的結果合起來得到最終像素級別的異常定位得分和異常分類得分。本文作者改進了擴散模型的Denoising Network,在Denoising Network的基礎上添加了與其結構相似的Semantic-Guided Network來保持輸入圖像與重構圖像語義信息的一致性,使擴散模型能夠在高步數加噪下仍保持與原輸入圖像語義信息的高度一致性并將異常區域重構為正常區域。? ?

83173a3a-9976-11ee-8b88-92fbcf53809c.png

圖2:DiAD模型框架

語義引導網絡(Semantic-Guided Network)

語義引導網絡首先通過卷積神經網絡將輸入圖像832c0096-9976-11ee-8b88-92fbcf53809c.jpg下采樣到與加噪后的隱變量82e04c00-9976-11ee-8b88-92fbcf53809c.jpg經過去噪網絡第一層編碼塊得到的特征圖同維度同尺度特征833e81a8-9976-11ee-8b88-92fbcf53809c.jpg,其次復制預訓練去噪網絡的編碼塊和解碼塊的參數用于之后模型的微調,為了保持重構圖像與輸入圖像語義信息的一致性,將語義引導網絡的中間層和一層解碼塊與去噪網絡對應模塊相連,最終去噪網絡的輸出為 ? ?

834814c0-9976-11ee-8b88-92fbcf53809c.png

其中83594736-9976-11ee-8b88-92fbcf53809c.jpg表示去噪網絡解碼塊、8361541c-9976-11ee-8b88-92fbcf53809c.jpg表示去噪網絡中間塊、8368b7f2-9976-11ee-8b88-92fbcf53809c.jpg表示去噪網絡編碼塊、83733efc-9976-11ee-8b88-92fbcf53809c.jpg表示語義引導網絡中間塊、839aa21c-9976-11ee-8b88-92fbcf53809c.jpg表示卷積神經網絡層、83a5f194-9976-11ee-8b88-92fbcf53809c.jpg表示語義引導網絡解碼層。

空間感知特征融合模塊(Spatial-aware Feature Fusion Block)

為了將不同空間尺度的信息結合起來,使用空間感知特征融合模塊融合在語義引導網絡中不同尺度編碼塊的輸出結果, 83acd61c-9976-11ee-8b88-92fbcf53809c.jpg表示編碼塊四中的低尺度的輸出特征圖,83b8d9f8-9976-11ee-8b88-92fbcf53809c.jpg表示編碼塊三中的高尺度的輸出特征圖,編碼塊四中的最終的輸出特征圖為:

83c018da-9976-11ee-8b88-92fbcf53809c.png

83c9ac42-9976-11ee-8b88-92fbcf53809c.jpg表示編碼塊三中有三層在本次實驗中使用,83d6562c-9976-11ee-8b88-92fbcf53809c.jpg表示一個基本的包含一個3×3卷積層、歸一化層和激活層的卷積模塊。

83e579f4-9976-11ee-8b88-92fbcf53809c.png

圖3:空間感知特征融合模塊

異常分數計算

將重構圖像83f4e736-9976-11ee-8b88-92fbcf53809c.jpg和輸入圖像82b895de-9976-11ee-8b88-92fbcf53809c.jpg共同輸入到特征空間中同一個預訓練的卷積神經網絡resnet50特征提取器8402dbb6-9976-11ee-8b88-92fbcf53809c.jpg中提取不同尺度的特征840c6190-9976-11ee-8b88-92fbcf53809c.jpg,并通過余弦相似度計算不同尺度的缺陷得分841b59b6-9976-11ee-8b88-92fbcf53809c.jpg,計算方式為:

8427b562-9976-11ee-8b88-92fbcf53809c.png

其中843499da-9976-11ee-8b88-92fbcf53809c.jpg代表第843499da-9976-11ee-8b88-92fbcf53809c.jpg層特征840c6190-9976-11ee-8b88-92fbcf53809c.jpg。最終的缺陷定位得分為:

844feec4-9976-11ee-8b88-92fbcf53809c.png

其中8455c95c-9976-11ee-8b88-92fbcf53809c.jpg表示上采樣率、846b8cce-9976-11ee-8b88-92fbcf53809c.jpg表示使用的特征層的數量,缺陷的分類得分為經過全局平均池化后的缺陷定位得分的最大值。

實驗結果

MVTec-AD數據集實驗結果

84741272-9976-11ee-8b88-92fbcf53809c.png

圖4:MVTec-AD數據集上多類異常檢測實驗結果,對應的指標分別為圖像級別AUROC/AP/F1max。

848659d2-9976-11ee-8b88-92fbcf53809c.png

圖5:MVTec-AD數據集上多類異常檢測實驗結果,對應的指標分別為像素級別AUROC/AP/F1max。

VisA數據集實驗結果

8498ecd2-9976-11ee-8b88-92fbcf53809c.jpg

圖6:VisA數據集上多類異常檢測實驗結果,cls表示圖像級別的結果而seg表示像素級別的結果。

總結

本文作者解決了現有擴散模型框架無法應對多類異常檢測任務并提出了DiAD擴散模型框架用于多類異常檢測。具體而言,作者在SD去噪網絡的基礎上引入了語義引導網絡(Semantic-Guided Network)保持輸入圖像和重構圖像的語義一致性,并且還提出了空間感知特征融合模塊(Spatial-aware Feature Fusion Block)將不同尺度的特征相融合。最終本文實現了在保持與輸入圖像語義信息一致的前提下將異常區域重構成正常圖像,同時實現SoTA。

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    8

    文章

    1611

    瀏覽量

    45697
  • 數據集
    +關注

    關注

    4

    文章

    1182

    瀏覽量

    24446
  • 卷積神經網絡

    關注

    4

    文章

    285

    瀏覽量

    11743

原文標題:AAAI 2024 | 浙大&優圖提出DiAD:第一個基于擴散模型的多類異常檢測工作

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于變分自編碼器的異常小區檢測

    異常小區 (c)干擾異常小區  圖1 異常小區類型  本文只對異常小區進行檢測,不對造成
    發表于 12-03 15:06

    基于NanoEdgeAI的異常檢測方案

    NanoEdge AI Studio自動創建基于三軸加速度傳感器信號的AI模型,并快速部署到ST SensorTile.box開發板上,進行異常檢測。
    發表于 09-07 06:27

    基于特征模式的馬爾可夫鏈異常檢測模型

    為提高檢測精度,同時保持算法復雜度在可接受范圍內,提出基于特征模式的馬爾可夫鏈異常檢測模型。提取所有支持度大于閾值的系統調用短序列為特征模式,在此基礎上建立改
    發表于 04-07 09:02 ?13次下載

    基于危險模式的異常檢測模型

    闡述了危險模式的概況及運行機制,提出了一種基于危險模式的異常檢測模型以及相關的算法。該模型通過分析實時系統調用序列中的危險信號,進而判斷是否為入侵事件。實驗結
    發表于 07-30 15:04 ?9次下載

    基于Q-學習算法的異常檢測模型

        針對網絡入侵的不確定性導致異常檢測系統誤報率較高的不足,提出一種基于Q-學習算法的異常檢測模型(QLA
    發表于 09-02 11:58 ?7次下載

    小波變換模極大值的擴散模型

    本內容詳細介紹了 小波變換 模極大值的擴散模型,歡迎大家下載,希望對大家學習有所幫助
    發表于 07-27 16:55 ?21次下載
    小波變換模極大值的<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>

    基于隱馬爾可夫模型的視頻異常檢測模型

    利用光流紋理圖描述移動物體的剛性特征,建立基于隱馬爾可夫模型HMM的時間上下文異常檢測模型。在此基礎上,提取異常目標的Radon特征,以支持
    發表于 11-20 09:37 ?8次下載
    基于隱馬爾可夫<b class='flag-5'>模型</b>的視頻<b class='flag-5'>異常</b><b class='flag-5'>檢測</b><b class='flag-5'>模型</b>

    基于健壯多元概率校準模型的全網絡異常檢測

    的。同時,由于網絡異常種類繁多、變化快速,且常常隱藏在復雜龐大的背景流量中,給網絡異常檢測帶來極大的困難。 提出了一種基于健壯多元概率校準模型
    發表于 03-06 10:02 ?0次下載

    模型的網絡異常流量檢測

    網絡流量的復雜性、難以預測性以及人們主觀評測的差異性等不確定因素,使得網絡流量的異常檢測成為網絡安全防護領域研究的難點問題。通過對流量安全特征的分析提取和范圍限定,引入云模型理論,提出一種基于云
    發表于 03-06 16:44 ?1次下載
    云<b class='flag-5'>模型</b>的網絡<b class='flag-5'>異常</b>流量<b class='flag-5'>檢測</b>

    基于Greenshield模型異常節點檢測機制

    面向車輛自組網的安全通信問題,提出一種基于Greenshield模型異常節點檢測機制。結合車輛自組網的特點,構造Greenshield模型,計算車輛速度、車輛密度和車流量參數。在此基
    發表于 03-29 09:54 ?0次下載

    如何改進和加速擴散模型采樣的方法1

      盡管擴散模型實現了較高的樣本質量和多樣性,但不幸的是,它們在采樣速度方面存在不足。這限制了擴散模型在實際應用中的廣泛采用,并導致了從這些模型
    的頭像 發表于 05-07 14:25 ?1955次閱讀
    如何改進和加速<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>采樣的方法1

    蒸餾無分類器指導擴散模型的方法

    去噪擴散概率模型(DDPM)在圖像生成、音頻合成、分子生成和似然估計領域都已經實現了 SOTA 性能。同時無分類器(classifier-free)指導進一步提升了擴散模型的樣本質量,
    的頭像 發表于 10-13 10:35 ?926次閱讀

    FreeWheel基于機器學習的業務異常檢測實踐

    本文介紹了 FreeWheel 基于機器學習的業務異常檢測實踐,提煉了從零開始構建業務異常檢測系統面臨的問題和解決方案,文章介紹了常用的異常
    的頭像 發表于 10-28 14:35 ?666次閱讀

    港大&amp;騰訊提出DiffusionDet:第一個用于目標檢測擴散模型

    近日,來自香港大學的羅平團隊、騰訊 AI Lab 的研究者聯合提出一種新框架 DiffusionDet,將擴散模型應用于目標檢測。據了解,還沒有研究可以成功地將擴散
    的頭像 發表于 11-22 15:35 ?1590次閱讀

    如何加速生成2 PyTorch擴散模型

    加速生成2 PyTorch擴散模型
    的頭像 發表于 09-04 16:09 ?858次閱讀
    如何加速生成2 PyTorch<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>