<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GAN應用缺陷的解決方法分享

電子工程師 ? 來源:陳翠 ? 2019-02-22 09:44 ? 次閱讀

盡管 GAN 領域的進步令人印象深刻,但其在應用過程中仍然存在一些困難。本文梳理了 GAN 在應用過程中存在的一些難題,并提出了最新的解決方法。

使用 GAN 的缺陷

眾所周知,GAN 是由 Generator 生成網絡和 Discriminator 判別網絡組成的。

1. Modecollapse(模型奔潰)

注:Mode collapse 是指 GAN 生成的樣本單一,其認為滿足某一分布的結果為 true,其他為 False,導致以上結果。

自然數據分布是非常復雜,且是多峰值的(multimodal)。也就是說數據分布有很多的峰值(peak)或眾數(mode)。每個 mode 都表示相似數據樣本的聚集,但與其他 mode 是不同的。

在 modecollapse 過程中,生成網絡 G 會生成屬于有限集 mode 的樣本。當 G 認為可以在單個 mode 上欺騙判別網絡 D 時,G 就會生成該 mode 外的樣本。

GAN應用缺陷的解決方法分享

上圖表示 GAN 的輸出沒有 mode collapse. 下圖則出現了 mode collapse。

判別網絡最后會判別來自該 mode 的樣本是假的。最后,生成網絡 G 會簡單地鎖定到另一個 mode。該循環會無限進行,就會限制生成樣本的多樣性。

2. Convergence(收斂)

GAN 訓練過程中遇到的一個問題是什么時候停止訓練?因為判別網絡 D 損失降級會改善生成網絡 G 的損失(反之亦然),因此無法根據損失函數的值來判斷收斂,如下圖所示:

GAN應用缺陷的解決方法分享

典型的GAN損失函數圖。注意該如何從這個圖中解釋收斂性。

3. Quality(質量)

與前面提到的收斂問題一樣,很難量化地判斷生成網絡 G 什么時候會生成高質量的樣本。另外,在損失函數中加入感知正則化則在一定程度上可緩解該問題。

4. Metrics(度量)

GAN 的目標函數解釋了生成網絡 G 或 判別網絡 D 如何根據組件來執行,但它卻不表示輸出的質量和多樣性。因此,需要許多不同的度量指標來進行衡量。

改善性能的技術

下面總結了一些可以使 GAN 更加穩定使用的技術。

1. Alternative Loss Functions (替代損失函數)

修復 GAN 缺陷的最流行的補丁是 Wasserstein GAN (https://arxiv.org/pdf/1701.07875.pdf)。該 GAN 用 Earth Mover distance( Wasserstein-1 distance 或 EM distance) 來替換傳統 GAN 的 Jensen Shannon divergence ( J-S 散度)。EM 距離的原始形式很難理解,因此使用了雙重形式。這需要判別網絡是 1-Lipschitz,通過修改判別網絡的權重來維護。

使用 Earth Mover distance 的優勢在于即使真實的生成數據分布是不相交的,它也是連續的。同時,在生成的圖像質量和損失值之間存在一定關系。使用 Earth Mover distance 的劣勢在于對于每個生成模型 G 都要執行許多判別網絡 D 的更新。而且,研究人員認為權重修改是確保 1-Lipschitz 限制的極端方式。

GAN應用缺陷的解決方法分享

左圖中 earth mover distance 是連續的, 即便其分布并不連續, 這不同于優圖中的 the Jensen Shannon divergence。

另一個解決方案是使用均方損失( mean squared loss )替代對數損失( log loss )。LSGAN (https://arxiv.org/abs/1611.04076)的作者認為傳統 GAN 損失函數并不會使收集的數據分布接近于真實數據分布。

原來 GAN 損失函數中的對數損失并不影響生成數據與決策邊界(decision boundary)的距離。另一方面,LSGAN 也會對距離決策邊界較遠的樣本進行懲罰,使生成的數據分布與真實數據分布更加靠近,這是通過將均方損失替換為對數損失來完成的。

2. Two Timescale Update Rule(TTUR)

在 TTUR 方法中,研究人員對判別網絡 D 和生成網絡 G 使用不同的學習速度。低速更新規則用于生成網絡 G ,判別網絡 D使用 高速更新規則。使用 TTUR 方法,研究人員可以讓生成網絡 G 和判別網絡 D 以 1:1 的速度更新。 SAGAN (https://arxiv.org/abs/1805.08318) 就使用了 TTUR 方法。

3. GradientPenalty (梯度懲罰)

論文Improved Training of WGANs(https://arxiv.org/abs/1704.00028)中,作者稱權重修改會導致優化問題。權重修改會迫使神經網絡學習學習更簡單的相似(simpler approximations)達到最優數據分布,導致結果質量不高。同時如果 WGAN 超參數設置不合理,權重修改可能會出現梯度消失或梯度爆炸的問題,論文作者在損失函數中加入了一個簡單的梯度懲罰機制以緩解該問題。

GAN應用缺陷的解決方法分享

加入 GradientPenalty 作為正則化器

DRAGAN (https://arxiv.org/abs/1705.07215)的作者稱,當 GAN 的博弈達到一個局部平衡態(local equilibrium state),就會出現 mode collapse 的問題。而且判別網絡 D 在這種狀態下產生的梯度是非常陡(sharp)的。一般來說,使用梯度懲罰機制可以幫助避免這種狀態的產生,極大增強 GAN 的穩定性,盡可能減少 mode collapse 問題的產生。

4. Spectral Normalization(譜歸一化)

Spectral normalization 是用在判別網絡 D 來增強訓練過程的權重正態化技術 (weight normalization technique),可以確保判別網絡 D 是 K-Lipschitz 連續的。SAGAN(https://arxiv.org/abs/1805.08318)這樣的實現也在判別網絡 D 上使用了譜正則化。而且該方法在計算上要比梯度懲罰方法更加高效。

5. Unrolling andPacking (展開和打包)

文章 Mode collapse in GANs(http://aiden.nibali.org/blog/2017-01-18-mode-collapse-gans/)中提到一種預防 mode hopping 的方法就是在更新參數時進行預期對抗(anticipate counterplay)。展開的 GAN ( Unrolled GANs )可以使用生成網絡 G 欺騙判別網絡 D,然后判別網絡 D 就有機會進行響應。

另一種預防 mode collapse 的方式就是把多個屬于同一類的樣本進行打包,然后傳遞給判別網絡 D 。PacGAN (https://arxiv.org/abs/1712.04086)就融入了該方法,并證明可以減少 mode collapse 的發生。

6. 多個 GAN

一個 GAN 可能不足以有效地處理任務,因此研究人員提出使用多個連續的 GAN ,每個 GAN 解決任務中的一些簡單問題。比如,FashionGAN(https://www.cs.toronto.edu/~urtasun/publications/zhu_etal_iccv17.pdf)就使用 2 個 GAN 來執行圖像定位翻譯。

GAN應用缺陷的解決方法分享

FashionGAN 使用兩個 GANs 進行圖像定位翻譯。

因此,可以讓 GAN 慢慢地解決更難的問題。比如 Progressive GANs (ProGANs,https://arxiv.org/abs/1710.10196) 就可以生成分辨率極高的高質量圖像。

7. Relativistic GANs(相對生成對抗網絡)

傳統的 GAN 會測量生成數據為真的可能性。Relativistic GANs 則會測量生成數據“逼真”的可能性。研究人員可以使用相對距離測量方法(appropriate distance measure)來測量相對真實性(relative realism),相關論文鏈接:https://arxiv.org/abs/1807.00734。

GAN應用缺陷的解決方法分享

圖 A 表示 JS 散度的最優解,圖 B 表示使用標準 GAN 損失時判別網絡 D 的輸出,圖 C 表示輸出曲線的實際圖。

在論文中,作者提到判別網絡 D 達到最優狀態時,D 的輸出應該聚集到 0.5。但傳統的 GAN 訓練算法會讓判別網絡 D 對圖像輸出“真實”(real,1)的可能性,這會限制判別網絡 D 達到最優性能。不過這種方法可以很好地解決這個問題,并得到不錯的結果。

經過 5000 次迭代后,標準 GAN (左)和相對 GAN (右)的輸出。

8. Self Attention Mechanism(自注意力機制)

Self Attention GANs(https://arxiv.org/abs/1805.08318)作者稱用于生成圖像的卷積會關注本地傳播的信息。也就是說,由于限制性接收域這會錯過廣泛傳播關系。

GAN應用缺陷的解決方法分享

將 attention map (在黃色框中計算)添加到標準卷積操作中。

Self-Attention Generative Adversarial Network 允許圖像生成任務中使用注意力驅動的、長距依賴的模型。自注意力機制是對正常卷積操作的補充,全局信息(長距依賴)會用于生成更高質量的圖像,而用來忽略注意力機制的神經網絡會考慮注意力機制和正常的卷積。(相關論文鏈接:https://arxiv.org/pdf/1805.08318.pdf)。

使用紅點標記的可視化 attention map。

9. 其他技術

其他可以用來改善 GAN 訓練過程的技術包括:

特征匹配

Mini Batch Discrimination(小批量判別)

歷史平均值

One-sided Label Smoothing(單側標簽平滑)

Virtual Batch Normalization(虛擬批量正態化)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1785

    瀏覽量

    68749
  • Model
    +關注

    關注

    0

    文章

    331

    瀏覽量

    24832

原文標題:GAN性能不穩?這九大技術可“鎮住”四類缺陷

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    鴻蒙OpenHarmony:【常見編譯問題和解決方法

    常見編譯問題和解決方法
    的頭像 發表于 05-11 16:09 ?674次閱讀

    GaN功率HEMT制造中的缺陷及其表征方法

    泛的應用范圍內推廣,詳細理解提高產量和可靠性的根本原因至關重要。本文中,我們總結了在GaN晶圓加工過程中常見的一些缺陷,以及用于檢測這些缺陷的表征技術。01氮化鎵晶體結構
    的頭像 發表于 04-18 11:49 ?232次閱讀
    <b class='flag-5'>GaN</b>功率HEMT制造中的<b class='flag-5'>缺陷</b>及其表征<b class='flag-5'>方法</b>

    分析電源電感發熱解決方法

    電子發燒友網站提供《分析電源電感發熱解決方法.docx》資料免費下載
    發表于 03-29 14:39 ?2次下載

    EMI電磁干擾:原理、影響及解決方法詳解?

    EMI電磁干擾:原理、影響及解決方法詳解?|深圳比創達電子
    的頭像 發表于 03-21 10:02 ?338次閱讀
    EMI電磁干擾:原理、影響及<b class='flag-5'>解決方法</b>詳解?

    基于深度學習的芯片缺陷檢測梳理分析

    雖然表面缺陷檢測技術已經不斷從學術研究走向成熟的工業應用,但是依然有一些需要解決的問題?;谝陨戏治隹梢园l現,由于芯片表面缺陷的獨特性質,通用目標檢測算法不適合直接應用于芯片表面缺陷檢測任務,需要提出新的
    發表于 02-25 14:30 ?452次閱讀
    基于深度學習的芯片<b class='flag-5'>缺陷</b>檢測梳理分析

    PCB壓合問題解決方法

    PCB壓合問題解決方法
    的頭像 發表于 01-05 10:32 ?438次閱讀

    三相電缺相的原因及解決方法

    三相電缺相的原因及解決方法 三相電缺相是指三相供電系統中某一相或多相出現故障或中斷的情況。常見的缺相原因包括線路故障、設備故障、接線錯誤、過載等,解決方法則包括檢查和修復故障線路或設備、調整電路連接
    的頭像 發表于 12-11 17:16 ?8559次閱讀

    晶振停振的原因及解決方法

    晶振停振的原因及解決方法 晶振是主頻組成器的核心元件之一,它能夠提供一個固定的、穩定的振蕩頻率信號,是電子元件中一種非常重要的信號源。然而,在使用過程中,晶振有時會出現停振的情況,導致整個電路的正常
    的頭像 發表于 10-31 10:42 ?1125次閱讀

    PCB制造缺陷解決方法

    在印制電路板制造過程涉及到工序較多,每道工序都有可能發生質量缺陷,這些質量總是涉及到諸多方面,解決起來比較麻煩,由于產生問題的原因是多方面的,有的是屬于化學、機械、板材、光學等等方面。經過幾十年的生產實踐,結合解決質量總是實際經驗和有關的解決技術問題的相應資料
    發表于 08-18 14:31 ?475次閱讀

    工業產品表面缺陷檢測方法研究

    了工業表面缺陷檢測中常見的關鍵問題及其解決方法;關鍵問題包括實時問題、小樣本問題、小目標問題、不平衡樣本問題。最后對近年來常用的工業表面缺陷數據集進行比較全面的總結,并比較了MVTec AD數據集的最新研究
    的頭像 發表于 08-17 11:23 ?637次閱讀
    工業產品表面<b class='flag-5'>缺陷</b>檢測<b class='flag-5'>方法</b>研究

    保護死區的概念和解決方法

    保護死區的概念和解決方法
    的頭像 發表于 07-15 11:02 ?964次閱讀
    保護死區的概念和<b class='flag-5'>解決方法</b>

    基于GAN的零缺陷樣本產品表面缺陷檢測

    少的情況下實現高精度的檢測呢?目前有兩種方法,一種是小樣本學習,另一種是用GAN。本文將介紹一種GAN用于無缺陷樣本產品表面缺陷檢測。
    的頭像 發表于 06-26 09:49 ?704次閱讀
    基于<b class='flag-5'>GAN</b>的零<b class='flag-5'>缺陷</b>樣本產品表面<b class='flag-5'>缺陷</b>檢測

    GaN功率集成電路的可靠性系統方法

    GaN功率集成電路可靠性的系統方法
    發表于 06-19 06:52

    CDMA網絡中的信號干擾問題及解決方法

    在CDMA網絡中,存在以下幾種信號干擾問題,并提供相應的解決方法
    的頭像 發表于 06-16 16:52 ?1434次閱讀

    GaN外延生長方法及生長模式

    由于GaN在高溫生長時N的離解壓很高,很難得到大尺寸的GaN單晶材料,因此,為了實現低成本、高效、高功率的GaN HEMTs器件,研究人員經過幾十年的不斷研究,并不斷嘗試利用不同的外延生長方法
    的頭像 發表于 06-10 09:43 ?867次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>