<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

GAN應用缺陷的解決方法分享

盡管 GAN 領域的進步令人印象深刻，但其在應用過程中仍然存在一些困難。本文梳理了 GAN 在應用過程中存在的一些難題，并提出了最新的解決方法。

使用 GAN 的缺陷

眾所周知，GAN 是由 Generator 生成網絡和 Discriminator 判別網絡組成的。

1. Modecollapse（模型奔潰）

注：Mode collapse 是指 GAN 生成的樣本單一，其認為滿足某一分布的結果為 true，其他為 False，導致以上結果。

自然數據分布是非常復雜，且是多峰值的（multimodal）。也就是說數據分布有很多的峰值（peak）或眾數（mode）。每個 mode 都表示相似數據樣本的聚集，但與其他 mode 是不同的。

在 modecollapse 過程中，生成網絡 G 會生成屬于有限集 mode 的樣本。當 G 認為可以在單個 mode 上欺騙判別網絡 D 時，G 就會生成該 mode 外的樣本。

GAN應用缺陷的解決方法分享

上圖表示 GAN 的輸出沒有 mode collapse. 下圖則出現了 mode collapse。

判別網絡最后會判別來自該 mode 的樣本是假的。最后，生成網絡 G 會簡單地鎖定到另一個 mode。該循環會無限進行，就會限制生成樣本的多樣性。

2. Convergence（收斂）

GAN 訓練過程中遇到的一個問題是什么時候停止訓練？因為判別網絡 D 損失降級會改善生成網絡 G 的損失（反之亦然），因此無法根據損失函數的值來判斷收斂，如下圖所示：

GAN應用缺陷的解決方法分享

典型的GAN損失函數圖。注意該如何從這個圖中解釋收斂性。

3. Quality（質量）

與前面提到的收斂問題一樣，很難量化地判斷生成網絡 G 什么時候會生成高質量的樣本。另外，在損失函數中加入感知正則化則在一定程度上可緩解該問題。

4. Metrics（度量）

GAN 的目標函數解釋了生成網絡 G 或判別網絡 D 如何根據組件來執行，但它卻不表示輸出的質量和多樣性。因此，需要許多不同的度量指標來進行衡量。

改善性能的技術

下面總結了一些可以使 GAN 更加穩定使用的技術。

1. Alternative Loss Functions （替代損失函數）

修復 GAN 缺陷的最流行的補丁是 Wassers tein GAN （https://arxiv.org/pdf/1701.07875.pdf）。該 GAN 用 Earth Mover distance( Wasserstein-1 distance 或 EM distance) 來替換傳統 GAN 的 Jensen Shannon divergence ( J-S 散度)。EM 距離的原始形式很難理解，因此使用了雙重形式。這需要判別網絡是 1-Lipschitz，通過修改判別網絡的權重來維護。

使用 Earth Mover distance 的優勢在于即使真實的生成數據分布是不相交的，它也是連續的。同時，在生成的圖像質量和損失值之間存在一定關系。使用 Earth Mover distance 的劣勢在于對于每個生成模型 G 都要執行許多判別網絡 D 的更新。而且，研究人員認為權重修改是確保 1-Lipschitz 限制的極端方式。

GAN應用缺陷的解決方法分享

左圖中 earth mover distance 是連續的, 即便其分布并不連續, 這不同于優圖中的 the Jensen Shannon divergence。

另一個解決方案是使用均方損失（ mean squared loss ）替代對數損失（ log loss ）。LSGAN （https://arxiv.org/abs/1611.04076）的作者認為傳統 GAN 損失函數并不會使收集的數據分布接近于真實數據分布。

原來 GAN 損失函數中的對數損失并不影響生成數據與決策邊界（decision boundary）的距離。另一方面，LSGAN 也會對距離決策邊界較遠的樣本進行懲罰，使生成的數據分布與真實數據分布更加靠近，這是通過將均方損失替換為對數損失來完成的。

2. Two Timescale Update Rule(TTUR)

在 TTUR 方法中，研究人員對判別網絡 D 和生成網絡 G 使用不同的學習速度。低速更新規則用于生成網絡 G ，判別網絡 D使用高速更新規則。使用 TTUR 方法，研究人員可以讓生成網絡 G 和判別網絡 D 以 1:1 的速度更新。 SAGAN （https://arxiv.org/abs/1805.08318）就使用了 TTUR 方法。

3. GradientPenalty （梯度懲罰）

論文Improved Training of WGANs（https://arxiv.org/abs/1704.00028）中，作者稱權重修改會導致優化問題。權重修改會迫使神經網絡學習學習更簡單的相似（simpler approximations）達到最優數據分布，導致結果質量不高。同時如果 WGAN 超參數設置不合理，權重修改可能會出現梯度消失或梯度爆炸的問題，論文作者在損失函數中加入了一個簡單的梯度懲罰機制以緩解該問題。

GAN應用缺陷的解決方法分享

加入 GradientPenalty 作為正則化器

DRAGAN （https://arxiv.org/abs/1705.07215）的作者稱，當 GAN 的博弈達到一個局部平衡態（local equilibrium state），就會出現 mode collapse 的問題。而且判別網絡 D 在這種狀態下產生的梯度是非常陡（sharp）的。一般來說，使用梯度懲罰機制可以幫助避免這種狀態的產生，極大增強 GAN 的穩定性，盡可能減少 mode collapse 問題的產生。

4. Spectral Normalization（譜歸一化）

Spectral normalization 是用在判別網絡 D 來增強訓練過程的權重正態化技術（weight normalization technique），可以確保判別網絡 D 是 K-Lipschitz 連續的。SAGAN(https://arxiv.org/abs/1805.08318)這樣的實現也在判別網絡 D 上使用了譜正則化。而且該方法在計算上要比梯度懲罰方法更加高效。

5. Unrolling andPacking (展開和打包)

文章 Mode collapse in GANs（http://aiden.nibali.org/blog/2017-01-18-mode-collapse-gans/）中提到一種預防 mode hopping 的方法就是在更新參數時進行預期對抗（anticipate counterplay）。展開的 GAN ( Unrolled GANs ）可以使用生成網絡 G 欺騙判別網絡 D，然后判別網絡 D 就有機會進行響應。

另一種預防 mode collapse 的方式就是把多個屬于同一類的樣本進行打包，然后傳遞給判別網絡 D 。PacGAN （https://arxiv.org/abs/1712.04086）就融入了該方法，并證明可以減少 mode collapse 的發生。

6. 多個 GAN

一個 GAN 可能不足以有效地處理任務，因此研究人員提出使用多個連續的 GAN ，每個 GAN 解決任務中的一些簡單問題。比如，FashionGAN（https://www.cs.toronto.edu/~urtasun/publications/zhu_etal_iccv17.pdf）就使用 2 個 GAN 來執行圖像定位翻譯。

GAN應用缺陷的解決方法分享

FashionGAN 使用兩個 GANs 進行圖像定位翻譯。

因此，可以讓 GAN 慢慢地解決更難的問題。比如 Progressive GANs (ProGANs，https://arxiv.org/abs/1710.10196) 就可以生成分辨率極高的高質量圖像。

7. Relativistic GANs（相對生成對抗網絡）

傳統的 GAN 會測量生成數據為真的可能性。Relativistic GANs 則會測量生成數據“逼真”的可能性。研究人員可以使用相對距離測量方法（appropriate distance measure）來測量相對真實性（relative realism），相關論文鏈接：https://arxiv.org/abs/1807.00734。

GAN應用缺陷的解決方法分享

圖 A 表示 JS 散度的最優解，圖 B 表示使用標準 GAN 損失時判別網絡 D 的輸出，圖 C 表示輸出曲線的實際圖。

在論文中，作者提到判別網絡 D 達到最優狀態時，D 的輸出應該聚集到 0.5。但傳統的 GAN 訓練算法會讓判別網絡 D 對圖像輸出“真實”（real，1）的可能性，這會限制判別網絡 D 達到最優性能。不過這種方法可以很好地解決這個問題，并得到不錯的結果。

經過 5000 次迭代后，標準 GAN (左)和相對 GAN (右)的輸出。

8. Self Attention Mechanism（自注意力機制）

Self Attention GANs（https://arxiv.org/abs/1805.08318）作者稱用于生成圖像的卷積會關注本地傳播的信息。也就是說，由于限制性接收域這會錯過廣泛傳播關系。

GAN應用缺陷的解決方法分享

將 attention map (在黃色框中計算)添加到標準卷積操作中。

Self-Attention Generative Adversarial Network 允許圖像生成任務中使用注意力驅動的、長距依賴的模型。自注意力機制是對正常卷積操作的補充，全局信息（長距依賴）會用于生成更高質量的圖像，而用來忽略注意力機制的神經網絡會考慮注意力機制和正常的卷積。（相關論文鏈接：https://arxiv.org/pdf/1805.08318.pdf）。

使用紅點標記的可視化 attention map。

9. 其他技術

其他可以用來改善 GAN 訓練過程的技術包括：

特征匹配

Mini Batch Discrimination（小批量判別）

歷史平均值

One-sided Label Smoothing（單側標簽平滑）

Virtual Batch Normalization（虛擬批量正態化）

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

GaN

GaN

+關注

關注
19

文章
1785

瀏覽量
68749
Model

Model

+關注

關注
0

文章
331

瀏覽量
24832

原文標題：GAN性能不穩？這九大技術可“鎮住”四類缺陷

文章出處：【微信號：rgznai100，微信公眾號：rgznai100】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

鴻蒙OpenHarmony：【常見編譯問題和解決方法】

常見編譯問題和解決方法

的頭像

發表于 05-11 16:09 ?674次閱讀

GaN功率HEMT制造中的缺陷及其表征方法

泛的應用范圍內推廣，詳細理解提高產量和可靠性的根本原因至關重要。本文中，我們總結了在GaN晶圓加工過程中常見的一些缺陷，以及用于檢測這些缺陷的表征技術。01氮化鎵晶體結構

的頭像

發表于 04-18 11:49 ?232次閱讀

<b class='flag-5'>GaN</b>功率HEMT制造中的<b class='flag-5'>缺陷</b>及其表征<b class='flag-5'>方法</b>

分析電源電感發熱解決方法

電子發燒友網站提供《分析電源電感發熱解決方法.docx》資料免費下載

發表于 03-29 14:39 ?2次下載

EMI電磁干擾：原理、影響及解決方法詳解？

EMI電磁干擾：原理、影響及解決方法詳解？|深圳比創達電子

的頭像

發表于 03-21 10:02 ?338次閱讀

EMI電磁干擾：原理、影響及<b class='flag-5'>解決方法</b>詳解？

基于深度學習的芯片缺陷檢測梳理分析

雖然表面缺陷檢測技術已經不斷從學術研究走向成熟的工業應用，但是依然有一些需要解決的問題?；谝陨戏治隹梢园l現，由于芯片表面缺陷的獨特性質，通用目標檢測算法不適合直接應用于芯片表面缺陷檢測任務，需要提出新的

發表于 02-25 14:30 ?452次閱讀

基于深度學習的芯片<b class='flag-5'>缺陷</b>檢測梳理分析

PCB壓合問題解決方法

PCB壓合問題解決方法

的頭像

發表于 01-05 10:32 ?438次閱讀

三相電缺相的原因及解決方法

三相電缺相的原因及解決方法 三相電缺相是指三相供電系統中某一相或多相出現故障或中斷的情況。常見的缺相原因包括線路故障、設備故障、接線錯誤、過載等，解決方法則包括檢查和修復故障線路或設備、調整電路連接

的頭像

發表于 12-11 17:16 ?8559次閱讀

晶振停振的原因及解決方法

晶振停振的原因及解決方法 晶振是主頻組成器的核心元件之一，它能夠提供一個固定的、穩定的振蕩頻率信號，是電子元件中一種非常重要的信號源。然而，在使用過程中，晶振有時會出現停振的情況，導致整個電路的正常

的頭像

發表于 10-31 10:42 ?1125次閱讀

PCB制造缺陷解決方法

在印制電路板制造過程涉及到工序較多，每道工序都有可能發生質量缺陷，這些質量總是涉及到諸多方面，解決起來比較麻煩，由于產生問題的原因是多方面的，有的是屬于化學、機械、板材、光學等等方面。經過幾十年的生產實踐，結合解決質量總是實際經驗和有關的解決技術問題的相應資料

發表于 08-18 14:31 ?475次閱讀

工業產品表面缺陷檢測方法研究

了工業表面缺陷檢測中常見的關鍵問題及其解決方法；關鍵問題包括實時問題、小樣本問題、小目標問題、不平衡樣本問題。最后對近年來常用的工業表面缺陷數據集進行比較全面的總結，并比較了MVTec AD數據集的最新研究

的頭像

發表于 08-17 11:23 ?637次閱讀

工業產品表面<b class='flag-5'>缺陷</b>檢測<b class='flag-5'>方法</b>研究

保護死區的概念和解決方法

保護死區的概念和解決方法

的頭像

發表于 07-15 11:02 ?964次閱讀

保護死區的概念和<b class='flag-5'>解決方法</b>

基于GAN的零缺陷樣本產品表面缺陷檢測

少的情況下實現高精度的檢測呢？目前有兩種方法，一種是小樣本學習，另一種是用GAN。本文將介紹一種GAN用于無缺陷樣本產品表面缺陷檢測。

的頭像

發表于 06-26 09:49 ?704次閱讀

基于<b class='flag-5'>GAN</b>的零<b class='flag-5'>缺陷</b>樣本產品表面<b class='flag-5'>缺陷</b>檢測

GaN功率集成電路的可靠性系統方法

GaN功率集成電路可靠性的系統方法

發表于 06-19 06:52

CDMA網絡中的信號干擾問題及解決方法

在CDMA網絡中，存在以下幾種信號干擾問題，并提供相應的解決方法

的頭像

發表于 06-16 16:52 ?1434次閱讀

GaN外延生長方法及生長模式

由于GaN在高溫生長時N的離解壓很高，很難得到大尺寸的GaN單晶材料，因此，為了實現低成本、高效、高功率的GaN HEMTs器件，研究人員經過幾十年的不斷研究，并不斷嘗試利用不同的外延生長方法

發表于 06-10 09:43 ?867次閱讀

精選推薦
更多

文章

資料

帖子

ELF 1技術貼|如何在Ubuntu中編譯OpenCV庫

ElfBoard
1天前

465 閱讀

【項目展示】基于CW32的遙控循跡小車

CW32生態社區
1天前

394 閱讀

精進嵌入式開源開發技能，RT-Thread?SMP培訓即將來襲！

RT-Thread官方賬號
2天前

118 閱讀

手把手教你如何在Purple Pi OH上開發板安裝Opencv

觸覺智能
2天前

219 閱讀

鴻蒙開發接口媒體：【@ohos.multimedia.image (圖片處理)】

jf_46214456
1天前

508 閱讀

基于DC996B-E模擬到數字轉換的參考設計

尚文清
1.71MB

免費

20下載

從零開始寫RISC-V處理器

5.43 MB

免費

96下載

file upload html5文件上傳組件

李玲
3.78 MB

免費

1下載

Ring Clojure的Web框架

郭大
0.11 MB

免費

1下載

TeamX基于Luffy faas的團隊協作工具

賈虎世
0.07 MB

免費

1下載

有關PL端利用AXI總線控制PS端DDR進行讀寫（從機wready信號一直不拉高）

jf_86841278
2天前

649 閱讀

LDO電源模塊如何快速設計布局

鄒夢雨
2天前

493 閱讀

全志H616（BIGTREETECH CB1）和博通BCM2711（樹莓派4B）CPU對比測試

corkia
2天前

464 閱讀

請教一個三極管推Pmos管的電路問題

雪舞風華
2天前

843 閱讀

用全志XR806開發板輕松連上華為云實現物聯網

corkia
2天前

460 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看