AIGC名詞解釋:GAN 生成對抗網絡

2023-10-05     新設技

原標題:AIGC名詞解釋:GAN 生成對抗網絡

用設計師能理解的語言

來解釋AIGC中的技術名詞

AIGC 屬於跨學科的產物,涉及領域眾多,包括高等數學、統計學、計算機圖形圖像學、機器學習等各個領域。AIGC 設計軟體的介面上往往會涉及到許多這些領域的技術術語。要想搞清楚它們背後的知識體系需要展開的知識樹體量十分龐大繁雜。術業有專攻,我們無法全面俱到地在每一個領域都做到精通,但又需要了解到一定的程度,以便更好地使用 AIGC 的相關軟體。所以,我們將儘量以設計行業從業者能理解的語言來解釋那些經常遇到無法繞開的技術術語。

GAN 生成對抗網絡

GAN 是 Generative Adversarial Network 生成對抗網絡英文的縮寫,(論文:https://arxiv.org/abs/1406.2661 )。GAN 也是一種神經網絡,是由被譽為「生成對抗網絡之父」 的蒙特婁大學博士生伊恩·古德弗洛(Ian Goodfellow)在2014年提出的。百度的前首席科學家吳恩達(Andrew Ng)說,GAN 代表了「重要而根本性的進步」。GAN 的發明激發了全球研究者群體的不斷壯大。

「生成對抗網絡之父」

伊恩·古德弗洛 Ian Goodfellow

GAN 在各類生成算法中,屬於深度生成模型,也是最流行的模型,另一個很流行的模型就是VAE( 到目前為止,有3種類型的生成模型,即 GAN、VAE 和基於 Flow 的模型)。

生成對抗網絡的主要思想是:通過生成器(Generato)與判別器(Discriminator)不斷對抗進行訓練。後來無論GAN發展到今天演化出了多麼複雜的變體,其基本思想仍是以上這兩種網絡的對抗,基本結構一定要有生成器與判別器。

GAN 的主要架構

  • 生成器 Generator(G):是生成圖像的網絡,它接受一個隨機的噪聲,並根據噪聲生成圖像,生成的圖像記作 ,
  • 判別器 Discriminator(D):是一個判別網絡,它判別一張圖像是不是「真實的」。它的輸入參數是 ,代表一張圖像,輸出 代表 為真實圖片的機率,如果為 1,就代表 100% 是真實的圖片,而輸出為 0,就代表不可能是真實的圖像。

這樣看來,我們發現 GAN 網絡就像一個自己對自己進行圖靈測試的機器。在測試過程中,生成器 G 和判別器 D 就像是兩個不斷地相互博弈而又永不放棄的人。生成網絡 G 的目標就是不斷改進自己的生成過程,使得輸出的結果儘量看起來像真實的圖像,以此騙過判別器 D ,好讓 D 打分為 1,即100%真實。而判別器 D 的目標就是儘量把 G 生成的圖片和真實的圖片區分開來,不斷練就自己的「慧眼」。通過相互對抗,生成器的生成能力和判別器的判別能力都越來越強大,最終當模型收斂時,我們將得到一個生成效果較好的生成器,畢竟這才是我們的核心目的。道高一尺魔高一丈的精髓至此被人工智慧學去了。

舉個比較形象的例子:我們假設生成器 G 是一個專門做贗品的畫師,判別器 D 是名畫鑑別師。這個希望靠贗品畫作渾水摸魚的畫家,拿著作品到市場上去很容易就被別人揭穿了。於是他請來一位名畫鑑別師 D 來幫助自己提高臨摹能力。但是名畫鑑別師 D 唯一能幫助 G 的就是不厭其煩地每天鑑別 G 的新作,並給出畫作是否像真畫的肯定或否定答案。起初 G 的畫作在不斷變化中嘗試改進,每一次都被 D 判定為假貨,但是成千上萬次不斷反覆訓練的結果,D 的畫技逐漸爐火純青,達到了以假亂真的地步,以至於鑑別師 D 也無法分辨真假了。

GAN 網絡中生成器(G)與判別器(D)的關係

而實際上,鑑別師 D 也是需要訓練的。訓練鑑別師的目的是為了更好地和贗品畫師 G 進行對抗,以提高 G 的亂真能力。我們把一些真品的畫作和假畫給鑑別師 D,並告之哪個是真,哪個是假,以此訓練 D。曾經一度 G 的贗品技藝已經讓 D 分別不出真假了,但是經過進一步訓練的 D 鑑別能力大大提升,又能洞察玄機鑑別出來 D 的畫作是贗品了。

然後,以上兩個人在不斷交替地對抗中,各自的本領都得到了極大的提高,魔高一尺道高一丈。當然,最終的檢驗標準還是市場。G 把作品拿到市場上,所有人都讚不絕口認為是一幅偉大的名畫,G 的辛苦訓練終於如願以償,他在臨摹過程中也提升了自己的畫技,發現自己也具備了一位真正的繪畫大師的能力了,他甚至準備出品屬於自己風格的畫作。此時,一直站在角落裡看著這一切的鑑別師 D 也發出了滿意的微笑!

最後,讓我們看看 GAN 的輸出效果吧。

你可能看到這些人的照片總覺得眼熟,但又實在說不出他們的名字,這些有著明星相貌的臉龐其實都是英偉達(Nvidia)公司在 GAN 的生成技術基礎之上研發出來的虛擬明星臉大模型。這些模型學習了各種大片和新聞里的明星面孔,總結規律,最後通過 GAN 的生成技術來生成這些以假亂真的明星面孔。看來,還真是存在明星臉這樣的規律!可是,別看這些面孔栩栩如生,各個都像是真人,然而,這些「人」壓根就不存在於這個地球上!

英偉達(Nvidia)公司

基於GAN 的技術研發出的虛擬明星臉生成器

所生成的以假亂真的明星臉

AIGC生成的油畫《 Théâtre D『opéra Spatial 》

(太空歌劇院)

再看看這個 GAN 的生成案例。這幅油畫《 Théâtre D『opéra Spatial 》(太空歌劇院)在2022年9月參加美國Colorado科羅拉多州博覽會的藝術比賽,奪得了第一名,獲得300美金的獎勵。而之後這幅畫很快被作者Jason Allen自己透露是一幅由 Midjourney (Midjourney 是基於 GAN 的AIGC生圖軟體)生成的作品,於是引發了巨大的爭論直至今天。自此,300刀的獎金撬起了萬億美元的AIGC市場!

AIGC基礎知識

專業名詞解析

Stable Diffusion從入門到精通到實戰

專欄內容簡介

從AIGC的基礎概念介紹開始,以「喂飯級」的語言,逐一詳細介紹 Stable Diffusion WebUI 的各個參數與設置,配合詳細的圖文素材,並用大量實戰案例來解讀 Stable Diffusion 在目前各設計領域中的應用。

通過這個專欄,你會得到

AIGC的基礎概念、紮實的基礎知識;

AIGC圖像設計創作領域目前最重要的陣地——Stable Diffusion 的相關基礎知識、專業術語;

Stable Diffusion WebUI 軟體中每一個參數詳細功能介紹,原理,對應AI生圖的結果;

Stable Diffusion WebUI 的具體使用方法和技巧,各種模型介紹、周邊配套插件與軟體的使用方法和技巧;

Stable Diffusion WebUI 在實際設計產業中的應用、實戰解析;

Stable Diffusion 的提示詞庫、參數庫等;

購買全套課程的學員,享受半年免費 SD-WebUI(高性能GPU)線上使用權限,使用期限內無限出圖、高速出圖。

訂閱須知

《Stable Diffusion從入門到精通到實戰》為圖文/視頻專欄,不少於 20 期,每周五 21:00 點更新;

20 期更新結束後,專欄內容會根據 AIGC 領域的最新動態、Stable Diffusion 的不斷疊代而產生新內容,這些與時俱進的新內容無需額外付費;

添加一對一輔導員,及時收到通知更新內容,一對一解答疑難問題;

本專欄為虛擬內容服務,購買成功後不支持退款,請理解。

加輔導員微信諮詢

了解更詳細課程信息

一對一解答疑難問題

Stable Diffusion WebUI

從入門到精通再到實戰

完全喂飯級,細緻到每一個參數

「設計小白」都能看懂

有設計基礎的朋友更會得到啟發

抓住人工智慧工業革命帶來的新機遇

輔導員微信:cyxq2019

長按上方二維碼圖

在彈出菜單中選擇「打開對方的名片」

加輔導員微信,諮詢課程

文章來源: https://twgreatdaily.com/9f12f3f0d9e7374a2800311b14c1a599.html