AIGC名詞解釋:Latent Space 潛空間 II

2023-10-05     新設技

原標題:AIGC名詞解釋:Latent Space 潛空間 II

用設計師能理解的語言

來解釋AIGC中的技術名詞

AIGC 屬於跨學科的產物,涉及領域眾多,包括高等數學、統計學、計算機圖形圖像學、機器學習等各個領域。AIGC 設計軟體的介面上往往會涉及到許多這些領域的技術術語。要想搞清楚它們背後的知識體系需要展開的知識樹體量十分龐大繁雜。術業有專攻,我們無法全面俱到地在每一個領域都做到精通,但又需要了解到一定的程度,以便更好地使用 AIGC 的相關軟體。所以,我們將儘量以設計行業從業者能理解的語言來解釋那些經常遇到無法繞開的技術術語。

Latent Space 潛空間(下)

Latent Space 潛在空間之所以叫「空間」,而不是叫「壓縮數據」或「高度概括數據」,還因為一個比較重要的概念「維度」。一個手寫數字卡片這樣的圖像,可以算是2維的數據集,而一段視頻,我們可以理解為3維的數據集,但是要通過數據來描述這個世界中的很多事物,不可能止步於3維。在一個虛擬的世界中,模擬再現出一個世界,需要用數字描繪的事物維度往往超過了3維,甚至高達十幾維、幾十維、幾百維。這樣的維度空間我們無法用感官去直接感受到或大腦想像到,但可以通過數據集來描述。人工智慧直接在這樣高維度的數據集中進行訓練,將因為數據過於龐大,且其中的「雜質」太多而難以進行。

比如圖5中的兩把椅子和桌子,很明顯,兩把椅子更有相似性,他們區別於桌子大機率是因為他們都是有靠背的、沒有抽屜的、更瘦高的外觀結構等等。這些都構成了數據的維度。可是很明顯,兩把椅子的顏色特徵,在建立椅子與椅子之間的相似度和椅子與桌子的區別度來看,純屬是無用的甚至是容易造成混淆的「雜質」信息。所以,我們需要過濾一下。通常的方式是把高維度的事物用低維度去解構。好比一個3D的圖形,我們把它解構為2D的正視圖、2D的側視圖和2D的頂視圖,最後再把這三個2D的圖像進行分別運算一樣。通過維度的降低,在訓練樣本足夠多的情況下,許多不相關的「雜質」數據將被識別後剔除掉,因為更接近於普遍規律性的數據將在數據表現上更接近。最後留在低維度空間(潛空間)中的信息將最大限度地高度概括這類事物的普遍特徵。

圖5:image source:towardsdatascience.com

這便有了「空間」的概念,把高緯度空間中的事物降維成低維度的空間中的數據,再在低維度空間中進行運算。這裡「空間」兩個字是一種意向上的比喻稱呼,比喻一種隱藏的、被壓縮後的、不可直觀感受到的、從高維度解構下來的低維度空間。這兩把椅子在潛空間中距離更近,你也可以理解為兩把椅子的數據集在潛空間中所占的坐標點位更相近。比如兩把椅子在潛空間中數據被壓縮成[0.4, 0.5] 和 [0.45, 0.45],而桌子被壓縮成[0.9, 1.05],若放在二維的坐標系中,兩個數值分別代表X坐標值和Y坐標值,很明顯兩把椅子的點位更接近,「椅子」的規律也就浮現出來了。

這其實很類似哲學意義上的歸納總結,在一系列類似的事物中,把沒用的、偶然的信息剔除掉,把有用的相互之間關聯的規律性的信息高度地形而上地總結起來,形成認知事物的規律(在人工智慧領域就是形成了「模型」),方便日後面對類似事物問題時進行分析判斷,遵循這樣的規律去行事以期達到我們心中想要的結果。潛空間就是這個拆分複雜問題後,剔除了無用的「雜質」信息後,留下來的「哲學空間」,但空間中的哲理描述則是簡明扼要的提綱挈領的。這個空間中的數據就被泛指為潛空間中的變量,簡稱為「潛變量」。

另外,關於潛空間、維度、編碼後的數據損失、規律性、解碼、訓練等概念可以通過圖6進行更形象地理解。圖6中,在 initial dimension 1 為橫軸、 initial dimension 2 為縱軸組成的二維坐標系中,A、B、C、D四個點代表原始數據,他們在二維空間中占有各自的位置(圖6中+號的點位,他們的初始坐標為右側表格中 Initial 列下的二維數據集)。編碼器將這四個點位首先從二維空間壓縮到一維空間對應的點,這個一維空間的坐標系就是圖6中 encoded dimension 1 坐標軸所代表的。它的原點和二維坐標系的原點是重合的。當這一降維編碼完畢後,自然而然地,ABCD四個點位的初始數據就被壓縮到了潛空間之中,即一維空間中。在一維空間中,ABCD四個點的數據集只包含一個數字,這個數字描繪了各個點與原點(坐標軸0點)之間的對應位置信息。而在一維空間中的點位再映射回到二維空間時,也就是再解碼回來時,我們就發現了誤差,即壓縮損失傳遞過來的解碼誤差(圖6中B點作為例子,編碼前後以及解碼後的數據都標註出來了)。可以看出,當數據被編碼壓縮或者說降維到潛空間之中時,雖然是有損失的,但是規律性也自然浮現了出來。因為一維空間 dimension 1 的坐標軸本身也代表了ABCD在二維空間中分布的潛在規律。目前我們只是用ABCD四個點來簡化說明,當這樣的數據足夠多時,這個規律性將更能說明普遍問題,更精細地指向趨勢。這也就是用更多的數據樣本來進行訓練的意義。在這個例子中,訓練內容就是讓dimension 1 坐標軸的斜率發生微調,調整到最優的狀態,以使得編碼和解碼後的點和初始點之間的誤差能儘量小,即圖6中虛線的長度儘量短(即最佳線性逼近)。

圖6:image source:towardsdatascience.com

當然,這並不意味著ABCD四個點就一定是現實物理世界中的二維平面上的四個點,而是說,ABCD這四個初始點採樣自現實世界中,每個點可以用一個二維向量來表示,即兩個數值代表的數據集。我們只是在數學模型構建這些點時,可以把他們視在二維坐標系中的點而已。實際上在大自然中要模擬一些複雜自然規律,其採樣的點的數據維度可能會極高,三維、四維、五維...以至於幾百維都有,即用來描述每一個採樣點的數據集中的數字為3個、4個、5個以至於幾百個,我們仍然有辦法可以將他們從高維逐層級地降成一維。

如圖7,三維降維到二維的例子中,此時求一個最佳斜率的問題就變成了求一個最佳平面的問題了。而平面求出來後,就又可以按照之前的方法求最佳一維坐標軸的斜率問題了。只不過此時產生了兩個一維坐標軸。更高維度降維的過程依此類推。在實際運行過程中,我們沒有必要把所有維度都降維到一維,降到幾維最合理,實際上要根據具體的問題來做調整的。

圖7:image source:towardsdatascience.com

當然,理論上來說,如果所有初始數據我們都放棄用直線來擬合,而是儘量找到某一種曲線的公式去擬合,如果計算足夠強大的話,是可以做到極少地壓縮損失的。換言之,就是過擬合。但我們應該記住兩件事。首先,沒有壓縮損失的降維往往伴隨著很大的代價,即潛空間中的數據缺乏可解釋和可總結的結構,即缺乏規律性。其次,降維的最終目的不僅是為了減少數據運算量,更多地是因為通過減少維數,把主要的重要的結構化的信息,從雜質信息中提煉並保留下來,但又不能做得太過分,以至於一些重要信息都被過濾掉了。基於這兩個原因,潛在空間的尺寸和自動編碼器的「深度」(即壓縮程度和質量)必須根據降維的最終目的而進行調整。

圖8很好地解釋了這個維度深淺的意義:

圖8:image source:towardsdatascience.com

圖8用dog、bird、car、plane,四個概念來舉例,好比每一個概念都是N維的數據集。那麼壓縮到二維就足夠了,可以對四個概念進行有效的規律總結和分類操作。但是再多壓縮一層,到一維時,我們就難以對數據規律進行總結了,即四個概念都混為一談了,也就是壓縮失去了太多關鍵信息。所以,「過擬合」和「擬合不到位」都不是好事情,恰如其分地擬合才是我們在訓練模型中所追求的。

AIGC基礎知識

專業名詞解析

Stable Diffusion從入門到精通到實戰

專欄內容簡介

從AIGC的基礎概念介紹開始,以「喂飯級」的語言,逐一詳細介紹 Stable Diffusion WebUI 的各個參數與設置,配合詳細的圖文素材,並用大量實戰案例來解讀 Stable Diffusion 在目前各設計領域中的應用。

通過這個專欄,你會得到

AIGC的基礎概念、紮實的基礎知識;

AIGC圖像設計創作領域目前最重要的陣地——Stable Diffusion 的相關基礎知識、專業術語;

Stable Diffusion WebUI 軟體中每一個參數詳細功能介紹,原理,對應AI生圖的結果;

Stable Diffusion WebUI 的具體使用方法和技巧,各種模型介紹、周邊配套插件與軟體的使用方法和技巧;

Stable Diffusion WebUI 在實際設計產業中的應用、實戰解析;

Stable Diffusion 的提示詞庫、參數庫等;

購買全套課程的學員,享受半年免費 SD-WebUI(高性能GPU)線上使用權限,使用期限內無限出圖、高速出圖。

訂閱須知

《Stable Diffusion從入門到精通到實戰》為圖文/視頻專欄,不少於 20 期,每周五 21:00 點更新;

20 期更新結束後,專欄內容會根據 AIGC 領域的最新動態、Stable Diffusion 的不斷疊代而產生新內容,這些與時俱進的新內容無需額外付費;

添加一對一輔導員,及時收到通知更新內容,一對一解答疑難問題;

本專欄為虛擬內容服務,購買成功後不支持退款,請理解。

加輔導員微信諮詢

了解更詳細課程信息

一對一解答疑難問題

Stable Diffusion WebUI

從入門到精通再到實戰

完全喂飯級,細緻到每一個參數

「設計小白」都能看懂

有設計基礎的朋友更會得到啟發

抓住人工智慧工業革命帶來的新機遇

輔導員微信:cyxq2019

長按上方二維碼圖

在彈出菜單中選擇「打開對方的名片」

加輔導員微信,諮詢課程

文章來源: https://twgreatdaily.com/zh/0ada753bb44e6e573874cf2d8de40cc4.html