AMD顯卡也能「煉丹」?實戰DirectML加速AI繪圖

2023-11-20     三易生活

原標題:AMD顯卡也能「煉丹」?實戰DirectML加速AI繪圖

【【【前言:AMD顯卡也能吃上AI繪圖的紅利嗎】】】

眾所周知,隨著AIGC相關技術最近這一兩年快速成熟,也使得AI繪圖早已經不再僅僅是部分PC發燒友或AI愛好者的「玩具」。

例如在一些遊戲里,現在已經可以看到AI繪製的角色或是AI設計的服裝,它們正在變得越來越精緻,同時也受到了許多玩家的好評。此外在一些工業產品上,「由AI參與設計」也成為了最新的營銷噱頭。與人類設計師相比,AI的「思路」有時會顯得格外天馬行空,為產品注入顯眼的亮點。

除此之外,在電商、外貿等領域,通過AI來繪製產品宣傳圖也成為了時下最新的熱門話題。由於與人類畫師相比,AI圖像生成程序「任勞任怨」,還支持反覆不斷地修改方案,因此在綜合成本上也有著顯著的優勢。

話雖如此,但只要用過AI繪圖工具的朋友可能都知道,以Stable Diffusion為代表的繪圖工具在易用性方面,普遍還存在著一些短板。其中最為突出的一點,就在於它們之中的很多版本,依賴的都是特定品牌顯卡的特定私有AI體系。如此一來,這就導致相關顯卡遭遇了一波又一波的炒作,不僅價格居高不下,甚至最近還出現了疑似部分型號遭遇禁售的傳言。

說實在的,這些對於大型企業、設計工作室來說都不是什麼問題,因為他們完全消費得起更專業、同時也更昂貴的AI加速卡,而且也熟稔Linux系統下更高效的種種AI繪圖工具。

但如果是一般的個人用戶呢,或者是對於諸如網店店主、小型遊戲開發者這類,對於AI繪圖有需求,但財力又相對有限的用戶來說,難道就真的沒有辦法以更低的價格和技術門檻,來吃上這一輪「AI」紅利了嗎?

【【【幸好微軟和AMD聯手,給出了解決方案】】】

辦法當然是有的,就以大家熟悉的Stable Diffusion來說,它本身就具備Windows客戶端版本,因此並不需要非得使用Linux或者更專業的作業系統。

其次,此前主流Stable Diffusion版本所使用的Pytorch指令,對於AMD GPU「天生」缺乏優化,這是造成A卡運行AI繪圖效果不佳的最核心原因。但現在藉助Microsoft Olive工具,Pytorch指令會被實時轉換為ONNX,然後便可以通過AMD GPU自帶的DirectML加速功能進行加速,大幅提升「AI繪圖」的效率。

在此基礎上,自今年7月底更新的驅動版本(23.7.2)之後,如今AMD GPU已經實現了對Microsoft Olive的原生支持。因此如今只需要在Windows系統下,配置一套啟用了Microsft Olive、支持DirectML加速的Stable Diffusion,就可以很簡單地享受到由A卡帶來的AI繪圖體驗,再沒有過多的成本和技術門檻了。

【【【測試平台:銳龍9+高頻內存,三款顯卡同時參測】】】

前面說了這麼多,那麼A卡+Windows系統如今在Stable Diffusion的AI繪圖場景下,性能表現到底如何呢?

為了探究這個問題,我們三易生活基於一套由銳龍9-7950X處理器,搭配32GB DDR5-6400內存,並使用最新版Windows 11專業工作站版的測試平台。

需要注意的是,AMD的銳龍7000系列平台在剛上市那陣子,對於超過6000MHz的DDR5內存兼容性並不太好,直到前段時間通過BIOS更新,才「解鎖」了明顯好得多的內存兼容性。所以如果也想與我們一樣,在如今的AMD平台上使用高頻DDR5內存,建議先將主板BIOS更新到最新版本才更為穩妥。

在測試顯卡方面,為了更廣泛地覆蓋儘可能多的用戶群體,我們選擇了三款,分別是Radeon RX 7900XTX、RX 7900XT和RX 7700XT。

其中,RX7900XTX我們此次使用了不僅具備完整的96 CU單元、192 AI加速器和24GB顯存配置,同時默認頻率也比公版更高、達到了2565MHz的版本。

相比之下,RX7900XT和RX7700XT我們使用的也是具備出廠超頻設計,並配備了比公版方案體量大得多的三風扇+多熱管散熱設計的版本。其中尤其是兩款7900系列顯卡的三槽散熱器設計,無論拿在手裡的「分量」、還是裝在機箱裡的視覺效果,也都相當驚人。

當然,從經驗來說,短期內的AI繪圖並不會對顯卡造成像遊戲那麼大的性能壓力,但誰又不希望自家顯卡可以在「煉丹」時更安靜、更涼快一點呢?

【【【測試結果:DirectML顯神威,A卡「煉丹」大加速】】】

值得一提的是,就在我們進行測試的這段時間,原版Stable Diffusion使用時所需訪問的大模型網站正好陷入長期的連接困難之中,這確實一度給測試帶來了不小的困擾。

好在經過一番摸索後我們發現,其實現在國內已經有愛好者製作出了更加本地化,配置起來也更容易的Stable Diffusion WebUI方案。而且其同樣擁有DirectML版本,可以使用AMD顯卡進行AI加速。

針對此次繪圖測試,我們使用了以下參數:

生成關鍵詞:

dynamic pose, dynamic angle,(masterpiece:1. 4, best quality), unity 8k wallpaper, ultra detailed, beautiful and aesthetic, perfect lighting,detailed background, realistic

去除關鍵詞:

EasyNegative,nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, bad feet, text,logo

解析度設置:512×512

採樣步進:20

提示詞引導係數:7

生成數量:15-1,1-1

RX7700XT生成15張圖片,總用時115.8秒、平均每張圖片耗時7.72秒

RX7900XT 生成15張圖片,總用時77.8秒、平均每張圖片耗時5.19秒

RX7900XTX 生成15張圖片,總用時67.7秒、平均每張圖片耗時4.51秒

可以看出,一方面有了DirectML加速途徑,如今AMD顯卡在AI繪圖的效能上已經不低。尤其是對於RX7900系列顯卡來說,大顯存加上更多的AI單元加持,使得其明顯具備更高的生成速度。

根據上面的測試結果我們將三款顯卡的平均每張圖片耗時成績匯總成了上面這張柱狀圖,可以看到RX7900XTX雖然有著明顯更快的速度,但相較之下,RX7900XT與其僅15%的性能差異,顯然沒有價格方面那麼明顯。對於要求沒有那麼高的朋友來說,即便是與RX7900XTX在性能方面有著71.2%差距的RX7700XT,兩者近一倍的價格差,無疑也使得RX7700XT有著不錯的性價比。

針對這一點,我們也出於好奇心進行了一次連續生成100張圖片的追加測試。可以看到,RX7900XTX應對自如,僅用時450.8秒就完成了全部任務,平均每張圖片的生成速度完全沒有變慢,依然維持在4.51秒一張的效率上。

【【【總結:AI繪圖現在已經有了更具性價比的選擇】】】

說實在的,由於過去很長一段時間生成式AI繪圖工具對於AMD顯卡的支持力度確實不算太好,這造成了大量有需求的用戶不得不額外去購買昂貴顯卡的局面,客觀上給消費者帶來了更多的開銷,也在一定程度上阻礙了生成式AI繪圖本身的技術發展速度。

好在隨著AMD和微軟聯合優化的Microsoft Olive工具,以及由此衍生的DirectML版本Stable Diffusion發行版誕生,A卡用戶們終於不需要再羨慕他人的「煉丹」效率,也不再需要配置繁瑣的Linux和RCOM環境,直接就能在Windows系統下像其他顯卡一樣,方便地使用AI繪圖工具了。

很顯然,無論是對於喜歡「折騰」的技術愛好者,還是對有這方面需求的商業用戶來說,這都意味著「AI繪圖」背後的硬體性價比的再次攀升。其中特別是對於「AI繪圖」有著強烈需求的商業用戶來說,新的繪圖工具就意味著部署的硬體和軟體成本都大幅降低,這也將進一步解放「AI繪圖」在實際商用場景中的可能性。

比如電商運營者現在便不再需要依賴畫師、廣告公司,來進行產品宣傳所需的美術設計,而是可以嘗試基於AI技術來生成產品宣傳圖。這不僅能夠大幅節約成本和時間,而且即便對效果不滿意,也可以無限次重來,直到獲得合適的設計為止。毫無疑問,這將會大幅促進電商行業的降本增效,並為生成式AI技術的發展注入了更多的現實需求動力。

與此同時,隨著「A卡煉丹」效率的解封,相信這也將促進生成式AI繪圖技術迎來更好、更快的發展。

當然從另外一個角度來說,它會不會因此使得顯卡的價格因此變得更加合理一些呢?

文章來源: https://twgreatdaily.com/zh/7bd01b5e047f93b2a3c0b9e2351d545e.html