在圖像領域,AI工具和人類手作的邊界已經逐漸模糊

2022-07-27     VRPinea

原標題:在圖像領域,AI工具和人類手作的邊界已經逐漸模糊

(VRPinea 7月27日訊)你能分辨出一張圖是由人工智慧圖像工具生成的還是人類製作的嗎?許多人可能會說這很容易,直到AI圖像工具DALL-E 2的出現,這打破了人類對人工智慧生成圖像的刻板印象,其以強大且逼真的圖像生成功能火爆了創作圈,此工具生成的圖像與人類生成的圖像別無二致。最後值得大家思考的是,這種AI生成圖像工具的出現對設計師的工作有什麼影響呢?

AI生成圖像工具和人類藝術

為了測試人們是否仍可以區分人類和AI生成的圖像,同時也引起了人們對DALL-E 2的關注,Stripe產品經理和AI愛好者Sahar Mor合作推出了網站thisimagedoesnotexist.com,該網站的靈感來自經典的AI假冒網站thispersondoesnotexist.com,網站開發者收集了數百張由DALL-E 2生成的圖像以及由人類創建的圖像,並附帶了一個簡單的投票程序:圖像是來自DALL-E 2還是來自人類?

DALL-E 2的主要功能

DALL-E 2是OpenAI開發的一種新型的人工智慧系統,用diffusion生成模型來實現圖像生成。該工具主要有三個功能:根據自然語言的描述創建逼真的圖像,更改圖像中的細節,生成相似圖像。

文本控制圖像生成

首先,DALL-E 2最強大也最受歡迎的功能就是通過分析文本生成圖像,用戶可以通過輸入和選擇關鍵字來生成相關的圖像。接下來小P想展示一些具體的例子。此功能的特點是只需要用戶輸入簡短的文字,工具就能識別到重點要素生成各種圖片。

當小P選擇了「太空人」、「與貓在太空打籃球」、「水彩風格」三個關鍵詞之後,DALL-E 2會生成相關的圖像。小夥伴們也可以去DALL-E 2的官網體驗一下通過選擇關鍵詞來生成圖片。

當用戶輸入「吼叫的猴」(howler monkey)時,這是DALL-E 2生成的圖像:

生成相似圖像

其次,DALLE.2工具還可以根據用戶上傳的圖像,以其為靈感自動創作出多張不同的圖片。藉助CLIP編碼然後使用擴散模型解碼輸入圖像的元素,在保留主要的元素之後改變其位置或風格,達到二次創作。此功能的特點是不需要費盡心思去想文字描述,同時也能得到有針對性的新圖像。接下來,小P想給各位展示一些有趣的例子。

由此可見,DALLE.2的畫風指定性強,其在寫實畫風、數字藝術、抽象等風格界定明確,且對於人物的造型感表現強烈。

編輯現有圖像

DALL·E 2還包含了其他的新功能,比如編輯現有圖像。舉個具體的例子,用戶可以圈中圖中的狗狗,輸入「可愛的小貓」,圖片立馬變成了一隻可愛的小貓坐在沙發上。除此之外,此功能後還能自動識別陰影、紋理等屬性,在此基礎上添加和刪除元素。

DALL-E2是否會對設計師的工作產生威脅?

大概了解了DALL-E 2的功能之後,可能會有小夥伴提出問題:DALL-E2是否會對設計師的工作產生威脅?小P在這裡分享一下自己的看法,DALL-E 2能在短時間內快速且高效地生成大量的圖片,為我們展示了更多的藝術創造的可能性。

但需要明確的是,這類AI作品在很長一段時間內不會完全取代人類的創作,僅會成為提高人們的工作效率。創作者可以通過搜索關鍵詞得到AI生成的圖片,但系統無法滿足創作者所有的要求。例如Rachel Metz就曾在Twitter上發布了一些DALL-E 2的翻車現場,Metz輸入「四個跳舞的企鵝」,但是DALL-E 2生成的圖片並不是四隻企鵝,對此Metz表示此工具擅長生成企鵝,但不擅長數數。

DALL-E 展示了富有想像力的人類和聰明的系統如何協同工作來創造新事物,從而放大我們的創造潛力。DALL-E生成的圖片大多數只是創作的靈感,但不能成為最終產品。我們應該正確地認識和使用AI工具,這類針對不同需求及生產結果所開展的AI研究將會越來越多的出現在我們的生活中,對我們的生活產生啟發以及新的預示。

本文屬VRPinea原創稿件,轉載請洽:[email protected]

文章來源: https://twgreatdaily.com/zh-mo/d22517f5fb9325126fb44c50df0ab11d.html