會畫畫、會識圖的ChatGPT終於要來了。。。

大半夜的， OpenAI 又整出了個勁爆消息：

DALL·E 3 來了！不僅來了，還會被整合到 ChatGPT 里。

也就是說，除了老生常談的對話、寫代碼、解數學題外，整合了最新 DALL·E 3 的 ChatGPT 這次終於有圖片功能了。

ChatGPT+DALL·E ，這波算是強強聯合，一個是語言大模型里的無冕之王，另外一個也算是文生圖模型里的佼佼者，真正的效果也必然會 1+1>2 。

這次突然官宣算是填了今年年初 GPT-4 剛出來後，被傳的紛紛揚揚的多模態 ChatGPT 的大坑。

不過，現在 OpenAI 還只是公布了這個消息，具體的上線時間是 10 月。面向 Plus 和企業版用戶，單獨的 DALL·E 3 今年秋天也會上線。

這玩意具體有多厲害，雖然現在我們還不能上手，但從 OpenAI 公開的示例來看，還是相當炸裂的。

其中，就有熱心網友直接打來了 Midjourney ，把 DALL·E 3 的示例提示詞喂給了它，好直接斗圖一比高下。

而結果只能說：Midjourney 危了。

首先是很經典的牛油果看病梗圖，提示詞：一個牛油果坐在治療師的椅子上，說著「我感到內心如此空虛」，牛油果中間有一個小坑大小的洞。治療師，勺子，塗鴉筆記。

雖然乍一看是各有千秋，兩種不同的風格。但若再仔細對照下提示詞，很顯然 Midjourney 忽視了治療師，勺子，塗鴉筆記這幾個元素，對話框里的文字也是亂寫一通，不按照要求來。

然後讓他們生成一張關於半透明心臟的圖片，並且要求在心臟下面刻上一行特定的名言。

提示詞：這是一幅用半透明的玻璃製成的人類心臟的插圖，它矗立在狂風暴雨的海洋中的一個基座上。陽光穿透雲層照亮了心靈，揭示了內在的微小宇宙。「發現你內心的宇宙」這句名言被用粗體字刻在基座上。

毫無疑問，這次 DALL·E 3 再次吊打了 Midjourney ， Midjourney 除了沒按照要求刻字外，像狂風暴雨的海洋、內在的微小宇宙等細節是一點也沒展現。

再來一張以荔枝為靈感的球形椅子的照片，細節上，要求有白色凹凸不平的外觀，柔軟的內飾，與背後的熱帶壁紙形成對比。

這把它們倆生成的圖片里各個元素都齊活了，但 Midjourney 似乎還是誤解了熱帶壁紙和熱帶雨林的區別。

當然，誤解提示詞、斷章取義這些都相當于是之前文生圖模型的頑疾了。

像什麼寄居蟹就給生成一個螃蟹。。。

讓它生成 2D 的擬人化森林樂隊結果生成 3D 的。。。

而這些老毛病，照 OpenAI 自己的說法以及給出的示例來看，新的 DALL·E 3 基本上不存在這種情況。

除了解決掉老毛病之外， DALL·E 3 還在原來二代版本上也進行了質感上的升級。

就比如讓它們畫籃球運動員扣籃的場景，元素是星空爆炸。

本來 DALL·E 2 生成的圖已經很符合要求了，沒想到升級後的 DALL·E 3 更加逼真，肌肉線條、宇宙的色彩這些細節都一一展示出來，屬實是降維打擊。

左：DALL·E 2 ，右：DALL·E 3

總體看下來，DALL·E 3 在 ChatGPT 的加持下，語言理解能力直接拉滿，簡直是要贏麻了的節奏。

升級版的 ChatGPT 不僅不會丟失關鍵信息點，就算只是零零星星打了幾個關鍵詞，它也能幫你自動補全描述，然後再讓 DALL·E 3 生成圖片。

OpenAI 這是拿捏住了當代網友「文化沙漠」的本質了（狗頭）。

當然 DALL·E 3 和 ChatGPT 的整合，不止是更能聽懂人話那麼簡單，它們還會產生一些奇妙的火花。

就比如升級版的 ChatGPT 在畫畫上也有了上下文理解能力，甚至可以直接當做生產力工具。

具體有多厲害， OpenAI 官網給出了一段演示視頻，說實話，世超在看了後，也是為插畫師的飯碗狠狠地捏了一把汗。

首先是讓 ChatGPT 生成一個超級向日葵刺蝟，它會給出四張圖，從裡面選一張最喜歡的之後，可以進行下一步的對話。

然後把這個刺蝟命名成 Larry ，可以再讓 ChatGPT 多生成幾張它的照片。

接下來上點難度，直接搞個場景，讓它展示一下 Larry 的家。

這把可以直接看出 DALL·E 3+ChatGPT 的實力了，不僅 Larry 的樣貌還保持原樣（這換其他 AI 可能早變樣了），而且門口的郵箱還寫著「LARRY」的名字。

此外，描述 Larry 的特點、用圖片展示它的愛心、甚至做做 Larry 的周邊，設計出幾個貼紙，對於 ChatGPT 來說都是洒洒水的事。

最後讓它整理個睡前故事，來個 ending pose ， ChatGPT 也是信手拈來， u1s1 我真的有點被這絲滑的對話震撼到。。。

看到這裡，世超還突然得了新的靈感，之後我們寫好的文章豈不是就可以直接丟給 ChatGPT ，讓它提取關鍵詞做封面。

有啥特殊要求也可以直接告訴 ChatGPT ，參考圖啥的也可以扔給它，摸魚技巧 +1+1 。。。

言歸正傳，上面提到的那些還只是 OpenAI 單方面展示出來的效果，實際用起來怎麼樣，還是得等到 10 月份上線之後才能知道，估計到時候有會有一波隱藏技巧被網友們開發出來，坐等。

另外，談到 AI 繪畫，就還是躲不過那個老生常談的話題：版權問題。

OpenAI 這邊依舊還是之前的立場，和第二版一樣，用 DALL·E 3 生成的圖片不需要經過許可就能用，想商業化都行。

不過，有了太多的前車之鑑， OpenAI 這次耍了點小聰明，說是藝術家可以選擇拒絕自己的作品被投喂給 DALL·E ，前提是只要填一個表格就 OK 了。

雖然這多少有點「不拒絕就是默許」的意味，但相較於之前，起碼藝術家們不再那麼被動了。。。

對於之前網絡出現的 AI 繪畫侵犯公眾人物隱私，以及一些其他偏見的問題， DALL·E 也有對策了：在實際使用的過程中， ChatGPT 會直接拒絕提示中帶有公眾人物名字的請求。

也就是，像這種樂子圖我們估計也不會在 ChatGPT 中看到了。。。

並且他們還組建了一個「紅色團隊」，用來評估和降低模型在各個階段可能會產生的風險。

最後， OpenAI 還在官網上表示說，它們在研究一個識別 AI 畫圖的工具，能夠判斷哪些圖片是 DALL·E 3 生成的。

（只希望不要像之前那個識別 AI 文本的工具，因為雞肋半路夭折。。。

總的來說，有文生圖功能的 ChatGPT 就已經足夠在 AI 圈子裡掀起一陣熱度，而這波又是整合的升級版 DALL·E 3 ，很難不讓人振奮，反正世超已經是等不及想上手試試了。

但有人歡喜有人憂， OpenAI 這波是再次甩了同行一大截，等到 10 月更新之後，估計又有不少 AI 初創公司被碾壓在 ChatGPT 前進的車輪下。。。

撰文：松鼠編輯：江江&面線封面：三狗

圖片、資料來源：

OpenAI、X、網絡

會畫畫、會識圖的ChatGPT終於要來了。。。

體驗完售價2799的一加平板，我發現它用起來還挺香。

用上6100mAh超大電池的一加，殺死了今年的續航比賽。

從月球帶點土特產回來，到底有多難？

參加華為開發者大會後，我感覺他們把系統玩明白了。。。

在填志願前，我建議你先百度下這個詞。

花了6年，馬斯克終於討回了4000億的工資。

蘋果的AI終於掏出來了，但說實話一點也不炸裂。

英偉達表示要向蘋果看齊，他自己說的。

吉利硬懟BYD油耗數據，這2.9升油耗到底是不是仙界科技？

風評血崩的鳴潮，還能成為原神殺手嗎？

想成為「郭有才」的人離開菏澤南站，整個中國都安靜了。

你打折、我免費，怎麼AI圈突然打價格戰了。。。

都說谷歌被OpenAI狙擊了，我怎麼覺得它在狙蘋果。。。

樂道的新車只要21.99萬，這回蔚來也盯上特斯拉了。

上手了刷屏一天的GPT-4o，我感覺目前也就那樣。。。

6499起的「滅霸」，能夠成為今年拍照最強的手機嗎？

余承東不當CEO了，汽車圈可能少了位高管網紅。

這次的「副總短視頻」背後，其實還有個很深的套路。

比亞迪也來賣車險了，它能把保險價格打下來嗎？

美國又對華為下手，這次不讓華為用英特爾和高通晶片了。。。

不是我給小米洗地，剎車生鏽跟質量是真沒關係。。。

相當罕見！蘋果今晚給iPad更新了波大的。

馬斯克快把太空搶完了，我們自己的商業火箭咋樣了？

80家4S店一夜倒閉，結果竟然有車企進去搶車。。。