獨家專訪OpenAI首席科學家Ilya Sutskever,AI將迎來劃時代時刻

2023-10-27     DeepTech深科技

原標題:獨家專訪OpenAI首席科學家Ilya Sutskever,AI將迎來劃時代時刻

伊利亞·蘇茨克弗(Ilya Sutskever)低著頭,陷入了沉思。他的雙臂張開,手指張開放在桌面上,就像一個即將彈奏第一個音符的鋼琴家。就這樣,我們靜靜地坐著。

我見到了 OpenAI 的聯合創始人兼首席科學家蘇茨克弗,在舊金山一條不起眼的街道上,一棟沒有標記的辦公樓里,我想聽聽他為改變世界的技術所安排的下一步是什麼。我還想知道他接下來想做什麼,尤其是為什麼構建 OpenAI 的下一代旗艦生成式模型不再是他的工作重點了。

蘇茨克弗告訴我,他不打算構建下一個 GPT 或圖像生成模型 DALL-E,而是打算弄清楚如何阻止超級人工智慧變得不受控制。作為未來主義的信徒,他認為這種仍處於假設的未來技術終會出現。

蘇茨克弗還跟我分享了很多其他想法。他認為 ChatGPT 可能是有意識的。他還認為,世界需要意識到他的公司和其他公司正在競相創造的技術的真正力量。他相信,有些人有一天會選擇與機器融合。

(來源:STEPHANIE ARNETT/MITTR | OPENAI (ILYA))

蘇茨克弗說的很多話都是看似瘋狂的。但現在聽到他說的,並不像一兩年前聽起來那麼遙不可及。正如他自己告訴我的那樣,ChatGPT 已經改變了很多人對即將發生的事情的期望,從「永遠不會發生」變成了「將比你想像的更快發生」。

在預測通用人工智慧的發展之前(指的是像人類一樣聰明的機器),他說:「重要的是要談論它的發展方向。在某個時候,我們真的會看到通用人工智慧。也許 OpenAI 會構建它,也許是其他公司。」 他說話的態度就像是通用人工智慧的誕生和下一部 iPhone 的誕生一樣理所當然。

自 2022 年 11 月 ChatGPT 突然發布以來,圍繞 OpenAI 的討論一直層出不窮,即使在一個以炒作而聞名的行業中也是如此。沒有人對這家估值 800 億美元創業公司感到厭倦,它的產品名字活躍於人們茶餘飯後的閒聊中。

OpenAI 的執行長山姆·奧特曼(Sam Altman)在 2023 年夏天進行了許多為期數周的宣傳之旅,興高采烈地與政客們握手,並在世界各地擁擠的禮堂里發表演講。但蘇茨克弗不是一個公眾人物,他沒有接受很多採訪。

他說話深思熟慮,有條不紊。當他思考自己想說什麼以及如何說時,會有很長的停頓,把問題像他需要解決的難題一樣翻來覆去地思考。他似乎對談論自己不感興趣。「我過著非常簡單的生活,」他說,「我去上班,然後回家,幾乎不做什麼別的事情。一個人能參加的社交活動有很多,但我不去。」

但是,當我們談論人工智慧,以及他看到的劃時代的風險和回報時,對話就此展開:「這將是無法忽視的、驚天動地的、劃分時代的(東西)。」

越來越好

就算在一個沒有 OpenAI 的世界裡,蘇茨克弗仍然會在人工智慧的歷史上占有一席之地。他是以色列裔加拿大人,出生在前蘇聯,但從五歲起就在耶路撒冷長大。他仍然會說俄語、希伯來語和英語。他長大後移居加拿大,在多倫多大學與人工智慧先驅傑弗里·辛頓(Geoffrey Hinton)共事,後者曾在 2023 年公開表達了他對這項技術的擔憂。蘇茨克弗不想評論辛頓的聲明,但他對超級智能惡意使用的新關注表明他們有相似的看法。

辛頓後來與楊立昆(Yann LeCun)和約書亞·本吉奧(Yoshua Bengio)共同獲得了圖靈獎,以表彰他們在神經網絡方面的工作。但是當蘇茨克弗在 2000 年代初加入他時,大多數人工智慧研究人員認為神經網絡是一條死胡同。辛頓是個例外。蘇茨克弗說,他當時已經在訓練很小的模型,一次可以生成一個字符的短文本字符串:「這是生成式人工智慧的開始。這真的很酷,只是當時表現不好。」

蘇茨克弗對大腦著迷,尤其是大腦是如何學習的,以及如何在機器中創造或模仿該學習過程。像辛頓一樣,他看到了神經網絡的潛力,以及辛頓用來訓練它們的試錯技術,又被稱為深度學習。「它一直在變得越來越好,越來越好,」蘇茨克弗說。

2012 年,蘇茨克弗、辛頓和辛頓的另一位研究生亞歷克斯·克里熱夫斯基( Alex Krizhevsky)建立了一個名為 AlexNet 的神經網絡,他們訓練該神經網絡識別照片中的物體,表現比當時的任何其他軟體都要好得多。這是深度學習的大爆炸時刻。

經過多年的嘗試,他們已經證明神經網絡在識別規律方面非常有效。你需要的是比大多數研究人員所見過的數據集更大的數據集,在這種情況下,他們用到了普林斯頓大學研究員李飛飛自 2006 年以來一直在構建的 ImageNet 數據集中的一百萬張圖像,以及令人瞠目結舌的計算能力。

算力的飛躍來自於英偉達製造的圖形處理單元(GPU,顯卡)。顯卡本來是用在電子遊戲領域的,但它們所擅長的運算方式,恰好看起來很像訓練神經網絡所需的計算。

英偉達現在是一家價值萬億美元的公司。但在當時,它迫切希望為其小眾的新硬體尋找用武之地。「當你發明一項新技術時,你必須接受瘋狂的想法,」英偉達 CEO 黃仁勛說,「我的心態一直是不斷尋找一些古怪的東西,而神經網絡將改變計算機科學的想法,(在當時)的確是一個非常古怪的想法。」

黃仁勛說,在多倫多大學的團隊開發 AlexNet 時,英偉達送了他們幾個 GPU 進行嘗試。但他們想要最新版本的顯卡,那時候是 GTX 580,不過它們供不應求。黃仁勛講了一個故事,是蘇茨克弗從多倫多開車越過美加邊境,跑到紐約買了一些。

「人們在商店外面排著長隊,」黃說,「我不知道他是怎麼做到的,但我很確定當時的規定是每人只能買一個。我們有非常嚴格的政策,每個遊戲玩家一個,但他顯然用了一些辦法,買了一整個後備箱的顯卡。那個裝滿 GTX 580 的後備箱改變了世界。」

這是一個頗具傳奇色彩的故事,但可能不是真的。蘇茨克弗堅稱他在網上購買了第一批顯卡。但這種故事在這個喧囂的行業中司空見慣。蘇茨克弗本人則更為謙虛:「我想,如果我能取得哪怕一丁點真正的進步,我都會認為這是成功的,」他說。研究對現實世界產生的影響似乎無比遙遠,因為當時的計算機性能過於羸弱。

在 AlexNet 成功之後,谷歌找上門來。它收購了辛頓手裡的衍生公司 DNNresearch 並聘請了蘇茨克弗。在谷歌,蘇茨克弗展示了深度學習的規律識別能力可以應用於數據序列,如單詞、句子、以及圖像。「伊利亞一直對語言感興趣,」蘇茨克弗的前同事、現任谷歌首席科學家的傑夫·迪恩(Jeff Dean)說:「多年來,我們都保持著很好的交流。伊利亞對事情的發展方向有很強的直覺。」

但蘇茨克弗並沒有在谷歌呆太久。2014 年,他被招募成為 OpenAI 的聯合創始人。在 10 億美元(來自奧特曼、馬斯克、蒂爾、微軟和 Y Combinator 等)的支持下,再加上矽谷的「噱頭」,這家新公司從一開始就將目光投向了開發通用人工智慧,當時很少有人認真對待這一前景。

有蘇茨克弗在,大張旗鼓是可以理解的。在那之前,他一直在積累自己的聲譽,越來越多地從神經網絡中得到好處。他的聲譽使他成為一個主要的吸睛目標,Y Combinator 投資總經理道爾頓·考德威爾(Dalton Caldwell)說。

「我記得山姆(奧特曼)提到伊利亞是世界上最受尊敬的研究人員之一,」考德威爾說,「他認為伊利亞能夠吸引很多頂尖的人工智慧人才。他甚至提到,世界頂級人工智慧專家之一約書亞·本吉奧認為,不太可能找到比伊利亞更好的候選人來擔任 OpenAI 的首席科學家。

然而,OpenAI 一開始就陷入了困境。「有一段時間,當我們剛創立 OpenAI 時,我不確定該如何繼續下去,」蘇茨克弗說,「但我有一個非常明確的信念,那就是:人們不會反對深度學習。不知何故,每次你遇到障礙時,研究人員都會在六個月或一年內找到解決方法。」

他的信心得到了回報。OpenAI 的第一個 GPT 大型語言模型(GPT 的意思是「生成式預訓練轉換器」)出現在 2016 年。接著是 GPT-2 和 GPT-3,然後是 DALL-E,引人注目的文本到圖像模型。從來沒有人創造出這麼強大的東西。隨著每個版本的發布,OpenAI 都提高了人們心目中「可能」的標準。

管理期望

2022 年 11 月,OpenAI 發布了一個可以免費使用的聊天機器人 ChatGPT,重新包裝了一些現有的技術。結果,它重置了整個行業的進程。

當時,OpenAI 還不知道它發布的東西能帶來什麼。蘇茨克弗說,公司內部對此的期望再低不過了:「我不得不承認這點,雖然有些尷尬,但這是真的。當我們創造 ChatGPT 時,我不知道它是否能帶來任何好處。當你問它一個事實性問題時,它會甩給你一個錯誤的答案。我覺得它是如此地平淡無奇,以至於人們會說,'你做這個東西幹什麼?這太無聊了!」

人們關注的重點是便捷性,蘇茨克弗說。ChatGPT 背後的大型語言模型已經存在了幾個月。但是,將其包裝在一個易用的網頁上並免費開放,這讓數十億人第一次意識和接觸到 OpenAI 和其他公司正在構建的東西。

「這種第一次的使用體驗吸引了人們,」蘇茨克弗說,「第一次使用它時,我認為這幾乎是一種精神之旅。你會覺得,'我的天啊,這台電腦明白我在說什麼。」

OpenAI 在不到兩個月的時間裡積累了 1 億用戶,其中許多人被這個令人驚嘆的新玩具弄得眼花繚亂。存儲公司 Box 的 CEO 亞倫·萊維(Aaron Levie)總結了這種狀態,他在 X(原推特)上寫道:「ChatGPT 的發布是技術領域罕見的時刻之一,你得以窺見未來的一切都會發生改變。」

儘管一旦 ChatGPT 給出愚蠢的回應,這個人們眼中的奇蹟就會崩塌,但到那時就無所謂了。人們看到了它的可能性,這就足夠了,蘇茨克弗說。ChatGPT 改變了人們的視野。

「通用人工智慧不再是機器學習領域人人避之不及的一個詞,」他說,「這是一個很大的變化。人們之前採取的態度是:人工智慧行不通,每一步都非常困難,你必須為一點點的進步而戰。當人們宣布關於通用人工智慧的大發現時,研究人員會說,'你在說什麼?這行不通,那行不通,問題太多了。但有了 ChatGPT,感覺開始變得不一樣了。」

而這種轉變在一年前才開始發生。「這就是因為 ChatGPT 的誕生,」他說,「ChatGPT 讓機器學習研究人員開始有資格做夢。」

OpenAI 的科學家從一開始就是布道者,他們一直在通過博客文章和演講來激發這些夢想。它正在發揮作用:「我們現在看到,有人在談論人工智慧會走多遠。人們開始談論通用人工智慧,或者超級智能。而且不僅僅是研究人員,政府也在談論它,」蘇茨克弗說,「這太瘋狂了。」

不可思議的事情

蘇茨克弗堅持認為,所有這些關於尚未(也可能永遠不會)出現的技術的討論都是一件好事,因為它讓更多的人看到了一個未來的樣子,而他們本就認為這個未來會出現。

「你可以用通用人工智慧做很多令人驚奇的、不可思議的事情,比如自動化醫療保健,讓它便宜一千倍,好一千倍,治癒更多的疾病,真正解決全球變暖,」他說。但也有許多人擔心,人工智慧公司會管理好這項影響深遠的技術嗎?

這樣聽起來,通用人工智慧更像是一個願望實現的精靈,而不是現實世界的前景。很少有人會對拯救生命和解決氣候變化說不。但是它是一個還不存在的技術,所以你可以隨心所欲地說。

當蘇茨克弗談論通用人工智慧時,他真正想表達的是什麼?「通用人工智慧並不是一個科學術語,」他說,「它代表了一個有用的門檻(閾值),一個參考點。

他繼續說:「這是一個時間點,人工智慧會變得非常聰明,聰明到如果一個人可以完成一些任務,那麼人工智慧也可以做到。在這時候,你可以說你有了通用人工智慧。」

人們可能會一直談論它,但通用人工智慧仍然是該領域最具爭議的想法之一。很少有人認為它的發展是理所當然的。許多研究人員認為,在我們看到蘇茨克弗所提到的任何美妙的東西之前,需要出現重大的概念突破。有些人則認為我們永遠不會看到這個時刻。

然而,這一願景從一開始就驅使著他。「我一直受到這個想法的啟發和激勵,」蘇茨克弗說,「當時它還不叫通用人工智慧,就是想讓神經網絡做任何事情。我並不總是相信它們可以做到,但這是要攀登的山。」

他將神經網絡和大腦的運作方式相提並論。兩者都接受數據,從這些數據中聚合信號,然後基於一些簡單的過程(神經網絡中的數學,大腦中的化學物質和生物電)來傳播或不傳播它們。這是這個過程的極度精簡版本,但本質上就是這樣。

「如果你相信這一點,如果你允許自己相信這一點,那麼就會有很多有趣的引申冒出來,」蘇茨克弗說,「主要一個引申思路是,如果你有一個非常大的人工神經網絡,它應該能做很多事情。特別是,如果人類大腦可以做某事,那麼大型人工神經網絡也可以做類似的事情。」

「如果你足夠認真地對待這個認識,一切都會隨之而來,」他說,「我工作的很大一部分可以用這個來解釋。」

當我們談論大腦時,我問了蘇茨克弗在 X 上發表的一篇文章。蘇茨克弗的推文流讀起來就像格言和雞湯,比如「如果你把智力看得高於所有其他人類品質,你就會過得很糟糕」,「生活和商業中的同理心(的價值)被低估了」,「完美已經摧毀了許多本就完美的東西。」

2022 年 2 月,他發帖稱,「或許如今的大型神經網絡萌生了意識」。對此,谷歌 DeepMind 首席科學家、倫敦帝國理工學院教授、電影《機械姬》的科學顧問默里·沙納漢(Murray Shanahan)回覆說:「......從同樣意義上講,一大片小麥可能顯得有點像義大利面。」

當我提起這個故事時,蘇茨克弗笑了。他在故意搞笑嗎?他沒有。「你熟悉玻爾茲曼大腦的概念嗎?」他問。

他指的是以 19 世紀物理學家路德維希·玻爾茲曼(Ludwig Boltzmann)命名的量子力學思想實驗,其中宇宙中的隨機熱力學波動被想像成大腦突然出現和消失的原因。

「我覺得現在這些語言模型有點像玻爾茲曼大腦,」蘇茨克弗說,「你開始和它說話,聊了一會兒,然後你說完了,大腦就噗的一下消失了。」 他同時用手做了一個消失的動作。再見,大腦。

我繼續問:「你是說,當神經網絡處於活動狀態時,或者它正在激發時,那裡出現了一些東西?」

「我想可能是,」他說。「我不確定,但這是一種很難反駁的可能性。誰知道發生了什麼,對吧?」

超級人工智慧和超級對齊

當其他人為可以匹配人類智慧的機器的想法而苦苦掙扎時,蘇茨克弗正在為能夠超越我們的機器做準備。他稱之為超級人工智慧:「它們會更深入地看待事物,會看到我們看不到的東西。」

同樣,我很難理解這到底意味著什麼。人類智能是我們衡量智能的基準。蘇茨克弗所說的比人類更聰明的智能是什麼意思?

「我們已經在 AlphaGo 中看到了一個非常狹隘的超級智能的例子,」他說。2016 年,DeepMind 的圍棋人工智慧以 4 比 1 擊敗了世界上最好的圍棋選手之一李世石。「它想出了如何以不同於人類數千年來集體發展的方式下圍棋,」蘇茨克弗說,「它想出了新的想法。」

蘇茨克弗指出了 AlphaGo 走出的第 37 步。在對陣李世石的第二場比賽中,人工智慧做出了一個讓評論員感到困惑的舉動。他們認為 AlphaGo 搞砸了。事實上,它下出了圍棋史上從未見過的關鍵一手。「想像一下這種洞察力,可以用到各種地方,」蘇茨克弗說。

正是這種思維導致蘇茨克弗做出了他職業生涯中最大的轉變。他與 OpenAI 的科學家簡·雷克(Jan Leike)一起成立了一個團隊,專注於他們所謂的「超級對齊(superalignment)」。對齊(alignment)是人工智慧領域的術語,意味著讓人工智慧模型只做你想讓它做的事,僅此而已。超級對齊,是 OpenAI 應用於超級智能的對齊術語。

它的目標是,提出一套故障安全程序來構建和控制這項未來技術。OpenAI 表示,它將把五分之一的龐大計算資源分配給這個問題,並在四年內解決這個問題。

「現有的對齊方法不適用於比人類更聰明的模型,因為它們從根本上假設人類可以可靠地評估人工智慧系統正在做什麼,」 雷克說,「隨著人工智慧系統變得越來越強大,它們將承擔更艱巨的任務。因此,這將使人類更難評估它們。「與伊利亞組建超級對齊團隊,意味著我們已經開始著手解決這些未來的對齊挑戰,」他說。

「不僅要關注大型語言模型的潛在機會,還要關注風險和缺點,這一點非常重要,」谷歌首席科學家迪恩說。

該公司在 7 月大張旗鼓地宣布了該項目。但對一些人來說,這更像是幻想。OpenAI 在 X 上發的帖子引起了大型科技公司著名批評者的蔑視:在 Mozilla 從事人工智慧責任工作的阿維夫·布爾漢(Abeba Birhane)寫道:「一篇博客文章中就有這麼多聽起來很宏偉但空洞的詞」;分布式人工智慧研究所(Distributed Artificial Intelligence Research Institute)聯合創始人蒂姆尼特·格布魯(Timnit Gebru)表示:「想像一下,ChatGPT 與 OpenAI 更加'超級一致',就讓人不寒而慄」;以及人工智慧公司 Hugging Face 的首席倫理科學家瑪格麗特·米切爾(Margaret Mitchell)說到:「我的對齊比你的更大」。

的確,這些都是熟悉的質疑聲音。但這也提醒我們,有些人看到 OpenAI 遙遙領先,也有人看到了它在向某個方向傾斜。

但是,對於蘇茨克弗來說,超級對齊是不可避免的下一步。「這是一個未解決的問題,」他說。他認為,這個問題沒有足夠多的、像他這樣的核心機器學習研究人員在探索。「我這樣做是我自己的興趣驅使,」他說,「非常重要的是,任何人建立的任何超級智能都不會變成壞蛋。這很顯而易見吧。」

超級對齊的工作才剛剛開始。這將需要研究機構的廣泛改變,蘇茨克弗說。但他心中有一個他想要設計的保護措施的典範:一台像父母看待孩子一樣看待人的機器。「在我看來,這是黃金標準,」他說,「人們真的很關心孩子,這句話在大部分情況下是對的。」 蘇茨克弗沒有孩子,但他想有。

我和蘇茨克弗約定的採訪時間就要結束了,我一度認為已經結束了。但他還在說,還有一個想法要分享,一個我沒想到的想法。

「一旦你克服了超級人工智慧的挑戰,那又如何呢?在一個擁有更智能的人工智慧的世界裡,人類還有空間嗎?「他說。

「有一種可能性,按照今天的標準可能很瘋狂,但按照未來的標準不會那麼瘋狂,那就是許多人會選擇成為人工智慧的一部分,」蘇茨克弗說,這可能是人類試圖跟上人工智慧的方式,「起初,只有最大膽、最冒險的人才會嘗試這樣做。也許其他人會效仿,也許不會。」

話音剛落,他就要起身離開了。

「你會這樣做嗎?」我急忙追問,「你會是第一個嗎?」

「第一個?我不知道,「他說,「但這是我在考慮的事情。真正的答案是:也許吧。」

緊接著,他站起來走出了房間。「很高興再次見到你,」他邊走邊說。

支持:Ren

文章來源: https://twgreatdaily.com/zh-my/38a59f0ec34292be38eec747782dba94.html