OpenAI CEO奧爾特曼: 更大的「魔法」在路上

2024-09-25   第一財經

「未來每個人的生活都可以比現在的任何人更好,如果從今天快進到100年後,未來的繁榮將難以想像。」

夢想家總在引導人工智慧前進的方向。OpenAI CEO薩姆·奧爾特曼(Sam Altman)於當地時間9月23日發布長篇博客,談及對智能時代的判斷。「這可能是歷史上最重要的事,即我們可能在幾千天內擁有超級智能(super intelligence),這可能需要更長時間,但相信我們會達到那裡。」奧爾特曼稱。

不久前,OpenAI發布o1系列模型,針對此前大模型數學能力弱的問題,該系列模型強化了大模型進行複雜推理任務的能力,使其性能類似於博士生在物理、化學、生物學中完成具挑戰性基準任務時的能力。該系列模型發布後,久違地引起了業界對於人工智慧範式的討論。不過,對於要實現超級智能乃至AGI(通用人工智慧),業內並沒有十分確切的時間表。

「深度學習有效」

奧爾特曼在這篇博客里展望了人工智慧將帶來的變化。他表示,在接下來的幾十年里,我們將能做一些對祖父母一輩而言像是「魔法」一樣的事情。

具體而言,人工智慧將為人們解決難題提供工具,幫助人們在「腳手架」上繼續添加新支柱。最終每個人都能擁有由不同領域虛擬專家組成的人工智慧團隊,人們的下一代將會有虛擬導師,虛擬導師將會在任何科目、用任何語言為孩子提供個性化指導。此外,人工智慧模型很快將能代表人類完成特定任務,如協調醫療護理,人工智慧還能創造更好的下一代系統。

奧爾特曼展望,憑藉近乎無限的智慧和豐富的能源,人類可以將許多想法變為現實。令人震驚的成就將變得司空見慣,例如解決氣候問題、建立太空殖民地、發現所有物理法則。

奧爾特曼談及回顧人類歷史的一個狹義視角:經過數千年的科學發現和技術進步,人類學會熔化沙子、添加雜質並以極小的尺度和令人驚訝的精度排列到計算機晶片中,隨後通電後形成日益強大的人工智慧系統。

2006年,傑弗里·辛頓等人提出了深度學習的概念,深度學習成為此後大模型的基礎。奧爾特曼認為,要如何實現下一次繁榮飛躍,還可以用幾個字概括,即「深度學習有效」。人們發現了一種算法(深度學習),能真正學習任何數據分布,隨著計算和數據量增多,能更好幫助人們解決難題。「無論我花多少時間思考這個問題,我都無法真正意識到它有多麼重要。」奧爾特曼強調。

回到技術層面的挑戰和人工智慧的負面影響,奧爾特曼則稱,現在還有很多細節需要弄清楚,但深度學習是有效的,我們將解決剩下的問題。人工智慧也會有危害,人們現在就需要減少其危害。預計人工智慧技術在未來幾年可能會對勞動力市場帶來重大影響,但大多數工作的變化速度比人們想像的更慢,他並不擔心人們會無事可做,社會將重新關注於積極和共贏的遊戲。

奧爾特曼也提到關於算力限制的問題,他表示,如果希望把人工智慧交到儘可能多的人手裡,就需要降低計算成本,這需要大量能源和晶片。如果不建設充足的基礎設施,人工智慧將成為非常有限的資源,引發爭奪並主要成為富人的工具。

人工智慧的範式改變了

奧爾特曼此時發布博客長文並提及算力的重要性,不排除是OpenAI將在算力層面加大發力的信號。

大模型公司為了購買算力而「燒錢」並非秘密。近日OpenAI已多次傳出將有新融資的消息,消息稱OpenAI正在進行一輪巨額融資的相關談判,籌集資金65億美元,公司估值或達1500億美元。OpenAI希望利用融資獲得更多計算能力並為運營提供資金。在此之前,奧爾特曼曾抱怨英偉達GPU(圖形處理器)短缺。雖然OpenAI還沒有公開的實質性動作,但今年OpenAI已數次傳出自行「造芯」或尋找合作方「造芯」的消息。

此外,不僅奧爾特曼表達了對人工智慧未來的信心,OpenAI本月發布o1系列模型,推動大模型疊代的「齒輪」繼續轉動,在業內也久違地帶來了關於人工智慧範式的討論,一定程度上也為人工智慧從業者帶來信心。

OpenAI研究科學家布朗(Noam Brown)表示,OpenAI正在招聘機器學習工程師,以打造一個新的「多智能體」研究團隊。目前新推出的o1模型處於第二階段,即所謂的「推理者」階段。相比之下,OpenAI認為「多智能體」是提高AI推理能力的關鍵途徑,將進一步推動AI的發展,使其達到第三級,即代理層面。

此前,隨著大模型疊代進展放緩,大模型數學能力弱的問題被公眾發現,GPT-5則遲遲未有面世時間表,業內出現了不少質疑大模型Scaling Law(縮放定律,即算力、數據、模型參數增大以持續產生更多的智能)面臨失效的聲音。近期面世的o1系列不僅依賴Scaling Law,還使用了大規模強化學習技術來訓練算法,讓模型利用思維鏈進行較長時間的高效思考,提高了模型推理能力。奧爾特曼認為o1標誌著一個新範式的開始,即AI能進行通用複雜推理。

將強化學習、推理環節「慢思考」引入大模型,在人工智慧業內引發了熱烈討論。月之暗面創始人楊植麟提到,o1發布標誌著人工智慧的範式從「預測下一個token(詞元)和Scaling」遷移到「強化學習和Scaling」。這種範式轉變的一個背景是Scaling Law所需的天然訓練數據面臨越來越少的瓶頸,而強化學習能讓AI轉向「自己跟自己玩」創造數據,推動AI能力繼續提升。原來大部分Scaling發生在訓練階段,而現在大部分計算轉移到推理階段。

大模型創業公司階躍星辰創始人姜大昕近日也表示,AI發展正在經歷關鍵的技術範式疊代。OpenAI的o1探索出通過強化學習讓AI具備人類慢思考能力的方式,接下來提升強化學習模型的泛化能力和加速推進多模態理解生成一體化,是AI技術進一步突破的關鍵。

「人工智慧繼續疊代的道路是明確的,只不過並非所有工作都已經完成,OpenAI的o1也說明了這一點。」一名機器學習資深研究者向第一財經記者表示,有自學習和自我改進能力的高級智能系統在短時間內不會出現,但從業內進展看長期仍有信心。

不過,更長遠看,關於超級智能或AGI(通用人工智慧)何時實現,業內仍有不同討論。此前OpenAI一篇論文里提到超級智能時未有明確定義,但上下文描述了人工智慧在各領域認知能力超過人類。AGI則沒有被廣泛認同的定義,一般可以指擁有與人類相當智能水平的人工智慧系統。

英偉達CEO黃仁勛此前預計,在他基於工程學的定義里,AGI可能在未來5年內實現,但人們可能不會認同到時的AI已是AGI。在近期的業內探討中,OpenAI等人工智慧公司的投資者Alpha Intelligence Captal聯合創始人兼管理合伙人布朗迪奧(Antoine Blondeau)表示實現AGI可能是在10年或20年內。英偉達人工智慧技術中心全球主管Simon See則認為要達到AGI,或許能在這10年內實現這一進程的80%,但最後的20%將非常具有挑戰性且需要更長時間。