發沒發布吵了一周,你在對 GPT-4.5 期待些什麼

2023-12-19     InfoQ

原標題:發沒發布吵了一周,你在對 GPT-4.5 期待些什麼

作者 | 褚杏娟

「我上周一直都在告訴你們 GPT-4.5Turbo 即將發布,有人說我說瞎話,有人說我瘋了。他們說是假新聞,但它就在這裡,GPT-4.5 Turbo 不僅上線了,而且還處於保密狀態。」網友 Wes Roth 在自己的視頻里說道。Wes Roth 透露,OpenAI 的 GPT-4.5 Turbo 已經開始灰度測試,並展示了測試結果:

其他網友測試後也給出了相同的結果:

還有網友稱,自己在 iPad 版本上測試成功,但在桌面版本上不行。「不過,當要求詳細信息時,它就會變得非常通用。」還有網友在移動端測試也成功了。

推特著名爆料博主 Jimmy Apples 也表示,當反覆詢問其版本時,他注意到模型的不同反應。「令我印象深刻的是該模型在移動設備上承認是 GPT-4.5 Turbo,而桌面查詢卻產生了不同的結果。」

目前,很多都是對於 GPT-4 Turbo 灰測的結果大多來源於用戶對 ChatGPT 提問後得到的回答。網友「Bahou」對此表示,「我相信這是一種幻覺。」Bahou 給出的具體理由如下:

還有網友猜測,「這似乎來自它的訓練數據。也有可能他們已經開始訓練 GPT-4.5,但尚未完成,因此並未公布。」

值得注意的是,Reddit 上一篇發布不久的「GPT-4.5 Turbo 已經正式發布」的帖子被刪掉。其中就有用戶表示,自己並沒有看到這個版本:

根據一些說法,GPT-4.5 Turbo 將在推理和「不那麼懶惰」方面取得一些進步。但有網友表示,如果當前所謂灰度測試的就是 GPT-4.5 Turbo,「那麼改進似乎並不太顯著,否則我們會看到一些巨大的飛躍。」

「太棒了,你應該讓 Altman 知道這件事!」有網友調侃道。實際上,在 12 月 14 日時候就有用戶問道關於 GPT-4.5 是否泄漏的問題,但 Altman 給出了模稜兩可的回答。

一名疑似 OpenAI 員工的網友否認這個消息:「兄弟們,你們需要對瘋狂的人工智慧炒作有更多的抵抗力。沒有 4.5,如果有,也不會靜默發布。」

GPT-4.5 到底啥樣?

最早表示 GPT-4.5 泄露的是 reddit 上的一個帖子(現已經被刪除):

GPT-4.5 將被描述為 OpenAI 最先進的「一款」模型,具備全新多模態能力,文本語音圖片以及視頻和 3D 信息全都能一併處理,並且還可以跨模態理解。從泄漏的截圖可以看出,OpenAI 可能推出三種型號:

  • GPT-4.5,每 1 千輸入 token 0.06 美元,每 1 千輸出 token 0.18 美元
  • GPT-4.5-64k,每 1 千輸入 token 0.12 美元,每 1 千輸出 token 0.36 美元;
  • GPT-4.5- 音頻 & 語音,每分鐘輸入 0.012 美元,每分鐘輸出 0.024 美元;

如果泄露的信息為真,那麼相比之前的 GPT-4 Turbo 模型,GPT-4.5 的價格提高了整整 6 倍,GPT-4.5-64k 的價格提高了 12 倍。

該消息爆出時,Jimmy Apples 表示:「OpenAI 或將在 12 月底前發布 GPT-4.5。」科技圈知名爆料人 futuristflower 也認為螢幕截圖泄露的信息基本正確,只是無法驗證截圖是否是官方的。這兩位的說法讓大家普遍認為 GPT-4.5 就會在這個月發布。

也不怪大家這麼期待 GPT-4.5,一方面,OpenAI 的發布會總會給人「驚喜」,另一方面,人們發現最近的 GPT-4 變得有些「懶惰」,老是拒絕執行某些任務或直接返回簡化的結果。

目前,OpenAl 還沒有公開詳細介紹 GPT-4.5 的技術細節和改進,但 ChatGPT 有回答「它的設計目的是在會話式 AI 應用程式中提供高效和有效的響應。」

根據外媒的預測,GPT-4.5 可能基於令人難以置信的 1.8 萬億個參數,而 GPT 3.5 僅有 1750 億個參數。GPT-4.5 幾乎肯定會考慮更多參數,並接受更多最新數據的訓練。

GPT-4 僅限於 2021 年秋季之前的數據,未來 GPT-4.5 模型可能至少會基於 2022 年的信息,也可能會持續到 2023 年。它還可能可以立即訪問網絡搜索和插件,GPT-4 已引入該功能幾個月了。

GPT-4 的推出還增加了 ChatGPT 識別圖像的能力,並對提示做出更自然、更細微的響應。GPT-4.5 可以再添加新功能,也許能夠分析視頻,或本地執行一些插件功能,例如閱讀 PDF 文檔,或者甚至幫助教學。

GPT-4.5 也有可能能夠記住更多信息,利用過去的對話來構建對未來的響應。GPT-4.5 也可能比 GPT-4 更加高效,運行資源需求更少,這有可能使其能夠在更小的設備上運行並更快地響應。

GPT-5 都在路上了

在大家紛紛期待 GPT-4.5 時,OpenAI 已經開始了 GPT-5 的研發。

Sam Altman 在一次最新的採訪中對外透露出,下一代人工智慧模型 GPT-5 正在開發中。Altman 還表示,計劃從微軟獲得更多資金支持,用以創造相當於人腦的超級 AI——通用人工智慧(AGI)。

不過, Altman 並沒有透露具體的時間和進度,只是說 GPT-5 會比 GPT-4 更加複雜,連他也無法準確預測 GPT-5 會具有哪些新功能和新技能。

Altman 表示,GPT-5 的終極目標就是是相當於人腦的超級 AI,目前 OpenAI 在構建 AGI 方面還是取得了一定進展,而大語言模型(LLM)是構建 AGI 的核心部分:「語言是壓縮信息很好的一個方法,我們已經用 GPT-3 證明了這一點,而谷歌 DeepMind 卻錯失了這一機會,雖然這些公司也有很多聰明人,但他們並沒有這麼做。」

但要做好 GPT-5 並不容易。Altman 在公開場合表示需要更多的數據。除了來自公共在線的數據資源,OpenAI 還尋求利用未公開提供的、更高質量的數據資源。

OpenAI 還需要大量的 GPU。據報道,GPT-5 的訓練需要 5 萬張英偉達 H100 的加持。Altaman 此前也表示 OpenAI 很缺 GPU,以至於並不希望太多人用 ChatGPT。此前,OpenAI 就受到 GPU 的限制,推遲了微調、專用容量、32k 上下文窗口、多模態等短期計劃。Altman 表示,最近收到了一批英偉達最新的 H100 晶片,他預計 2024 年供應將進一步放鬆。

Altman 沒有承諾 GPT-5 的發布時間,但即使很快開始訓練,該模型也不會在短期內面世。根據其大小和設計,訓練可能需要數周或數月的時間。然後原始算法必須經過很多人的壓力測試和微調以確保其安全。該公司花了八個月的時間打磨並在測試後發布了 GPT-4。儘管現在競爭格局更加激烈,但 GPT-4 的到來比 GPT-3 晚了近三年。

不過值得注意的是,比爾·蓋茨評論稱,「GPT-5 不會比 GPT-4 好多少。」他認為,當前生成式人工智慧已經達到極限。

相關連結:

https://twitter.com/BahouPrompts

https://www.digitaltrends.com/computing/gpt-45-language-model/

https://singularityhub.com/2023/11/15/openai-ceo-sam-altman-says-his-company-is-now-building-gpt-5/

尋找增長,SaaS 企業選擇上飛書

離開雲轉戰 AI?23 歲寫了百萬人用的開源軟體,這個 IT 奇才 11 年後離開了自己的上市公司

月薪八千離職賠百萬,寧德時代的「競業封印」;國內網際網路大廠月薪最新一覽;螞蟻宣布新一輪職級體系改革|Q資訊

洞見 re:Invent:生成式 AI 與雲共舞,成為構建者最好的時代來臨!

文章來源: https://twgreatdaily.com/zh/139a4fc6a93cd0971424e5825057e4fe.html