就像iPhone推出了App Store。
作者|趙健
在距離ChatGPT發布即將一周年之際,OpenAI在舊金山舉辦了首屆開發者大會DevDay。
首先,OpenAI CEO 山姆·阿爾特曼上台回顧了過去一年發布的里程碑產品:ChatGPT,以及在4月發布的GPT-4——仍然是世界上最強大的模型。此外,ChatGPT還推出新的語音與圖像功能,讓ChatGPT可以看、聽和說話;推出企業版以及DALL-E等。
阿爾特曼還公布了OpenAI最新的數據:有超過200萬開發人員在其API上構建「廣泛的用例」,並服務了92%的財富500強公司。同時,ChatGPT本身每周約有1億活躍用戶。
微軟CEO薩蒂亞·納德拉也來到了現場,他曾主導了微軟對OpenAI的投資。納德拉表示:「我們提供最好的系統,你們提供最好的模型。」納德拉也多次提到了基於GPT-4模型打造的副駕駛產品Copilot。
OpenAI在本次開發者大會上分享了數十項新增功能和改進,並降低了平台許多部分的價格。這些包括:
- ChatGPT的自定義版本——GPTs,並發布「GPT商店」;
- 新的GPT-4 Turbo模型,功能更強大、更便宜並且支持128K上下文窗口;
- 新的Assistants(助手)API,使開發人員可以更輕鬆地構建自己的輔助 AI 應用程式,這些應用程式有特定目標並可以調用模型和工具;
- 平台中的新多模態功能,包括視覺、圖像創建(DALL·E 3)和文本轉語音(TTS)。
OpenAI正在圍繞大模型,構建自己的生態帝國。
1.ChatGPT的「App Store」
OpenAI表示,自從推出ChatGPT以來,人們一直在尋求定製ChatGPT以適應他們特定的使用方式的方法。OpenAI在7月推出了自定義指令,可設置一些首選項,但不斷有人要求更多控制。許多高級用戶都會維護一份精心設計的提示和指令集列表,並將它們手動複製到ChatGPT中。
GPTs現在可以完成所有這些工作。
GPTs是一個UGC平台。OpenAI相信最令人難以置信的GPT將來自社區的構建者,無論是教育家、教練,還是只是喜歡構建有用工具的人,都不需要了解編碼來製作工具並分享專業知識。
從今天開始,用戶可以創建GPTs並公開共享。本月晚些時候,OpenAI將推出GPT商店,其中包含經過驗證的構建者的作品。一旦進入商店,GPTs就可以被搜索到,並且可能會登上排行榜。OpenAI還將重點關注在生產力、教育和「只是為了好玩」等類別中遇到的最有用和最令人愉快的GPTs。
就像蘋果App Store的開發者一樣,用戶還可以根據使用其開發的GPTs的人數來賺錢。
圖片來自OpenAI
關於隱私和安全問題,用戶可以通過ChatGPT控制數據。用戶與GPTs的聊天不會與構建者共享。如果GPTs使用第三方API,用戶可以選擇是否可以將數據發送到該API。當構建者使用操作或知識定製自己的GPTs時,構建者可以選擇用戶與該GPTs的聊天是否可用於改進和訓練模型。這些選擇建立在用戶現有的隱私控制之上,包括選擇將整個帳戶排除在模型訓練之外的選項。
OpenAI還建立了新的審查機制,旨在防護用戶共享有害的GPTs,包括涉及欺詐活動、仇恨內容或成人主題的 GPTs。
OpenAI表示,GPTs將繼續變得更有用、更智能,用戶最終將能夠讓它們承擔現實世界中的實際任務,這些系統通常被稱為「代理(Agents)」。OpenAI認為,逐步邁向這一未來非常重要,因為這需要認真的技術和安全工作,以及社會適應的時間。
對於開發者而言,除了使用內置功能之外,還可以通過向GPTs提供一個或多個API 來自定義操作。與插件一樣,操作允許GPTs集成外部數據或與現實世界交互,將GPTs連接到資料庫、將其插入電子郵件或使它們成為購物助手。
對於企業客戶而言,可以部署僅供內部人員使用的GPTs。OpenAI介紹。Amgen、Bain 和 Square 等早期客戶已經在利用內部 GPTs來做一些事情,例如製作體現其品牌的營銷材料、幫助支持人員回答客戶問題或幫助新軟體工程師入職。
企業用戶在本周三就可以使用GPTs。OpenAI強調,與ChatGPT Enterprise上的所有使用者一樣,OpenAI不會使用企業與GPTs的對話來改進模型。
OpenAI表示,希望更多的人參與到塑造人工智慧的行為方式之中,這對於OpenAI構建造福人類的安全通用人工智慧的使命至關重要。
2.新的模型與開發者產品
- 具有 128K 上下文的 GPT-4 Turbo
OpenAI於3月份發布了GPT-4 的第一個版本,並於7月份向所有開發人員開放。今天,OpenAI推出該模型的下一代GPT-4 Turbo的預覽。
此前,OpenAI的所有模型的訓練數據截止時間為2021年9月,而GPT-4 Turbo了解截至2023年4月的世界事件。GPT-4 Turbo具有128k上下文窗口,因此可以在單個提示中容納相當於300多頁文本的內容。
GPT-4 Turbo 可供所有付費開發者通過gpt-4-1106-preview API 進行嘗試,OpenAI計劃在未來幾周內發布穩定的生產就緒模型。
GPT-4 Turbo的功能更新包括:函數調用更新、改進的指令跟隨和 JSON 模式、可重複的輸出和對數機率等,此外,OpenAI還發布了新版本的GPT-3.5 Turbo,默認支持 16K 上下文窗口。
- 助手API、檢索和代碼解釋器
OpenAI發布的Assistants API是幫助開發人員在自己的應用程式中構建類似代理體驗的第一步。
助手是一種專門構建的人工智慧,具有特定的指令,利用額外的知識,並且可以調用模型和工具來執行任務。新的 Assistants API 提供了代碼解釋器和檢索以及函數調用等新功能,可以處理用戶以前必須自己完成的大量繁重工作,並能夠構建高質量的 AI 應用程式。
這個 API 的設計是為了靈活性。用例範圍包括基於自然語言的數據分析應用程式、編碼助手、人工智慧驅動的假期規劃器、語音控制的 DJ、智能視覺畫布等等。助理還可以根據需要調用新工具,包括:代碼解釋器、檢索與函數調用。
- API 中的多模態模式
GPT-4 Turbo 可以接受圖像作為聊天完成 API中的輸入,從而實現生成標題、詳細分析現實世界圖像以及閱讀帶有圖形的文檔等用例。例如,BeMyEyes 使用這項技術幫助盲人或弱視人士完成識別產品或瀏覽商店等日常任務。OpenAI計劃為主要的 GPT-4 Turbo 模型提供視覺支持,作為其穩定版本的一部分。定價取決於輸入圖像的大小。例如,將 1080×1080 像素的圖像傳遞給 GPT-4 Turbo 的成本為 0.00765 美元。
開發人員可以通過圖像API指定模型,將OpenAI向ChatGPT Plus和企業用戶推出的DALL·E 3 直接集成到他們的應用程式和產品中。Snap、可口可樂和 Shutterstock 等公司已使用 DALL·E 3 以編程方式為其客戶和活動生成圖像和設計。OpenAI提供不同的格式和質量選項,每生成一張圖像的起價為 0.04 美元。
開發人員現在可以通過文本轉語音 API從文本生成人類質量的語音。新 TTS 模型提供六種預設聲音可供選擇以及兩種模型變體——tts-1與tts-1-hd,tts-1針對實時用例進行了優化,tts-1-hd針對質量進行了優化。每輸入 1000 個字符起價為 0.015 美元。
圖片來自OpenAI開發者大會截圖
OpenAI正在發布Whisper large-v3,這是開源自動語音識別模型 (ASR) 的下一個版本,它的特點是跨語言性能得到了改進。OpenAI計劃在不久的將來在API中支持Whisper v3。
OpenAI還開源了Consistency Decoder,這是穩定擴散 VAE 解碼器的替代品。該解碼器改進了與 Stable Diffusion 1.0+ VAE 兼容的所有圖像,在文本、面部和直線方面有顯著改進。
3.OpenAI也打「價格戰」
針對開發者關心的價格問題,OpenAI表示正在降低整個平台的多個價格,以便將節省的費用轉嫁給開發者(以下所有價格均以每 1,000 個token表示):
- GPT-4 Turbo 輸入token比 GPT-4 便宜 3 倍,為 0.01 美元,輸出token便宜 2 倍,為 0.03 美元。
- GPT-3.5 Turbo 輸入token比之前的 16K 型號便宜 3 倍,價格為 0.001 美元,輸出token便宜 2 倍,價格為 0.002 美元。之前使用 GPT-3.5 Turbo 4K 的開發人員受益於輸入token減少 33%,價格為 0.001 美元。這些較低的價格僅適用於今天推出的新款 GPT-3.5 Turbo。
- 經過微調的 GPT-3.5 Turbo 4K 模型輸入token減少了 4 倍,價格為 0.003 美元,輸出token便宜了 2.7 倍,價格為 0.006 美元。微調還通過新的 GPT-3.5 Turbo 型號以與 4K 相同的價格支持 16K 上下文。這些新價格也適用於微調型號gpt-3.5-turbo-0613。
圖片來自OpenAI
OpenAI正在創建一個用於GPT-4 微調的實驗性訪問程序。初步結果表明,與 GPT-3.5 微調實現的實質性收益相比,GPT-4 微調需要更多的工作才能對基本模型實現有意義的改進。
對於需要比微調所能提供的更多自定義的組織,特別適用於具有極大專有數據集——至少數十億token的組織,OpenAI還啟動了自定義模型計劃,為選定的組織提供了與專門的 OpenAI 研究人員小組將定製 GPT-4 訓練到其特定領域。這包括修改模型訓練過程的每一步,從進行額外的特定領域預訓練,到運行針對特定領域定製的自定義強化學習後訓練過程。組織將擁有對其定製模型的獨家訪問權。
(封面圖來自OpenAI開發者大會截圖)
參考資料:
https://www.youtube.com/watch?v=U9mJuUkhUzk
https://openai.com/blog/introducing-gpts
https://openai.com/blog/new-models-and-developer-products-announced-at-devday