動動嘴就能定製ChatGPT,賺分成!OpenAI要做大開發者生態 | 新榜出品

2023-11-08     新榜

原標題:動動嘴就能定製ChatGPT,賺分成!OpenAI要做大開發者生態 | 新榜出品

作者 | 捲毛

編輯 | 張潔

今天凌晨(北京時間11月7日),「AI春晚」首屆OpenAI開發者大會如約而至,此前的爆料基本都被證實了,要圍繞GPT-4做大生態,進一步降低開發門檻。面對這一波升級更新,從業者興奮不已,也有人調侃道「Sam Altman是真不給自己活路」。

來看看OpenAI開發者大會的亮點總結:

Sam Altman首先回顧了過去一年的成績單:目前ChatGPT的每周活躍用戶數已達到1億,約有200萬開發者基於OpenAI API進行開發,92%的財富500強公司在使用OpenAI的產品。

OpenAI這次發布了數十項更新,主要包括:

發布GPT-4 Turbo模型,功能更強大、更便宜,並且支持128K上下文窗口。
發布Assistants API,使開發者更輕鬆地構建自己的輔助AI應用程式,獲得類似Agent的體驗。
API更新多模態功能,包括帶視覺功能的GPT-4 Turbo、圖像創建 (DALL·E 3) 和文本轉語音 (TTS)。

使用Assistants API無需代碼即可創建高質量助手

OpenAI還降低了許多模型API的價格,新發布的GPT-4 Turbo輸入價格(每1000個tokens)比GPT-4便宜3倍,為0.01美元,輸出便宜2倍,為0.03美元。

對於更多用戶,尤其是沒有編程基礎的開發者,OpenAI這次推出了ChatGPT的自定義版本,稱為GPTs。無需編碼,人人都能在對話中創建一個自己的GPT,並公開分享給其他人使用。OpenAI將在本月推出GPT商店,展示最佳、使用量最大的GPT,並和這些創建者進行收入分成。

圖源OpenAI官方博客(https://openai.com/blog/introducing-gpts)

關於隱私和安全問題,OpenAI建立了新的審查系統,企業客戶可以部署僅供內部使用的GPT,OpenAI不會使用API或ChatGPT企業客戶的數據進行訓練。

圖源OpenAI官方博客(https://openai.com/enterprise)

更多細節可以查看以下直播視頻,「頭號AI玩家」結合AI翻譯整理了整場演講全文,歡迎收藏、轉發和討論!

回顧過去一年OpenAI的發展

Sam Altman:

早上好。歡迎來到我們的第一個OpenAI開發者日。我們很高興你來到這裡,這裡的氛圍很棒。

歡迎來到舊金山。從第一天開始,舊金山就是我們的家。這座城市對我們和整個科技行業都很重要。我們期待著在這裡繼續成長。所以今天我們有一些很重要的事情要宣布。

但首先,我想花點時間談談我們在過去一年裡所做的一些事情。大約一年前,11月30日,我們發布了一個研究預覽ChatGPT,後來到三月份進行得相當順利。我們隨後推出了GPT-4,它仍然是世界上性能最出色的模型。

在過去的幾個月里,我們推出了語音和視覺功能,ChatGPT現在可以看到並說話。

最近,我們推出了世界上最先進的圖像模型DALL·E 3。當然,你可以在ChatGPT中使用它。

對於企業客戶,我們推出了ChatGPT企業版,提供企業級安全和隱私,更高速度的GPT-4訪問,更長的上下文窗口等等。

今天,我們有大約200萬開發人員基於我們的API開發各種用例,做出了令人驚嘆的事情。超過92%的500強公司使用我們的產品。現在我們有大約1億用戶每周活躍在ChatGPT上。令人難以置信的是,我們是完全通過口口相傳實現的。人們只是發現它很有用,並告訴他們的朋友,OpenAI是目前世界上最先進和使用最廣泛的AI平台。

但數字永遠無法說明全貌。真正重要的是人們如何使用產品,人們如何使用AI。所以我想給你們看一個簡短的視頻。

(長約2分鐘的用戶案例視頻,分享了ChatGPT幫助用戶寫信表達情感,作為創業者的工作助手,幫助藝術創作者獲得設計靈感,幫助醫生做研究,完成日常生活任務,幫助程式設計師編寫代碼,幫助老人獲得陪伴等等)

我們喜歡聽人們如何使用這項技術的故事。這就是我們做這一切的原因。

發布GPT-4 Turbo

現在讓我們來看看新的東西。首先,我們將討論我們所做的一系列改進,然後再談談我們下一步的發展方向。

在過去的一年裡,我們花了很多時間與世界各地的開發者進行交流,聽到了很多反饋。今天我們要向你們展示一款新模型GPT-4 Turbo。

GPT-4 Turbo將解決許多你們的需求。我們提供了六個方面的更新。

第一,上下文長度。很多人的任務需要更長的上下文長度,GPT-4最多支持8k,在某些情況下,支持32k。但我們知道這對你們中的許多人來說還不夠。

現在GPT-4 Turbo最多支持128000個上下文tokens。這就是一本標準書的300頁,比我們的8k上下文長16倍。除了更長的上下文長度之外,該模型在更長的上下文中會更準確。

第二,更多控制。我們了解到開發人員需要對模型、響應和輸出有更多的控制。所以我們已經用多種方式解決了這個問題。

我們推出了一個叫做Json模式的新功能,確保模型使用有效的Json進行響應。這是一個巨大的開發者需求,它將使調用API變得更容易。

該模型在函數調用方面也做得更好,你現在可以同時調用許多函數,而且它在遵循一般指示方面會表現更好。

我們還將引入一項新功能,稱為可重複輸出。您可以輸入一個種子參數,它將使模型返回一致的輸出。當然,這可以讓你對模型行為有更高程度的控制。今天我們推出了測試版,在未來幾周,我們還將推出一項功能讓你可以查看API中的日誌問題。

第三,更了解世界。你希望這些模型能夠更好地獲取關於世界的知識,我們也是。所以我們的平台支持檢索功能,你可以將外部文檔或資料庫中的知識引入到你正在構建的任何東西中。

我們也在更新知識界限。GPT-4關於世界的知識截至2021年。我們將盡力不再讓它過時。GPT-4 Turbo現在擁有截至2023年4月的世界知識。隨著時間的推移,我們將繼續改進這一點。

第四,新模態。DALLE 3,帶有視覺的GPT-4 Turbo,和新的語音文本模型,都將提供API。

我們有一些客戶剛剛開始使用DALLE 3以編程方式生成圖像和設計。可口可樂正在推出一項活動,讓消費者使用DALLE 3生成卡片。當然,我們的安全系統可以幫助開發者保護應用程式不被濫用。

這些工具在API中可用,GPT-4 Turbo現在可以通過API接受圖像作為輸入,可以生成標題、分類和分析。例如,Be My Eyes使用這項技術來幫助盲人或低視力的人完成日常任務,像是識別面前的產品。

使用我們新的TTS模型,你可以從API中的文本生成非常自然的聲音,並有6種預設聲音可供選擇。

舉個例子,你知道著名的發明家亞歷山大·格雷厄姆·貝爾對聲音的世界著迷嗎?他用聰明才智發明了留聲機,使聲音穿越時間,這比我們聽到的其他任何東西都要自然得多。

語音可以使應用程式更自然地交互,更易於訪問。我們還解鎖了許多用例,如語言學習和語音助手。

說到新模式,我們將發布新版本的開源語音識別模型Whisper V3,今天很快就會在API上推出,它提高了跨多種語言的性能,希望你會喜歡它。

第五,定製化。自從幾個月前推出GPT 3.5以來,微調模型一直非常有效。從今天開始,我們將擴展到16k版本的模型。同時,即日起我們將邀請活躍的微調用戶申請GPT-4微調實驗項目。

微調API非常適合讓模型在數據量相對較小的各種應用程式中實現更好的性能。但是你可能需要一個模型來學習全新的知識領域或使用大量專有數據。所以今天我們將推出一個名為自定義模型的新程序。

我們的研究人員將幫助客戶創建出色的自定義模型。這包括模型訓練中的每個步驟,進行額外的特定領域預訓練或訓練後的過程。它是為特定領域量身定製的。

我們剛開始無法和很多公司達成合作。這將需要大量的工作,而且為了達到預期,至少在初期階段它不會很便宜。但如果你很想把事情推進到極致,請與我們聯繫,我們可以一起做得很好。

第六,更高的速率限制。我們為所有GPT-4用戶每分鐘增加一倍的tokens,以便做更多事情。而且你可以申請更改速率限制,並直接在API帳戶設置中引用。

除了這些速率限制,我們還必須盡力保證開發者在我們的平台上成功構建。因此,我們引入了版權保護,這意味著如果你面臨有關版權侵權的法律索賠,我們將介入並保護你,並支付所產生的費用。這適用於ChatGPT企業客戶和API開發者。

需要強調的是,我們不會使用API或ChatGPT企業客戶的數據進行訓練。

實際上還有一個開發者的需求大於所有這些需求,那就是GPT-4的定價。

GPT-4 Turbo是行業領先的模型,它提供了我們剛剛所說的許多新功能,而且比GPT-4更智能。我們從開發人員那裡聽說他們有很多想要構建的東西,但是GPT-4的成本太高了,如果我們能將成本降低20至25%,那就太好了。

我很激動地告訴大家,GPT-4 Turbo,一個更好的模型,但比GPT-4便宜得多,從今天起輸入token價格降低3倍,輸出token價格降低2倍。因此新的價格為每千個輸入token 1美分,每千個輸出token3美分。這意味著GPT-4 Turbo的費率比GPT-4便宜2.75倍以上。

我們優先考慮了價格,在價格和速度中我們必須選擇其中一個,但很快你會注意到GPT-4 Turbo變得更快了。

我們也在降低GPT-3.5 Turbo 16k的成本。輸入token減少了三倍,alpha token減少了兩倍,這意味著GPT-3.5 16K現在比以前的GPT-3.5 4k型號便宜,運行微調GPT-3.5 Turbo 16K版本也比舊的微調4k版本便宜。

與微軟CEO對話

我們剛剛介紹了很多關於模型本身的內容,希望這些更新能解決你的問題。我們很幸運有一位對合作夥伴對實現這些起到了重要作用。這位特別嘉賓是微軟執行長Satya Nadella。

Sam Altman:兩個問題不會占用你太多時間,微軟目前是如何看待這一合作關係的?

Satya Nadella:我記得你第一次聯繫我說,嘿,你有Azure積分嗎?從那時起,我們已經走了很長一段路,你們創造了一個神奇的世界。在合作方面,首先是這些工作負載,我從事基礎設施業務已有三十年了,從來沒見過這樣的工作量和工作模式,這些訓練工作是如此同步,如此龐大。所以我們一直在做的第一件事就是與你們合作構建系統,Azure的形態發生了巨大的變化,以支持正在構建的模型,然後將最好的模型提供給開發人員。

另一方面,我們自己就是開發者,正在打造產品。在我第一次看到GPT上的Copilot時,我對這一代基礎模型的信念完全改變了,所以我們想在OpenAI API之上構建我們的Copilot。

例如,GitHub Copilot可以作為企業版提供給這裡的所有與會者,開發人員甚至還可以通過Azure Marketplace構建產品以快速進入市場。

Sam Altman:您如何看待未來的合作關係或人工智慧的未來等等?

Satya Nadella:有幾件事我認為非常關鍵。 一是我剛剛描述的系統,我們將繼續致力於讓基礎模型的建設者擁有最好的訓練和推理系統,擁有最多的計算能力,向前邁進。

我們雙方都關心的第二件事是使命,我們的使命是幫助地球上的每個人和每個組織取得更大成就。歸根結底,人工智慧只有真正發揮作用時才會有用,我認為能將人工智慧的好處廣泛傳播給每個人,這是我們的目標。

最後一件事,我們堅信安全很重要,安全並不是以後才會關心的事情,我們非常關注這一點。

發布GPTs

本次開發者大會,我們對ChatGPT也進行了一些更新。ChatGPT現在可以使用GPT-4 Turbo與所有最新的改進,包括最新的知識獲取,我們將繼續更新。

ChatGPT現在可以在需要編寫和運行代碼時瀏覽網絡、分析數據、生成圖像等等。你們反饋說模型選擇器非常煩人,所以它已經去掉了。從今天開始,你將不需要在下拉菜單中點擊來回切換。這一切將無縫協作。ChatGPT知道何時使用何種能力。

但這並不是主要的事情,定價也不是。實際上開發者還有另一個更大的需求。

我們知道人們想要人工智慧更智能、更個性化、更可定製,可以為您做更多事情。最終,你只需告訴計算機你需要什麼,它就會為你完成所有任務。這些功能在人工智慧領域經常被稱為代理Agent。

OpenAI堅信,漸進式、疊代式部署是解決人工智慧安全問題和安全挑戰的最佳方式。我們認為,謹慎地邁向Agent的未來尤為重要。這需要大量的技術工作和社會的深思熟慮。因此,今天,我們邁出了未來的第一步。我們很高興推出GPTs。

GPTs是針對特定目的定製的ChatGPT版本。你可以用於任何帶有說明、擴展知識和操作的內容構建一個GPT,一個自定義的ChatGPT,然後你可以將它發布以供其他人使用。

GPTs結合了指令、擴展知識和操作,可以為你提供更多幫助,使你更輕鬆地完成各種任務或享受更多樂趣。

你可以直接在ChatGPT 中使用GPTs。實際上,只需通過與 GPT 交談即可用語言對其進行編程,可以輕鬆自定義行為,使其滿足需求。構建一個GPT變得非常容易,它為每個人提供了代理。

我們將向你展示什麼是GPTs、如何使用它們以及如何構建它們。然後我們將討論如何分布和發現它們,以及對於開發人員,我們將展示如何將這些類似代理的體驗構建到自己的應用程式中。

首先,讓我們看幾個例子。

我們在code.org的合作夥伴正努力在學校推廣計算機科學,他們的課程被全世界數千萬學生使用。code.org精心製作了Lesson Planner GPT,以幫助教師為中學生提供更具吸引力的體驗。

如果老師要求它以創造性的方式解釋4個循環,它通過視頻遊戲角色反覆拾取硬幣來解釋,對於八年級學生來說非常容易理解。

接下來,Canva建立了一個GPT,讓你可以通過用自然語言描述設計想要的東西。如果你說為今天晚上的開發者招待會製作一張海報,並且給它一些細節,它會通過點擊畫布api生成一些選項。

有些人可能對這個概念很熟悉,我們已將插件疊代為GPTs的自定義操作。你可以繼續和它聊天,看看不同的裝飾,然後選擇喜歡的進入Canva來獲得完整的設計體驗。

現在我們要給大家直播演示GPT。Zapier構建了一個GPT,可以跨6000個應用程式執行操作,以釋放各種集成的可能性。我們請Jessica,我們的解決方案架構師之一,來進行這個演示。

Jessica:

首先,GBTs位於左上角。單擊 Zapier AI,在右側,可以看到這是我今天的日程表,它實際上已經連接到我的日曆了。我可以詢問今天的日程安排。

我們在構建GPTs時考慮到了安全性,因此,在執行任何操作或共享數據之前,它會請求你的許可。GBTs旨在接收你的指令,決定調用哪個功能來執行該操作。我要求它識別我的行程上的衝突,可以看到它實際上能夠識別這一點。

那麼如果我想讓Sam知道我必須提前離開怎麼辦?我要切換到我和Sam的對話,然後我會說是的,請運行它。

Sam Altman:

除此之外,人們正在創建更多類型的GPT,更多 GPTs將很快出現。

我們知道許多想要構建GPT 的人不知道如何編碼。現在你只需通過對話即可構建GPT,自然語言將成為人們未來使用計算機的重要組成部分。

舉個例子,我要創建一個 GPT,在啟動新項目時為創始人和開發人員提供建議。

進入GPT構建器,首先關於商業創意,我問GPT是否能給我一些建議。GPT問我想要做什麼,我說我想幫助初創公司創始人思考他們的業務、商業理念,並在創始人獲得一些建議後提供進一步的建議,比如關於為什麼不能發展得更快。

GPT會開始思考這個問題,它寫了一些詳細的說明。它還會問我起什麼名字,創業導師怎麼樣?挺好的,當然,我也可以叫它別的名字。

在預覽模式的右側,可以看到它已經開始創建GPT,其中說明了它的作用,提供了候選問題。

我上傳了一些關於初創企業講座的記錄,要求它針對這些問題提出建議。在「配置」選項頁面,你可以看到已經啟用的功能,可以添加自定義操作。比如我要求GPT給出簡潔和建設性的反饋。

我現在只向我自己發布這個GPT。但我稍後可以添加更多有用的操作,通過連結公開分享,供任何人使用。或者,企業客戶可以專門為公司製作GPT。

本月晚些時候,我們將推出GPT 商店。我們將推薦最好和最受歡迎的GPT。 當然,我們會確保商店裡的GPT在可供訪問之前遵循我們的政策。

同時,我們將向那些構建最有用和最常用的 GPT 的人,支付我們收入的一部分。

我們很高興能通過GPT 商店來培育一個充滿活力的生態系統。這只是我們周末構建起來的,相信之後將會有很多很棒的GPTs。

發布Assistants API

作為一個開發者大會,我們還將把相同的概念引入API。

許多人已經在API 上構建了類似代理的體驗,例如Shopify、Discord、MyAI的AI工具。這些經驗很棒,但構建起來卻很困難,有時需要花費數月時間,需要數十名工程師組成的團隊。 因此,今天我們通過新的輔助 API 讓這一切變得更加容易。

AssistantsAPI 包括持久線程,因此它們不必弄清楚如何處理內置於檢索代碼解釋器(沙箱環境中的工作 Python 解釋器)中的長對話歷史。當然,還有我們之前討論過的改進的函數調用。

我們邀請Ramon,我們的開發者體驗主管,向你展示其工作原理。

Ramon:

今天,我們在API 中推出新模式。想像一下我正在為全球探險家構建Wonderlust旅行應用程式。這是登陸頁面。我實際上已經使用GPT-4 來提出這些目的地想法,這些插圖是使用DALLE 3 API以編程方式生成的。

讓我們添加一個非常簡單的助手來發布這個應用程式。首先,切換到新的Assistants Playground。只需給它一個名稱、一些初始說明和一個模型就能創建了。我選擇了GPT-4 Turbo,然後打開代碼解釋器,檢索和保存。這樣我們的助理已經準備好了。讓我們快速瀏覽一下代碼。

對於每個新用戶,我都會創建一個新線程。當這些用戶與他們的助手互動時,我會將他們的消息添加到線程中,然後我可以隨時運行助手響應流回應用程式。這樣我們就可以返回應用程式並嘗試實際操作。

如果我說我們去巴黎吧,只需幾行代碼,就可以在應用程式內獲得非常專業的幫助。

我最喜歡的功能之一是函數調用,它可以保證Json輸出沒有編輯延遲,並且可以一次同時調用多個函數。

如果我繼續問在巴黎最重要的10件事是什麼,助手給出了回答,還在右側的地圖上顯示出地點。這種集成使我們的自然語言介面能夠與應用程式商店的組件和功能流暢地交互。

我們還有檢索功能,為助手提供除這些即時用戶消息之外的更多知識。比如我已經預訂了去巴黎的機票,我只需把機票PDF拖放到這裡,助手就可以讀取這些文件,提取關鍵信息。

許多開發人員說自己構建很困難,通常需要計算嵌入,設置分塊算法。現在,所有這些都已為你處理好。不僅僅是檢索,像處理上下文窗口、清理消息等這種複雜性現在完全被新的API消除了。

但這不意味著它是一個黑匣子。事實上,您可以在開發人員儀錶板中看到這些工具正在執行的步驟。

接下來一項新功能也被要求很久了,代碼解釋器現在也可以在API中使用了。AI能夠即時編寫和執行代碼,甚至生成文件。 那麼讓我們看看它的實際效果。

如果我說將會有四個朋友入住此AirBnb,我要花多少錢,再加上我的航班。它編寫了一些代碼來回答這個問題,它計算了我在巴黎的天數,還在幕後做了一些匯率計算來得到這個答案。

我想我的巴黎之行已經安排好了。回顧一下,我們剛剛了解了如何快速創建一個助手來管理用戶對話的狀態,利用這些外部工具,如知識、檢索和代碼解釋器,最後調用您自己的函數來實現。

我們還有另一個案例展示了使用函數調用的可能性。

在為聾人日工作時我們建立了一個小型的定製助手,它了解有關該活動的一切。這是我的手機頁面,在右側,你可以看到一個非常簡單的快速應用程式,它接受麥克風輸入。API 中有六種獨特而豐富的聲音可供選擇,每種聲音都支持多種語言,因此你可以找到最適合的聲音。

在左側可以看到幕後的日誌,我用Whisper把語音輸入轉換成文本,用GPP-4 Turbo的助手,最後用新的TTS API讓它說話。

當助手可以連接到網際網路並對用戶做出反應時,函數調用會變得更加有趣。我們讓助手在這裡隨機選擇五名與會者並給他們500 美元的OpenAI積分。可以看到,助手正在檢查與會者名單,完成後,我挑選了五位開發日參與者,並向他們的帳戶添加了 500 美元的積分。

總結

Sam Altman:

非常酷,今天Assistants API 開放測試版,我們非常高興看到你們用它做什麼。之後任何人都可以啟用。GPTs和Assistants是Agent能夠做更多事情的前身,他們可以逐漸代表你計劃和執行更複雜的操作。

正如我之前提到的,我們確實相信逐步疊代部署的重要性。我們認為,人們現在就開始構建和使用這些代理非常重要,這樣可以了解當他們變得更有能力時世界將會是什麼樣子。我們將根據你的反饋繼續更新我們的系統。

今天我們推出了ChatGPT的GPT自定義版本,它結合了指令、擴展知識和操作。我們推出了Assistants API,以便你更輕鬆地使用自己的應用程式構建輔助體驗。這是我們邁向人工智慧代理的第一步,隨著時間的推移,它們的能力將不斷增強。

我們推出了新的GPT-4 Turbo模型,提供了改進的函數調用知識、更低的價格、新的模式等等。

我們正在深化與微軟的合作關係。

最後,我想花一點時間感謝創造這一切的團隊。OpenAI的人才密度非常高,但要實現這一切,仍然需要大量的努力和協調。我非常感激能夠與他們一起工作。我們做這一切是因為我們相信人工智慧將成為一場技術和社會革命,它將在很多方面改變世界。

我們之前說過,如果你給人們更好的工具,他們就能改變世界。人工智慧將以我們以前從未見過的規模賦予個人權力和代理權,並將把人類提升到我們以前從未見過的規模。我們將能夠做得更多,創造更多,擁有更多。

隨著智能無處不在,我們都將擁有隨需應變的超能力。很高興看到你們將利用這項技術做些什麼,去共同構建新的未來。希望你們明年能再來。感謝。

文章來源: https://twgreatdaily.com/zh-tw/fe892c1147b57ea8529b934a7f0b1e8a.html