除了模型,GPT 們還在卷什麼?

2023-05-29     少數派

原標題:除了模型,GPT 們還在卷什麼?

ChatGPT 問世後,各大公司都在「大模型」上下了苦功,模型能力也成為大家最關注的話題。ChatGPT 雖直接定義了基於大模型的生成式對話機器人這個產品類型,其模型的強大也導致大家都忽略了它在產品使用上的問題。

其實不管是底層模型開發的大廠還是專注於應用層的小廠,又或者是開源的獨立開發者,都在模型能力之外的產品體驗上暗自較勁,以不同的姿態參與到這場能夠定義新的人機互動方式的對話革命中來。

那除了模型,他們還在「卷」些什麼?

大廠:專注模型

體驗略顯「簡陋」,主打一個 less is more

ChatGPT:三件套框架定義極簡

ChatGPT 作為行業標杆,直接定義了生成式對話機器人行業標準。免費版本的 ChatGPT 早期只有對話、對話管理以及簡單的主題設置功能,靠著模型能力席捲全球。隨著用戶的增多和抱怨,ChatGPT 的產品經理也坐不住了開始逐步增加一些功能。

最令人深刻的當屬 Upgrade to Plus,牢牢霸占左下角的設置頁,一眼望過去只有兩個字,「充錢」。除此之外,ChatGPT 也逐步增加了主題設置、隱私管理等功能,但仍然突出一個克制,頗有小龍哥真傳。

ChatGPT 的 Web 介面,由對話功能、對話管理、帳戶管理三個分區構成

付費版 ChatGPT 主要的區別在於增加了模型切換的按鈕,以及在設置中增加了 Beta Features 的功能,可以使用聯網搜索功能 Browsing 或者使用其他插件。

Bard & Bing:非差異化競爭

三巨頭的剩下兩家 Google Bard 以及 Bing Chat 也都各有各自的風格,但總體上還是維持著極簡風。

Bard 的功能設計邏輯與 ChatGPT 幾乎一致:對話功能為主,融合必要的對話管理、帳戶管理以及介面設置功能。作為搜索大拿,Bard 在對話的基礎上也引入了搜索的功能,能夠自然地根據問題引入搜索,並呈現融合處理過的結果,體驗上更加 up to date。對於天氣、實時信息的查詢都表現良好。

大模型在生成答案時會有多個答案並且有相應的權重,Bard 的「查看其他答案」功能給用戶提供了更多選擇,當我詢問北京市天氣的時候,它甚至給出了文字版本、表格版本和極簡版本,非常驚艷。

值得一提的是,Bard 的回答生成在交互方面是一次性生成而非打字機模式(文字一個一個出現,有打字機效果,參考 ChatGPT),缺乏了生成過程,體驗上感覺不夠絲滑。

Bard 的「查看其它答案」功能,可以查看多個答案

與 ChatGPT 和 Google Bard 不同的是,Bing Chat 的定位是基於搜索的,它的工作原理是從輸入中總結搜索關鍵詞進行搜索,然後對搜索結果進行總結。每一條回復都會引用相應的來源,這同時導致它在創造力方面更缺乏,但是來源可考、保證了準確性。

Bing 同樣也是極簡風,整體的產品介面設計與其他兩家區別不大,但色彩上明顯更活潑一些。功能上最開始甚至連對話管理的功能都沒有,聊完了您就清空,不留下一絲痕跡。後來才增加「最近活動」的功能,用戶能夠看到自己最近的對話。

Bing 唯一的特點在於設定了三種對話樣式:更有創造力、更平衡、更精確,能夠根據此參數確定模型是更精確還是更有創造性,這與 GPT 模型中的高級參數 Temperature 是對應的。然而因為無法同時對比幾個模式,在使用體驗上用戶很難感受到差別,即使是更有創造力的選項,受限於 Bing 更偏向搜索的定位,搜出的結果依舊缺乏創造力。

對比下來,三巨頭比拼的主要還是模型能力,目前 ChatGPT 還是比較領先;Bard 比較好地融合了搜索和生成兩種模式,體驗上是更優秀一些,Bing 則缺乏使用上的亮點,但靠著一句 GPT-4 模型就足以吸引大部分用戶。

🥈

中小廠: 深耕體驗能力之上體驗狂卷

不同於大廠卷模型能力,中小廠和個人開發者們更多將注意力放在了模型層上的應用層,依託各家大廠的底層模型能力,在功能和體驗方面卷的飛起。

Perplexity:基於搜索的 AI 對話產品該怎麼做

首先要說的就是 Perplexity,一家對話式的搜尋引擎,體驗上可以說是完爆 Google Bard 和 Bing Chat。Perplexity 翻譯為「困惑度」,是人工智慧領域用來描述語言模型效果的一個常用指標,模型困惑度越小,說明模型越強大。Perplexity 是一家只有 14 個員工的小型跨學科團隊,但在產品力上可以說是完爆大廠,堪稱 more is more 的典範。

Perplexity 首頁

在基本的 ChatGPT 式對話架構三件套基礎上,Perplexity 融合了垂直領域搜索(學術、YouTube、Reddit、Wolfram 等)、搜索歷史、搜索熱榜、以及 Copilot(類似 AutoGPT)等功能。UI 設計採用了傳統的搜索布局,對話框在螢幕偏上方,而非對話類框架輸入框在下方的模式,讓人一眼就知道,這個產品是更「搜索」的產品。

從這點上來說,Perplexity 比 Google 和 Bing 更加突出了自己的搜索定位,旗幟鮮明、定位清晰。產品的邏輯則與 Bing 類似,是對搜索結果的總結(summerize),通過多次使用感覺對文獻的引用更加全面,比 Bing 更加具有創造性一些。在多輪對話當中,Perplexity 還增加了相關話題,預測了根據答案你可能會有的其他疑問,順利的話只需要問一次,剩下的問題靠點擊就可以解決了,體驗上很順暢。

對於「如何成為一名少數派作者」,筆者分別對 Perplexity 和 Bing Chat 做了測試,從回答的內容來說,Perplexity 的內容更加詳實,參考來源更多,同時搜索後的介面在延伸閱讀、follow up 提問以及排版優化上,都比 Bing Chat 體驗要好。巨硬果然是拿腳做產品。

對於「如何成為一名少數派作者」的回答結果

Poe:「美國知乎」的縫合怪

Poe是「美國知乎」Quora 推出的官方 AI 聊天應用,接入了 GPT-3.5、GPT-4、Claude、Midjourney 等多種 AI 服務,是目前最官方的「AI 縫合怪」。

其最大的營銷點:可以免費使用 GPT-4 和 Claude Instant,然而點進去你就會發現 GPT-4 每天只能用 1 次、每個月可以使用 30 次,只能說是聊勝於無吧。另外除了縫合之外,其單個服務的產品體驗非常簡陋,幾乎只有對話功能,長期使用體驗較差。

其官方的 AI 對話助手 Sage 在使用體驗上沒有什麼獨特之處,應該也是用了 GPT-3.5 之類的模型。

Forefront:ChatGPT 最佳代替品

免費 GPT-4 幾乎是所有套殼應用最有效的宣傳方式,只要你有這個功能,哪怕是每天只能用 1 次,你都能騙來一大波流量(鞭屍 Poe)。

而 Forefront 幾乎做到了 GPT-4 的全免費。它來自一個 GitHub 項目,通過逆向工程 Poe、Bing 等使用了 GPT-4 的大廠,為普通網友提供免費的 GPT-4 連接,在 GitHub 上狂砍 3.7 萬星標,幾乎是最近增長最快的項目。

Forefront 內置了豐富的人格預設,能夠滿足用戶多樣化的使用需求。人格化預設來自一個經典的 prompt 技巧:讓 ChatGPT 扮演某一種角色,這樣它的回答能夠更加準確。Forefront 可以一鍵選擇超多人格,達文西、喬布斯、軟體開發工程師等,提供了豐富的場景模板,編程幫助、創意寫作、學術研究等場景都可以滿足。

Forefront 對話設置首頁:GPT-4 和人格設置異常突出

套殼應用細節爆炸,深度玩家福音

說完了官方主力軍們,接下來介紹一下依託於官方 API 的各種套殼產品。它們主要是在模型能力上對前端交互進行優化並增加了一些輔助功能,用戶可以將自己的 API 填入並使用。

這類產品更適合深度體驗者以及當成生產力工具,能夠定製化的細節非常多。

ChatBox:多平台客戶端之王

ChatBox是目前最成熟的多平台 AI 聊天客戶端,用戶可以自主可以接入 ChatGPT、Azure ChatGPT 服務、Claude API 等,在 GitHub 上獲得了 11.7 萬星標,橫掃客戶端界。對於對客戶端有執念的用戶,它也是 Windows 上最好的選擇。

ChatBox 的架構也是基於 ChatGPT 的三段式架構,但每個部分都增加了更多功能,滿足多樣化的效率使用體驗。它在對話管理功能中還設置了多種預設 pormpts,包括軟體開發、私人助理、誇誇機等模式。

在設置中,ChatBox 也支持高級參數和更詳細地信息顯示:首先可以自定義 temperature 參數,調整模型答案的隨機性、創造性;同時可以顯示 API 的 token 用量,可輸入輸出的 token 數量估計,以及調整文字大小、默認語言等功能。用下來應該算是 Windows 上用起來體驗最好的客戶端。

MacGPT:如果只能有一款 GPT 客戶端,那就是 MacGPT

至於為什麼 ChatBox 只能是 Windows 最好用的桌面客戶端,因為 Mac 平台上有更卷的產品:MacGPT

得益於 Mac 系統的特點,MacGPT 支持 5 種模式:Web、API、任務欄模式、全局呼出以及 Intext。任何場景都能夠滿足需求。

Web 模式相當於一個簡版瀏覽器窗口,整個使用體驗與 ChatGPT 一致;API 模式體驗與 ChatBox 類似,相當於一個本地的 Mac 客戶端;任務欄模式可以支持從任務欄喚醒並且隨時開啟對話,依託於任務欄可以保證在任何場景下都可以快速啟動 ChatGPT,非常高效;全局呼出模式則支持通過熱鍵呼出置頂的對話欄並立刻展開對話,用過 Alfred應該都能明白這種體驗是多麼流暢。

MacGPT 全局呼出模式

Intext 模式更是 amazing,簡直是文字工作者的大殺器。當你在任何文本輸入的環境(備忘錄、Word 等)中打出 /gpt,隨後的內容就會被作為 ChatGPT 的輸入,並且直接在當前文本環境中生成回答,完全無需切換應用就能使用 ChatGPT 進行問答,並且直接插入到文檔中,簡直就是 Notion AI 的全局版本,必須吹爆。

MacGPT 的 Intext 模式

ChatGPT-Next:每個人的雲服務 AI 助手

如果一定要選一個 Web 端 ChatGPT 的套殼客戶端,那我願稱 ChatGPT-Next 是個人助理之王。

它的作者不僅開發了這個 Web 端應用,還開發了一鍵部署到 Vercel(前端託管伺服器)的功能。也就是說只需一個 API key 和幾次單擊,每個人都能擁有自己的專屬 ChatGPT 客戶端,自用、團隊用或者作為服務提供給其他人,都像呼吸一樣簡單。

筆者成功將自己部署的客戶端發給了爸媽和姥姥,給他們帶去了一點小小的 AI 震撼,姥姥甚至高興地給我做了一大碗紅燒肉。

ChatGPT-Next 的內置人格:創業點子王

產品功能方面 ChatGPT-Next 也是集大成者,預設了 20 種人格和應用場景,且支持自定義;高級參數方面,模型選擇 model、隨機性 tempeture、單次回復限制 max tokens 以及話題新鮮度 presence penalty,都可以根據需求場景精準調節。

同時對話管理中的歷史消息長度壓縮也堪稱王炸級別功能,能夠在上下文數量達到一定的 token 時對上下文進行總結,並清除之前的記憶,有效減少 token 占用,讓對話更持久。最後其介面也是所有 app 中可自定義程度最高的,字體、語音、發送預覽、緊湊邊框,全部可以自定義。

論套殼類產品在功能豐富度和自定義程度方面,ChatGPT-Next 是各個方向中最強的,長期使用下來感受最好,使用 API 的速度也會比各種服務的官方速度更快,是生產力玩家的首選。

國內大廠:生態迅速接入,創業公司更快一步

釘釘、飛書、微信作為國內的三大辦公 IM 巨頭,截至目前都已經有了非官方的開源 AI 機器人接入。國內某創業公司通過開源社區的馬拉松項目,開發了基於釘釘、飛書的 AI 對話機器人矩陣,融合多模態(ChatGPT、DALL·E + Whisper、Midjourney)、圖片創作、表格分析、文檔導出、多話題討論、公式計算等等功能全部可以實現。甚至連 API 也是免費提供的,真正實現了賦能業務,讓國內打工人成為第一批無縫使用 AI 的選手。

在 ToB 功能方面,國內創業公司應該是走在了世界前列,已經完成了產品化的開發,並且可以根據企業情況快速部署,依託 IM 實現辦公的 AI 提效。一鍵快速部署、企業級的AI權限管理、用戶導入導出使用記錄、風險詞攔截等,讓企業用戶順暢使用。

國內某創業公司的企業 AI 機器人產品

微信也有相應的開源機器人,但由於微信平台本身的限制,微信機器人的功能就限制較強了,基本也就是官方的功能移植到了微信對話框中。

據悉美團內部也在進行對話機器人的接入,幫助員工提升工作效率。其小美助手內置了多個量身定製的場景和 prompts,幫助員工能夠快速上手。整體體驗上與 ChatGPT 無異。

國內其他模型大廠的官方客戶端整體都還在狂卷模型能以趕上 GPT-3 的水平,目前也都還處在遮遮掩掩的狀態,想要獲得體驗資格的難度比成熟產品要高的多,因此暫且不做評論,但應該可以確認不會有更令人驚喜的功能。

ChatGPT:App Store 登頂,移動 AI 時代到來

最後聊聊 ChatGPT 本尊。

5 月 18 日,ChatGPT 上線了 App Store 並迅速登頂 iOS 下載榜第一名。移動端的 ChatGPT 也是突出一個簡潔,但整體交互看得出來下了一些功夫:常規對話介面加入了回復的震動反饋,感覺到對面的 AI 真的在打字,體驗爆棚;同時左滑交互可以呼出對話管理功能,右滑交互能夠新開對話,邏輯清晰;整體使用的流暢程度也非常優秀,比 Web 端的體驗好很多。

然而目前手機端的應用場景非常有限,周圍的人也大多將其當成 wiki 問答來用,沒有插件和聯網的加持,移動端目前並沒有太多應用場景,而生產力場景 Web 端效率更高,協作也更加流暢——畢竟我不能上班的時候一直扣手機吧。

但 iOS 客戶端解決了 ChatGPT 充值 Plus 難的痛點,可以通過 App Store 直接訂閱,讓不少用戶終於能夠方便地用上 GPT-4。

移動端的潛力當然是巨大的,現在 ChatGPT 剛剛下場,但其戰略上的「我全都要」是可以窺探到的。在前有 Poe、Snapchat 移動端的情況下,ChatGPT 無疑讓移動端的競爭格局一下子不同了起來,未來會發展成什麼樣子我們拭目以待。

小結

ChatGPT 帶來的 AI 變革將深刻改變社會的發展方向,現在是混沌的亂斗局面,大家都卯著勁想做出點什麼。但模型又不是普通人能做的,所以出現了更多以場景應用為主的產品,也給創業者和開發者們提供了許多 AI 應用的思路。

另外本土化是另一個重要的課題,國內大廠在進度上明顯落後,但應用層已經先行並且有了很多好用的產品,這將來也會是競爭最激烈同時機會最多的地方。乘上這波 AI 的大浪吧,不妨做一頭飛起來的豬。

原文連結:

https://sspai.com/post/79985?utm_source=wechat&utm_medium=social

作者:PandorAI

責編:克萊德

/ 更多熱門文章 /

文章來源: https://twgreatdaily.com/zh-sg/f116f91b34e3af81db8ba99dd22ae137.html