(編者按:本文所有圖片的觀點均來自AI大模型的直接回復,無任何導向性,不代表本媒體立場。)
(VRPinea2023年3月20日訊)近日,微軟舉辦了「The Future of Work with AI」發布會,重磅發布AI辦公助手——Microsoft 365 Copilot。簡單來說,Copilot(副駕駛員)是一個搭載了GPT-4大模型能力的AI助手,將接入微軟全家桶產品中。而GPT-4,是數日前由OpenAI發布的目前功能最強大的AI大模型。當下,微軟Office 365旗下的辦公產品包括Word、Excel、Powerpoint、Outlook、Teams等等。一邊是全球最大辦公軟體,一邊是最強AI大模型,兩者結合堪稱「王炸」。
王炸組合里的GPT-4,看上去是不是和去年年底爆火的ChatGPT很相像呢,小P這就來替大家梳理一下它們的關係。
GPT-4是由Open AI開發的最新一代通用語言處理模型,它是GPT系列模型的最新版本,在基礎架構、訓練數據、模型規模和效果等方面都進行了進一步的升級和改進。
而ChatGPT是GPT系列模型的一個分支版本,它以GPT系列模型為基礎,針對聊天機器人這一場景進行了優化和特化,加入了對話生成和上下文理解等特定功能,並對訓練數據和架構進行了調整。因此,ChatGPT與GPT-4是同源同宗的模型。
OpenAI靠著ChatGPT實力吸睛,Google帶著Bard緊隨其後,你方唱罷我登場的AI領域,終於還是出現了「國貨」的身影。在微軟發布會的不到12小時之前,百度舉行了百度文心一言發布會。發布會上百度創始人兼CEO李彥宏展示了文心一言在文學創作、商業文案寫作、數理邏輯推算、中文理解、多模態生成等方面的能力。他表示,「今天的文心一言是過去多年努力的延續。但也不能說我們完全ready了,文心一言要對標ChatGPT、甚至是對標 GPT-4的門檻是很高的,全球大廠還沒有一個做出來的,百度是第一個。我自己測試感覺還是有很多不完美的地方。」
姍姍來遲的文心一言表現如何?口說無憑,是騾子是馬得拉出來遛遛才知道。小P用不同方面的多個問題同時提問兩者後發現,文心一言在上下文記憶、聯繫、糾錯等方面遜色於ChatGPT(3.5版),回復問題的速度也存在肉眼可見的差距(未考慮網速原因的影響),這是算力差距帶來的鴻溝。儘管ChatGPT更占上風,但文心一言也並不是完全被動「挨打」的角色,在某些比較有「中國特色」的問題上,文心一言的回答反而要出色一些。
小P首先詢問了比較常規的日常應用場景的問題,「推薦十首好聽的粵語歌」。在這個問題上,ChatGPT的回答中規中矩,推薦了一些較為經典的粵語歌曲,不過存在一些小瑕疵是,比如它推薦了光良的《童話》,《倩女幽魂》的原唱是張國榮等。除此之外,結尾問候語「希望您會喜歡它們!」也算亮點之一,這更接近於正常對話的模式。文心一言的回答就有些不同尋常了,它的回答是一段粵語語音,這對於粵語歌迷來說無疑算是一個小驚喜了。鑒於推薦歌曲大機率不是嚴肅的場景,那麼文心一言沒有文字回答,不便記憶的缺點也就無傷大雅了。
接下來是一道帶有陷阱性質的高中地理問題,「有一隻熊掉到了陷阱里,陷阱深19.617米,下落時間正好2秒。求熊是什麼顏色的?」關於這個問題,ChatGPT沒有答案,它選擇了質疑問題的準確性,「熊掉進陷阱的深度和下落時間並不能確定熊的顏色,這是一個典型的謬誤推理」。這體現其出色的思辨性,但不可掩蓋的是,它掉進了語言陷阱中,沒有發現題目中的隱含條件。而文言一心則通過物理運算和地理知識的推導,得出了熊是黑色的正確答案。果然,在中國文理科知識這樣的特定領域問題,文心一言就是比「外國貨」懂得多。
(編者按:根據陷阱深19.617米、下落時間2秒的條件,可得出當地的重力加速度為9.8085,進而可以推導出陷阱所在地的緯度大概是44度左右。熊的分布大多集中在北半球,北緯44°分布的只有棕熊和黑熊。深達十多米的陷阱可得出該地土質為衝擊母質,而棕熊棲息在高海拔地區,所以,只有黑熊符合條件。)
在關於「如何看待中國央視網認為孔乙己之所以陷入生活的困境,不是因為讀過書,而是因為放不下讀書人的擔子,不願意靠勞動改變自身的處境?」這一問題的回答上。誇張一些來說,ChatGPT完全吊打了文心一言。前者不僅開篇就提到了「作為一個AI語言模型,我不會對特定觀點進行評價,但是我可以嘗試解釋一下這個觀點所表達的意思」這樣的句子。並且對這一觀點進行了較有思辨性的回覆,對比了孔乙己所處時代和當今社會,表述不同觀點及其產生的原因,還延伸出了對相關社會問題的思考。而文心一言的回覆則更像是一段對題目觀點的擴寫,給人一種機械死板的感覺。
「請從今年高考的高三學生的角度,寫一篇高考誓師演講稿」,在這個問題上,兩者都是表現平平,生成的文章都很模式化,滿是一股公關辭令的味道。不過倒也正常,目前來說,我們不能指望兩個AI大模型能寫出,像前段時間登上熱搜的湖南某高中「誓師女孩」那樣激情澎湃的演講。情緒,是AI所不具備的能力。
小P最後還詢問了一些文史哲方向的問題,如解讀明朝哲學家王陽明四句教的涵義等,文言一心的回答是低於預期的,只能給出一些淺層次的回答,甚至還會給出一些張冠李戴的回覆。而ChatGPT的回覆則有一定的邏輯性,但在深度層面的理解上依舊是有所欠缺的。在小P看來,這方面的不足是技術局限性的必然結果,AI大模型的「思考」還處在初級階段,主觀意識過於濃厚的問題,已經超出了它的能力範圍。
結合上述ChatGPT和文心一言的表現來看,AI想要取代人類員工還有較長的一段路需要走,網際網路、新聞、設計等行業從業人員大規模失業的場景還不會發生。但人工智慧最大的特點就是自我學習,目前AI大模型的一些「滿口胡言」是局限於訓練數據無法實時更新的弊端。一旦技術進步升級,解決掉現有問題之後,或許,以ChatGPT為代表的AI大模型會像比爾·蓋茨認為的那樣,其意義甚至超過PC、網際網路的誕生,標誌著一個全新時代的來臨。
結語
文心一言與ChatGPT之間的差距真實存在,想讓文心一言在短時間內完成追趕,幾乎是不可能的事情。但毋庸置疑的是,文心一言的發布實現了中文語言大模型AI生成式產品從無到有的突破,對於中文網際網路來說是個標誌性的事件。
希望面向公眾開放後,文心一言可以通過用戶們大量的搜索請求進行學習、改進和升級,從而提升處理相應問題的準確性和速度。士別三日,當刮目相看,對於AI大模型來說更是如此。
本文屬VRPinea原創稿件,轉載請洽:[email protected]