孰優孰劣｜百度文心一言vs微軟ChatGPT

（編者按：本文所有圖片的觀點均來自AI大模型的直接回復，無任何導向性，不代表本媒體立場。）

（VRPinea2023年3月20日訊）近日，微軟舉辦了「The Future of Work with AI」發布會，重磅發布AI辦公助手——Microsoft 365 Copilot。簡單來說，Copilot（副駕駛員）是一個搭載了GPT-4大模型能力的AI助手，將接入微軟全家桶產品中。而GPT-4，是數日前由OpenAI發布的目前功能最強大的AI大模型。當下，微軟Office 365旗下的辦公產品包括Word、Excel、Powerpoint、Outlook、Teams等等。一邊是全球最大辦公軟體，一邊是最強AI大模型，兩者結合堪稱「王炸」。

王炸組合里的GPT-4，看上去是不是和去年年底爆火的ChatGPT很相像呢，小P這就來替大家梳理一下它們的關係。

GPT-4是由Open AI開發的最新一代通用語言處理模型，它是GPT系列模型的最新版本，在基礎架構、訓練數據、模型規模和效果等方面都進行了進一步的升級和改進。

而ChatGPT是GPT系列模型的一個分支版本，它以GPT系列模型為基礎，針對聊天機器人這一場景進行了優化和特化，加入了對話生成和上下文理解等特定功能，並對訓練數據和架構進行了調整。因此，ChatGPT與GPT-4是同源同宗的模型。

OpenAI靠著ChatGPT實力吸睛，Google帶著Bard緊隨其後，你方唱罷我登場的AI領域，終於還是出現了「國貨」的身影。在微軟發布會的不到12小時之前，百度舉行了百度文心一言發布會。發布會上百度創始人兼CEO李彥宏展示了文心一言在文學創作、商業文案寫作、數理邏輯推算、中文理解、多模態生成等方面的能力。他表示，「今天的文心一言是過去多年努力的延續。但也不能說我們完全ready了，文心一言要對標ChatGPT、甚至是對標 GPT-4的門檻是很高的，全球大廠還沒有一個做出來的，百度是第一個。我自己測試感覺還是有很多不完美的地方。」

姍姍來遲的文心一言表現如何？口說無憑，是騾子是馬得拉出來遛遛才知道。小P用不同方面的多個問題同時提問兩者後發現，文心一言在上下文記憶、聯繫、糾錯等方面遜色於ChatGPT（3.5版），回復問題的速度也存在肉眼可見的差距（未考慮網速原因的影響），這是算力差距帶來的鴻溝。儘管ChatGPT更占上風，但文心一言也並不是完全被動「挨打」的角色，在某些比較有「中國特色」的問題上，文心一言的回答反而要出色一些。

小P首先詢問了比較常規的日常應用場景的問題，「推薦十首好聽的粵語歌」。在這個問題上，ChatGPT的回答中規中矩，推薦了一些較為經典的粵語歌曲，不過存在一些小瑕疵是，比如它推薦了光良的《童話》，《倩女幽魂》的原唱是張國榮等。除此之外，結尾問候語「希望您會喜歡它們！」也算亮點之一，這更接近於正常對話的模式。文心一言的回答就有些不同尋常了，它的回答是一段粵語語音，這對於粵語歌迷來說無疑算是一個小驚喜了。鑒於推薦歌曲大機率不是嚴肅的場景，那麼文心一言沒有文字回答，不便記憶的缺點也就無傷大雅了。

接下來是一道帶有陷阱性質的高中地理問題，「有一隻熊掉到了陷阱里，陷阱深19.617米，下落時間正好2秒。求熊是什麼顏色的？」關於這個問題，ChatGPT沒有答案，它選擇了質疑問題的準確性，「熊掉進陷阱的深度和下落時間並不能確定熊的顏色，這是一個典型的謬誤推理」。這體現其出色的思辨性，但不可掩蓋的是，它掉進了語言陷阱中，沒有發現題目中的隱含條件。而文言一心則通過物理運算和地理知識的推導，得出了熊是黑色的正確答案。果然，在中國文理科知識這樣的特定領域問題，文心一言就是比「外國貨」懂得多。

（編者按：根據陷阱深19.617米、下落時間2秒的條件，可得出當地的重力加速度為9.8085，進而可以推導出陷阱所在地的緯度大概是44度左右。熊的分布大多集中在北半球，北緯44°分布的只有棕熊和黑熊。深達十多米的陷阱可得出該地土質為衝擊母質，而棕熊棲息在高海拔地區，所以，只有黑熊符合條件。）

在關於「如何看待中國央視網認為孔乙己之所以陷入生活的困境，不是因為讀過書，而是因為放不下讀書人的擔子，不願意靠勞動改變自身的處境？」這一問題的回答上。誇張一些來說，ChatGPT完全吊打了文心一言。前者不僅開篇就提到了「作為一個AI語言模型，我不會對特定觀點進行評價，但是我可以嘗試解釋一下這個觀點所表達的意思」這樣的句子。並且對這一觀點進行了較有思辨性的回覆，對比了孔乙己所處時代和當今社會，表述不同觀點及其產生的原因，還延伸出了對相關社會問題的思考。而文心一言的回覆則更像是一段對題目觀點的擴寫，給人一種機械死板的感覺。

「請從今年高考的高三學生的角度，寫一篇高考誓師演講稿」，在這個問題上，兩者都是表現平平，生成的文章都很模式化，滿是一股公關辭令的味道。不過倒也正常，目前來說，我們不能指望兩個AI大模型能寫出，像前段時間登上熱搜的湖南某高中「誓師女孩」那樣激情澎湃的演講。情緒，是AI所不具備的能力。

小P最後還詢問了一些文史哲方向的問題，如解讀明朝哲學家王陽明四句教的涵義等，文言一心的回答是低於預期的，只能給出一些淺層次的回答，甚至還會給出一些張冠李戴的回覆。而ChatGPT的回覆則有一定的邏輯性，但在深度層面的理解上依舊是有所欠缺的。在小P看來，這方面的不足是技術局限性的必然結果，AI大模型的「思考」還處在初級階段，主觀意識過於濃厚的問題，已經超出了它的能力範圍。

結合上述ChatGPT和文心一言的表現來看，AI想要取代人類員工還有較長的一段路需要走，網際網路、新聞、設計等行業從業人員大規模失業的場景還不會發生。但人工智慧最大的特點就是自我學習，目前AI大模型的一些「滿口胡言」是局限於訓練數據無法實時更新的弊端。一旦技術進步升級，解決掉現有問題之後，或許，以ChatGPT為代表的AI大模型會像比爾·蓋茨認為的那樣，其意義甚至超過PC、網際網路的誕生，標誌著一個全新時代的來臨。

結語

文心一言與ChatGPT之間的差距真實存在，想讓文心一言在短時間內完成追趕，幾乎是不可能的事情。但毋庸置疑的是，文心一言的發布實現了中文語言大模型AI生成式產品從無到有的突破，對於中文網際網路來說是個標誌性的事件。

希望面向公眾開放後，文心一言可以通過用戶們大量的搜索請求進行學習、改進和升級，從而提升處理相應問題的準確性和速度。士別三日，當刮目相看，對於AI大模型來說更是如此。

本文屬VRPinea原創稿件，轉載請洽：[email protected]

孰優孰劣｜百度文心一言vs微軟ChatGPT

文章來源: https://twgreatdaily.com/3d55980dee82dfa419de5f8761e21eed.html

一篇文章，讓你決定要不要購買蘋果Vision Pro

AR眼鏡的「iPhone」時刻？AI+AR的大蛋糕，誰能切下最大的一塊？

CES2024，消費電子的春晚，國產黑科技品牌成色如何？

2023年12月SteamVR活躍設備：Quest 3破繭成蝶，Quest 2跌落神壇

Vision Pro專題報道｜六合一精華版

Vision Pro專題報道｜XR陣營該如何邁出下一步

Vision Pro專題報道｜風口機遇篇

Vision Pro專題報道｜內容推演篇

Vision Pro專題報道｜交互邏輯分析篇

Vision Pro專題報道｜硬體分析篇

《博德之門 3》斬獲TGA 2023六項大獎，RPG遊戲VR化會是VR遊戲的新出路嗎？

平衡還是妥協？現階段「合理」的ARknovv A1

PICO裁員背後，做錯了哪些事？

Game Changer？超高端XR頭顯會是行業改變者嗎？

VR只是「中場休息」，不是「中道崩殂」

2023年的VR/AR設備都在哪些方面取得了進步？

這些功能，未來VR頭顯的殺手鐧？

一文詳知，2023年的VR市場到底怎麼了？

看完這篇，可別再搞不懂AR設備和VR設備的區別了

蘋果Vision Pro破局的關鍵會是虛擬社交嗎？

回顧：9月全球XR行業投融資信息匯總

對於真AR眼鏡而言，雷鳥X2邁出了關鍵性的一步

Unity收費哪李貴了？結果：公司CEO宣布辭職

一文速看，Meta Connect 2023上發布了哪些產品？（精編版）