百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

2023-03-16     愛范兒

原標題:百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

最近 AI 真是火得沒邊了。

OpenAI 靠著 ChatGPT 實力吸睛,Google 帶著 Bard 緊隨其後,就在昨天,GPT-4 模型又搶盡風頭。你方唱罷我登場的 AI 領域,今天,輪到了百度了。

就在今天下午,備受期待的百度文心一言如期而至。不過在發布會一開場,百度 CEO 李彥宏先給大家打了一劑預防針:

從某種意義上說百度為此(發布文心一言)已經準備了多年,我們十幾年前就開始投入 AI 研究,2019 年就推出了文心大語言模型,今天的文心一言是過去多年努力的延續。

但也不能說我們完全 ready 了,文心一言要對標 ChatGPT、甚至是對標 GPT-4 的門檻是很高的,全球大廠還沒有一個做出來的,百度是第一個。我自己測試感覺還是有很多不完美的地方。

從某種意義上說百度為此(發布文心一言)已經準備了多年,我們十幾年前就開始投入 AI 研究,2019 年就推出了文心大語言模型,今天的文心一言是過去多年努力的延續。

但也不能說我們完全 ready 了,文心一言要對標 ChatGPT、甚至是對標 GPT-4 的門檻是很高的,全球大廠還沒有一個做出來的,百度是第一個。我自己測試感覺還是有很多不完美的地方。

姍姍來遲的文心一言表現如何?和 ChatGPT 的差距有多少?能滿足市場對中文大語言模型的需求嗎?我們對它做了一次全方位解析。

申請內測網站我們也一併放出來 https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552

新一代大語言模型、生成式 AI 產品文心一言,能做什麼?

五大要點:

  • 文學創作;
  • 商業文案的創作;
  • 數理邏輯的推算;
  • 中文的理解;
  • 多模態生成。

針對這五大場景,李彥宏分別進行了演示。值得一提的是,這些演示並非現場操作,而是錄播。

首先是文心一言的文學創作能力,李彥宏連續對文心一言提出了與《三體》相關的若干問題。

首先從演示視頻看來,文心一言的回答速度很快,比 ChatGPT 快很多,另外出來的內容都挺不錯的,後面我們也會把相同的問題扔給 ChatGPT 和必應 Chat,看看三者之間的區別。

動圖未加速

針對商業文案創作,李彥宏向文心一言提問:

如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,可以起個什麼公司名?

如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,可以起個什麼公司名?

以下是它的問答。

別說,還挺像樣的。

還能用它生成新聞稿,可以說是把 AI 從頭用到腳,很符合這家公司的定位。

在數理邏輯推演環節,百度問了個雞兔同籠的問題,文心一言先是發現了題目出錯,後來換了個題目,它就能準確回答出來。

文心一言發布前,已經有人猜測這個語言模型會比 OpenAI、Google、微軟做得更好,因此百度也在這部分炫了個技,文心一言不僅準確回答了成語「洛陽紙貴」的含義,還對背後的金融現象進行了解釋,最後還用這個成語寫了首藏頭詩。

李彥宏在現場也提到,中文是文心一言的優勢,反過來說,對英文素材的解析則成了它的劣勢。

最後介紹了文心一言的多模態生成能力,畫圖、寫長文、根據文字生成短視頻內容,它都一一完成,這是 ChatGPT 所不具備的能力。

還能用生成方言語音

李彥宏還提到,百家號已經在利用文心一言的多模態生成能力,把文字內容視頻化。

會後,首批用戶通過百度提供的內測碼,可以搶先體驗到文心一言,我們已經提交內測申請,未來將在第一時間給大家帶來體驗內容。

在這之前,我們把會上演示的幾個場景,分別喂給了 ChatGPT(3.5 版)和 Bing Chat,看看他們輸出的結果如何。

對比 ChatGPT&Bing Chat,文心一言體驗如何?

演示過程中,李彥宏多次強調百度在中文語言的處理上,處於獨一無二的位置。

相比 ChatGPT 和 Bing Chat,現在的最大的不同點在於多模態生成,即可以通過語言生成海報、語音甚至視頻內容。

發布會演示中,李彥宏展示了使用文心一言生成活動海報、方言語音,並根據提問內容生成與活動相關的視頻。不過生成視頻的成本較高,現階段尚未對所有用戶開放。

圖片、視頻的生成能力確實讓我們眼前一亮,李彥宏也表示,「多模態生成式 AI 是一個明確的發展趨勢」。

除了這一特色功能,我們也很好奇其他能力相比 ChatGPT、Bing Chat 孰強孰弱,所以就用發布會中演示的內容去詢問了 ChatGPT(3.5 版)以及 Bing Chat。先說結論:文心一言在中文領域的表現,確實要優於 ChatGPT、Bing Chat 這兩個前輩。

首先是關於《三體》的提問,Bing Chat 和文心一言均能正確回答作者是誰、來自哪裡的問題,而 ChatGPT 則把劉慈欣的籍貫錯標成了山東。

有趣的是,Bing Chat 的信息來源是百度百科。

而在關於 2023 年初上演的《三體》電視劇版演員的問題中,信息庫停留在 2021 年的 ChatGPT 再次吃癟,表示《三體》電視劇暫未開拍,而 Bing Chat 則在豆瓣中找到了答案。

在商業文案創作方面,三者均可以給出它們的看法,ChatGPT 還貼心的附上了英文名,方便我們進行步入國際市場。

而 Bing Chat 則在第一次詢問時識別錯了問題含義,沒有給我準確的公司名,而是提供了如何起一個公司名的解決方案。

至於三家起的名字哪個更好,就留給大家評判了。

不論是 ChatGPT 還是 Bing Chat,它們在做數學題時並不能讓我們完全放心,不過百度發布會中提到的雞兔同籠問題並沒有難倒二者,均準確的做出了解答。

相比之下,我更喜歡 Bing Chat 的解讀,它更像是一位循循善誘的老師,而文心一言的回答則有點像課後的參考答案。

中文理解方面,文心一言的優勢就體現出來了。

在詢問「當時洛陽的紙到底有多貴」時,ChatGPT 誤以為我詢問的是唐代的物價,告訴我洛陽的紙一點都不貴,Bing Chat 識別上沒有問題,但也沒有給出準確數據。

而文心一言給出兩三千文的價格,至少與我搜索得到的數據是一致的。

相信你也注意到了,且不說寫的內容如何,ChatGPT 和 Bing Chat 都沒有理解什麼是藏頭詩,相比下來,百度文心一言的表現確實出色。

當然,這樣的比較對 ChatGPT 和 Bing Chat 是不公平的,畢竟我們還沒有正式體驗到文心一言,只是與發布會演示比較而已。獲得測試機會後,我們會第一時間體驗文心一言,表現如何到時再見分曉。

李彥宏在發布會中也提到,雖然中文方面優勢明顯,但文心一言針對英文語種、代碼場景的訓練還不夠多,表現也不夠好,相信接下來百度會迅速提升。

腳踏實地,仰望星空

毫無疑問,文心一言的發布對於中文網際網路來說是個標誌性的事件。

正如李彥宏開場時所言,百度是首個做出可以對標 ChatGPT 的產品的大廠,實現了中文語言大模型 AI 生成式產品從無到有的突破。

但另一方面,我們也需要正確看待文心一言與 ChatGPT 之間的差距。

我們今天所說的 ChatGPT,或者其背後的 GPT-4 語言模型,是一個花了 5 年時間、經歷了 4 次疊代,完成了從量變到質變過程。想讓文心一言在這麼短的時間內實現趕超,幾乎是不可能的事情。

從今天的發布會來看,文心一言並不是人們預期中那樣具有革命性的產品,而更像是對百度 AI 技術儲備的一次中期考驗,展現百度也有追逐最先進人工智慧產品的研發能力。

面向公眾開放後,文心一言可以通過用戶們大量的搜索請求進行學習和改進,從而提升處理相應問題的準確性和速度。在 ChatGPT 上,我們已經見識過 AI 語言模型進化的速度。

如果你也期待見到一個真正的「中文版 ChatGPT」,不妨再給文心一言時間和耐心。士別三日,當刮目相看,對於 AI 模型更是如此。

少說廢話。

#歡迎關注愛范兒官方微信公眾號:愛范兒(微信號:ifanr),更多精彩內容第一時間為您奉上。

| · ·

文章來源: https://twgreatdaily.com/zh-hk/356ae5837029f8a97de58c40242de6e8.html