「文心一言」APP，真的好難用！

原創 | 網羅燈下黑

wldxh8

最近，百度在蘋果 App Store 悄咪咪上線了自家的「文心一言」，一直掛在「效率」免費排行榜前十的位置（估計快了）。

說實話，今年國產大模型落地不少，但咱們還真沒有正兒八經的測試過，一方面是在通用大語言模型這裡，領跑者收穫了全部目光，憑空拔高了預期；另一方面則是，作為一個老倒霉蛋兒，國內這些大模型的內測資格是真滴難搞。

不過還好，雖然幾個月前首次內測沒搞到，但排了這麼長時間的隊，也算是終有所得。

關於「文心一言」的 App 版還有個小插曲，幾個月前百度因此控告過盜版，不過這也算 App Store 里的老傳統了。

話說回來，對於這種「新鮮出爐」的工具，還是需要拉出來溜溜，至於評價，倆字：難評。

文字對話

整體來看，文心一言的 App 分成「對話」和「發現」兩個板塊，前者就是多輪對話，後者則是內置好參數的一個個小對話 bot。

所以先測對話，我請出了之前用來分辨 GPT-3.5 和 GPT-4 的經典三問。

一問：昨天的當天是明天的什麼？

文心一言規避了想像中的答案，但又挑不出來毛病。

我想大概是我問的有問題，繼而更換了兩次問法，嗯，和 GPT-3.5 一個水準。

二問：樹上 9 只鳥，打掉 1 只，還剩幾隻？

這道題的難點不是計算，而是能不能分情況討論，意識到現實中其他鳥會飛走，文心一言很明顯是當數學題來做了，嗯，和 GPT-3.5 一個水準了。

三問：魯迅為什麼暴打周樹人？

這次文心一言的回答很完美，清晰的判斷出了問題里的雷。

不過值得驚喜的是，除了經典三問，像以前一問就錯的諧音雙關梗，現在的文心一言可以輕鬆拿下。

當然，文字對話可不是今天的重點，重點是文心一言 App 支持的多模態輸入，說人話就是能看懂圖了。

圖片對話

圖片多模態輸入這個功能，OpenAI 那邊畫餅已久，咱不是幸運兒自然沒機會體驗，文心一言的搶跑是值得點贊的。

效果嘛，咱們一起來看測試。

從網上找了張相擁在一起的男女，文心一言很輕鬆的判斷出了兩人的關係：

發了張鳥巢，也能認出這個標誌性建築：

發了張表情包，也識別出了湯姆和傑瑞的出處，雖然理解上有些生硬，但整體也不算錯。

但也有問題，比如這張人眼很好分辨的東方明珠，文心一言點出了黃浦江畔，卻沒辦法確定具體位置。

好事多磨，耐心多追問幾句，文心一言是真的忽略了東方明珠。

至於你說圖裡的文字能不能識別？我找了個表情包，還專門點了下文字很重要。

沒想到在文心一言的回答里看到了「麥當勞」三個字，本以為它能識字，但追問下去，真正暴露麥當勞信息的，是圖中右下角的「M」。

當然，我硬問下去，生成式 AI 不可避免的幻覺就該來了。

關於圖片輸入，評價是有用，但沒那麼有用，不過和不能識圖的 GPT-3.5 比，可謂是吊打了。

在「對話」這個板塊，現階段的文心一言有明顯進步，但你落地到應用，還得看「發現」。

發現

就像前面說的，發現里是 AIGC 的大雜燴，是預設了參數的對話機器人，11 個大場景，120 個小助手。

特色是有特色了，但總覺得這是一個實驗性質的功能，說人話就是還有進步空間。

比如「華山論劍 PK 劇情」和「10 年後甦醒的我」這兩個小助手，以為可能是個文字接龍遊戲，但只是預設好的擴寫。

而且就拿 PK 說，我前後叫了「wldxh、小明、小紅、小黑」等等，雖然過程可能有壓力，但這場華山論劍我就沒輸過，主打一個有黑幕，反手一個高情商。

所以角色扮演、娛樂性質的小助手咱就不測了，除非你喜歡諸葛亮教你學習。

在「職場」里有一個「Excel 公式生成」小助手，這個功能算是挺頂的，把難搞的公式以提問的形式讓 AI 解決，而且有公式、有解釋，很到位了。

同樣「職場」，裡面還有「代碼解釋」的小助手，我把以前分享過的油猴腳本發給了它，解釋的沒毛病，但術語還是多了些，代碼小白想用起來，可能需要連續多問幾嘴。

至於繪畫，文心一言的繪畫能力絕對是被一割再割，哪怕你再熟悉 SD 和 MJ 的提示詞，也難在這裡大戰手腳，可以一試，但不值得細玩。

結語

差不多了，文心一言這次的 App 倒是還有很多趣味玩法，但怎麼說呢，隔了前面 AI 快速疊代的這幾個月，你很難找到所謂的驚喜。

這次測試下來，文心一言值得一夸的是響應速度夠快，沒有門檻，更沒有封號的問題，至於回答質量，比幾個月前的它強了不少。

一句話總結：百度出了個可以一試的免費工具，但，難評。

「文心一言」APP，真的好難用！

14歲男孩殺死了自己，在此之前，他迷上了他的AI伴侶

暴跌125億！AI「巨頭」萬興科技，泡沫有多大？

AI重構下的百度網盤：限速頑疾久治不愈、屢曝安全漏洞，用戶信息如何守護？

深圳地下交通「最強大腦」背後：商湯科技五年半虧了近五百億

第一批搶跑的人，用AI搞了上千萬？

AI 幽靈，「刺殺」小說家

我用ChatGPT做了一下姜萍的數學競賽題，它懵了，我也懵了！

蘋果的大模型衝刺：沒有 AI 新產品，只有新功能

大模型軍備競賽遠未結束，但已註定成為少數人的遊戲

為了0.0003元，阿里和位元組槓上了

Kimi掙錢的樣子好抽象！

降價會是位元組AI的出路嗎？

別再狂吹GPT-4o了！不要只顧著漲他人威風、滅自己志氣

月之暗面撞上算力牆？

小紅書的大模型有點慫

三天暴漲一倍，商湯翻身還是泡沫？

巴菲特：我對AI一無所知

阿里想藉助AI電商反殺拼多多？

苦苦掙扎的周鴻禕，搖擺不定的360

湯曉鷗，倒在了商湯最難的時候

AI 製作的成人電影，為什麼這麼多人在看？

被冤枉的李開復，被「錯付」的中國開源

營收下降，利潤下滑！聯想梭哈大模型？

我找兩個熱門行業問現在AI如何取代人，結果被潑了冷水