「文心一言」APP,真的好難用!

2023-07-12     AI狐頭條

原標題:「文心一言」APP,真的好難用!

原創 | 網羅燈下黑
wldxh8

最近,百度在蘋果 App Store 悄咪咪上線了自家的「文心一言」,一直掛在「效率」免費排行榜前十的位置(估計快了)。

說實話,今年國產大模型落地不少,但咱們還真沒有正兒八經的測試過,一方面是在通用大語言模型這裡,領跑者收穫了全部目光,憑空拔高了預期;另一方面則是,作為一個老倒霉蛋兒,國內這些大模型的內測資格是真滴難搞。

不過還好,雖然幾個月前首次內測沒搞到,但排了這麼長時間的隊,也算是終有所得。

關於「文心一言」的 App 版還有個小插曲,幾個月前百度因此控告過盜版,不過這也算 App Store 里的老傳統了。

話說回來,對於這種「新鮮出爐」的工具,還是需要拉出來溜溜,至於評價,倆字:難評。

文字對話

整體來看,文心一言的 App 分成「對話」和「發現」兩個板塊,前者就是多輪對話,後者則是內置好參數的一個個小對話 bot。

所以先測對話,我請出了之前用來分辨 GPT-3.5 和 GPT-4 的經典三問。

一問:昨天的當天是明天的什麼?

文心一言規避了想像中的答案,但又挑不出來毛病。

我想大概是我問的有問題,繼而更換了兩次問法,嗯,和 GPT-3.5 一個水準。

二問:樹上 9 只鳥,打掉 1 只,還剩幾隻?

這道題的難點不是計算,而是能不能分情況討論,意識到現實中其他鳥會飛走,文心一言很明顯是當數學題來做了,嗯,和 GPT-3.5 一個水準了。

三問:魯迅為什麼暴打周樹人?

這次文心一言的回答很完美,清晰的判斷出了問題里的雷。

不過值得驚喜的是,除了經典三問,像以前一問就錯的諧音雙關梗,現在的文心一言可以輕鬆拿下。

當然,文字對話可不是今天的重點,重點是文心一言 App 支持的多模態輸入,說人話就是能看懂圖了。

圖片對話

圖片多模態輸入這個功能,OpenAI 那邊畫餅已久,咱不是幸運兒自然沒機會體驗,文心一言的搶跑是值得點贊的。

效果嘛,咱們一起來看測試。

從網上找了張相擁在一起的男女,文心一言很輕鬆的判斷出了兩人的關係:

發了張鳥巢,也能認出這個標誌性建築:

發了張表情包,也識別出了湯姆和傑瑞的出處,雖然理解上有些生硬,但整體也不算錯。

但也有問題,比如這張人眼很好分辨的東方明珠,文心一言點出了黃浦江畔,卻沒辦法確定具體位置。

好事多磨,耐心多追問幾句,文心一言是真的忽略了東方明珠。

至於你說圖裡的文字能不能識別?我找了個表情包,還專門點了下文字很重要。

沒想到在文心一言的回答里看到了「麥當勞」三個字,本以為它能識字,但追問下去,真正暴露麥當勞信息的,是圖中右下角的「M」。

當然,我硬問下去,生成式 AI 不可避免的幻覺就該來了。

關於圖片輸入,評價是有用,但沒那麼有用,不過和不能識圖的 GPT-3.5 比,可謂是吊打了。

在「對話」這個板塊,現階段的文心一言有明顯進步,但你落地到應用,還得看「發現」。

發現

就像前面說的,發現里是 AIGC 的大雜燴,是預設了參數的對話機器人,11 個大場景,120 個小助手。

特色是有特色了,但總覺得這是一個實驗性質的功能,說人話就是還有進步空間。

比如「華山論劍 PK 劇情」和「10 年後甦醒的我」這兩個小助手,以為可能是個文字接龍遊戲,但只是預設好的擴寫。

而且就拿 PK 說,我前後叫了「wldxh、小明、小紅、小黑」等等,雖然過程可能有壓力,但這場華山論劍我就沒輸過,主打一個有黑幕,反手一個高情商。

所以角色扮演、娛樂性質的小助手咱就不測了,除非你喜歡諸葛亮教你學習。

在「職場」里有一個「Excel 公式生成」小助手,這個功能算是挺頂的,把難搞的公式以提問的形式讓 AI 解決,而且有公式、有解釋,很到位了。

同樣「職場」,裡面還有「代碼解釋」的小助手,我把以前分享過的油猴腳本發給了它,解釋的沒毛病,但術語還是多了些,代碼小白想用起來,可能需要連續多問幾嘴。

至於繪畫,文心一言的繪畫能力絕對是被一割再割,哪怕你再熟悉 SD 和 MJ 的提示詞,也難在這裡大戰手腳,可以一試,但不值得細玩。

結語

差不多了,文心一言這次的 App 倒是還有很多趣味玩法,但怎麼說呢,隔了前面 AI 快速疊代的這幾個月,你很難找到所謂的驚喜。

這次測試下來,文心一言值得一夸的是響應速度夠快,沒有門檻,更沒有封號的問題,至於回答質量,比幾個月前的它強了不少。

一句話總結:百度出了個可以一試的免費工具,但,難評。

文章來源: https://twgreatdaily.com/d41da3b2e5ab6ea992a251977b5aae31.html