國產AI大戰高考作文!20款大模型橫評,看得我頭皮發麻

2024-06-07     智東西

智東西

作者 | 程茜

編輯 | 心緣

智東西6月7日消息,今天下午,高考首日結束。每年高考率先衝上熱搜的非「高考作文」莫屬,今日上午的語文考試結束不到10分鐘,#高考作文#話題就爆了!

AI這一當下的話題熱詞赫然出現在了新課標I卷的高考語文作文中:

讓AI寫關於「AI主題」的高考作文,能交出滿分答卷嗎?智東西嘗試讓20款主流國產AI智能助手去分別作答,看看它們能否寫出一些高分範文。

現在在手機上用AI大模型已經非常方便,這次橫評有18款國產AI智能助手都有獨立App,有2款通過微信小程序和移動端瀏覽器頁面進行測試,包括:

  • 來自8家網際網路和AI大廠的豆包(位元組跳動)、騰訊元寶、文心一言(百度)、通義千問(阿里雲)、訊飛星火(科大訊飛)、天工AI智能助手(崑崙萬維)、360智腦、商湯商量;
  • 來自5家AI大模型獨角獸的智譜清言、Kimi智能助手(月之暗面)、海螺AI(MiniMax)、百小應(百川智能)、萬知AI(零一萬物);
  • 來自中科院自動化研究所和武漢人工智慧研究院的紫東太初;
  • 來自6家手機大廠的AI助手華為小藝、榮耀YOYO、小米小愛、OPPO小布、vivo藍心小V、魅族Aicy。

基礎考量標準是按照題目要求,字數不少於800字並自擬標題;更高階的則是考察國產AI助手們的寫作、聯想及思辨能力,比如標題是否出彩、主題是否清晰、首尾段是否點題、價值觀是否正確、行文是否流暢、邏輯是否嚴謹、思辨是否深刻、語言是否有文采等。

360智腦是唯一一款稱自己不能生成滿足字數要求的文章的AI助手,給出了多達700字的參考框架和思路,讓用戶自己完善。

從行文措辭來看,所有AI助手都拿捏住在首尾點題的技巧,多數AI助手都用了排比句,並展現出了不同的「個性」。

豆包、商量等妥妥的偏理工思維,用詞比較樸實,走沉穩論證、言之有物的路線;騰訊元寶、文心一言、訊飛星火、天工AI智能助手、OPPO小布等則更具文科思維,語言長短錯落,運用大量形容詞,熟練掌握設問、比喻、排比等修辭技巧,並擅長引經據典,遣詞造句文采飛揚。

通義、智譜清言、Kimi、海螺AI、百小應、萬知AI、紫東太初、華為小藝、榮耀YOYO、小米小愛、vivo藍心小V、魅族Aicy助手等則通篇論文即視感,每段開頭都是「首先」、「其次」、「再者」、「然而」、「此外」、「那麼」、「因此」、「最後」、「總之」、「綜上所述」等關聯詞。

1、位元組跳動-豆包

豆包寫的作文有900+字,以「學會從問題中找機遇,敢於提問、鼓勵探索未知」為主題,通篇文風很沉穩,嚴謹論證,沒有用一些浮華的辭藻,信息密度較高,並在結尾用「看似答案隨手可得」、「真正的智慧和進步往往隱藏在那些有待解答的問題之中」再度扣題。

2、騰訊-騰訊元寶

騰訊元寶寫的作文有800+字,標題有點像口號和廣告語,主題提倡「保持獨立思考、勇於探索未知、AI發展不會成為絆腳石」,行文運用了很多修辭手法,用到很多的形容詞,並引用了明朝思想家陳獻章的名言。

3、百度-文心一言

文心一言的「發現」有款「高考語文作文輔導」工具。用它寫的作文有800+字,擬標題的思路和畫風跟騰訊元寶異曲同工,行文看起來感情更充沛,非常嫻熟地高密度運用設問、比喻、排比等修辭手法,並大量引經據典,提到孔子、莊子、魯迅等名人的名言以及牛頓、愛因斯坦的事跡。

4、阿里雲-通義

通義新上線了「高考作文狀元」工具,用這個工具寫的作文有900+字,標題「問天問地問心」乍一看挺有哲學味兒,正文則變成嚴密論證的畫風,「首先……其次……再者……因此……綜上所述……」的結構看起來邏輯清晰,但也顯得有些呆板平淡,語言美感稍弱一籌。

5、科大訊飛-訊飛星火

訊飛星火寫的作文有800+字,主題是「網際網路和AI會催生更多問題」,長短段落交錯,整體偏論述風,中間引用了馬克思、馬雲等名人的名言,並用屈原、哥白尼、伽利略、牛頓、愛因斯坦的事跡來論證「提問需要智慧」、「提問讓世界變得更美好」,結尾扣題強調「在問題中走向未來」。

6、崑崙萬維-天工AI智能助手

天工AI智能助手的作文有800+字,語言看起來很華麗,主題是「問題不會因為答案增多而減少,而會拓展視野,催生更多的問題」,不過形容詞用得有點泛濫,從標題到正文的一些比喻都需要反覆咀嚼消化一下跟作文題的關聯度。

7、360-360智腦

360智腦說它無法直接生成滿足字數要求的文章,只能提供大致框架和思路,然後寫了一個超過700字的參考示例,讓用戶自己進一步展開和完善。框架邏輯還是很嚴謹扣題的,讓用戶先論證網際網路和AI擴展信息獲取的渠道和速度,有助於加速解決問題,但也會催生新的問題,所以人類會持續思考和探索,教育和創新很重要。

8、商湯科技-商量

商湯商量沒有獨立的App版本,測得是移動端瀏覽器網頁。它寫的作文有900+字,標題也用了比喻,行文偏理性,就事論事地論述「問題不會隨著答案的增多而減少」,但因為平鋪直敘的語句偏多,也沒有犀利的文辭,讀起來略顯寡淡,不像前面運用大段排比句的文章那麼有氣勢。

9、智譜AI-智譜清言

智譜清言寫的作文有900+字,標題直接易懂,走得也是論述風,沒有大量的修辭手法,用了很多關聯詞,主題「網際網路和AI能很大程度解決問題,但會產生新的問題,需要辨別真偽、深入思考、積極探索的能力」很清晰,語言有點拉拉雜雜,不是很簡練,比如「網際網路和人工智慧」在全文出現不下十次,這就能頂超過80字。

10、月之暗面-Kimi智能助手

Kimi智能助手寫的作文有900+字,標題是所有AI助手中最長的,「加速器」和「終結者」兩個比喻都清晰易懂,用「首先……然而……此外……那麼……總之」串聯全文,從論述網際網路和AI解決問題的巨大潛力和負面影響,引出平衡便利性與保持獨立思考能力的方法,優點是結構規整邏輯清晰,缺點是通篇說理會顯得有些枯燥。

11、MiniMax-海螺AI

海螺AI的作文字數只有700+。標題以「信息洪流」為背景,但與題干中的網際網路與AI應用相關性不強。正文部分看起來邏輯簡單,論述部分均以「技術的發展」開頭再給出結論。整體來看,文風表述呆板,且沒有幫助理解的案例或吸睛的名言典故,缺乏亮點。

12、百川智能-百小應

百小應的作文只有600+字,其文章思路與其他文章不同,沒有率先從AI發展開始論述,而是緊扣主題的「問題」,將人們好奇心的重要性先呈現出來,隨後層層遞進與當下技術的發展相銜接。但文字部分平鋪直敘,沒有特別抓人眼球的地方。

13、零一萬物-萬知AI

萬知AI沒有獨立的App版本,測得是微信小程序。它寫的作文剛滿800字,但沒寫標題,扣掉2分。文風也是偏說理,通篇「首先……然而……此外……因此……總之」。論點上略有新意,提出「網際網路和AI沒有減少問題,而是改變了問題的性質和形式,使得人們從更多關注如何獲取信息,轉向更多思考如何處理和理解這些問題」,其餘論點則與其他文章大同小異。

14、中科院-紫東太初

紫東太初的作文只有600+字,文章前半部分對題乾的兩部分內容進行了拆解,後半部分將重點放到了最後的「問題是否減少」上。但後半部分內容缺失對網際網路普及、AI廣泛應用的聯繫,且從最後一段的結論來看,基本上是將上述幾部分內容的關鍵語句進行了重複引用。

15、華為-小藝

華為小藝的作文只有500+字,標題與作文題目的相似度很高。文章正文的段落通過「首先……其次……最後」進行連接,文章邏輯清晰,每一部分層層遞進,從問題的本質、AI的影響、新問題的出現等,最後升華將人們需要提升思考能力的主題點明。

16、榮耀-YOYO助理

榮耀YOYO助理的作文有800+字。文章標題沒有新意,與作文題干相近。在正文中,通過關聯詞語與一句話總結去呈現文章的主要邏輯。相比於開篇華麗的詞藻,作文的正文部分敘述過於冷靜,有割裂感。

17、小米-小愛同學

小米小愛同學的作文只有500+字,文章結構簡單清晰,以「網際網路和AI不能消除問題本身」為主題,通過AI的具體案例引出新的挑戰與機遇,最後得出「問題不會被AI消除,只能改變我們解決問題的方式」的結論。

18、OPPO-小布助手

OPPO小布助手寫的作文只有600+字。作文標題直接引用「問渠哪得清如許,為有源頭活水來」的古詩,且本意與文章內容相扣,正文部分引用名言或舉例論證時,將標題中的「源泉」等與AI、問題的關係進行了闡明。不過文章用語稍顯平淡,內容單調,段落間邏輯關係不明確。

19、vivo-藍心小V

vivo藍心小V寫的作文只有600+字,標題直接套用題干「問題是否會越來越少?」,沒有發散思考。正文以純粹的議論為主,沒有典型的事實案例進行支撐,這使得「不意味著我們的問題會減少」的結論說服力不夠。

20、魅族-Aicy助手

魅族Aicy寫的作文只有700+字,標題的問題空泛不明所以,沒有與作文主題強相關。正文部分通過「首先……其次……再者……總之」的表述環環相扣,並輔以「信息海洋」的比喻,最終得出「網際網路和AI的普及並沒有讓我們的問題越來越少」的結論,並最終落腳到用「批判性思維」看待問題。

結語:AI遇上高考,科技與人文對話

AI已經成為當前最熱門的話題,高考作文題目中出現關於「AI應用」的思考,正說明了前沿技術發展對社會的影響,讓更多學生更早關注、接觸到科技的前沿話題,通過探討這類話題激發學生的創新意識等。

與此同時,國內大量AI智能應用助手湧現,是AI技術發展的最直觀體現,同時其生成的內容有助於拓寬人們的思維方式和創新能力,激發更多靈感。

回歸主題,大致瀏覽完國內20位AI「考生」的作文大作後,你會給它們打幾分?歡迎在評論區留言討論。

文章來源: https://twgreatdaily.com/zh-tw/176ae4c855ac2ec14399a47c66aa5e6e.html