混元大模型初體驗：目前不太出色

原創 | 算法一隻狗

雖然說之前已經有很多公司發布了大模型，但是騰訊在大模型上還是令人期待的。

隨著ChatGPT帶來的AI大模型潮流的發展，國內各家大公司都是卯足力氣發布自家的大模型。自今年3月份以來，百度發布了文心一言，並在近期發布了文心一言APP。4月份則是阿里發布的通義千問，同時近期也發布了多模態通義千問Qwen-Chat。而此後國內大模型就一直百花齊放，因此又被網友稱為「百模大戰」。

雖然「百模大戰」已經然很多網友感覺到了疲勞。主要原因在於：

利用現有的榜單進行刷榜，其實人們已經很少去關注了，刷榜只會給人們帶來麻木在開源模型中，目前只有LLAMA2真正使用了RLHF，其他模型還是欠缺了許多

大模型目前的發力點還在於實用性

從9月7日騰訊全球數字生態大會上，騰訊發布了自家大模型「混元助手」來看，其實騰訊更傾向於把大模型真正變成生產力，來提高工作效率。這就需要不斷依賴於混元大模型與騰訊業務的緊密結合，從而找到更好的發力點。

大模型不僅僅要「參數量大」，更需要在多領域上進行充分應用，把用戶的痛點進行充分解決，讓更多開發者參與進來進行開發，從而更好的促進自身大模型的生態打造。

從官網介紹，混元大模型在複雜語境下，能夠完成很好的「多輪對話」、「內容創作」、「邏輯推理」等大模型的基礎能力

從生態大會上得知，騰訊混元大模型更加聚焦於其應用方面，其目前已經在騰訊文檔、廣告、會議等多個業務上取得明顯效果。比如在騰訊文檔中，可以有效的做到多種文案的生成，並且已經支持excel公式的生成。

在騰訊文檔中，新建智能文檔，按下"/"鍵，就可以快速調出混元助手進行文本生成：

而在騰訊會議中，混元助手則可以幫助你快速記錄會議內容並生成摘要文檔。同時能夠根據一定的上下文進行問題回答：

當然，也可以通過混元助手生成對應的圖片，並進行AI廣告創作。讓你幾分鐘內製作出好看的圖片出來。

混元助手初體驗

申請通過，我們可以通過網頁和微信小程序體驗混元助手，這裡面提出幾個問題對混元助手進行相應的測試。

數學計算

Q:個三角形,如果一條邊長為4cm,另一條邊長為7cm,則第三條邊最長可能是多少厘米?（答案為正整數）

本身推理過程算是比較正確，但是最後得到了錯誤的答案。因此這裡進一步提示模型，這樣才能夠算出正確答案：

說明模型本身是有一定的推理能力的，而且也接受一定的多輪對話理解。

邏輯推理

全國防災減災日

Q：趙三的父母結婚的時候，為什麼沒有邀請自己參加

好像沒有回答，只是把輸入的話重複了一遍而已。

Q：我媽媽的弟弟的兒子的老婆我叫他

這次的推理還是比較準確，能夠準確推理出親戚之間的關係。

代碼能力

本身在混元助手中，已經集成了多種不同的能力，這裡面就包括生成代碼。我們也可以生成自己的指令，進行快速的編寫。

Q：利用huggingface調用LLAMA大模型代碼。

從上面代碼上看，基本沒有什麼問題。還會貼心的給出代碼的每個步驟在幹什麼，應該是初步具備一定的代碼水平。

額外的能力

除了上面幾個能力之外，它還包括了繪畫、營銷、角色扮演等等。

在生成的圖片上，沒有太多的理解我的意思，同時生成的風格偏向於動畫化：

總結

從「百模大戰」的內卷，也最終讓很多大公司意思到只有在具體行業中落地，才能夠充分發揮大模型帶來的價值。

而混元大模型雖然目前表現還不是太出色，但是如果能夠與更多的場景進行融合，相信能夠變得越來越好，真正的提升人們的工作效率。

混元大模型初體驗：目前不太出色

文章來源: https://twgreatdaily.com/bb6c05965bc639db43709591fe5efba4.html

14歲男孩殺死了自己，在此之前，他迷上了他的AI伴侶

暴跌125億！AI「巨頭」萬興科技，泡沫有多大？

AI重構下的百度網盤：限速頑疾久治不愈、屢曝安全漏洞，用戶信息如何守護？

深圳地下交通「最強大腦」背後：商湯科技五年半虧了近五百億

第一批搶跑的人，用AI搞了上千萬？

AI 幽靈，「刺殺」小說家

我用ChatGPT做了一下姜萍的數學競賽題，它懵了，我也懵了！

蘋果的大模型衝刺：沒有 AI 新產品，只有新功能

大模型軍備競賽遠未結束，但已註定成為少數人的遊戲

為了0.0003元，阿里和位元組槓上了

Kimi掙錢的樣子好抽象！

降價會是位元組AI的出路嗎？

別再狂吹GPT-4o了！不要只顧著漲他人威風、滅自己志氣

月之暗面撞上算力牆？

小紅書的大模型有點慫

三天暴漲一倍，商湯翻身還是泡沫？

巴菲特：我對AI一無所知

阿里想藉助AI電商反殺拼多多？

苦苦掙扎的周鴻禕，搖擺不定的360

湯曉鷗，倒在了商湯最難的時候

AI 製作的成人電影，為什麼這麼多人在看？

被冤枉的李開復，被「錯付」的中國開源

營收下降，利潤下滑！聯想梭哈大模型？

我找兩個熱門行業問現在AI如何取代人，結果被潑了冷水