原創 | 算法一隻狗
雖然說之前已經有很多公司發布了大模型,但是騰訊在大模型上還是令人期待的。
隨著ChatGPT帶來的AI大模型潮流的發展,國內各家大公司都是卯足力氣發布自家的大模型。自今年3月份以來,百度發布了文心一言,並在近期發布了文心一言APP。4月份則是阿里發布的通義千問,同時近期也發布了多模態通義千問Qwen-Chat。而此後國內大模型就一直百花齊放,因此又被網友稱為「百模大戰」。
雖然「百模大戰」已經然很多網友感覺到了疲勞。主要原因在於:
利用現有的榜單進行刷榜,其實人們已經很少去關注了,刷榜只會給人們帶來麻木在開源模型中,目前只有LLAMA2真正使用了RLHF,其他模型還是欠缺了許多
大模型目前的發力點還在於實用性
從9月7日騰訊全球數字生態大會上,騰訊發布了自家大模型「混元助手」來看,其實騰訊更傾向於把大模型真正變成生產力,來提高工作效率。這就需要不斷依賴於混元大模型與騰訊業務的緊密結合,從而找到更好的發力點。
大模型不僅僅要「參數量大」,更需要在多領域上進行充分應用,把用戶的痛點進行充分解決,讓更多開發者參與進來進行開發,從而更好的促進自身大模型的生態打造。
從官網介紹,混元大模型在複雜語境下,能夠完成很好的「多輪對話」、「內容創作」、「邏輯推理」等大模型的基礎能力
從生態大會上得知,騰訊混元大模型更加聚焦於其應用方面,其目前已經在騰訊文檔、廣告、會議等多個業務上取得明顯效果。比如在騰訊文檔中,可以有效的做到多種文案的生成,並且已經支持excel公式的生成。
在騰訊文檔中,新建智能文檔,按下"/"鍵,就可以快速調出混元助手進行文本生成:
而在騰訊會議中,混元助手則可以幫助你快速記錄會議內容並生成摘要文檔。同時能夠根據一定的上下文進行問題回答:
當然,也可以通過混元助手生成對應的圖片,並進行AI廣告創作。讓你幾分鐘內製作出好看的圖片出來。
混元助手初體驗
申請通過,我們可以通過網頁和微信小程序體驗混元助手,這裡面提出幾個問題對混元助手進行相應的測試。
1
數學計算
Q:個三角形,如果一條邊長為4cm,另一條邊長為7cm,則第三條邊最長可能是多少厘米?(答案為正整數)
本身推理過程算是比較正確,但是最後得到了錯誤的答案。因此這裡進一步提示模型,這樣才能夠算出正確答案:
說明模型本身是有一定的推理能力的,而且也接受一定的多輪對話理解。
2
邏輯推理
全國防災減災日
Q:趙三的父母結婚的時候,為什麼沒有邀請自己參加
好像沒有回答,只是把輸入的話重複了一遍而已。
Q:我媽媽的弟弟的兒子的老婆我叫他
這次的推理還是比較準確,能夠準確推理出親戚之間的關係。
3
代碼能力
本身在混元助手中,已經集成了多種不同的能力,這裡面就包括生成代碼。我們也可以生成自己的指令,進行快速的編寫。
Q:利用huggingface調用LLAMA大模型代碼。
從上面代碼上看,基本沒有什麼問題。還會貼心的給出代碼的每個步驟在幹什麼,應該是初步具備一定的代碼水平。
4
額外的能力
除了上面幾個能力之外,它還包括了繪畫、營銷、角色扮演等等。
在生成的圖片上,沒有太多的理解我的意思,同時生成的風格偏向於動畫化:
總結
從「百模大戰」的內卷,也最終讓很多大公司意思到只有在具體行業中落地,才能夠充分發揮大模型帶來的價值。
而混元大模型雖然目前表現還不是太出色,但是如果能夠與更多的場景進行融合,相信能夠變得越來越好,真正的提升人們的工作效率。