熱度Top10通用大模型產品有哪些?
ChatGPT的發布掀起了新一代人工智慧發展浪潮,將人類科技文明推向了通用人工智慧時代,AIGC基礎層的通用大模型成為國內外廠商紛紛布局的領域。
浪潮湧現以來,各類機構陸續推出大模型測評體系,但多基於問題集的訓練方式開展測評,很少從用戶實際使用體驗感知方面進行評價。本次,甲子光年智庫面向大模型實際使用者開展產品使用後的體驗感知測評,以期從用戶視角提供評價維度參考。
甲子光年智庫基於原創的科技發展三大定律推導出兩大核心路徑作為甲子星空坐標系的兩大關鍵維度:以智能化水平反映先進性,以賦能空間反映普適性、應用廣度。兩大關鍵維度展開九大細分評測維度,以此設置測評指標與用戶評價調研問卷,以評價AIGC通用大模型產品的水平高低。
本次調研測評對象是AIGC通用大模型類產品。後續甲子光年智庫將持續發布相關結果,並將持續開展AIGC中間層、應用層等測評並推出甲子星空坐標系。
本次測評對象為AIGC基礎層通用大模型產品
甲子光年智庫認為當下的AI技術棧不能滿足ChatGPT推動的新一代人工智慧浪潮,未來的AI技術棧將呈現新的技術架構體系。
甲子光年智庫將新一代人工智慧的技術架構劃分為五層:算力層、平台層、基礎層、中間層和應用層。其中,基礎層、中間層和應用層可歸納為算法層。基礎層主要是通用大模型,以大數據、大算力、高投入和高能耗為特點,中間層主要是專用/行業大模型,應用層則主要是個性化場景微模型和應用產品。本次AIGC大模型測評對象為基礎層,即AIGC通用大模型產品。
測評指標體系:智能化水平×賦能空間
甲子光年於2023年4月25日提出人類科技發展存在三大定律:
- 定律1:科技的發展軌跡存在「不可逆性」
- 定律2:能源與信息是人類科技進步的兩把標尺
- 定律3:技術進步的本質是推動信息與能源的轉化,以生產工具改變物理世界,繼而滿足人的需求
定律1與定律2反映推動社會發展的先進生產力,體現先進性,如技術的智能水平、高度、強度、速度;定律3反映的是滿足全社會需求的能力,體現普適性,如技術應用的廣度、落地效率。
基於三定律所揭示的先進性、普適性兩條路徑,甲子光年智庫推導確定AIGC通用大模型產品的測評指標體系,用智能化水平反映其先進性,用賦能空間反映其普適性。
甲子光年智庫認為,在智能化水平方面,AIGC通用大模型產品需要體現內容的多元與創造能力,前後生成內容要一致且連貫,生成內容要使用戶有一定的可控能力,且具有較高實用性,並可以像人一樣進行溝通。因此,智能化水平從多樣性、一致性、可控性、實用性、擬人性五大維度進行測評;在賦能空間方面,AIGC通用大模型產品需要體現用戶使用後的滿意情況,生成內容需要有一定準確性且可有效提升工作效率,並具有一定的應用廣度。因此,賦能空間主要從滿意度、信度、效度、應用廣度四大維度進行測評。
AIGC通用大模型產品用戶畫像:一二線城市、中小微企業、教育科研領域居多
本次調研對象是使用過AIGC通用大模型產品至少1次及以上的用戶(包含個人用戶和開發者用戶) ,調研對象針對自身使用相關產品的情況進行評價打分。
- 從用戶所屬企業類型來看,中小微型企業占比較高,比例達68.5%,其次是大型企業,占比14.8%。
- 從用戶所在地域分布來看,二線城市占比最高,達39.5%,其次是一線城市,占比25.2%,一二線城市是用戶聚集地。
- 從用戶所屬行業前十名來看,教育、科研/院校、金融、網際網路、專業服務、媒體、醫療、軟體、文娛、政府等是AIGC通用大模型產品使用較多的行業,尤其教育和科研/院校領域占比較高。
AIGC通用大模型產品用戶職業:內容生產者占比近九成,開發者占半壁江山
從職業分布來看,AIGC通用大模型產品用戶以開發者和內容生產者為主。
開發者指具有一定代碼編寫能力的軟體開發技術人員,包括但不限於IT部門人員、軟體開發人員等。
內容生產者指從事內容生產相關工作的職業者,其與開發者存在一定重合性。
其中,從是否是開發者角度看,開發者占比43%,普通個人占比57%。從是否是內容生產者角度看,高達89%的用戶都是內容生產者。從兩大職業交叉分布看,第一客群是作為普通個人的內容生產者,占比50.5%;第二客群是作為開發者和內容生產者雙重角色的用戶,占比38.6%。
用戶使用熱度Top10大模型產品:60%側重面向開發者,40%側重面向普通個人
從用戶使用熱度來看,Top10大模型產品是ChatGPT、GPT-4、谷歌Bard、騰訊雲、華為盤古、文心一言、360智腦、通義千問、商湯日日新和訊飛星火。
從Top10大模型產品的用戶職業分布來看,有60%是側重面向開發者的,40%是側重面向普通個人的,說明當下市場主流大模型產品仍以面向開發者用戶為主。
從Top10大模型產品的用戶細分客群來看, ChatGPT、谷歌Bard、騰訊雲、文心一言、通義千問和訊飛星火等大模型產品用戶以第一客群為主, GPT-4、華為盤古、 360智腦和商湯日日新大模型產品用戶則是以第二客群為主。
用戶可接受最優價格是300元/季度,廠商最適合定價區間是300-3000元/季度
甲子光年智庫調研數據顯示,300元/季度是AIGC通用大模型產品用戶可接受價格的最優定價,300-3000元/季度是AIGC通用大模型產品用戶可接受合理價格區間。
當價格超過3000元/季度時,用戶的付費購買意願會快速下降。因此,甲子光年智庫建議AIGC通用大模型廠商在產品定價時優選【300元/季度,3000元/季度】區間。
工作效率水平: 整體提升47.9%,醫療、金融等行業和翻譯、科研場景提升效率高
AIGC通用大模型產品對用戶工作效率的提升水平達到47.9%。
從行業表現來看,金融、醫療和科研行業的工作效率提升水平較高,分別為59.3%、57.3%和52.1%,另外在文娛、專業服務、政府、教育、網際網路等行業提升效率水平也表現較好。
從應用場景表現來看,翻譯、科研學術場景的工作效率提升水平比較高,分別達到62.5%和50.7%。辦公、文案創作、文本改寫/擴寫、文本摘要歸納和海報設計等方面對工作效率的提升也非常可觀。另外,搜尋引擎場景的提升效率水平達到42.1%,也是值得關注的重點場景之一。
市場地位:文心一言、騰訊、華為和商湯屬星團象限
基於X軸賦能水平和Y軸智能化水平,可以將AIGC通用大模型產品劃分為四個象限,形成甲子星空坐標系。
光年象限的產品在賦能水平和智能化水平方面表現均較為突出,既具有技術先進性/創新性,對生產效率提升顯著,又具有較高的應用普及性和可落地能力,可以滿足各行業和場景應用需求,有助於推動社會發展,屬於整個行業的領導者,如GPT-4。
星辰象限的企業則具有較高技術水平和創新能力,對生產效率提升顯著,但還尚未形成廣泛的應用落地與使用場景,但其發展潛力大,處於挑戰者地位,未來大規模應用後有進入光年象限的可能,具有挑戰行業領導者地位的潛力,目前top10熱度產品未出現在此象限。
星雲象限的通用大模型產品則是多為新成立或新發布產品階段,其在生產效率提升能力和大規模商業化應用能力方面具有較高的可成長型,屬於新勢力,未來潛力空間較大。
星團象限的通用大模型則具有較廣的應用面,已經建立穩定的商業模式和應用場景,並在某些行業或專業場景具有競爭力,處於行業先行者和隱形冠軍地位,如文心一言、騰訊、華為和商湯等均屬星團象限。
市場潛力:商湯、騰訊雲和華為盤古的商業化落地潛力較大
基於X軸用戶推薦意願和Y軸用戶滿意度,可以將AIGC通用大模型產品劃分為四個象限,形成評估產品市場潛力的甲子星空坐標系。
光年象限的產品用戶滿意度高且願意推薦給同行使用,具有較好的產品接受度和推薦傳播能力,是行業中市場增長引擎最強的產品群體,屬於側重商業落地應用的類型。
星辰象限的通用大模型產品則是用戶使用後滿意度較高,但推薦給同行使用的意願不足,處於可推薦可不推薦狀態,這說明其產品體驗和表現已經滿足用戶預期,但可能存在產品功能過於單一或仍有進步優化空間,導致推薦動力不足,在產品疊代後有潛力激發市場化應用,成為光年象限產品,屬於側重產品體驗的類型。
星雲象限通用大模型產品的商業化模式不夠清晰,現有象限中大模型產品用戶以普通個人和內容生產者居多,建議該象限的大模型產品以普通個人為目標客群,未來需注重普通個人應用場景的商業化落地,以滿足用戶需求。
星團象限的通用大模型產品處於推薦意願高但未達滿意狀態,該象限產品多面向開發者,其對產品具有較高的技術要求,因此雖然該象限產品具有較高的用戶推薦意願但用戶仍認為存在產品的瑕疵,需要儘快確定產品問題點並進行改進升級,從而維持用戶粘性、產品忠誠度與持久熱度。
核心場景:翻譯、學術、設計屬光年象限,商業潛力大
基於X軸用戶使用熱度和Y軸提升工作效率水平,可以將AIGC通用大模型應用場景劃分為四個象限,形成評估應用場景的甲子星空坐標系。
光年象限的應用場景在用戶使用熱度和成熟度方面均較為突出,屬於應用場景中的領導者,如翻譯、科研學術、海報設計等場景,均屬於光年象限的應用場景。
星辰象限的應用場景,對工作生產效率有顯著提升,但還尚未形成廣泛的用戶使用偏好,其發展潛力大,處於挑戰者地位,未來大規模應用後有進入光年象限的可能。
星雲象限的應用場景,多為新興且處於探索階段的場景,具有較高的可成長性,屬於新勢力。
星團象限的應用場景,用戶具有較高的熱度和使用偏好,但其實際提升工作效率的水平仍有待改善,這部分場景往往具有一定應用基礎,已建立一定的商業模式,處於先行者地位,尤其辦公和文案創作場景商業潛力較大。
甲子星空坐標系的由來簡述
甲子光年智庫在2023年4月25日提出,人類科技發展存在三大定律:
- 定律1:科技的發展軌跡存在「不可逆性」
- 定律2:能源與信息是人類科技進步的兩把標尺
- 定律3:技術進步的本質是推動信息與能源的轉化,以生產工具改變物理世界,繼而滿足人的需求
定律1與定律2反映推動社會發展的先進生產力,體現先進性,如技術的智能水平、高度、強度、速度。
定律3反映滿足全社會需求的能力,體現普適性,如技術應用的廣度、落地效率。
基於三定律所揭示的兩條路徑,可以推導出科技發展的先進性與普適性是推動社會發展的核心路徑,甲子光年智庫基於這兩條核心路徑,推導、設定評估指標體系。
甲子星空坐標系的維度選取
基於科技發展三大定律所揭示的兩大核心維度先進性與普適性為核心路徑進行推導確定維度選取。
普適性方面:以應用效率提升為主,反映的是廣度,主要維度:用戶需求滿足能力、社會責任能力(雙碳、綠色環保、共同富裕等)、經濟推動能力等。可以滿足企業數字建設需求,具有較高落地應用能力,有助於賦能社會責任,有助於推動經濟發展。
先進性方面:以反映高度和強度兩個關鍵推動社會發展的方向為主進行推導,高度以提高生成效率為主,強度以提高能源效率為主
- 高度:以生產效率提升為主,反映的是高度,主要維度:數字化、智能化。注重科技水平的先進性和創新性,能夠有效提升生產效率,可基於先進技術開發顯著提升生產效率的新型生產工具。
- 強度:以能源效率提升為主,反映的是強度,主要維度:能效比、可再生能力。具備較高的能效比和可持續發展能力,可以滿足低功耗即可實現先進技術的能力,確保可以較高強度的使用,並能大規模支持日常生產生活。
甲子星空坐標系象限劃分與意義
第一象限為光年象限:在賦能水平和智能化水平方面表現較為突出,其技術實力較強,市場接受度高,大規模應用落地,已經獲得市場的認可,屬於領導者定位;
第二象限為星辰象限:具有較高技術水平和創新能力,對生產效率提升顯著,但還尚未形成廣泛的應用落地,屬於挑戰者的定位;
第三象限為星雲象限:多為新成立且具有較高原創性和潛力空間的企業,屬於新勢力定位;
第四象限為星團象限:具有較廣的應用面,已經建立穩定的商業模式,並某些行業或場景具有競爭力,屬於先行者和隱形冠軍定位;
甲子星空坐標系象限特性解讀
基於X軸賦能水平和Y軸先進性水平,可以將廠商劃分為四個象限:光年象限、星團象限、星辰象限和星雲象限。
光年象限的企業在賦能水平和智能化水平方面表現較為突出,其技術實力較強,市場接受度高,大規模應用落地,已經獲得市場的認可。
星辰象限的企業則具有較高技術水平和創新能力,對生產效率提升顯著,但還尚未形成廣泛的應用落地。
星雲象限的企業則是多位新成立且具有較高原創性和潛力空間的企業,屬於新勢力。
星團象限的企業則具有較廣的應用面,已經建立穩定的商業模式,並某些行業或場景具有競爭力,屬於隱形冠軍。