國產大模型攻關又跨越出了關鍵的一步。
10月24日,一年一度的科技行業盛事科大訊飛全球1024開發者節在合肥如期舉辦。在開幕式上,科大訊飛重磅發布訊飛星火認知大模型V3.0。
相比此前版本,訊飛星火大模型V3.0的七大維度能力進一步全面提升:重磅升級了大模型代碼能力,實現全面對標ChatGPT(基於GPT-3.5),醫療相關性能更是超越了最新的GPT-4大模型。
基於訊飛星火V3.0,科大訊飛更推出了科研助手、AI心理夥伴等領先行業應用,並聯合行業龍頭共同發布12個行業大模型,並與華為共同發布了「飛星一號」大模型算力平台。
不僅如此,科大訊飛董事長劉慶峰還現場官宣:正式啟動對標GPT-4的模型訓練,並計劃在2024年上半年完成對GPT-4的對標。
從切進大模型賽道開始,科大訊飛始終處於國際領先水平,先後以ChatGPT、GPT-4為目標。事實證明,在技術含量和產業價值兩個維度,訊飛星火已經走在了國內大模型的市場前列。
01、千模大戰,多而不精
2022年末,「小而美」、一度名不見經傳的美國科技企業OpenAI一舉發布了當時最為領先的自然語言理解大模型——「ChatGPT」。由此,全球科技領域掀起了一陣關於NLP(自然語言處理)大模型研發的創投颶風,也預示著一片充滿想像力的市場藍海開啟。
根據國際數據公司IDC預測,全球AI計算市場規模將從2022年的195.0億美元增長到2026年的346.6億美元。其中,生成式AI計算市場規模將從2022年的8.2億美元增長到2026年的109.9億美元,復合增長率高達91%。
另據高盛預測,未來十年,生成式AI將推動全球GDP增長7%,約合近7萬億美元。
萬億規模的市場藍海,吸引了各方力量積極下場。過去近一年以來,大模型市場風起雲湧,湧現出了科技大廠、早期成立的AI企業、知名投資人、企業家等各方參與者入局。
據賽迪顧問發布的《2023大模型現狀調查報告》,截至2023年7月底,國外累計發布大模型138個,中國則累計有130個大模型問世。從數量來看,中國大模型數量僅次於美國,穩居全球第一梯隊。而中美兩國大模型的數量占到全球大模型數量的近90%。
不僅如此,由於國內龐大的市場需求和人才儲備量,至今仍可以看到新的大模型產品不斷湧現出來。
「千模大戰」仍打得火熱,與此同時,新一輪的洗牌或許也已悄然到來。
業界普遍認為,從市場需求而言,最終能夠歷經蕩滌留存下來的玩家必將是有限的。
如OpenAI創始人Sam Altman所判斷的:「將來應該會出現幾個大型的基礎模型,開發人員都將基於這些基礎模型研發AI應用。」而不是每個市場參與者都從0到1地對大模型進行自研。
不僅如此,由於AI算力、訓練數據等賽道資源的稀缺性,大模型市場的機會窗口也將是短暫的。
知名AI企業「小冰」的CEO李笛就曾發出論斷,認為這一領域「到2024年應該就會退熱,發現誰在岸上裸泳」。
那麼,什麼樣的參與者才能經受磨礪,在一輪輪的市場洗牌中找到自己的市場位置?
除了追求技術的領先性,大模型企業們無疑還要思考,該如何真正為消費者、產業真正創造價值。
在1024開發者節上,針對大模型技術領先性和創造產業價值這兩個重要命題,成立已有24年的領先AI企業科大訊飛給出了自己的階段性答案。
02、「中文超越,英文相當」於ChatGPT
在活動現場,劉慶峰用「中文超越,英文相當」這幾個字,來描述最新的星火認知V3.0與ChatGPT之間的差距。
國務院發展研究中心國研經濟研究院測評報告則顯示,星火大模型V3.0綜合能力超越ChatGPT,國內領先,達到國際一流水平,在醫療、法律、教育行業的表現格外突出。
與此前發布的版本相比,星火認知大模型V3.0的七大能力均在持續提升。
早在5月6日星火大模型初次亮相的發布會上,劉慶峰就曾講到:真正智能湧現的通用人工智慧系統應當具備7大能力,分別為文本生成、語言理解、知識問答、邏輯推理、數學、代碼和多模態能力。
在持續優化性能的基礎上,星火3.0 進一步升級了數學自動提煉規律、小樣本學習、代碼項目級理解能力、多模態指令跟隨與細節表達等能力,進一步提升星火的落地應用能力。
不僅如此,訊飛星火大模型V3.0新增了「虛擬人格」功能。它可以根據性格模擬、情緒理解、表達風格來形成一個初始人設,再結合特定知識學習、對話記憶學習,形成一個更個性化的AI人設。
而在落地應用方面,科大訊飛同樣走在前列。
據中國電信研究院調研,如今國內外大模型發展模式主要有三種,分別是:龍頭廠商利用自研的基礎大模型,賦能其原有業務,如谷歌、微軟等;在龍頭企業發布的大模型API基礎上,結合外部、公開行業數據進行微調,發布行業模型解決方案,如國內的妙鴨相機、AI法律助手等;第三種則是各行業的中大型企業,用開源大模型和自有數據,自行私有化部署大模型。
而訊飛星火認知大模型已然全面涉足了上述商業化方案。
針對賦能原有業務這一點,以科大訊飛智能硬體為例,劉慶峰分享道:「在大模型的加持下,科大訊飛的智能硬體業務總體銷量增長了70%以上,學習機更是實現了200%的增長。」
本次科大訊飛也基於星火大模型V3.0對訊飛AI學習機進行了升級,首次發布了啟發互動式英語AI答疑輔學功能、升級了百科問答助手功能等等。科大訊飛還推出了AI心理夥伴,能夠「聽懂」孩子的心事,主動回應和給出解決問題的個性化指導建議,守護青少年心理健康。
此外,訊飛星火V3.0也瞄準了眾多行業應用領域。
比如在科研領域,訊飛星火與中科院文獻情報中心聯合打造科技文獻大模型,可以實現成果調研、論文研讀、學術寫作三大功能;在醫療領域推出訊飛星火醫療大模型;在機器人領域發布業界首個「大模型+具身智能」的人形機器人……
在大會上,科大訊飛還聯合行業龍頭共同發布12個行業大模型,包含金融、汽車、運營商、工業、住建、物業、法律等行業,加速產業升級。
私有化部署方面,面向強調數據安全的高端客戶,科大訊飛提供兩種交付模式。
其一是交付國產自主可控的軟硬一體的星火一體機。星火一體機為訊飛與華為共同推出的軟硬體一體化的私有專屬大模型解決方案,官方信息顯示其性能已可對標「全球AI晶片龍頭」英偉達的「A100」型號高端晶片。
此外,基於客戶的自有硬體,訊飛提亦可供星火大模型私有化部署和訓練的「軟體+服務」解決方案。
03、為什麼是科大訊飛?
綜合1024開發者節的整體發布情況來看,訊飛星火認知大模型在技術研發、商業落地兩端都表現得超出市場預期。
事實上,這得益於科大訊飛從切入大模型市場開始,就進行著完善的規劃,其中甚至包括對研發節奏、商業化節奏的精準把控。
早在5月6日,訊飛星火認知大模型首次亮相時,劉慶峰就曾公開預告:彼時發布的產品為基礎大模型,公司還將在6月9日、8月15日、10月24日分別推出升級更新,預計到10月24日,星火大模型的英文能力將達到ChatGPT水平,中文能力將超越ChatGPT。這也是國內首個明確給出對標ChatGPT時間表的企業。
而在10月24日的發布會上,科大訊飛也如期拿出了其迄今為止能力最強的星火認知大模型。
不僅如此,會上劉慶峰官宣,24日起,科大訊飛正式啟動全面對標GPT-4的更大參數規模的大模型訓練,並計劃在2024上半年完成對標。
科大訊飛還聯合華為重磅發布了基於昇騰生態的「飛星一號」大模型算力平台,用以作為接下來訓練對標GPT-4大模型的能力底座。飛星一號平台上,既有像華為這樣的具備國產算力存儲網絡優勢的企業,也有科大訊飛與其聯合研發的各種優質的運算元庫。
得益於這些運算元庫的粘度,科大訊飛在訓練大模型上的效率相較傳統解決方案可以提升一倍甚至更多。
之所以有對標GPT-4的底氣,是因為作為一家24歲、幾乎是國內最早成立的AI企業,科大訊飛在技術儲備、人才梯隊培養、大模型落地場景等方面都已有積累。
科大訊飛多年來一直在技術方面潛心投入,取得了諸多成果。比如早在2014年8月,公司就推出「超腦計劃」,從讓機器能聽會說到讓機器能理解會思考邁進;2017 年,公司獲批承建認知智能國家重點實驗室;2022年初推出「超腦2030」計劃,目標就是讓機器懂知識、善學習、能進化;訊飛多年來在 Transformer 深度神經網絡算法方面擁有豐富經驗,核心技術保持國際領先 水平,2022 年科大訊飛共獲得 13 項認知智能領域國際頂級賽事冠軍。
不僅如此,在過往24年的發展歷程中,科大訊飛已經構建起一支成建制的、行業頂尖的 研發團隊。不少團隊成員是多年來在各個聯合實驗室里培養出的博士;團隊建制完整、高效協同、團結沒有內耗,構成了科大訊飛在AI研發領域的核心優勢之一。
而在商業化落地場景方面,作為智能語音及AI領域的龍頭企業,科大訊飛業務早已涵蓋了教育、智慧城市、開放平台及消費者業務、運營商、智慧汽車、智慧醫療、智慧金融等幾大條線。
因此,訊飛星火能夠快速賦能、融合到成熟產品之中,造福消費者與各類企業用戶,並在不斷打磨之中優化商業鏈路。
隨著團隊合力的進一步發揮、與各界合作夥伴的一同奮進、持續貫徹社會責任與使命,模型能力的進一步提升,更多的開發者、用戶、企業有望聚合到訊飛星火的平台之上。
在演講最後,劉慶峰講到了國產大模型必須正視和GPT-4的差距:「國產大模型在複雜知識推理、小樣本快速學習、超長文本處理、跨模態統一理解上距GPT4還有差距。」而要持續探索大模型的技術上限、深化落地應用,「這個過程剛剛開始,核心技術還要持續進步。」
面向未來的星辰大海,科大訊飛代表的一批國內科技企業,還將持續前行下去。
(作者|董溫淑,編輯|李原)
(註:文中插圖源自科大訊飛)