從訊飛華為聯手,我們看到了國產大模型的「三級跳」

2023-10-25     財經無忌

原標題:從訊飛華為聯手,我們看到了國產大模型的「三級跳」

文 | 山核桃

時間撥回到今年5月6日,星火認知大模型剛發布時,「國產大模型追上chatGPT還要多久」成了一個熱議的話題。當時,科大訊飛董事長劉慶峰向外界展示了這家有著24年歷史的AI龍頭企業在大模型浪潮中清晰的發展時間表——到10 月 24 日,也就是昨天,科大訊飛要開發出中文水平超越 ChatGPT,英文水平與之相當的大模型應用。

「我們如期兌現了自己給大家的時刻表。」

在合肥體育中心內,現場座無虛席,會場兩側都站滿了人。在昨天舉辦的2023科大訊飛全球1024開發者節上,劉慶峰宣布了訊飛星火認知大模型V3.0版本(以下簡稱:星火V3.0),兩個多小時的現場分享中,劉慶峰一如既往地語調洪亮。

星火V3.0在文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力和多模態能力7大方面都有了顯著的提升。根據國務院發展中心國研經濟研究院的橫評報告,星火大模型綜合能力已超越ChatGPT,實現國內領先,國際一流,且在教育、醫療和法律行業表現尤為突出。

星火V3.0七大能力持續提升 作者攝

半年內完成大模型能力的三次大升級,這是科大訊飛交出的大模型答卷。而與華為的合作成為了這場發布會的另一大重要看點。

在同日的發布會上,劉慶峰官宣了與華為最新的動態, 科大訊飛聯合華為打造了基於昇騰生態的自主可控大模型算力底座「飛星一號」平台,訊飛星火大模型將在下一階段開啟對標GPT-4的更大規模訓練。

大半年來,訊飛華為的生態合作,是當下國產大模型加速競爭下的一個新趨勢。頭部科技企業之間,基於各自生態位的合縱聯橫和強強合作,既能形成技術與業務間的互補,又能加速大模型的商業化與行業化落地。

我們好奇的是,這一聯手合作將對中國大模型的未來有什麼深遠意義?

1、更強算力+更強模型,解大模型「燃眉之急」

一個業內的共識是,由ChatGPT引爆的「百模大戰」至今,國產大模型已從「卷參數」進入了「卷應用」,紅衫資本在近期的一份研究報告中也指出,當下的大模型競逐已進入第二階段,比起技術,更強調產品體驗與應用形態。

一位國內頭部券商傳媒領域分析師曾對財經無忌分析:「中國科技公司最擅長的場景與應用,移動網際網路時代已是存量博弈,大模型時代會更有機會。」

但進入「應用戰」後,橫亘在國產大模型眼前,也有看得見的兩道關卡:

一是,成本難關。 暴漲的算力需求下,隨著AI大模型加速商業化部署,需要高功率、高算力的基礎設施。大模型研發高度依賴高端AI晶片、集群及生態,不斷攀升的算力成本,讓許多企業只能「望模興嘆」。

二是,應用難關。 不同行業場景中企業和開發者,對於大模型的和使用方式有不同的差異,如何進一步降低大模型的使用門檻,讓大模型真正用起來,需要國產大模型廠商找到高頻剛需的應用場景,打造殺手級應用。

而訊飛與華為的攜手,本就是為了紓解上述國產大模型的燃眉之急。

首先,華為有更強的算力基礎。 華為此前已宣布,昇騰AI集群規模已從最初的4000卡集群擴展至16000卡,是業界首個萬卡AI集群,擁有更快的訓練速度和30天以上的穩定訓練周期。

其次,科大訊飛也有更強的大模型能力。 作為一家人工智慧龍頭企業,一方面,科大訊飛有著強大的算法優勢與清晰的技術路徑。

另一方面,對場景的理解能力,不同於其他大模型廠商,科大訊飛思考的不止是技術,而是前沿技術開發與商業化的齊頭並進。

星火認知大模型疊代至V3.0版本,科大訊飛在現場重點演示了星火V3.0在數學能力、小樣本學習、代碼能力、英語能力和多模態能力的提升。

以英語能力與多模態能力為例,星火能自如地進行更native的英文閱讀、寫作與潤色。而在多模態能力上,星火現場製作起了兒童繪本,能夠跟自如地根據prompt生成更多細節與故事性的圖案。

正如上文所說,科大訊飛在創業的24年中,已形成了研發與商業化並行的路線。因此,每一次隨星火認知大模型同時能力疊代的,是科大訊飛一系列的產品與行業方案的升級。

星火現場製作起了兒童繪本 作者攝

在現場,科大訊飛發布了星火V3.0的能力集成與部署進一系列賦能行業與場景的商業化產品中,這之中既包括了一系列落地於教育、辦公、醫療等行業場景的AI原生應用,如全新升級的iFlyCode2.0(智能編程助手),與中科院文獻情報中心聯合打造的星火科研助手、教育領域的AI心理夥伴、醫療領域的曉醫助手等,也包括了直面C端的智能硬體產品,如具備英語AI答疑輔學的訊飛AI學習機、面向未來的人形機器人等。

星火文獻科研助手可閱讀文獻、整理綜述與潤色文本 作者攝

訊飛曉醫助手現場演示如何分析體驗報告 作者攝

這是科大訊飛區別於其他網際網路大廠的獨到優勢。多年創業路上對人工智慧技術商業化的思考以及服務政企、教育等客戶的經驗,讓科大訊飛具備了更快地將前沿技術結合前端市場需求,進行變現的能力。

科大訊飛很早就提出了「1+N」架構,對於大模型與行業結合,有自己一套清晰可見的布局。訊飛研究院院長劉聰曾在一次採訪中表示,大模型與行業的結合,不是簡單把大模型的能力API調過去就能用,而是要具體設計產品功能,並且要結合用戶的需求。

當方向正確清晰,路徑與方法論就自然而然地形成,焦慮也就化為了動力。

劉慶峰坦言,在chatGPT橫空出世之時,身邊很多人都十分焦慮:「擔心我們的技術會差。」。

但訊飛華為基於各自優勢領域的互補與協同,從供給與需求兩側,能更務實地解決當前國產大模型所面臨的焦慮。

一方面,在供給側 ,以華為昇騰AI為核心,軟硬體協同優化,訊飛星火認知大模型在算力層構建了性能更優越、供給更穩定和數據更安全的大模型訓練集群,為大模型的深度應用提供了自主創新的算力底座。

另一方面,在需求側 ,訊飛星火認知大模型的技術優勢與場景理解能力,本身也能高效適配昇騰AI,進而降低大模型使用門檻,加速行業落地。

而在劉慶峰看來,另一重關鍵意義則是縮短國產大模型與GPT-4之間的差距。

「中國現有的大模型根基實力,與GPT-4仍有差距。」 劉慶峰坦言,在複雜知識推理、小樣本快速學習、超長文本處理以及跨模態的統一理解上,國產模型還有不小的差距。

只有正視差距,才能實現超越。此次訊飛與華為攜手,無疑也將為訊飛星火等國產大模型在下一階段對標GPT4,實現超越,做好更長期準備。

2、第二跳:超越零和博弈,以長期視野釋放大模型潛力

從技術的演進與發展史來看,一個顛撲不破的規律是,顛覆性的技術從實驗室走向普惠,強強聯合遠比單打獨鬥效果要好,過去科技巨頭們的經驗已印證了這一觀點。

在PC時代,微軟和英特爾就曾為推動個人電腦產業的發展,組成了Wintel聯盟,英特爾的硬體優勢與微軟的軟體生態結合,雙方協同創新,最終拉動了產業的升級,大大促進了個人電腦性能的提升與用戶體驗的升級。

在移動革命掀起時,早期蘋果之所以能重新定義消費電子產品,背後離不開與晶片設計公司ARM的深度合作。

訊飛與華為所形成的國產AI生態合作,也是如此。超越零和博弈的競爭思維,尋求技術落地的破局點,上述案例已然印證了,「強強聯合」往往能引領一個時代的發展。

大模型的誕生第一次讓人們瞥見了通往AGI世界的可能,但大模型能力的進化必須依賴更先進的算力底座,而算力底座從能用到好用,必須依賴成熟大模型廠商的協同,沒有使用,就不能形成規模優勢,形成數據飛輪,就無法均攤算力底座高昂的技術投入。

今年8月中旬,科大訊飛聯合華為推出了大模型算力硬體 「星火一體機」。一體機的特點是可以私有化部署大模型,讓所有企業都可以在國產自主創新平台上私有化部署大模型。

1個月後的華為全聯接大會上,劉慶峰在演講中透露了與華為的進一步合作。而在昨天,科大訊飛聯合華為正式推出基於昇騰生態的自主創新大模型算力底座「飛星一號」平台,支持訊飛星火大模型在對標GPT-4之路上,實現更大規模的訓練。

發布會現場, 科大訊飛董事長劉慶峰給出的時刻表 作者攝

「科大訊飛敢於對標 ChatGPT 並超越,讓人們對中國大模型時代快速發展的未來充滿信心」。據華為科技有限公司副董事長、輪值董事長徐直軍透露,發布「飛星一號」平台,讓星火的訓練效果翻番。

超越ChatGPT 並不容易,但這是國產大模型必須要走的關鍵一步,也是中國大模型生態進化的關鍵一步。

3、第三條:大模型時代,提供自主創新的「中國答案」

從更深遠的價值來看,訊飛華為聯手,實則在更加嚴峻的逆全球化趨勢下,為國產大模型發展提供了一條自主創新的路徑,也為全世界的大模型發展提供了第二選擇。

「訊飛華為攜手,不僅是中國企業的相互抱團,更是為世界提供第二選擇。」劉慶峰說。

科大訊飛董事長劉慶峰強調了技術的自主可控 作者攝

從此前美國商務部工業安全局多次針對中國算力產業鏈的制裁就能看出,無論是將關鍵企業列入實體清單,還是升級管制規定,本質上都是延緩中國技術的發展速度。

在大模型技術爆發的當下,中美也掀起了新一輪技術軍備競賽,儘管仍舊存在著差距,但在此輪技術升級中,中國科技企業也並非是倉促應戰。

據財經無忌觀察,中國大模型生態為實現真正的自主創新,主要沿著兩條路徑:一是產業鏈關鍵環節的自研,例如自研晶片、框架、工具鏈等;二是通過擴大生態,國產大模型廠商與自主創新的算力底座相結合,共同培育本土產業鏈生態。

後者無疑更有未來,產業意義也更大。 國際產業鍊表現所表現出的不確定性,倒逼中國企業必須要認清現實。一方面,在智算資源部署上,如華為一樣的科技公司將AI算力做精、做實。

另一方面,而在模型具體能力升級上,如科大訊飛一樣的人工智慧企業也在通過不斷的技術投入與躍升的產品能力,加速大模型落地行業。

劉慶峰在現場分享了一個訊飛華為的細節小故事。為了更快地構建算力底座,推出「飛星一號」,華為派遣了員工入駐到訊飛合肥總部,組建「聯合特戰隊」,整個合作過程中,雙方團隊都出了許多心血。

「隨著核心技術的突破,產業生態的持續完善,利用場景的深化,訓練數據的打磨,大模型時代的序幕才剛剛拉開。」劉慶峰對國產大模型的未來做出這樣的判斷。

毫無疑問,大模型賦能千行百業將是一場硬仗,但只有自主創新才能真正實現超越。訊飛華為所選擇的無疑是一條更難的路,但也是一條更廣闊的路。

文章來源: https://twgreatdaily.com/zh-my/9c9ef4d5ea2ce9c596b63ea14512af26.html