中國網3月1日訊(記者 謝露瑩)近期,由美國人工智慧公司OpenAI推出的大語言模型ChatGPT所取得的技術突破引起學術界和產業界的廣泛關注。
人工智慧大模型技術為何能實現突破?其所依賴的「創新模式」是什麼?日前,全國政協委員、360集團創始人周鴻禕在他的提案中對此進行解讀。周鴻禕認為,要關注技術創新,同時更要關注技術突破背後所依賴的創新模式。面對ChatGPT為代表的人工智慧大模型技術的巨大躍升,中國理應迎頭趕上,奮起直追。
ChatGPT的關鍵成功因素有哪些?
周鴻禕認為,ChatGPT的成功因素有「微軟+OpenAI」的產研協同模式發揮了巨大作用,是大型企業+科研機構協同創新的典範,更是開源、合作和眾包模式的典範。
周鴻禕介紹,ChatGPT的成功是大型企業+科研機構協同創新的典範。美國等科技創新企業在協同中充分發揮了大型科技企業的優勢。如對模型工程化調優的支持;大規模算力支持;訓練數據的抓取;幫助改善用戶體驗;提供用戶流量的支持;收集用戶反饋提升強化學習效果;商業化模式的探索;基於瀏覽器、搜尋引擎探索用戶使用場景;巨大且持續的投資支持等。
「在這樣全方位的支持下,OpenAI可以專注於學術研究,在技術路線上堅持長期主義,不斷吸引尖端人才,持續打磨算法和模型,不斷向前推進技術邊界。這樣優勢互補的方式支撐了ChatGPT的技術創新。」周鴻禕說。
ChatGPT的成功更是開源、合作和眾包的典範。周鴻禕提出以下幾點理由:
「沒有開源就不會有ChatGPT的誕生。」周鴻禕表示,ChatGPT本身就是基於開源算法不斷完善的結果,初代GPT建立在谷歌公司開源的Transformer算法之上,吸收了業界大量開源成果,並且GPT1、GPT2都已經開源。同時,ChatGPT所使用的訓練數據大部分是開源數據集,包括Common Crawl、WebText2、維基百科、書籍、期刊、開原始碼等數據,比重超過90%。
另外,開源也促進產業的共同發展,而不是少數公司壟斷技術。通過開放論文、開原始碼,微軟、谷歌、臉書等,大型公司及眾多創新型中小公司齊頭並進,不斷推進技術進步。
還有,ChatGPT的訓練和調優應用了大規模的眾包模式,不僅外包了人工標註和人工排序的工程性工作,還通過開放接口,在供全球用戶使用的同時,也收集了海量的真實提問以及點贊或者負向反饋,使模型不斷調優。
周鴻禕表示,ChatGPT是以通用大模型為中心的生態創新模式,這也是其成功不可或缺的因素。他介紹,ChatGPT是一個通用的大語言模型,只有開發出各種各樣的垂類應用才能連接百行千業,服務於傳統產業的數字化、智能化轉型。OpenAI在應用創新上「不搞一家通吃」,而是把ChatGPT通用大模型作為一個作業系統或應用商店,面向創業者和創新型中小企業開放,扶持上百家中小公司孵化各行各業的垂直應用,使各行各業無需再「大煉大模型」,從而專注於開發行業領域的智能化應用。目前,引用ChatGPT開放接口的應用已多達上千個,各類問答、代碼生成、內容創作等新應用如雨後春筍不斷湧現,促使產業生態快速發展。
中國應如何突破瓶頸,迎頭趕上?
面對人工智慧大模型技術的巨大躍升,中國應如何做?對此,周鴻禕建議,中國也要建立大型科技企業+重點科研機構的產研協同創新模式,打造中國的「微軟+Open AI」組合引領大模型技術攻關。
他認為,中國可以從建設國家戰略科技力量高度出發,篩選技術基礎好的產研機構,組成優勢互補的產業協同組合,發揮科研機構在關鍵核心技術上的研究優勢,同時發揮大型科技企業在產品化、工程化、場景化、商業化和數據化方面的優勢,成為大模型技術攻關和應用的龍頭。
另外,中國還需支持設立多個國家級人工智慧大模型的長期開源項目,打造開源眾包的開放創新生態。
周鴻禕認為,人工智慧大模型不應成為少數公司壟斷的高級技術,而應最大發揮其對於產業和社會的價值。他建議,針對多條技術路線以開源模式設立多個國家級長期項目,以大型科技企業+重點科研機構為龍頭,通過開源、合作、眾包和生態的創新模式,引導高校、科研機構和創新型企業形成多個技術路線的創新生態群。
(責編:唐佳蕾 張艷玲)