大模型激戰正酣?「小模型」或許才是出路

2023-08-04     青橙商業

原標題:大模型激戰正酣?「小模型」或許才是出路

作者丨青沐

編輯丨六子

7月26日,OpenAI推出安卓版ChatGPT,雖然目前僅限在美國、印度、孟加拉國和巴西四國使用,但OpenAI也表示,下周將在更多國家推廣安卓版ChatGPT。這讓近期熱度稍降的ChatGPT重回大眾視野

ChatGPT在上線之初,用僅僅兩個月的時間,就一躍成為歷史上最快突破1億用戶的應用,沉寂了許久的全球科技市場再次沸騰,國內的投資人與創業者,紛紛飛往矽谷取經問道。

面對這一洶湧的AI浪潮,中國的創業者和投資人們行動很快。數月之後,中國科技行業已呈現「百模大戰」的壯觀姿態。2023年上半年,國內就已出現了80多個大模型產品,在最新的數據中,國內市場上已經有130家公司在做大模型。而在全球範圍內,今年上半年新發布的大模型已超過400個。

中國的大模型玩家們在追逐商業利益和科技未來的同時,也被冠以民族情懷:做中國版的OpenAI

7月24日消息,安卓版ChatGPT上線前夕,IDC發布的大模型技術能力評估報告顯示,百度文心大模型3.5拿下12項指標的7個滿分,綜合評分第一。百度副總裁吳甜表示,新版本的文心一言3.5能力已超越ChatGPT 3.5,這是在我們國內開展相關技術工作重要的里程碑。

*來源於文心一言官網

科大訊飛則在此前就宣布,將在10月24日對星火大模型進行第三次疊代,全面對標ChatGPT,中文能力實現超越GPT3.5,英文能力與GPT3.5相當。

01

「場景,場景」

事實上,正如前Google科學家、出門問問創始人兼CEO李志飛所說的那樣,中國或許不會存在一個跟OpenAI一樣的組織。

相比ChatGPT這種通用大模型,國內的大模型產品,更多注重應用和場景,即垂直大模型、行業大模型、產業大模型。對此,科技創投圈大佬們的意見幾乎表達了同一個意思。

百度創始人李彥宏早就公開表示:「創業公司重新做一個ChatGPT其實沒有多大意義。我覺得基於這種大語言模型開發應用機會很大,沒有必要再重新發明一遍輪子,有了輪子之後,做汽車、飛機,價值可能比輪子大多了。」

金沙江創投董事總經理朱嘯虎在朋友圈寫道:「不要迷信通用大模型,因為明年GPT-3.5就成commodity(通用基礎設施),而三年後,GPT-4也會是。對於大部分創業者,場景優先,數據為王!」

獵豹移動董事長兼CEO傅盛認為,大模型會分兩條路。一條叫越來越牛的大模型,是「造一個愛因斯坦」。但很多工作崗位不需要「愛因斯坦」,大學畢業生就能做。這是另一條路。我相信一定有大量的人做「平民化大模型」。

華為雲CEO張平安在盤古大模型3.0發布會上表示:「盤古大模型沒有時間作詩和聊天。參數再多、對話能力做得再好,但如果解決不了實際問題,也沒有多大用處。」

近期國內發布的大模型,大多都面向垂直產業落地,如京東發布的言犀大模型,攜程發布的旅遊行業垂直大模型「攜程問道」,閱文集團發布的閱文妙筆大模型,網易有道發布的教育領域垂直大模型「子曰」等。

京東言犀大模型沉澱了京東在零售、物流、健康、金融等行業多年積累的知識,融合70%通用數據與30%京東數智供應鏈原生數據進行訓練,帶來了商品推薦、金融政策、理財規則、物流體驗等領域的能力。京東雲事業部總裁曹鵬認為,單一的大模型技術本身無法直接產生價值,技術只有放到場景里,才能產生實際價值

*來源於網絡

攜程旅遊大模型問道篩選了200億非結構性旅遊數據,結合攜程現有的結構性實時數據,以及攜程歷史訓練的機器人和搜索算法,進行了自研垂直模型的訓練,同時投入了巨大人力對旅行通用回復內容進行生成和校驗。攜程創始人、董事局主席梁建章表示,攜程會不遺餘力地為大模型投入,投資數額不設限

在應用方面,百度近日與聯想在AIGC領域達成合作,聯想私人定製業務全面引入百度文心一格,消費者可通過官網 AIGC 主題繪畫活動定製筆記本電腦外觀。華為雲盤古大模型與美圖視覺大模型MiracleVision合作推出的AI模特試衣功能,可以有效提升服裝類產品的電商上架效率。

垂直大模型雖然不如通用大模型那樣對參數和算力有太高的要求,但對場景和數據有著更高的要求,需要開發者具備專業的知識、豐富的行業應用實踐積累,對錯誤的容忍程度也更低,需要AI具備超強的穩定性和可靠性。所以越到垂直行業,垂直模型的優勢也就更大。

「通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業某個場景的需求。企業如果基於行業大模型,再加上自身數據進行精調,可以建構專屬模型,打造出高可用性的智能服務,而且模型參數比通用大模型少,訓練和推理的成本更低,模型優化也更容易。」騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生表示。

從這個角度來說,「小模型」或許更性感,更能解決具體的問題。

*來源於商湯官網

商湯推出了千億參數的大模型,也在推出針對不同垂直領域的百億參數小模型。大模型的長處在於能夠找到新的解法,幫助解決新問題,一旦解決以後可以在狹窄領域產生大量數據,重新訓練小模型。有的小模型甚至可以跑在終端上,成本更低。但如果沒有大模型,小模型也不會存在。

02

「大廠贏家通吃,創業公司的機會在哪?」

行業里有一種觀點認為,中國版的ChatGPT只會在5家公司產生:百度、阿里、騰訊、位元組、華為

網際網路時代,是典型的「721」,第一名吃香喝辣,第二名勉強生存,第三名往後朝不保夕。

眼下,百模混戰,誰都想在大模型里分一杯羹。但有一個很現實的問題是,大廠做大模型,有著創業公司無法比擬的優勢。小而美的創業公司,想靠三五個人就干翻大廠,大機率只是一種幻覺。

*來源於網絡

大模型離不開雲平台。大模型落地需要不斷進行微調、訓練、都需要在雲平台上運行。百度、阿里、騰訊、位元組、華為都有自己的雲業務,百度和華為還完成了從還完成了從晶片到應用的布局,百度是「崑崙芯+飛槳平台+文心大模型」,華為是「昇騰晶片+MindSpore框架+盤古大模型」,這都是創業公司難以企及的優勢。

此外,在資金儲備、人才資源、使用場景、數據積累方面,大公司都有著天然的優勢。創業公司沒有落地場景,技術就沒法疊代,無法持續優化,無法形成數據網絡效應。

那么小公司就一點機會都沒有了嗎?

不妨重提那個淘金時代的喻言:「這個時代跟淘金時代很像,如果你那個時候去加州淘金,一大堆人會死掉。但是賣勺子、賣鏟子的人永遠可以賺錢。」這也是奇績創壇創始人兼CEO陸奇在近期對創業者的分享。陸奇希望幫助中國創業者認清這次歷史性的拐點時刻,定位今天的時代坐標、找准自己的位置。

7月初,加州大學伯克利分校計算機科學教授、《人工智慧——現代方法》作者斯圖爾特·羅素(Stuart Russell)發出警告稱,ChatGPT等人工智慧驅動的機器人可能很快就會「耗盡宇宙中的文本」,通過收集大量文本來訓練機器人的技術「開始遇到困難」。

上周,8500多名作家簽署了一封信,要求OpenAI、微軟、Meta和Alphabet等公司領導者不要在未經許可或未支付報酬的情況下使用這些作家的作品來訓練人工智慧系統,並要求這些人工智慧公司賠償其版權損失。

存量的網際網路數據即將被耗盡,優質數據正變得越來越稀缺。一個模型的好壞,20%由算法決定,80%由數據質量決定。在數據、算力、算法「三駕馬車」里,數據是最核心、最長遠、最基礎性的要素。大模型需要用海量數據進行喂養,才能持續優化、疊代。

接下來,真正的價值將會變成可持續性的高質量數據。如何持續獲取合法合規、合商業邏輯的數據源,將成為大模型性能提升的關鍵因素。因此,數據運營商或將成為制約大模型發展的重要角色。

比較理想的狀態是,模型不斷為用戶提供服務,用戶不斷為模型生成新的數據。至於下一步,則會拼私有數據。更個性化的服務,意味著需要更私有化的數據,而人類不太可能將私人化數據毫無保留地展示給大模型。

任何時代,「賣水人」永遠是一門好生意。頗具意味的是,無論是開創者、探索者還是掘金者,都離不開水。當然也可以賣勺子、賣鏟子。

03

「結語」

前幾個月,社交平台上有一則帖子流傳甚廣:

把AI想像成一個小孩。歐美的AI屬於精英教育路線,出生後家裡就一路砸錢供他讀書到博士,等到畢業後,一出場就王炸,驚艷全場。

中國的AI屬於功利教育路線,出生就接受生存養育,養到15歲,就開始逼著他想辦法給家裡掙錢,學的都是如何市場化的技巧。

寥寥數語,細細品來,滋味萬千。

雖然不一定對,但這或許也在某種程度上解釋了OpenAI、ChatGPT為什麼沒有出現在中國。事實上,國內的一些投資人和創業者,在剛開始也是信心滿滿,要做中國版的OpenAI。在折騰了幾個月後,發現還是要尋找盈利模式,探索業務應用場景和商業化的能力。

值得一提的是,近來部分C端用戶感知到ChatGPT-4在某些任務上性能表現太差,這被認為是OpenAI使用混合專家模型(MOE)進行降本增效,將重心轉向企業級服務的動作之一

放眼望去,蘋果也在研發自己的大語言模型Apple GPT,高通則已經在研究如何在今年底實現,讓100億-150億參數級別的模型在手機上離線運行,無需雲端處理運算。

大模型是生產力的重塑,是範式轉換。200年前,人類用蒸汽機第一次把熱能變成動能,工業化時代開啟。今天,人類用大模型把電能轉換成腦力和通用智力,一個新的時代正在開啟。

輪子固然不需要太多,但我們仍然需要好用的輪子。

任重道遠。

參考文獻:

《經緯張穎:AI的遠與近》—混沌學園

《大模型,冷靜!》—中國企業家雜誌

《陸奇的大模型世界觀》—騰訊新聞

《對話傅盛:大模型的世界不只有愛因斯坦,還有普通人》—騰訊科技

《非獨家對話李彥宏:真正AI時代,新的應用需要基於大模型的「新地基」》—品玩

《大廠大模型,強在哪?》—定焦One

《大模型應用,必須警惕「速成幻覺」》

- END -

文 | 青沐

合作及進官方群請後台留言聯繫

圖 | 來自網際網路

文章來源: https://twgreatdaily.com/zh-tw/8a750c93842e60c28579ec56ac80bce2.html