作者|宋婉心
編輯|鄭懷舟
中國擁有超過700萬程式設計師,過去幾十年間,這個龐大群體的編程工作,幾乎完全建立在海外提供的編程工具及底座之上。
但這一情況在過去一年發生了改變。據CSDN的數據,現在64.3%的AI編程工具為國產化,國產AI編程工具使用占比達到57.2%。
得益於國內大模型廠商的軍備競賽,如今阿里雲旗下的AI編程工具「通義靈碼」的使用占比,僅次於美國頭部公司GitHub,其他更多國產工具產品也躋身占比前列。
要知道的是,在去年年初,編程工具這一市場在國內仍是空白。國內大模型混戰的過程中,編程AI化也成為重要的競爭方向之一。
供給側和需求側的增長是同步的。CSDN董事長蔣濤表示,CSDN 的用戶在過去一年增長了700萬,關注開源 AI 的開發者占比已達到47%,AI 開發者的快速增長已經成為顯著的趨勢。
「全球的基礎開源模型和領域開源模型已經超過1000個,開源模型在一年內的下載量更是達到了3.5億次。這是一個十倍速的時代。」
但對於程式設計師而言,只有「生成代碼」的大模型遠遠不夠。軟體編程是一條複雜程度足夠媲美汽車供應鏈的系統,但其在國內的工業化程度卻遠不及汽車產業鏈。
繼去年CSDN聯合華為雲CodeArts發布了開源社區GitCode後,今年9月21日,雙方又合作發布了GitCode AI模型社區。
「GitCode AI模型社區對標Huggingface。現在開發人員核心需要兩個底座,一個是代碼的底座,第二個是數據和模型的底座。」
蔣濤在36氪的採訪中表示,大模型生成代碼是一個能力,如何把這個能力用到它的流程和代碼工具裡面去,這是CSDN現在要做的。
按照信息技術發展的四個階段,第一代PC生態、第二代網際網路生態和第三代作業系統和晶片,前三代中國和全球都保持著開放與互聯互通。
但如今地緣政治的影響下,在第四代大模型和手機智能體應用生態,國內市場需要建立自主且完整的開發者生產力工具體系。
蔣濤認為,第四代生態是中國開源的重大發展機遇。
受訪者供圖
以下為36氪與CSDN董事長蔣濤對談精編:
36氪:您可以先簡單介紹一下這次發布的社區產品的情況。
蔣濤:這次發布的AI模型社區產品實際上是對標Huggingface的大模型社區。現在開發人員核心需要兩個底座,一個是代碼的底座,第二個是數據和模型的底座。
之前數據和模型的底座就用Huggingface比較多,Huggingface現在不能用了,所以我們需要構造一個相當於全類型的底座,它本身技術邏輯是一樣的。
軟體要有新形態,現在已經看到一些苗頭和和維度了。比如手機的去APP化,現在是一個過渡階段。
比如這次榮耀展示的跨APP能力,比如說你現在訂了很多包月的業務,但是你也不知道有哪些,有時候忘掉。你對著榮耀手機說「把我包月的業務都找出來」,它能理解你這句話,手機作業系統就可以控制你的APP,模擬用戶把所有都找出來再做個列表。
所以APP就變成只提供能力,不提供介面了。
這是在用戶側,然後在開發側、工具側,現在也在發生變化。現在程式設計師組裝模塊化的代碼還需要一套工具平台,因為組裝這個過程也是個數據流程,這就導致我們要有自己的底座和工具,所以現在我們現在和華為雲做了這個模型和數據的底座。
之後我們還要發布一個自主的IDE工具。整體上,我們希望做三件事,也是開源的核心問題:可持續的開源底座和根生態,可信賴的開源庫,可智能化的軟體研發流程工具。
36氪:一年前國內AI編程工具還是空白,如今國內廠商的大模型基本都提供AI編程工具能力,GitCode及其AI模型社區和這些編程工具的生產關係是怎樣的?彼此有競爭關係嗎?
蔣濤:不算競爭。大模型去生成代碼是一個能力,可以認為所有的大模型都有這個能力,但是怎麼把這個能力用到它的流程和代碼工具裡面去,讓它的易用性做得更好,這個是我們現在要做到的。
你要用到代碼工具裡面去,你所有這些東西最後是他如果是你就用大模型生成代碼再拷貝過來再去編譯,實際上效率是比較低的。
但是我們現在把它一站式集成,而且你寫的代碼馬上可以運行,你寫完代碼以後你的program馬上能出來,然後你調用大模型背後 GPU,我們也可以按調度能力給你變成一鍵可調用,這些都讓它變得更加的方便。
36氪:國內出現的這一批AI編程工具,跟美國市場上的產品比有什麼不同?
蔣濤:Llama3公布出來以後,我覺得中美本質差距不是太大,關鍵是在於下一代的差距會是怎麼樣的。
現在講邏輯鏈,然後就出來了ChatGPT o1,所以o1是一條線,另外一條線是不用Transfomer做了,用新的模型來做,類似於李飛飛那個空間模型。還有一個就是準備在上面加一層,把你的任務進行收斂。
所以現在我們跟對方的差距是在這裡,不在於公布出來的能力,差距是不知道對方還儲備了多少。目前看起來,後續差距有可能是比我們想像的要大的,因為馬斯克儲備了10萬張晶片,就說明一定是有對應的需求的。
但國內的這些大模型廠商,可能2萬至3萬張,大概是這麼一個水平。
36氪:美國的AI編程工具市場比較分散,一大批創業公司,您怎麼推斷中國這個市場的未來競爭形態?
蔣濤:國內已經相對集中了。國內的情況比較特殊,因為國內沒有這個市場,上一波做SAAS的人大部分遭遇了失敗,所以現在大家就很謹慎。
我們現在也就是想為大家創造這麼一個環境,就是說我們也得做供應鏈,而且我們其實做的是一個基礎供應鏈,中間環節還有很多點可以被提升和改進,這些點大家都一定能收到錢才行。
我們現在需要建立的是商業化路徑,做開發工具要能獲得收入。現在比較容易的一個路徑,是在國外的基礎上先做二創,先做插件做服務,然後國外也能掙點錢,國內尋找下一個機會。
中國一大堆上市的軟體公司不掙錢都是這個原因,因為沒有產品能力,只有集成能力,所以就賺不到軟體最好賺的錢,也就是複製的錢。
36氪:GitCode的商業化路徑是怎樣規劃的?
蔣濤:商業化現在實際上是清楚的,只是要把路徑做好。
第一,如果你能幫助他提高效率,開發人員是願意為工具付費的,其實最願意付費的是企業老闆,因為老闆買的開發人員就為了買他的工作效率,但是現在這個共識或者說常識沒有被大家接受,那就要證明這一點。
這是第一個,我們首先要把 AI編程切進去,切進去以後大家發現每個環節實際上都還有可提升的空間。那麼,一種就是你自己找別人的開源軟體拼裝進來用,一種是你去買一個人提供服務的能力,比你自己拼裝效率要更高。
之後我們在這之上再構建一個集中需求的市場,因為我們可以發現用戶的一些需求,我們就可以把這個需求變成一個服務,讓開發人員來做,這是我們下一步正在做的一件事,但要到明年來看到底做的怎麼樣。
這個需求提出來了,它如果是一個可以標準化調用、可產品化、可被複製的一個需求,我們就鼓勵開發人員去做這個事,然後我們就可以變成它的分銷商。
就是未來所謂的「程式設計師up主」的概念。
36氪:關於這一點,您說會誕生大量的獨立開發者,像up主一樣,這是供給端,您如何確認市場有相應的大量需求去消耗這些供給?
蔣濤:需求當然也還需要被激活。因為有的需求可能沒人做,但是大多數人不知道需求在哪,因為沒有人去收集它。我們現在收集的是開發者的工具需求,未來可能還有應用類的需求,應用類的需求就反映出來(C端的需求情況),但是要有一個雙向雙輪滾動的過程。
我們還有一個sponsor,叫Micro-SaaS工會。現在不是創業難嗎?但是大公司也還在做人員優化,出來的這批人就覺得做海外市場好了,海外找到需求點,如果能賣出去的話,很多獨立開發者也能掙很多錢,美國本身有這個軟體付費市場,所以大家先在那裡練能力。
而國內還需要一個過程,這個過程在於,軟體的創造成本真的要降下來。我們的工具鏈甚至包括國外的工具鏈,大家還沒有用得那麼順暢,如果它能降下來,需求就有可能被滿足。
但是現在的需求是什麼?現在都是企業級需求,企業級需求的複雜度和交付標準要求比較高,還沒有到散戶要求,所以這是一個雙向的過程。
這是為什麼我說我們跟手機廠商未來有機會可以做聯合,比如Siri上可能就有大量的需求,肯定一堆人對著蘋果瞎喊一通,但沒有人把它提煉出來。
這就是一個要靠程式設計師自己去發掘的點,但是原來付費通道又沒有轉起來,所以可能程式設計師做了幾十萬個應用,用戶也不去調用。
所以後面就是要看,「需求的多元化」和「供給的低價化」,兩個之間要找到一個碰撞點。
我們最近剛招了一個小伙子進來,他自己做IDE,他原來是做遊戲引擎的一個核心工程師,後來自己做出來創業,他自己做了一個IDE,是準備幫助Python的開發者去做應用。
學Python的人是最多的,但Python有個巨大的問題,他寫不出一個獨立的應用程式出來,這個流程很複雜,因為國外沒這個需求,國外專業程式設計師不用Python,他只是在需要調用一些模型數據時去調用,
國內前一陣人工智慧教會了一批人用Python,但是他們沒法做應用,(需求)全都撒在那兒,語法會了,做不出來。他就看到了這個需求,就做了一個Python的IDE。
然後做完這個東西,工具寫出來了,但也沒人用,或者大家還不太會用,他就想做個樣板程序。寫什麼樣板程序能讓大家感興趣?他就到閒魚和淘寶上去看。
所以這需要一個過程,
36氪:這就相當於GitCode AI模型社區的角色是吧?把散戶需求聚集起來,然後連接開發者跟需求。
蔣濤:對。淘寶閒魚沒有程式設計師,但很多人在那裡發需求。而且做過的需求要再做,成本就低,因為我的程序90%是可以復用的。