他從阿里離職,要做中國第一個打破數據壟斷的創業者

2024-01-12   鈦媒體APP

原標題:他從阿里離職,要做中國第一個打破數據壟斷的創業者

圖片來源@視覺中國

有著餘杭「曼哈頓」之稱的杭州歐美金融城,聚集了一眾從阿里辭職的創業者。吳翰清的新公司就位於這裡,他最近正在頻繁約見投資人。

2023年5月,網傳阿里P10級人物吳翰清,宣布創業。直到近段時間,他的AI項目才浮出水面。

簡單點來說,這位15歲進入西安交大少年班的天才,有了一個天才想法:在阿里浸潤了15年,他宣布用「魔法打敗魔法」,用一個「新世界」打敗「數據壟斷的舊世界」。

數據壟斷與數據剝削

自人類進入數字時代以來,數據以中心化的形式存儲於特定的數字平台中,人類從中獲得便利、甚至在其中構建新的業態和生活方式。於是,平台上的數據越來越多,被人們選中的數字平台成為了數據壟斷方,而當這種默認契約達成後,數據剝削便產生了——

用戶自願生成的數據以及用戶在數字平台上的「存在」被平台售賣給廣告主和項目投資公司,平台在這一過程中賺得盆滿缽滿,而作為數據生產者的用戶和作為流量的用戶卻並沒有獲得任何實質收益。這是對用戶數字勞動的絕對剩餘價值和相對剩餘價值的雙重剝削。

數字平台與數據剝削

這種數據壟斷和數據剝削也成為當下一些社會問題的幫凶。比如,近來一組數據受到關注,根據北師大中國收入分配研究院2021年發表的調查數據,我國超過一半的人口月收入不到2000塊。一個社會的財富總量在一定時期內總是有限的,有人靠壟斷資源攫取了暴利,那麼普通人得到的財富自然就少了。「網際網路巨頭和背後的資本攫取了過多的暴利,這些暴利已經遠遠高於社會人均收入值,超出了合理範圍。千萬富翁越多,老百姓就越窮。」吳翰清在個人公眾號中發文表示。

他的觀點是,當今網際網路最深層次的主要矛盾在於:「信息聚集導致的數據壟斷」和「人們對自由、開放、共享、平等的網絡環境的嚮往」之間的矛盾。

去掉「中間商」,構建一個去中心化的網際網路,是吳翰清創業的初衷。

只不過,他一直在等待一個時機。

時機到了

ChatGPT橫空出世,吳翰清認為,打破數據壟斷的時機到了。

他要構建一個AI網際網路,並構建個人AI計算機。如果這個想法能夠實現的話,吳翰清的願景是:「AI網際網路」將消滅精準營銷廣告,把精準營銷廣告商榨取的萬億級別人民幣利潤返還給供應商和老百姓。」相當於,人們以後在網際網路上買所有東西應當會免除一道廣告稅。

對於那些希望通過看廣告來免費獲取服務的用戶來說,需要認識到廣告的隱蔽危害最終抬高了商品和服務的價格。而想免費獲取某些商品和服務其實有其他辦法,比如通過自己的分享來換取,就是一個健康的機制,它提倡和鼓勵人們分享,而非攫取。因此最終AI網際網路會更省時、更便宜、更豐富。

於是,吳翰清成立了新公司"KMind",第一代產品即「半個宇宙」。

半個宇宙的「AI網際網路」設想

半個宇宙的產品邏輯與ChatGPT有一定的共通之處,在半個宇宙的架構底層也使用大語言模型LLM,不過囿於LLM當前存在的比較嚴重的幻覺等問題,半個宇宙在路線選擇上,主要通過LLM在LUI(Language User Interface,人機對話交互)中完成用戶對話意圖分類,以及在運算器的位置通過LLM提高效率。但並不需要LLM的邏輯推理能力。

「邏輯推理能力是我們控制器要建設的核心能力,我們也不需要LLM的常識,因為我們的存儲器將讓用戶建設自己的私有知識庫。」吳翰清表示。

也就是說,半個宇宙中的用戶可以像使用雲盤一樣,將自己的數據存儲在半個宇宙當中,用戶可以選擇這些數據是否共享。如果選擇共享,當另一位用戶向半個宇宙提出問題時,半個宇宙的AI框架會自動在已共享資料中尋找答案並將這些答案帶給提問者。

在這樣的模式下,數據存在於每一個用戶手中,他們對自己的數據是共享享有決定權,當那些被共享出來的數據被其他用戶以提問的形式召喚時,AI將自動處理數據將信息「送貨上門"。

個人AI計算機

半個宇宙所使用的AI框架由馮·諾依曼架構的擴展而來,保留了馮·諾伊曼架構的主要部件:輸入輸出模塊、控制器、運算器、存儲器。

不過,依託馮·諾伊曼架構,半個宇宙的底層框架在輸入輸出模塊增加了LUI,它基於LLM對用戶的自然語言做意圖分類,然後觸發控制器執行相應的動作。其次新增記憶器用於處理短時記憶,LLM和提示詞框架也被放到了運算器中。而其中的控制器相當於整個系統的「大腦」,它理解用戶意圖並對複雜任務做拆解,並調度不同的執行單元完成任務。

吳翰清將這個擴展後的AI框架定義為個人AI計算機,這個系統也被命名為kOS-1.0。

KMind通用AI計算機架構圖

個人AI計算機主要實現兩類任務,一是自動化的處理數據,二是學會使用工具。個人AI計算機要完成的本質工作只有一個:操作數據。」吳翰清表示。這也決定了半個宇宙與OpenAI的本質不同,半個宇宙追求的是個人AI計算機,而OpenAI最終可能會形成一個AI Agent生態。

半個宇宙與OpenAI

半個宇宙的世界中除了最終用戶,還有一類群體會對這個宇宙的建立起到至關重要的作用,就是開發者。在半個宇宙的邏輯鏈中,開發者可以自主開發ACT(Action縮寫),ACT強調AI自主性,即定義自主智能(Autonomous Intelligence)行為,初衷在於用戶可以用自然語言來操作計算機,LUI則在中間完成自然語言Query到ACT之間的映射。

半個宇宙初始設置了「Native ACT」,通過Python編寫代碼,組合Native ACT的調用,開發者就可以開發出一個自定義的ACT。不過,由於實現了「基於自然語言的AI編程",半個宇宙的開發者群體有望從700萬開發者,變成7000萬的專業工作者。各行各業的專業工作者如作家、畫家、美食家、律師、醫生、教師、學者等等通過自然語言描述需求,AI計算機自動完成任務。

吳翰清的觀點是,在AI時代,ACT會成為新的程序開發形態。

「新世界」能成嗎

叫板OpenAI,棒打巨頭壟斷,半個宇宙這件事兒能成嗎?誰來為這樣一個反壟斷、反剝削的新世界買單?

半個宇宙承諾不使用用戶數據來訓練AI,也承諾絕不上線廣告,但它最終還是需要用戶買單的付費產品。

「現在為計算機花多少錢,未來在『半個宇宙』就會花多少錢。但半個宇宙價格可能會更親民一點。」吳翰清表示。

對於一家計算機公司來說,計算是重資產,伺服器也是重資產,這些成本無論如何也無法用廣告收入來抹平,它必須是付費而不是免費的生意。就商業的本質來說,吳翰清認為,半個宇宙最終賣的是算力,用戶未來按月彈性訂閱,也可以分成48個月付款,每個月花幾十塊錢就能夠得到一台計算機了,並且這台計算機還可以隨時擴容,隨時進行算力升級。

為了觸達用用戶的不同使用場景,半個宇宙未來也不排除推出硬體類產品。"你不能說我們把AI真的塞到這個硬體盒子裡,不是這樣的,但它肯定會有一些雲端之間的協同,這是必然會產生的。"從吳翰清的表達中看,硬體可能是更長期的布局,不會現在立即就做,它會跟隨半個宇宙成長規模慢慢展開。

半個宇宙的數據量最終會超過百度,會不會超過谷歌再說,但一定會超過百度」吳翰清表示。他也並不害怕與巨頭的正面競爭,「這是兩個時代的競爭,如果真的這件事情成了,或者說如果我預測的未來到來,他們就自然消亡掉了,所以都不是說我把它們打敗,是時代把它們打敗了。」

以下為訪談節選:

1.在所有的GPT都是希望成為OpenAI的情況下,半個宇宙如何保證不成為OpenAI?

吳翰清:這裡面有一個很重要的區別就是,首先如果這個公司的商業模式是廣告,那我覺得最終它很難避免自己不作惡。不提倡數據壟斷意味著我們不會用大數據去盈利,但這不是說我們不會用大數據,我認為我們未來數據總量至少超過百度,會不會超過谷歌再說,但是我認為我們的數據總量未來至少是超過百度的。

第二我們不會自己搞一個擁有所有常識的AI出來,然後去收費,我們不會幹這個事情。那我們這家公司幹嘛呢?我們賣算力,「半個宇宙」提供的是算力,程式設計師進來提供的是算法,用戶提供的數據,所以數據是歸用戶的。用戶得到了數據,創造了價值,程式設計師得到了他寫的算法創造的價值,最後「半個宇宙」提供了算力,這是一個良性的生態結構。OpenAI是這三者全是它的,數據的價值是它的,算法的價值是它的,算力的價值還是它的,所以最後它是會讓所有agent公司死掉,我們會讓所有的agent公司活,這就是差別。

從另一個角度來講,為什麼我剛才提到OpenAI有點問題?就是它最近的這個「宮斗」,我不知道外界怎麼解讀的,從我的角度我覺得是非常糟糕的一件事情。

2.OpenAI的董事會和Sam,你支持誰?

吳翰清:這不是一個支持不支持的問題,如果我在Sam Altman的位置我會做同樣的事情,但是今天我是一個外部觀察者的角度來看,我認為是非常非常糟糕的。原因就是OpenAI這個母體它的非盈利性的組織,它是通過協議在約束商業公司的,最後如果這個員工起義就能夠把董事會給fire的話,那所有商業的契約精神就不復存在了,所以我認為這是一家沒有契約精神的公司。不管他的出發點是不是正義的,但是他一定是違背了契約精神。你看看OpenAI它原本的董事會,他們想幹嘛?他們是認為AGI對人類可能會造成威脅,所以他們試圖去維護它。他們是在捍衛道德,還是在捍衛商業之間做了一個博弈,最後商業贏了。

在發生了這樣的「宮斗」之後,我認為OpenAI對我們已經沒有威脅了,因為我們的價值觀比它更正。我們一直是走在希望創造更平等的網際網路的道路上,但OpenAI曾經試圖堅持這件事情,我認為如果他們真的把Sam給fire掉了,我認為這是一家非常偉大的公司。

3.如何去抵抗數據剝削?因為「半個宇宙」最終要成為一家盈利的公司,要成為一家商業公司。

吳翰清:我要把最關鍵的「半個宇宙」信息推薦算法和檢索算法開源掉,由一個開源社區來維護,第一天我們就做了這件事,斷掉了未來「半個宇宙」想要閉源的根子。如果某一天「半個宇宙」竟然想要把它給閉源掉,把開源算法替換掉,那我也號召所有「半個宇宙」的居民來推翻它,因為從那一天可能就是他作惡的開始,他開始嘗試又從不壟斷數據走向了數據壟斷,那就是違背了這家公司的使命和初心。

4.剛才您提到了「半個宇宙」賣算力,這個具體是怎麼做的?最終付費的是不是還是用戶?

吳翰清:最終付費的當然是用戶,因為我們是一家做計算機的公司,而且我也說了,我們只對標蘋果,所以你想想吧,你買蘋果手機是要付費的,沒有人說會免費的給你用智慧型手機,除非是運營商買單,然後積分什麼換,但實際上一定是有人為此去付費的。

5.您剛才也提到了做硬體,接口很重要,那這個是必選項還是說未來可能為商業模式去考慮更順利然後做這件事情?

吳翰清:剛才談到硬體純粹是出於商業考慮,就像我說的,我們真正的主體是在雲上的,所以我們的星伴它一定是一個AI永遠在線的形態,硬體只是為了更好的去通過商業觸達不同的場景。因為今天很多消費者的購買選擇是非理性的,比如說很多消費者去買車的時候,他壓根不懂車裡面的引擎到底有多好,他是看這個車的外形好不好看。不好看的統統否掉,就都不進入到購買選項,只去看好看的車,它貴也會買,所以消費者的選擇往往是非理性的,我們做硬體可能也是出於這樣的消費者心理的考慮。但你不能說我們把AI真的塞到這個盒子裡,不是這樣的,但它肯定會有一些雲端之間的協同,這是必然會產生的。所以是不是做硬體對我來說是一個商業選擇,而且可能也不是我們第一天的商業選擇,但是隨著我們成長的規模和路徑慢慢地都會覆蓋到。

6.半個宇宙的思路在現在看來是超前的,因為超前就有可能失敗,會有這個問題嗎?

吳翰清:我認為可能之前我們看到了很多公司,他們嘗試著想做類似的事情,但是他們可能出現在10年前,所以他們失敗了。那到今天我之所以敢出來做,是因為我認為時機和條件成熟了。就像我在我們這裡分析的就是到今天誕生個人AI計算機的幾個基礎前提今天已經具備了,今天出現了大模型這樣的具備足夠泛化能力的神經網絡,在之前是沒有這個東西的,之前都是小模型,都是基於特定場景的,必須依賴於數據的樣本,這件事情大概在4、5年前還是這個樣子,但是到今天我們突然發現大模型出來之後改變了很多,它最關鍵的改變我認為是在這個地方,所以LUI是一個巨大的變化。

第二是談到雲計算今年也是產生了,所以今天我們是有足夠的能力支撐我們來做這樣的事情,有足夠的算力。這個算力不是指的英偉達這個東西,我們談到的是雲計算這種模式。

三是我們認為到今天可能這個臨界點就是在於可編程這件事情,如何讓一個AI具備可編程能力,我認為是到了一個臨界點。這件事情還沒有真正突破,但是恰恰因為它沒有真正突破,所以我們才有機會。如果它已經被別的公司突破了,我們也沒有機會了,所以我認為最後這臨門一腳應該我們射出去。恰好是在一個天時、地利、人和的時間點上,天時、地利、人和,你不這樣想嗎?我認為是天時、地利、人和。

7.打破數據壟斷這個東西一定會動各大廠蛋糕,如何考慮這些難點?

吳翰清:首先我認為跟這些大廠的競爭是兩個時代的競爭,所以我跟他們其實也沒什麼好競爭的。如果真的這件事情成了,或者說如果我預測的未來到來,他們就自然消亡掉了,所以都不是說我把它們打敗,是時代把它們打敗了,是時代淘汰了它們。時代認為未來應該是一個更平等的網際網路,而不是說一個被壟斷的網際網路。所以AI網際網路到來的那天,首先不一定是「半個宇宙」做成的,但是AI網際網路我認為它一定會到來,所以那些公司就是今天做廣告的,它自然就淘汰掉了。為什麼會淘汰掉呢?因為我們認為它們很難轉型,因為它們都是上市公司,財報把他們壓到他們沒法轉型,沒法調整,做任何的調整財務數據一掉,投資人跳起來,股民跳起來,他們就又不能調了,所以就很艱難。你會看到的現象是這些大廠裡面的人才都流失,然後出來去擁抱AI網際網路,你會看到這樣的現象,那我就把這個預言放在這好了。

所以我才覺得「半個宇宙」是在順勢而為,我們不是說我們今天創造了AI網際網路,我認為是AI網際網路必將到來,我們看到了這樣的未來,看到了這樣的機會,所以我們提前進去了。

更高的事情,我們是在做一件效率更高的事情,所以最終我會把它做到安全讓大家選擇去相信它。今天是一個很好的開始,在今天我們一定會受到一些質疑,就是關於隱私和安全的挑戰,但是我們會優先選擇願意相信我們的人來共同成長和發展。隨著相信我們的人越來越多,我相信最終我們會被社會所普遍接受,所以這是一個社會需要去接受它的一個新事物的過程,它不是別的過程,所有技術都需要經歷這樣的過程。

8.怎麼看待下一代搜索?很多公司都想成為一家下一代搜索公司。

吳翰清:搜尋引擎本身是在聚合網際網路上的大量信息,才會有搜索這個概念。在我們AI互聯的概念裡面是沒有這個概念的,你要做搜索也只是一個局部搜索,所以在我們AI互聯的概念裡面,應該是你有需求你要廣播,無非是看你廣播的範圍,最後會有很多AI出來應答,應答是一個推薦的過程。推薦過程有可能開源掉,所以我認為在我們看到的AI互聯的未來裡面是沒有搜索這個中心化概念的,這是我們非常重要的一個區別。

9.但它實際上做的就是搜索這個事,只不過換了一種去中心化的方式。

吳翰清:它做的不是搜索這個事,因為搜索是人在找信息,我們AI互聯講究的是信息找人,是信息的反向流動。這個反向流動你已經不能把它叫做搜索了,你獲得了信息,但它不是搜索來的。