我遇到一群能「預測未來」的人

2020-05-29   淺黑科技

原標題:我遇到一群能「預測未來」的人

文 | 史中

(一)從「數據紀元」到「大數據紀元」

上面這張圖,是土星五號。

這個36層樓高、3000噸的怪物,是人類史上最大的運載火箭之一。它曾經9次把太空人送上月球。

1962年在賴斯大學體育場上宣布登月計劃時,甘迺迪曾說了這樣一句話:我們選擇登月,並非因為它簡單,而恰恰因為它困難重重。

甘迺迪所說的「重重困難」中,有一股鮮為人知的「暗流」:

一枚土星五號有200萬個零件,而為了精確追蹤每一顆零件的製造過程,NASA 需要管理一個巨型的表單。為此,IBM、北美航空、卡特彼勒聯合為 NASA 開發了一套數據管理系統 IMS。

於是,人類一不留神手造了一個新物種——「資料庫」

正是依靠資料庫在十幾年間精準的記錄和有條不紊的調度,才最終把「登月」這項壯舉從紙上談兵變成鋼鐵現實。

從那一刻起,沒有人能阻止這顆種子萌芽。潦倒的程式設計師拉里·埃里森寫出了 Oracle 商用資料庫,IBM 推出了 DB2。此後,銀行、券商、酒店、航空、連鎖超市各行各業里每一個顧客的訂單、每一個帳戶里的每一分錢都交由資料庫保管。

自此,我們這個物種進入了「數據紀元」。

時間來到1983年,大洋彼岸的中國。

這一年,阿爾文·托夫勒撰寫的《第三次浪潮》由三聯出版社第一次譯成中文出版。這本書在中國狂銷1000萬冊,被後世追認為「先知啟示錄」。書里所說的第三次浪潮,正是後來出現的「網際網路」。

預言網際網路的到來已經夠神了,而托夫勒更是喊出了一句彼時無人能懂,但現在看來不要太牛X的「神諭」:大數據將是第三次浪潮中的華彩樂章。

啥意思?也就是說,如果把網際網路比作一段搖滾樂,那麼大數據就是吉他手「嗞兒~~」一聲之後瘋狂的動次打次。。。

大數據有這麼神麼?很可能有。如果讓中哥只用一句話展現大數據的神奇之處,我會這樣說:

把大規模的數據放在一起分析,就可以在某種程度上預測未來。

怎麼預測未來呢?別急,下一章里中哥掰開揉碎告訴你,我們先看故事。

1995年夏天,一個毛頭小伙子走進了昆明理工大學。報到通知書上寫著他的名字:甘雲鋒。

他臉上並沒有太多喜悅,高考沒有發揮好,專業是調劑的「測繪工程」,並不喜歡。但他卻是個倔小孩,喜歡就是喜歡,不喜歡就是不喜歡,打死也不喜歡。整個大學時光,他喜提20多門重修,「退學警告」像病危通知一樣一道道送到他手裡。

可是他的恨分明,愛也分明。在所有課程里他唯獨愛一樣:計算機。而在計算機里,他又偏偏痴迷普通人敬而遠之的硬核技能:資料庫。

那時候的計算機內存小得可憐,編程的時候連字型檔都不能全載入進去,經常要用彙編語言輾轉騰挪,用到哪些字就提取哪些字。能用數據操控一切的感覺,簡直太神奇了。

回憶往昔,甘雲鋒嘴角上揚。

風劍

仿佛上天安排,甘雲鋒在學校圖書館翻到了那本《第三次浪潮》,看到「大數據」三個字,一道閃電咔嚓一下從他額頭劈過。「砰!」他把書合上,周圍人都抬頭側目,看著這位神神叨叨的同學眼裡爍爍放光。幾秒種後,同學們紛紛回到了自己的世界裡,可是甘雲鋒卻永遠留在了未來。

甘雲鋒並不孤單,神州大地上,無數英雄和他一樣強烈地接收到了《第三次浪潮》的感召。

1998年,馬雲成立了阿里巴巴,1999年,馬化騰成立了騰訊,2000年,李彥宏成立了百度。燈光如炬,那些亮暗分明的面孔登上舞台。一場有關大數據的磅礴史詩,就此奔騰開去。

(二)能「預測未來」的神器

剛才中哥還欠你一個解釋:大數據怎麼預測未來?

空口無憑,舉個栗子。

2016年,紅遍大江南北的《我是歌手》開始了第四季,湖南衛視的領導輾轉找到了時任阿里雲總裁胡曉明:「都說大數據可以預測未來,你們能不能用大數據預測一下《我是歌手》的冠軍?」

這個劍走偏鋒的重任,猛然落在阿里巴巴的一群數據老司機頭上。

他們趕緊跑去各大音樂平台收集數據,包括各位歌手歌曲被播放的次數,被評論的次數,評論中的情感取向;
然後他們又找來往期《我是歌手》,從中分析出哪些旋律和節奏更受歡迎;
在決賽之前,他們專門去節目現場安裝了聲音捕捉裝置,用來探測現場觀眾的歡呼聲浪大小;
他們還在現場安裝了人臉捕捉裝置,用以探測觀眾的哭、笑、流淚;他們還向湖南衛視要來了實時收視率數據,由此可知每時每刻觀眾的「跳台率」。
總之,凡是能用來預測未來的數據,能收集的全都收集了。

直播開始後,每隔五分鐘,系統就根據最新數據一頓狂算,刷新一次冠軍機率,有理有據,朋克異常。最終,機器人成功算準了半決賽前三名中的兩位,並且在決賽直播中一舉預測了總冠軍李玟。

你看,如果沒有科技,平淡無奇的數據就這樣躺在世界的角落裡吃灰,但用大數據技術把它們煉在一起,居然就能成為「看見未來的水晶球」。

剛才中哥故意打了個「馬賽克」——沒有透露這次預測背後操刀的老司機是誰。估計你也猜到了,正是甘雲鋒和他的團隊。只不過,這位執拗的技術大牛幾經輾轉加入阿里巴巴後,取了一個更為人熟知的花名:風劍。

風劍是2011年加入阿里巴巴的。這個時間一點兒都不偶然,其實就在那幾年,阿里巴巴網羅數據英才成立「數據平台事業部」,全中國最好的數據大牛幾乎盡入阿里彀中。這麼做,當然不是為了預測《我是歌手》,而是為了四個字:真金白銀。

不如說直白一點,阿里巴巴最想預測的就是:你(別瞅了,就是你)可能會買什麼。

舉個例子:你在淘寶上的每一次瀏覽什麼商品,瀏覽多久、是否收藏、經過多久下單、下單之後是否回購,這些數據其實都可以被阿里巴巴用來給你「號脈」——猜到你的喜好,從而主動出擊,給你推薦更適合的東西。

在淘寶的各個頁面里,其實都是給你量身定做的內容

阿里巴巴也不是從一開始就意識到大數據這麼有用的。大概從2008年左右開始,淘寶的數據沉澱增多,大數據計算的理論框架成熟,計算力成本也在下降,他們意識到,自己平台上幾億用戶每天「折騰」的數據一夜之間變成了一座挖不盡的金礦。正如王思聰16歲的時候才聽說原來老爸是個富豪,這種感覺不要太好。

雖然家裡有礦,但礦藏不是你想采,想采就能采。要把「大數據」的礦石冶煉成黃金,還要解決多如牛毛的具體問題。

舉個例子:

在2013年的阿里巴巴集團下面,其實是有淘寶、天貓、聚划算、航旅、無線、阿里媽媽等等25個事業部,幾乎每個事業部都各自存儲著消費者的數據。

由於這些系統誕生的時候,誰也沒想到後來還能用大數據系統分析,所以相互之間沒有設計數據互通機制。。。。

這就像戰國時期的車軌距,有五尺、有六尺、有七尺,還有五尺半。。。要是這麼搞,再厲害的老司機也沒辦法在戰國七雄之間無縫飆車。

其實,風劍加入阿里後,很快就和其他大牛們一起投入了「數據打通」的戰鬥。他們陸續花了三年的時間,才建好了一個叫做 TCIF(淘寶消費者信息庫)的東西。有了 TCIF,阿里巴巴內部的數據才實現了「車同軌」,這才有了後來奔涌的大數據史詩。

「統一六國」之後就萬事大吉了嗎?圖樣圖森破。老司機們還面臨各種奇葩的問題,再給你舉一個比較有趣的例子:

我問你,假如你是淘寶用戶,但是你今天逛淘寶忘記登錄自己的帳號了,那麼淘寶怎麼知道你是你?

如果淘寶不知道,就只能推薦給你一些大眾喜歡的東西,你敗興而歸,淘寶商家也賺不到錢;如果能猜到是你,那麼就可以推薦更適合你的東西,沒準你就挑中了一樣心水寶貝,淘寶也賺錢,皆大歡喜。

所以「知道你是你」,還挺重要的。

這個事兒,歸阿里巴巴的廣告事業部「阿里媽媽」管,那時候阿里媽媽的很多同學覺得「猜人」的難度太大了,最多只能探測一下你用的這部電腦(或手機)之前登陸過哪些帳號,在這些人中隨機認定一個。這樣的「盲猜」,識別準確率只有17%左右——蒙六次能對一次。

你也來盲猜一下,他們都是誰???看你的準確率有沒有17%

下面揭曉答案

可是數據老司機風劍卻聞到了機會:用戶留下的信息,可不只有設備號這一個。還有 Wi-Fi 環境、操作習慣等等,蛛絲馬跡其實已經足夠多了,如果把現有這些數據進行「深度計算」,就像拼圖一樣,猜出用戶全貌也許並沒那麼難。

於是他跟領導申請,帶隊做一套識別用戶精準身份的「ID-Mapping」(用戶ID關聯識別)系統

系統不是你想做,想做就能做。ID-Mapping 的投入少則需要大幾千萬,多則幾億,可是做出來後效果究竟如何,沒人說得准。數據平台事業部從上到下,有四五個領導看過之後都覺得風險有點大,建議是:先停下來,等等再說。

風劍三番五次解釋,領導兩次強勢叫停。

風劍的祖傳脾氣上來了,做了一件「大快人心」的事兒:把老闆們集體拉黑。他還放出狠話:「這件事兒,在技術上我已經認準了,我給你們兩個選擇:要麼開除我,要麼我就把 ID-Mapping 做到底!」

這波操作把當時他團隊里的幾個同學們都嚇傻了。

江敏就是風劍團隊的一員,回憶起來,他笑著說:「當時覺得,風劍太硬核了,沒等領導給他兩個選擇,他居然先給領導兩個選擇。。。領導最後居然還選擇了屈服。。。不過後來事實證明,風劍的技術眼光真的是領先大家好幾年。搞事情,就得跟著這號不撞南牆不回頭的人才能成。」

ID-Mapping 陸續做了一年多,結果大獲成功:阿里媽媽之前對用戶的識別率只有17%,使用 ID-Mapping 之後瞬間被提升到了75%,點擊轉化率從之前的 0.15% 提升到 2%,狂飆十三倍。。。

這意味著背後帶來的額外收益,不知道值多少個「小目標」。

這一下,原來最激烈的反對者都啞口無言。

在後來不久,友商們也紛紛開始嘗試 ID-Mapping,大家有點後怕:如果阿里不是提前搞定這項技術,就會在電商競爭里吃一個大虧。

ID-Mapping,加上剛才介紹的打通阿里巴巴各個業務部門數據的系統 TCIF,再加上同樣是風劍主導的,讓淘寶商家可以傻瓜式地向指定人群投放廣告的系統 DMP,這三大法寶,構成了阿里巴巴的大數據能力的基石,還在2015年被 CEO 張勇評為阿里巴巴「最有價值的數據戰略資產」。

這,就是被無數業內人士津津樂道的「阿里巴巴大數據中台」。

2014年阿里巴巴在美國上市,風劍和同事們的合影

而在大數據能力的加持下,阿里巴巴的收入突飛猛進,正是因為看到了這一切,馬雲才在那次大會上豪情萬丈地宣布:人類將進入「DT 時代」。

風劍的夢想也開始上頭。

(三)西天取經

大風起兮,必有英雄。

阿里巴巴把數據平台事業部一分為二,一部分留在阿里內部維護既有系統,一部分劃入阿里雲,負責「先富帶後富」——幫助其他公司使用大數據。

作為一個鐵桿理想主義者,風劍的想法很明確:「大數據能預測未來,當然應該讓全世界的公司都學會啊!」於是他一秒猶豫都沒有,加入阿里雲,組建「數據創新工作室」,開始了「布道生涯」——幫助其他企業建立他們自己的數據中台。

數據創新工作室成立後,馬雲、王堅、胡曉明來參觀

然而,理想的宿敵從來都是現實。

注意,風劍的本意是授人以漁——教會別人怎麼利用自家的數據;可是那時候,大多數找到風劍的人卻希望阿里巴巴授人以魚——直接把你阿里巴巴的數據給我用。

直接把阿里的用戶數據給另一家公司用,會有效果嗎?很可能有。能不能這麼干呢?絕對不能!

這裡有個巨大的問題:所謂的「魚」——用戶數據——其實屬於阿里巴巴和用戶雙方聯合產生。雖然當時的法律沒有明確規定,但是風劍的直覺告訴自己,如果靠賣用戶數據賺錢,恐怕三年之內,腦袋就不在自己脖子上了。。。

況且,對於一家公司來說,最好用的數據肯定是自己的數據。這就像衣服一樣,把別人的衣服拿來穿,雖然能穿,但大機率是不合身的。

於是,風劍的日常劇本就是給各路客戶解釋:「你自己家裡這麼多礦,不需要惦記別人的數據!」

這條路走得異常艱辛。

那天睡不著覺,他突然開始反思三個問題:

第一,眼看企業的數據越來越多,一旦大家都掌握大數據技術,那這會不會是一個巨大的商業機會呢?
第二,但現實很骨感,99%的企業還沒有大數據入門。這場「布道」至少還得堅持五年到十年才能獲得回報。我能堅持下來嗎?
第三,如果我決定去「布道」,是背靠阿里這棵大樹更好呢,還是獨自遠行更好呢?

對於第一個問題,答案毫無疑問:是。

對於第二個問題,答案也斬釘截鐵:能。

「我把一輩子都用來和數據打交道了,做別的都沒興趣,別說十年,堅持一輩子都沒問題吧。」風劍說。

至於第三個問題,他的答案是:要獨自遠行。

數據都存在企業的 IT 系統里,但企業的 IT 系統千差萬別,就拿底層的雲計算來說,有的使用阿里雲,有的使用華為雲,有的使用騰訊雲。如果留在阿里巴巴,我肯定只能使用阿里的技術體系來幫企業解決問題。
這樣,雖然看起來是背靠大樹,但是從長遠來看,我自己也被拴死在這棵大樹上了。被拴在樹上,又怎麼「西天取經」呢?

風劍說。

第二天一早,他下定了一個大大的決心:

阿里巴巴曾經像一個光芒萬丈的宮殿,給了自己無限榮光。但是現在,是時候深鞠一躬,收拾行囊,去西天取經了。

你可能會笑,創業就創業唄,怎麼好像生離死別一樣。

其實還真有點生離死別。。。作為功臣元老,當時風劍手裡的阿里期權可是不少,如果拿到現在價值最少5000萬。如果換做是中哥,和阿里告別,容易;和錢告別,難。

我說服了自己,如果我留在阿里,就會越來越有錢,越來越喪失改變世界的鬥志。為了那個更大的目標,我別無選擇,必須「斬斷情絲」。

風劍笑。

具體來說,風劍想創業做什麼呢?

他想要做「數據中台」,這個中台要像一個「大廚」——無論是政府、金融、地產、工業、傳媒各個行業,只要把自己的 IT 系統連通這個中台,就等於提供了食材(數據)。接下來不用管,想吃什麼菜就能自動炒出什麼菜。企業不需要有阿里巴巴那麼強的大數據經驗,「哪裡不會點哪裡」就行。

如果真能做出這麼一個適合各行各業的數據中台,未來肯定會像雲計算一樣成為各個企業的基礎設施,大放異彩。

可是這條路又太艱險:

首先是人的問題:大數據布道是個漫長的過程,很可能十年後才能看到大規模商業回報。這一路西去,艱險異常,稍不留神就會被妖怪當點心,有誰願意和自己同行呢?
其次是錢的問題:這樣一個基礎平台,相當於大數據系統「全家桶」,開發所需要的人員和資金至少是1億起步,幾百號頂級程式設計師。錢誰出?

總之就是一句話:上一個想去西天取經的,已經在路上被老虎吃了。。。

至於人,幸運女神眷顧,風劍很快就如願以償——由於在阿里巴巴的戰績實在太輝煌,團隊里一共六位骨幹,聽說他要創業,有五位技術大牛都決定追隨他「西去」。

至於錢,說實話,那時候風劍連什麼是VC(風險投資)都不知道。這時,幸運女神又眷顧了。

風劍剛剛提交辭職申請,還沒對外宣布時,著名風投 IDG 資本的大佬們找到他,本來只是向他詢問一些大數據的行業技術知識,沒想到風劍一個鯉魚打挺:你要聊這個我可就不睏了。

他一個小時嘴沒停,像含著一把機關槍,把他對於大數據未來的思考一股腦掃射過去,把對面打成了篩子。末了,對方從懵逼中回過神來,問:你怎麼不創業?風劍說:誰說我不創業?

就這樣,IDG 成了他們的天使投資人。

當時《瘋狂動物城》正在上映,風劍特別喜歡裡邊那個「樹懶先生」,蓋章賊慢,但是飆車很猛。這種老司機的沉穩形象正中風劍的下懷。

「積澱的時候很慢,爆發起來誰都追不上,正是創業應該有的樣子。所以我們就把公司起了個諧音的名字——數瀾科技。」風劍回憶。

數瀾科技的核心產品——數據應用的基礎設施——被起名叫做「數棲平台」。

分工很快決定,風劍任職 CEO,之前被風劍的「硬核」所折服的江敏做 CTO,高雁冰管市場,付登坡做數據架構,當年預測《我是歌手》的算法大牛趙東輝當數據科學家,另外幾位同學做項目實施。

這一年,風劍43歲。

幾位創始人合影,從左到右分別是:白松、付登坡、高雁冰、甘雲鋒、江敏、黃耐寒

(四)數據「廚師」

老司機們一頭扎進研發,一路無話。

趁這個空檔,我給你講講數棲到底是怎麼工作的。

風劍特別跟我強調:數據中台不是產品,而是一套機制。這是啥意思?還是拿燒菜舉例,想要做出米其林餐廳的美食,不是買來最好的菜、肉、鍋、爐灶這些「產品」就行的,而是要主廚設計出一整套做菜的流程,什麼食材用什麼方法處理多長時間,哪幾個工序怎麼銜接,有了這套機制,人人都是食神。

具體來說,這個機制大概分四步:

第一步:業務的數據化。

我們繼續用米其林餐廳舉例。負責採購食材的是一個人,負責面案的是一個人,負責切墩的又是一個人,負責幫廚的又是一個人,他們各自掌握一些信息,但是卻難以相互溝通。這就意味著主廚沒辦法把他們的數據捏到一起聯合計算。

此時,就需要一個像阿里巴巴 TCIF 一樣的系統,把各個工種的數據連通起來。

你不妨想像一個幼兒園,小盆友就是數據。他們本來散落在各個班級里,現在要讓他們統一站在操場上。

雖然連通數據的工作很枯燥,但是一旦完成,後面的一切都會變得有據可循。

第二步:數據的資產化

接下來是要讓數據「排排站」,就像課間操一樣,小朋友按大小個排好隊,用專業術語講,這叫做給數據「打標籤」。如此一來想找誰的時候,就可以直接根據標籤「按圖索驥」,不用大海撈針了。

第三步:資產的服務化

如果每次找小朋友,都需要老師人肉去喊,那效率可太低了。此時,必須有一套自動化的「機械臂」,想要哪些數據,機械臂就會迅速把他們抓在一起。只有這樣,大數據計算才會從一個「花瓶」變成真正高效率的自動化服務。

第四步:服務的業務化

大數據能力被打包成服務後,就可以提供很多「規定動作」了。就像餐廳的菜單,顧客只要簡單地在菜單上一指,後廚就自動啟動流程,美味佳肴就送到了桌前。這樣,一個米其林餐廳才華麗麗地出現。

當然,做完這四步之後,你的菜肴會深受喜愛,越來越多的吃貨會來你的餐廳消費,於是你擁有了更多用戶數據,接下來又可以回到第一步,把新客戶的業務數據化了。如此循環,一步步出任總經理,迎娶白富美,走上人生巔峰。

既然目標是做這個世界上數據應用的基礎設施,數瀾的老司機們就必然面對一場代碼的「長征」——雖然在2016年底代碼就可以跑通了,但是數棲真正成熟,已經到了2017年秋天。

全公司上上下下一百多號人,都開始八仙過海各顯其能,只為了一件事情:找客戶。

(五)九九八十一難

失去了阿里巴巴的光環,數瀾這群人看上去和創業大潮中的普通人無異。除了兩種人堅定地相信風劍:第一種,投資人,第二種,自己和團隊。

在平台研發的過程中,沒有產品可賣,他們就抽空給客戶做大數據相關的項目,「貼補家用」,積攢口碑。

那時候,無論是CTO 還是技術專家,出差都是家常便飯。情急之下,還得在自行車上工作。

江敏是個極其嚴謹的人,每次去飛機場都要提前兩小時到。沒想到,有一次腦子裡跑著給客戶的方案,竟然在錯誤的登機口坐了半天,飛機都走了半小時,他才反應過來不對勁。

風劍只要求一點:我們是大數據的布道者,雖然現在是做小項目,但一點都不能偷懶,無論項目是賺是賠,一定要盡全力做到最好,而且,不能客戶說什麼就幹什麼,要讓用戶知道最正確的大數據技術應該是怎樣的。

數瀾科技開出第一張發票,幾位創始人還拍照留念

各行各業都流傳一句話:數瀾這幫人拗得很,但他們不是為了坑你,是為了幫你。

就這樣,數瀾的口碑一點點建立起來,客戶也一點點變大。

終於,一個大型央企集團注意到了數瀾科技。出於客戶保密需要,我們就叫它Z集團吧。

回憶這個項目時,風劍先笑了。

2018年,Z集團經過測試,對數瀾的技術非常認可,可是領導層卻提出了一個直擊靈魂的問題:你的系統可是要布置在我最重要的地方,但數瀾畢竟是家創業公司,說不好聽的,萬一哪天你公司掛了,我找誰來後續維護系統呀。。。

Z集團的擔心有道理嗎?有一定的道理。這句話扎心嗎?真扎心啊。

他們提出的意見是:要不你把原始碼給我吧。

風劍一聽到這個要求,內心萬馬奔騰。辛辛苦苦開發了兩年的原始碼,集結了老司機們十多年的心血,怎麼可能給人?而且,如果客戶自己維護原始碼,後續不僅要投入很多人力和資本,還沒辦法跟隨數瀾的版本進行升級,這反而不利於他們把數據用起來。

可好不容易撩上了這麼大的客戶。。。大伙兒都看著風劍。

風劍沉默了五分鐘,說了兩個字:「不給。」

「好好跟客戶解釋,我們說的有道理,他們一定會同意的。如果不同意,說明他們還需要一些時間來理解我們的夢想,損失了這單生意也不可惜。」他補充。

經過一個多月的溝通,連對方的領導也變成數瀾的幫手,跟集團反覆斡旋,終於給數瀾科技開了綠燈,同意了「不給原始碼」的要求。

所有人長舒一口氣。

系統搞定後,Z集團迅速在這個基礎設施之上開發出了很多之前根本實現不了的業務,例如對每個用戶都做到「千人千面」的精準營銷。一票同類企業都分外眼紅:「原來把自己的數據用到極致,居然是這個效果。。。」他們紛紛找到數瀾科技,求來個一模一樣的。

數瀾科技在業內名聲鵲起,越來越多人開始理解風劍的「大數據哲學」,也願意成為他所想像的「大數據未來」中的一員。

這是數瀾的同學在客戶現場實施,你可能猜不到,照片拍攝時間是凌晨一點

越打怪升級,碰到的 BOSS 就越大,2019年春天,數瀾這群老司機迎來了一場大考,這次的主考官是:萬科集團。

很多不了解萬科的人以為它只是個「賣樓的」企業,但其實萬科集團有49家子公司,橫跨地產、養老、旅遊、投資等等11個業態。

萬科找到數瀾,交給他們一個重任——把49家子公司的數據整合在一起,建立一套統一的大數據基礎平台。

這麼大規模的數據系統,不正是風劍夢寐以求要做的事情嗎?為此,風劍把主力精銳盡數派出。

進入萬科的內部,這群老司機領略了什麼叫做真正的「複雜」。萬科是1984年成立的老牌企業,各個子公司里的系統,簡直就是大型的「IT 博物館」,從舊到新,應有盡有。

幸虧在過去三年,數棲已經升級到了4.0,大仗小仗打過無數,對各種系統都死磕除了相應的對接方案,只剩一些角度刁鑽的系統適配,需要現場研發。

數瀾的同事們一身冷汗,要是早幾年初生牛犢不怕虎,直接和萬科合作,沒準就死在這裡了。。。

不過,最關鍵的一件事風劍早有預料,那就是萬科子公司們使用的基礎算力系統來自於阿里、華為等等好多家。把它們打通的時候,就需要讓阿里雲和華為雲這些競品相互對接。這種情況下,如果風劍仍然代表阿里巴巴來做改造,就像在蘋果上跑起安卓的應用,那是不太可能成功的。

實際上,每一家大公司從安全角度考慮,IT 系統都不可能只選某一家的產品。大數據中台這件事兒,只有中立第三方公司才能做成。

風劍說。

這個項目從2019年3月一直做到秋天,到了臨近驗收的日子,萬科集團點名要風劍去參加驗收活動。

風劍心裡七上八下,這個項目進展的時候,經歷了好多困難,他是知道的。「雖然最後都搞定了,但是萬科的老總們恐怕還是會數落我一頓。」他嘆了口氣,既然是創始人,我不頂雷誰頂雷?就算是鴻門宴,也得赴約。

他知道自己的脾氣不好,很可能現場哪句話沒說對就懟起來,於是去之前做了充足的心理建設,想了對各種質疑的妥帖回答方式,在飛機上還自己叨咕了一遍。走進驗收會會場之前,他深吸幾口氣。。。

果然,一到驗收現場,領導們把他團團圍住。。。。。一頓猛夸。。。。

萬科各個子公司的項目負責人介紹了系統給他們帶來的好處,羅列了很多數據,其中有一個讓風劍印象最深刻:

萬科物業一直以來業主滿意度就很高,超過90%,但是這個滿意度卻在原地徘徊了很多年。用大數據中台進行分析以後,物業馬上找到了很多「隱藏問題」,僅僅用了三個月,就把業主滿意度突破性地拉升了2%。

老大哥的示範效應非常強大,萬科一役後,旭輝地產等等很多房地產企業也紛紛找到數瀾合作。

在數瀾,還保存著一張照片,這是數瀾奪得2016年阿里巴巴諸神之戰全球創客大賽中國區冠軍時,其他選手找風劍合影。

從空中俯瞰,就像一場大遷徙,越來越多的企業鼓起勇氣跨過那條湍急的河流,從所謂的「傳統企業」變成了「數據驅動」的新物種。

最讓風劍記憶深刻的一家企業,是時尚集團。沒錯,就是那個《時尚芭莎》《男人裝》的時尚傳媒集團。

時尚集團找到數瀾的時候,數瀾的同事問他:你們企業的 IT 系統用的是哪家?結果時尚集團回答萌翻了一屋子人:就有個 ERP 系統,沒其他 IT 系統了。

「那你們的數據存在哪裡?」

時尚集團的同事掏出包里的雜誌:「在這裡。」

沒錯,時尚集團的數據,就是過去三十年出的雜誌。

這樣的數據也能用??真男人絕說不。數瀾的老司機們幫助時尚集團通過掃描和文字識別的方法,把之前所有雜誌的內容全部掃描了一遍,在網絡空間重建了所有過往文章的內容和排版。

這下,歷史上任何文章、圖片,甚至是音頻、視頻,只要通過智能內容搜索,就可以全部出現在眼前。

而根據當年雜誌里廣告的位置數據,再結合當時廣告的效果數據,時尚集團擁有了一個大數據廣告系統,可以瞬間預測哪類廣告對受眾更貼合,也可以預估回報的多少。在這個系統之上,時尚集團建立了電商平台,新業務風生水起。

各行各業對大數據的理解程度不同,家裡的實際情況又不相同。所以在最初幾年,數瀾科技的同事都是撲到對方的集團里,一點點地和對方商量、研究,每做一個項目都像羅丹在雕刻一件藝術品,漫長而反覆。

這就像唐僧西去的路上,剛捉住了幾個妖,又擒住了幾個魔,九九八十一難,未免一言難盡。

要說苦,當然有很多,但其實大多都記不住了。
有時候,看著數瀾親手把這些傳統企業送到大數據的光芒之下,我就能知道背後整個國家的經濟效率會因為我們微不足道的努力而有一點點提升。你說,想到這些,還會覺得自己團隊的困難都是大事情嗎?

風劍笑著說。

(六)無止盡的長征:數據智能

老司機們埋頭苦行,一抬眼已經將近五個春秋。

「你的布道進度條如何了呢?」我問。

「現在幾乎所有的公司都認同一個基本事實:數據中台是企業生存發展的重要基礎設施。而且在不少行業里,我們已經有了標準的操作方法。」他說。

科技史和自然史有一個共通之處:某種基礎技術一旦普及,就會在其上進化出新的技術。正如哺乳動物占領地球後,人類才有機會誕生。

最近五年,因為有了好用的數據中台,我們積累下了更多數據,在這之上,人類猝不及防地解鎖了一項技術:數據智能。

簡單理解,數據智能=大數據分析+人工智慧。

一旦用上人工智慧,大數據就像插上了翅膀,分分鐘要上天。不妨給你科普兩個例子:

1、關係網絡分析。

銀保監會會對各個銀行帳戶的主體進行智能分析,這些數據包括但不限於:帳戶之間的轉帳,各個帳戶向銀行借錢的情況,商戶主體之間的消費結算,企業主體之間的擔保行為等等。

看上去沒什麼關係的數據,經過綜合分析,就會描繪出一幅圖景。這是真的「圖景」,在這幅圖裡,各個主體之間的關係清晰可辨,於是,誰在洗錢,誰在騙貸,誰在連環擔保,誰在薅社會主義羊毛,一眼就能看出來。

據此,相關部門就可以向金融機構預警高危帳戶。

2、工業智能。

一個玩具工廠有很多條生產線,所有生產線的狀態數據都會進入數據中台,例如運轉參數、噪音分貝、各個零件的影像等等。

應用數據智能,就可以輕而易舉地預判哪條生產線即將出現故障,故障可能出現在哪個零件上。可以不用等到出問題再停機維修,每年節省幾百萬的成本都是很輕鬆的。

上面這兩個例子,都是隨著 IoT 和人工智慧技術成熟,在最近幾年大數據被新開發出來的用途。

這還遠不是大數據時代的頂峰,5G時代到來後,數據量還會在現在的基礎上暴增——相應的,數據智能所需要的存儲量和計算量都會呈現幾何級數的增長。

這對於金字塔的腰部——「數據中台」——來說將是個巨大的壓力。

而數瀾站在浪潮最前面,很早就意識到了這個問題。他們殫精竭慮,不斷給自己的「基礎設施」斷增加新的技能。

1、例如,「實時計算」會成為大數據中台的一個標配。

傳統的大數據計算,每天晚上對新增數據進行一下計算就能滿足需求。但是在越來越多的場景里,一天一算已經不夠了。你還記得預測《我是歌手》冠軍的例子嗎?在那個情況下,就是五分鐘一次計算。

而在現在的很多情況下,用戶做了某個操作,下一秒系統就要更新他的推薦內容。這就需要一個強大的「實時計算」引擎。

這就像神舟飛船合體天宮一號一樣,需要實時計算當前的位置,才能完成精密的對接。

從2018年開始,老司機們就做了各種開發,讓數棲平台可以支持各種實時計算引擎。

2、例如,「大規模數倉」也迫在眉睫。

傳統的數據倉庫就像一個大樓,所有數據在其中來回調度。但是,由於工程能力的限制,大樓沒辦法做到無限高。

於是很多大規模數倉的技術就應運而生。江敏告訴我,系統也在實時更新,保持對所有最先進的數據倉庫的完美對接。這樣的情況下,不論未來大數據的浪頭有多麼猛,大數據中台基礎設施仍然可以巋然不動。

(七)布道者

如果給我全世界的數據,我能給你預測未來500年的歷史。

這是風劍經常「吹牛」的一句話。

聽到這樣科幻的話,我猜有人可能會擔憂:世界上存在風劍這樣的大數據的布道者,讓大數據的時代更快來臨,這對普通人來說,是更好了,還是更壞了?

我也一直在思考這個問題。末了,我忍不住直接問了他。

他給我講了一個在阿里巴巴時代的往事。

2014年,阿里巴巴通過大數據分析,商品廣告投放非常精準,以至於一個點擊已經能賣到30多塊了。這還僅僅是點擊一次的價格。如果十個點擊的人有一個買了商家的東西,那麼商家為這一個成交,就需要付給淘寶300塊。可是,淘寶上有什麼東西的利潤能夠超過300塊呢?阿里巴巴的高層發現,這件事兒已經非常不正常了。

風劍回憶。

前車之鑑就是百度,如果一味追求提高廣告的收入,那麼到最後,給得起廣告費的肯定是非奸即盜,不僅讓用戶寒心,還不符合公序良俗,對阿里巴巴的長遠發展來說也是自毀前程。

於是,當時阿里巴巴定了一個奇葩的目標,降低單個廣告點擊的價格。

「我們會在給用戶的推薦里,加入那些用心經營的店鋪,讓那些剛開始做,但想認真做長遠的店鋪也能得到曝光。」風劍說。

「可是,你怎麼知道誰的店鋪經營用心呢?」我問。

「當然還是用數據。一個店鋪裝修的次數,修改的次數,調整各種參數的次數,大量數據都會在那裡,你要對數據有信心,因為數據能看清這個世界的真相,所以數據才能預測未來。」風劍說。

數據的問題,同樣可以用數據來修補。只要人心正道,數據不會傷人。

2020年,雖然數瀾科技的產品進入了地產、金融、安全、工業、出版傳媒各個行業,但是風劍卻非常警惕,他怕數瀾科技變成傾向於某一個行業的解決方案廠商。因為他的初衷是:要做各行各業的基礎設施。

三年間,很多友商都模仿數瀾科技推出了「數據中台」。其中相當一部分從研發到上線只用了三個月。這一度讓風劍有點焦慮。

但是,把兩個產品一做對比測試,我馬上就不焦慮了。因為三個月做出來的東西過於粗糙,缺少對數據理念的認知,完全沒辦法承擔「大數據基礎設施」的重擔。

風劍說。

自此以後,風劍向團隊宣布,凡是產品研發幾個月就推出的友商,根本不用浪費時間去研究。反而是像數瀾這樣,做了半天還不捨得把產品拿出來,想要再仔細打磨打磨的友商,才是值得重視和尊敬的對手。

「可能是我比較蠢比較笨。反正我覺得,短則十年,多則二三十年,才能真正打磨出一款數字世界的基礎設施。」他說。

數瀾從最初的的十來個人,到現在已經有了三百多人。而風劍一如既往,面對朋友總是一副笑眯眯的樣子,好像體內永遠奔涌著雞血。

數棲大會是一年一度數瀾科技的「布道大會」

但江敏告訴我,風劍也會把自己關在屋子裡很久,只是外人很難看到。

如果真的有什麼遺憾,可能公司越大,我越覺得孤單。因為我要承擔一切決策的最終後果,所以很難像之前一樣和好哥們嘻嘻哈哈。
但是,我們這群人錯過了90年代的信息化浪潮,錯過了00年代的網際網路浪潮,錯過了10年的移動網際網路,我告訴自己不能再錯過大數據浪潮,因為這是一個屬於未來一百年的浪潮。我別無選擇,我註定要經歷這些。

風劍說這番話的時候,仍然是笑著。

2020年4月9日,國務院發布了《中共中央國務院關於構建更加完善的要素市場化配置的體制機制的意見》,在這個意見中,有一條讓風劍覺得無比鼓舞:「數據」成為了五大生產要素之一,第一次比肩土地、勞動力、資金和技術,被認定為我們這個民族生存在世界上的鋼鐵武器。

那個1995年第一次看到大數據兩眼放光的小伙子,那個大數據的孤獨布道者,二十多年站在數據的土地上,如今看到了霞光萬道。

於是我確信,布道者的心裡也許沒有自己的生死,他們關心的東西遠遠超越生命的長度。

投機者或許永遠無法與潮共舞,而只有在世界中心默默等待的人,才配得上一場華麗的未來。

再自我介紹一下吧。我叫史中,是一個傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmini,還可以關注我的公眾號淺黑科技:qianheikeji