淘寶的「秘密戰爭」

2020-08-07     淺黑科技

原標題:淘寶的「秘密戰爭」

淘寶的「秘密戰爭」

2013年,馬雲身著一件明白色襯衣,在座無虛席的黃龍體育場正中心向黑壓壓的人群吐露真心:

公司做到這個規模,小小的自尊,我很驕傲。 但是對社會的責任,我們這個公司才剛剛開始。

那個晚上,他宣布自己將卸任阿里巴巴 CEO,把「為社會負起責任」的征程繼續交給台下數以萬計的阿里巴巴人。

說罷,他單膝跪地:「我拜託大家!」

那一天,淘寶整整十歲。

在馬雲所拜託的人中,有無數手握代碼權杖的 技術人。他們中有人跟隨馬雲創業,在非典的陰影下敲下了淘寶網最初的幾行代碼;有人在張勇天貓改革之時慕名加入,穿行了困頓的低谷「十月圍城」;有人即將在這個良夜離開溫暖的學術圈,跨入阿里巴巴的大門。

未來尚未向他們展現溫柔,亦未向他們張開獠牙。

刻不容緩,淘寶的很多團隊都摸著石頭上路了。有趣的是,站在今天回望,他們雖然研究的姿勢不同,卻殊途同歸地擁抱了同一個技術: 人工智慧。

如今,普通人都理所當然地沐浴人工智慧的恩澤。然而在技術人的具體記憶里,這卻是一條艱辛的征程,如同少年騎士打怪升級, 這條路上有兩個「怪獸」足以致命:

第一、人類智能進化需要億萬年,人工智慧的進化也很緩慢。這意味著,淘寶的很多創新功能會給人一種「傻傻的」感覺,引來用戶的花式吐槽。而技術人卻不能停下腳步,他們必須說服自己:今天被「愛答不理」的點滴星火一定會在未來成為「高攀不起」的耀眼光芒。

第二、技術是一柄曜石長劍,可以捍衛真理,也可以欺凌弱小。技術人需要在無數個十字路口仔細分辨技術的「善」與「惡」,決定是走還是停。而他們唯一的憑據,只有自己的內心。

最近,中哥遇到了幾位淘寶背後的神秘技術大牛,在過去的七八年間,他們深居簡出,卻無時無刻不在和這兩個怪獸戰鬥。

(一)翻譯:難倒戰鬥民族的小事兒

2012年,中國向全世界出口了90億雙鞋,5000萬輛自行車,700萬噸塑料製品,價值100億美元的玩具。

Made in China 如火山噴涌。

在這創紀錄的出口交易額中,有越來越多的訂單是老外通過阿里巴巴國際站下單的,這很讓阿里人驕傲。但隨之而來的卻是外國買家的吐槽——在阿里巴巴國際站上商品的描述都是英文,可是在歐洲、南美洲、中東有大量的老外不說英文,也沒過英語四六級,商品介紹看得是雲里霧裡。

你想像一個場景:天不怕地不怕的戰鬥民族經銷商,皺著眉頭懟著螢幕,用蹩腳的翻譯軟體查字典,想買又怕買錯,帶著慫慫的表情在危險的邊緣瘋狂試探,是一幅怎樣的畫面。。。

為了給 Made in China 添磚加瓦,阿里巴巴的同學決心把商品描述給直接翻譯成高質量的俄語、西班牙語、葡萄牙語、義大利語、阿拉伯語、土耳其語等等17種語言。

可是數以億計的商品,要是雇幾個人類翻譯,恐怕到世界末日都干不完。這種情況下,他們別無選擇,只能想辦法做出一套 「人工智慧機器翻譯系統」

想法很豐滿,現實很骨感。在2012年的中國,會搞「機器翻譯」這種法術的大牛鳳毛麟角。

阿里巴巴的同學們只好訪遍名山大川。終於,他們找到了中科院門下。彼時中科院正好有一個小分隊做研究性質的機器翻譯。而駱衛華,正是當時團隊的一員。

駱衛華

別被駱衛華的外表欺騙,他笑容和氣,辦事卻總是死磕。在清華第一次接觸「機器翻譯」,他就被這件事兒給迷住了,反覆叨叨著:「有意思,真的有意思!」

有意思歸有意思,從1995年上大學到2012年這十幾年之間,因為機器翻譯還在早期,沒啥人用,所以學機器翻譯的人根本沒什麼用武之地。這個專業的學生要麼畢業就轉行去做程式設計師,要麼就像駱衛華那樣進入研究機構「躲在小樓成一統」。

說白了,在那種情況下還能堅持做機器翻譯研究的,基本上非瘋即癲,駱衛華的老師劉群比他還誇張,微博名字都改成了「MT-to-Death」(機器翻譯至死)。。。

春天還是讓這幫人給等到了。這不,阿里巴巴的同學已經在門口三顧茅廬了。

這裡簡單科普一下「機器翻譯」的原理:

機器翻譯的基本操作就是給機器準備大量的「原文-譯文對照資料」,然後經過精巧的人工智慧算法,讓機器能夠從這些資料中「總結」出翻譯的規律,從而學會翻譯。

當時,駱衛華他們拚命收集來了網絡上17種語言為數不多的對照資料,還拜託各個語種的專家為每種語言寫了上千句精細的對照翻譯,很快就訓練出了一個簡易版的翻譯機器人。

畢竟資料有限,我們也不懂這些小語種,幾乎可以肯定,這個機器人翻譯出來的東西是很粗糙的。

駱衛華回憶。

然而,17個語言的頁面上線之後,把阿里巴巴和駱衛華都嚇了一跳。來自非英語國家的訪問量瞬間就增長了40%,成交量當然也隨之攀升。

只是牛刀小試,就帶來這麼威猛的效果。這徹底燃起了阿里巴巴同學們的熱情,決定了,大刀闊斧地搞人工智慧翻譯!於是,他們要做的第一件事就是——邀請駱衛華加盟阿里巴巴。

寶貝描述翻譯成俄語大概就是這種感覺,你感受一下。

(二)什麼翻譯是「好」翻譯

2014年,駱衛華成為了阿里巴巴的一員,專門負責機器翻譯團隊的建設。

剛一加入,他的三觀就受到了衝擊:

之前我滿腦子想的都是怎麼讓翻譯更接近原文的意思。到了阿里巴巴內部之後我才發現,翻譯原來並不是越準確越好。。。

駱衛華說。

你可能都看懵了,翻譯難道不是越準確越好???

沒錯,翻譯這件事兒其實是技術和藝術的混合體,講究個「信達雅」。有時候地道的翻譯卻並不「準確」,例如《 Gone With The Wind》翻譯成中文叫《亂世佳人》,或者只有一個字《飄》,這兩種翻譯都不「準確」,卻讓人更能體會到原句的意境。

在淘寶上,同樣有這樣的例子。

你可能看到過有商家給自己的寶貝標題起名叫這種: 「iPhone11鋼化膜蘋果11pro防窺x防偷窺膜Xsmax全屏覆蓋11防窺屏Xr防塵手機7p防透屏偷8plus窺p膜看瞄貼膜」

這種做法其實是為了讓用戶無論搜索什麼關鍵詞都能找到它。可是如果把這個標題原封不動地翻譯成外語,老外看著這一長串心裡就會一萬草泥馬奔騰而過:「這到底是在賣啥吶思密達??」

所以,對於阿里巴巴上的商品來說,並不是翻譯得越「準確」越好,而是越「地道」越好。

於是,駱衛華和同學們開始研究一套有中國特色的翻譯系統:改寫翻譯。簡單來說就是: 讓機器理解這句話的核心是想表達什麼,然後給你一個重新組織語言的機會,用人話再說一次。

例如剛才那個超長的標題:「iPhone11鋼化膜蘋果11pro防窺x防偷窺膜Xsmax全屏覆蓋11防窺屏Xr防塵手機7p防透屏偷8plus窺p膜看瞄貼膜」,被精簡之後大概就會變成: 「iPhone防窺鋼化膜」

雖然機器翻譯肯定達不到《亂世佳人》這種信達雅,但畢竟直奔主題,更適應老外的文化習慣,他們紛紛豎起大拇哥。

折騰了半天才搞定標題,大伙兒擦擦汗,接下來要開始進軍商品的內文描述了。

內文翻譯涇渭分明地分成兩類:有些詞句可以創造性的「改寫」;但是有些詞句卻必須100%嚴格準確翻譯。這就是商品的「關鍵屬性」,包括 品牌、型號、材質、尺寸、顏色等等。

舉個栗子,「小米」這個詞。

如果機器翻譯要是把「小米」(手機)給翻譯成了「millet」(吃的那個小米),人家把小米手機當成粗糧給進口了,這還了得。。。

我舉小米這個例子,大部分人都能get到梗,但是在不同的專業領域,還有無數像「小米」這樣需要專業背景知識才能翻譯對的詞語。這時候,僅僅靠翻譯團隊自己的人生閱歷就不夠了,他們需要各行各業的專家加持。

很幸運,在阿里巴巴內部就有負責各個行業的運營同學,駱衛華團隊趕快請他們標註自己的行業的專有名詞都有哪些類型,然後機器翻譯團隊再「按圖索驥」,對照專業詞典里一個一個地核實修改,就像是在通用翻譯系統上一個個「打補丁」。

這個過程非常累,而且不能出錯。但每多一個補丁,翻譯系統的表現就好一點。正應了技術宅那句古訓:「人工智慧,有多少人工,就有多少智能。」

搞定了這些,前言不搭後語、驢唇不對馬嘴、指鹿為馬的笑話才慢慢絕跡了。

然而這僅僅是萬里長征的第一步。

有一天開會,國際業務的同學提出一個困惑:「你們說,泰國人需不需要買拖鞋?」

「當然需要啦。。。」大家回答。

「可為啥泰國人就是不在阿里巴巴上搜索拖鞋呢?」對方問。

駱衛華心裡「咯噔」一下。

(三)買拖鞋引發的「血案」

這裡要先科普一下阿里巴巴的外語搜索系統是如何運作的。

泰國人搜索輸入的關鍵詞當然是泰語。但是阿里巴巴搜尋引擎只認識英語,所以搜索過程被分為三步:

1、泰國人輸入泰語關鍵詞;

2、一個翻譯系統把關鍵詞從泰語翻譯成英語;

3、阿里巴巴用「英語關鍵詞」去匹配資料庫中的商品。

駱衛華說。

大傢伙兒一拍大腿,就是因為對文化的理解不夠深入,造成這麼一個翻譯上的失誤,結果無數中國商家損失了生意,無數泰國剁手黨沒有找到心儀的拖鞋,真是罪過。。。

於是他們意識到,很多翻譯僅僅專業還遠遠不夠的,還要考慮當地的文化習慣、口語習慣。

「泰國人買拖鞋」的問題肯定不是孤例,團隊馬上舉一反三,去後台查驗每一種商品的搜索量。凡是他們覺得不對勁的商品,就找到熟悉這個文化的專家去核實,果然用這種方法發現了很多類似問題。

例如,西班牙語的一個詞,在南美洲的阿根廷代表「拖鞋」,在西班牙就是「舞鞋」,在美國說西班牙語的地區指的是「運動鞋」。我們就得根據搜索者的地理位置來判斷給他哪種鞋。。。

駱衛華苦笑。

如此案例,不勝枚舉。

2015年,隨著翻譯的完善,阿里巴巴的國際業務開始爆發增長。而「翻譯」這件小事兒,也把人工智慧的強大表現得淋漓盡致。到2018年,阿里憑藉每天7.5億次的調用量,創造了全球最大規模的電商機器翻譯應用記錄。

事實上,就在駱衛華加入阿里巴巴的2014年,也是阿里巴巴人工智慧的爆發年。他們大刀闊斧地成立了研究機構 iDST,而後自然語言處理大神司羅、來自微軟的計算引擎大神周靖人,密西根州立大學的機器學習大牛金榕紛紛加盟,這些 iDST 大神們支撐起了阿里巴巴人工智慧的骨架。而 iDST 也幾經輾轉,成為了如今人們耳熟能詳的 達摩院 ,此乃後話。

而我們不妨回到我們的故事,彼時在淘寶的主戰場——中國本土,人工智慧也已露出鋒芒。

(四)超級導購

2015年,淘寶團隊發現了一個「小變化」:來自手機端的購物流量,第一次完全超越 PC 端。

小變化,往往是大歷史的迴響。

就在同一年,中國大地上智慧型手機狂銷4.38億部,相當於這個國度總人口的三分之一都在這一年購買了智能機;而在英國倫敦,阿法狗的工程師們正在緊鑼密鼓地秘密籌備,來年,這部人工智慧機器人會以羞辱的姿勢戰勝人類最強棋手李世石和柯潔。

「移動網際網路」和「人工智慧」,就這樣以堅固的姿勢扭在一起,從手機螢幕噴薄而出。而普通人感受到的第一個變化,恐怕就是在手機淘寶上發現了一個有趣的「小功能」。

以往在淘寶的首頁往下拉,很快就能拉到底部。而現在不同了,往下拉,會出現一個名叫「猜你喜歡」的神秘板塊,一個個推薦商品如同待選的嬪妃,像瀑布一樣流淌在螢幕下方,越劃拉越有,越有越想劃拉。

站在今天回望,這就是淘寶「認知智能」的第一波雛形。

這就是「猜你喜歡」

三桐,正是手淘「推薦算法」的負責人。作為阿里巴巴最早一批招攬的搜索推薦技術人才,他毫無疑問是淘寶移動化戰役背後的功臣之一。

剛才說的那個「猜你喜歡」,背後正是三桐和同事們一起構建的推薦算法體系。

三桐

說回我們的故事。淘寶認知智能的任務就是一句話:儘自己的最大的努力「猜對」用戶想要找什麼商品。

你去購物中心的時候,時常會碰到一些比較資深的導購員,通過和你對話,甚至察言觀色,就能知道你想買的是什麼,從而幫你找到喜歡的東西,甚至還會和你探討著裝品味,討論服飾穿搭,讓你這次購物體驗很開心。其實我們的夢想,就是讓淘寶成為「資深導購員」。

三桐對我說。

有一說一,即便是一群天才組成的隊伍,要做出一個「人工智慧資深導購員」仍然非常艱辛。

一方面,要從很少的信息里判斷用戶的意圖,還要確保信息不泄露,本身就對算法有很高的要求;

另一方面,導購要非常謹慎地不打擾客戶,稍微多說一句話就會讓顧客覺得不自在。

總結一句話:咱也不知道,咱還不敢問。

講真,就這個尺度,人類都經常拿捏不好。在理髮店被理髮師「唐僧式推銷」過的人一定深有感觸——你能從理髮師的推銷里聽出滿滿的「要掏你錢包」的惡意,這恐怕是人生中最不好的體驗之一了。

既然這麼難,動不動就招罵,淘寶又為什麼又非要挑戰呢?

其實就在淘寶內部,曾有過激烈的討論:我們做推薦,到底是為了什麼?

討論的結果是:不做推薦,當然不會打擾用戶,但卻會讓淘寶變成死氣沉沉的啞巴商場。而做「推薦」,絕不是為了多賣東西,而是可以讓用戶有「發現」的感覺,這樣才能體會到購物的 快樂

於是就有了「猜你喜歡」。

這裡科普一下。「猜你喜歡」其實是一個 「隱式詢問系統」,它的工作原理大概是這樣:

1、淘寶可以猜一下你的大致年齡和喜好,然後粗略地算出你可能會喜歡什麼產品,把這些新產品顯示在主頁下面。例如給你推薦了一些裙子、化妝品還有背包。

2、你可能無意間刷到了一條裙子,感覺不錯,於是點進去查看;後來又發現了一個口紅,於是又點進去看。淘寶就通過這種方式,並沒有打擾你,但卻相當於問了你「喜不喜歡這條裙子?」「喜不喜歡這個口紅?」,並且得到了你的「回答」。

3、把用戶的這些「回答」塞進複雜的人工智慧算法,人工智慧會試著預判你的喜好,可以繼續推薦你可能喜歡的其他東西。

你看,察言觀色,直指人心,這就是「隱式詢問」的魅力。

事實上,就在「猜你喜歡」上線之後,有很多人超喜歡這個功能。

當時很多淘寶的用戶反映,每天不刷完淘寶給推薦的商品,都不想睡覺。。。

三桐笑著告訴我。

但是,這並不能讓所有用戶滿意。這裡有個經典的案例:有的用戶在點擊了幾次「電腦」之後,淘寶會總向他推薦電腦,也不管他是不是已經買過電腦了,或者已經不想買電腦了。

人的思維很活絡,而機器卻很呆板,完全跟不上人的變化。這種「無腦」推薦,開始讓一些用戶覺得無聊,還讓他們產生了錯覺:淘寶是不是想掙錢想瘋了,我不買就不罷休??

面對這種吐槽,技術團隊覺得好冤枉:明明是技術不夠厲害,卻被懷疑動機。他們壓力山大,趕緊想辦法改善推薦的算法和策略。

(五)「閃念」捕捉者

「猜你喜歡」的傻,根本原因還是對於消費者「意圖」的理解不準確。

上個月我搜過汽車,上周我搜過鍵盤,昨天我搜了水杯。這次我又來淘寶,你說,我想要什麼?汽車、鍵盤、水杯一起來嗎?大機率不是。

此時此刻我的興趣點很可能集中在 某一個特定的主題上,這個主題有可能是之前搜索過的汽車鍵盤水杯,有可能是今天臨時起意剛剛想到的。

猜對我現在的想法,難度不亞於「讀心術」。

2017年 三桐所在的團隊就開始著手用人類最高級的算法提升推薦的準確性,並且定了一個逆天的目標:認知智能。

剛才幾次提到了「認知智能」,聽上去很兇悍。這裡解釋一下:

「認知智能」是「感知智能」的進階形態。

認知智能,就是讓人工智慧擁有類似人類的「理解」「推理」「規劃」能力。一個具有完整認知智能的機器人,基本就達到了科幻電影的水準。

我們說回淘寶推薦系統的改造現場。

三桐告訴我,人的意圖實際上可以粗略分為三類:

第一類,是標籤,它是靜態的。

例如你是一個「男人」,你基本可能大概就永遠是個男人,那麼你大機率會一直喜歡男裝(如果你不是女裝大佬的話)。如果你「有小孩」,那麼你基本就會一直有小孩,你會在很長的一段時間喜歡購買兒童用品。

第二類,是偏好,它是偏動態的。

假如你是個米 Boy,那麼你大機率會一直喜歡小米。如果你是花粉,那麼你大機率會一直喜歡華為。這就是品牌偏好,會在一段時間內保持穩定。但是人們會不會一生只對一個品牌忠誠呢?顯然大多數人不會。今天還夸 Android 好,明天就抱著蘋果喊真香的大有人在。

第三類,才是真正的意圖,它是高度動態的。

比如你偶爾在路上看到一個人的耳機很漂亮,你掏出淘寶想要找,找到之後馬上下單。到了單位聽同事介紹了一款泡麵不錯,你打算下單在家裡屯一箱,看了看覺得吃這麼多方便麵沒營養,於是放棄了。這種閃念,是來無影去無蹤的。

對這三類意圖就分別像考卷上的「選擇題」、「填空題」、「大題」,只有都做對了,用戶才會覺得人工智慧懂自己。

可對於人工智慧來說,這三種題的難度和計算量可是不同的。感受人類的標籤,是 Easy 模式,一個月算一次就夠了;感受人的偏好,是 Hard 模式,可能要一周算一次;感受人的意圖,就是 Hell 模式了,需要每時每刻每秒都永不停歇地計算。

所以,要做對這張考卷,主要考驗兩個技術:「算法」和「算力」。

所謂算法,主要就是解題能力:無數的數據湧來,到底怎麼才能把這些龐雜的數據變成一個「意圖」。如果算法不精,用戶本來想要黃瓜,你判斷用戶想要茄子,答案都錯了,算得再快也木意義。

所謂算力,主要就是答題速度:如何在最短的時間內,把這個算法跑完。用戶搜索了一件衣服,可能一秒鐘以後就希望看到你給她的推薦,可如果淘寶算了一小時才算好,那用戶早就連淘寶都退出了。。。

這其中,算力的問題相對好解決,解決的方案就叫做「阿里雲」。阿里雲的本質就是一大坨不知疲倦的計算機,它產生的計算力可以為阿里巴巴自己所用,也可以對外提供服務。實際上,阿里巴巴當年那麼努力地做出阿里雲,首先是要滿足自己計算的需要。(參考 《阿里雲的這群瘋子》 )

然而,算法的提升,卻是一個非常緩慢的過程。為此,認知智能團隊招攬了很多國際上頂尖的算法大牛。他們做了很多嘗試。

舉個例子:

如果你看到某個商品出現在螢幕里,可能就會快速划過,這時,你的快速划動的動作就應該被算法認為是你對這個商品不感興趣的因素。

某些商品你雖然停留的時間長,但卻僅僅是停留,沒有查看的動作,也不意味著你對這個商品感興趣。

算法越好,可以考慮的情況就越精細,得出的結論就越貼近真實世界。

最近幾年,認知智能團隊在頂級會議上發表了很多論文,都是在踩坑的過程中得到的乾貨結論。而人們也會發現,淘寶的推薦雖然仍然在很多方面有提高的空間,卻在緩慢而堅定地進步。(參考 《阿里巴巴,終於有了預測未來的能力》 )

「認知智能」就像一個紅娘,不僅要懂姑娘,還要懂小伙兒。這個姑娘代表「消費者」,小伙兒就代表「商品」。

剛才說的都是對消費者的理解,現在說說對商品的理解。

對商品的理解,難度主要集中在商品的圖片上。理解圖片包括兩方面:

第一,圖片裡面有啥;

第二,圖片美不美。

一個商品具有「事實分類」和「情感分類」兩個屬性。

所以,這群技術宅需要專門開發一套算法,計算出什麼類型的人喜歡什麼類型的圖片。如果是喜歡簡約的商務人士,就給他推圖片風格簡約的皮包;如果是波西米亞風的少女,那就給他推看一眼能暈車的花紋裙子。

如今,你打開淘寶,在首頁下拉、付款成功頁面、還有商品詳情頁里,都有推薦商品的板塊,它們都是最初那個「猜你喜歡」的衍生版。

這些年,淘寶推薦功能使用的人越來越多,但是吐槽也隨之而來。

最大的問題就在於,人們總能感覺出來淘寶在根據自己的行為做推薦。推薦就是這樣,一旦被人察覺出來你在推薦,你的推薦再好都不香了。。。

欲戴王冠,必承其重。技術帶來的問題,要用技術解決。

於是,從2019年開始, 三桐和團隊開始攻堅「認知智能」的進階版,那就是想辦法讓推薦來到人身邊的時候,感覺輕柔、絲滑、無感,卻又貼心。

三桐和團隊

在雙11的合影

(六)打雷要下雨,天冷穿棉襖

講真,大多數人沒有意識到,了解別人不一定非要獲得這個人的每一個細節信息,僅僅依靠常識就能成為一個相當善解人意的人。

什麼是常識呢?

舉個例子:1、人在熱的時候需要冷的東西降溫;2、冷的東西包括冷飲;3、冰淇淋屬於冷飲;4、夏天的屬性是熱。根據以上四點推導: 人在夏天更喜歡購買冰淇淋

這就是一個常識。

所以,不管你是誰,在炎炎夏日,有人給你端來一杯冷飲,大機率會讓你開心。同理,夏天的時候在淘寶上給你推薦冷飲,也是一個不錯的選擇。而且,結合常識做出的推薦,人們接受起來也會更容易。

這個世界上的常識無計其數,而把無數常識聯合起來,變成一套能讓機器理解的東西,就叫做「認知圖譜」。

認知智能團隊想要死磕的,就是 「認知圖譜」

例如,手機殼是和手機相關的配件。所以當你買了手機之後,給你推薦手機殼,就不僅不會引起你的反感,反而讓你覺得很貼心;孜然、辣椒麵、羊肉是和燒烤相關的商品,那麼當你對燒烤架感興趣的時候,給你推薦這些食材,就變得很智慧了。

這就是一個認知圖譜的示例。

當然,知識圖譜所包含的內容,還遠不止「下雨要打傘」、「天冷穿棉襖」這些小兒科的常識。它還能知道「流行動向」。

例如,最近 Supreme 熱銷,而你經常購買其他時尚潮牌,系統同樣可以給你推薦它;如果你經常購買 JK,那淘寶可能就會給你推薦 Conomi。

有了認知圖譜,淘寶開始漸漸擺脫「你搜過什麼就給你推什麼」的「幼稚園」階段,進入了更多地給你推薦適合商品的高級階段。

從學術角度看,最近兩年在知識圖譜領域有一個非常有趣的測試集,叫做「火鍋問答」(HotpotQA),是由三名在美國留學的中國學生聚餐吃火鍋的時候想出的創意。

火鍋問答里收錄了各種需要知識圖譜推理才能得出正確答案的問題,而全世界的知識圖譜系統都會以挑戰火鍋問答的成績作為實力的證明。

阿里認知圖譜團隊的算法,最近幾年都穩穩排在火鍋問答成績榜的世界第一,實力確實不一般。

三桐告訴我,從後台數據看,2020年使用淘寶推薦的用戶正在爆炸式地增加,但是仍然有很多人並沒有使用推薦的習慣。不過他也不著急,他覺得只要技術進步,一定有越來越多的用戶可以發現並且信任這個「導購」。

三桐團隊的推薦系統是一個「隱形導購」,然而在淘寶上,還有另一個「實體導購」,那就是人人都很熟悉的,在旺旺上一口一個「親~」的客服小姐姐。

你可能會問,客服小姐姐和人工智慧有啥關係?

關係槓槓的。其實就在此刻,你在淘寶上諮詢商品,有很多回答都是人工智慧做出的。

(七)「機器人小姐姐」

人工智慧客服和人類客服哪個更好?

大多數人的答案毋庸置疑:肯定是人類客服好!誰願意和機器人對話呀??

這話沒錯,但是在2014年,淘寶並不是要在「人類」和「人工智慧」之間二選一,而是要在「沒人」和「人工智慧」之間二選一。

空無,是如今淘寶智能客服團隊的負責人。他可是歷史的親歷者。

空無,被尊為「阿里巴巴的韓庚」

2014年的時候,淘寶客服的壓力山大。用戶打進來的熱線電話根本接不起來,有的買賣糾紛投訴,一排就排到三個月以後處理。短時間招不來成千上萬的客服人員,即使能招來,也養不起。。。

空無回憶。

那個時候,空無是CCO事業部的技術負責人。CCO,就是當時淘寶為了提高用戶滿意度而設立的部門,全稱叫做「阿里巴巴客戶體驗事業部」。

客服連電話都接不起來,還談啥客戶體驗嘞。。。

空無臨危受命,準備搞一套人工智慧的客服機器人。輔助淘寶的人類客服對付海潮一樣湧來的用戶諮詢。

這裡有兩個行業小知識,需要科普一下。

1、當時的客服形態是:在對話介面先給你展示一些常見問題,你點選問題,就彈出解答。實在解答不了,你會在角落裡發現「人工服務」按鈕。淘寶也是這麼做的。

2、無論在哪個行業,大部分的用戶諮詢其實都是比較「低階」的。例如在淘寶上,用戶詢問客服最多的就是:「怎麼退貨?」「怎麼申請售後?」這類基本操作。

好,問題來了。

很多用戶即使是詢問簡單問題也會選擇人工客服,而人類客服回答一個簡單問題,也要耗費相當的精力和時間。這樣一來,真正複雜高階的問題就被擠到後面,忙不過來了。

這就好像考試的時候雖然選擇題很簡單,但是數量太多了,導致沒有時間做大題。。。。

所以,空無想做的客服機器人理念是醬的:

用戶把問題用「人話」的形式表達出來,人工智慧理解這句話之後,就去知識庫里搜索,如果它能回答就直接回答,如果不能回答再讓人工服務接過去不遲。

你還記得不,「有多少人工就有多少智能」。要做這件事,首先得拉來很多懂人工智慧算法的大牛。

空無那些年的小心思在這一刻體現得淋漓盡致:

其實我加入 CCO 以後,就開始在內部馬不停蹄地籠絡算法大牛。那時候做算法的人很沒地位的,各個團隊都不需要他們,很鬱悶。別人還看不到算法的重要性,我正好撿漏!到了要做客服機器人的時候,我已經有三個算法團隊了。

空無笑著說。

2015年,第一版客服機器人誕生了,這就是現在很多人都知道的「阿里小蜜」。

可是就在阿里小蜜準備上線服役的時候,一場「真理標準大討論」猝不及防地在淘寶內部爆發了。

很多同事組成了「反方」,他們的觀點是:人工智慧客服還很傻,一旦放出去,用戶很容易覺得淘寶在用這個機器人「阻擋」用戶接觸人工客服,這會對淘寶的口碑造成很大的影響。

可是空無他們的「正方」觀點是:如果不嘗試,怎麼知道用戶喜不喜歡呢?況且人工智慧需要在不斷的訓練中才能成長,如果遲遲不放阿里小蜜出去鍛鍊,就會一直智障下去。。。眼看每天人工客服積壓的投訴越來越多,事不宜遲啊!

最終,空無他們拚死爭取到了一塊「試驗田」:淘寶的新註冊用戶(大概占總用戶的10%)可以看到人工智慧客服入口。

講真,這一版的阿里小蜜確實不太聰明的亞子,從後台來看,對於用戶問題的解決率只有30-40%。大部分最後還得轉人工。

這也不怪團隊不努力,因為涉及到自然語言理解的人工智慧確實處在技術的早期,真的非常非常難。但是這樣的結果,讓「反方」同學占了優勢,大家一致投票,人工智慧客服還沒到火候,再等等也不遲。

空無他們別提多鬱悶了。

可是幾個月後,大洋彼岸的一個重磅新聞,卻扭轉了「輿論局勢」。

2016年春天,積攢了一年的阿法狗火力全開,橫掃李世石和柯潔,瞬間甩掉了人工智慧頭上「智障」的帽子。雖然阿法狗下圍棋和阿里巴巴智能客服沒啥關係,可這件事兒卻影響了所有人的心智。

「大家開始相信,原來人工智慧的春天已經這麼近了。」空無說。

這件事之後,「反方」的阻力明顯變弱了。從2016年春天開始,所有人投票同意:阿里小蜜全量鋪開,所有淘寶的用戶都可以用到這個智能客服機器人了。

要知道, 人工智慧的智能程度,和訓練它用到的數據量直接相關。

面對數以億計的巨大用戶群,阿里小蜜迅速獲得了海潮一樣的洶湧數據,進化的速度陡然加快,問題解決率攀升到60%。

酒香不怕巷子深。很多在淘寶天貓上的商家也開始注意到了這個可堪大用的機器人。他們紛紛輾轉找到空無,詢問這機器人能不能借他們用用。眼看要到雙11,他們店鋪自己的客服也不夠用了。

空無當然很開心,可是這時,反對派的擔憂又來了。。。

(八)小蜜「出圈兒」

淘寶自己用機器人客服,畢竟只代表淘寶。可是平台上的商家如果用了機器人客服,一旦出問題,那可是會影響銷量的。商家損失真金白銀,肯定會罵淘寶,用戶購物體驗糟糕,也肯定會罵淘寶。

兩頭挨罵,誰能擔得起這個責任呢?

人工智慧征程上的「怪獸」,此刻威力盡顯。究竟是給商家上機器人客服是「善」,還是不給商家上機器人客服是「善」?這個抉擇,是技術人不能承受之重。

最終,正反兩方「打」成了一致,決定先選擇9個比較大的商家,一起來共建人工智慧客服。大家把好處和風險都攤開了。如果商家信任阿里巴巴,並且願意承擔風險,那我們就一起干!就這樣,阿里小蜜的商家版——店小蜜——第一次亮相了。

當時同意合作的9個商家包括耐克、小米、榮耀等等。你可以看到這些品牌不僅很大,而且他們的文化都是相當重視用戶口碑和體驗的。

他們愛惜羽毛到了「變態」的地步:

在雙11之前,每一家都對店小蜜提了一長串要求,其中包括店小蜜回復用戶的語氣,轉人工服務的方式,甚至規定了不同時段分流到店小蜜和人工客服的用戶比例,儘量多地讓人類客服來接觸服務用戶,實在忙不過來了店小蜜再頂上。

所有人,都緊張地度過了這次雙11。然而,這9家店鋪店小蜜的表現可以用「驚艷」來形容。

小米在上一年雙11用到了700名人類客服,今年本來預計會用到1000人以上,但是店小蜜的加入,只配合了500個人類客服就平穩地度過了雙11,節省了一半的人力。

當然僅僅節省人力不是目的。根據這些商家回憶,在沒有增加成本的情況下,店鋪從銷量到用戶滿意度居然都提高了,這一把確確實實「賭對了」。

經此一役,阿里內部懷疑阿里小蜜和店小蜜的聲音迅速減少,人工智慧終於用時間和努力,證明了自己體內所蘊含的巨大能量——機器人客服絕不僅僅是一個工具,而是一個大時代的序曲。

找到一張空無和小蜜的合影

從2016年開始,越來越多的店鋪開始使用店小蜜,而店小蜜的回答解決率也超過了90%。作為普通買家,估計你也會有感覺,這幾年你在淘寶上諮詢商品,人工智慧的回覆越來越多。雖然有時還不盡如人意,但是解決你的基本問題還是沒問題的。

在短短的兩年間,被空無「籠絡」的算法工程師人生經歷了過山車——被各個部門「愛答不理」到「高攀不起」。有了這一手好牌,大家終於可以元氣滿滿地精進人工智慧的技術了。

阿里小蜜在這幾年又攻克了很多技術難關,空無給我舉了幾個例子:

1、多輪互動

用戶會按照日常對話的方式和機器人對話。而在日常人類對話里,多輪互動是很稀鬆平常的。

例如:

用戶:我要開發票。

客服:你要開哪一個商品的發票?

用戶:小米手機。

這時,人腦很輕鬆就能把前後的信息拼起來,明白用戶是要開「小米手機」的「發票」。

可是對於人類來說簡單的事情,人工智慧就很難做到。這時,技術宅們就要為人工智慧專門創建一個「多輪對話」的引擎。簡單來說就是把常用的多輪對話都列舉出來,讓機器下次遇到同樣的情況就可以應對自如。

列舉多輪對話的場景,是個相當繁瑣而且具有專業屬性的工作,僅僅靠空無的技術團隊是不夠的,還需要客服團隊根據經驗來列舉、調整。

為此,空無他們專門做了一套可視化系統,讓普通的客服或者運營同學就可以通過拖拽的方式調整多輪對話,很多人一起貢獻智慧,機器人聰明的腳步就越來越快了。

2、知識圖譜

知識圖譜和我們之前說的認知智能里的「認知圖譜」有點像,你可以理解為它就是人類的常識。

舉兩個例子:

如果一個人對客服說:我忘記了。根據知識圖譜里記載,「被忘記」的很可能是「密碼」。所以阿里小蜜此時就可以根據「知識圖譜」追問一句:你是不是忘記了密碼?

如果一個人對客服說:不想要了。那麼根據知識圖譜,「不想要了」的東西很可能是「商品」,阿里小蜜就可以追問:是不是要退貨?

3、語音對話

從2018年開始,阿里小蜜長能耐了。以前都是通過文字和用戶交流,現在它可以「接電話」了。

其實接電話的本質就是把用戶的語音變成文字,人工智慧客服再把回答從文字變成語音說出來就行了。但是,真的做起來, 空無發現現實情況比這個要難得多得多。

首先,把語音翻譯成文字會涉及到語音識別的準確性;把文字發成語音考驗斷句和發音的流暢性。這就要求在 ASR(自動語音識別)和 TTS(語音轉文字)方面不斷改進技術。

其次,用戶在語音聊天時的狀態更自然,思路更飄忽。有可能上一秒在說售後服務的事兒,下一秒就去說支付的事兒。這個時候就要求系統時刻感知用戶的思路有沒有切換。

再次,在語音對話的時候,用戶一旦發現機器人說的不是自己感興趣的內容,就會強制打斷,這就要求系統在說話的同時,也要時刻支著耳朵聽用戶有沒有新指示,這叫做「雙工」技術。

以上每一個問題的解決,都要用到此時此刻人類科學的最前沿成果。

空無感嘆,這麼多年,做了這麼多事兒,其實就是為了一點: 絕不想讓人工智慧客服成為擋住用戶尋找人類客服的牆,而是應該成為輔助人類客服幫用戶解決問題的幫手。

他面前的那個怪獸,仍然會時不時殺出來,阻擋去路。

2017年的「雙11」的一個小插曲,讓空無想了很多。

那年11月10日晚上23:50,距離雙11流量洪峰到來只有10分鐘,客服團隊的一位同學突然做了一個操作,本意是想讓接下來的阿里小蜜和店小蜜發揮得更好。好巧不巧,這個操作卻恰好觸發了系統的一個隱秘 Bug,小蜜瞬間癱瘓。

所有的人腦子瞬間一片空白,趕快去搶修。

可是要把系統恢復好,卻需要將近二十分鐘。這意味著就在雙11零點到來之後的十分鐘,小蜜是不可用的。

果然,零點到來,無數店鋪都發現了:小蜜沒有正常工作。瞬間,質疑和吐槽雪片一樣襲來。空無他們沒有辦法,只好一邊全力修復,一邊安撫店鋪掌柜。直到00:10系統恢復運作,吐槽才順次平息。

那以後,小蜜團隊痛定思痛,把本來就很強的測試系統又再次加強,全力保證這種問題不會再出現。到2018年雙11,小蜜已經承接了淘寶天貓平台98%的在線服務需求。

很長時間,空無都在被一種情緒所籠罩:

我們的小蜜再也不是一個可有可無的機器人,它背後是幾十萬商家的真金白銀、身家性命,這是沉重的責任。

空無說。

(九)淘寶的「打怪升級」

時間終於跋涉到了2020年。

淘寶已經像一個機甲戰士,渾身轉載了諸多打磨錚亮的人工智慧武器。雖然傷痕累累,卻目光炯炯。

馬雲正式宣布退休,從人們視野中淡去,他的「跪地託付」也留在了歷史的書頁里,恐怕這些技術人不會每時每刻都記起。但那個畫面卻像一幕戲劇的開端。

逍遙子張勇接過阿里巴巴的帥印,繼續讓天下沒有難做的生意。大幕拉開,淘寶像一艘船,被技術人的夢想和一次次的抉擇推向未知的遠方。

張勇

後來,駱衛華的翻譯團隊搞出了新的事情,他們能夠把商品圖片中的文字「摳出來」,翻譯好再原封不動地「PS」回去,讓一幅帶有中文或英文的圖片,可以變成俄羅斯語、西班牙語、土耳其語的圖片。這樣一來,整個商品頁面的翻譯變得渾然一體。

這是一個把中文圖片變成英文圖片的例子。

「我們的希望就是外國用戶完全沉浸其中,不要意識到他們看的是一個翻譯頁面。」駱衛華說。

他們也幫助阿里雲團隊把阿里雲的各種產品介紹都翻譯成全世界各國的語言,讓代表中國的雲計算可以更方便地漂洋過海。

他們還試著對淘寶的購買評價做「情感分析」,從成千上萬條評價中找到誇獎和吐槽最典型的幾條,作為推薦評價呈現給用戶,希望能縮短人們在翻閱評論上浪費的時間。

三桐和他所在的搜索推薦團隊仍然在他們「資深導購」的路上探索,最近幾年,他們傾注了大量的力量在前沿的「圖計算」領域,通過精細分析數據之間的關聯來優化推薦,試著給顧客更多的驚喜。

而空無的智能客服團隊最近正在嘗試讓小蜜做「閱讀理解」,給它一篇商品介紹的文章,它就可以自動從中挑出關鍵信息,組成回答。有了這項技術加持,店鋪的工作人員不用花很長時間調試機器人,它就可以 自己學習商品特性,回答顧客的問題。

而這些技術,也在漸漸從服務淘寶用戶的工具變成服務社會的生產力。

駱衛華給我講了一個故事。

2020年,新冠肺炎來了。中國的治療實踐非常成功,尤其是浙大一院,在兇狠的疫情浪潮里,沒有一例死亡病例。

於是,當時馬雲公益基金、浙大一院和世界衛生組織 WHO 合作,第一時間把醫生的救治經驗總結成了一套醫療手冊對外發布了出去。但是,很快 WHO 就接到了一些反饋:很多非英語國家的一線醫生沒辦法那麼準確地閱讀英語資料,但醫療手冊又非常專業,決不能出現絲毫理解偏差。這些國家的衛生機構希望 WHO 能給出一個多語言版本的醫療手冊。

這個任務,猝不及防地落在了駱衛華的機器翻譯團隊頭上。

當然,這麼嚴肅的事情,肯定不敢完全依賴機器翻譯。但是他們想到了一個好辦法:結合已有的醫療詞庫,把醫療手冊先用機器粗略翻譯,然後再召集各個語言的志願者在這個「粗加工版本」上進行精確訂正。

這樣做有一個巨大的好處:對於專業詞彙的口徑已經被統一,人類志願者不需要在專業詞彙上有紛爭,這可以節省很多時間。

召集志願者的英雄帖火速刊登在 WHO 網站上,來自俄羅斯、印尼、伊朗、義大利、日本、韓國的志願者紛紛回復,願意為祖國效力。

這是俄文版醫療手冊的截圖

就這樣,原本最短也需要10天才能完成的繁重翻譯工作,在人工智慧和人的協作下,各個語種分別用了3-5天就全部完成了翻譯。世衛組織趕快下發了這些醫療手冊。

沒人能夠估計,如果這些醫療手冊晚下發一周,將會有多少處在生死邊緣的生命會等不到黎明,滑向深淵。

由於疫情,中國的出口貿易也受到了衝擊,關注社會時事和國家命運的人們,都著實捏了一把汗。

然而在中國內部,直播帶貨方興未艾,網購的數額大幅增加。阿里巴巴決定把直播帶貨這件事兒,推向全世界。

駱衛華和團隊們做了一件有趣的事情,給直播的主播畫面下方,配上了各個語種的實時翻譯字幕。現在你登錄速賣通(國際版的淘寶),就可以看到一幅奇景:很多主播用中文帶貨,可下面圍觀的都是操著各種語言的老外。。。

技術就是技術,這柄長劍並無善惡。

但是,使用技術的淘寶技術人卻在漫長的日子裡如履薄冰。當我站在他們身邊,映入我雙眼的是:他們在做「沉重且真實」的事情,盡力讓技術加深人和人之間的理解,讓技術帶給人希望。讓技術成為一朵煙花,在夜空里散盡人間的溫柔。

如果讓我來評價「淘寶打怪升級」的歷程,我也許會摘抄 《基業長青》的作者吉姆·柯林斯所說的一段話:

沒有單一的決定性行動,沒有宏大的計劃,沒有一招致勝的創新,沒有單獨的幸運突破,也沒有什麼奇蹟時刻。相反,這個過程就像持續地推動一個巨大而沉重的飛輪,讓它一圈接著一圈旋轉,不斷增加動能,直至達到突破點,甚至超越。

他們也許做對了很多,也做錯了很多。然而漫長的路上,誰又真的能預知下一個怪獸何時到來?誰又能真的擁有一本《馴龍秘籍》,像開掛一樣斬妖除魔?

除了向前,我們別無選擇。

如果想轉載這篇文章,請加微信:woshimantoujie

技術成為一朵煙花

在夜空散盡人間溫柔

文章來源: https://twgreatdaily.com/zh-tw/Vuc6yHMBd8y1i3sJOABr.html





白海豚大逃殺

2021-05-24