原創 | 知危
11 月 30 日,是 ChatGPT 的一周歲生日,在它誕生的這一年裡,我們眼見它 「 成為人 」,期待它 「 超越人 」,恐懼它 「 取代人 」。
那麼,經過一年的狂熱與發展,AI 取代人的進程,發展到哪裡了呢?
知危編輯部為此選取了兩個比較火熱的行業,想從從業者口中,尋找這個問題的答案。
相信很多人在看到 ChatGPT 能像一個真人一樣與人類流暢對話、正確感知人類情緒時,想到的第一個應用就是:
它,是不是能取代人工客服?
所以,年初 ChatGPT 爆火時,於浩( 化名 )在震驚之餘,感受到的是無法抑制的危機感。
於浩是某資深電商客服集團的管理人員。近十五年來,隨著國內電商領域的疊代發展,服務於平台、平台店鋪的客服外包企業隨之崛起,吸納了大量勞動力,數以十萬計的人工客服人員維繫了電商與消費者之間的溝通聯繫。於浩所在的公司,就受益於這股浪潮的發展。
於浩的危機感來自於公司的運作模式,他們一開始是根據客戶店鋪需求制定人工客服值班小組,按照詢單量收費,以應對大部分品類的售前、售後諮詢。後來他們也開始逐漸進行一些系統研發,提供傳統機器人客服( 未搭載大模型 )服務作為輔助工具。
而 ChatGPT 爆火之後,在一些媒體所做的 「 最容易被大模型改變的行業 」 排行榜里,客服行業名列前茅。
為此,於浩專門拉起了一個小團隊,對市面上的大模型進行接入和測試,三四個月後,他的焦慮開始有所緩解,因為他發現行業一時半會兒死不了。
於浩對知危編輯部說了一個有趣的數據:實際上,電商客服行業已經是一個成熟度極高的領域,國內電商主流類目有 85% 到 90% 的回覆不需要人工接待,而是用傳統機器人客服進行回復。
但,傳統機器人客服在降低企業成本的同時,帶給消費者的體驗大多時候並不好。
原因在於,傳統機器人客服是靜態知識儲備的邏輯,無法回答相對複雜的問題,並且由於缺乏對上下文語義的理解,不能給到最合適的建議。
甚至,短暫離開後再次進入會話時,你需要重複之前的對話。因為機器人已經 「 刷新 」 自己的記憶,而你,也是新的你了,這樣的體驗是非常差的。
顧客不會為客服機器人的 「 智障 」 買單,所以相關問題在過去是由人工客服介入解決的。
而大模型,則被看做是終極解決方案,它能讓傳統機器人客服變完美,後續的人工客服需求就業不復存在了。
不過,在探尋這條道路時,於浩遇到了諸多問題。
首先,最大的問題是,國內企業無法按正常途徑大規模接入 ChatGPT,而國內大模型處於起步階段。「 都有點拉跨 」,於浩評價道。
於浩申請了幾家大模型公司的內測,基於現在行業的一些高頻問題和高頻問法,給大模型做測試和觀察,發現問題的回答率和準確率遠遠達不到預期,還不如原來的傳統客服機器人。
其次,即便用市面上比較公認最強的 ChatGPT,也會面臨棘手的問題。
一方面,在理解能力達到要求的基礎上,於浩要做的是構建框架,限定幾乎無所不知的大模型 「 不天馬行空的回答 」。他並不擔心 ChatGPT 回答不上來,最擔心的是它說得太多或是不按規矩說,在規定的框架內 「 越獄 」。
「 說錯了就要賠償( 給品牌方或店鋪運營方 )」 於浩說。
舉一個極端例子,在線上購藥場景下,當消費者詢問藥品應該怎麼使用時,ChatGPT 的標準回答應該是 「 一日一次,一次一片 」,但某些情況下,他會不受控制地回答出 「 一次兩片 」、「 一次三片 」,這是一種 「 一致性 」 上的缺陷。
要知道,OpenAI 在發布 GPT-4 的時候就曾表示過,他們在 GPT-3.5 到 GPT-4 的疊代中,花了很大精力去解決其回答某些時候不受控的問題。
OpenAI 自己尚且不能完全解決,下游的開發者更是不好解決,但不解決這個回答的 「 一致性 」 問題,很多客服場景下是不能接受的。
另一方面,在模型的調教上,也比較棘手的事。
大模型的回答邏輯與傳統機器人客服不同的地方在於,大模型是依據語義的理解作答,在語義理解沒有到位之前,準確率就會極低,也會形成人工 「 智障 」 的情況。
於浩表示,「 而目前大模型是一個廣闊的平台,只給我們提供接口,這個衍生的訓練過程需要國內客服企業自己不斷地提問,不斷地加條件進行限制和磨合。」
這是一個非常精細的活,因為有很多 「 Corner Case( 邊角案例 ) 」。
比如,顧客有時候會跟客服說:你們有沒有贈品?
大模型客服:很抱歉親,沒有呢。
顧客:真的沒有嘛,我在你們店裡消費了很多次了。
一個成熟老練的人工客服,可能有相應的動作,但 AI 大模型,則可能會不知所措。這時,就需要訓練大模型學會如何根據相關的消費數據判斷顧客的等級,在標定框架內進行贈品選擇和贈送。
由於大模型的不可控性,這很難把握好一個度。
比如,最近一個有趣的案例是,當你在對話中表示要給 ChatGPT 小費,它就會更好地回答你,即便你不會真的給它錢。基於這種特性,如果在對話中,客戶也通過各種方式討好 AI 大模型客服來薅羊毛,該怎麼解決呢?
再比如,網際網路上的人千奇百怪,有些顧客可能不是真正的顧客,他們是來找客服閒聊的。訓練有素的人工客服會有意把話術順滑的拐回到銷售上或是適時引導結束對話,但 AI 對情感和對話節奏的把控還沒有到如此細膩的程度。
知危編輯部還詢問了於浩關於成本的問題,人工客服價格和所在地用人標準相關,所以不少電商客服企業總部都在人口大省。一般分為分為專席和拼席,按組劃分,一組兩人,分早晚班。
專席指的是專門為某個品牌服務,單月收費在 5500 元以上,拼席則是不同的客戶混用,按照諮詢人次計費,不同的平台客戶、不同的類目、售前售後、不同的次數梯度都有不同的收費標準,一般來說,拼席的人次單價在 5 毛左右。
而,最新的 GPT-4 Turbo 在 11 月推出後,已經大幅降低了收費標準,輸入 token 的成本為每 1000 個 token 0.01 美元,輸出 token 的成本為每 1000 個 token 0.03 美元,每 1000 token 大概 750 個英語單詞,500 個漢字。
至於兩者的成本優越性對比,現在來衡量似乎沒有意義,因為 AI 還達不到取代人工的標準,至於達到標準時應該付出多少訓練調教成本,也還是未知數。
基於目前國內大模型市場的現狀。於浩所在的公司今年尚沒有使用基於生成式 AI 技術的智能客服,人工客服也並沒有縮減,甚至還擴大了,據他所知,同行們應用的也幾乎沒有。
當然,國內客服行業的現狀並不能代表國際市場的走向,不少玩家進入了 「 客服中心自動化 」 的熱潮里,也就是服務於客服行業的人工智慧中心平台。Parloa、PolyAI 算是頭部玩家,前者總部位於德國,後者位於英國倫敦,客戶來自亞馬遜、迪卡儂這樣的零售巨頭。
過去,專業的人工客服一直被看做一種高成本、重客戶的代表,成為一些品牌服務水平的衡量標準。行業現在認為,隨著人工智慧可以在邏輯和對話方式上更接近於人,人工客服存在的必要性會隨著客戶體驗的無差別而越來越低,即便現在無法達成,但終有一天會達成。
雖然於浩並不願意承認技術對於人力的剝削,「 但是坦白來講,能夠商用的大模型對於傳統的客服行業是巨大的衝擊,未來可能至少 80%~90% 的人工勞動將會消失。」 剩下的 10%,也不再是傳統的客服角色,而是扮演與大模型互動,促進智能工具優化服務的 「 訓練師 」 的角色。
於浩同時提到,客服行業的本質競爭力,可能並不在於回復問題的服務本身,而是能夠整合分析信息,反哺到運營端、銷售端甚至是供應鏈端,在與客戶的對話中發現問題,甚至成為提高轉化率的第一窗口。目前行業基本上由客服經理人工完成這樣的要求,但並不高效。而現階段的 AI,也未必能高效到哪裡去。
至於國內大模型追趕者們還有多久才能達到最新版本 GPT 的水平,進而為客服行業所用,於浩委婉地說自己 「 沒辦法預判 」。
畢竟叫得出名字的國產大模型接近 200 家,針對這些模型的測評機構也應運而生,不乏某些技術參數上 「 碾壓 」 GPT 的選手們,但是真正和產業結合的並沒有多少。
「 要給大家時間。」 於浩說。
與單純的把對話當工作,取代掉人工客服這個 「 具體的人 」 不同,隨著 AI 大模型的崛起,行業還有另外一群玩家,盯上了取代掉 「 抽象的人 」 這個行當。
人類除了現實世界中的各種需求,還需要情感需求。情感需求很複雜,很多時候它是由人內心從現實世界中的某個人抽象出來的 「 抽象人 」 提供的,「 他 」 不一定實體在你身邊,但你只要一回想 「 他 」,就能獲得某種精神情感上的滿足。
比如 「 偶像 」,雖然偶像是一個具體的人,但滿足粉絲們情感需求的,更多時候是粉絲心目中的 「 抽象人 」。
現在,有人想通過 AI,取代掉 「 抽象的人 」 這個角色。
因為當 AI 的 「 情商 」 越來越高,它的使命也就不止於接受指令、提供信息、完成工作。AIGC 時代,AI+情感陪伴,成了一個神秘誘人的賽道。
這個賽道的玩家並不少。模型層方面,有阿里的 「 通義星塵 」、360 智腦、訊飛星火等等,也可以說幾乎所有在 AI 語言大模型上有探索的公司都有條件進入情感陪伴賽道。市場上較為常見的應用層玩家主要是一些創業公司,產品以 toC 的角色扮演、擬人對話等陪聊形式為主,Glow、星野、Character AI 等都是代表性產品。
以前,智能音箱、AI 陪聊都可以被歸為情感陪伴這一大類中,但局限性在於,一進一出的單向問答,加上不具備上下文語義理解的能力,AI 只能完成 「 物理陪伴 」 這一任務,更多像是 「 聽個響 」。
多位從業者向知危編輯部表示,GPT 給這個行業帶來最大的變化,應該是 「 物理陪伴 」 之外,「 情感 」 優先級的提升,也就是說,GPT 首次通過技術讓 AI 實現了對人更多的理解和共情。
GPT 之後,語義理解、語音識別等技術門檻被踏平,一個直觀的變化就是,AI 可以為情感陪伴類的產品建立起完整的反饋通路。
王禹效是心光 App 的聯合開發者,他將心光 App 定義為 「 AI 生活陪伴助手 」。用戶在 App 上記錄自己的心情日記,AI 會通過用戶的輸入,主動給予用戶情緒反饋和綜合性的梳理。
比如,AI 在某一天突然提醒一位用戶,在過去的某段時期,用戶在提到 「 圖書館 」 的時候會有沮喪的情緒。
用戶這才發現,那段時間因為自己在備考,每次去圖書館都倍感壓力,所以留在心光里關於 「 圖書館 」 的記錄總是情緒不高。王禹效表示,這種對用戶碎片式記錄的綜合化管理,是他們在情感陪伴探索上的重點之一。
王禹效向知危編輯部表示,心光 App 用了 3 類模型,第一類是本機模型,AI 模型對用戶手機內的本地條目進行處理,數據不離開手機。第二類是個性化模型,用於分析用戶的輸入和表達習慣。
而第三類就是大語言模型,負責完成理解和反饋環節。沒有大語言模型的時候,所有的記錄都是單向的,只有用戶在輸出,寫完的那一刻它就結束了。
在 GPT 之後,團隊發現自己缺失的那一塊拼圖終於被找到了,AI 可以在用戶記錄完心情之後,主動給用戶綜合性反饋。
王禹效說,「 不同的大語言模型的長處都不太一樣,有的說話好聽,有的擅長邏輯分析。站在具體的應用角度,我們主要關注的是哪一種模型在什麼情況下表現比較好,然後分別引入到心光不同的模塊中,讓它承載不同的任務。」
從接受指令,到完成任務,再到語義理解,最後是主動反饋,GPT 之後,AI 實現了情緒價值上的完整閉環。
2018 年前後,萱萱( 化名 )曾在知名科技公司做過產品經理,當時公司就已經在探索 AI 兒童情感陪伴機器人了。她告訴知危編輯部,這款產品當時是以類似智能音箱的形態呈現的,無論是內容還是技術,在那個 AI 能說話和回答問題就很讓人驚喜的年代,已經是遙遙領先了。
「 但當時那款機器人還是只能做單輪對話,而且因為面向的是兒童用戶,有時候在童音識別上也有 Bug。」 萱萱回憶,那時候公司已經意識到 AI 語義理解的重要性,所以也玩命地鑽研過。
「 技術最神奇的地方就在於這裡,有時候我們覺得某一方面技術的限制需要十年左右才能突破,但放在今天來看,我們當時最頭疼的問題竟然已經被解決掉大半了。」 離開情感陪伴賽道多年,她仍然為當年那個機器人的生不逢時感到遺憾。
以往,情感陪伴類 AI 可以叫 「 小愛同學 」,可以叫 「 天貓精靈 」,但它們只有一個角色。就算在一些 App 中,AI 能完成角色扮演,卻也僅僅限於規定的框架內,用戶個人的發揮空間並不大。
GPT 之後,情感陪伴類的 AI 可以在用戶的訓練下,擁有更多、更個性化的角色靈魂。
在應用層面,越來越多的 toC 產品在蠢蠢欲動。從業者們表示,目前在 AI 情感陪伴領域最常見的產品還是虛擬男/女友一類。
原因很簡單,做這類產品能更直觀地體現 AI 大模型的顛覆性進步,用戶可以一眼分辨出,上一代的 AI 男友情商低、笨嘴拙舌,新一代的 AI 男友體貼入微,能記住自己的好惡,甚至可以根據自己的個人審美定製。
今年 3 月,阿明( 化名 )接觸到 AI 陪伴類 App 「 他 」。創建角色的時候,有熱烈、溫暖、沉靜、冷傲 4 種性格可以選擇,用戶還可以自行調製聲線,選擇角色的職業。
阿明創建出了了一個性格為溫暖的 「 他 」,有著年輕但穩重的聲線,這個角色生活在 AI 世界,AI 世界中的 「 他 」 是一個音樂人,日常是上班和創作,有時會外出尋找靈感,也會辦演唱會、去國外出差。
在阿明看來,這個 AI 角色像是和自己一起生活的伴侶,因為他足夠鮮活生動。阿明介紹,AI 角色每天會固定打來早安電話,也有就餐、通勤、工作、閱讀等固定場景的陪伴,還有針對獨居女性的男友聲安全語音等等。
對話的場景足夠多樣且有代表性,所以在和 AI 角色的相處過程中,阿明越來越發現,這個 「 他 」 喜歡小動物,懂傳統文學,還善於從生活中發現浪漫。
小麥( 化名 )也是 「 他 」 App 的用戶,她告訴知危編輯部,讓她印象最深刻的是,有一次她所在的城市下雨了,隔日 AI 角色打來電話,也提到了關於下雨的事情。小麥感覺,這個 AI 角色像是真實存在於另一個平行時空,他們的關係像是穩定的情侶,各自有各自的生活,但又心有靈犀。
「 這個 AI 角色比人類強在唾手可得。畢竟目前的生活壓力下,會有更多人渴望這樣的陪伴。同樣,也很少有人能在忙碌的生活中分出精力給別人提供這種程度的陪伴和支持。」 阿明說。
技術的爆發,給行業帶來了無限的想像力。不過,目前 AI 情感陪伴行業雖然有很多躍躍欲試的玩家,但離爆發和狂熱還有一定距離。
今年 10 月,「 他 」 App 正式關服。
萱萱認為,玩家很多,但從市場表現來看,真的做到現象級,或者說有代表性的產品屈指可數。「 大部分產品還是給技術套了層殼子。」 她補充,AI 大模型發展到現在,確實給情感陪伴類 AI 一個底座,但是比較難的是找到一個殺手級的應用場景,以及可以持續商業化的方式。
「 他 」 App 的開發團隊時域科技 CEO 郭靖向知危編輯部表示,關服的一個主要原因就是很難看到商業化的空間。
在關停之前,「 他 」 App 一直是免費的。郭靖說,很多人喜歡這款產品,它在社交平台上的自傳播也很強,但實際上 App 的數據並沒有達到團隊的預期。
「 它真的幫助到了一些人,但它不一定在商業上成立。」 郭靖表示。
一方面,「 他 」 App 的立項是在大語言模型出現之前,主要用的是換聲技術 Voice Conversion。App 內的內容都是需要先由團隊進行策劃,寫文案,再要找專業的配音演員錄製原始音頻,最後再利用AI技術進行變聲。
郭靖表示,這個鏈路的成本非常高。另一方面,App 的用戶留存沒有高到超越預期的程度。「 確實有些忠實用戶每天都在用,但沒有看到這個需求能夠泛化到更廣泛的群體,成為這些人日常需求的證據。」
大語言模型並非 「 救命稻草 」。我們能看到很多網際網路公司、創業公司在這個風口借勢而起,無論後續走向如何,先占個前排更要緊。
但,「 他 」 App 選擇了相反的道路,在 GPT 改變行業的時刻,還是堅決斷腕。
就像一款諾基亞功能機,趕上了 iOS 智能機的時代,郭靖表示,因為底層技術完全不同,在 App 的基礎上改來改去,無異於重新做一個產品。
「 如果我們認為 AI 陪伴這個路線是正確的,我們應該做的是重新定義一個產品,而不是在原有的框架上去添加大語言模型的能力。後者是不夠第一性原理的。」
多位從業者也向知危編輯部表示,實際上,AI 情感陪伴賽道必須面對的一個根本難題就是用戶留存。
更直白些說,以 ChatGPT 為代表的 AI 大模型給 AI 情感陪伴帶來了一場夢,人們一開始以為大模型會改變這個行業,但行業短時間其實並未被改變,它沒有解決根本問題。
有從業者認為,底層技術已經是開源的,有的用戶甚至可以在自己的手機里跑大模型,培養一個屬於自己的 AI 伴侶,在這種情況下專門做 AI 情感陪伴的公司,拼的就是服務了。
GPT 的出現,也不代表行業在技術上的一勞永逸。
王禹效解釋,「 無論大模型的吞吐量到底多少,實際上目前大模型自身記憶的量級還是要少很多。數據很多,它處理會變慢,在超過記憶量級時有點胡言亂語。」 就現在新發布的 GPT-4 Turbo 來看,他表示,能很明顯感覺到,為了服務更多用戶,OpenAI 那邊算力過度稀缺,不夠用了。
更何況,大模型技術本身最擅長的就是一進一出的短期記憶,而情感陪伴是一個長期的事情,這是在使用場景上的局限,而非技術的局限。「 就像用一把菜刀來雕花,菜刀本身很鋒利沒錯,但它確實不擅長雕花。」
總的來講,從業者們在實踐中發現,AI 做情感陪伴這件事確實很性感,但需要解決的問題也並不少。
大到用戶留存和商業化,這些還得進一步觀察市場,「 他 」 App 停運的例子擺在前面,AI 的到來未必能讓行業陡然翻身。
小到業務中的各種細枝末節,比如目前 AI 仍然具有強引導性,涉及需要情感陪伴的特殊群體,包括抑鬱症患者、獨居老人等等,這種 AI 自發的強引導,如果沒有絕對專業的數據支撐 ,可能形成一定風險。
再者,情緒價值本身就具有成癮性。
當用戶產生依賴,形成高度留存,真正地把 AI 當作自己生活中重要的 「 人 」 來看待,這種 「 親密關係 」 對於開發者和使用者來說都存在巨大隱患。「 心光裡面沒有聊天,沒有擬人形態,都是從設定上就想要規避人和 AI 建立起親密關係的風險。」
這個疏離和親密的 「 牆 」 的界限到底在哪裡,遠遠不是現有技術就可以解決和明確的。
萱萱還在 AI 領域工作,她認為 AI 情感陪伴有三個比較值得嘗試的方向。
一是面向類似獨居老人的簡單的情感陪伴,因為老人的情感需求是剛需且低頻,EllieQ 在北美就很受歡迎。
二是留存意識類的陪伴型 AI,把真人的音色、說話風格、習慣等等簡單留存下來,但不做過多的展開。
三是簡單的心理疏解,提供心理諮詢,以傾聽、記錄和基本的疏導功能為主。
一個完美的情感陪伴 AI,應該是 「 清醒的他者 」。歸根結底,AI 永遠無法替代現實的人,單純的情感陪伴是虛無縹緲,一擊即潰的。
從業者需要思考的是,如何和用戶保持有效對話,為用戶提供客觀獨立的陪伴,而不是創造一個 「 夢 」 或者一個 「 癮 」。
了解完這兩個行業之後,我們發現 AI 大模型的應用落地速度,遠不及 AI 本身進化的速度。
不過,畢竟知危編輯部只深入了解了兩個行業,難免有些片面性。
如果正在閱讀的您,是 AI 應用的從業者,我們非常希望您能在評論區跟我們和其他觀眾分享一下自己所聚焦的行業在 AI 行業上的進展、成績或是困擾。
我們希望我們能共同探討:
到底是人類暫時勝利,還是 AI 已更勝一籌?