經不起拷打的數字,難以定義的真相

2020-01-13   哈佛商業評論

我們習慣於一件事情要麼是真,要麼是假,但「後真相」(Post-Truth)則既不是徹底的真相,也不是純粹的謊言,它是指大眾輿論中那種真相和邏輯被忽視,而情感和偏見占據主導的情形。2016年,在特朗普當選美國總統和英國通過公投脫歐兩件「黑天鵝」事件接連發生之後,《牛津大詞典》把「後真相」選為了年度詞彙,有學者提出,傳統主流媒體奉為圭臬的「真相」已經衰落,我們已經進入了一個「後真相時代」,而後浪出版社近期出版的《後真相時代》正是一本全面剖析「後真相」現象如何誕生的書。

在「後真相」現象中,數字是一個毫無疑問的幫凶,雖然人們常說「數字不撒謊」,但是還有一句剛好相反的話是「只要拷問數字,它們就會承認任何罪名」,數字本身當然不會說謊,但是對於如何使用它卻有著太多的玄機和奧秘,本期巴倫書摘選自《後真相時代》第四章《數字》,我們可以看到四種如何通過「拷打」數字來隱藏和扭曲真相的敘事策略。

數字是神奇的。它們可以提供語言常常無法提供的關於世界的清晰度。我們可以用數字來比較、評價事物,測量變化,總結出一個人物的一系列優秀品質。數字可以被任何文化中的任何人理解。它是一種世界語言。問題在於,我們許多人在很多時候對數字存在誤解。即使是兩個接受過統計學培訓的科學家也看不出他們自己的數字說明了什麼,難怪那麼多人會對數字的含義感到困惑。

這不是數學能力問題。如今,我們很少有人需要口算乘除法。你可能不知道什麼是二次方程,但這沒有關係。對於管理家庭預算和為負責任的政府投票的人來說,重要的是理解某個具體數字意味著什麼。

由於我們許多人在看到一個統計量、一所新學校的成本或者一個群體的規模時很難知道它的真正含義,誤導者可以暗示他們所希望的含義,從而影響現實。數字本應是目前最透明的溝通形式,因此它本應最不容易被人誤用。不過,我們卻在生活中的各個領域看到了由數字支持的競爭性真相。

左撇子「早死」之謎

左撇子常常遇到麻煩。土豆削皮器和剪子是為右撇子設計的。拳擊課程會被「南爪子」搞亂。在支票簿或活頁簿上寫字會成為一項艱難的任務。在擁擠的餐桌上用左手喝湯很容易引發事故。就連不起眼的褲子拉鏈也對右撇子有利。不過,當兩位著名心理學家1991年發布的研究報告指出左撇子比右撇子平均早死9年時,左撇子似乎遭受了更大的打擊。

加利福尼亞州立大學聖布納迪諾分校的黛安·F·哈爾彭博士(Dr Diane F. Halpern)和不列顛哥倫比亞大學的斯坦利·科倫博士(Dr Stanley Coren)研究了1?000名加州人的死亡時間,發現右撇子的平均死亡年齡是75歲,左撇子的平均死亡年齡是66歲。在《左撇子:生存適應性下降的標誌》一文中,他們聲稱:「左利手的一些較大風險顯然來自提升他們事故發生率的環境因素。」作者的邏輯是,工具和車輛是為右撇子設計的,所以左撇子容易發生汽車或電鋸事故。《紐約時報》沮喪地指出:「在20多歲的人群中,左撇子的比例是13%,但在80多歲的人群中,左撇子只占1%。」看起來,左撇子和吸煙對於健康具有同等危害。

左撇子註定早死的觀念迅速傳播開來。到了2013年,英國廣播公司認為他們有必要重新考慮這個問題:「左撇子真的會早死嗎?」

答案是否定的。這完全是胡說八道。科倫和哈爾彭誤解了他們在數字中發現的真相。他們成了誤傳者。

我成長於寬容的20世紀70年代,當時人們積極鼓勵我接受自己是左撇子。之前的人就沒有這麼開明了。「不祥的」和「笨拙的」左撇子受到人們的懷疑,他們被認為受到了魔鬼的觸摸。左撇子遭到了迴避和歧視。因此,父母會儘量將孩子培養成右撇子。用左手吃飯或寫字的嬰兒會迅速被糾正過來。左撇子的自然比例是10%到12%,但在19世紀和20世紀早期,被視為左撇子的人口比例要小得多。直到最近,天生的左撇子才有可能以左撇子的身份成長。

因此,在1991年,左撇子群體的平均年齡低於右撇子群體。所以,左撇子的死亡年齡應該比同時期死亡的右撇子小。我可以通過類比說明這一點。已經去世的數字土著的平均死亡年齡小於非數字土著。這一定是真的,因為所有在網際網路普及時代出生的人全都低於25歲。這並不意味著數字土著的身份對健康有害。

1991年去世的左撇子的確比右撇子年輕得多。不過,這個真相受到了廣泛的誤解,使世界各地的左撇子產生了不必要的恐慌。事實上,年齡相同的左撇子和右撇子具有幾乎相同的壽命預期,這個競爭性真相應該可以使那些仍然在為壽命而焦慮的左撇子感到安慰。

蘋果、橘子和芝加哥謀殺

在談論數字之前,我們需要考察數字究竟代表了什麼。吹噓僱傭記錄的企業談論的是全職員工、合同工、無薪實習生還是等效全職工?煽動者引用的數字是移民、非法移民、經濟移民還是難民?接受救濟的人是失業者還是僅僅有資格獲得兒童或低收入支持的人?喜歡某產品的人是全體人民中的70%,還是最近被該產品的廣告轟炸過的小鎮上70%的受調查者?政府統計量指的是玉米種植量還是玉米銷售量,是家庭還是個體,是納稅人還是居民?這些區別之中存在著大量的調整空間,這為競爭性真相提供了機會。

加拿大和澳大利亞擁有全世界最高的兒童劫持率。是的,這是真的。這不是因為它們比墨西哥和哥倫比亞更加危險,而是因為兩國政府將兒童監護權爭端包含在了劫持兒童的統計數據中。類似地,瑞典的強姦率據說排在全球第二位,每年每10萬居民中有60起案件報告(印度的強姦率是十萬分之二)。不過,這不僅說明瑞典性犯罪的報告率較高,而且體現了更加寬泛的強姦定義。

2001年,為了支持在北極國家野生動物保護區開採石油,美國副總統迪克·切尼(Dick Cheney)聲稱,只有2 000英畝土地將會受到影響,其面積相當於「杜勒斯機場的1/5」。事實上,他只統計了建造「生產和支持設施」的土地,這既不包括公路和相關基礎設施占用的土地,也不包括靠近鑽探地點,可能打擾野生動物或污染環境的土地。此外,在建設地上管道的地區,只有支撐管道的支柱被統計到了建設面積之中,管道其餘部分下方的土地被排除在外。切尼的數字極具誤導性,他的提案隨後被參議院駁回。

數字策略之一:選擇有利單位

當特朗普總統2017年對國會說「9400萬美國人沒有工作」時,這似乎意味著所有這些人都是被動失業者。實際上,這個來自勞工統計局的數字包括所有16歲以上的學生、退休人員以及那些選擇不工作的人。真實的美國失業數字——想工作但是無法獲得工作職位的人——在2017年年初約為760萬,不到特朗普所說數字的1/10。

類似地,當特朗普宣稱「像阿富汗這樣的地方比我們一些城市的中心區還要安全」時,他要麼記錯了,要麼有意曲解了芝加哥謀殺案和美國人在阿富汗死亡人數的對比。2001年到2006年,芝加哥有記錄的被害人數為7916人。同一時期,2384人在阿富汗遇難。阿富汗的暴力死亡總人數要高得多(一位學者估計,2001年以來,超過10萬人在阿富汗被害),相對較少的美國人在阿富汗的暴力死亡率明顯高於芝加哥。特朗普的說法指的是在芝加哥被害的美國人比阿富汗要多,但是生活在芝加哥的美國人要多得多。根據這種邏輯,他完全可以說,在太陽上生活更加安全。

一款沐浴露產品的市場宣傳材料稱:「原始薄荷茶樹沐浴露濃縮了7927片真實薄荷葉。」數字7927以很大的字號印在瓶子上。7927片薄荷葉很多嗎?我不知道。製作幾毫升精華油需要幾千朵玫瑰,所以這個數字也許並不多。不過,這款產品顯然暗示了這是一個很大的數字。

在塑造品牌這一輕鬆背景下,這並不十分重要。不過,下面的說法呢:

我們正在雇用1000名新護士。

我們的全新送貨車輛每年可以節省100萬加侖燃料。

這些數字很大嗎?發表這些言論的人顯然想營造這樣的印象。不過,在了解背景之前,我們無法做出判斷。在只有大約8000個專業護士的愛沙尼亞,新增1000名護士是一項了不起的成就。在護士群體大約有90萬人的德國,這些新人幾乎不會引起人們的注意。對於UPS這種擁有十幾萬輛送貨車的公司,每年100萬加侖燃料只是一個捨入誤差而已。

現在的英國年輕人買房很困難,這在很大程度上是因為「可負擔」住宅的短缺。在2017年10月的一次重要演講中,首相特蕾莎·梅宣布:「我會在首相任期內專注於解決這個問題。」她還說:「今天,我可以宣布,我們將在可負擔住宅上新增20億英鎊的投資。」首相想表述一個很大的數字,但媒體迅速戳破了她的泡沫:20億英鎊(26億美元)可以多建造2.5萬套住宅,這在120萬家庭排隊等待分發住房的國家無異於杯水車薪。

數字策略之二:使數字看上去變大或變小

當某人試圖說服你相信一個數字特別重要時,他所做的第一件事就是將其轉換成包含相關背景的更具啟發性的真相。百分率往往可以比數字本身提供更多信息。道達爾對太陽能電池板製造商日能公司投資14億美元。你感到震驚嗎?不要急於預測這家法國石油天然氣巨頭的可再生能源革命:這筆投資只占道達爾總資產的不到1%。

2015年,懷俄明的公路死亡人數只有145人,德克薩斯則有3516人死於車輛事故。不過,對於只有58.6萬人口的懷俄明來說,每10萬人的年公路死亡人數是24.7。在擁擠的德克薩斯,這個數字是12.8。

2010年,電子製造商富士康的18名員工企圖自殺,其中14人死亡。這個故事成了西方報紙的頭條新聞,因為富士康是蘋果手機以及三星、戴爾、索尼等全球品牌一系列產品的製造商。富士康和蘋果立即受到了虐待勞工和工作條件不佳的指控。這些自殺事件是一場悲劇,但它們是否意味著富士康真的存在問題?

該公司2010年的員工接近100萬人,年自殺率約為十萬分之一點五。中國的平均自殺率為十萬分之二十二。換句話說,富士康的自殺率不到全國平均水平的7%。14起備受關注的死亡事件混淆了一個更加積極的競爭性真相。

歐巴馬曾說過,在美國,浴缸導致的死亡人數超過了恐怖襲擊。這種說法受到了批評,但是歐巴馬並沒有說錯。根據國家安全委員會的數據,2013年,464名美國人在浴缸中溺死,1810名美國人在天然水域溺死,903人在床上意外窒息或者被勒死,超過3萬人摔死。同年,只有3個美國人在波士頓馬拉松期間死於恐怖襲擊——還不到浴缸死亡人數的1/100。

脫歐事件中的數字

有一個數字決定了英國脫歐公投。這個數字是:「英國每周向歐盟提供3.5億英鎊。」英國脫歐倡導者鮑里斯·詹森(Boris Johnson)甚至開著一輛側面印有這句話的「戰鬥巴士」環遊了英國。這是一句十足的謊言。在這本關於真相的書中,我不想對此進行更多討論。

不過,其他一些更加真實的數字得到了巧妙的使用,以便誤導大眾。財政大臣喬治·奧斯本(George Osborne)用一個極為驚人的數字支持了「留歐派」。財政部發布了一份預測報告,稱如果脫離歐盟,英國2030年的國內生產總值將比留在歐盟低6%。奧斯本的新聞稿是這樣寫的:「如果英國投票退出歐盟,英國每個家庭每年將損失4300英鎊。」

這有什麼問題呢?首先,奧斯本的新聞稿使人覺得英國將比目前更加糟糕。實際上,財政部的預測顯示,不管是否脫離歐盟,英國2030年的國內生產總值都要比現在高得多。更加完整誠實的標題應該是這樣的:「英國將比它本應面臨的情況糟糕一些,但它仍然會好於現在。」

還有家庭的問題。新聞稿暗示,每個英國家庭的支出將會減少4 300英鎊。雖然它沒有這樣說,但是解讀這份新聞稿的報紙的確是這樣說的。不過,財政部在分析中談論的並不是家庭收入——國內生產總值是一個完全不同的怪物,因為它包括公司投資和政府支出等因素。英國2015年有2?700萬家庭,國內生產總值為1.869萬億英鎊,平均每個家庭的國內生產總值超過6.9萬英鎊。2014—2015年的家庭可支配收入中值只有這個數字的1/3多一點,為25?700英鎊。顯然,家庭平均國內生產總值這一概念本身毫無意義。喬治·奧斯本及其財政部團隊完全清楚所有這些事情。他們的標題是真實的,但它卻是一個故意誤導大眾的真相。

數字策略之三:隱藏或誇大趨勢

在圖表上,誤導者可以改變圖像的標度,或者使用不是從0開始的軸線,從而改變真相。當你在有利的軸線上描繪數據時,下降趨勢可以顯得很平坦,不明顯的增長也可以顯得很突出。如果你所在地區可用醫院床位的數量從15 134增加到15 326,這種1%的平凡增長在縱軸始於15 000的圖像上將會成為一項令人矚目的成就。

在尷尬的投資人會議上,你可以用累計銷售圖像掩蓋主打產品糟糕的銷售數字——你可以展示產品的總銷量,而不是今年的銷量。對誤導者來說,累計圖像的好處在於,它不會下降。你今年的累計銷量不可能低於去年,除非你執行了非常寬鬆的退貨政策。蘋果總裁蒂姆·庫克(Tim Cook)2013年展示了「蘋果手機累計銷售」圖表,從而隱藏了兩個季度的銷售下降。他在一個月後對平板電腦銷量進行了同樣的操作,因為平板電腦銷量也下降了兩個季度。石英商業新聞網站總結道:「蘋果要麼不善於設計圖表,要麼認為你不會注意到這種區別。」

石英網上有一張可愛的曲線圖,描繪了1820年以來海盜人數的下降和全球平均溫度的上升。這種關聯很神秘:隨著海盜人數的下降,世界變得更加溫暖。顯然,公海犯罪行為的減少推動了洲際貿易,導致全球變暖!

這個結論當然很可笑。傻瓜都能看出來,這個邏輯應該顛倒過來:溫度上升導致船上的朗姆酒蒸發,削弱了海盜的士氣,促使他們從事更加本分的行業。

上面這段可笑的分析告訴我們,兩組數據表面上的關聯並不意味著它們存在某種因果關係。有人注意到,海濱度假區銷售的冰激凌越多,溺水的人似乎就越多。這並不意味著冰激凌會導致致命的痙攣。當天氣暖和時,人們喜歡吃冰激凌。當天氣較好時,人們還喜歡游泳。冰激凌消費和溺水事件的增長沒有因果關係,二者都是由第三個因素導致的。

數字策略之四:挑選統計量

均值還存在其他狡猾之處。許多父母關心孩子所在班級的規模,他們通常喜歡小班,因為老師有更多時間照顧每個孩子。所以,政客們熱衷於證明班級的平均規模很小。不過,這並不意味著大多數孩子都在小班裡。

為說明這一違反直覺的現象,想像你們鎮上只有兩個班級。一個班有10個孩子,另一個班有50個孩子。班級規模的均值是30,這聽上去不錯。不過,大多數孩子都在50人的班裡。所以,平均而言,一個孩子很可能在50人的班裡。更準確地說,每個孩子所在班級的人數均值是43多一點。

所以,當政客真實地談論一個州或國家的平均班級規模時,這個數字低於一個孩子所在班級的平均人數。同樣的技巧也適用於過度擁擠的監獄、火車、醫院等。國家或州的均值總會低估普通人的經歷。

考慮下面的謎題。當一個頭髮長度超過平均值的男人走進酒吧時,酒吧里的頭髮長度平均值卻下降了。這是怎麼回事?

這個謎題很簡單,但它體現了一個被稱為「辛普森悖論」的統計學問題。它的問題在於,同樣的數字可以傳達兩個完全不同的真相。在回答謎題之前,讓我們考慮現實中的一個例子。

2000年到2012年,調整通脹因素後的美國工資中位數上升了0.9%。這似乎是一個好消息。不過,在同一時期,高中輟學生的工資中位數下降了7.9%,高中畢業生的工資中位數下降了4.7%,大學生的工資中位數下降了7.6%,至少擁有一個學位的群體的工資中位數下降了1.2%。簡單地說,美國每個經濟群體的工資都下降了,但總體平均數卻出現了上升。

這就是它被稱為悖論的原因。

回到謎題上來。答案取決於「頭髮長度超過平均值」意味著什麼。我們談論的不是所有人口的「平均值」。我們是說,這個男人的頭髮長度超過了男性群體的平均值。當然,酒吧里有男有女,新來者的頭髮長度比不上女性平均值。酒吧里男性子群體的頭髮長度平均值增加了,女性子群體的平均值保持不變,總體平均值出現了下降。

辛普森悖論的關鍵是識別群體和子群體的差異。

謊言,該死的謊言和統計學

常言道:「世界上有三種謊言,謊言、該死的謊言、統計學。」在衛生、政治、投資、教育和其他許多領域,我們依靠統計量做出合適的選擇。統計量不是謊言。不過,作為真相,它們比單純的數字更容易受到操縱。

對於統計量的操縱似乎很常見,因此似乎合情合理。有人會說,如果你天真地相信某個黨派組織公布的數字,那麼你上當也是應該的。問題是,許多人對於數字很頭疼,他們在看到數字時會停止批判性思考。如果政府部門的人拿出一組數字,我們誰會質疑它們呢?如果相互對立的智庫向我們展示相互矛盾的數字,我們如何確定哪組數字代表了更大的真相呢?

我們對世界的理解取決於我們如何測量世界。我們的理解反過來又決定了我們的選票、行動和態度。數字很重要。我們一定不能失去對於數字的信任。不過,我們需要更好地解讀數字,並在誤導者用數字真相對我們說謊時要求他們承擔責任。

文 | 赫克托·麥克唐納