幾種常見的統計學陷阱

2019-11-12     異璧

首先舉個經典例子:埃塞克斯大學的研究員們,在經過同行評審之後,於研究人類性別取向的權威學術刊物《性行為》上發表論文,論文內容稱「若干研究顯示,人的性取向可由人手指的長度決定。」

從統計學的角度來看,這個觀點就是扯淡。

每當我們以為消費者似乎變得更加聰明的時候——好比說,記得問科學雜誌有沒有經過同行評審,人們卻往往忽視相關研究選擇的實驗基數是否夠大,或是研究的贊助者對研究產生了多大影響,這些因素最終會使得整體研究變得令人無法相信。在上述的案例中,研究採用的置信區間就足以令人生疑。因此,如果沒有具體的關聯數字等等,人們就完全沒必要去關注它。

但很不幸的是,對於那些不喜歡數字的人來說,如果你不想被死氣沉沉的、言過其實的、毫無價值的研究報道所欺騙,以下是幾個常見的統計學陷阱供你參考。話說在前邊,即使是「正統學術研究」也有可能充斥著騙局。

大家肯定都見過這種讓人頭疼的文章標題:「八年研究顯示,食用炸薯條的人死亡率比常人高一倍。」說這話的時候,嚇得我趕緊吃了口薯條、喝了口可樂壓驚。

當然,說得沒錯,相關研究有美國臨床營養學雜誌背書,肯定假不了。但接下來幾個問題才是重點:吃多少薯條會讓你的死亡風險翻倍?死亡風險的來源又是啥呢?基礎死亡率又是多少呢?

研究里說,如果你每周吃三次以上的炸薯條,你的死亡風險會加倍。因此,我們用這個研究當中出現的被試進行舉例:一位六十歲的男性。那麼,不考慮炸薯條,六十歲男性的死亡風險是多少呢?1%。這也就是說,如果你隨便找100個六十歲的男性過來,其中至少有一個第二年會去世。

那麼,如果讓這100個人終生每周都吃三次以上的炸薯條,那麼他們的死亡率會翻倍。1%翻倍是多少呢?是2%。因此,這100位老兄里,在第二年中,會有兩個人去世。但至少他們能夠終生享用炸薯條了。反正肯定有人樂意這樣做。

在統計學中,有個專門的概念來形容這一情況:相對風險。如果患某種疾病的機率是10億分之一,那麼即使這一機率翻了四倍,它仍然只有10億分之四而已。換句話說,它是不會發生的。

因此,當你再一次看見什麼研究說幾率增加時,首先你應該問的問題是:在什麼基礎之上增加的幾率?

咱們實話實說吧,難道真的有人能永遠戒掉薯條、可樂嗎?就算可以,難道就不會有別的消遣了嗎?

打個岔,再舉個例子:睡覺前吃奶酪有可能會導致睡眠中被床單勒死。

各個國家會給每個新生家庭提供嬰兒箱,這一舉動既贈送了一種時髦的禮品,同時還能幫助年輕爸爸媽媽們給孩子提供一個安全的地方睡覺。最先做出這一舉動的國家是芬蘭。芬蘭從1930年前後開始採用了這一措施,有效降低了嬰幼兒的與睡眠有關的死亡率。嬰兒箱裡包含這麼幾種東西:尿布,嬰兒濕巾,嬰兒連體衣,乳墊等等。

在芬蘭向新生嬰兒家庭提供嬰兒箱之後,當地的嬰兒死亡率急劇下降,直到今天,芬蘭的嬰兒死亡率也是全世界最低的。因此如果說,使用了嬰兒箱,使得嬰兒死亡率迅速下降,這個說法看起來是合情合理的。

但除了嬰兒箱之外,還有啥發生變化了嗎?產前護理也得到了改善。為了能夠有資格申請嬰兒箱,芬蘭的女性被要求在生產前四個月開始定期進行醫護檢查。

1944年,31%的芬蘭母親們接受了產前培訓。1945年,這個數字變成了86%。實際上,嬰兒死亡率的下降並不是由於嬰兒箱的使用才實現的,真正的功臣實際上是產前培訓、孕期早期體檢。

這個案例解釋了一個經典的統計學偏差:相關,並不代表因果。引入嬰兒箱與嬰兒死亡率下降確實相關,但這二者之間並不存在因果關係。

但這一事實並不會使嬰兒箱公司大肆打廣告、售賣嬰兒箱。他們打著「源自芬蘭的嬰兒箱」的旗號,每個嬰兒箱「僅售」449.99美刀(基本上是iPhone8的價格了)。但新媽媽們還是樂此不疲地把大把鈔票塞給他們。

因此,當你在看到之前所說的那個打岔:睡前奶酪與睡眠中被床單勒死這樣的標題時,你應該多花點心思想一想:還有什麼可能會導致這個結果?

最近,勞工統計局公布了一組數據,稱9月份失業率從3.9%下降至3.7%。顯然,勞工統計局不可能挨個問所有的工人「你有工作嗎」,他們選擇的是抽樣法。從所有人口中抽取一個小樣本,再根據小樣本中的失業率推廣到所有人口。

*在此條形圖中,棕色條的頂端表示觀察到的均值,紅色線段(「誤差條」)表示其周圍的置信區間。

儘管誤差線顯示為均值對稱,但並非總是如此。

還必須注意,在大多數圖中,誤差線並不代表置信區間(例如,它們通常代表標準誤差或標準偏差)。

因此這也就是說,官方機構提供的失業率數據是估算值——很努力地猜數字,但仍然也只不過是猜的。這種「上下浮動的錯誤區間」在統計學中叫「置信區間」。

實際上,他們提供的數據說的是,全國範圍內的失業人口數量減少了27萬人——但這個數字存在一定誤差,也就是置信區間,上下浮動26萬3千人。顯然,直接說27萬人這個數字會容易理解的多。在這個具體案例中,由於數字是估算而來,因此必定會存在一定的誤差。所以失業人口數量減少的實際範圍是:最少7000人、最多53萬3千人。

這種偏差和文章開頭提到的性取向與手指長度異曲同工——過大的誤差空間,將會嚴重影響研究本身的可信性。

在實際生活中,最能體現置信區間對我們影響的案例,就是投票。民意調查者們從總人口中選取一定的比例,向這些人提問會投給誰,然後就把得到的結果推導成全國人口在投票日可能會做出的投票選擇。當選期變得膠著時,由於民意調查的置信區間過大,因此實際上他們無法判斷出誰會是最後的贏家,也就無法做出正確的預測。

因此當你再在生活中看到所謂的「覆蓋人口的XX百分比」時,首先應當保持理智,要清楚的認識到這個所謂的百分比必然存在著誤差,接下來你要做的就是去查看相應的置信區間,也就是上下浮動的具體範圍。

知道這幾種統計學陷阱,就能保證你在生活中不會上當嗎?不可能的。但多少會有點幫助。

以及,別忘了,「多或少」也存在著浮動偏差。

文章內容基於知識共享協議編譯。文中圖片除特別註明外,均來源於免版權網站,已保留原圖地址。

文中任何內容如涉及侵權請聯繫後台處理。

轉載請註明出處。

【覺得文章內容有趣?歡迎關注】

文章來源: https://twgreatdaily.com/zh-sg/IpSwYW4BMH2_cNUgYfhn.html