首先举个经典例子:埃塞克斯大学的研究员们,在经过同行评审之后,于研究人类性别取向的权威学术刊物《性行为》上发表论文,论文内容称“若干研究显示,人的性取向可由人手指的长度决定。”
从统计学的角度来看,这个观点就是扯淡。
每当我们以为消费者似乎变得更加聪明的时候——好比说,记得问科学杂志有没有经过同行评审,人们却往往忽视相关研究选择的实验基数是否够大,或是研究的赞助者对研究产生了多大影响,这些因素最终会使得整体研究变得令人无法相信。在上述的案例中,研究采用的置信区间就足以令人生疑。因此,如果没有具体的关联数字等等,人们就完全没必要去关注它。
但很不幸的是,对于那些不喜欢数字的人来说,如果你不想被死气沉沉的、言过其实的、毫无价值的研究报道所欺骗,以下是几个常见的统计学陷阱供你参考。话说在前边,即使是“正统学术研究”也有可能充斥着骗局。
大家肯定都见过这种让人头疼的文章标题:“八年研究显示,食用炸薯条的人死亡率比常人高一倍。”说这话的时候,吓得我赶紧吃了口薯条、喝了口可乐压惊。
当然,说得没错,相关研究有美国临床营养学杂志背书,肯定假不了。但接下来几个问题才是重点:吃多少薯条会让你的死亡风险翻倍?死亡风险的来源又是啥呢?基础死亡率又是多少呢?
研究里说,如果你每周吃三次以上的炸薯条,你的死亡风险会加倍。因此,我们用这个研究当中出现的被试进行举例:一位六十岁的男性。那么,不考虑炸薯条,六十岁男性的死亡风险是多少呢?1%。这也就是说,如果你随便找100个六十岁的男性过来,其中至少有一个第二年会去世。
那么,如果让这100个人终生每周都吃三次以上的炸薯条,那么他们的死亡率会翻倍。1%翻倍是多少呢?是2%。因此,这100位老兄里,在第二年中,会有两个人去世。但至少他们能够终生享用炸薯条了。反正肯定有人乐意这样做。
在统计学中,有个专门的概念来形容这一情况:相对风险。如果患某种疾病的概率是10亿分之一,那么即使这一概率翻了四倍,它仍然只有10亿分之四而已。换句话说,它是不会发生的。
因此,当你再一次看见什么研究说几率增加时,首先你应该问的问题是:在什么基础之上增加的几率?
咱们实话实说吧,难道真的有人能永远戒掉薯条、可乐吗?就算可以,难道就不会有别的消遣了吗?
打个岔,再举个例子:睡觉前吃奶酪有可能会导致睡眠中被床单勒死。
各个国家会给每个新生家庭提供婴儿箱,这一举动既赠送了一种时髦的礼品,同时还能帮助年轻爸爸妈妈们给孩子提供一个安全的地方睡觉。最先做出这一举动的国家是芬兰。芬兰从1930年前后开始采用了这一措施,有效降低了婴幼儿的与睡眠有关的死亡率。婴儿箱里包含这么几种东西:尿布,婴儿湿巾,婴儿连体衣,乳垫等等。
在芬兰向新生婴儿家庭提供婴儿箱之后,当地的婴儿死亡率急剧下降,直到今天,芬兰的婴儿死亡率也是全世界最低的。因此如果说,使用了婴儿箱,使得婴儿死亡率迅速下降,这个说法看起来是合情合理的。
但除了婴儿箱之外,还有啥发生变化了吗?产前护理也得到了改善。为了能够有资格申请婴儿箱,芬兰的女性被要求在生产前四个月开始定期进行医护检查。
1944年,31%的芬兰母亲们接受了产前培训。1945年,这个数字变成了86%。实际上,婴儿死亡率的下降并不是由于婴儿箱的使用才实现的,真正的功臣实际上是产前培训、孕期早期体检。
这个案例解释了一个经典的统计学偏差:相关,并不代表因果。引入婴儿箱与婴儿死亡率下降确实相关,但这二者之间并不存在因果关系。
但这一事实并不会使婴儿箱公司大肆打广告、售卖婴儿箱。他们打着“源自芬兰的婴儿箱”的旗号,每个婴儿箱“仅售”449.99美刀(基本上是iPhone8的价格了)。但新妈妈们还是乐此不疲地把大把钞票塞给他们。
因此,当你在看到之前所说的那个打岔:睡前奶酪与睡眠中被床单勒死这样的标题时,你应该多花点心思想一想:还有什么可能会导致这个结果?
最近,劳工统计局公布了一组数据,称9月份失业率从3.9%下降至3.7%。显然,劳工统计局不可能挨个问所有的工人“你有工作吗”,他们选择的是抽样法。从所有人口中抽取一个小样本,再根据小样本中的失业率推广到所有人口。
*在此条形图中,棕色条的顶端表示观察到的均值,红色线段(“误差条”)表示其周围的置信区间。
尽管误差线显示为均值对称,但并非总是如此。
还必须注意,在大多数图中,误差线并不代表置信区间(例如,它们通常代表标准误差或标准偏差)。
因此这也就是说,官方机构提供的失业率数据是估算值——很努力地猜数字,但仍然也只不过是猜的。这种“上下浮动的错误区间”在统计学中叫“置信区间”。
实际上,他们提供的数据说的是,全国范围内的失业人口数量减少了27万人——但这个数字存在一定误差,也就是置信区间,上下浮动26万3千人。显然,直接说27万人这个数字会容易理解的多。在这个具体案例中,由于数字是估算而来,因此必定会存在一定的误差。所以失业人口数量减少的实际范围是:最少7000人、最多53万3千人。
这种偏差和文章开头提到的性取向与手指长度异曲同工——过大的误差空间,将会严重影响研究本身的可信性。
在实际生活中,最能体现置信区间对我们影响的案例,就是投票。民意调查者们从总人口中选取一定的比例,向这些人提问会投给谁,然后就把得到的结果推导成全国人口在投票日可能会做出的投票选择。当选期变得胶着时,由于民意调查的置信区间过大,因此实际上他们无法判断出谁会是最后的赢家,也就无法做出正确的预测。
因此当你再在生活中看到所谓的“覆盖人口的XX百分比”时,首先应当保持理智,要清楚的认识到这个所谓的百分比必然存在着误差,接下来你要做的就是去查看相应的置信区间,也就是上下浮动的具体范围。
知道这几种统计学陷阱,就能保证你在生活中不会上当吗?不可能的。但多少会有点帮助。
以及,别忘了,“多或少”也存在着浮动偏差。
文章内容基于知识共享协议编译。文中图片除特别注明外,均来源于免版权网站,已保留原图地址。
文中任何内容如涉及侵权请联系后台处理。
转载请注明出处。
【觉得文章内容有趣?欢迎关注】