如何识别新闻中的误导性统计数据

如何识别新闻中的误导性统计数据

“一项实用研究发现,人们的性取向可以通过手指的长度来判断”是最近的一条标题,该文章基于埃塞克斯大学备受尊敬的研究人员在《性行为档案》上发表的一项同行评议研究,该杂志是人类性行为领域的领先学术出版物。

但以我这个统计专家的眼光来看,这完全是一派胡言。

就在新闻消费者似乎开始变得聪明起来——记得询问科学是否“经过同行评审”,样本量是否足够大,或者谁资助了这项研究——的时候,一个出乎意料的故事出现了。在这种情况下,一个快速的新闻以置信区间的形式出现,这是一个统计学主题,任何外行人都不应该费力去理解一篇新闻文章。

但不幸的是,对于那些讨厌数字的人来说,如果你不想被那些夸大其词、夸大其词或毫无价值的研究所欺骗,我们必须讨论一些统计原则,即使所有的“合法研究”框都被勾选,这些原则仍然可能让你犯错。

好吃吗?Leo/Flickr,CC BY-NC-ND

我的真正风险是什么?

我读过的最令人沮丧的标题之一是“八年研究发现,大量食用炸薯条的人死亡风险‘增加一倍’。”“呃,”我大声说道,一边喝着一杯红酒,面前摆着一大篮金黄的炸薯条。真的吗?

是的,根据《美国临床营养学杂志》发表的一项同行评议研究,这是真的。吃炸薯条确实会使你的死亡风险增加一倍。但是,吃多少炸薯条,而且,我原来的死亡风险是多少?

研究表明,如果你每周吃三次或三次以上的炸薯条,你的死亡风险将增加一倍。那么让我们以这项研究中的普通人为例:一个 60 岁的男人。无论他吃多少炸薯条,他的死亡风险是多少?百分之一。这意味着如果你把 100 名 60 岁的男人排成一排,其中至少有一人会在明年死亡,仅仅因为他是一名 60 岁的男人。

现在,如果这 100 人一生中每周至少吃三次炸土豆,那么他们的死亡风险就会翻倍。但是 1% 翻倍意味着什么?2%。因此,一年中,这 100 人中死亡的将不是一个人,而是两个人。而且他们一生中每周可以吃三次或更多次炸土豆——这听起来像是我愿意承担的风险。

这是一个统计概念,称为相对风险。如果患上某种疾病的几率是十亿分之一,那么即使你患病的风险增加四倍,你的风险仍然只有十亿分之四。这是不会发生的。

因此,下次您看到风险增加或减少时,您应该问的第一个问题是“与原始风险相比,风险是增加还是减少?”

另外,这些人是不是和我一样,一边吃炸土豆,一边喝着一杯葡萄酒或一品脱啤酒?罪魁祸首可能是其他东西?

睡前吃奶酪等于被床单缠住而死?

婴儿箱已成为政府资助送给新父母的流行礼物,旨在为新生儿提供一个安全的睡眠场所。该倡议源于 20 世纪 30 年代末芬兰发起的一项旨在降低婴儿睡眠相关死亡率的活动。纸箱里有一些必需品:一些尿布、婴儿湿巾、连体衣、乳垫等。

新生儿到来前的芬兰“孕妇礼包”内容。Visa Kopu/Flickr,CC BY-NC-ND

芬兰的婴儿死亡率随着这些婴儿箱的引入而迅速下降,该国目前是世界上婴儿死亡率最低的国家之一。因此,可以合理地假设这些婴儿箱导致婴儿死亡率下降。

但你猜还有什么变化?产前护理。为了有资格领取婴儿箱,妇女必须在怀孕的前四个月开始到卫生诊所就诊。

1944 年,31% 的芬兰母亲接受了产前教育。1945 年,这一比例跃升至 86%。婴儿箱并不是婴儿死亡率变化的原因,而是教育和早期健康检查。

这是相关性不等于因果性的典型案例。婴儿箱的引入和婴儿死亡率的下降是相关的,但两者之间并不是因果关系。

然而,这个小事实并没有阻止婴儿用品公司如雨后春笋般涌现,以 449.99 美元的价格出售诸如“婴儿用品套装:芬兰原版”之类的产品。美国各州还利用税收向新妈妈们发放一个版本。

因此,下次您看到某种联系或关联时(例如,吃奶酪与被床单缠住而死亡有关),您应该问“还有什么原因导致这种情况发生?”

当误差幅度大于效果时

美国劳工统计局最新数据显示,全国失业率从 8 月份的 3.9% 下降到 9 月份的 3.7%。在编制这些数据时,劳工统计局显然不会到处询问每个人是否有工作。它只会询问一小部分人,然后将该群体的失业率推广到整个美国。

这意味着官方给出的失业率在任何特定时间都是一个估计值——一个不错的猜测,但终归是猜测。这种“正负误差”由统计学家称为置信区间的东西来定义。

数据实际上表明,全国失业人数似乎减少了 270,000 人,但置信区间的误差幅度为正负 263,000。宣布一个像 270,000 这样的单一数字更容易。但抽样总是有误差的,将单一估计值视为一个范围更为准确。在这种情况下,统计学家认为实际失业人数下降了大约 7,000 人(最低)和 533,000 人(最高)。

这与手指长度定义性研究中发生的问题相同——与这些估计相关的正负误差可以完全否定结果的任何确定性。

置信区间让我们的生活变得混乱的最明显例子就是民意调查。民意调查员会抽取人口样本,询问该样本将投票给谁,然后从中推断出整个人口在选举日会做什么。当竞选势均力敌时,他们对样本的民意调查的正负误差会抵消任何关于谁将获胜的真实信息,从而使竞选“难分胜负”。

因此,下次您看到关于整个人群的数字时,由于不可能询问每个人或测试每个受试者,因此您应该询问正负误差。

了解统计误导的这三个方面是否意味着你永远不会被愚弄?不会。但它们肯定会有所帮助。

利伯蒂·维特特 (Liberty Vittert) 是华盛顿大学统计学客座助理教授。本文最初发表于 The Conversation。

<<:  无需请电工即可在插座上添加 USB 端口

>>:  设置安全的私人电子邮件服务器并不像听起来那么难

推荐阅读

双层! Doug & Kirill EXTRA - 深入评论和建议要点

双层! Doug & Kirill EXTRA - 深入评论和综合指南■ 公共媒体网络■ 原...

科学家们可能已经通过将巨型原木绑在额头上来解决了一个古老的普韦布洛之谜

新墨西哥州的查科峡谷拥有西半球最令人印象深刻的前哥伦布时期建筑。这里的宽阔道路、圆形的祭祀场所(称为...

Anker 鼠标 30% 折扣,今日其他优惠

如需了解更多交易和产品信息,请查看我们的专属 Facebook 群组。...

土耳其和叙利亚发生强烈地震后救援工作正在进行

周一黎明前,土耳其和叙利亚部分地区发生 7.8 级地震。数百栋建筑倒塌,至少 35,000 人丧生。...

经过人工智能训练的人工智能会产生大量乱码垃圾

众所周知,OpenAI 和 Google 提供的大型语言模型需要大量的训练数据才能发挥作用。这些模型...

2021 年阵亡将士纪念日最佳促销:小工具、烤架等

2021 年阵亡将士纪念日是什么时候?今年的阵亡将士纪念日是 5 月 31 日星期一。这是一个纪念日...

这个超大质量黑洞吸力巨大

黑洞仍然是宇宙中最神秘的物体之一,但过去几年来,天文学家已经开发出直接对这些强大真空进行成像的技术。...

《3D DINOSAURS II Dinky DINOSAURS》的魅力与评价:以3D形式体验小恐龙的冒险

“3D DINOSAURS Ⅱ Dinky DINOSAURS”——以 3D 形式体验恐龙世界的全新...

《THE八犬传》的魅力与评价:古典文学在现代的再解读

《THE 八犬传》综合评论与推荐概述《八犬传》是1990年至1991年以OVA形式发售的动画系列。原...

南极企鹅正在死于 H5N1 禽流感病毒

科学家证实,一些南极企鹅物种首次死于一种名为 H5N1 的传染性高致病性禽流感病毒。H5N1 病毒于...

我们经常不小心吃到的令人难以置信的恶心食物

每晚会吞下八只蜘蛛的说法是一派胡言,互联网早期流行的一系列随机“事实”使之流行起来。然而,这个令人反...

3 件可以利用重复使用的面具制作的万圣节服装

如果你和你的家人在疫情期间选择使用一次性口罩,那么你很可能已经用过很多了。即使是布口罩也会随着时间而...

《远野与一笑》漫画同捆版的魅力与评价

《远野与一笑漫画合集》:展现战国武将新魅力的喜剧动画■ 公共媒体卵子■ 原创媒体漫画■ 发布日期20...

如何录音

当您进行重要采访或观察朋友对某则新闻的反应时,您可能希望保留该对话的记录以供后人参考。幸运的是,一些...

氢燃料可能会改变飞机的工作方式和外观

上个月,空客宣布计划对一架 A380 客机进行大修,在飞机外部增加一台氢燃料发动机并安装监控设备。通...