“一项实用研究发现,人们的性取向可以通过手指的长度来判断”是最近的一条标题,该文章基于埃塞克斯大学备受尊敬的研究人员在《性行为档案》上发表的一项同行评议研究,该杂志是人类性行为领域的领先学术出版物。 但以我这个统计专家的眼光来看,这完全是一派胡言。 就在新闻消费者似乎开始变得聪明起来——记得询问科学是否“经过同行评审”,样本量是否足够大,或者谁资助了这项研究——的时候,一个出乎意料的故事出现了。在这种情况下,一个快速的新闻以置信区间的形式出现,这是一个统计学主题,任何外行人都不应该费力去理解一篇新闻文章。 但不幸的是,对于那些讨厌数字的人来说,如果你不想被那些夸大其词、夸大其词或毫无价值的研究所欺骗,我们必须讨论一些统计原则,即使所有的“合法研究”框都被勾选,这些原则仍然可能让你犯错。 我的真正风险是什么?我读过的最令人沮丧的标题之一是“八年研究发现,大量食用炸薯条的人死亡风险‘增加一倍’。”“呃,”我大声说道,一边喝着一杯红酒,面前摆着一大篮金黄的炸薯条。真的吗? 是的,根据《美国临床营养学杂志》发表的一项同行评议研究,这是真的。吃炸薯条确实会使你的死亡风险增加一倍。但是,吃多少炸薯条,而且,我原来的死亡风险是多少? 研究表明,如果你每周吃三次或三次以上的炸薯条,你的死亡风险将增加一倍。那么让我们以这项研究中的普通人为例:一个 60 岁的男人。无论他吃多少炸薯条,他的死亡风险是多少?百分之一。这意味着如果你把 100 名 60 岁的男人排成一排,其中至少有一人会在明年死亡,仅仅因为他是一名 60 岁的男人。 现在,如果这 100 人一生中每周至少吃三次炸土豆,那么他们的死亡风险就会翻倍。但是 1% 翻倍意味着什么?2%。因此,一年中,这 100 人中死亡的将不是一个人,而是两个人。而且他们一生中每周可以吃三次或更多次炸土豆——这听起来像是我愿意承担的风险。 这是一个统计概念,称为相对风险。如果患上某种疾病的几率是十亿分之一,那么即使你患病的风险增加四倍,你的风险仍然只有十亿分之四。这是不会发生的。 因此,下次您看到风险增加或减少时,您应该问的第一个问题是“与原始风险相比,风险是增加还是减少?” 另外,这些人是不是和我一样,一边吃炸土豆,一边喝着一杯葡萄酒或一品脱啤酒?罪魁祸首可能是其他东西? 睡前吃奶酪等于被床单缠住而死?婴儿箱已成为政府资助送给新父母的流行礼物,旨在为新生儿提供一个安全的睡眠场所。该倡议源于 20 世纪 30 年代末芬兰发起的一项旨在降低婴儿睡眠相关死亡率的活动。纸箱里有一些必需品:一些尿布、婴儿湿巾、连体衣、乳垫等。 芬兰的婴儿死亡率随着这些婴儿箱的引入而迅速下降,该国目前是世界上婴儿死亡率最低的国家之一。因此,可以合理地假设这些婴儿箱导致婴儿死亡率下降。 但你猜还有什么变化?产前护理。为了有资格领取婴儿箱,妇女必须在怀孕的前四个月开始到卫生诊所就诊。 1944 年,31% 的芬兰母亲接受了产前教育。1945 年,这一比例跃升至 86%。婴儿箱并不是婴儿死亡率变化的原因,而是教育和早期健康检查。 这是相关性不等于因果性的典型案例。婴儿箱的引入和婴儿死亡率的下降是相关的,但两者之间并不是因果关系。 然而,这个小事实并没有阻止婴儿用品公司如雨后春笋般涌现,以 449.99 美元的价格出售诸如“婴儿用品套装:芬兰原版”之类的产品。美国各州还利用税收向新妈妈们发放一个版本。 因此,下次您看到某种联系或关联时(例如,吃奶酪与被床单缠住而死亡有关),您应该问“还有什么原因导致这种情况发生?” 当误差幅度大于效果时美国劳工统计局最新数据显示,全国失业率从 8 月份的 3.9% 下降到 9 月份的 3.7%。在编制这些数据时,劳工统计局显然不会到处询问每个人是否有工作。它只会询问一小部分人,然后将该群体的失业率推广到整个美国。 这意味着官方给出的失业率在任何特定时间都是一个估计值——一个不错的猜测,但终归是猜测。这种“正负误差”由统计学家称为置信区间的东西来定义。 数据实际上表明,全国失业人数似乎减少了 270,000 人,但置信区间的误差幅度为正负 263,000。宣布一个像 270,000 这样的单一数字更容易。但抽样总是有误差的,将单一估计值视为一个范围更为准确。在这种情况下,统计学家认为实际失业人数下降了大约 7,000 人(最低)和 533,000 人(最高)。 这与手指长度定义性研究中发生的问题相同——与这些估计相关的正负误差可以完全否定结果的任何确定性。 置信区间让我们的生活变得混乱的最明显例子就是民意调查。民意调查员会抽取人口样本,询问该样本将投票给谁,然后从中推断出整个人口在选举日会做什么。当竞选势均力敌时,他们对样本的民意调查的正负误差会抵消任何关于谁将获胜的真实信息,从而使竞选“难分胜负”。 因此,下次您看到关于整个人群的数字时,由于不可能询问每个人或测试每个受试者,因此您应该询问正负误差。 了解统计误导的这三个方面是否意味着你永远不会被愚弄?不会。但它们肯定会有所帮助。 利伯蒂·维特特 (Liberty Vittert) 是华盛顿大学统计学客座助理教授。本文最初发表于 The Conversation。 |
众所周知,天气雷达可以探测到成群的蚱蜢、蜻蜓,甚至蝉在天空中飞行。虽然这些大群昆虫不会产生阵雨或雷暴...
IBM 蓝色基因阿贡国家实验室高性能超级计算机可以解决气候科学、航空航天设计、生物医学和粒子物理学中...
伊丽莎白·米勒是一位屡获殊荣的记者,撰写有关野生动物、公共土地和能源开发的文章。她的作品得到了自由调...
英国希望为其军队配备一种新型无人机,这种无人机要足够小,以便士兵可以将其带入战场,并且数量要足够多,...
《猴子魔术》的吸引力与评价《Monkey Magic》是一部电视动画,于1999年12月31日至20...
本周四,夏季第一轮满月将出现在天空。继续阅读,了解为什么有人称这轮满月为超级月亮、它的名字从何而来以...
生成式人工智能程序在根据文本输入构建令人印象深刻的详细视觉图像方面已经做得越来越好,但日本大阪大学的...
经过四年时间,勒蒙 24 小时耐力赛(售价 500 美元的汽车耐力赛)已成为地球上最具竞争力的赛车运...
牛打嗝和胀气对环境有害。牛和公牛排出的气体会产生大量甲烷,这种温室气体在吸收大气热量方面比二氧化碳强...
当然,太空旅行很酷,但标志性的航天器很少看起来像艺术品。设计限制和现实世界的现实使得火箭不像小说中想...
蝙蝠可能具有生态和经济价值,但它们也因传播疾病而臭名昭著,尤其是狂犬病,甚至可能是埃博拉病毒。然而,...
最后,Roomba 有理由感到害怕。上周,高端吸尘器制造商戴森发布了 360 Eye,这是一款使用全...
《该死的生存追逐者》:拉力赛车世界中的赛车刺激与戏剧性■ 公共媒体卵子■ 原创媒体漫画■ 发布日期...
美国宇航局即将迈出重返月球的第一步。该计划的第一阶段,恰如其分地称为阿尔忒弥斯 1 号,计划派遣一架...
Anker PowerHouse。亚马逊如果您要驾车穿越全国、去露营旅行,或者只是想拥有一个可以让...