统计的另一种陷阱

猎手前不久写过一篇《统计陷阱》之“相关关系与因果关系”。指出某些统计的结论本质上是与统计数据没有必然的因果关系,甚至没有相关关系。

我要说的另一种统计的陷阱。

中午看新闻时,又看到在说关于婚检的事,还是那一套老调子:强制婚检取消以后,某地新生婴儿的缺陷率上升了多少多少个百分点。起初我是很相信这些的,问题是这种话说多了,就感觉出有些漏洞了。

婚检和新生儿缺陷之间的确是有因果关系的:因为没去婚检,所以有些不适合生育的人生了孩子,而这些人的下一代具有更高的缺陷可能性,最终导致新生儿缺陷率上升。

但是反过来想一下就发现,这样的报道很片面。新生儿缺陷并不是完全由遗传因素决定,而且就算是与遗传有关的缺陷,也并非与婚检有完全的关系。公布这种统计结果的同时,他们显然有意隐藏了几个问题:

强制婚检时期,婚检的不通过率是多少?因为那时很多地方的婚检都是走过场,收了钱就完事,那么如果现在的新生儿缺陷率上升幅度大于以前的婚检不通过率,那么之间的差值便不能算在自愿婚检的头上。

再看看从取消强制婚检到现在,各种可能导致遗传的疾病的普遍发病率是多少?前后相比有没有上升?比如这几年来不健康的生活方式导致的遗传性性病艾滋病的感染率上升对新生儿缺陷会带来多少的影响?

还有这些年来工业等方面发展带来的环境污染,以及现代人工作压力增大等因素对健康带来的影响,特别是孕期对胎儿的影响有没有计算进去?

……

把这些因素都考虑进去,再来分析婚检的影响才是客观科学的。

但是他们就算是知道这些,也不会这么做。就像猎手引用的那篇学历与上网时间的关系的统计一样。他们要的就是这样的结论!

如李敖说的民众与政府的关系,二者的力量是不对等的,拿大刀长矛对坦克车是没有胜算的。而面对一个完全掌握了舆论媒体和教育系统的力量谈民主也是没有胜算的。民众就是这么容易地就可以被愚弄——这还是假设他们用的真实的统计数据。

5 Replies to “统计的另一种陷阱”

  1. 这就是信息不对称强势者掌握了更多的信息并且控制信息发布以获得对自己有利的结果增加市场的交易成本信息披露应该 诚实 充分又绕到经济学汗我走……

  2. 如果能够收集足够的背景数据的话,有些偏差应该是可以消除的。最重要的是相关因素和决定是否婚检之间的概率关系:如果能够把和决定是否婚检有关的背景资料全部收集齐,那么同样背景的人婚检与否就是完全随机的了。Causal Inference一直是统计里一个很重要的研究课题,但是科普得不够,有时记者写的这种文章和荒谬的结论,倒未必是故意隐藏或者误导,只是不了解相关和因果之间的关系。

Leave a Reply

Your email address will not be published. Required fields are marked *