メールフォーマットエラー
emailCannotEmpty
emailDoesExist
pwdLetterLimtTip
inconsistentPwd
pwdLetterLimtTip
inconsistentPwd
一个笑话
学校组织郊游,老师问:没来的同学举个手,好,人齐了,我们出发吧!
这种一听就知道统计有问题,只拿到的同学来做统计,显然是有问题的。
这种现象叫做 幸存者偏差,来源下面的案例
1941年,第二次世界大战中,空军是最重要的兵种之一,盟军的战机在多次空战中损失严重,无数次被纳粹炮火击落,盟军总部秘密邀请了一些物理学家、数学家以及统计学家组成了一个小组,专门研究“如何减少空军被击落概率”的问题。
当时军方的高层统计了所有返回的飞机的中弹情况——发现飞机的机翼部分中弹较为密集,而机身和机尾部分则中弹较为稀疏,于是当时的盟军高层的建议是:加强机翼部分的防护。
但这一建议被小组中的一位来自哥伦比亚大学的统计学教授——沃德(Abraham Wald)驳回了,沃德教授提出了完全相反的观点——加强机身和机尾部分的防护。
那么这位统计学家是如何得出这一看似不够符合常识的结论的呢?沃德教授的基本出发点基于三个事实是:
统计的样本只是平安返回的战机;
被多次击中机翼的飞机,似乎还是能够安全返航;
而在机身机尾的位置,很少发现弹孔的原因并非真的不会中弹,而是一旦中弹,其安全返航的机率极小,即返回的飞机是幸存者,仅仅依靠幸存者做出判断是不科学的,那些被忽视了的非幸存者才是关键,他们根本没有回来!
军方采用了教授的建议,加强了机尾和机身的防护,并且后来证实该决策是无比正确的,盟军战机的击落率大大降低,这就是“幸存者偏差”故事的来源。
大家做一个分析判断时候
判断样本的随机性,即必须知道样本是否是随机的。
判断样本和剩余样本中会不会存在显著差异。
分析剩余样本数据,验证结论。