百度百科「幸存者偏差」中关于二战飞机的例子,前后解释有些矛盾,是怎么回事?
我在百度百科上看到的“幸存者偏差“,用了二战空战举例子,可是我觉得百度百科上的解释有些前后矛盾,有心者可以看看那个百科,开头也是用空战举例子,中间也是用空战举例子,可是说法却不一样。我有点看不懂了,希望谁能真正解释一下什么是“幸存者偏差”,谢谢。
按投票排序按时间排序
27 个回答
(建议先阅读周祚的答案,以及程毅南的答案,因为这篇答案是在知友讨论的基础上写的。)
现在讨论方向变成了「这个故事是不是鸡汤段子」「飞机的罩门到底是肚子还是翅膀」?
故事里的专家要哭了:快别编排我了,读读爷爷七十年前的论文再说…
我们来看这篇 1943 年的论文吧。
论文背景是,二战时,从战火中返航的飞机的伤痕呈现某种规律,有的部位中弹多,有的部位中弹少。为了提高飞机的防御力,直觉上似乎应该在弹孔密集处加强装甲。
不过这位专家说:到底哪里最需要防护,直觉说了不算,我算给你看。
(Cameron Moll 画的示意图)
这位专家是匈牙利裔犹太人,后来去美国做研究,二战前后达到个人学术成就的顶峰。
此时你是否想起了一头姓冯名诺依曼的超级神犇?
不过这里说的不是冯·诺依曼,而是亚伯拉罕·沃尔德(Abraham Wald)。
沃尔德的名气比冯·诺依曼小一万倍,但在当时神牛辈出的学术圈也不是无名之辈。
诺贝尔奖经济学奖得主,弗里德曼,为美国海军研究炸弹试验方案时,卡在一个统计学问题上。弗里德曼求助犹太老乡沃尔德,问题迎刃而解。战后沃尔德拓展了这个问题,写成专著《序列分析》。
弗里德曼把这段经历写入了自传,称赞道:「他(沃尔德)是一位杰出的统计学家,为统计学做出了创造性的贡献。」
(沃尔德台词:老乡见老乡,风头全抢光!快把话题转回我的论文)
========
沃尔德的论文题目是:
A Method of Estimating Plane Vulnerability Based on Damage of Survivors
一种根据幸存飞机损伤情况推测飞机要害部位的方法。
上图是正文第一页。开篇是定义参数,推出引理,列出数值分析方法等等。
铺垫了五十五页之后,沃尔德开始代入数据,演示如何计算飞机要害处。他用了一组虚构的数据:
400 架飞机参与轰炸行动,返回 359 架。在返回的这些飞机中, 240 架毫发无损, 68 架中弹 1 发,29 架中弹 2 发, 12 架中弹 3 发, 10 架中弹 4 发。另外还已知飞机的各部位面积及各部位中弹次数,其中发动机部位的弹孔分布最稀疏。但对于没回来的飞机是怎么死的一无所知。
我的第一反应是:这道应用题是不是条件不足?
只了解返航的飞机的情况,完全不知道坠毁的飞机哪里中了弹,没有对照,怎么知道哪个部位是要害呢?
沃尔德毕竟是吃这碗饭的,前五十五页也不是白写的。推算结论如下表:
大意是说,根据这组虚构的数据,得出结论,发动机是最要命的地方,被击中一弹,就有 39% 的概率坠毁。
弹孔最稀疏处,恰恰是要害处,因为没怎么被击中要害的飞机才更有机会返航、进入统计样本。这就是「幸存者偏差」,更多描述请阅读 程毅南关于「幸存者偏差」的答案 。
接下来,沃尔德马上推出升级版算法:只要知道返回的飞机何处中了何种子弹,我就可以算出飞机不同部位被不同武器击中之后的坠毁概率!此处使用的数据仍是虚构的,只为演示算法,结论如下:
沃尔德根据虚构的数据算出:
1. 飞机最怕被20毫米机炮击中发动机,挂掉的概率是 53.4% ;
2. 第二危险的是被7.9毫米机枪击中驾驶舱,有 19.4% 的概率坠毁;
3. 综合来说,发动机是最致命的地方;
4. 综合来说,被20毫米机炮击中掉血最多。
或许有人会说:我用膝盖都能想到发动机和驾驶舱是要害,还要你算给我看?更不用说你的数据还是虚构的了。
不过我的想法是,设计飞机的人不会没有考虑到发动机和驾驶舱的重要性,或许已经给予了充分甚至过分的保护了呢?加厚装甲的代价是损失飞行灵活性,不是想加就加的。
所以在这点上我同意 @欲三更 所说的,凭常识是不足以判断飞机哪里需要加固的。有了计算方法,我们才有办法知道对要害的保护有没有矫枉过正,有没有暴露出新的要害。
========
沃尔德的论文链接:http://cna.org/sites/default/files/research/0204320000.pdf
今人对此文的分析:http://people.ucsc.edu/~msmangel/Wald.pdf
这篇 1943 年的论文的实用价值在于:战场上我们很难找回坠毁的飞机,因而没有办法像 CSI 那样去给飞机验尸,但是不要紧,只要分析返回的飞机,使用统计学方法,就可以推算出那些挂掉的飞机的死因,以助改进飞机的设计。
总之,故事确有真实源头,不过故事中没有提到的是,飞机的要害部位与弹孔分布的关系,不是光凭空口推理的,而是一位优秀的统计学家以平生所学,花了近百页的篇幅,列了一百多个式子推导出来的。
沃尔德的结局令人惋惜。1950 年,四十八岁的他受印度政府邀请,携妻前往印度讲学。不料,航行至印度的尼尔吉里丘陵时,飞机坠毁,沃尔德和妻子都未能成为幸存者。
现在讨论方向变成了「这个故事是不是鸡汤段子」「飞机的罩门到底是肚子还是翅膀」?
故事里的专家要哭了:快别编排我了,读读爷爷七十年前的论文再说…
我们来看这篇 1943 年的论文吧。
论文背景是,二战时,从战火中返航的飞机的伤痕呈现某种规律,有的部位中弹多,有的部位中弹少。为了提高飞机的防御力,直觉上似乎应该在弹孔密集处加强装甲。
不过这位专家说:到底哪里最需要防护,直觉说了不算,我算给你看。
(Cameron Moll 画的示意图)
这位专家是匈牙利裔犹太人,后来去美国做研究,二战前后达到个人学术成就的顶峰。
此时你是否想起了一头姓冯名诺依曼的超级神犇?
不过这里说的不是冯·诺依曼,而是亚伯拉罕·沃尔德(Abraham Wald)。
沃尔德的名气比冯·诺依曼小一万倍,但在当时神牛辈出的学术圈也不是无名之辈。
诺贝尔奖经济学奖得主,弗里德曼,为美国海军研究炸弹试验方案时,卡在一个统计学问题上。弗里德曼求助犹太老乡沃尔德,问题迎刃而解。战后沃尔德拓展了这个问题,写成专著《序列分析》。
弗里德曼把这段经历写入了自传,称赞道:「他(沃尔德)是一位杰出的统计学家,为统计学做出了创造性的贡献。」
(沃尔德台词:老乡见老乡,风头全抢光!快把话题转回我的论文)
========
沃尔德的论文题目是:
A Method of Estimating Plane Vulnerability Based on Damage of Survivors
一种根据幸存飞机损伤情况推测飞机要害部位的方法。
上图是正文第一页。开篇是定义参数,推出引理,列出数值分析方法等等。
铺垫了五十五页之后,沃尔德开始代入数据,演示如何计算飞机要害处。他用了一组虚构的数据:
400 架飞机参与轰炸行动,返回 359 架。在返回的这些飞机中, 240 架毫发无损, 68 架中弹 1 发,29 架中弹 2 发, 12 架中弹 3 发, 10 架中弹 4 发。另外还已知飞机的各部位面积及各部位中弹次数,其中发动机部位的弹孔分布最稀疏。但对于没回来的飞机是怎么死的一无所知。
我的第一反应是:这道应用题是不是条件不足?
只了解返航的飞机的情况,完全不知道坠毁的飞机哪里中了弹,没有对照,怎么知道哪个部位是要害呢?
沃尔德毕竟是吃这碗饭的,前五十五页也不是白写的。推算结论如下表:
大意是说,根据这组虚构的数据,得出结论,发动机是最要命的地方,被击中一弹,就有 39% 的概率坠毁。
弹孔最稀疏处,恰恰是要害处,因为没怎么被击中要害的飞机才更有机会返航、进入统计样本。这就是「幸存者偏差」,更多描述请阅读 程毅南关于「幸存者偏差」的答案 。
接下来,沃尔德马上推出升级版算法:只要知道返回的飞机何处中了何种子弹,我就可以算出飞机不同部位被不同武器击中之后的坠毁概率!此处使用的数据仍是虚构的,只为演示算法,结论如下:
沃尔德根据虚构的数据算出:
1. 飞机最怕被20毫米机炮击中发动机,挂掉的概率是 53.4% ;
2. 第二危险的是被7.9毫米机枪击中驾驶舱,有 19.4% 的概率坠毁;
3. 综合来说,发动机是最致命的地方;
4. 综合来说,被20毫米机炮击中掉血最多。
或许有人会说:我用膝盖都能想到发动机和驾驶舱是要害,还要你算给我看?更不用说你的数据还是虚构的了。
不过我的想法是,设计飞机的人不会没有考虑到发动机和驾驶舱的重要性,或许已经给予了充分甚至过分的保护了呢?加厚装甲的代价是损失飞行灵活性,不是想加就加的。
所以在这点上我同意 @欲三更 所说的,凭常识是不足以判断飞机哪里需要加固的。有了计算方法,我们才有办法知道对要害的保护有没有矫枉过正,有没有暴露出新的要害。
========
沃尔德的论文链接:http://cna.org/sites/default/files/research/0204320000.pdf
今人对此文的分析:http://people.ucsc.edu/~msmangel/Wald.pdf
这篇 1943 年的论文的实用价值在于:战场上我们很难找回坠毁的飞机,因而没有办法像 CSI 那样去给飞机验尸,但是不要紧,只要分析返回的飞机,使用统计学方法,就可以推算出那些挂掉的飞机的死因,以助改进飞机的设计。
总之,故事确有真实源头,不过故事中没有提到的是,飞机的要害部位与弹孔分布的关系,不是光凭空口推理的,而是一位优秀的统计学家以平生所学,花了近百页的篇幅,列了一百多个式子推导出来的。
沃尔德的结局令人惋惜。1950 年,四十八岁的他受印度政府邀请,携妻前往印度讲学。不料,航行至印度的尼尔吉里丘陵时,飞机坠毁,沃尔德和妻子都未能成为幸存者。
是时候体现知乎(相对百度)的先进性了!(握拳!)
幸存者偏倚(Survivorship bias)是一种常见的逻辑谬误(所以我说叫“谬误”而不是“偏差”),意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。
空战的例子这样解释:简单来说,专家根据返航飞机翼部和尾部等位置中弹最多的特点,判断出,如果要强化飞机装甲,应该强化翼部和尾部。但如果仅仅根据返航的飞机上的弹孔分布,来研究该加强飞机的哪部分时,就忽略掉了“飞机被击落”这个筛选的过程。也就是说,能返航的飞机都是躲过防空炮火筛选的、没有受过致命伤的。他们多中弹于翼部和尾部,而油箱和驾驶员仓位完好,这恰恰说明翼部和尾部不是致命伤,不应该加强;而油箱和驾驶员仓位受伤的飞机,基本没有活着回来的,因此油箱和驾驶员仓位才是真正致命的地方,这些部位受伤的飞机却因为被击落而被筛出研究样本,从而变成了“不会说话的死人”,或“沉默的数据”。
(其实我倾向于认为这样的研究确实存在过,请见Patrick Blackett和他的Operational Research,在二战中确实涉及到这样一个对于飞机弹孔的研究:http://en.wikipedia.org/wiki/Patrick_Blackett)
再举个例子,如果仅仅通过研究大学生来探究高中教育的问题,那就忽略了高考这个筛选器:没有通过高考、没有考上大学的人,他们才是在高中教育真正出现问题的人,而他们不在大学生的研究样本中。
现在看很多人在知乎上讨论的政治问题、经济问题、文化问题,也有此类逻辑谬误。大多数知乎网友的观点和见闻,大多来自于你们能接触到的,可以在网络传播、可以通过新闻媒体扩散的信息,而那些没什么人传播、上不了新闻,却天天发生的事情,我们都不了解。没有调查就没有发言权,就是这个意思咯。
(查了一下英文的source,对原文飞机中弹位置做了更改,感谢@周祚)
幸存者偏倚(Survivorship bias)是一种常见的逻辑谬误(所以我说叫“谬误”而不是“偏差”),意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。
空战的例子这样解释:简单来说,专家根据返航飞机翼部和尾部等位置中弹最多的特点,判断出,如果要强化飞机装甲,应该强化翼部和尾部。但如果仅仅根据返航的飞机上的弹孔分布,来研究该加强飞机的哪部分时,就忽略掉了“飞机被击落”这个筛选的过程。也就是说,能返航的飞机都是躲过防空炮火筛选的、没有受过致命伤的。他们多中弹于翼部和尾部,而油箱和驾驶员仓位完好,这恰恰说明翼部和尾部不是致命伤,不应该加强;而油箱和驾驶员仓位受伤的飞机,基本没有活着回来的,因此油箱和驾驶员仓位才是真正致命的地方,这些部位受伤的飞机却因为被击落而被筛出研究样本,从而变成了“不会说话的死人”,或“沉默的数据”。
(其实我倾向于认为这样的研究确实存在过,请见Patrick Blackett和他的Operational Research,在二战中确实涉及到这样一个对于飞机弹孔的研究:http://en.wikipedia.org/wiki/Patrick_Blackett)
再举个例子,如果仅仅通过研究大学生来探究高中教育的问题,那就忽略了高考这个筛选器:没有通过高考、没有考上大学的人,他们才是在高中教育真正出现问题的人,而他们不在大学生的研究样本中。
现在看很多人在知乎上讨论的政治问题、经济问题、文化问题,也有此类逻辑谬误。大多数知乎网友的观点和见闻,大多来自于你们能接触到的,可以在网络传播、可以通过新闻媒体扩散的信息,而那些没什么人传播、上不了新闻,却天天发生的事情,我们都不了解。没有调查就没有发言权,就是这个意思咯。
(查了一下英文的source,对原文飞机中弹位置做了更改,感谢@周祚)
是的,体现知乎(相对于百度)先进性的时候到了!
楼上的几位包括@程毅南 老师,你们详细地解释了什么叫做幸存者偏差,我没有什么好补充的了。除了程老师举的空战的例子存疑,这个我后面说。
但是,你们都没有去仔细看那篇百度百科对不对~~~
那么,下面,我非常高兴地来贡献一个“以上都不对,看我的!”的答案:
题主所困惑的,不是他即使上网查询也弄不懂幸存者偏差是什么意思(那太蠢了),而是在百度百科中,前后文使用的案例内容是自相矛盾的,见幸存者偏差_百度百科
第一个故事里面,说的是机腹中弹多,机翼中弹少,但是实际上机翼中弹了很难返航。
第二个更加详细的故事里面,则变成了机翼中弹多,“座舱与机尾发动机部位”中弹少,结果和上面相反。
到底特么的哪里中弹多!特么的哪里被打中容易挂啊!(╯‵□′)╯︵┻━┻
于是题主糊涂了。他糊涂不是弄不懂幸存者偏差,而是不明白百度百科的自相矛盾。
为了解决他的问题,我花了一个小时上网查资料,查出一个广泛传播于投资界、经济学界和鸡汤界的这么一个谣言段子,全文如下:
甚至,在知乎上都有人引用过这个案例:
成功的人都必须有很强的自我意识吗?
为了验证这个段子的不靠谱性,我特地问了问北航毕业的军迷同学,其答复曰“你傻逼么,当然是座舱和发动机最重要,机翼算个屁啊!”
好吧,一条好大好大的鱼。
感谢媒体和自媒体们对于知识的传播所做出的贡献,但是你们在引用案例的时候稍微过一下脑子,会让世界更好一点的。
我分析,最初的作者或许搞混了“机翼”和“尾翼”的区别(据说尾翼也是要害部位一旦被击中很难返航这个我不懂请大牛指正),随手写错,之后如蝴蝶效应一般,引发全民的不靠谱。
甚至在本题之中,尽管各位对于幸存者偏差的概念解释的都很好,但是题主的困惑就从这个段子而来,程老师在答题的时候又引用了这个错误的案例内容,那么只会让他更困惑,或者又产生一位不明就里的谣言传播者。
这不是正确的学术态度。
经济学在最近几年越来越有向鸡汤学发展的趋势,不得不说有这些段子的功劳。
下面,是在知乎上应该出现的对该题主的回答:
1. 幸存者偏差的概念,最简单来说就是:统计科目(中弹部位)和样本是否能被纳入统计(返航让你数弹孔)有相关性(打下来就回不来了),所以样本呈现的结果和实际结果存在偏差。用白话说,活下来的才能让你看到,所以那些死掉的真实情况你无从得知,于是你只能看到机翼中弹返航的飞机、和股市里面赚几十倍的股神。
2. 百度百科词条中,第一个关于飞机的案例是错的,它引用了一个广为传播谣言段子,排除了这个关于机翼和机腹的谬误之后,你理解这个概念应该没太大问题。
3. 百度百科虽然和维基一样是大众编辑,志愿者修订,不过做的远没有维基好,这类的冷门概念最好看英文维基,Survivorship bias
4. 不过,即使看着这两个矛盾的案例,也应该能明白作者想表达的幸存者偏差的概念吧。排除阻碍认知模糊信息的技能请题主再多推一点。
5. (本条是私货)不过,还是感谢题主提出的疑惑,其实驾驶舱和机翼哪个对于飞机更要害,并不是一个具备专业知识才能明白的问题。那么多人,在引用别人的话的时候,自己都不会好好读,我个人觉得,这是写文字的人所能做的最蠢的事情没有之一:引用即表明你对这些文字推崇备至,你特么自己都不好好读,骗狗呢!
答题完毕。
知乎的先进性,我来维护。
================================
感谢大家挑的BUG,“发动机在尾翼”这个谬误,是我从百度百科的另一个案例中引用的,原文为:
经过大家的指正,确实没有把发动机装在机尾的,但是同时下面有专业人士贴出的论文中,确实认为机尾和机腹一样属于要害部位,具体的原因有待专业人士解答。
这太可怕了,一个广为传播案例是错的,我用来纠正它的另一个广为传播的案例也是错的。
看你们丫以后还敢再在经济学文章中用飞机做案例不?
楼上的几位包括@程毅南 老师,你们详细地解释了什么叫做幸存者偏差,我没有什么好补充的了。除了程老师举的空战的例子存疑,这个我后面说。
但是,你们都没有去仔细看那篇百度百科对不对~~~
那么,下面,我非常高兴地来贡献一个“以上都不对,看我的!”的答案:
题主所困惑的,不是他即使上网查询也弄不懂幸存者偏差是什么意思(那太蠢了),而是在百度百科中,前后文使用的案例内容是自相矛盾的,见幸存者偏差_百度百科
第一个故事里面,说的是机腹中弹多,机翼中弹少,但是实际上机翼中弹了很难返航。
第二个更加详细的故事里面,则变成了机翼中弹多,“座舱与机尾发动机部位”中弹少,结果和上面相反。
到底特么的哪里中弹多!特么的哪里被打中容易挂啊!(╯‵□′)╯︵┻━┻
于是题主糊涂了。他糊涂不是弄不懂幸存者偏差,而是不明白百度百科的自相矛盾。
为了解决他的问题,我花了一个小时上网查资料,查出一个广泛传播于投资界、经济学界和鸡汤界的这么一个谣言段子,全文如下:
二次世界大战时,美英联军对德国展开了战略大轰炸。由于德国防空力量强大,美英空军损失惨重,国防部找来飞机专家,要求研究战斗机受损情况,对飞机进行改进。专家们检查了执行任务归来的飞机,发现所有飞机的机腹都伤痕累累,于是专家们建议,机腹非常容易受到防空炮火攻击,应该加强机腹的防护。最后国防部的改进要求却是,改进和加强对机翼的防护。因为国防部的一个统计学家发现,能够幸运返航的飞机,机翼都完好无损,这说明,被击中机翼的飞机都坠落了,而仅仅被击中机腹的飞机都返航了,应该加强防护的是机翼,而不是机腹。统计学里将这类因结果导致错误认知的情况,称为“幸存者偏差”。放狗得知,这个段子在互联网上最早出自09年的某个BLOG上(欢迎各位补充更原始的出处),之后被小范围转载,之后被某财经专栏作家引用后较大范围转载,之后被各类网站大范围转载,并在今年通过读者等大众杂志转载之后达到了传播的高潮,如今你在百度上输入“幸存者偏差”,出来的10000多个结果90%是这个案例。
甚至,在知乎上都有人引用过这个案例:
成功的人都必须有很强的自我意识吗?
为了验证这个段子的不靠谱性,我特地问了问北航毕业的军迷同学,其答复曰“你傻逼么,当然是座舱和发动机最重要,机翼算个屁啊!”
好吧,一条好大好大的鱼。
感谢媒体和自媒体们对于知识的传播所做出的贡献,但是你们在引用案例的时候稍微过一下脑子,会让世界更好一点的。
我分析,最初的作者或许搞混了“机翼”和“尾翼”的区别(据说尾翼也是要害部位一旦被击中很难返航这个我不懂请大牛指正),随手写错,之后如蝴蝶效应一般,引发全民的不靠谱。
甚至在本题之中,尽管各位对于幸存者偏差的概念解释的都很好,但是题主的困惑就从这个段子而来,程老师在答题的时候又引用了这个错误的案例内容,那么只会让他更困惑,或者又产生一位不明就里的谣言传播者。
这不是正确的学术态度。
经济学在最近几年越来越有向鸡汤学发展的趋势,不得不说有这些段子的功劳。
下面,是在知乎上应该出现的对该题主的回答:
1. 幸存者偏差的概念,最简单来说就是:统计科目(中弹部位)和样本是否能被纳入统计(返航让你数弹孔)有相关性(打下来就回不来了),所以样本呈现的结果和实际结果存在偏差。用白话说,活下来的才能让你看到,所以那些死掉的真实情况你无从得知,于是你只能看到机翼中弹返航的飞机、和股市里面赚几十倍的股神。
2. 百度百科词条中,第一个关于飞机的案例是错的,它引用了一个广为传播谣言段子,排除了这个关于机翼和机腹的谬误之后,你理解这个概念应该没太大问题。
3. 百度百科虽然和维基一样是大众编辑,志愿者修订,不过做的远没有维基好,这类的冷门概念最好看英文维基,Survivorship bias
4. 不过,即使看着这两个矛盾的案例,也应该能明白作者想表达的幸存者偏差的概念吧。排除阻碍认知模糊信息的技能请题主再多推一点。
5. (本条是私货)不过,还是感谢题主提出的疑惑,其实驾驶舱和机翼哪个对于飞机更要害,并不是一个具备专业知识才能明白的问题。那么多人,在引用别人的话的时候,自己都不会好好读,我个人觉得,这是写文字的人所能做的最蠢的事情没有之一:引用即表明你对这些文字推崇备至,你特么自己都不好好读,骗狗呢!
答题完毕。
知乎的先进性,我来维护。
================================
感谢大家挑的BUG,“发动机在尾翼”这个谬误,是我从百度百科的另一个案例中引用的,原文为:
沃德客气但坚定地说: 「将军,我尊敬你在飞行上的专业,艾玛,这个段子也获得了广泛的传播,比上一个少一点,因为这个段子还是比较长的。
但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿
最少发现弹孔。」
经过大家的指正,确实没有把发动机装在机尾的,但是同时下面有专业人士贴出的论文中,确实认为机尾和机腹一样属于要害部位,具体的原因有待专业人士解答。
这太可怕了,一个广为传播案例是错的,我用来纠正它的另一个广为传播的案例也是错的。
看你们丫以后还敢再在经济学文章中用飞机做案例不?
是的,体现知乎(相对于百度)先进性的时候到了!(好吧我只是不想破坏队形而已嘛)
楼上的几位包括@程毅南@周祚 老师,你们详细地解释了什么叫做幸存者偏差,我没有什么好补充的了。很可惜,程老师所引用的那个例子是错误的版本(修改后仍然是错误的)。而周老师虽然看出了问题,却在搜索后错误地认为这个二战空战的例子只是一个编造出来的段子。
那么,下面,再花了5分钟查资料以后。我非常高兴地来贡献一个“以上都不对,看我的!”的答案:
这个例子是真实存在的,这位统计学家的名字叫Abraham Wald,匈牙利裔犹太人。详细生平见
Abraham Wald
以下是这个故事真实版本:
二战期间,为减少盟军轰炸机在敌人防空炮火中的损失,军方决定为这些飞机加装装甲板,而Abraham奉命解决的问题是,确定这些防弹装甲板的安装位置
为了找出最有效的位置,Abraham画了一张轰炸机草图,每天统计返航的轰炸机的弹孔数量和位置,并将它们画到图上。很快,这幅草图上的轰炸机就被弹孔覆盖了,仅有几个地方例外。Abraham据此决定,将所有草图上没有弹孔的地方装上装甲板,理由是,这些地方中弹的飞机一架也没有回来
至于中弹的位置,请参考下图
该图来自统计学家Howard Wainer 发表于1999年的论文:The Most Dangerous Profession: A Note on Non sampling Error
http://www.rc.usf.edu/~jdorio/ORM/Wainer,%20H.%20(1999)..pdf
这个例子经常被用来说明很多统计学和运筹学问题,比如选择性偏差等等。但它绝对——不,是,一,个,段,子。
恩,对了,最后我还要说说知乎的学术性问题,现在的知乎是越来越。。。等等,其实我只是刚好看过相关资料而已,所以,大家不要太在意,有空多读书就好了
楼上的几位包括@程毅南@周祚 老师,你们详细地解释了什么叫做幸存者偏差,我没有什么好补充的了。很可惜,程老师所引用的那个例子是错误的版本(修改后仍然是错误的)。而周老师虽然看出了问题,却在搜索后错误地认为这个二战空战的例子只是一个编造出来的段子。
那么,下面,再花了5分钟查资料以后。我非常高兴地来贡献一个“以上都不对,看我的!”的答案:
这个例子是真实存在的,这位统计学家的名字叫Abraham Wald,匈牙利裔犹太人。详细生平见
Abraham Wald
以下是这个故事真实版本:
二战期间,为减少盟军轰炸机在敌人防空炮火中的损失,军方决定为这些飞机加装装甲板,而Abraham奉命解决的问题是,确定这些防弹装甲板的安装位置
为了找出最有效的位置,Abraham画了一张轰炸机草图,每天统计返航的轰炸机的弹孔数量和位置,并将它们画到图上。很快,这幅草图上的轰炸机就被弹孔覆盖了,仅有几个地方例外。Abraham据此决定,将所有草图上没有弹孔的地方装上装甲板,理由是,这些地方中弹的飞机一架也没有回来
至于中弹的位置,请参考下图
该图来自统计学家Howard Wainer 发表于1999年的论文:The Most Dangerous Profession: A Note on Non sampling Error
http://www.rc.usf.edu/~jdorio/ORM/Wainer,%20H.%20(1999)..pdf
这个例子经常被用来说明很多统计学和运筹学问题,比如选择性偏差等等。但它绝对——不,是,一,个,段,子。
恩,对了,最后我还要说说知乎的学术性问题,现在的知乎是越来越。。。等等,其实我只是刚好看过相关资料而已,所以,大家不要太在意,有空多读书就好了
说到飞机,作为一个飞机维修的工程师,我就绕远一点,谈谈飞机。
我们都知道最早的飞机是莱特兄弟发明的,当时的飞机是这样的:
引用自维基百科(不是百度)
而我们平时的所乘坐的飞机是这样的:
飞机的设计历史是一个很长而且非常值得讲的一段故事,其中有一段,就跟之前@林怡通老师提到的沃尔德教授有关,也同时回答@程毅南老师,这样的研究确实存在过,当然了,不止是他一个人,而是一个庞大的团队,二战的时候关于飞机,特别是轰炸机的研究非常的多,从弹孔分析飞机的重要部位,到轰炸机到底是一架一架的飞,还是组团过去扔炸弹,飞机到底需要几台发动机,各种各样的研究都有。
回到这个例子,由于非常有启发性,后人又有很多修饰,把他编成了段子,大概的内容之前几位都写的很清楚了,大体的意思就是为了研究轰炸机在哪些部位需要加装钢板(飞机都是铝合金的蒙皮,因为又轻又结实,但问题就是怕子弹),美国的科学家就对返航的飞机的弹孔进行统计,在有弹孔的地方图上颜色,一张飞机的图上密密麻麻涂了很多地方,从图上判断,飞机机翼是最容易被打中的地方,发动机和驾驶舱却没有颜色,但最后得出结论,需要加装护甲的地方是没有涂色的部位,原因就是被击中了要害的飞机,都没有回来。
我想幸存者偏差拿这个举例子,就是想说我们只拿幸存的飞机做样本,很容易产生错误的判断。
虽然讲到这里已经差不多回答完问题了,但是.....继续扯远........
现代的飞机之所以跟莱特兄弟的相差那么远,
而且有那么多繁复的规定,你们每次上飞机都要听空姐说一遍:系好安全带,收起小桌板,拉开遮阳板.....巴拉巴拉巴拉....哦,还有禁止吸烟(90年代的我国的航班是可以吸烟的),之所以有这些,是因为有些不听话的同学...死了.....
我想说飞机之所以有现在这样的设计,并不完全是设计师的深思熟虑,很多改进源于一次次的空难,哈维兰彗星型客机,最早的喷气民航客机,它的连续空中解体,才使人们发现不合理的铆钉结构会导致金属疲劳。基于DHL货机巴格达遇袭事件,现代飞机更新飞机尾部的液压布局。
还有一样东西,不得不提一下,叫做MEL(minimum equipment list 最低设备清单)。正是有这份东西的存在,才使得现代飞机能安全到两百五十万分之一(2012年数据)的事故率。
这是什么东西呢,正如它字面的意思,最低设备清单,就是飞机最少必须有哪些设备。一台飞机上大多数设备有两套甚至三套,防止其失效而影响飞机的安全,最主要的是,影响航班的正点率,飞机毕竟是庞大的机器,上百万个零件,总有一两个会有毛病,如果有一点问题飞机就不飞,拿机场服务台早就被乘客掀了。所以飞机制造厂家根据飞机的性能,编写了MEL,规定哪些设备必须是完好的,哪些设备允许失效,例如飞机上有四个厕所,坏了三个,还能飞航班,有些灯泡不亮,可以飞航班,但如果是应急的灯光有问题,就不能飞,必须修好了才可以。
看着很熟悉是吧,是的,MEL的鼻祖就是美国人在二战时期关于弹孔的研究,当然结论不仅仅是段子中说的驾驶舱和发动机那么简单,他们整理了最早的“最低设备清单”。
这是段子背后的故事。
我们都知道最早的飞机是莱特兄弟发明的,当时的飞机是这样的:
引用自维基百科(不是百度)
而我们平时的所乘坐的飞机是这样的:
飞机的设计历史是一个很长而且非常值得讲的一段故事,其中有一段,就跟之前@林怡通老师提到的沃尔德教授有关,也同时回答@程毅南老师,这样的研究确实存在过,当然了,不止是他一个人,而是一个庞大的团队,二战的时候关于飞机,特别是轰炸机的研究非常的多,从弹孔分析飞机的重要部位,到轰炸机到底是一架一架的飞,还是组团过去扔炸弹,飞机到底需要几台发动机,各种各样的研究都有。
回到这个例子,由于非常有启发性,后人又有很多修饰,把他编成了段子,大概的内容之前几位都写的很清楚了,大体的意思就是为了研究轰炸机在哪些部位需要加装钢板(飞机都是铝合金的蒙皮,因为又轻又结实,但问题就是怕子弹),美国的科学家就对返航的飞机的弹孔进行统计,在有弹孔的地方图上颜色,一张飞机的图上密密麻麻涂了很多地方,从图上判断,飞机机翼是最容易被打中的地方,发动机和驾驶舱却没有颜色,但最后得出结论,需要加装护甲的地方是没有涂色的部位,原因就是被击中了要害的飞机,都没有回来。
我想幸存者偏差拿这个举例子,就是想说我们只拿幸存的飞机做样本,很容易产生错误的判断。
虽然讲到这里已经差不多回答完问题了,但是.....继续扯远........
现代的飞机之所以跟莱特兄弟的相差那么远,
而且有那么多繁复的规定,你们每次上飞机都要听空姐说一遍:系好安全带,收起小桌板,拉开遮阳板.....巴拉巴拉巴拉....哦,还有禁止吸烟(90年代的我国的航班是可以吸烟的),之所以有这些,是因为有些不听话的同学...死了.....
我想说飞机之所以有现在这样的设计,并不完全是设计师的深思熟虑,很多改进源于一次次的空难,哈维兰彗星型客机,最早的喷气民航客机,它的连续空中解体,才使人们发现不合理的铆钉结构会导致金属疲劳。基于DHL货机巴格达遇袭事件,现代飞机更新飞机尾部的液压布局。
还有一样东西,不得不提一下,叫做MEL(minimum equipment list 最低设备清单)。正是有这份东西的存在,才使得现代飞机能安全到两百五十万分之一(2012年数据)的事故率。
这是什么东西呢,正如它字面的意思,最低设备清单,就是飞机最少必须有哪些设备。一台飞机上大多数设备有两套甚至三套,防止其失效而影响飞机的安全,最主要的是,影响航班的正点率,飞机毕竟是庞大的机器,上百万个零件,总有一两个会有毛病,如果有一点问题飞机就不飞,拿机场服务台早就被乘客掀了。所以飞机制造厂家根据飞机的性能,编写了MEL,规定哪些设备必须是完好的,哪些设备允许失效,例如飞机上有四个厕所,坏了三个,还能飞航班,有些灯泡不亮,可以飞航班,但如果是应急的灯光有问题,就不能飞,必须修好了才可以。
看着很熟悉是吧,是的,MEL的鼻祖就是美国人在二战时期关于弹孔的研究,当然结论不仅仅是段子中说的驾驶舱和发动机那么简单,他们整理了最早的“最低设备清单”。
这是段子背后的故事。
搓手。我对这个问题真的思考过,终于有机会说了。
“幸存者偏差”又称“沉默的数据”、“死人不会说话”等。但就这个案例,我认为考虑站在指挥官,即一个普通人(非专家)的角度应该如何思考,更有意义。前面有大牛提到了,沃德用了很复杂的统计模型才算出这个结论来的,而作为普通人,我们只能靠简单的逻辑推论。
我试着自己用很机械的方式分析一下:
本案例中,飞机会不会被击落,只与两个因素有关:防御能力和被击中概率。根据现有条件可知:机翼防御强,中弹概率大;驾驶舱和机尾发动机防御弱,中弹概率不明。
现在采取机械式的逐条分析。
1、只考虑防御能力。有以下几种可能:
(1)机翼:防御强,但击中过多仍会被击落(可能成立)
(2)机翼:防御弱,很容易被击落(不成立)
(3)驾驶舱和机尾发动机:防御强,不容易被击落(不成立,现有样本无法证明其防御强)
(4)驾驶舱和机尾发动机:防御弱,容易被击落(可能成立)
现在,事实就明确了,只有(1)和(4)可能成立。也就是教授和指挥官的观点。
进一步分析:首先需要加强的,肯定是防御弱的部位,增强驾驶舱和机尾发动机的装甲是对的。
2、考虑中弹概率,又有几种可能:
(1)机翼可能中弹概率大,所以需要加强防御。(可能成立)
(2)机翼可能中弹概率小,所以不需要加强防御。(不成立)
(3)驾驶舱和机尾发动机中弹概率大,而且一中就挂,所以需要加强防御。(可能成立)
(4)驾驶舱和机尾发动机中弹概率小,但一中就挂,所以需要加强防御。(可能成立)
现在来看,驾驶舱和机尾发动机、机翼都需要加强防御,但前者明显更迫切,因为有无论其中弹概率大不大,都很容易挂。
3、以上两个因素结合起来考虑。
(1)机翼:防御强,被击中概率大,击中过多仍会被击落(可能成立)
(2)机翼:防御强,被击中概率小(不成立)
(3)机翼:防御弱,被击中概率大(不成立)
(4)机翼:防御弱,被击中概率小(不成立)
(5)驾驶舱和机尾发动机:防御强,被击中概率大(不成立)
(6)驾驶舱和机尾发动机:防御强,被击中概率小(不成立)
(7)驾驶舱和机尾发动机:防御弱,被击中概率大(可能成立)
(8)驾驶舱和机尾发动机:防御弱,被击中概率小,但一打就挂(可能成立)
结论:首先加强驾驶舱和机尾发动机的装甲。
可是这样的思考只是在条件不足的情况下进行的,确定性不够高。最好的办法是什么呢?在有条件的情况下,应该增加2个做法:第一种:统计被击落的飞机的数据,数据沉默、死人不说话时,就让它们说话,事实永远胜于推理。第二种:分别实验加强机翼和驾驶舱和机尾发动机装甲后的数据,比如100架飞机只加强机翼装甲,100架飞机加强驾驶舱和机尾发动机装甲,执勤若干次后,统计返航率。
说了半天,好像都是废话。呵呵。请大神指出错误吧。
熊掌百科真是毁人不倦啊,Copy+Paste还能把这么简单的一段对话给弄的混乱不堪。
为什么总有东北小孩在冬天用舌头舔大铁门然后被粘上呢?
这个问题就是一个典型的幸存者谬误。
通俗点说就是能让你看到的都满足了某个特质,结果仅仅通过这些来研究就会认为所有的都具备这个特质,但事实上是不具备这个特质的你根本就看不到。
幸存者谬误实在是过分常见了,我可以随便举一大堆:
为什么地铁总是人满为患但还是亏本运营?
因为你总是人满为患的时段去挤地铁。
为什么中国盖的桥,修的路都是动不动就塌了。
因为没塌的不会有人报道。
为什么电视上香港人的房子都那么大,香港人还说房子太小,地太贵。
因为小房子上不了电视,机位没法摆。
为什么外国人都很有钱的样子。
因为没钱的来不了中国让你看见。
为什么新疆人都卖切糕和拉面?
因为卖葡萄和哈密瓜的在新疆。
为什么总有东北小孩在冬天用舌头舔大铁门然后被粘上呢?
这个问题就是一个典型的幸存者谬误。
通俗点说就是能让你看到的都满足了某个特质,结果仅仅通过这些来研究就会认为所有的都具备这个特质,但事实上是不具备这个特质的你根本就看不到。
幸存者谬误实在是过分常见了,我可以随便举一大堆:
为什么地铁总是人满为患但还是亏本运营?
因为你总是人满为患的时段去挤地铁。
为什么中国盖的桥,修的路都是动不动就塌了。
因为没塌的不会有人报道。
为什么电视上香港人的房子都那么大,香港人还说房子太小,地太贵。
因为小房子上不了电视,机位没法摆。
为什么外国人都很有钱的样子。
因为没钱的来不了中国让你看见。
为什么新疆人都卖切糕和拉面?
因为卖葡萄和哈密瓜的在新疆。
非专业,写一点粗浅见解,权当补遗。(已于发布次日被搬运到百度百科)
只看了一点相关书籍,里面都提及了这一个典型的思维偏差。
The Art of Thinking Clearly 《清醒思考的艺术》by Rolf Dobelli
Fooled By Randomness 《随机漫步的傻瓜》by Nassim Nicholas Taleb
幸存者偏倚(survivor bias) 的字面意思和事例来讲,是阐述一个概率和统计方面的易见偏差:
即人们在观察和统计时,更容易注意和搜集到成功案例,而容易忽略或无法统计到失败案例,在此基础上得出的结果,是可能存在偏差和错误结论的。
这点不难理解,也已经有两个答案给出了不错的例子
此外这个偏倚还有两个个人理解方面的引申含义:
1,在大样本下,幸存者出现的概率*基数而大幅提升,而此时幸存(成功)会被认为是幸存者的个人能力或和失败者的差异而导致的必然结果
2,基于上一条,对于幸存者的错误评估,会导致“成功者有更大概率在之后获得成功”的误解
第一条的例子如下:
假设我们有一个公平证券交易市场,其投资风险和收益相当,只需进行普通的买卖
那么,我雇佣512只猴子,给他们两个按钮,一个买,一个卖,让他们每天随机乱按——每年检查一次猴子们的收益,将赔本的剔除出工位,只保留那些盈利的。
于是,第二年我还有256只猴子,第三年128只,第四年64只,第五年32只
这32只猴子只是“幸存者”,可是,我们通常会给他们带上“成功人士”的标签,事实往往如此。
如果将证券市场的环境改为“抽牌比大小的赌场”或者类似的环境,很奇怪,这32只猴子只配得到“幸运儿”的头衔。
而接下来,就是对32只猴子的采访,对他们宗教信仰,生活方式,饮食结构,作息规律,哦对,还有按下买卖按钮的规律的总结,并且结册为“成功人士所必备的xx个习惯”的名字,翻译成32种文字,大卖500万本。
第二条的例子如下:
如果你现在要进入上述证券交易市场,将自己的资金委托给一些投资管理人进行管理,你会选择“今年进入市场还未取得成绩的512只猴子之一“还是”已经连续5年取得优异成绩的32只猴子“之一呢?如无意外,都是后者
如果将环境换成赌场,你会相信连赢5把21点的赌客留下的位置会带给你好运而取得更大的胜率概率吗?不,我想不会
案例摘自纳西姆先生的书,他的这本书和《黑天鹅》据我在期货界的朋友说,都是被普遍获得肯定和好评的(虽然里面最多讽刺的就是金融和证券业界的人)
而罗尓夫先生告诉我们这样一段话:(摘自”你应该多逛逛墓地“条目)
所以,我不是说成功都一定靠运气,而是人们因为幸存者偏差而极大地低估了运气在成功中所占的比重——就算克隆出1024个乔布斯,扔到世界各地不同行业中去,能取得成功的可能也只有1个,所以成功的因素是环境造就,而往往非个人能力决定。
所以,我要说任何成功学都是扯淡,如果成功是可以通过模仿来复制的,并且还上升到了科学的高度那么那么多读了成功学的书并且身体力行的人,怎么还他妈都是loser?
只看了一点相关书籍,里面都提及了这一个典型的思维偏差。
The Art of Thinking Clearly 《清醒思考的艺术》by Rolf Dobelli
Fooled By Randomness 《随机漫步的傻瓜》by Nassim Nicholas Taleb
幸存者偏倚(survivor bias) 的字面意思和事例来讲,是阐述一个概率和统计方面的易见偏差:
即人们在观察和统计时,更容易注意和搜集到成功案例,而容易忽略或无法统计到失败案例,在此基础上得出的结果,是可能存在偏差和错误结论的。
这点不难理解,也已经有两个答案给出了不错的例子
此外这个偏倚还有两个个人理解方面的引申含义:
1,在大样本下,幸存者出现的概率*基数而大幅提升,而此时幸存(成功)会被认为是幸存者的个人能力或和失败者的差异而导致的必然结果
2,基于上一条,对于幸存者的错误评估,会导致“成功者有更大概率在之后获得成功”的误解
第一条的例子如下:
假设我们有一个公平证券交易市场,其投资风险和收益相当,只需进行普通的买卖
那么,我雇佣512只猴子,给他们两个按钮,一个买,一个卖,让他们每天随机乱按——每年检查一次猴子们的收益,将赔本的剔除出工位,只保留那些盈利的。
于是,第二年我还有256只猴子,第三年128只,第四年64只,第五年32只
这32只猴子只是“幸存者”,可是,我们通常会给他们带上“成功人士”的标签,事实往往如此。
如果将证券市场的环境改为“抽牌比大小的赌场”或者类似的环境,很奇怪,这32只猴子只配得到“幸运儿”的头衔。
而接下来,就是对32只猴子的采访,对他们宗教信仰,生活方式,饮食结构,作息规律,哦对,还有按下买卖按钮的规律的总结,并且结册为“成功人士所必备的xx个习惯”的名字,翻译成32种文字,大卖500万本。
第二条的例子如下:
如果你现在要进入上述证券交易市场,将自己的资金委托给一些投资管理人进行管理,你会选择“今年进入市场还未取得成绩的512只猴子之一“还是”已经连续5年取得优异成绩的32只猴子“之一呢?如无意外,都是后者
如果将环境换成赌场,你会相信连赢5把21点的赌客留下的位置会带给你好运而取得更大的胜率概率吗?不,我想不会
案例摘自纳西姆先生的书,他的这本书和《黑天鹅》据我在期货界的朋友说,都是被普遍获得肯定和好评的(虽然里面最多讽刺的就是金融和证券业界的人)
而罗尓夫先生告诉我们这样一段话:(摘自”你应该多逛逛墓地“条目)
如果你本身就是“幸存者”的一分子,幸存偏误就非常麻烦了。哪怕你的成功纯属偶然,你也会发现你与其他成功者的共同点,并将它们诠释为“成功因素”。不过在逛失败者 (人员、公司等)的墓地时你会发现,这些人经常也运用了他们以为的“成功因素”。
所以,我不是说成功都一定靠运气,而是人们因为幸存者偏差而极大地低估了运气在成功中所占的比重——就算克隆出1024个乔布斯,扔到世界各地不同行业中去,能取得成功的可能也只有1个,所以成功的因素是环境造就,而往往非个人能力决定。
所以,我要说任何成功学都是扯淡,如果成功是可以通过模仿来复制的,并且还上升到了科学的高度那么那么多读了成功学的书并且身体力行的人,怎么还他妈都是loser?
沒有留言:
張貼留言
留下你的想法