统计悖论
- 1 友谊悖论(Friendship Paradox)
- 1.1 文字版
- 1.2 公式版
- 1.3 现实意义
- 2 布雷斯悖论
- 2.1 未开通A》B路线
- 2.2 开通A》B路线
- 2.3 其余布雷斯悖论的例子
- 3 参考
最近在学习一个统计学的课程,其中涉及到几个统计悖论,笔者感觉很有意思,特总结一波和大家进行分享~
1 友谊悖论(Friendship Paradox)
1.1 文字版
一个人朋友的数量往往比他朋友的朋友数量要少!
比如上图中每个节点代表一个人物,横线表示两者是朋友关系,故各自朋友的数量为:
- A:1
- B:3
- C:2
- D:2
结论1:ABCD四位平均朋友数为:(1+3+2+2)/4 = 2
而ABCD四位各自朋友的朋友数量分别为:3、5、5、5
- A(3):B(3)
- B(5):A(1);C(2);D(2)
- C(5):B(3);D(2)
- D(5):B(3);C(2)
结论2:ABCD四位朋友的平均朋友数为:(3+5+5+5)/ (1+3+2+2) = 2.25
结论3:ABCD四位平均朋友数小于ABCD四位朋友的平均朋友数
1.2 公式版
设每个人的朋友数(即节点数)为 F i F_i Fi, 所有人的平均朋友数用 d ˉ \bar{d} dˉ 来表示,其中
d ˉ = ∑ i = 1 n F i n \bar{d}\ = \frac{\sum_{i=1}^n F_i}{n} dˉ =n∑i=1nFi
= A
所有人朋友的朋友平均数为:
∑ i = 1 n F i 2 ∑ i = 1 n F i \frac{\sum_{i=1}^n F_i^2}{\sum_{i=1}^n F_i} ∑i=1nFi∑i=1nFi2
至于为什么分子是平方,解释是因为每一个节点都会被计算两次,所以朋友的朋友就是平方!
上面的式子可以继续进行变换,具体见下:
∑ i = 1 n ( D F i + ( E F i ) 2 ) ∑ i = 1 n F i \frac{\sum_{i=1}^n (DF_i + (EF_i)^2) }{\sum_{i=1}^n F_i} ∑i=1nFi∑i=1n(DFi+(EFi)2)
= n D F i + n d ˉ 2 n d ˉ \frac{nDF_i + n\bar{d}^2}{n\bar{d}} ndˉnDFi+ndˉ2
= d ˉ + n D F i d ˉ \bar{d} + \frac{nDF_i}{\bar{d}} dˉ+dˉnDFi
= B
故 A < B!即平均来说每个人的朋友数小于他朋友的朋友数!
1.3 现实意义
- 你也许并没有那么孤独!交际能力也许并没有那么差! 你的朋友看起来总是拥有比你更多的朋友,其实只是某几个人际交往明星从中作梗,让你产生了这种错觉而已。即凡是和社交有关的都会产生相关悖论!一开始大家差不多,但是随着时间推移,身边的“明星朋友”会让你觉得你没有什么朋友!
- 不能解释个体但可以解释群体的情况。比如可以解释一些事情为什么倾向于发生!假如你是一个高校教师,和你合作过的学者一般都比你更大牛。如果遇到反常情况,两种解释,一种是你已经很牛逼了!另一种是有人在说谎!
- 应该避免对负面事件的发生做出过高的估计。比如,有专家曾经对美国的100所大学进行了一项大型研究,结果发现,大学生们普遍对抽烟、喝酒、吸大麻这些事有过高的估计,他们认为周围一定有很多学生都在抽烟、喝酒、吸大麻,实际上根本并没有那么多。主要原因是身边“网红式人物”拉高了平均水平!而且社交媒体进一步扩大了“过度代表”的效果!因此我们就没有必要因为“大家都这么做”而去沾染不良习惯,也没有必要觉得整个社会到处都是负面新闻而感到沮丧。
- 传染病的预警和预防:不是直接去寻找人群中的“交际花”,而是随机选择一批人,然后让每个人去说出一位他自认为比他优秀的交际朋友,然后去监控这些人即可!
2 布雷斯悖论
这个悖论也是很有意思,记得之前笔者在参加一次数学建模竞赛的时候,遇到过道路交通相关的问题,当时还有幸拿到了全国二等奖,在做竞赛的过程中遇到了一个悖论,即布雷斯悖论。
明明增加了路线,但堵车的情况却更加严重了。而这种吃力不讨好且反常识的交通网络现象,便是著名的布雷斯悖论,由德国数学家迪特里希·布雷斯(Dietrich Braess)于1968年提出。
假设每天上班会有4000辆车需要从start处到End处!
2.1 未开通A》B路线
具体现在交通线路见上,用户小李需要从start到end处。具体小李有两条线路可以选择(假设走路线1有a辆车):
- 线路1:S》A》E。所需时间是t1=a/100+45
- 线路2:S》B》E。所需时间是t2=45+(4000-a)/100
直观的结论就是a越大,那么路线1所花时间越长,路线2所花时间越短!但随着大家的经验,车流量会非常平均的分摊到两条路线上!即随着时间的推移,无论是路线1还是路线2,通行时间固定为2000/100+45=65分钟。
2.2 开通A》B路线
具体在上图中,如果A和B之间开通了一条快速通道,即道路增加了1条!这两处之间所花时间可以忽略不计,记为0。此时我们来看看从S到E需要多久!是不是更快了呢?!
新开了一条路,符合人性(最快到达目的地)的情况下,所有司机都会走这条道路!即路线为:
S》A》B》E
此时所花时间为:t=4000/100+4000/100=80
诶!是不是很反人类!时间竟然比65分钟多!导致这种情况的原因是什么呢?个体聪明选择的汇总,其实并非最优解!
大家都因忌讳损害自身的利益而选择抄近路,则是布雷斯悖论中的纳什均衡点。身陷这个庞大的漩涡,所花时间更多都是可以预料的后果了。
2.3 其余布雷斯悖论的例子
例1:
1969年德国的斯图加特市添加了一条新道路,就是为了解决交通不顺畅的老毛病。没想到却得了反效果,交通状况更是恶化,堵得水泄不通。绝望的政府只好把这些路段去掉,交通才得以恢复原状。
所以反过来,许多大城市也曾参考这个理论来制定了政策。有时只需把“多余”的路封掉,就能提高道路网络的整体效率。
例2:
比如在1990年世界地球日当天,纽约市政府就决定关闭最繁忙的路段第42号大街。
当时纽约的媒体和市民直接炸开了锅,都认为政府脑子是不是锈了。对本来就堵成沙丁鱼罐头的纽约市来说,这无异于雪上加霜。有人甚至直接唱衰,预言那天将会是“世界末日”。
但让人意外的是,地球日如期而至,拥堵却没有发生。
例3:
韩国首尔市中心就有一条名为清溪川的河流,全长10.84公里,总流域面积达59.83平方公里。但你可能有所不知,这条清溪川原本竟是一条6车道的高速公路,每天都要承载16万8千辆车。把这条高速公路改成河流之后,首尔交通不但没有变堵,反而是得到了极大的疏通。
例4:
布雷斯悖论还可以应用到团队策略中,例如篮球、足球等比赛。(有时候团队缺少了一个毒瘤,剩下人可能会更加团结,更加厉害!)
一支篮球队可以看做是一条得分线路的网络,每条路径的效率都不同。然而,当这只队伍有明星球员加入时,反而会降低整个球队的整体效率。因为过度利用明星球员的“这条捷径”,可能会导致更糟糕的结果出现。
而竞技体育届的布雷斯现象,甚至还有了另外的代名词“尤因理论”。这源于1999年尼克斯队与步行者队的传奇一战。
当时尼克斯队的最强球员帕特里克·尤因发生了意外,跟腱撕裂,无法比赛。
遇到这种情况,大家都直言尼克斯队怕是要凉了。但是到最后尼克斯居然还是以4:2的比分赢得了比赛,顺利晋级NBA总决赛。
这场比赛,就与交通中的布雷斯悖论有着异曲同工之妙。明尼苏州大学的布莱恩·斯基纳就特别痴迷篮球,2009年他还特地对此现象构造了对应的概念模型。他认为,球队就是因为知道利用明星球员这条线路能够提高获胜几率,打出高分。然而,这条路有时却也会变成那条被“自私的司机”塞满的捷径。
3 参考
- https://www.zhihu.com/question/376209754/answer/1057119327
- 有哪些违背直觉的数学问题?(同时涉及辛普森悖论,总结的很好)https://www.zhihu.com/question/41408857/answer/129140965
- https://www.zhihu.com/question/24072013
- https://zhuanlan.zhihu.com/p/43934918
- https://zh.wikipedia.org/wiki/%E5%B8%83%E9%9B%B7%E6%96%AF%E6%82%96%E8%AE%BA