飞雪团队

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 4570|回复: 0

泊松分布与美国枪击案

[复制链接]

4137

主题

4225

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
14711
发表于 2020-8-5 10:49:13 | 显示全部楼层 |阅读模式
去年12月,美国康涅狄格州发生校园枪击案,造成28人死亡。
                                                                                                               
2df1609c313ec1d5d9b02cce1192028b.jpg

资料显示,1982年至2012年,美国共发生62起(大规模)枪击案。其中,2012年发生了7起,是次数最多的一年。
093aa7e08ef665a640c45184853dfdfa.jpg

去年有这么多枪击案,这是巧合,还是表明美国治安恶化了?
前几天,我看到一篇很有趣的文章,使用"泊松分布"(Poisson distribution),判断同一年发生7起枪击案是否巧合。

让我们先通过一个例子,了解什么是"泊松分布"。
aa92fd5f288ddc06de0a945b2c5d0751.jpg

已知某家小杂货店,平均每周售出2个水果罐头。请问该店水果罐头的最佳库存量是多少?
假定不存在季节因素,可以近似认为,这个问题满足以下三个条件:
  (1)顾客购买水果罐头是小概率事件。
  (2)购买水果罐头的顾客是独立的,不会互相影响。
  (3)顾客购买水果罐头的概率是稳定的。
在统计学上,只要某类事件满足上面三个条件,它就服从"泊松分布"。
泊松分布的公式如下:

P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}

P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}

各个参数的含义:
  P:每周销售k个罐头的概率。
  X:水果罐头的销售变量。
  k:X的取值(0,1,2,3...)。
  λ:每周水果罐头的平均销售量,是一个常数,本题为2。
根据公式,计算得到每周销量的分布:
6cbecc76b30dc9e00ff26147e00a781a.png

从上表可见,如果存货4个罐头,95%的概率不会缺货(平均每19周发生一次);如果存货5个罐头,98%的概率不会缺货(平均59周发生一次)。
866e7b4ea6e915e8a9ad0d3ac3303097.jpg

现在,我们再回过头,来看美国枪击案。
假定它们满足"泊松分布"的三个条件:
  (1)枪击案是小概率事件。
  (2)枪击案是独立的,不会互相影响。
  (3)枪击案的发生概率是稳定的。
显然,第三个条件是关键。如果成立,就说明美国的治安没有恶化;如果不成立,就说明枪击案的发生概率不稳定,正在提高,美国治安恶化。
根据资料,1982--2012年枪击案的分布情况如下:
26bc114ff891b1b1fa426ff75f1ec624.png

计算得到,平均每年发生2起枪击案,所以 λ = 2 。
217b69873c2fc2e3c754fd88ed70fb8e.png

上图中,蓝色的条形柱是实际的观察值,红色的虚线是理论的预期值。可以看到,观察值与期望值还是相当接近的。
60943ca52e52d692ba6d1fc140caf65d.png

我们用"卡方检验"(chi-square test),检验观察值与期望值之间是否存在显著差异。
  卡方统计量 = Σ [ ( 观察值 - 期望值 ) ^ 2 / 期望值 ]
计算得到,卡方统计量等于9.82。查表后得到,置信水平0.90、自由度7的卡方分布临界值为12.017。因此,卡方统计量小于临界值,这表明枪击案的观察值与期望值之间没有显著差异。所以,可以接受"发生枪击案的概率是稳定的"假设,也就是说,从统计学上无法得到美国治安正在恶化的结论。
但是,也必须看到,卡方统计量9.82离临界值很接近,p-value只有0.18。也就是说,对于"美国治安没有恶化"的结论,我们只有82%的把握,还有18%的可能是我们错了,美国治安实际上正在恶化。因此,这就需要看今后两年中,是否还有大量枪击案发生。如果确实发生了,泊松分布就不成立了。
[参考阅读]
  * 泊松分布,by 曹亮吉
  * 卡方分布(PDF文件)
(完)
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|飞雪团队

GMT+8, 2024-5-14 19:33 , Processed in 0.064873 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表