4.4: 泊松分布
另一个有用的概率分布是泊松分布,即等待时间分布。 这种分配用于确定需要多少结账员才能将排队等待时间保持在指定水平,需要多少电话线来防止系统超载,以及许多其他实际应用。 近四个世纪前发明的Pascal是对泊松的改造,如今被世界各地的电信公司用于解决负载系数、卫星连接水平和互联网容量问题。 该分布取自西蒙·泊松(Simeon Poisson),他在1837年将其作为二项分布的延伸而提出,我们将看到泊松可以估算二项式分布。
泊松实验有两个主要特征。
- 泊松概率分布给出了在固定的时间间隔或空间内发生的许多事件的概率,前提是这些事件以已知的平均速率发生。
- 这些事件与自上次事件以来的时间无关。 例如,图书编辑可能会对某本书中拼写错误的单词数量感兴趣。 可能是,平均而言,100 页中有五个单词拼写不正确。 间隔为 100 页,假设出现拼写错误的时间之间没有关系。
- 随机变量X = 目标区间内的出现次数。
示例4.4.12
一家银行预计平均每天会收到六张不良支票。 银行在任何一天收到少于五张不良支票的概率是多少? 利息是银行一天内收到的支票数量,因此利息时间间隔为一天。 LetX = 银行一天内收到的不良支票数量。 如果银行预计每天收到六张不良支票,则平均每天收到六张支票。 为概率问题写一个数学陈述。
- 回答
-
P(x<5)
示例4.4.13
你注意到新闻记者平均每次广播都说 “呃” 两次。 新闻记者每次广播说 “呃” 两次以上的概率是多少。
这是泊松的问题,因为你想知道新闻记者在广播中说 “呃” 的次数。
a. 利息间隔是多少?
- 回答
-
a. 一次广播以分钟为单位
b. 新闻记者在一次广播中说 “呃” 的平均次数是多少?
- 回答
-
b. 2
c. 让X = ____________。 有什么X价值观?
- 回答
-
c. 让X = 新闻记者在一次广播中说 “呃” 的次数。
x=0,1,2,3,...
d. 概率问题是P (______)。
- 回答
-
d。P(x>2)
泊松表示法:P = 泊松概率分布函数
X∼P(μ)
将此读作 “X是具有泊松分布的随机变量”。 参数为\ (\ mu (或 l);\ mu(或 l)= 目标区间的平均值。 平均值是间隔期间平均发生的次数。
计算来自泊松过程的概率的公式是:
P(x)=μxe−μx!
其中P(X)是X成功概率,μ是基于历史数据的预期成功次数,e 是大约等于 2.718 的自然对数,X是每个单位的成功次数,通常是每单位时间。
为了使用泊松分布,某些假设必须成立。 它们是:成功概率在区间内保持不变,区间内不可能同时成功,最后,区间之间的成功概率是独立的,与二项式分布的假设相同。μ
从某种意义上说,泊松分布可以看作是通过将时间分解为离散的独立区间将连续随机变量(通常是时间)转换为离散随机变量的巧妙方法。 这种思考泊松的方式有助于我们理解为什么它可以用来估计二项式分布中离散随机变量的概率。 泊松要求在一段时间内多次成功的概率,而二项式则要求在给定数量的试验中获得一定数量的成功概率。
示例4.4.14
Leah 的答录机在上午 8 点到上午 10 点之间接到大约六个电话。Leah 在接下来的 15 分钟内接到多个电话的概率是多少?
假设 X = Leah 在 15 分钟内接到的电话数量。 (关注间隔为 15 分钟或14小时。)
x=0,1,2,3,...
如果 Leah 平均在两小时内接到六个电话,两个小时内有八个 15 分钟的间隔,那么 Leah 会接到
(18)(6) = 平均在 15 分钟内通话 0.75 次。 所以,\ mu = 0.75 表示这个问题。
X∼P(0.75)
查找P(x>1).P(x>1)=0.1734
Leah 在接下来的 15 分钟内接到多个电话的概率约为 0.1734。
的图表X∼P(0.75)是:
y-axis 包含 wherx eX = 15 分钟内呼叫次数的概率。
示例4.4.15
根据一项调查,一位大学教授平均每天收到7封电子邮件。 假设 X = 教授每天收到的电子邮件数量。 离散随机变量 X 取值 x = 0、1、2... 随机变量 X 的泊松分布:X ~ P (7)。 平均是 7 封电子邮件。
- 电子邮件用户每天恰好收到 2 封电子邮件的概率是多少?
- 电子邮件用户每天最多收到 2 封电子邮件的概率是多少?
- 标准差是多少?
- 回答
-
一个。P(x=2)=μxe−μx!=72e−72!=0.022
b。P(x≤2)=70e−70!+71e−71!+72e−72!=0.029
c. 标准差 =σ=√μ=√7≈2.65
示例4.4.16
短信用户平均每天接收或发送 41.5 条短信。
- 用户每小时收到或发送多少条短信?
- 短信用户每小时收到或发送两条消息的概率是多少?
- 短信用户每小时收到或发送超过两条消息的概率是多少?
- 回答
-
A.let X = 用户在一小时内发送或接收的短信数量。 每小时收到的平均短信数量为41.524 1.7292。
b。P(x=2)=μxe−μx!=1.7292e−1.7292!=0.265
c。P(x>2)=1−P(x≤2)=1−[70e−70!+71e71!+72e−72!]=0.250
示例4.4.17
据报道,从2013年5月13日下午 4:30 开始,阿拉斯加未来48小时内低地震活动的概率约为1.02%。 使用接下来的 200 天内的这些信息,找出在未来 200 天中的 10 天内发生低地震活动的概率。 同时使用二项分布和泊松分布来计算概率。 他们接近了吗?
- 回答
-
假设 X = 地震活动较低的天数。
使用二项分布:
P(x=10)=200!10!(200−10)!×.010210×.9898190=0.000039使用泊松分布:
计算μ=np=200(0.0102)≈2.04P(x=10)=μxe−μx!=2.0410e−2.0410!=0.000045
我们预计近似值是好的,因为它n很大(大于 20)而且p很小(小于 0.05)。 结果很接近——报告的两个概率几乎都为 0。
使用泊松分布估算二项分布
我们之前发现二项分布为超几何分布提供了近似值。 现在我们发现 Poisson 分布可以为二项式提供近似值。 我们说二项分布接近泊松。 二项式分布接近泊松分布,因为 n 变大而 p 变小,所以 np 变为常量值。 关于何时可以说他们会使用泊松来估计二项式,有几个经验法则。 有人认为 np,即二项式的均值,应小于 25。 另一位作者建议它应该小于 7。 另一篇文章指出,泊松的均值和方差都相同,这表明二项式的均值和方差 np 和 n pq 应大于 5。 对于何时可以使用泊松来估计二项式,没有一个被广泛接受的经验法则。
当我们浏览这些概率分布时,我们会得到更复杂的分布,从某种意义上说,这些分布中包含不太复杂的分布。 数学家已经证明了这一主张。 这使我们在下一个概率分布中达到了最高的复杂程度,它可以用作我们到目前为止讨论的所有概率分布的近似值。 这是正态分布。
示例4.4.18
对普莱斯商学院500名高年级学生的调查得出了以下信息。75%的人毕业后直接去工作。15%继续攻读工商管理硕士学位。9%的人留下来攻读另一个课程的辅修课程。
超过2名高年级学生进入研究生院攻读金融硕士学位的可能性是多少?
- 回答
-
这显然是一个二项式概率分布问题。 当我们将结果定义为 “金融研究生院” 与 “所有其他期权” 时,选择是二元的。 随机变量是离散的,我们可以假设事件是独立的。 作为二项式问题求解,我们有:
二项式解决方案
n⋅p=500⋅0.01=5=μ
P(0)=500!0!(500−0)!0.010(1−0.01)500−0=0.00657
P(1)=500!1!(500−1)!0.011(1−0.01)500=0.03318
P(2)=500!2!(500−2)!0.012(1−0.01)5002=0.08363
将所有 3 个加在一起 = 0.12339
1−0.12339=0.87661
泊松近似值
n⋅p=500⋅0.01=5=μ
n⋅p⋅(1−p)=500⋅0.01⋅(0.99)≈5=σ2=μ
P(X)=e−np(np)xx!={P(0)=e−5⋅500!}+{P(1)=e−5⋅511!}+{P(2)=e−5⋅522!}
0.0067+0.0337+0.0842=0.1247
1−0.1247=0.8753
偏离千分之一的近似值当然是可以接受的近似值。