4.3: 几何分布
几何概率密度函数建立在我们从二项式分布中学到的知识之上。 在这种情况下,实验将持续到成功或失败为止,而不是进行一定数量的试验。 几何实验有三个主要特征。
- 有一次或多次伯努利试验都失败了,最后一次是成功的。 换句话说,你一直在重复你正在做的事情,直到第一次成功。 然后你停下来。 例如,你向靶心投掷飞镖,直到你击中靶心。 你第一次击中靶心是 “成功”,所以你停止投掷飞镖了。 可能需要六次尝试才能击中靶心。 你可以将试验看作失败、失败、失败、失败、失败、成功、停止。
- 从理论上讲,试验的数量可能会永远持续下去。
- 每次试验的成功概率和失败的概率是相同的。pq p+q=1和q=1−p。 例如,当你投出一枚公平骰子时掷出三分的概率为16。 不管你掷多少次骰子都是如此。 假设你想知道在第五轮中获得前三名的概率。 在滚动一到四时,你不会得到一张带三的脸。 每轮的概率为 q =56,即失败的概率。 在第五轮中获得三分的概率是(56)(56)(56)(56)(16)=0.0804
- X= 第一次成功之前的独立试验次数。
示例4.3.5
你玩的是一场机会游戏,你可以赢或输(没有其他可能性),直到你输了。 你输的概率是p=0.57。 你输掉比赛需要五场比赛的概率是多少? LetX = 你输掉之前玩的游戏数量(包括输掉的游戏)。 然后 X 取值 1、2、3、... (可能会无限期地持续下去)。 概率问题是P(x=5)。
练习4.3.5
你向棋盘投掷飞镖,直到你击中中心区域。 你击中中心区域的概率是p=0.17。 你想找出在击中中心之前需要八次投掷的概率。 它X具有什么价值观?
示例4.3.6
安全工程师认为,其工厂中所有工业事故中有35%是由于员工不遵守指示造成的。 她决定查看事故报告(随机选择并在阅读后在堆中替换),直到找到一份显示员工不遵守指示造成事故的报告。 平均而言,安全工程师在找到显示员工未遵守指示造成事故的报告之前,她期望查看多少报告? 安全工程师必须检查至少三份报告,直到发现一份报告显示员工未按指示造成事故的报告为止?
LetX = 安全工程师必须检查的事故数量,直到她找到一份报告显示员工不遵守指示而造成的事故。 X 取值 1、2、3、... 第一个问题要求你找到预期值或均值。 第二个问题要求你找到P(x≥3)。 (“至少” 转换为 “大于或等于” 符号)。
练习4.3.6
教师认为 15% 的学生在期末考试中成绩低于 C。 她决定看期末考试(随机选择,阅读后在堆中替换),直到找到分数低于 C 的期末考试。我们想知道教师在找到分数低于 C 的考试之前必须至少考十次考试的概率是什么用数学说的?
示例4.3.7
假设你在大学里找一个住在你五英里以内的学生。 你知道,在25,000名学生中,有55%生活在你五英里以内。 你随机联系大学的学生,直到有人说他或她住在离你五英里以内。 你需要联系四个人的概率是多少?
这是一个几何问题,因为在获得你想要的成功之前,你可能会遇到很多失败。 此外,每当你询问学生是否住在离你五英里以内时,成功的概率大致相同。 没有确定的试用次数(你问学生的次数)。
a. 让X = 你必须问 ____________ 的数目 ____________ 有人说是。
- 回答
-
a. LetX = 在有人回答 “是” 之前你必须询问的学生人数。
b. 具有什么X价值观?
- 回答
-
b. 1、2、3、...(学生总数)
c. 什么是p和q?
- 回答
-
c。p=0.55;q=0.45
d. 概率问题是P (_______)。
- 回答
-
d。P(x=4)
几何表示法:G = 几何概率分布函数
X∼G(p)
读作 “X是具有几何分布的随机变量”。 参数为p;p = 每次试验的成功概率。
Geometry Pdf 告诉我们第一次成功需要x多次独立试验的概率,每个试验的成功概率为 p。如果每项试验的成功概率为 p,则x第 th 次试验(不在x试验中)是第一次成功的概率是:
P(X=x)=(1−p)x−1p
对于x=1,2,3,...
的预期值(此分布的平均值)为1/p。X 这告诉我们,在获得第一次成功之前,我们需要进行多少次试验,包括成功的试验。 以上形式的几何分布用于对试验次数进行建模,直到第一次成功。 试验次数包括成功的试验:x= 所有试验,包括成功的试验。 这可以从公式的形式看出。 如果X = 包括成功的试验次数,那么我们必须将失败概率乘以失败次数X−1。(1−p)
相比之下,以下形式的几何分布用于对首次成功之前的失效次数进行建模:
P(X=x)=(1−p)xp
对于x=0,1,2,3,...
在这种情况下,成功的试验不算作公式中的试验:x= 失败次数。 此分布的预期值(均值)为μ=(1−p)p。 这告诉我们在取得成功之前预计会有多少失败。 无论哪种情况,概率序列都是几何序列。
示例4.3.8
假设计算机组件出现缺陷的概率为 0.02。 组件是随机选择的。 找出第一个缺陷由测试的第七个组件引起的概率。 在发现一个组件有缺陷之前,你预计要测试多少组件?
LetX = 在发现第一个缺陷之前测试的计算机组件的数量。
X 取值1,2,3,... 其中p=0.02.X∼G(0.02)
查找P(x=7)。 回答:P(x=7)=(1−0.02)7−1×0.02=0.0177。
第七个分量是第一个缺陷的概率为 0.0177。
的图表X∼G(0.02)是:
y-axis 包含概率x,其中X = 测试的计算机组件的数量。 请注意,概率以常见的增量下降。 该增量是每个数字之间的相同比率,被称为几何级数,因此是此概率密度函数的名称。
在找到第一个缺陷组件之前,您预计要测试的组件数量是平均值μ=50。
定义为第一次成功之前的失败次数的随机变量的均值的公式为μ=1p=10.02=50
有关将几何随机变量定义4.3.9为首次成功之前的试验次数的示例,请参阅示例。 此几何公式的预期值将与此版本的分布不同。
方差的公式是σ2=(1p)(1p−1)=(10.02)(10.02−1)=2,450
标准差为σ=√(1p)(1p−1)=√(10.02)(10.02−1)=49.5
终身患胰腺癌的风险约为78分之一(1.28%)。 假设 X = 在有人说自己患有胰腺癌之前你问过的人数。 本例中的随机变量 X 仅包括失败的试验数量,不包括成功找到患有该疾病的人的试验。 这个随机变量的相应公式是上面给出的第二个公式。 那么 X 是一个具有几何分布的离散随机变量:X ~ G(178) 或 X ~ G (0.0128)。
- 在有人说他或她患有胰腺癌之前,你问9个人的概率是多少? 这是在问,你问9个人失败而第10个人成功的概率是多少?
- 你必须问20个人的概率是多少?
- 找出 X 的 (i) 均值和 (ii) 标准差。
- 回答
-
一个。P(x=9)=(1−0.0128)9⋅0.0128=0.0114
b。P(x=20)=(1−0.0128)19⋅0.0128=0.01
- 意思是 =μ=(1−p)p=(1−0.0128)0.0128=77.12
- 标准差 =σ=√1−pp2=√1−0.01280.01282≈77.62
练习4.3.9
一个国家的识字率衡量的是15岁及以上能读写的人的比例。 独立联合殖民地的女性识字率为12%。 让X = 你问的女性人数,直到有人说她有读写能力。
- 的概率分布是多X少?
- 你问五个女人然后一个人说她有读写能力的概率是多少?
- 你必须问十个女人的概率是多少?
示例4.3.10
棒球运动员的平均击球率为 0.320。 这是他每次击球时被击中的一般概率。
他在第三次击球之旅中获得第一击的概率是多少?
- 回答
-
P(x=3)=(1−0.32)3−1×.32=0.1480
在这种情况下,顺序是失败,失败成功。
你预计击球手需要多少次击球才能被击中?
- 回答
-
μ=1p=10.320=3.125≈3
这只是成功的预期值,因此也是分布的平均值。
示例4.3.11
达尔马提亚犬有 80% 的概率有 13 个黑点。 你去看狗展,数点达尔马提亚犬的斑点。 在你找到一只有 13 个黑点的狗之前,你检查一只狗身上的斑点的概率是多少?
- 回答
-
P(x=3)=(1−0.80)3×0.80=0.0064
脚注
1 “艾滋病毒感染率,总数(15-49岁人口的百分比)”,世界银行,2013年。 可通过 http://data.worldbank.org/indicator/...last&sort=desc 在线获得(2013 年 5 月 15 日访问)。