Skip to main content
Library homepage
 
Global

4.3: 几何分布

几何概率密度函数建立在我们从二项式分布中学到的知识之上。 在这种情况下,实验将持续到成功或失败为止,而不是进行一定数量的试验。 几何实验有三个主要特征。

  1. 有一次或多次伯努利试验都失败了,最后一次是成功的。 换句话说,你一直在重复你正在做的事情,直到第一次成功。 然后你停下来。 例如,你向靶心投掷飞镖,直到你击中靶心。 你第一次击中靶心是 “成功”,所以你停止投掷飞镖了。 可能需要六次尝试才能击中靶心。 你可以将试验看作失败、失败、失败、失败、失败、成功、停止。
  2. 从理论上讲,试验的数量可能会永远持续下去。
  3. 每次试验的成功概率和失败的概率是相同的。pq p+q=1q=1p。 例如,当你投出一枚公平骰子时掷出三分的概率为16。 不管你掷多少次骰子都是如此。 假设你想知道在第五轮中获得前三名的概率。 在滚动一到四时,你不会得到一张带三的脸。 每轮的概率为 q =56,即失败的概率。 在第五轮中获得三分的概率是(56)(56)(56)(56)(16)=0.0804
  4. X= 第一次成功之前的独立试验次数。

示例4.3.5

你玩的是一场机会游戏,你可以赢或输(没有其他可能性),直到你输了。 你输的概率是p=0.57。 你输掉比赛需要五场比赛的概率是多少? LetX = 你输掉之前玩的游戏数量(包括输掉的游戏)。 然后 X 取值 1、2、3、... (可能会无限期地持续下去)。 概率问题是P(x=5)

练习4.3.5

你向棋盘投掷飞镖,直到你击中中心区域。 你击中中心区域的概率是p=0.17。 你想找出在击中中心之前需要八次投掷的概率。 它X具有什么价值观?

示例4.3.6

安全工程师认为,其工厂中所有工业事故中有35%是由于员工不遵守指示造成的。 她决定查看事故报告(随机选择并在阅读后在堆中替换),直到找到一份显示员工不遵守指示造成事故的报告。 平均而言,安全工程师在找到显示员工未遵守指示造成事故的报告之前,她期望查看多少报告? 安全工程师必须检查至少三份报告,直到发现一份报告显示员工未按指示造成事故的报告为止?

LetX = 安全工程师必须检查的事故数量,直到她找到一份报告显示员工不遵守指示而造成的事故。 X 取值 1、2、3、... 第一个问题要求你找到预期值或均值。 第二个问题要求你找到P(x3)。 (“至少” 转换为 “大于或等于” 符号)。

练习4.3.6

教师认为 15% 的学生在期末考试中成绩低于 C。 她决定看期末考试(随机选择,阅读后在堆中替换),直到找到分数低于 C 的期末考试。我们想知道教师在找到分数低于 C 的考试之前必须至少考十次考试的概率是什么用数学说的?

示例4.3.7

假设你在大学里找一个住在你五英里以内的学生。 你知道,在25,000名学生中,有55%生活在你五英里以内。 你随机联系大学的学生,直到有人说他或她住在离你五英里以内。 你需要联系四个人的概率是多少?

这是一个几何问题,因为在获得你想要的成功之前,你可能会遇到很多失败。 此外,每当你询问学生是否住在离你五英里以内时,成功的概率大致相同。 没有确定的试用次数(你问学生的次数)。

a. 让X = 你必须问 ____________ 的数目 ____________ 有人说是。

回答

a. LetX = 在有人回答 “是” 之前你必须询问的学生人数。

b. 具有什么X价值观?

回答

b. 1、2、3、...(学生总数)

c. 什么是pq

回答

c。p=0.55;q=0.45

d. 概率问题是P (_______)。

回答

d。P(x=4)

几何表示法:G = 几何概率分布函数

XG(p)

读作 “X是具有几何分布的随机变量”。 参数为p;p = 每次试验的成功概率。

Geometry Pdf 告诉我们第一次成功需要x多次独立试验的概率,每个试验的成功概率为 p。如果每项试验的成功概率为 p,则x第 th 次试验(不在x试验中)是第一次成功的概率是:

P(X=x)=(1p)x1p

对于x=1,2,3,...
的预期值(此分布的平均值)为1/pX 这告诉我们,在获得第一次成功之前,我们需要进行多少次试验,包括成功的试验。 以上形式的几何分布用于对试验次数进行建模,直到第一次成功。 试验次数包括成功的试验:x= 所有试验,包括成功的试验。 这可以从公式的形式看出。 如果X = 包括成功的试验次数,那么我们必须将失败概率乘以失败次数X1(1p)

相比之下,以下形式的几何分布用于对首次成功之前的失效次数进行建模:

P(X=x)=(1p)xp

对于x=0,1,2,3,...
在这种情况下,成功的试验不算作公式中的试验:x= 失败次数。 此分布的预期值(均值)为μ=(1p)p。 这告诉我们在取得成功之前预计会有多少失败。 无论哪种情况,概率序列都是几何序列。

示例4.3.8

假设计算机组件出现缺陷的概率为 0.02。 组件是随机选择的。 找出第一个缺陷由测试的第七个组件引起的概率。 在发现一个组件有缺陷之前,你预计要测试多少组件?

LetX = 在发现第一个缺陷之前测试的计算机组件的数量。

X 取值1,2,3,... 其中p=0.02.XG(0.02)

查找P(x=7)。 回答:P(x=7)=(10.02)71×0.02=0.0177

第七个分量是第一个缺陷的概率为 0.0177。

的图表XG(0.02)是:

此图显示了几何概率分布。 它由左侧的峰值和向下倾斜的柱线组成,每个连续的柱线在右边。 x 轴上的值计算在发现缺陷之前测试的计算机组件的数量。 y 轴以 0.005 为增量从 0 缩放到 0.02。
4.3.2

y-axis 包含概率x,其中X = 测试的计算机组件的数量。 请注意,概率以常见的增量下降。 该增量是每个数字之间的相同比率,被称为几何级数,因此是此概率密度函数的名称。

在找到第一个缺陷组件之前,您预计要测试的组件数量是平均值μ=50

定义为第一次成功之前的失败次数的随机变量的均值的公式为μ=1p=10.02=50

有关将几何随机变量定义4.3.9为首次成功之前的试验次数的示例,请参阅示例。 此几何公式的预期值将与此版本的分布不同。

方差的公式是σ2=(1p)(1p1)=(10.02)(10.021)=2,450

标准差为σ=(1p)(1p1)=(10.02)(10.021)=49.5

终身患胰腺癌的风险约为78分之一(1.28%)。 假设 X = 在有人说自己患有胰腺癌之前你问过的人数。 本例中的随机变量 X 仅包括失败的试验数量,不包括成功找到患有该疾病的人的试验。 这个随机变量的相应公式是上面给出的第二个公式。 那么 X 是一个具有几何分布的离散随机变量:X ~ G(178) 或 X ~ G (0.0128)。

  1. 在有人说他或她患有胰腺癌之前,你问9个人的概率是多少? 这是在问,你问9个人失败而第10个人成功的概率是多少?
  2. 你必须问20个人的概率是多少?
  3. 找出 X 的 (i) 均值和 (ii) 标准差。
回答

一个。P(x=9)=(10.0128)90.0128=0.0114

b。P(x=20)=(10.0128)190.0128=0.01

  1. 意思是 =μ=(1p)p=(10.0128)0.0128=77.12
  2. 标准差 =σ=1pp2=10.01280.0128277.62

练习4.3.9

一个国家的识字率衡量的是15岁及以上能读写的人的比例。 独立联合殖民地的女性识字率为12%。 让X = 你问的女性人数,直到有人说她有读写能力。

  1. 的概率分布是多X少?
  2. 你问五个女人然后一个人说她有读写能力的概率是多少?
  3. 你必须问十个女人的概率是多少?

示例4.3.10

棒球运动员的平均击球率为 0.320。 这是他每次击球时被击中的一般概率。

他在第三次击球之旅中获得第一击的概率是多少?

回答

P(x=3)=(10.32)31×.32=0.1480

在这种情况下,顺序是失败,失败成功。

你预计击球手需要多少次击球才能被击中?

回答

μ=1p=10.320=3.1253

这只是成功的预期值,因此也是分布的平均值。

示例4.3.11

达尔马提亚犬有 80% 的概率有 13 个黑点。 你去看狗展,数点达尔马提亚犬的斑点。 在你找到一只有 13 个黑点的狗之前,你检查一只狗身上的斑点的概率是多少?

回答

P(x=3)=(10.80)3×0.80=0.0064

脚注

1 “艾滋病毒感染率,总数(15-49岁人口的百分比)”,世界银行,2013年。 可通过 http://data.worldbank.org/indicator/...last&sort=desc 在线获得(2013 年 5 月 15 日访问)。