Skip to main content
Global

4.2: 二项式分布

  • Page ID
    205054
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    在许多应用中,一个更有价值的概率密度函数是二项分布。 此分布将计算任何二项式过程的概率。 二项式过程,通常在第一个充分开发其特性的人之后被称为伯努利过程,是指任何一项试验中只有两种可能的结果,称为成功和失败。 它的名字来自二进制数字系统,在该系统中,所有数字都缩减为1或0,这是计算机技术和CD音乐录制的基础。

    二项式公式

    \[b(x)=\left(\begin{array}{l}{n} \\ {x}\end{array}\right) p^{x} q^{n-x}\nonumber\]

    \(b(x)\)当任何一项\(n\)试验的\(X\)成功概率为时,试验成功的概率在哪里\(p\)。 当然\(q=(1-p)\),这是任何一项试验失败的概率。

    我们现在可以明白为什么组合公式也被称为二项式系数,因为它再次出现在二项式概率函数中。 为了使二项式公式起作用,任何一项试验的成功概率在每个试验中都必须相同,换句话说,每个试验的结果必须是独立的。 掷硬币是一个二项式过程,因为一次翻转获得头部的概率并不取决于之前的翻转中发生的情况。 (目前应该注意的是,使用\(p\)作为二项分布的参数违反了人口参数用希腊字母表示的规则。 在许多教科书中\(\theta\)(发音为 theta)代替 p,应该是这样。

    就像一组数据一样,概率密度函数具有描述数据集的平均值和标准差。 对于二项分布,这些由公式给出:

    \[\mu=np\nonumber\]

    \[\sigma=\sqrt{n p q}\nonumber\]

    请注意,p 是这些方程中唯一的参数。 因此,二项式分布被视为来自概率分布的单参数家族。 简而言之,一旦我们知道 p,即在任何一次试验中成功的概率,我们就知道了关于二项式的所有信息。

    在概率论中,在某些情况下,一个概率分布可以用来近似另一个概率分布。 我们说一个是另一个的限制分布。 如果要从大量人口中提取少量数字,即使没有替代品,即使认为这不是二项式过程,我们仍然可以使用二项式。 如果没有替代品,则违反了二项式的独立性规则。 尽管如此,如果我们绘制的总量少于 10%,也就是说 n 小于超几何函数公式中 N 的 10%,我们可以使用二项式来近似实际上是超几何分布的概率。 这种论点的理由是,在抽取一小部分人口时,我们不会以任何有意义的方式将成功概率从平局改为抽奖。 想象一下,不是从一副52张牌中抽出,而是从6副牌中抽出。 说抽出一张王牌的概率并不会改变第二次平局中发生的情况的条件概率,就像现在只有 4 张 A 而不是 24 张王牌可供抽出一样。 这种使用一种概率分布来估计其他概率分布的能力在以后对我们来说将变得非常有价值。

    二项式实验有三个特征。

    1. 试用次数是固定的。 把试验看作是实验的重复。 该字母\(n\)表示试验次数。
    2. 随机变量\(x\),成功次数,是离散的。
    3. 每项试验只有两种可能的结果,分别是 “成功” 和 “失败”。 该字母\(p\)表示任何一项试验的成功概率,并\(q\)表示任何一项试验失败的概率。 \(p + q = 1\)
    4. n 次试验是独立的,使用相同的条件重复试验。 可以把这看作是用替换图画的。 由于 n 个试验是独立的,因此一项试验的结果无助于预测另一项试验的结果。 另一种说法是,对于每项单独的试验\(p\),成功的概率和失败的概率保持不变。\(q\) 例如,随机猜测真假统计问题只有两个结果。 如果成功是猜对了,那么失败就是猜错了。 假设 Joe 在任何统计数据上都猜对了有概率的真假问题\(p = 0.6\)。 然后,\(q = 0.4\)。 这意味着,对于 Joe 回答的每一个真假统计问题,他的成功概率 (\(p = 0.6\)) 和失败概率 (\(q = 0.4\)) 都保持不变。

    二项式实验的结果与二项式概率分布相吻合。 随机变量\(X\) = 在\(n\)独立试验中获得的成功次数。

    二项式概率分布的均值和方差为\(\mu = np\)\(\sigma^2 = npq\)\(\mu\)\(\sigma^2\) 因此\(\sigma\),标准差为\ sigma =\(\sqrt{n p q}\)

    任何具有三和四特征的实验都\(n = 1\)称为伯努利试验(以雅各布·伯努利命名,他在1700年代后期对其进行了广泛研究)。 当在一个或多个伯努利试验中计算成功次数时,就会发生二项式实验。

    示例\(\PageIndex{2}\)

    假设你玩的游戏只能赢或输。 你赢得任何一场比赛的概率为55%,输掉的概率为45%。 你玩的每款游戏都是独立的。 如果你玩了 20 次游戏,请编写一个函数,描述你在 20 次中赢得 15 次的概率。 在这里,如果你定义\(X\)为获胜次数,则\(X\)取值 0、1、2、3、...、20。 成功的概率是\(p = 0.55\)。 失败的概率为\(q = 0.45\)。 试用次数为\(n = 20\)。 概率问题可以用数学来表述为\(P(x = 15)\)

    练习\(\PageIndex{2}\)

    训练师正在教海豚玩花样。 海豚成功完成技巧的概率为35%,而海豚未能成功执行该技巧的概率为65%。 在 20 次尝试中,你想找出海豚成功 12 次的概率。 \(P(X=12)\)使用二项式 Pdf 查找

    示例\(\PageIndex{3}\)

    一枚公平的硬币会被掷出 15 次。 每次翻盖都是独立的。 获得超过十个头的概率是多少? Let\(X\) = 公平硬币翻转 15 次中的头部数量。 \(X\)取值 0、1、2、3、...、15。 既然硬币很公平,\(p = 0.5\)而且\(q = 0.5\)。 试用次数为\(n = 15\)。 用数学方法陈述概率问题。

    回答

    \(P (x > 10)\)

    示例\(\PageIndex{4}\)

    大约 70% 的统计专业学生及时完成作业,以便收集和评分。 每个学生都独立做作业。 在50名学生的统计课中,至少有40名学生按时完成作业的概率是多少? 学生是随机选择的。

    a. 这是一个二项式问题,因为只有成功或 ________,试验次数是固定的,每次试验的成功概率为 0.70。

    回答

    a. 失败

    b. 如果我们对准时完成作业的学生人数感兴趣,那么我们该如何定义\(X\)呢?

    回答

    b.\(X\) = 按时完成作业的统计学生人数

    c. 具有什么\(x\)价值观?

    回答

    c. 0、1、2、...、50

    d. 用言语来说,什么是 “失败”?

    回答

    d. 失败的定义是学生没有按时完成作业。

    成功的概率是\(p = 0.70\)。 试用次数为\(n = 50\)

    e. 如果\(p + q = 1\),那是什么\(q\)

    回答

    e。\(q = 0.30\)

    f. “至少” 一词翻译为概率问题\(P(x\) ____ 40) 的哪种不等式。

    回答

    f. 大于或等于 (\(\geq\))
    概率问题是\(P(x \geq 40)\)

    练习\(\PageIndex{4}\)

    百分之六十五的人在第一次尝试时通过了州驾驶员考试。 随机选出一组 50 名参加驾驶员考试的人。 给出为什么这是二项式问题的两个理由

    练习\(\PageIndex{4}\)

    在2013年NBA常规赛季中,洛杉矶快船队的德安德烈·乔丹的射门得分完成率是联盟中最高的。 DeAndre 的投篮率为 61.3%。 假设你随机选择了 DeAndre 在 2013 赛季拍摄的 80 张镜头样本。 Let\(X\) = 得分的射门次数。

    1. 概率分布是做什么用的\(X\)
    2. 使用公式计算 (i) 均值和 (ii) 标准差\(X\)
    3. 找出 DeAndre 在其中的 60 次射门中得分的概率。
    4. 找出 DeAndre 在超过 50 个这样的射门中得分的概率。