Skip to main content
Global

6.2: 使用正态分布

  • Page ID
    204316
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    下图中的阴影区域表示右侧的区域\(x\)。 该区域由概率表示\(P(X > x)\)。 正态表提供均值、标准正态分布为零和特定值(例如)之间的概率\(x_1\)。 这是图表中从均值到的无阴影部分\(x_1\)

    这是一条正态分布曲线。 在水平轴上标记一个值 x,X。一条垂直线从 x 点延伸到曲线,x 左侧曲线下方的区域被阴影。 该阴影部分的面积表示变量值小于 x 的概率。

    \(\PageIndex{1}\)

    因为正态分布是对称的,所以如果\(x_1\)平均值左侧的距离相同,则左尾的面积、概率将与右尾的阴影区域相同。 另外,请记住,由于这种分布的对称性,一半的概率在均值的右边,一半的概率在均值的左边。

    概率计算

    要找到具有连续随机变量的概率密度函数的概率,我们需要计算函数下方\(X\)在我们感兴趣的值上的面积。 鉴于公式的复杂性,对于正态分布来说,这似乎是一项艰巨的任务。 但是,有一种简单的方法可以得到我们想要的东西。 这里又是正态分布的公式:

    \[f(x)=\frac{1}{\sigma \cdot \sqrt{2 \cdot \pi}} \cdot \mathrm{e}^{-\frac{1}{2} \cdot\left(\frac{x-\mu}{\sigma}\right)^{2}}\nonumber\]

    从正态分布的公式来看,尚不清楚我们将如何求解概率,就像使用之前的概率函数一样。 在那里,我们将数据放入公式中并进行数学运算。

    为了解开这个难题,我们开始知道概率密度函数下的面积就是概率。

    \(\PageIndex{2}\)

    这表明\(X_1\)和之间的面积\(X_2\)是公式中所述的概率:\(P (X_1 \leq X \leq X_2)\)

    找到曲线下方面积所需的数学工具是积分微积分。 两个点 x 1 和 x 2 之间的正态概率密度函数的积分是这两个点之间的曲线下方的面积,是这两个点之间的概率。

    做这些积分并不好玩,而且可能非常耗时。 但是现在,请记住那里有无限数量的正态分布,我们可以考虑平均值为零且标准差为 1 的正态分布。 这种特定的正态分布被命名为标准正态分布。 将这些值放入公式中,可以简化为一个非常简单的方程式。 现在,我们可以很容易地计算出任何值 x 的所有概率,对于这个特定的正态分布,其平均值为零,标准差为 1。 这些文件已经制作,可在文本的附录中查阅,也可以在网络上的任何地方获得。 它们以各种方式呈现。 本文中的表格是最常见的表示形式,设置了从零开始、均值和向外移动的一半分布的概率。 统计表中表格顶部图表中的阴影区域表示从零到水平轴上注明的特定\(Z\)值的概率\(Z\)

    唯一的问题是,即使有了这张表,我们的数据平均值为零而标准差为一也是一个荒谬的巧合。 解决方案是将我们拥有的分布及其均值和标准差转换为这个新的标准正态分布。 标准法线有一个名为的随机变量\(Z\)

    使用标准正态表(通常称为正态表)求出一个标准差的概率,转到该\(Z\)列,向下读取到 1.0,然后在第 0 列读取。 这个数字\(0.3413\)是从零到 1 标准差的概率。 表的顶部是分布中的阴影区域,即一个标准差的概率。 该表解决了我们的积分微积分问题。 但前提是我们的数据均值为零,标准差为 1。

    但是,这里的要点是,一个正态分布上一个标准差的概率在每个正态分布上是相同的。 如果总体数据集的平均值为 10,标准差为 5,则从 10 到 15 的概率(一个标准差)与从零到 1 的概率相同,即标准正态分布上的一个标准差。 要计算任何正态分布的概率和面积,我们只需要将特定的正态分布转换为标准正态分布,然后在表中查找答案即可。 综上所述,这里又是标准化公式

    \[Z=\frac{x-\mu}{\sigma}\nonumber\]

    其中\(Z\)是标准正态分布上的值,\(X\)是人们希望转换为标准正态的正态分布的值,\(\mu\)分别\(\sigma\)是该总体的均值和标准差。 请注意,该方程使用\(\mu\)\(\sigma\)表示总体参数。 这仍在处理概率,所以我们总是在处理总体,包括已知的参数值和已知的分布。 同样重要的是要注意,由于正态分布是对称的,因此在计算概率时 z 分数是正还是负并不重要。 左边的一个标准差(负 Z 分数)覆盖的区域与右边的一个标准差(正 Z 分数)覆盖的区域相同。 这就是为什么标准正态表没有为分布的左侧提供面积的原因。 由于这种对称性,Z 分数公式有时写成:

    \[Z=\frac{|x-\mu|}{\sigma}\nonumber\]

    其中,方程中的垂直线表示数字的绝对值。

    标准化公式真正要做的是计算标准差\(X\)数与其自身分布均值之间的差值。 标准化公式和计算与均值的标准差的概念是我们在这个统计类中将要做的所有事情的秘密。 之所以如此,是因为所有统计数据都归结为变异,而标准差的计数是变异的衡量标准。

    在整个课程中,这个公式将以多种伪装反复出现。

    示例\(\PageIndex{1}\)

    统计课的期末考试分数为正态分布,平均值为 63,标准差为 5。

    a. 计算随机选择的学生在考试中得分超过 65 的概率。
    b. 计算随机选择的学生分数低于 85 的概率。

    回答 a

    \(X\) = 期末考试的分数。 \(X \sim N(63, 5)\),哪里\(\mu = 63\)\(\sigma = 5\)

    画一张图表。

    然后,找到\(P(x > 65)\)

    \(P(x > 65) = 0.3446\)

    这是一条正态分布曲线。 曲线的峰值与水平轴上的点 63 重合。 点 65 也被标记了。 垂直线从点 65 延伸到曲线。 65 右边的概率区域有阴影;它等于 0.3446。

    \(\PageIndex{3}\)

    \[Z_{1}=\frac{x_{1}-\mu}{\sigma}=\frac{65-63}{5}=0.4\nonumber\]

    \(P\left(x \geq x_{1}\right)=P\left(Z \geq Z_{1}\right)=0.3446\)

    任何学生随机选择的分数超过 65 的概率为 0.3446。 以下是我们找到这个答案的方式。

    答案 b

    普通表提供从零到数值的概率\(Z_1\)。 对于这个问题,问题可以写成:\(P(X \geq 65) = P(Z \geq Z1)\),这是尾部的区域。 要找到这个区域,公式是\(0.5 – P(X \leq 65)\)。 一半的概率高于平均值,因为这是对称分布。 该图显示了如何通过将该部分从平均值零减去\(Z_1\)值来找到尾部的面积。 最后的答案是:\(P(X \geq 63) = P(Z \geq 0.4) = 0.3446\)

    \(z=\frac{65-63}{5}=0.4\)

    零平均值左\(Z_1\)边的面积为\(0.1554\)

    \(P(x > 65) = P(z > 0.4) = 0.5 – 0.1554 = 0.3446\)

    \(Z=\frac{x-\mu}{\sigma}=\frac{85-63}{5}=4.4\)它大于标准法线表中的最大值。 因此,一个学生分数低于 85 的概率大约为 1 或 100%。

    分数为 85 表示与平均值 63 相差的 4.4 个标准差,后者超出了标准正态表的范围。 因此,一个学生分数低于 85 的概率大约为一(或 100%)。

    练习\(\PageIndex{1}\)

    学校队的高尔夫分数是正态分布,平均值为 68,标准差为 3。 计算随机选择的高尔夫球手得分低于 65 的概率。

    示例\(\PageIndex{2A}\)

    个人计算机用于在家办公、研究、通信、个人理财、教育、娱乐、社交网络和许多其他事情。 假设一台家用个人计算机用于娱乐的平均小时数为每天两小时。 假设娱乐时间是正态分布的,时间的标准差为半小时。

    a. 计算出每天使用家用个人计算机娱乐 1.8 到 2.75 小时的概率。

    回答

    a. Let\(X\) = 家用个人计算机用于娱乐的时间(以小时为单位)。 \(X \sim N(2, 0.5)\)在哪里\(\mu= 2\)\(\sigma = 0.5\)

    查找\(P(1.8 < X < 2.75)\)

    您要查找的概率是介于\(X = 1.8\)之间的区域\(X = 2.75\)\(P(1.8 < X < 2.75) = 0.5886\)

    这是一条正态分布曲线。 曲线的峰值与水平轴上的点 2 重合。 值 1.8 和 2.75 也在 x 轴上标记。 垂直线从 1.8 和 2.75 延伸到曲线。 线条之间的区域是阴影的。

    \(\PageIndex{4}\)

    \(P(1.8 \leq X \leq 2.75) = P(Z_1 \leq Z \leq Z_2)\)

    家用个人计算机每天使用 1.8 到 2.75 小时进行娱乐的概率为 0.5886。

    示例\(\PageIndex{2B}\)

    b. 计算最底层四分之一家庭每天使用个人计算机娱乐的最大时数。

    回答

    解决方案 6.4

    b. 要计算底层四分之一家庭每天使用个人计算机娱乐的最大时数,请在哪里找到 25 个百分位数\(P(x < k) = 0.25\)\(k\)

    这是一条正态分布曲线。 曲线左尾下方的区域有阴影。 阴影区域显示 x 小于 k 的概率为 0.25。 由此可见 k = 1.67。
    \(\PageIndex{5}\)

    \(f(Z)=0.5-0.25=0.25, \text { therefore } Z \approx-0.675(\text { or just } 0.67 \text { using the table) } Z=\frac{x-\mu}{\sigma}=\frac{x-2}{0.5}=-0.675 , \text {therefore } x=-0.675 * 0.5+2=1.66\)

    最底层的四分之一家庭每天使用个人计算机娱乐的最大时数为1.66小时。

    练习\(\PageIndex{2}\)

    学校队的高尔夫分数是正态分布,平均值为 68,标准差为 3。 找出高尔夫球手得分在 66 到 70 之间的概率。

    示例\(\PageIndex{3}\)

    在美国,年龄在13至55岁以上的智能手机用户大致遵循正态分布,大约平均值和标准差分别为36.9岁和13.9岁。

    a. 确定年龄在 13 至 55 岁以上的随机智能手机用户在 23 到 64.7 岁之间的概率。

    回答

    回答

    a. 0.8186

    b. 0.8413

    示例\(\PageIndex{4}\)

    一位种植橘子的柑橘种植者发现,在他的农场收获的橘子的直径遵循正态分布,平均直径为 5.85 厘米,标准差为 0.24 厘米。

    a. 找出从该农场随机选择的橘子直径大于 6.0 厘米的概率。 绘制图表。

    回答
    这是一条正态分布曲线。 曲线的峰值与水平轴上的点 2 重合。 值 1.8 和 2.75 也在 x 轴上标记。 垂直线从 1.8 和 2.75 延伸到曲线。 线条之间的区域是阴影的。

    \(\PageIndex{6}\)

    \[Z_{1}=\frac{6-5.85}{.24}=.625\nonumber\]

    \(P(x \geq 6) = P(z \geq 0.625) = 0.2670\)

    b. 该农场中间 20% 的橘子的直径介于 ______ 和 ______ 之间。

    \(f(Z)=\frac{0.20}{2}=0.10, \text { therefore } Z \approx \pm 0.25\)

    \(Z=\frac{x-\mu}{\sigma}=\frac{x-5.85}{0.24}=\pm 0.25 \rightarrow \pm 0.25 \cdot 0.24+5.85=(5.79,5.91)\)