Skip to main content
Global

8.1:总体标准差、已知样本量或大样本量的置信区间

  • Page ID
    204301
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    具有已知总体标准差的总体均值的置信区间基于中心极限定理的结论,即样本均值的抽样分布遵循近似正态分布。

    计算置信区间

    以讨论中心极限定理时制定的抽样分布标准化公式为例:

    \[Z_{1}=\frac{\overline{X}-\mu_{\overline{X}}}{\sigma_{\overline{X}}}=\frac{\overline{X}-\mu}{\sigma / \sqrt{n}}\nonumber\]

    请注意,\(\mu\)它被替换了,\(\mu_{\overline{x}}\)因为我们知道的预期值\(\mu\)来自中心极限定理\(\sigma / \sqrt{n}\),取而\(\sigma_{\overline{x}}\)代之\(\mu_{\overline{x}}\)的是也来自中心极限定理。

    在这个公式中\(\overline X\),我们知道\(\sigma_{\overline{x}}\)\(n\)样本数量。 (实际上,我们不知道总体标准差,但根据我们采集的样本\(s\),我们确实有一个点估计值。 稍后会详细介绍。) 我们不知道的是\(\mu\)\(Z_1\)。 我们可以用另一个来解决其中任何一个。 根据\(Z_1\)给出求解:\(\mu\)

    \[\mu=\overline{X} \pm Z_{1} {\sigma} / \sqrt{n}\nonumber\]

    记住中心极限定理告诉我们,的分布,即均值\(\overline X\)的抽样分布,是正态分布,并且正态分布是对称的,我们可以这样重新排列项:

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    这是总体均值的置信区间的公式。

    请注意,在此方程\(Z_1\)\(Z_\alpha\)已将其替换。 这是统计学家必须做出选择的地方。 分析师必须决定他们希望对置信区间施加的置信水平。 \ alpha 是区间不包含真实总体均值的概率。 置信度定义为\((1-\alpha)\)\(Z_\alpha\)是具有一定概率的标准\(\overline X\)差数与均值之间的偏差。 如果\(Z_\alpha = 1.96\)我们选择,则要求95%的置信区间,因为我们将真实均值位于范围内的概率设置为0.95。 如果我们将概\(Z_\alpha\)率设置为1.64,则要求90%的置信区间,因为我们将概率设置为0.90。 这些数字可以通过查阅标准标准表来验证。 将 0.95 或 0.90 除以两半,然后在表格正文中找到该概率。 然后在上边距和左边距上读取获得此概率水平所需的标准差数。

    实际上,只要改变公式中的\(Z_\alpha\)值,我们就可以设定我们想要的任何信心水平。 这是分析师的选择。 经济学和大多数社会科学中的常见惯例将置信区间设定为90%、95%或99%的水平。 低于 90% 的水平被认为没有什么价值。 特定区间估计值的置信度由调用\((1-\alpha)\)

    观察置信区间发展情况的一个好方法是以图形方式描述请求置信区间问题的解决方案。 图\(\PageIndex{2}\)中显示了简介中有关从 iTunes 下载次数的示例。 这种情况是针对95%的置信区间,但根据分析师的需求,也可以很容易地选择其他置信水平。 但是,置信度必须预先设定,不得因计算结果而修改。

    这是一条正态分布曲线。 点 z0.01 被标记在曲线的右边,该点右边的区域有阴影。 该阴影区域的面积等于 0.01。 无阴影区域等于 0.99。
    \(\PageIndex{2}\)

    在此示例中,假设我们知道 iTunes 的实际总体平均下载量为 2.1。 真实总体均值在 95% 置信区间的范围内。 绝对没有什么可以保证会发生这种情况。 此外,如果真实均值落在区间之外,我们永远不会知道。 我们必须永远记住,我们永远不会知道真正的意思。 统计数据仅允许我们在给定的概率水平(置信度)下说真实均值在计算的范围内。 这就是导言中所说的 “承认的无知程度”。

    更改置信水平或样本数量

    这里再次是假设我们知道总体标准差的未知总体均值的置信区间的公式:

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    很明显,置信区间是由两个因素驱动的:选定的置信水平和抽样分布的标准差。\(Z_\alpha\) 抽样分布的标准差进一步受到两个因素的影响,即总体的标准差和我们为数据选择的样本数量。 在这里,我们希望研究我们所做的每项选择对计算出的置信区间、置信水平和样本数量的影响。

    暂时我们应该问一下我们在置信区间内想要什么。 我们的目标是估计样本中的总体均值。 除非我们的人口极少且收集相关数据的成本非常低,否则无论如何,我们都无法找到真正的总体均值和人口标准差。 在所有其他情况下,我们必须依靠样品。 有了中心极限定理,我们就有了在给定置信度下提供有意义的置信区间的工具,这意味着已知的错误概率。 我们所说的有意义的置信区间是指有用的置信区间。 想象一下,你被要求根据同学的年龄提供置信区间。 您采集了一个样本,找到了19.8年的平均值。 你希望非常有信心,所以你报告的间隔在9.8年到29.8年之间。 这个区间肯定会包含真实的总体均值,并且具有非常高的置信水平。 但是,它几乎不算有意义。 在具有高置信度的同时,最佳置信区间较窄。 这两个目标之间自然存在紧张关系。 置信度越高,置信区间越宽,如同年龄以上的学生一样。 我们可以在置信区间的方程中看到这种张力。

    \[\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\nonumber\]

    置信区间的宽度将随着\(Z_\alpha\)增加而\(Z_\alpha\)增加,随着置信水平的提高而增加。 在置信水平和区间宽度之间需要权衡。 现在让我们再看一遍公式,我们发现样本数量在置信区间的宽度中也起着重要作用。 样本大小 nn 显示在抽样分布标准差的分母中。 随着样本数量的增加,抽样分布的标准差会减小,从而减小置信区间的宽度,同时保持置信水平不变。 这种关系如图所示\(\PageIndex{8}\)。 尽管我们随后面临第二个限制,即收集数据的成本,但我们再次看到了使用大量样本进行分析的重要性。

    计算置信区间:另一种方法

    接近置信区间的另一种方法是使用一种叫做 “错误界限” 的东西。 Error Bound 之所以得名,是因为它认识到它提供了从采样分布的标准误差得出的区间边界。 在上面的方程中可以看出,区间只是估计的均值、样本均值,加上或减去某物。 这是误差界限,由我们希望在估计值中维持的概率乘以抽样分布的标准差驱动。\(Z_\alpha\) 均值的误差界限被命名为 “错误界限均值” 或\(EBM\)

    要为单一未知总体均值构造置信区间\(\mu\)其中总体标准差是已知的,我们需要\(\overline x\)作为估计值\(\mu\),也需要误差幅度。 在这里,误差幅度\((EBM)\)称为总体均值(缩写为 EBM)的误差界限。 样本均值\(\overline x\)是未知总体均值的点估计值\(\mu\)

    置信区间估计值将采用以下形式:

    (点估计值-误差界限、点估计值+误差界限)或者,用符号表示\((\overline{x}-E B M, \overline{x}+E B M)\)

    此置信区间的数学公式为:

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\]

    误差幅度 (EBM) 取决于置信水平(缩写为 CL)。 置信水平通常被视为计算出的置信区间估计值包含真实总体参数的概率。 但是,如果说置信水平是重复采集样本时包含真实总体参数的置信区间的百分比,则更为准确。 大多数情况下,构建置信区间的人会选择90%或更高的置信水平,因为该人希望合理地确定自己的结论。

    还有另一种概率叫做 alpha (\(\alpha\))。 \(\alpha\)与信心水平有关\(CL\)\(\alpha\)是区间不包含未知总体参数的概率。
    从数学上讲,\(1 - \alpha = CL\)

    具有已知标准差的总体均值的置信区间基于样本均值的抽样分布遵循近似正态分布这一事实。 假设我们的样本的平均值为\(\overline x = 10\),我们在此构造了 90% 的置信区间\((5, 15)\)\(EBM = 5\)

    要获得 90% 的置信区间,我们必须包括正态分布概率的中心 90%。 如果我们包括中心的 90%,则两条尾部\(\alpha = 10%\)总共省略正态分布的 5%,或每条尾部的 5%。

    这是一条正态分布曲线。 曲线的峰值与水平轴上的点 10 重合。 点 5 和 15 在轴上标注。 从这些点到曲线绘制垂直线,直线之间的区域用阴影绘制。 阴影区域的面积等于 0.90。
    \(\PageIndex{3}\)

    要获取 90% 的中心值,我们必须在计算的样本均值的两侧取出 1.645 个标准差。 值 1.645 是来自标准正态概率分布的 z 得分,该分布将面积置于 0.90 的中心位置,0.05 的面积位于最左尾处,最右尾的面积为 0.05。

    重要的是,所使用的标准差必须适合我们正在估计的参数,因此在本节中,我们需要使用适用于抽样分布的标准差,我们使用中心极限定理研究的均值\(\frac{\sigma}{\sqrt{n}}\)

    使用 EMB 计算置信区间

    要构造未知总体均值的置信区间估计值,我们需要来自随机样本的数据。 构造和解释置信区间的步骤是:

    • 根据样本数据计算样本均值\(\overline x\)。 请记住,在本节中,我们知道总体标准差\(\sigma\)
    • 从标准法线表中找到与所需置信度相对应的 z 得分。
    • 计算误差界限\(EBM\)
    • 构造置信区间。
    • 写一句话,在问题情况的背景下解释估计。

    我们将首先更详细地研究每个步骤,然后用一些示例说明该过程。

    找出规定置信度的 z 分数

    当我们知道总体标准差\ sigma 时,我们使用标准正态分布来计算误差界限\(EBM\)并构造置信区间。 我们需要找到该值将一个等于置信水平(十进制)的面积置于标准正态分布的中间\(Z \sim N(0, 1)\)\(z\)

    置信水平是标准正态分布中间的区域。\(CL\) \(CL = 1 – \alpha\)\(\alpha\),两条尾部之间平均分配的区域也是如此。 每条尾部都包含一个等于的面积\(\frac{\alpha}{2}\)

    右侧有区域的 z 分数\(\frac{\alpha}{2}\)用表示\(Z_{\frac{\alpha}{2}}\)

    例如,when\(CL = 0.95\)\(\alpha = 0.05\)、and\(\frac{\alpha}{2} = 0.025\); 我们写\(Z_{\frac{\alpha}{2}}\) = Z_ {0.025}\)。

    右边的区域\(Z_{0.025}\)是 0.025,左边的区域\(Z_{0.025}\)\(1 – 0.025 = 0.975\)

    \(Z_{\frac{\alpha}{2}} = Z_{0.025} = 1.96\),使用标准正态概率表。 稍后我们将看到,我们可以使用不同的概率表,即学生的 t 分布,来查找常用置信水平的标准差数。

    计算误差界限 (EBM)

    已知总体标准差\ sigma 时,未知总体均值\ mu 的误差界限公式为

    • \(E B M=\left(Z \frac{\alpha}{2}\right)\left(\frac{\sigma}{\sqrt{n}}\right)\)

    构造置信区间

    • 置信区间估计值的格式\((\overline{x}-E B M, \overline{x}+E B M)\)或公式为:\(\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\)

    该图描绘了整个情况。

    \(C L+\frac{\alpha}{2}+\frac{\alpha}{2}=C L+\alpha=1\)

    这是一条正态分布曲线。 曲线的峰值与水平轴上的点 x-bar 重合。 x-bar-EBM 和 x-bar + EBM 点在轴上标记。 从这些点到曲线绘制垂直线,直线之间的区域用阴影绘制。 阴影区域的面积等于 1-a,表示置信水平。 每条没有阴影的尾巴都有 a/2 区域。

    \(\PageIndex{4}\)

    示例\(\PageIndex{1}\)

    假设我们对考试的平均分数感兴趣。 随机抽取 36 个分数的样本,得出的样本均值(样本平均分数)为 68(X−X-= 68)。 在这个例子中,我们不寻常地知道总体标准差为 3 个点。 不要指望在教科书示例之外了解人口参数。 找到总体平均考试分数(所有考试的平均分数)的置信区间估计值。

    找出统计学考试分数的真实(总体)均值的 90% 置信区间。

    回答

    解决方案 8.1

    • 解决方案逐步显示。

    要找到置信区间,需要样本均值\(\overline x\)、和\(EBM\)

    • \(\overline x = 68\)
    • \(EBM = \left(Z_{\frac{\alpha}{2}}\right)\left(\frac{\sigma}{\sqrt{n}}\right)\)
    • \(\sigma = 3\);\(n = 36\); 置信水平为 90%\((CL = 0.90)\)

    \(CL = 0.90\)所以\(\alpha = 1 – CL = 1 – 0.90 = 0.10\)

    \(\frac{\alpha}{2}=0.05, Z_{\frac{\alpha}{2}}=z_{0.05}\)

    右边的区域\(Z_{0.05}\)\(0.05\),左边的区域\(Z_{0.05}\)\(1 – 0.05 = 0.95\)

    \(Z_{\frac{\alpha}{2}}=Z_{0.05}=1.645\)

    这可以通过计算机找到,也可以使用标准正态分布的概率表来找到。 由于对社会科学的普遍信心水平为 90%、95% 和 99%,不久之后你就会熟悉这些数字,即 1.645、1.96 和 2.56

    \(E B M=(1.645)\left(\frac{3}{\sqrt{36}}\right)=0.8225\)

    \(\overline{x}-E B M=68-0.8225=67.1775\)

    \(\overline{x}+E B M=68+0.8225=68.8225\)

    90% 的置信区间为 (67.1775、68.8225)。

    口译

    我们以90%的置信度估计,所有统计专业学生的真实人口平均考试分数在67.18和68.82之间。

    示例\(\PageIndex{2}\)

    假设我们使用 95% 的置信水平改变\(\PageIndex{1}\)示例中的原始问题。 找出真实(总体)平均统计考试分数的 95% 置信区间。

    回答

    解决方案 8.2

    \(\PageIndex{5}\)

    \[\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\nonumber\]

    \[\mu=68 \pm 1.96\left(\frac{3}{\sqrt{36}}\right)\nonumber\]

    \[67.02 \leq \mu \leq 68.98\nonumber\]

    \(\sigma = 3\);\(n = 36\); 置信水平为 95% (\(CL = 0.95\))。

    \(CL = 0.95\)所以\(\alpha = 1 – CL = 1 – 0.95 = 0.05\)

    \(Z_{\frac{\alpha}{2}}=Z_{0.025}=1.96\)

    请注意,如果原始问题的置信水平为 95%,则更大。\(EBM\)

    比较结果

    90% 的置信区间为 (67.18, 68.82)。 95% 的置信区间为 (67.02, 68.98)。 95% 的置信区间更宽。 如果你看一下图表,因为面积 0.95 大于区域 0.90,所以 95% 的置信区间更宽是有道理的。 为了更确信置信区间确实包含所有统计学考试分数的总体均值的真实值,置信区间必须更大。 这说明了一个非常重要的置信区间原理。 在置信水平和区间宽度之间需要权衡。 我们的愿望是有一个狭窄的置信区间,巨大的宽区间提供的有用信息很少。 但是我们也希望对我们的区间有很高的信心。 这表明我们不能两者兼而有之。

    第 (a) 部分显示了正态分布曲线。 面积等于 0.90 的中心区域被加上阴影。 曲线每条无阴影尾部的面积等于 0.05。 第 (b) 部分显示了正态分布曲线。 面积等于 0.95 的中心区域被加上阴影。 曲线每条无阴影尾部的面积等于 0.025。

    \(\PageIndex{6}\)

    摘要:改变置信水平的影响

    • 提高置信水平会延长置信区间。
    • 降低置信水平会使置信区间变窄。

    再说一遍,这里是假设我们有总体标准差的未知均值的置信区间的公式:

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    抽样分布的标准差由中心极限定理提供\(\sigma / \sqrt{n}\)。 虽然我们很少选择样本数量,但它在置信区间中起着重要作用。 由于样本数量在方程的分母中,因此随着样本数量的\(n\)增加,它会导致采样分布的标准差减小,从而使置信区间的宽度减小。 我们之前在回顾样本量对中心极限定理的影响时遇到了这个问题。 在那里,我们看到,随着抽样分布的\(n\)增加,抽样分布会变窄,直到达到极限值,它在真实总体均值上崩溃。

    示例\(\PageIndex{3}\)

    假设我们在示例中更改了原始问题\(\PageIndex{1}\),以查看如果样本数量发生变化,置信区间会发生什么。

    除样本量外,所有内容保持不变。 使用最初的 90% 置信水平。 如果我们增加样本数量并\(n = 100\)改用置信区间,则置信区间会\(n = 36\)怎样? 如果我们将样本量减少到\(n = 25\)而不是\(n = 36\)

    回答

    解决方案 8.3

    解决方案 A

    \(\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\)

    \(\mu=68 \pm 1.645\left(\frac{3}{\sqrt{100}}\right)\)

    \(67.5065 \leq \mu \leq 68.4935\)

    如果我们将样本数量增加\(n\)到 100,则相对于原始样本数量 36 个观测值,我们就会小置信区间的宽度。

    回答

    解决方案 8.3

    解决方案 B

    \(\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\)

    \(\mu=68 \pm 1.645\left(\frac{3}{\sqrt{25}}\right)\)

    \(67.013 \leq \mu \leq 68.987\)

    如果我们将样本数量减\(n\)到 25,则与 36 个观测值的原始样本数量相比,我们会增加置信区间的宽度。

    摘要:更改样本数量的影响

    • 增加样本数量会使置信区间变窄。
    • 减小样本数量会使置信区间变宽。

    当我们回顾改变样本大小 n 对中心极限定理的影响时,我们已经看到了这种影响。 参见图\(\PageIndex{7}\),看看这个效果。 在此之前,随着样本数量的增加,抽样分布的标准差会降低。 这就是为什么我们从大样本中选择样本均值而不是小样本的原因,所有其他因素都保持不变。

    到目前为止,我们假设我们知道总体标准差。 实际上,情况永远不会如此。 但是,我们将得到样本标准差 s。 这是总体标准差的点估计值,在某些情况下可以替换为均值的置信区间公式。 在讨论中心极限定理时,我们刚刚看到了样本数量对置信区间宽度的影响以及对抽样分布的影响。 如果样本数量大 “足够”,我们可以调用它来用点估计值代替标准差。 仿真研究表明,30 个或更多的观测值足以消除估计置信区间中的任何有意义的偏差。

    示例\(\PageIndex{4}\)

    春假可能是一个非常昂贵的假期。 对80名学生进行了抽样调查,学生在旅行和饮料上的平均支出为593.84美元。 样本标准差约为 369.34 美元。

    为春假者花费的总体平均金额构建 92% 的置信区间。

    回答

    解决方案 8.4

    我们从均值的置信区间开始。 我们使用公式计算均值,因为随机变量是花费的美元,这是一个连续的随机变量。 总体标准差 s 的点估计值取代了真实总体标准差,因为在 80 个观测值中,不必担心置信区间估计值中的偏差。

    \[\mu=\overline{x} \pm\left[Z_{(\mathrm{a} / 2)} \frac{s}{\sqrt{n}}\right]\nonumber\]

    将这些值代入公式中,我们有:

    \[\mu=593.84 \pm\left[1.75 \frac{369.34}{\sqrt{80}}\right]\nonumber\]

    \(Z_{(a / 2)}\)可以在标准法线表中向上查找 0.46,然后在表格侧面和顶部找到标准差数;1.75。 因此,该间隔的解是:

    \[\mu=593.84 \pm 72.2636=(521.57,666.10)\nonumber\]

    \[\$ 521.58 \leq \mu \leq \$ 666.10\nonumber\]

    \(\PageIndex{7}\)

    配方回顾

    单一总体均值、已知标准差、正态分布的置信区间的一般形式由以下公式给出:当总体标准差已知时使用\(\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\)此公式。

    \(CL\)= 置信水平,或创建的预计包含真实总体参数的置信区间的比例

    \(\alpha = 1 – CL\)= 不包含总体参数的置信区间的比例

    \(z_{\frac{\alpha}{2}}\)= z 分数,其属性为 z 分数右侧的区域是\(\frac{\propto}{2}\)这是计算 “\(EBM\)” 时使用的 z 得分,其中\(\alpha = 1 – CL\)