8.3: 总体比例的置信区间

Last updated
Save as PDF

Page ID: 204321

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

在选举年，我们在报纸上看到文章以比例或百分比说明了置信区间。例如，对竞选总统的特定候选人的民意调查可能显示该候选人在三个百分点内获得40％的选票（如果样本足够大）。通常，选举民意调查的计算置信度为95％，因此，民意调查员对支持候选人的真实选民比例将在0.37和0.43之间有95％的信心。

股票市场的投资者对每周上涨和下跌的股票的真实比例感兴趣。销售个人计算机的企业对美国家庭拥有个人计算机的比例感兴趣。可以根据每周上涨或下跌的股票的真实比例以及美国拥有个人计算机的家庭的真实比例来计算置信区间。

查找总体比率置信区间的过程与总体均值的置信区间的过程类似，但公式尽管在概念上相同，但略有不同。尽管公式不同，但它们基于中心极限定理为我们提供的相同数学基础。因此，我们将使用相同的三条信息看到相同的基本格式：相关参数的样本值、相关抽样分布的标准差以及我们对估计值具有所需置信度所需的标准差数。

你怎么知道你在处理比例问题？ 首先，基础分布具有二进制随机变量，因此是二项分布。（没有提到均值或平均值。）如果\(X\)是二项式随机变量，则\(X \sim B(n, p)\)其中\(n\)是试验次数和\(p\)成功概率。要形成样本比例\(X\)，请取成功次数的随机变量\(n\)，然后将其除以试验次数（或样本数量）。随机变量\(P^{\prime}\)（读取 “P 素数”）是样本比例，

\[P^{\prime}=\frac{X}{n} \nonumber\]

（有时随机变量表示为\(\hat{P}\)，读作 “P hat”。）

\(P^{\prime}\)= 成功率的估计比例或成功的样本比例（\(P^{\prime}\)是实际总体比率的分数估计值，因此\(q\)是任何一项试验中失败的概率。）\(p\)
\(x\)= 样本中的成功次数
\(n\)= 样本的大小

总体比率的置信区间公式采用与总体均值估计值的置信区间公式相同的格式。记住第 7 章中比例的抽样分布，发现标准差为：

\[\sigma_{\mathrm{p}^{\prime}}=\sqrt{\frac{p(1-p)}{n}}\nonumber\]

因此，总体比例的置信区间变为：

\[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

\(Z_{\left(\frac{a}{2}\right)}\)是根据我们想要的置信度设置\(\sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\)的，是抽样分布的标准差。

样本比率\(\bf{p^{\prime}}\)和\(\bf{q^{\prime}}\)是未知总体比率的估计值\(\bf{p}\)，以及\(\bf{q}\). 之所以使用估计比率\(p^{\prime}\)和\(q^{\prime}\)，是因为\(p\)和\(q\)未知。

请记住，随着从 0.5 进一步\(p\)移动，二项式分布变得不那么对称。因为我们用对称正态分布估算二项式，所以距离对称越远，二项式对估计值的信心就越低。

这个结论可以通过以下分析来证明。比率基于二项式概率分布。可能的结果是二进制的，要么是 “成功”，要么是 “失败”。这就产生了一个比例，即 “成功” 结果的百分比。结果表明，如果我们只知道任何一项名为 “的试验” 的成功概率，就可以完全理解二项式分布\(p\)。发现二项式的平均值和标准差为：

\[\mu=\mathrm{np}\nonumber\]

\[\sigma=\sqrt{npq}\nonumber\]

研究还表明，如果 BOTH AND 大于 5，则可以通过正态分布估算二项式。\(np\)\(nq\) 从上面的讨论中可以看出，二项分布的标准化公式是：

\[Z=\frac{\mathrm{p}^{\prime}-p}{\sqrt{\left(\frac{p q}{n}\right)}}\nonumber\]

这只不过是重述一般标准化公式，用适当替代二项式\(\mu\)和二项式\(\sigma\)取代。我们可以使用标准正态分布，原因\(Z\)在方程中，因为正态分布是二项式的极限分布。这是中心极限定理的另一个例子。我们已经看到，均值的抽样分布是正态分布的。回想一下第 7 章中关于比率抽样分布的详细讨论和中心极限定理的结论。

现在，我们可以像查找均值的置信区间一样操作此公式，但要找到二项式总体参数的置信区间\(p\)。

\[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

其中\(p^{\prime} = x/n\)，从样本中\(p\)提取的分数估计值。请注意，公式\(p\)中\(p^{\prime}\)已将其替换。这是因为我们不知道\(p\)，事实上，这正是我们想要估计的。

遗憾的是，对于样本数量较小的情况，没有校正系数\(np^{\prime}\)，因此\(nq^{\prime}\)必须始终大于 5 才能得出区间估计值\(p\)。

示例\(\PageIndex{1}\)

假设雇用了一家市场研究公司来估算生活在大城市中拥有手机的成年人的百分比。对这座城市随机选择的五百名成年居民进行了调查，以确定他们是否有手机。在抽样的500人中，有421人回答 “是” ——他们拥有手机。使用 95% 的置信水平，计算该城市拥有手机的成年居民的真实比例的置信区间估计值。

回答

分步解决方法。

Let\(X\) = 样本中拥有手机的人数。 \(X\)是二项式：随机变量是二进制的，人们要么有手机，要么没有。

要计算置信区间，我们必须找到\(p^{\prime}, q^{\prime}\)。

\(n = 500\)

\(x=\text { the number of successes in the sample }=421\)

\(p^{\prime}=\frac{x}{n}=\frac{421}{500}=0.842\)

\(p^{\prime}=0.842\)是样本比例；这是总体比例的点估计值。

\(q^{\prime}=1-p^{\prime}=1-0.842=0.158\)

既然请求的置信水平是\(CL = 0.95\)，那么\(\alpha=1-C L=1-0.95=0.05\left(\frac{\alpha}{2}\right)=0.025\)。

那么\(z_{\frac{\alpha}{2}}=z_{0.025}=1.96\)

这可以使用表中的标准正态概率表找到\(\PageIndex{6}\)。这也可以在学生 t 表的 0.025 列和无穷自由度中找到，因为在无限自由度下，学生 t 分布变为标准正态分布\(Z\)。

真实二项式总体比率的置信区间为

\(\text{Substituting in the values from above we find the confidence interval is : } 0.810 \leq p \leq 0.874\)

口译

我们以95％的置信度估计，该城市所有成年居民中有81％至87.4％拥有手机。

95% 置信水平的解释

以这种方式构建的置信区间中有百分之九十五将包含该城市所有拥有手机的成年居民的人口比例的真实值。

练习\(\PageIndex{1}\)

假设对 250 名随机选择的人进行了调查，以确定他们是否拥有平板电脑。在250名受访者中，有98人表示拥有平板电脑。使用 95% 的置信水平，计算拥有平板电脑的人的真实比例的置信区间估计值。

示例\(\PageIndex{2}\)

Dundee Dog Training School 参加竞技职业赛事的客户比例高于平均水平。构造了参加 150 所不同训练学校职业赛事的犬种群比例的置信区间。下限被确定为 0.08，上限被确定为 0.16。确定用于构造参加职业赛事的狗的种群比例间隔的置信水平。

回答

我们从比例置信区间的公式开始，因为随机变量是二进制的；要么客户参加职业竞技狗比赛，要么不参加。

\[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

接下来我们找到样本比例：

\[p^{\prime}=\frac{0.08+0.16}{2}=0.12\nonumber\]

因此\(\pm\)，构成置信区间的就是\(0.04; 0.12 + 0.04 = 0.16\)和\(0.12 − 0.04 = 0.08\)置信区间的边界。最后，我们求解\(Z\)。

\(\left[Z \cdot \sqrt{\frac{0.12(1-0.12)}{150}}\right]=0.04, \textbf { therefore } \bf{z=1.51}\)

然后在标准正态表上查找 1.51 个标准差的概率。

\(p(Z=1.51)=0.4345, p(Z) \cdot 2=0.8690 \textbf { or } 86.90 \%\)。

示例\(\PageIndex{3}\)

一家公司的财务官员想要估算逾期超过30天的应收账款的百分比。他调查了 500 个账户，发现有 300 个账户的逾期已超过 30 天。计算逾期超过 30 天的应收账款的真实百分比的 90% 置信区间，并解释置信区间。

回答

解决方案是逐步解决的：

以这种方式构建的所有置信区间中有百分之九十包含逾期 30 天的应收账款总体百分比的真实值。

90% 置信水平的解释

\(x = 300\)和\(n = 500\)

\(p^{\prime}=\frac{x}{n}=\frac{300}{500}=0.600\)

\(q^{\prime}=1-p^{\prime}=1-0.600=0.400\)

既然置信水平 =\(0.90\)，那么\(a=1-\text { confidence level }=(1-0.90)=0.10\left(\frac{\alpha}{2}\right)=0.05\)

\(Z_{\frac{\alpha}{2}}=Z_{0.05}=1.645\)

可以使用标准正态概率表找到此 Z 值。也可以通过在 0.05 列输入表格并在该行读取无限自由度来使用学生的 t 表。 t 分布是无限自由度的正态分布。这是在为常用置信度寻找 Z 值时要记住的便捷技巧。我们使用这个公式来计算比率的置信区间：

用上面的值代替，我们发现真正的二项式总体比率的置信区间为\(0.564 \leq p \leq 0.636\)

口译

我们以90％的置信度估计，所有逾期30天的应收账款的真实百分比在56.4％至63.6％之间。替代措辞：我们以90％的置信度估计，所有账户中有56.4％至63.6％已过期30天。

练习\(\PageIndex{2}\)

一名学生对学校进行民意调查，看看学区的学生是赞成还是反对有关校服的新立法。她对600名学生进行了调查，发现有480名学生反对新立法。

计算反对新立法的学生的真实百分比为 90% 的置信区间，并解释置信区间。
在 300 名学生的样本中，有 68% 的学生表示他们拥有 iPod 和智能手机。计算拥有 iPod 和智能手机的学生的真实百分比为 97% 的置信区间。