12.1：两个方差的检验

Last updated
Save as PDF

Page ID: 204417

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

本章介绍了一个新的概率密度函数，即\(F\)分布。这种分布用于许多应用程序，包括方差分析，也用于测试多个均值之间的相等性。我们从方差差异假设的\(F\)分布和检验开始。通常需要比较两个方差而不是两个平均值。例如，大学管理人员希望两位考试评分的大学教授的评分差异相同。为了使盖子适合容器，盖子和容器的变化应该大致相同。超市可能会对两个跳棋的退房时间的变化感兴趣。在金融领域，方差是衡量风险的一种方法，因此一个有趣的问题是检验两个不同的投资组合具有相同方差的假设，即波动率。

为了对两个方差进行\(F\)检验，必须满足以下条件：

从中抽取两个样本的种群大致呈正态分布。
这两个群体相互独立。

与本书中的大多数其他假设\(F\)检验不同，两个方差相等的检验对偏离正态非常敏感。如果两个分布不是正态分布或不接近，则检验可能会给出检验统计量的偏差结果。

假设我们从两个独立的正态群体中随机抽样。 Let\(\sigma_1^2\) an\(\sigma_2^2\) d be 未知的总体方差\(s_1^2\)，and\(s_2^2\) be se 样本方差。假设样本数量为\(n_1\)和\(n_2\)。由于我们有兴趣比较两个样本方差，因此我们使用\(F\)比率：

\(F=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}\)

\(F\)有发行版\(F \sim F\left(n_{1}-1, n_{2}-1\right)\)

其中\(n_1 – 1\)是分子的自由度，\(n_2 – 1\)是分母的自由度。

如果原假设为\(\sigma_{1}^{2}=\sigma_{2}^{2}\)，则\(F\)比率（检验统计量）变为\(F_{c}=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}=\frac{s_{1}^{2}}{s_{2}^{2}}\)

所测试的假设的各种形式是：

表 12.1
双尾测试	单尾测试	单尾测试
\(\mathrm{H}_{0} : \sigma_{1}^{2}=\sigma_{2}^{2}\)	\(\mathrm{H}_{0} : \sigma_{1}^{2} \leq \sigma_{2}^{2}\)	\(\mathrm{H}_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\)
\(\mathrm{H}_{1} : \sigma_{1}^{2} \neq \sigma_{2}^{2}\)	\(\mathrm{H}_{1} : \sigma_{1}^{2}>\sigma_{2}^{2}\)	\(\mathrm{H}_{1} : \sigma_{1}^{2}<\sigma_{2}^{2}\)

双尾检验的原假设和备择假设的一种更通用的形式是：

\[H_{0} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}}=\delta_{0}\nonumber\]

\[H_{a} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}} \neq \delta_{0}\nonumber\]

如果\(\delta_{0}=1\)这是对两个方差相等的假设的简单检验，则在哪里。这种形式的假设的好处是允许进行比简单差异更多的检验，并且可以像我们对均值差异和比率差异所做的那样容纳特定差异的检验。这种形式的假设还显示了分布与\(F\)分布之间的关系\(\chi^2\)：\(F\)这是我们在上一章中看到的两个 chi 平方分布的比率。这有助于确定合成\(F\)分布的自由度。

如果两个总体的方差相等，\(s_2^2\)则\(s_1^2\)和的值接近，检验统计量接近\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\)于一。但是，如果这两个人口差异有很大的不同，\(s_1^2\)而且\(s_2^2\)往往也大不相同。选择\(s_1^2\)较大的样本方差会\(\frac{s_{1}^{2}}{s_{2}^{2}}\)导致比率大于 1。如果\(s_1^2\)和相距\(s_2^2\)很远，则\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\)是一个很大的数字。

因此，如果\(F\)接近一，则证据支持原假设（两个总体方差相等）。但是，如果大\(F\)于一，则证据与原假设背道而驰。本质上，我们要问的是计算出的 F 统计量，即检验统计量，是否与 1 有显著差异。

为了确定我们必须找到的关键点\(F_{\alpha,df1,df2}\)。有关该\(F\)表，请参阅附录 A。此\(F\)表具有从 0.1 到 0.001 的各种显著性级别的值，在第一列中指定为 “p”。要找到临界值，请选择所需的显著性水平，然后向下移动，在两个不同自由度的交汇处找到临界值。 \(F\)分布有两个不同的自由度，一个与分子有关\(_{df1}\)，另一个与分母有关。使问题复杂化的是，\(_{df2}\)\(F\)分布不对称，并且随着自由度的变化，偏度会发生变化。分子中的自由度为\(n_1-1\)，其中\(n_1\)是组 1 的样本数量，分母中的自由度为\(n_2-1\)，其中\(n_2\)是组 2 的样本数量。 \(F_{\alpha,df1,df2}\)将在\(F\)分布的上端给出临界值。

要找到分布下端的临界值，请反转自由度并将表中的\(F\)-value 除以 1。

上尾临界值：\(F_{\alpha,df1,df2}\)
下限尾部临界值：\(1/F_{\alpha,df2,df1}\)

当计算值介于临界值之间而不是尾部时，我们不能否定两个方差来自具有相同方差的总体的原假设。\(F\) 如果计算出的 F 值在任一尾尾部，我们就无法接受原假设，就像我们在之前的所有假设检验中所做的那样。

查找\(F\)分布临界值的另一种方法使\(F\)-table的使用变得更加容易。我们在\(F\)表中注意到，的所有值\(F\)都大于一，因此左尾的临界\(F\)值将始终小于一，因为要找到左尾的临界值，我们将一个\(F\)值分成数字一，如上所示。我们还注意到，如果检验统计量分子中的样本方差大于分母中的样本方差，则结果\(F\)值将大于一。因此，此检验的速记方法是确保将两个样本方差中的较大者放在分子中以计算检验统计量。这意味着只需要在\(F\)-table 中找到右尾临界值。

示例 12.1

两位大学教师对他们的数学考试评分方式是否存在差异感兴趣。他们每人对相同的 10 次考试进行评分。第一位教师的成绩差异为 52.3。第二位教师的成绩差异为 89.9。测试第一位教师的方差较小的说法。（在大多数大学中，希望教师之间的考试成绩差异几乎相同。）重要程度为 10%。

回答

解决方案 12.1

假设 1 和 2 为分别表示第一位和第二位教师的下标。

\(n_1 = n_2 = 10\)。

\(H_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\)和\(H_{a} : \sigma_{1}^{2}<\sigma_{2}^{2}\)

计算检验统计量：根据原假设 (\(\sigma_{1}^{2} \geq \sigma_{2}^{2}\))，\(F\)统计量为：

\(F_{c}=\frac{s_{2}^{2}}{s_{1}^{2}}=\frac{89.9}{52.3}=1.719\)

测试的临界值：\(F_{9,9}=5.35\)位置\(n_1 – 1 = 9\)和\(n_2 – 1 = 9\)。

此图显示了非对称的 F 分布曲线。曲线稍微向右倾斜，但近似正常。值 0.5818 标记在曲线峰值右侧的垂直轴上。一条垂直向上的线从 0.5818 延伸到曲线，该线左侧的区域用阴影表示 p 值。 — 图 12.2

做出决定：由于计算出的\(F\)值不在尾部，因此我们无法拒绝\(H_0\)。

结论：根据数据，显著性水平为10％，没有足够的证据得出结论，第一位教师的成绩差异较小。

练习 12.1

纽约合唱协会将男歌手分为四类，从最高声音到最低声音：Tenor1、Tenor2、Bass1、Bass2。表中有 Tenor1 和 Bass2 组中男性的身高。有人怀疑，身高较高的男人的声音会更低，身高差异也可能随着声音的降低而增加。我们是否有充分的证据表明这两个组别（Tenor1和Bass2）中歌手的身高差异是不同的？

表 12.2
男高音 1	低音 2	男高音 1	低音 2	男高音 1	低音 2
69	72	67	72	68	67
72	75	70	74	67	70
71	67	65	70	64	70
66	75	72	66		69
76	74	70	68		72
74	72	68	75		71
71	72	64	68		74
66	74	73	70		75
68	72	66	72

男高音 1	低音 2	男高音 1	低音 2	男高音 1	低音 2
69	72	67	72	68	67
72	75	70	74	67	70
71	67	65	70	64	70
66	75	72	66		69
76	74	70	68		72
74	72	68	75		71
71	72	64	68		74
66	74	73	70		75
68	72	66	72

男高音 1	低音 2	男高音 1	低音 2	男高音 1	低音 2
69	72	67	72	68	67
72	75	70	74	67	70
71	67	65	70	64	70
66	75	72	66		69
76	74	70	68		72
74	72	68	75		71
71	72	64	68		74
66	74	73	70		75
68	72	66	72

男高音 1	低音 2	男高音 1	低音 2	男高音 1	低音 2
69	72	67	72	68	67
72	75	70	74	67	70
71	67	65	70	64	70
66	75	72	66		69
76	74	70	68		72
74	72	68	75		71
71	72	64	68		74
66	74	73	70		75
68	72	66	72