11.2: 单方差检验
- Page ID
- 204578
到目前为止,我们的兴趣完全集中在人口参数\(μ\)或二项式中的对应参数上\(p\)。 当然,总体的平均值是掌握的最关键的信息,但在某些情况下,我们对某些分布结果的可变性感兴趣。 在几乎所有的生产过程中,质量的衡量标准不仅是机器与目标的匹配程度,还包括过程的可变性。 如果有人用薯片装满袋子,不仅会对袋子的平均重量感兴趣,还会对重量有多大的变化感兴趣。 没有人愿意放心,当他们的包里没有碎片时,平均重量是准确的。 电压可能达到一定的平均水平,但是很大的波动(峰值)会对电机,尤其是计算机造成严重损坏。 我不仅希望在课堂上有较高的平均分数,而且还希望这个平均值的变化较小。 简而言之,有关分布方差的统计检验具有很大的价值和许多用途。
单方差检验假设基础分布是正态分布。 原假设和备择假设是用总体方差表示的。 检验统计数据是:
\[\chi_{c}^{2}=\frac{(n-1) s^{2}}{\sigma_{0}^{2}}\nonumber\]
哪里:
- \(n\)= 样本数据中的观测值总数
- \(s^2\)= 样本方差
- \(\sigma_{0}^{2}\)= 总体方差的假设值
- \(H_{0} : \sigma^{2}=\sigma_{0}^{2}\)
- \(H_{a} : \sigma^{2} \neq \sigma_{0}^{2}\)
在这个测试中,你可以将 s 视为随机变量。 自由度数为\(df = n - 1\)。 单方差的检验可以是右尾、左尾或双尾。 示例\(\PageIndex{1}\)将向您展示如何设置原假设和备选假设。 原假设和备择假设包含有关总体方差的陈述。
示例\(\PageIndex{1}\)
数学教师不仅对学生在考试中的平均成绩感兴趣,还对考试分数的变化感兴趣。 对许多教师来说,方差(或标准差)可能比平均值更重要。
假设一位数学教师认为他的期末考试的标准差为五分。 他最优秀的学生之一不这么认为。 学生声称标准差超过五分。 如果学生要进行假设检验,原假设和备选假设会是什么?
- 回答
-
尽管我们得到了总体标准差,但我们可以使用总体方差设置检验,如下所示。
- \(H_{0} : \sigma^{2} \leq 5^{2}\)
- \(H_{a} : \sigma^{2}>5^{2}\)
练习\(\PageIndex{1}\)
水肺潜水教练希望记录每位学生在结账时潜水的集体深度。 他对深度如何变化很感兴趣,尽管每个人都应该处于相同的深度。 他认为标准差是三英尺。 他的助手认为标准差小于三英尺。 如果教师要进行测试,那么原假设和备选假设会是什么?
示例\(\PageIndex{2}\)
由于各个窗口各有排队,邮局发现周五下午客户等待时间的标准差为7.2分钟。 邮局尝试了单一的主等候线,发现对于25名客户的随机抽样,周五下午客户的等待时间标准差为3.5分钟。
在显著性水平为5%的情况下,测试单线导致客户等待时间差异较小的说法。
- 回答
-
由于声称单线导致的变异较少,因此这是对单方差的检验。 参数是总体方差\(\sigma^2\)。
随机变量:样本标准差是随机变量。\(s\) 让\(s\) = 等待时间的标准偏差。
- \(H_{0} : \sigma^{2} \geq 7.2^{2}\)
- \(H_{a} : \sigma^{2}<7.2^{2}\)
测试分布:\(\chi_{24}^{2}\),其中:
- \(n\)= 抽样的客户数量
- \(df = n – 1 = 25 – 1 = 24\)
计算测试统计数据:
\(\chi_{c}^{2}=\frac{(n-1) s^{2}}{\sigma^{2}}=\frac{(25-1)(3.5)^{2}}{7.2^{2}}=5.67\)
其中\(n = 25\)\(s = 3.5\)、和\(\sigma = 7.2\)。
卡方图显示了分布并以 24 个自由度标记临界值,置信度为 95%\(\alpha = 0.05\),即 13.85。 13.85 的临界值来自 Chi 平方表,该表的读法与学生 t 表非常相似。 区别在于学生 t 分布是对称的,而 Chi 平方分布不对称。 在 Chi 平方表的顶部,我们不仅可以看到熟悉的 0.05、0.10 等,还有 0.95、0.975 等。这些列用于查找左手临界值。 该图还标记了 5.67 的计算得出的\(\chi^2\)检验统计量。 将检验统计量与临界值进行比较,就像我们在所有其他假设检验中所做的那样,得出结论。
“少” 这个词告诉你这是个左尾测试。
做出决定:因为计算出的测试统计数据在尾部,所以我们无法接受\(H_0\)。 这意味着你拒绝\(\sigma^2 \geq 7.2^2\)。 换句话说,你认为等待时间的变化不是 7.2 分钟或更长时间;你认为等待时间的变化较小。
结论:从数据来看,在5%的显著性水平上,有足够的证据可以得出结论,单条线路导致等待时间之间的差异较小;对于单线,客户等待时间变化不到7.2分钟。
示例\(\PageIndex{3}\)
哈德利教授对充满奶油的甜甜圈有弱点,但他认为有些面包店填充的甜甜圈不正确。 24 个甜甜圈样本显示平均填充量等于 0.04 杯,样本标准差为 0.11 杯。 当然,哈德利教授对馅料的平均量很感兴趣,但是如果一个甜甜圈与另一个甜甜圈截然不同,他会特别沮丧。 哈德利教授不喜欢惊喜。
在 95% 时检验原假设,即甜甜圈填充的总体方差与平均填充量有显著差异。
- 回答
-
这显然是处理差异的问题。 在这种情况下,我们正在测试单个样本,而不是比较来自不同群体的两个样本。 因此,原假设和备选假设是:
\[H_{0} : \sigma^{2}=0.04\nonumber\]
\[H_{0} : \sigma^{2} \neq 0.04\nonumber\]
该测试之所以设置为双尾测试,是因为哈德利教授对填充量变化太大以及填充量太少表示担忧:他不喜欢任何超出预期平均水平的0.04杯填充量。 检验统计量的计算公式为:
\[\chi_{c}^{2}=\frac{(n-1) s^{2}}{\sigma_{o}^{2}}=\frac{(24-1) 0 \cdot 11^{2}}{0.04^{2}}=6.9575\nonumber\]
计算出的\(\chi^2\)检验统计量 6.96 位于尾部,因此在 0.05 显著性水平上,我们不能接受圆环填充方差等于 0.04 杯的原假设。 看来哈德利教授注定要对每一点感到失望。
练习\(\PageIndex{3}\)
联邦通信委员会进行宽带速度测试,以测量每秒有多少数据在消费者的计算机和互联网之间传输。 截至2012年8月,互联网服务提供商(ISP)的互联网速度标准差为12.2%。 假设采集了 15 个 ISP 的样本,标准差为 13.2。 一位分析师声称,速度的标准差比报告的要大。 陈述原假设和备择假设,计算自由度,检验统计量,绘制分布图,标记与置信度相关的区域,然后得出结论。 在 1% 显著性水平上进行测试。