11.5: 同质性测试
拟合优度检验可用于确定一个总体是否与给定分布相吻合,但仅仅决定两个总体是否遵循相同的未知分布是不够的。 另一种检验称为同质性检验,可用于得出两个群体是否具有相同分布的结论。 要计算同质性检验的检验统计量,请遵循与独立性检验相同的程序。
注意
要使用此测试,每个单元格内的预期值必须至少为五个。
假设
- H0: 两个总体的分布是相同的。
- Ha: 两个总体的分布不相同。
测试统计
使用χ2测试统计数据。 它的计算方法与独立性检验相同。
自由度 (df)
df= number of columns −1
要求
表中的所有值都必须大于或等于五。
常见用途
比较两个种群。 例如:男性与女性,之前与之后,东方与西方。 该变量是分类变量,可能有两个以上的响应值。
示例11.5.1
男女大学生的生活安排分布是否相同? 使用显著性水平 0.05。 假设向随机选择的250名男大学生和300名随机选择的女大学生询问了他们的生活安排:宿舍、公寓、与父母在一起等。 结果如表所示11.5.18。 男女大学生的生活安排分布是否相同?
\ (\ pageIndex {18}\) 大学男生和女大学生生活安排的分布 “>宿舍 | 公寓 | 和父母在一起 | 其他 | |
男性 | 72 | 84 | 49 | 45 |
女性 | 91 | 86 | 88 | 35 |
- 回答
-
解决方案 11.11
H0: 男大学生生活安排的分配与女大学生生活安排的分配相同。
Ha: 男大学生生活安排的分配与女大学生生活安排的分配不同。
自由度 (df):检验的
df= number of columns –1=4–1=3
分布:χ23
计算检验统计数据:χ2c=10.129图11.5.9 卡方图显示了分布并以三个自由度标记临界值,置信度为 95%α=0.05,即 7.815。 该图还标记了计算得出的 10.129 的χ2检验统计量。 将检验统计量与临界值进行比较,就像我们在所有其他假设检验中所做的那样,得出结论。
做出决定:因为计算出的测试统计数据在尾部,所以我们无法接受H0。 这意味着分布不一样。
结论:从数据来看,重要程度为5%,有足够的证据得出结论,男女大学生生活安排的分布不一样。
请注意,结论只是分布不相同。 我们不能用同质性检验来得出关于它们有何不同之处的任何结论。
练习11.5.1A
家庭和单身人士的汽车分布是否相同? 使用显著性水平 0.05。 假设有 100 个随机选择的家庭和 200 个随机选择的单身人士被问及他们驾驶的是哪种类型的汽车:运动车、轿车、掀背车、卡车、货车/越野车。 结果如表所示11.5.19。 家庭和单身人士的汽车分布是否相同? 在显著性水平为 0.05 时进行测试。
\ (\ pageIndex {19}\) “>运动 | 四门轿车 | 掀背车 | 卡车 | 货车/越野车 | |
---|---|---|---|---|---|
家庭 | 5 | 15 | 35 | 17 | 28 |
单身 | 45 | 65 | 37 | 46 | 7 |
练习11.5.1B
常春藤盟校收到许多申请,但只有一部分可以被接受。 在表中列出的学校中11.5.20,接受两种类型的申请:常规申请和早期决定申请。
\ (\ pageIndex {20}\) “>申请类型已接受 | 棕色 | 哥伦比亚 | 康奈尔 | 达特茅斯 | 佩恩 | 耶鲁大学 |
---|---|---|---|---|---|---|
常规 | 2,115 | 1,792 | 5,306 | 1,734 | 2,685 | 1,245 |
尽早做出决定 | 577 | 627 | 1,228 | 444 | 1,195 | 761 |
我们想知道接受的常规申请数量是否与接受的早期申请数量的分布相同。 陈述原假设和备择假设、自由度和检验统计量,绘制χ2分布图,显示检验统计量的临界值和计算值,并得出关于同质性检验的结论。