12.3: F 分布和 F 比率
用于假设检验的分布是新分布。 它被称为 F 分布,由乔治·斯内德科尔发明,但以英国统计学家罗纳德·费舍尔爵士的名字命名。 F统计数据是一个比率(分数)。 有两组自由度;一组用于分子,一组用于分母。
例如,如果F遵循F分布且分子的自由度数为四,分母的自由度数为十,则F∼F4,10。
为了计算F比率,对方差进行了两个估计。
- 样本间方差:该值的σ2估计值是样本均值的方差乘以n(当样本数量相同时)。 如果样本大小不同,则对样本之间的方差进行加权以考虑不同的样本数量。 由于治疗或解释的变异,该方差也称为变异。
- 样本内部方差:该估计值是样本方差的平均值(也称为合并方差)。σ2 当样本数量不同时,将对样本内部的方差进行加权。 方差也称为由于错误或无法解释的变异而产生的变异。
- SSbetween是表示不同样本之间变异的平方和
- SSwithin是平方和,表示样本内偶然产生的变异。
找出 “平方和” 意味着将在某些情况下可能经过加权的平方量相加。 我们在表 1.19 中使用平方和来计算样本方差和样本标准差。
MS 的意思是 “均方形”。 MSbetween是组间的方差,MSwithin是组内的方差。
计算平方和和平方
- k是不同组的数量
- nj是jth群组的大小
- sj=jth 组中值的总和
- n是所有值的总数(样本总量:Σnj)
- x是唯一的值:∑x=∑sj
- 每组所有值的平方和总和:∑x2
- 组间变异性:SStotal=∑x2−(∑x2)n
- 总平方和:∑x2−(∑x)2n
- 解释的变异:代表不同样本之间变异的平方和:
SSbetween=∑[(sj)2nj]−(∑sj)2n - 无法解释的变异:表示样本内偶然变异的平方和:SS within =SS total −SS between
- df代表不同的组(df代表分子):df=k–1
- 样本内误差方程(df分母):dfwithin=n–k
- 由不同组解释的均方(方差估计值):MS between =SS between df between
- 偶然产生的均方(方差估计值)(无法解释):MSwithin=SSwithindfwithin
MSbetween并且MSwithin可以写成如下所示:
MSbetween=SSbetweendfbetween=SSbetweenk−1MSwithin=SSwithindfwithin=SSwithinn−k
单因子方差分析检验取决于这样一个事实,该事实MSbetween可能受到多个组均值之间的总体差异的影响。 由于MSwithin将每个组的值与自己的组均值进行比较,因此组均值可能不同的事实不会影响MSwithin。
原假设表示所有组都是来自具有相同正态分布的总体的样本。 另一种假设表明,至少有两个样本组来自具有不同正态分布的总体。 如果原假设为真MSbetween,则两者都MSwithin应该估计相同的值。
注意
原假设表示所有群组总体均值都相等。 均值相等的假设意味着总体具有相同的正态分布,因为假设总体是正态的,并且它们具有相等的方差。
定义:F 比率或 F 统计量
F=MS between MS within
如果MSbetween和MSwithin估计值相同(假设H0为真),则F-ratio 应大致等于 1。 大多数情况下,仅仅采样错误就会导致偏离一个的变化。 事实证明,它MSbetween由总体方差加上样本之间的差异产生的方差组成。 MSwithin是总体方差的估计值。 由于方差始终为正,因此如果原假设为假,则通常MSbetween会大于。MSwithin那么F-ratio 将大于 1。 但是,如果总体效应很小,那么在给定样本中MSwithin,总体效应不太可能更大。
上述计算是针对不同大小的群组进行的。 如果组的大小相同,则计算会稍微简化一些,F 比率可以写成:
当各组大小相同时的 F 比率公式
上述计算是针对不同大小的群组进行的。 如果组的大小相同,则计算会稍微简化一些,F 比率可以写成
F=n⋅s2¯xs2pooled
哪里
- n= 样本数量
- dfnumerator=k−1
- dfdenominator=n−k
- s2pooled= 样本方差的平均值(合并方差)
- s2¯x= 样本均值的方差
数据通常放在表格中以便于查看。 单因子方差分析结果通常由计算机软件以这种方式显示。
变异来源 | 平方和 (SS) | 自由度 (df) | 均方形 (MS) | F |
---|---|---|---|---|
系数 (介于) |
\ (SS\))” >SS(系数) | \ (df\))” >k–1 | \ (MS\))” >MS(Factor)=SS(Factor)k–1 | \ (F\)” >F=MS(Factor)MS(Error) |
错误 (内部) |
\ (SS\))” >SS(错误) | \ (df\))” >n–k | \ (MS\))” >MS(Error)=SS(Error)n–k | \ (F\)” > |
总计 | \ (SS\))” >SS(总计) | \ (df\))” >n–1 | \ (MS\))” > | \ (F\)” > |
示例 12.2
将测试三种不同的饮食计划,以确定平均减肥。 表中的条目是不同计划的减肥情况。 单因子方差分析结果如表所示12.3.2。
计划 1:n1=4 | 计划 2:n2=3 | 计划 3:n3=3 |
---|---|---|
\ (n_1 = 4\)” >5 | \ (n_2 = 3\)” >3.5 | \ (n_3 = 3\)” >8 |
\ (n_1 = 4\)” >4.5 | \ (n_2 = 3\)” >7 | \ (n_3 = 3\)” >4 |
\ (n_1 = 4\)” >4 | \ (n_2 = 3\)” > | \ (n_3 = 3\)” >3.5 |
\ (n_1 = 4\)” >3 | \ (n_2 = 3\)” >4.5 | \ (n_3 = 3\)” > |
s1=16.5,s2=15,s3=15.5
以下是填写单因子方差分析表所需的计算。 该表用于进行假设检验。
S( between )=∑[(sj)2nj]−(∑sj)2n=s214+s223+s233−(s1+s2+s3)210
在哪里n1=4,n2=3,n3=3和n=n1+n2+n3=10。
S( between )=(16.5)24+(15)23+(15.5)23−(16.5+15+15.5)210=2.2458S(total)=∑x2−(∑x)2n=(52+4.52+42+32+3.52+72+4.52+82+42+3.52)−(5+4.5+4+3+3.5+7+4.5+8+4+3.5)210=244−47210=244−220.9=23.1S(within)=S(total)−SS(between)=23.1−2.2458=20.8542
变异来源 | 平方和 (SS) | 自由度 (df) | 均方形 (MS) | F |
---|---|---|---|---|
系数 (介于) |
\ (SS\))” >SS(Factor)=SS(Between)=2.2458 | \ (df\))” >k–1=3groups–1=2 | \ (MS\))” >MS(Factor)=SS(Factor)k–1=2.2458/2=1.1229 | \ (F\)” >F=MS(Factor)MS(Error)=1.12292.9792=0.3769 |
错误 (内部) |
\ (SS\))” >SS(Error)=SS(Within)=20.8542 | \ (df\))” >n–k=10totaldata–3groups=7 | \ (MS\))” >MS(Error)=SS(Error)n–k=20.85427=2.9792 | \ (F\)” > |
总计 | \ (SS\))” >SS(Total)=2.2458+20.8542=23.1 | \ (df\))” >n–1=10totaldata–1=9 | \ (MS\))” > | \ (F\)” > |
练习 12.2
作为一项实验的一部分,Marist College的学生在不同的土壤覆盖条件下种植了番茄植物,以了解不同类型的土壤覆盖将如何影响番茄的产量。 由三株植物组成的小组每组都接受了以下一种处理方法
- 裸露的土壤
- 商业地面覆盖物
- 黑色塑料
- 吸管
- 堆肥
所有植物都在相同的条件下生长,并且是相同的品种。 学生记录了 n = 15 株植物中每株生产的番茄的重量(以克为单位):
裸露:n1=3 | 地面覆盖物:n2=3 | 塑料:n3=3 | 吸管:n4=3 | 堆肥:n5=3 |
---|---|---|---|---|
\ (n_1 = 3\)” >2,625 | \ (n_2 = 3\)” >5,348 | \ (n_3 = 3\)” >6,583 | \ (n_4 = 3\)” >7,285 | \ (n_5 = 3\)” >6,277 |
\ (n_1 = 3\)” >2,997 | \ (n_2 = 3\)” >5,682 | \ (n_3 = 3\)” >8,560 | \ (n_4 = 3\)” >6,897 | \ (n_5 = 3\)” >7,818 |
\ (n_1 = 3\)” >4,915 | \ (n_2 = 3\)” >5,482 | \ (n_3 = 3\)” >3,830 | \ (n_4 = 3\)” >9,230 | \ (n_5 = 3\)” >8,677 |
创建单因子方差分析表。
单因子方差分析假设检验始终是右尾的,因为较大的F-values 在 F 分布曲线的右尾中排出,往往会使我们拒绝H0。
示例 12.3
让我们回到 Tr y It 中的番茄切片练习。 五种覆盖条件下的番茄产量均值用表示μ1,μ2,μ3,μ4,μ5。 我们将进行假设检验,以确定所有均值是相同还是至少有一个均值不同。 使用显著性水平 5%,检验原假设,即五个组之间的均值产出率没有差异,而备择假设至少有一个均值与其他均值不同。
- 回答
-
原假设和备选假设是:
H0:μ1=μ2=μ3=μ4=μ5
Ha:μi≠μj一些i≠j
单因子方差分析结果如表所示12.3.5
桌子12.3.5 变异来源 平方和 (SS) 自由度 (df) 均方形 (MS) F 系数(介于) \ (SS\))” >36,648,561 \ (df\))” >5–1=4 \ (MS\))” >36,648,5614=9,162,140 9,162,1402,044,672.6=4.4810 错误(内部) \ (SS\))” >20,446,726 \ (df\))” >15–5=10 \ (MS\))” class= “mt-align-center” >20,446,72610=2,044,672.6 总计 \ (SS\))” >57,095,287 \ (df\))” >15–1=14 \ (MS\))” > 测试分布:F4,10
df(num)=5–1=4
df(denom)=15–5=10
测试统计数据:F=4.4810
图12.3.1 概率陈述:p-value =P(F>4.481)=0.0248.
比较α和p-v alue:α=0.05,p-value =0.0248
做出决定:因为α>p-value,我们不能接受H0。
结论:在5%的显著性水平上,我们有相当有力的证据表明,在不同覆盖条件下种植的番茄植物切片的平均产量差异不太可能仅仅是偶然造成的。 我们可以得出结论,至少有一些覆盖物导致了不同的平均产量。
练习 12.3
金黄色葡萄球菌或金黄色葡萄球菌可导致住院患者严重细菌感染。 12.3.6该表显示了可能患有也可能没有金黄色葡萄球菌的不同患者的各种菌落数。 表中的数据绘制在图中12.3.2。
Conc = 0.6 | Conc = 0.8 | Conc = 1.0 | Conc = 1.2 | Conc = 1.4 |
---|---|---|---|---|
9 | 16 | 22 | 30 | 27 |
66 | 93 | 147 | 199 | 168 |
98 | 82 | 120 | 148 | 132 |
不同浓度的数据图:
图12.3.2
测试菌落的平均数量是相同还是不同。 构造方差分析表,找出 p 值,然后陈述您的结论。 使用 5% 的显著性等级。
示例 12.4
四个联谊会随机抽取了姐妹的样本,以了解他们在上个学期的成绩平均值。 结果如表所示12.3.7。
联谊会 1 | 联谊会 2 | 联谊会 3 | 联谊会 4 |
---|---|---|---|
2.17 | 2.63 | 2.63 | 3.79 |
1.85 | 1.77 | 3.78 | 3.45 |
2.83 | 3.25 | 4.00 | 3.08 |
1.69 | 1.86 | 2.55 | 2.26 |
3.33 | 2.21 | 2.45 | 3.18 |
如果显著性水平为 1%,则各联谊会的平均成绩有差异吗?
- 回答
-
让我们μ1,μ2,μ3,μ4成为联谊会的人口手段。 请记住,原假设声称联谊会组来自相同的正态分布。 另一种假设是,至少有两个联谊会群体来自具有不同正态分布的人群。 请注意,四个样本数量各为五个。
注意:这是平衡设计的示例,因为每个因子(即联谊会)具有相同数量的观测值。
H0:μ1=μ2=μ3=μ4
Ha: 并非所有均值μ1,μ2,μ3,μ4都相等。
测试分布:F3,16
其中,k=4分组和n=20样本总数
df(num)=k–1=4–1=3
df(denom)=n–k=20–4=16
计算测试统计数据:F=2.23
图表:
图12.3.3
概率陈述:p-value =P(F>2.23)=0.1241
比较α和p -value:α=0.01
p-value =0.1241
α<p-val ue做出决定:自从α<p-value 以来,你不能拒绝H0。
结论:没有足够的证据得出结论,联谊会的平均成绩之间存在差异。
练习 12.4
去年,有四支运动队随机抽取了球员的GPA样本。 结果如表所示12.3.8。
篮球 | 棒球 | 曲棍球 | 曲棍球 |
---|---|---|---|
3.6 | 2.1 | 4.0 | 2.0 |
2.9 | 2.6 | 2.0 | 3.6 |
2.5 | 3.9 | 2.6 | 3.9 |
3.3 | 3.1 | 3.2 | 2.7 |
3.8 | 3.4 | 3.2 | 2.5 |
使用 5% 的显著性等级,并确定各队之间的 GPA 是否存在差异。
示例 12.5
四年级的班级正在学习环境。 任务之一是在不同的土壤中种植豆类植物。 汤米选择在教室外混有烘干机皮棉的土壤中种植豆类植物。 塔拉选择在当地苗圃购买的盆栽土壤中种植豆类植物。 尼克选择在他母亲花园的土壤中种植豆类植物。 植物上没有使用任何化学物质,只用水。 它们是在教室里长大窗户旁边的。 每个孩子种了五株植物。 在生长期结束时,对每株植物进行了测量,得出了表中的数据(以英寸为单位)12.3.9。
汤米的植物 | 塔拉的植物 | 尼克的植物 |
---|---|---|
24 | 25 | 23 |
21 | 31 | 27 |
23 | 23 | 22 |
30 | 20 | 30 |
23 | 28 | 20 |
种植豆类植物的三种培养基产生的平均高度是否相同? 以 3% 的显著性水平进行测试。
- 回答
-
这次,我们将执行导致 F' 统计的计算。 请注意,每个组的植物数量相同,因此我们将使用公式F′=n⋅s2¯xs2pooled。
首先,计算每个组的样本均值和样本方差。
汤米的植物 塔拉的植物 尼克的植物 样本均值 24.2 25.4 24.4 样本方差 11.7 18.3 16.3 桌子12.3.10 接下来,计算三个组均值的方差(计算 24.2、25.4 和 24.4 的方差)。 该组的方差均值 = 0.413 =s2¯x
那么样本n=5量在MSbetween=ns2¯x=(5)(0.413)哪里(每个孩子生长的植物数量)。
计算三个样本方差的平均值(计算 11.7、18.3 和 16.3 的平均值)。 样本方差的平均值 = 15.433 =s2 合并
然后MSwithin=s2 pooled =15.433。
F统计数据(或F比率)为F=MS between MS within =ns2¯xs2 pooled =(5)(0.413)15.433=0.134
分子的df s = 组数–1=3–1=2。
分母的df s = 样本总数 — 组数=15–3=12
检验的分布为F2,12,F统计量为F=0.134
p-value 是P(F>0.134)=0.8759。
决定:从α=0.03那以p-value =0.8759后你就不能拒绝 H0 了。 (为什么?)
结论:根据样本数据,显著性水平为3%,证据不足以得出豆类植物的平均高度不同的结论。
符号
F分布的表示法是 wherF∼Fdf(num),df(denom) edf(num)=dfbetween anddf(denom)=dfwithin。 F分布的均值为μ=df(num)df(denom)−2