9.4:完整假设检验示例
- Page ID
- 204993
均值测试
示例\(\PageIndex{8}\)
八岁的杰弗里确定了游泳 25 码自由泳的平均时间为 16.43 秒,标准差为 0.8 秒。 他的父亲弗兰克认为杰弗里可以用护目镜更快地游泳 25 码自由泳。 弗兰克给杰弗里买了一副昂贵的新护目镜,并安排杰弗里进行 15 次 25 码自由泳的时间。 对于 15 次游泳,杰弗里的平均时间为 16 秒。 弗兰克认为护目镜帮助杰弗里游泳的速度超过了 16.43 秒。 使用预设进行假设检验\(\alpha = 0.05\)。
- 回答
-
设置假设检验:
由于问题与均值有关,因此这是对单一总体均值的检验。
设置原假设和备择假设:
在这种情况下,存在隐含的质疑或索赔。 这是因为护目镜会减少游泳时间。 这样做的效果是将假设设置为单尾检验。 索赔将始终采用备选假设,因为举证责任始终由备选假设承担。 请记住,必须以高度的信心打破现状,在本例中为95%的信心。 因此,原假设和备选假设是:
\(H_0: \mu \geq 16.43\)\(H_a: \mu < 16.43\)
为了让杰弗里更快地游泳,他的时间将少于16.43秒。 “<” 告诉你这是左尾的。
确定所需的分配:
随机变量:\(\overline X\)= 游泳 25 码自由泳的平均时间。
检验统计量的分布:
样本数量小于 30 而且我们不知道总体标准差,所以这是一个 t 检验。正确的公式是:\(t_{c}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\)
\(\mu_ 0 = 16.43\)来自\(H_0\)而不是数据。 \(\overline X = 16\)。 \(s = 0.8\),和\(n = 15\)。
我们的第 2 步,即设置显著性级别,已经由问题确定,显著性水平为 95%,为 .05。 值得考虑这个选择的含义。 第一类错误是得出结论,杰弗里平均在不到16.43秒的时间内游了25码自由泳,而事实上,他实际上平均在16.43秒内游了25码自由泳。 (当原假设为真时,拒绝原假设。) 在这种情况下,对 I 型错误的唯一担忧似乎是 Jeffery 的父亲可能无法押注儿子的胜利,因为他对护目镜的效果没有足够的信心。
要找到临界值,我们需要选择相应的检验统计量。 我们得出的结论是,这是基于样本数量的 t 检验,我们对总体均值感兴趣。 我们现在可以绘制 t 分布图并标记临界值。 对于此问题,自由度为 n-1 或 14。 在 t 表的 0.05 列上看 14 个自由度,我们发现 1.761。 这是临界值,我们可以把它放在图表上。
步骤 3 是使用我们选择的公式计算检验统计量。 我们发现计算出的检验统计量为 2.08,这意味着样本均值与假设均值 16.43 相差 2.08 个标准差。
\[t_{c}=\frac{\overline{x}-\mu_{0}}{s / \sqrt{n}}=\frac{16-16.43}{.8 / \sqrt{15}}=-2.08\nonumber\]
步骤 4 让我们比较检验统计量和临界值,然后在图表上标记它们。 我们看到检验统计量在尾部,因此我们进入步骤 4 并得出结论。 平均时间为 16 分钟的概率可能来自总体均值为 16.43 分钟的分布,这种概率对于我们来说不太可能接受原假设。 我们不能接受空值。
第 5 步让我们先正式陈述结论,然后再不那么正式地陈述结论。 正式结论可以这样说:“显著性水平为95%,我们不能接受原假设,即戴护目镜的游泳时间来自人口平均时间为16.43分钟的分布。” 不太正式的是,“我们相信护目镜具有95%的意义,可以提高游泳速度”
如果我们想使用\(p\)-value系统得出结论,我们将计算统计量并采取额外步骤来找出与t分布均值2.08个标准差的概率。 此值为 .0187。 将其与\ alpha 级别的 .05 进行比较,我们发现我们不能接受空值。 \(p\)-value 已作为 -2.08 以外的阴影区域放在图表上,它表明它小于阴影区域,即 alpha 等级 0.05。 两种方法都得出相同的结论,即我们不能接受原假设。
练习\(\PageIndex{8}\)
对于高中新生四分卫马可来说,足球的平均投掷距离为 40 码,标准偏差为两码。 球队教练告诉 Marco 调整抓地力以获得更远的距离。 教练记录了 20 次投掷的距离。 对于 20 次投掷,Marco 的平均距离为 45 码。 教练认为不同的抓地力帮助 Marco 投掷的距离超过 40 码。 使用预设进行假设检验\(\alpha = 0.05\)。 假设足球的投掷距离是正常的。
首先,确定这是什么类型的检验,设置假设检验,找到\(p\)-value,绘制图形,然后陈述您的结论。
示例\(\PageIndex{9}\)
Jane刚刚开始她的新工作,她是一家竞争非常激烈的公司的销售队伍。 在16次销售电话的样本中,发现她以平均价值108美元结束了合同,标准差为12美元。 以 5% 的显著性检验总体均值至少为 100 美元,而替代方案则认为总体均值小于 100 美元。 公司政策要求销售队伍的新成员在试用期内每份合同的平均收入必须超过100美元。 我们能否得出结论 Jane 已在 95% 的重要性水平上满足了这一要求?
- 回答
-
- \(H_0: \mu \leq 100\)
\(H_a: \mu > 100\)
原假设和备择假设适用于该参数,\(\mu\)因为合约的美元数是一个连续的随机变量。 此外,这是一项单尾测试,因为只有当每位联系人的金额低于特定数字而不是 “太高” 时,公司才会感兴趣。 这可以看作是声称要求已得到满足,因此该主张属于备择假设。 - 测试统计数据:\(t_{c}=\frac{\overline{x}-\mu_{0}}{\frac{s}{\sqrt{n}}}=\frac{108-100}{\left(\frac{12}{\sqrt{16}}\right)}=2.67\)
- 临界值:\(t_a=1.753\)自由\(n-1\)度 = 15
检验统计量是学生的 t,因为样本数量低于 30;因此,我们不能使用正态分布。 将检验统计量的计算值与 tt (ta) (ta) 在 5% 显著性水平上的临界值进行比较,我们发现计算出的值位于分布的尾部。 因此,我们得出结论,每张合约108美元明显高于假设的100美元,因此我们不能接受原假设。 有证据表明 Jane 的业绩符合公司标准。
- \(H_0: \mu \leq 100\)
练习\(\PageIndex{9}\)
据信,特定公司的股票价格将以每周5美元的速度增长,标准差为1美元。 一位投资者认为股票的增长速度不会那么快。 股票价格的变化记录了十周,如下所示:4美元、3美元、2美元、3美元、1美元、7美元、2美元、1美元、2美元。 使用 5% 的显著性水平进行假设检验。 陈述原假设和备选假设,陈述您的结论,并找出 I 型错误。
示例\(\PageIndex{10}\)
一家沙拉酱制造商使用机器将液体配料分配到瓶中,瓶子沿着灌装线移动。 分配 8 盎司沙拉酱后,分配沙拉酱的机器工作正常。 假设在 35 瓶的特定样品中分配的平均量为 7.91 盎司,方差为 0.03 盎司的平方\(s^2\)。 是否有证据表明机器应该停机,生产等待维修? 停产造成的产量损失可能非常严重,以至于管理层认为分析中的重要性应为99%。
同样,我们将按照分析这个问题的步骤进行操作。
- 回答
-
步骤 1:设置原假设和备择假设。 随机变量是放置在瓶子中的液体量。 这是一个连续的随机变量,我们感兴趣的参数是均值。 因此,我们的假设是关于均值的。 在这种情况下,我们担心机器填充不正确。 据我们所知,机器是过量灌装还是灌装不足都没关系,两者似乎都是一个同样严重的错误。 这告诉我们这是一个双尾测试:如果机器出现故障,无论是过量灌装还是灌装不足,它都会关闭。 因此,原假设和备选假设是:
\[H_0:\mu=8\nonumber\]
\[Ha:\mu \neq 8\nonumber\]
第 2 步:确定重要程度并绘制显示临界值的图表。
这个问题已经将重要性级别设置为99%。 这个决定似乎是一个恰当的决定,它显示了设定重要性等级时的思维过程。 管理层希望在可能性允许的情况下非常确定他们不会关闭不需要维修的机器。 要得出分布和临界值,我们需要知道要使用哪个分布。 由于这是一个连续的随机变量,我们对均值感兴趣,并且样本数量大于 30,因此相应的分布是正态分布,相关临界值是 0.005 列和无限自由度的正态表或 t 表中的 2.575。 我们画出图表并标记这些点。
步骤 3:计算样本参数和检验统计量。 提供了样本参数,样本均值为 7.91,样本方差为 .03,样本数量为 35。 我们需要注意的是,提供的样本方差不是样本标准差,而样本标准差正是我们在公式中需要的。 请记住标准差只是方差的平方根,因此我们知道样本标准差 s 为 0.173。 利用这些信息,我们将检验统计量计算为 -3.07,并将其标记在图表上。
\[Z_{c}=\frac{\overline{x}-\mu_{0}}{s / \sqrt{n}}=\frac{7.91-8}{\cdot 173 / \sqrt{35}}=-3.07\nonumber\]
第 4 步:比较检验统计量和临界值现在,我们通过将检验统计量放在图表上来比较检验统计量和临界值。 我们看到检验统计数据在尾部,绝对大于临界值 2.575。 我们注意到,即使假设值和样本值之间的微小差异仍然是大量的标准差。 样本均值与所需的 8 盎司水平相差仅为 0.08 盎司,但距离标准差加上 3 盎司,因此我们不能接受原假设。
第 5 步:得出结论
检验统计量的三个标准差将保证检验失败。 任何东西都在三个标准差之内的概率几乎为零。 实际上,它在正态分布上是 0.0026,从实际意义上讲,这肯定几乎为零。 我们的正式结论是:“在99%的显著性水平上,我们不能接受样本均值来自平均值为8盎司的分布的假设”,或者不那么正式地说,“在99%的显著性水平上,我们得出结论,机器装满瓶子不足,正在需要维修”。
比率假设检验
就像比率存在置信区间,或者更正式地说是二\(p\)项式分布的总体参数一样,也有能力检验相关的假设\(p\)。
二项式的总体参数为\(p\)。 的估计值(分数估计)\(p\)是\(p^{\prime}\)\(p^{\prime} = x/n\),\(x\)是样本中的成功次数,\(n\)是样本数量。
当您对总体比例进行假设检验时\(p\),可以从总体中抽取一个简单的随机样本。 必须满足二项分布的条件,即:有一定数量的独立试验表示随机抽样,任何试验的结果都是二进制,成功或失败,每个试验的成功概率相同\(p\)。 二项分布的形状必须与正态分布的形状相似。 为确保这一点,数量\(np^{\prime}\)和\(nq^{\prime}\)必须都大于五(\(np^{\prime} > 5\)和\(nq^{\prime} > 5\))。 在这种情况下,样本(估计)比率的二项式分布可以通过带有\(\mu=np\)和的正态分布来近似\(\sigma=\sqrt{n p q}\)。 记住这一点\(q=1–p\)。 没有任何分布可以纠正这种小样本偏差,因此,如果不满足这些条件,我们根本无法使用当时可用的数据来检验假设。 当我们第一次估算的置信区间时,我们遇到了这个条件\(p\)。
同样,我们从修改标准化公式开始,因为这是二项式的分布。
\[Z=\frac{\mathrm{p}^{\prime}-p}{\sqrt{\frac{\mathrm{pq}}{n}}}\nonumber\]
用假设值代替\(p_0\)\(p\),我们有:
\[Z_{c}=\frac{\mathrm{p}^{\prime}-p_{0}}{\sqrt{\frac{p_{0} q_{0}}{n}}}\nonumber\]
这是用于检验 p 假设值的检验统计量,其中,原假设和备择假设采用以下形式之一:
\ (\ pageIndex {5}\) “>双尾测试 | 单尾测试 | 单尾测试 |
---|---|---|
\(H_0: p = p_0\) | \(H_0: p \leq p_0\) | \(H_0: p \geq p_0\) |
\(H_a: p \neq p_0\) | \(H_a: p > p_0\) | \(H_a: p < p_0\) |
上述决策规则在这里也适用:如果的计算值\(Z_c\)显示样本比率与假设比率 “太多” 的标准差,则不能接受原假设。 什么是 “太多” 的决定由分析师根据测试要求的重要性级别预先确定。
示例\(\PageIndex{11}\)
一家大型银行的抵押贷款部门对首次借款人的贷款性质感兴趣。 这些信息将用于定制他们的营销策略。 他们认为,50%的首次借款人获得的贷款比其他借款人少。 他们进行假设检验以确定百分比与 50% 是相同还是不同。 他们抽样了 100名首次借款人,发现其中 53 笔贷款比其他借款人少。 对于假设检验,他们选择 5% 的显著性水平。
- 回答
-
步骤 1:设置原假设和备择假设。
\(H_0: p = 0.50\)\(H_a: p \neq 0.50\)
“与之相同或不同” 这个词告诉你这是一个双尾测试。 第一类和第二类错误如下:第一类错误是得出结论,借款人的比例与50%不同,而实际上,该比例实际上为50%。 (当原假设为真时拒绝原假设)。 第二类错误是没有足够的证据得出结论,首次借款人的比例与50%不同,而实际上,该比例确实与50%不同。 (如果原假设为假,则无法否定原假设。)
第 2 步:确定重要程度并绘制显示临界值的图表
问题已将显著性级别设置为 95%。 因为这是双尾检验,所以一半的 alpha 值将在上尾部,一半位于下尾部,如图所示。 置信度为 95% 的正态分布的临界值为 1.96。 这可以很容易地在最底部的学生的 t 表上以无限的自由度找到,记住无穷大时 t 分布是正态分布。 当然,这个值也可以在普通表上找到,但是你必须在表格正文中找到 95(0.475)中的一半,然后从侧面和顶部读出标准差的数量。
步骤 3:计算检验统计量的样本参数和临界值。
检验统计量是用于检验比率的正态分布\(Z\),为:
\[Z=\frac{p^{\prime}-p_{0}}{\sqrt{\frac{p_{0} q_{0}}{n}}}=\frac{.53-.50}{\sqrt{\frac{.5(.5)}{100}}}=0.60\nonumber\]
在本案中,100人的样本发现53名首次借款人与其他借款人不同。 因此,样本比例,\(p^{\prime} = 53/100= 0.53\)检验问题是:“0.53 与 .50 有显著差异吗?” 将这些值放入检验统计量的公式中,我们发现 0.53 与 .50 只有 0.60 个标准差。 这与零的标准正态分布的平均值差不多。 在标准差方面,与样本比率和假设比例几乎没有区别。
步骤 4:比较检验统计数据和临界值。
计算出的值完全在\(\pm 1.96\)标准差的临界值之内,因此我们无法否定原假设。 要否定原假设,我们需要假设值和样本值之间存在显著差异的证据。 在这种情况下,样本值与以标准差测量的假设值几乎相同。
第 5 步:得出结论
正式的结论是:“在95%的意义上,我们不能否认50%的首次借款人拥有与其他借款人相同规模的贷款的原假设”。 我们不那么正式地说:“没有证据表明一半的首次借款人的贷款规模与其他借款人有显著差异”。 请注意,结论要花多长时间才能包括结论所附的所有条件。 统计学家尽管受到了种种批评,但即使这看起来微不足道,也要谨慎行事,要非常具体。 统计学家说的话不能超出他们所知道的范围,而且数据将结论限制在数据的界限之内。
练习\(\PageIndex{11}\)
一位老师认为,班上有85%的学生想去当地的动物园实地考察。 她进行假设检验以确定该百分比与 85% 是相同还是不同。 老师抽取了50名学生的样本,39名学生回答说他们想去动物园。 对于假设检验,使用 1% 的显著性水平。
示例\(\PageIndex{12}\)
假设一个消费者群体怀疑拥有三部或三部以上手机的家庭比例为30%。 一家手机公司有理由相信这个比例不是 30%。 在他们开始大型广告活动之前,他们会进行假设检验。 他们的营销人员对150个家庭进行了调查,结果是其中43个家庭拥有三部或三部以上的手机。
- 回答
-
以下是求解应用于比例检验的假设检验的系统的缩写版本。
\[H_0 : p = 0.3 \nonumber\]
\[H_a : p \neq 0.3 \nonumber\]
\[n = 150\nonumber\]
\[\mathrm{p}^{\prime}=\frac{x}{n}=\frac{43}{150}=0.287\nonumber\]
\[Z_{c}=\frac{\mathrm{p}^{\prime}-p_{0}}{\sqrt{\frac{p_{0} q_{0}}{n}}}=\frac{0.287-0.3}{\sqrt{\frac{3(7)}{150}}}=0.347\nonumber\]
示例\(\PageIndex{13}\)
美国国家标准与技术研究所提供有关材料电导率特性的精确数据。 以下是随机选择的特定类型玻璃的11块的电导率测量值。
1.11; 1.07; 1.11; 1.07; 1.12; 1.08; .98 1.02; .95 是否有
令人信服的证据表明这种玻璃的平均电导率大于一? 使用显著性水平 0.05。
- 回答
-
让我们按照四个步骤来回答这个统计问题。
陈述问题:我们需要确定在0.05显著性水平上,所选玻璃的平均电导率是否大于1。 我们的假设是
- \(H_0: \mu \leq 1\)
- \(H_a: \mu > 1\)
示例\(\PageIndex{14}\)
在一项针对420,019名手机用户的研究中,有172名受试者患上了脑癌。 测试手机用户患脑癌的比率高于非手机用户的说法(非手机用户的脑癌发病率为0.0340%)。 由于这是一个关键问题,请使用 0.005 的显著性水平。 解释为什么在 I 类错误方面显著性水平应该这么低。
- 回答
-
- 我们需要对声称的癌症发病率进行假设检验。 我们的假设是
- \(H_0: p \leq 0.00034\)
- \(H_a: p > 0.00034\)
如果我们犯了 Type I 错误,我们实际上是在接受虚假声明。 由于该声明描述了致癌环境,因此我们希望最大限度地减少错误识别癌症原因的机会。
- 我们将使用\(x = 172\)和来测试样本比例\(n = 420,019\)。 样本足够大\(np^{\prime} = 420,019(0.00034) = 142.8\)\(n q^{\prime}=420,019(0.99966)=419,876.2\),因为我们有两个独立的结果和固定的成功概率\(p^{\prime} = 0.00034\)。 因此,我们将能够将我们的结果推广给大众。
- 我们需要对声称的癌症发病率进行假设检验。 我们的假设是