13.8: 章节练习

Last updated
Save as PDF

Page ID: 204973

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

13.1 相关系数 r

1。

为了在特征\(A\)和之间建立相关系数\(B\)，必须有：

一组受试者，其中一些具有特质特征\(A\)，其余具有特质特征\(B\)
测量一组受试者的特质\(A\)和\(B\)另一组受试者的特征
两组受试者，一组可以归类为\(A\)或不是\(A\)，另一组可以归类为\(B\)或不是\(B\)
两组受试者，一组可以归类为\(A\)或不可以归类\(A\)，另一组可以归类为\(B\)或不是\(B\)

2。

定义相关系数并给出其用法的独特示例。

3。

如果汽车的使用寿命与维修费用之间的相关性为+.90

81% 的维修费用差异是由汽车的使用寿命来解释的
81% 的维修费用因汽车的使用年限而无法解释
90% 的维修费用是用汽车的老化来解释的
以上都不是

4。

假设智商测试的大学平均成绩和口头部分的相关性为0.40。这两个方差的共同点是多少？

5。

对还是错？如果为 false，请解释原因：确定系数的值可以介于 -1 和 +1 之间。

6。

True or False：每当 r 是根据样本计算出来时，我们为 r 获得的值只是对真实相关系数的估计值，如果我们为整个总体进行计算，则会得到该估计值。

7。

在 “散点图” 下，有一种表示法表示相关系数为 0.10。这是什么意思？

正负 10% 的均值包括大约 68% 的病例
一个变量方差的十分之一与另一个变量共享
一个变量的十分之一是由另一个变量引起的
在 -1 到 +1 的尺度上，两个变量之间的线性关系度为 +.10

8。

已知\(X\)和\(Y\)的相关系数为零。然后我们可以得出以下结论：

X 并\(Y\)具有标准分布
\(X\)和的方差\(Y\)相等
\(X\)和 Y 之间不存在任何关系
\(X\)和 Y 之间不存在线性关系
这些都不是

9。

你会猜出这两个变量的相关系数的值是多少：“工作工时数” 和 “已完成的工作单位数”？

大约 0.9
大约 0.4
大约 0.0
大约 -0.4
大约 -0.9

10。

在给定组中，以英尺为单位测量的身高和以磅为单位的体重之间的相关性为 +.68。以下哪项会改变 r 的值？

高度以厘米表示。
重量以千克表示。
以上两个都会影响 r。
以上任何更改都不会影响 r。

13.2 测试相关系数的显著性

11。

定义回归系数的\(t\)检验，并举一个独特的使用示例。

12。

神经质测试分数与焦虑测试分数之间的相关性很高且呈阳性；因此

焦虑会导致神经质
那些在一项测试中分数较低的人往往在另一项考试中得分较高。
那些在一项测试中分数较低的人往往在另一项测试中得分较低。
从一项测试到另一项测试无法作出有意义的预测。

13.3 线性方程

13。

对还是错？如果为 False，则更正：假设\(Y\) on\(\beta\) 的直线回归斜率的置信区间\(X\)为 95%\(-3.5 < \beta < -0.5\)。然后，对该假设进行双面检验\(H_{0} : \beta=-1\)将导致在 1% 的显著性水平\(H_0\)上被拒绝。

14。

对还是错：将关联系数解释为关联度量而不是因果关系更安全，因为存在虚假关联的可能性。

15。

我们有兴趣找出一次购买的小部件数量与每个小部件的成本之间的线性关系。已获得以下数据：

\(X\): 购买的小部件数量 — 1、3、6、10、15

\(Y\): 每个小部件的成本（以美元计）— 55、52、46、32、25

假设回归线是\(\hat{y}=-2.5 x+60\)。如果购买了 30 个小部件，我们会计算每个小部件的平均价格，然后观察以下哪一项？

\(\hat{y}=15 \text { dollars }\); 显然，我们错了；预测实际上\(\hat y\)是+15美元。
\(\hat{y}=15 \text { dollars }\)，从数据来看，这似乎是合理的。
\ (\ hat {y} =-15\ text {dollars}\，这显然是胡说八道。回归线必须不正确。
\(\hat{y}=-15 \text { dollars }\)，这显然是胡说八道。这提醒我们，在数据\(X\)值范围\(Y\)之外进行预测是一种非常糟糕的做法。

16。

简要讨论相关性和因果关系之间的区别。

17。

对还是错：如果\(r\)接近 + 或 -1，我们可以说存在很强的相关性，默示我们指的是线性关系，别无其他。

13.4 回归方程

18。

假设您有 30 个驱动程序中每个驱动程序的以下信息可供使用。提出一个模型（包括用于表示自变量的符号的非常简短的指示），根据测量的因子，解释驾驶员每加仑英里数在不同驾驶员之间有何差异。

信息：

每天行驶里程
汽车的重量
汽车中的气缸数
平均速度
英里/加仑
乘客人数

19。

以因变量 (\(Y\)) 和自变量 () 之间的样本最小二乘回归分析为例。\(X\) 样本相关系数 −1（减一）告诉我们

样本\(X\)中的\(Y\)和之间没有关系
人口\(X\)中\(Y\)和之间没有关系
人口\(X\)中\(Y\)和之间存在着完美的负面关系
样本\(X\)中的\(Y\)和之间存在完美的负关系。

20。

在相关分析中，当点在回归线上广泛分散时，这意味着相关性为

负面的。
低。
异构。
在两个不可靠的度量之间。

13.5 回归系数的解释：弹性和对数变换

21。

在线性回归中，为什么我们需要关注自变 (\(X\)) 变量的范围？

22。

假设一个人收集了以下信息，其中\(X\)是树干的直径，\(Y\)是树高。

\ (\ pageIndex {3}\) “>

桌子\(\PageIndex{3}\)
X	Y
4	8
2	4
8	18
6	22
10	30
6	8

回归方程：\(\hat{y}_{i}=-3.6+3.1 \cdot X_{i}\)

你估计树干直径为 7 英寸的所有树木的平均高度是多少？

23。

用于跳蚤项圈的化学品的制造商声称，在标准测试条件下，每增加一个单位的化学品将减少5个跳蚤（即哪里\(X_{j}=\text { amount of chemical }\)和\(Y_{J}=B_{0}+B_{1} \cdot X_{J}+E_{J}\)，\(H_0:B_1=−5\)

假设已经进行了测试，计算机的结果包括：

拦截 = 60

斜率 = −4

回归系数的标准误差 = 1.0

误差自由度 = 2000

斜率的 95% 置信区间 −2.04、−5.96

这个证据是否与跳蚤数量以每单位化学品5个跳蚤的速度减少的说法一致？

13.6 使用回归方程进行预测

24。

对还是错？如果为 False，则更正：假设您正在执行\(Y\) on 的简单线性回归，\(X\)并对照双向备选方案检验斜率\(\beta\)为零的假设。您有\(n=25\)观测值，计算得出的 test (\(t\)) 统计量为 2.6。然后你的 P 值由给出\(.01 < P < .02\)，这给出了临界意义（即你会拒绝\(H_0\) at\(\alpha=.02\) 但不能拒绝\(H_0\) at\(\alpha=.01\)）。

25。

一位经济学家对 “奇迹小麦” 对一个地区小麦平均产量可能产生的影响感兴趣。为此，他拟定了在十年内推出 “奇迹小麦” 之后每年的平均产量与年均产量的线性回归。

拟合的趋势线是

\(\hat{y}_{j}=80+1.5 \cdot X_{j}\)

(\(Y_j\): 引入后\(j\)一年的平均产量)

(\(X_j\): 引入后\(j\)一年)。

引入后第四年的估计平均产量是多少？
你想用这条趋势线来估计（比如）引入后20年的收益率吗？为什么？你的估计是多少？

26。

一种解释\(r=0.5\)是，\(Y\)-variation 的以下部分与以下哪个变体有关\(X\)：

大多数
一半
很少
四分之一
这些都不是

27。

以下哪个值\(r\)表示对一个变量与另一个变量的预测最准确？

\(r=1.18\)
\(r=−.77\)
\(r=.68\)

13.7 如何使用微软 Excel® 进行回归分析

28。

已使用多元回归计算机程序进行拟合\(\hat{y}_{j}=b_{0}+b_{1} \cdot X_{1 j}+b_{2} \cdot X_{2 j}+b_{3} \cdot X_{3 j}\)。

计算机输出的一部分包括：

\ (\ pageIndex {4}\) “>

桌子\(\PageIndex{4}\)
我	\(b_i\)	\(S_{b_i}\)
0	8	1.6
1	2.2	.24
2	-.72	.32
3	0.005	0.002

的置信区间的计算由 _______\(\pm\)（学生的\(t\)值）(_______)\(b_2\) 组成
此区间的置信水平反映在用于 _______ 的值中。
可用于估计方差的自由度与用于 _______ 的值直接相关

29。

一名研究人员在 20 个数据点上使用了多元回归程序，得出了包含 3 个变量的回归方程。计算机输出的一部分是：

\ (\ pageIndex {5}\) “>

桌子\(\PageIndex{5}\)
变量	系数	的标准误差\(bf{b_i}\)
1	0.45	0.21
2	0.80	0.10
3	3.10	0.86

0.80 是 ___________ 的估计值。
0.10 是 ___________ 的估计值。
假设响应满足正态性假设，我们可以有 95% 的置信度认为的值\(\beta_2\)位于区间 _______ ± [\(t_{.025} \cdot \)_____] 中，其中\(t_{.025}\)是自由度为 ____ 的学生 t 分布的临界值。