13.10:章节解决方案
1。
d
2。
一种度量,用于衡量一个变量的变异与一个或多个其他变量的变异的关联程度。 最常用的相关系数表示一个变量中变异由与另一个变量的直线关系描述的程度。
假设有关于家庭收入和户主受教育年限的样本信息。 相关系数 = 0 表示这两个变量之间根本没有线性关联。 相关性为 1 表示完美的线性关联(其中家庭收入的所有变异都可能与教育有关,反之亦然)。
3。
a. 81% 的维修费用差异是由汽车的使用年限解释的
4。
b. 16
5。
确定系数为0 \leq r \cdot \cdot 2 \leq 1,r \cdot \cdot 2since-1 \leq r \leq 1。
6。
真的
7。
d. 在 -1 到 +1 的尺度上,两个变量之间的线性关系度为 +.10
8。
d. X 和 Y 之间不存在线性关系
9。
大约 0.9
10。
d. 以上任何更改都不会影响r。
11。
定义:通过将回归系数除以其标准误差,然后将结果与带错误的学生 t 的临界值进行比较来获得t检验df。 它检验了\beta_{i}=0当所有其他变量都包含在相关回归模型中的说法。
示例:假设 4 个变量被怀疑会影响某些响应。 假设拟合的结果Y_{i}=\beta_{0}+\beta_{1} X_{1 i}+\beta_{2} X_{2 i}+\beta_{3} X_{3 i}+\beta_{4} X_{4 i}+e_{i}包括:
\ (\ pageIndex {6}\) “>变量 | 回归系数 | 正则系数的标准差 |
.5 | 1 | -3 |
.4 | 2 | +2 |
.02 | 3 | +1 |
.6 | 4 | -5 |
t为变量 1、2 和 3 计算的绝对值将为 5 或更大,而变量 4 的计算值将小于 1。 对于大多数显著性水平,该假设\beta_{1}=0将被拒绝。 但是,请注意,这适用于X_2X_3、和X_4已包含在回归中的情况。 对于大多数显著性水平,在回归中、和X_3 are 的情况下X_1X_2,\beta_{4}=0将继续(保留)假设。 通常,这种结果模式会导致计算另一种仅涉及X_1、X_2X_3、的回归,并检查针对该情况生成的 t 比率。
12。
c. 那些在一项测试中分数较低的人往往在另一项考试中得分较低。
13。
假的。 由于H_{0} : \beta=-1不会在被拒绝\alpha=0.05,因此不会在被拒绝\alpha=0.01。
14。
真的
15。
d
16。
有些变量似乎是相关的,因此了解一个变量的状态可以让我们预测另一个变量的状态。 这种关系可以测量,称为相关性。 但是,两个变量之间的高度相关性绝不能证明它们之间存在因果关系。 第三个因素完全有可能导致两个变量一起变化。
17。
真的
18。
Y_{j}=b_{0}+b_{1} \cdot X_{1}+b_{2} \cdot X_{2}+b_{3} \cdot X_{3}+b_{4} \cdot X_{4}+b_{5} \cdot X_{6}+e_{j}
19。
d. 样本X中的Y和之间存在完美的负关系。
20。
b. 低
21。
Y变量估计值的精度取决于所探索的独立 (X) 变量的范围。 如果我们探索X变量的很小范围,我们将无法充分利用回归。 此外,不建议使用外推法。
22。
\hat{y}=-3.6+(3.1 \cdot 7)=18.1
23。
最简单地说,由于 −5 包含在斜率的置信区间中,我们可以得出结论,证据与置信度为 95% 的说法一致。
使用t测试:H_{0} : B_{1}=-5H_{A} : B_{1} \neq-5t_{\text { calculated }}=\frac{-5-(-4)}{1}=-1t_{\text { critical }}=-1.96.
由于t_{\mathrm{calc}}<t_{\mathrm{crit}}我们保留了原假设,那就是B_{1}=-5.
24。
真的。
t_{\text { (critical, }, d f=23, \text { two-tailed, } \alpha=.02 )}=\pm 2.5
\mathrm{t}_{\text { critical }, \mathrm{df}=23, \text { two-tailed, } \alpha=.01}=\pm 2.8
25。
26。
d. 四分之一
27。
b。r=−.77
28。
29。
- 的总体值\beta_2,即当其他变量保持不变时Y随着单位变化而发生的变化。X_2
- 估计值分布的标准误的总体值\beta_2。
- .8, .1, 16 = 20 − 4。