9.7: 章节关键术语

Last updated
Save as PDF

Page ID: 205025

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

二项分布: 来自伯努利试验的离散随机变量 (RV)。独立试验的数量是固定的 n。 “独立” 是指任何试验（例如，试验 1）的结果不影响以下试验的结果，并且所有试验都是在相同的条件下进行的。在这种情况下，二项式 RV 被定义为\(n\)试验的成功次数。表示法为:\(X \sim B(n, p) \mu = np\)，标准差为\(\sigma=\sqrt{n p q}\)。 \(n\)试验\(x\)成功的概率是\(P(X=x)=\left(\begin{array}{l}{n} \\ {x}\end{array}\right) p^{x} q^{n-x}\)。

中心极限定理: 给定一个具有已知均值\(\mu\)和已知标准差的随机变量 (RV)\(\sigma\)。我们正在采样大小为 n，我们对两个新的 RV 感兴趣——样本均值\(\overline X\)。如果样本的大小 n 足够大，那么\(\overline{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\)。如果样本的大小 n 足够大，则无论总体形状如何，样本均值的分布都将近似正态分布。样本均值的预期值将等于总体均值。样本均值分布的标准差称为均值的标准差。\(\frac{\sigma}{\sqrt{n}}\)

置信区间 (CI)

未知总体参数的间隔估计值。这取决于：

所需的置信水平。
有关分布的已知信息（例如，已知的标准差）。
样本及其大小。

临界值: 由研究人员设定的\(t\)或\(Z\)值，用于测量 I 型错误的概率\(\sigma\)。

假设: 关于总体参数值的陈述，如果有两个假设，则假定为真的陈述称为原假设（表示法\(H_0\)），矛盾的陈述称为备择假设（表示法\(H_a\)）。

假设检验: 基于样本证据，一种确定所述假设是否为合理陈述且不应被驳回的程序，还是不合理且应予以拒绝的程序。

正态分布: 带有 pdf 的连续随机变量 (RV)\(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{\frac{-(x-\mu)^{2}}{2 \sigma^{2}}}\)，其中\(\mu\)是分布的平均值，\(\sigma\)是标准差，表示法:\(X \sim N(\mu, \sigma)\)。如果为\(\mu = 0\) an\(\sigma = 1\) d，则 RV 称为标准正态分布。

标准差: 一个等于方差平方根的数字，用于衡量数据值与其平均值的距离；表示法：s 表示样本标准差，α 表示总体标准差。

学生的 T 分布

William S. Gossett 于 1908 年调查和报道，并以化名 Student 出版。随机变量 (RV) 的主要特征是：

它是连续的，假设任何实数值。
pdf 的均值为零，是对称的。但是，它在顶点比正态分布更分散，更平坦。
随着 n 变大，它接近标准正态分布。
有一个 t 分布的 “族群”：该族的每个代表完全由自由度数定义，自由度数比数据项数少一。

测试统计: 计算相关分布上的标准差数的公式表示估计参数偏离假设值。

I 型错误: 当事实上原假设为真时，决定否定原假设。

第二类错误: 决定不是否定原假设，而事实上原假设是错误的。