9.7: 章节关键术语
- Page ID
- 205025
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)
- 二项分布
- 来自伯努利试验的离散随机变量 (RV)。 独立试验的数量是固定的 n。 “独立” 是指任何试验(例如,试验 1)的结果不影响以下试验的结果,并且所有试验都是在相同的条件下进行的。 在这种情况下,二项式 RV 被定义为\(n\)试验的成功次数。 表示法为:\(X \sim B(n, p) \mu = np\),标准差为\(\sigma=\sqrt{n p q}\)。 \(n\)试验\(x\)成功的概率是\(P(X=x)=\left(\begin{array}{l}{n} \\ {x}\end{array}\right) p^{x} q^{n-x}\)。
- 中心极限定理
- 给定一个具有已知均值\(\mu\)和已知标准差的随机变量 (RV)\(\sigma\)。 我们正在采样大小为 n,我们对两个新的 RV 感兴趣——样本均值\(\overline X\)。 如果样本的大小 n 足够大,那么\(\overline{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\)。 如果样本的大小 n 足够大,则无论总体形状如何,样本均值的分布都将近似正态分布。 样本均值的预期值将等于总体均值。 样本均值分布的标准差称为均值的标准差。\(\frac{\sigma}{\sqrt{n}}\)
- 置信区间 (CI)
- 未知总体参数的间隔估计值。 这取决于:
- 所需的置信水平。
- 有关分布的已知信息(例如,已知的标准差)。
- 样本及其大小。
- 临界值
- 由研究人员设定的\(t\)或\(Z\)值,用于测量 I 型错误的概率\(\sigma\)。
- 假设
- 关于总体参数值的陈述,如果有两个假设,则假定为真的陈述称为原假设(表示法\(H_0\)),矛盾的陈述称为备择假设(表示法\(H_a\))。
- 假设检验
- 基于样本证据,一种确定所述假设是否为合理陈述且不应被驳回的程序,还是不合理且应予以拒绝的程序。
- 正态分布
- 带有 pdf 的连续随机变量 (RV)\(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{\frac{-(x-\mu)^{2}}{2 \sigma^{2}}}\),其中\(\mu\)是分布的平均值,\(\sigma\)是标准差,表示法:\(X \sim N(\mu, \sigma)\)。 如果为\(\mu = 0\) an\(\sigma = 1\) d,则 RV 称为标准正态分布。
- 标准差
- 一个等于方差平方根的数字,用于衡量数据值与其平均值的距离;表示法:s 表示样本标准差,α 表示总体标准差。
- 学生的 T 分布
- William S. Gossett 于 1908 年调查和报道,并以化名 Student 出版。 随机变量 (RV) 的主要特征是:
- 它是连续的,假设任何实数值。
- pdf 的均值为零,是对称的。 但是,它在顶点比正态分布更分散,更平坦。
- 随着 n 变大,它接近标准正态分布。
- 有一个 t 分布的 “族群”:该族的每个代表完全由自由度数定义,自由度数比数据项数少一。
- 测试统计
- 计算相关分布上的标准差数的公式表示估计参数偏离假设值。
- I 型错误
- 当事实上原假设为真时,决定否定原假设。
- 第二类错误
- 决定不是否定原假设,而事实上原假设是错误的。