9.7: 章节关键术语
- 二项分布
- 来自伯努利试验的离散随机变量 (RV)。 独立试验的数量是固定的 n。 “独立” 是指任何试验(例如,试验 1)的结果不影响以下试验的结果,并且所有试验都是在相同的条件下进行的。 在这种情况下,二项式 RV 被定义为n试验的成功次数。 表示法为:X∼B(n,p)μ=np,标准差为σ=√npq。 n试验x成功的概率是P(X=x)=(nx)pxqn−x。
- 中心极限定理
- 给定一个具有已知均值μ和已知标准差的随机变量 (RV)σ。 我们正在采样大小为 n,我们对两个新的 RV 感兴趣——样本均值¯X。 如果样本的大小 n 足够大,那么¯X∼N(μ,σ√n)。 如果样本的大小 n 足够大,则无论总体形状如何,样本均值的分布都将近似正态分布。 样本均值的预期值将等于总体均值。 样本均值分布的标准差称为均值的标准差。σ√n
- 置信区间 (CI)
- 未知总体参数的间隔估计值。 这取决于:
- 所需的置信水平。
- 有关分布的已知信息(例如,已知的标准差)。
- 样本及其大小。
- 临界值
- 由研究人员设定的t或Z值,用于测量 I 型错误的概率σ。
- 假设
- 关于总体参数值的陈述,如果有两个假设,则假定为真的陈述称为原假设(表示法H0),矛盾的陈述称为备择假设(表示法Ha)。
- 假设检验
- 基于样本证据,一种确定所述假设是否为合理陈述且不应被驳回的程序,还是不合理且应予以拒绝的程序。
- 正态分布
- 带有 pdf 的连续随机变量 (RV)f(x)=1σ√2πe−(x−μ)22σ2,其中μ是分布的平均值,σ是标准差,表示法:X∼N(μ,σ)。 如果为μ=0 anσ=1 d,则 RV 称为标准正态分布。
- 标准差
- 一个等于方差平方根的数字,用于衡量数据值与其平均值的距离;表示法:s 表示样本标准差,α 表示总体标准差。
- 学生的 T 分布
- William S. Gossett 于 1908 年调查和报道,并以化名 Student 出版。 随机变量 (RV) 的主要特征是:
- 它是连续的,假设任何实数值。
- pdf 的均值为零,是对称的。 但是,它在顶点比正态分布更分散,更平坦。
- 随着 n 变大,它接近标准正态分布。
- 有一个 t 分布的 “族群”:该族的每个代表完全由自由度数定义,自由度数比数据项数少一。
- 测试统计
- 计算相关分布上的标准差数的公式表示估计参数偏离假设值。
- I 型错误
- 当事实上原假设为真时,决定否定原假设。
- 第二类错误
- 决定不是否定原假设,而事实上原假设是错误的。