6.0:正态分布简介
- Page ID
- 204281
正态概率密度函数是一种连续分布,是所有分布中最重要的一个。 它被广泛使用,甚至被更广泛地滥用。 它的图形是钟形的。 你可以看到几乎所有学科的钟形曲线。 其中一些包括心理学、商业、经济学、科学、护理,当然还有数学。 您的某些教师可能会使用正态分布来帮助确定您的成绩。 大多数智商分数是正态分布的。 房地产价格通常符合正态分布。
正态分布极其重要,但它不能应用于现实世界中的所有事物。 请记住,我们还在谈论人口数据的分布。 这是对概率的讨论,因此可能是正态分布的群体数据,如果是正态分布,那么我们就可以这样找到特定事件的概率,就像我们对可能为二项分布或泊松分布的种群数据所做的那样。 之所以要谨慎行事,是因为在下一章中,我们将看到正态分布描述的东西与原始数据截然不同,构成了推理统计的基础。
正态分布有两个参数(两个数值描述性测量):均值 (\(\mu\)) 和标准差 (\(\sigma\))。 如果 X 是一个要测量的量,其正态分布为 mean (\(\mu\)) 和标准差 (\(\sigma\)),则我们通过编写以下正态概率密度函数公式来指定该量:
概率密度函数是一个相当复杂的函数。 不要记住它。 这不是必需的。
\[f(x)=\frac{1}{\sigma \cdot \sqrt{2 \cdot \pi}} \cdot \mathrm{e}^{-\frac{1}{2} \cdot\left(\frac{x-\mu}{\sigma}\right)^{2}}\nonumber\]
曲线围绕穿过平均值绘制的垂直线对称\(\mu\)。 均值与中位数相同,后者与模式相同,因为图形大致对称\(\mu\)。 如记法所示,正态分布仅取决于均值和标准差。 请注意,这与我们已经研究过的几个概率密度函数不同,例如泊松函数,其中均值等于而标准差只是均值的平方根,或者二项式,其中 p 用于确定均值和标准差。\(\mu\)\(\mu\) 由于曲线下方的面积必须等于 1,因此标准差的变化会导致法线曲线的形状发生变化;视情况而定,曲线会变得更胖、更宽或更薄、更高\(\sigma\)。\(\sigma\) 更改会\(\mu\)导致图表向左或向右移动。 这意味着存在无限数量的正态概率分布。 其中一个特别值得关注的称为标准正态分布。