Skip to main content
Global

6.0:正态分布简介

  • Page ID
    204281
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    正态概率密度函数是一种连续分布,是所有分布中最重要的一个。 它被广泛使用,甚至被更广泛地滥用。 它的图形是钟形的。 你可以看到几乎所有学科的钟形曲线。 其中一些包括心理学、商业、经济学、科学、护理,当然还有数学。 您的某些教师可能会使用正态分布来帮助确定您的成绩。 大多数智商分数是正态分布的。 房地产价格通常符合正态分布。

    这张照片显示了许多不同颜色的不同鞋子。 鞋子好像是用绳子挂在墙上的。
    \(\PageIndex{1}\)如果你向足够多的人询问他们的鞋子尺码,你会发现你的图形数据形状像钟形曲线,可以说是正态分布。 (来源:Ömer ünl)

    正态分布极其重要,但它不能应用于现实世界中的所有事物。 请记住,我们还在谈论人口数据的分布。 这是对概率的讨论,因此可能是正态分布的群体数据,如果是正态分布,那么我们就可以这样找到特定事件的概率,就像我们对可能为二项分布或泊松分布的种群数据所做的那样。 之所以要谨慎行事,是因为在下一章中,我们将看到正态分布描述的东西与原始数据截然不同,构成了推理统计的基础。

    正态分布有两个参数(两个数值描述性测量):均值 (\(\mu\)) 和标准差 (\(\sigma\))。 如果 X 是一个要测量的量,其正态分布为 mean (\(\mu\)) 和标准差 (\(\sigma\)),则我们通过编写以下正态概率密度函数公式来指定该量:

    这是正态分布的频率曲线。 它在中心显示了单个峰值,曲线在两侧逐渐变细到水平轴。 分布是对称的;它代表具有正态分布的随机变量 X,平均值为 m,标准差 s。

    \(\PageIndex{2}\)

    概率密度函数是一个相当复杂的函数。 不要记住它。 这不是必需的。

    \[f(x)=\frac{1}{\sigma \cdot \sqrt{2 \cdot \pi}} \cdot \mathrm{e}^{-\frac{1}{2} \cdot\left(\frac{x-\mu}{\sigma}\right)^{2}}\nonumber\]

    曲线围绕穿过平均值绘制的垂直线对称\(\mu\)。 均值与中位数相同,后者与模式相同,因为图形大致对称\(\mu\)。 如记法所示,正态分布仅取决于均值和标准差。 请注意,这与我们已经研究过的几个概率密度函数不同,例如泊松函数,其中均值等于而标准差只是均值的平方根,或者二项式,其中 p 用于确定均值和标准差。\(\mu\)\(\mu\) 由于曲线下方的面积必须等于 1,因此标准差的变化会导致法线曲线的形状发生变化;视情况而定,曲线会变得更胖、更宽或更薄、更高\(\sigma\)\(\sigma\) 更改会\(\mu\)导致图表向左或向右移动。 这意味着存在无限数量的正态概率分布。 其中一个特别值得关注的称为标准正态分布