6.0：正态分布简介

Last updated
Save as PDF

Page ID: 204281

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

正态概率密度函数是一种连续分布，是所有分布中最重要的一个。它被广泛使用，甚至被更广泛地滥用。它的图形是钟形的。你可以看到几乎所有学科的钟形曲线。其中一些包括心理学、商业、经济学、科学、护理，当然还有数学。您的某些教师可能会使用正态分布来帮助确定您的成绩。大多数智商分数是正态分布的。房地产价格通常符合正态分布。

这张照片显示了许多不同颜色的不同鞋子。鞋子好像是用绳子挂在墙上的。 — 图\(\PageIndex{1}\)如果你向足够多的人询问他们的鞋子尺码，你会发现你的图形数据形状像钟形曲线，可以说是正态分布。（来源：Ömer ünl）

正态分布极其重要，但它不能应用于现实世界中的所有事物。请记住，我们还在谈论人口数据的分布。这是对概率的讨论，因此可能是正态分布的群体数据，如果是正态分布，那么我们就可以这样找到特定事件的概率，就像我们对可能为二项分布或泊松分布的种群数据所做的那样。之所以要谨慎行事，是因为在下一章中，我们将看到正态分布描述的东西与原始数据截然不同，构成了推理统计的基础。

正态分布有两个参数（两个数值描述性测量）：均值 (\(\mu\)) 和标准差 (\(\sigma\))。如果 X 是一个要测量的量，其正态分布为 mean (\(\mu\)) 和标准差 (\(\sigma\))，则我们通过编写以下正态概率密度函数公式来指定该量：

这是正态分布的频率曲线。它在中心显示了单个峰值，曲线在两侧逐渐变细到水平轴。分布是对称的；它代表具有正态分布的随机变量 X，平均值为 m，标准差 s。

概率密度函数是一个相当复杂的函数。 不要记住它。这不是必需的。

\[f(x)=\frac{1}{\sigma \cdot \sqrt{2 \cdot \pi}} \cdot \mathrm{e}^{-\frac{1}{2} \cdot\left(\frac{x-\mu}{\sigma}\right)^{2}}\nonumber\]

曲线围绕穿过平均值绘制的垂直线对称\(\mu\)。均值与中位数相同，后者与模式相同，因为图形大致对称\(\mu\)。如记法所示，正态分布仅取决于均值和标准差。请注意，这与我们已经研究过的几个概率密度函数不同，例如泊松函数，其中均值等于而标准差只是均值的平方根，或者二项式，其中 p 用于确定均值和标准差。\(\mu\)\(\mu\) 由于曲线下方的面积必须等于 1，因此标准差的变化会导致法线曲线的形状发生变化；视情况而定，曲线会变得更胖、更宽或更薄、更高\(\sigma\)。\(\sigma\) 更改会\(\mu\)导致图表向左或向右移动。这意味着存在无限数量的正态概率分布。其中一个特别值得关注的称为标准正态分布。