5.1: 连续概率密度函数的属性

Last updated
Save as PDF

Page ID: 204826

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

连续概率分布的图形是一条曲线。概率由曲线下方的面积表示。当我们在第 2 章中使用直方图开发相对频率时，我们已经遇到了这个概念。一系列值的相对面积是在该组中随机绘制观测值的概率。同样，在第 4 章中的泊松分布中，示例中的图形\(\PageIndex{14}\)使用方框来表示随机变量特定值的概率。在这种情况下，我们有点随意，因为泊松分布的随机变量是离散的，整数的，盒子有宽度。请注意，水平轴，即随机变量\(x\)，故意没有标记轴上的点。连续随机变量的特定值的概率将为零，因为点下方的面积为零。概率是面积。

该曲线称为概率密度函数（缩写为 pdf）。我们使用符号\(f(x))\)来表示曲线。 \(f(x))\)是与图形对应的函数；我们使用密度函数\(f(x))\)来绘制概率分布图。

曲线下方的面积由另一个称为累积分布函数（缩写为 cdf）的函数给出。累积分布函数用于将概率计算为面积。从数学上讲，累积概率密度函数是 pdf 的积分，连续随机变量的两个值之间的概率将是这两个值之间 pdf 的积分：这两个值之间的曲线下方的面积。请记住，可以肯定的是，随机变量的所有可能值在 pdf 下方的区域是一个。因此，概率可以看作是两个感兴趣值之间的相对确定性百分比。

结果是衡量的，而不是计算在内的。
曲线下方和 x 轴上方的整个面积等于 1。
可以为 x 值的间隔找到概率，而不是为单个\(x\)值找到概率。
\(P(c < x < d)\)是随机变量 X 处于值 c 和 d 之间的间隔内的概率。\(P(c < x < d)\)是曲线下方、x 轴上方、右侧\(c\)和左侧的面积\(d\)。
\(P(x = c) = 0\)\(x\)采用任何单个值的概率为零。曲线下方、x 轴上方以及\(x = c\)和之间的区域\(x = c\)没有宽度，因此没有面积 (\(\text{area }= 0\))。由于概率等于面积，因此概率也为零。
\(P(c < x < d)\)与之相同，\(P(c ≤ x ≤ d)\)因为概率等于面积。

我们将使用几何、公式、技术或概率表来找到表示概率的区域。通常，需要使用积分微积分来找到许多概率密度函数的曲线下方的面积。当我们在本教科书中使用公式来查找面积时，公式是使用积分微积分技术找到的。

有许多连续概率分布。使用连续概率分布对概率进行建模时，选择使用的分布以最佳方式对特定情况进行建模和拟合。

在本章和下一章中，我们将研究均匀分布、指数分布和正态分布。下图说明了这些分布。

这张图显示了均匀分布。水平轴的范围为 0 到 10。分布由从 x = 2 延伸到 x = 8.8 的矩形建模。从 x = 3 到 x = 6 的区域在矩形内部被着色。阴影区域表示 P (3 x < 6)。 — 图\(\PageIndex{2}\)该图显示了均匀分布，面积介于\(x = 3\)和\(x = 6\)阴影之间，表示随机变量的值\(X\)处于三到六之间的间隔内的概率。

图\(\PageIndex{3}\)该图显示了指数分布，面积介于\(x = 2\)和\(x = 4\)阴影之间，表示随机变量的值\(X\)处于二到四之间的间隔内的概率。

此图显示了指数分布。该图向下倾斜。它从 y 轴上的某个点开始，接近图形右边缘的 x 轴。图表下方从 x = 2 到 x = 4 的区域用阴影表示 P (2 < x < 4)。 — 图\(\PageIndex{4}\)该图显示了标准正态分布，其面积介于\(x = 1\)和\(x = 2\)阴影之间，表示随机变量的值处\(X\)于 1 和 2 之间的间隔内的概率。

对于连续概率分布，概率 = 面积。

示例\(\PageIndex{1}\)

考虑实数\(f(x) = \frac{1}{20}\)\(0 ≤ x ≤ 20. x =\)的函数。的图形\(f(x) = \frac{1}{20}\)是一条水平线。但是，sanc\(0 ≤ x≤ 20, f(x)\) e 仅限于介于\(x = 0\)和之间（含\(x = 20\)）的部分。

这显示了函数 f (x) = 1/20 的图形。水平线的范围从点 (0, 1/20) 到点 (20, 1/20)。一条垂直线从 x 轴延伸到直线的末端 (20, 1/20)，形成矩形。 — 图\(\PageIndex{5}\)

\(f(x) = \frac{1}{20}\)对于\(0 ≤ x ≤ 20\)。

的图形\(f(x) =\frac{1}{20}\)是水平线段\(0 ≤ x ≤ 20\)。

wher\(f(x) = \frac{1}{20}\) e\(0 ≤ x ≤ 20\) 和 x 轴之间的区域是具有底部\(= 20\)和高度的矩形的面积\(= \frac{1}{20}\)。

\[\operatorname{AREA}=20\left(\frac{1}{20}\right)=1\nonumber\]

假设我们想找到介于\(bf{f(x)) = \frac{1}{20}}\)和 x 轴之间的区域\(\bf{0 < x < 2}\)。

这显示了函数 f (x) = 1/20 的图形。水平线的范围从点 (0, 1/20) 到点 (20, 1/20)。一条垂直线从 x 轴延伸到直线的末端 (20, 1/20)，形成矩形。矩形内部的区域从 x = 0 到 x = 2 的阴影呈阴影。 — 图\(\PageIndex{6}\)

\[\operatorname{AREA}=(2-0)\left(\frac{1}{20}\right)=0.1\nonumber\]

\[(2-0)=2= \text{base of rectangle}\nonumber\]

提醒

矩形的面积 =（底部）（高度）。

该区域对应概率。介于零和二之间的概率\(x\)是\(0.1\)，在数学上可以写成\(P(0 < x < 2) = P(x < 2) = 0.1\)。

假设我们想找到介于\(\bf{f(x) = \frac{1}{20}}\)和 x 轴之间的区域\(\bf{ 4 < x < 15 }\)。

这显示了函数 f (x) = 1/20 的图形。水平线的范围从点 (0, 1/20) 到点 (20, 1/20)。一条垂直线从 x 轴延伸到直线的末端 (20, 1/20)，形成矩形。矩形内部的区域从 x = 4 到 x = 15 的阴影呈阴影。 — 图\(\PageIndex{7}\)

\(\operatorname{AREA}=(15-4)\left(\frac{1}{20}\right)=0.55\)

\((15 – 4) = 11 = \text{the base of a rectangle}\)

面积对应于概率\(P (4 < x < 15) = 0.55\)。

假设我们想找到\(P(x = 15)\)。在 x-y 图上，\(x = 15\)是一条垂直线。垂直线没有宽度（或零宽度）。因此，\(P(x = 15) =\)（底座）（高度）\(= (0)\left(\frac{1}{20}\right) = 0\)

这显示了函数 f (x) = 1/20 的图形。水平线的范围从点 (0, 1/20) 到点 (20, 1/20)。一条垂直线从 x 轴延伸到直线的末端 (20, 1/20)，形成矩形。一条垂直线从水平轴延伸到 x = 15 处的图形。 — 图\(\PageIndex{8}\)

\(P(X ≤ x)\)，也可以写成\(P(X < x)\)连续分布函数，称为累积分布函数或 CDF。注意 “小于或等于” 符号。我们也可以使用 CDF 来计算\(P (X > x)\)。 CDF 给出 “左边的区域” 并\(P(X > x)\)给出 “右边的区域”。我们按如下方式计算\(P(X > x)\)连续分布:\(P(X > x) = 1 – P (X < x)\).

这显示了函数 f (x) = 1/20 的图形。水平线的范围从点 (0, 1/20) 到点 (20, 1/20)。一条垂直线从 x 轴延伸到直线的末端 (20, 1/20)，形成矩形。值 x 左侧的区域带有阴影。 — 图\(\PageIndex{9}\)

使用\(f(x)\)和标记图表\(x\)。使用最大值\(x\)和\(y\)值缩放\(x\)和\(y\)轴。 \(f(x) = \frac{1}{20} , 0 ≤ x ≤ 20\)。

要计算两个\(x\)值之间的概率，请看下图。对\(x = 2.3\)和之间的区域进行遮蔽\(x = 12.7\)。然后计算矩形的阴影面积。

这显示了函数 f (x) = 1/20 的图形。水平线的范围从点 (0, 1/20) 到点 (20, 1/20)。一条垂直线从 x 轴延伸到直线的末端 (20, 1/20)，形成矩形。矩形内部的区域从 x = 2.3 到 x = 12.7 的阴影呈阴影 — 图\(\PageIndex{10}\)

\(P(2.3<x<12.7)=(\text { base })(\text { height })=(12.7-2.3)\left(\frac{1}{20}\right)=0.52\)

练习\(\PageIndex{1}\)

考虑这个函数\(f(x) = \frac{1}{8}\)\(0 \leq x \leq 8\)。绘制图表\(f(x))\)并查找\(P(2.5 < x < 7.5)\)。