5.1: 连续概率密度函数的属性
- Page ID
- 204826
连续概率分布的图形是一条曲线。 概率由曲线下方的面积表示。 当我们在第 2 章中使用直方图开发相对频率时,我们已经遇到了这个概念。 一系列值的相对面积是在该组中随机绘制观测值的概率。 同样,在第 4 章中的泊松分布中,示例中的图形\(\PageIndex{14}\)使用方框来表示随机变量特定值的概率。 在这种情况下,我们有点随意,因为泊松分布的随机变量是离散的,整数的,盒子有宽度。 请注意,水平轴,即随机变量\(x\),故意没有标记轴上的点。 连续随机变量的特定值的概率将为零,因为点下方的面积为零。 概率是面积。
该曲线称为概率密度函数(缩写为 pdf)。 我们使用符号\(f(x))\)来表示曲线。 \(f(x))\)是与图形对应的函数;我们使用密度函数\(f(x))\)来绘制概率分布图。
曲线下方的面积由另一个称为累积分布函数(缩写为 cdf)的函数给出。 累积分布函数用于将概率计算为面积。 从数学上讲,累积概率密度函数是 pdf 的积分,连续随机变量的两个值之间的概率将是这两个值之间 pdf 的积分:这两个值之间的曲线下方的面积。 请记住,可以肯定的是,随机变量的所有可能值在 pdf 下方的区域是一个。 因此,概率可以看作是两个感兴趣值之间的相对确定性百分比。
- 结果是衡量的,而不是计算在内的。
- 曲线下方和 x 轴上方的整个面积等于 1。
- 可以为 x 值的间隔找到概率,而不是为单个\(x\)值找到概率。
- \(P(c < x < d)\)是随机变量 X 处于值 c 和 d 之间的间隔内的概率。\(P(c < x < d)\)是曲线下方、x 轴上方、右侧\(c\)和左侧的面积\(d\)。
- \(P(x = c) = 0\)\(x\)采用任何单个值的概率为零。 曲线下方、x 轴上方以及\(x = c\)和之间的区域\(x = c\)没有宽度,因此没有面积 (\(\text{area }= 0\))。 由于概率等于面积,因此概率也为零。
- \(P(c < x < d)\)与之相同,\(P(c ≤ x ≤ d)\)因为概率等于面积。
我们将使用几何、公式、技术或概率表来找到表示概率的区域。 通常,需要使用积分微积分来找到许多概率密度函数的曲线下方的面积。 当我们在本教科书中使用公式来查找面积时,公式是使用积分微积分技术找到的。
有许多连续概率分布。 使用连续概率分布对概率进行建模时,选择使用的分布以最佳方式对特定情况进行建模和拟合。
在本章和下一章中,我们将研究均匀分布、指数分布和正态分布。 下图说明了这些分布。
对于连续概率分布,概率 = 面积。
示例\(\PageIndex{1}\)
考虑实数\(f(x) = \frac{1}{20}\)\(0 ≤ x ≤ 20. x =\)的函数。 的图形\(f(x) = \frac{1}{20}\)是一条水平线。 但是,sanc\(0 ≤ x≤ 20, f(x)\) e 仅限于介于\(x = 0\)和之间(含\(x = 20\))的部分。
\(f(x) = \frac{1}{20}\)对于\(0 ≤ x ≤ 20\)。
的图形\(f(x) =\frac{1}{20}\)是水平线段\(0 ≤ x ≤ 20\)。
wher\(f(x) = \frac{1}{20}\) e\(0 ≤ x ≤ 20\) 和 x 轴之间的区域是具有底部\(= 20\)和高度的矩形的面积\(= \frac{1}{20}\)。
\[\operatorname{AREA}=20\left(\frac{1}{20}\right)=1\nonumber\]
假设我们想找到介于\(bf{f(x)) = \frac{1}{20}}\)和 x 轴之间的区域\(\bf{0 < x < 2}\)。
\[\operatorname{AREA}=(2-0)\left(\frac{1}{20}\right)=0.1\nonumber\]
\[(2-0)=2= \text{base of rectangle}\nonumber\]
提醒
矩形的面积 =(底部)(高度)。
该区域对应概率。 介于零和二之间的概率\(x\)是\(0.1\),在数学上可以写成\(P(0 < x < 2) = P(x < 2) = 0.1\)。
假设我们想找到介于\(\bf{f(x) = \frac{1}{20}}\)和 x 轴之间的区域\(\bf{ 4 < x < 15 }\)。
\(\operatorname{AREA}=(15-4)\left(\frac{1}{20}\right)=0.55\)
\((15 – 4) = 11 = \text{the base of a rectangle}\)
面积对应于概率\(P (4 < x < 15) = 0.55\)。
假设我们想找到\(P(x = 15)\)。 在 x-y 图上,\(x = 15\)是一条垂直线。 垂直线没有宽度(或零宽度)。 因此,\(P(x = 15) =\)(底座)(高度)\(= (0)\left(\frac{1}{20}\right) = 0\)
\(P(X ≤ x)\),也可以写成\(P(X < x)\)连续分布函数,称为累积分布函数或 CDF。 注意 “小于或等于” 符号。 我们也可以使用 CDF 来计算\(P (X > x)\)。 CDF 给出 “左边的区域” 并\(P(X > x)\)给出 “右边的区域”。 我们按如下方式计算\(P(X > x)\)连续分布:\(P(X > x) = 1 – P (X < x)\).
使用\(f(x)\)和标记图表\(x\)。 使用最大值\(x\)和\(y\)值缩放\(x\)和\(y\)轴。 \(f(x) = \frac{1}{20} , 0 ≤ x ≤ 20\)。
要计算两个\(x\)值之间的概率,请看下图。 对\(x = 2.3\)和之间的区域进行遮蔽\(x = 12.7\)。 然后计算矩形的阴影面积。
\(P(2.3<x<12.7)=(\text { base })(\text { height })=(12.7-2.3)\left(\frac{1}{20}\right)=0.52\)
练习\(\PageIndex{1}\)
考虑这个函数\(f(x) = \frac{1}{8}\)\(0 \leq x \leq 8\)。 绘制图表\(f(x))\)并查找\(P(2.5 < x < 7.5)\)。