4.0:离散随机变量简介
- Page ID
- 205028
一个学生参加一个十个问题的、真错的测验。 由于学生的日程安排如此繁忙,他或她无法学习,只能随机猜测每个答案。 学生以至少 70% 的分数通过考试的概率是多少?
小型公司可能会对员工在一天的高峰时段拨打的长途电话数量感兴趣。 假设历史平均值为 20 次呼叫。 员工在高峰时段拨打超过 20 个长途电话的概率是多少?
这两个例子说明了涉及离散随机变量的两种不同类型的概率问题。 回想一下,离散数据是您可以计算的数据,也就是说,随机变量只能使用整数值。 随机变量用文字描述统计实验的结果。 每次重复实验(通常称为试验),随机变量的值可能会有所不同。
随机变量表示法
大写字母 X 表示随机变量。 像 x 或 y 这样的小写字母表示随机变量的值。 如果 X 是随机变量,则 X 用单词书写,x 以数字给出。
例如,假设 X = 投掷三枚公平硬币时获得的头数。 投掷三枚公平硬币的样本空间是 TTT; T HH; HT H; H HT; HT T; TTH; TTH; HHH。 然后,x = 0、1、2、3。 X 是单词,x 是数字。 请注意,在本示例中,x 值是可数的结果。 因为你可以将可能的值算作 X 可以取的整数,结果是随机的(x 值 0、1、2、3),所以 X 是一个离散的随机变量。
随机变量的概率密度函数 (PDF)
概率密度函数或概率分布函数有两个特征:
- 概率密度函数是一种数学公式,用于计算特定类型事件(我们称之为实验)的概率。 概率密度函数 (Pdf) 有一种神奇之处,部分原因是相同的公式通常描述非常不同的事件类型。 例如,二项式 Pdf 将计算掷硬币的概率、考试中的是/否问题、向上或向下民意调查中选民的意见,实际上是任何二元事件的概率。 其他概率密度函数将提供部件失效前的概率、客户到达收费公路摊位的时间、到达中央总机的电话数量、细菌的生长速度等的概率。 概率密度函数系列用于各种各样的应用,包括医学、商业和金融、物理和工程等。
为了满足我们的需求,我们在开发推理统计工具时将只关注几个概率密度函数。
计数公式和组合公式
作为一个方程式,这是:
\[P(A)=\frac{\text { number of ways to get } \mathrm{A}}{\text { Total number of possible outcomes }}\]
当我们查看翻转 3 枚硬币的样本空间时,我们可以很容易地写出完整的样本空间,从而可以轻松计算出符合我们预期结果的事件数量,例如 x = 1,其中 X 是定义为头数的随机变量。
由于我们在样本空间中有更多的物品,比如一整副包含 52 张牌,写出样本空间的能力变得不可能。
我们看到,概率只不过是计算我们感兴趣的每个组中的事件,然后除以宇宙或样本空间中的元素数量。 如果我们在 Stat 类中计算二年级学生,这很容易,但是在更复杂的情况下,列出所有可能的结果可能需要一生的时间。 例如,仅投掷两个六面骰子就有36种可能的结果,其中随机变量是朝上两侧点数的总和。 如果有四个骰子,那么可能的结果总数将变为1,296。 在由52张牌组成的标准牌组中,有超过250万张可能的5张牌扑克牌。 显然,跟踪所有这些可能性并将其计数为单一概率充其量只能是乏味的。
除了列出完整的样本空间并计算我们感兴趣的元素数量之外,另一种方法是跳过列出样本空间的步骤,只需计算出其中的元素数量并进行相应的划分即可。 如果我们追求概率,我们真的不需要看到样本空间中的每个元素,我们只需要知道有多少元素即可。 计数公式就是为了做到这一点而发明的。 它们告诉我们一定大小的无序子集的数量,这些子集可以由一组独特的元素创建。 无序意味着,例如,在发牌时,无论你得到 {ace、ace、ace、ace、king} 还是 {king、ace、ace、ace} 还是 {ace、king、ace、ace} 等都没关系。 这些子集中的每一个都是一样的,因为它们各有 4 个 ace 和一个国王。
组合公式
\[\left(\begin{array}{l}{n} \\ {x}\end{array}\right)=_{n} C_{x}=\frac{n !}{x !(n-x) !}\nonumber\]
这个公式告诉可以从 n 个唯一元素中创建的大小为 x 的唯一无序子集的数量。 公式读作 “n 组合 x”。 有时它被读作 “n 选择 x”。 感叹号 “!” 被称为阶乘,它告诉我们取从 1 到之前的数字的所有数字! 然后将它们乘在一起得到 4! 是 1·2·3·4=24。 顾名思义 0! = 1。 该公式称为组合公式。 它也被称为二项式系数,其原因很快就会明确。 尽管这个数学概念早在1653年之前就被理解了,但布莱斯·帕斯卡尔因其在当年发表的证据而受到高度赞扬。 此外,他开发了一种计算组合值的通用方法,我们称之为帕斯卡三角形。 帕斯卡尔是智力非凡进步时代的天才之一,其中包括伽利略、雷内·笛卡尔、艾萨克·牛顿、威廉·莎士比亚的著作以及科学方法的完善,这正是本文主题的基础。
如果我们要一次拿两张牌,那么让我们找出一副牌中四张王牌的组合总数。 样本空间将是:
S= {Spade、Heart)、(黑桃、钻石)、(黑桃、俱乐部)、(钻石、俱乐部)、(Heart、Diamond)、(Heart、Club)}
有 6 种组合;形式上是六个大小为 2 的独特无序子集,可以由 4 个独特的元素创建。 要使用组合公式,我们将按如下方式求解公式:
\[\left(\begin{array}{l}{4} \\ {2}\end{array}\right)=\frac{4 !}{(4-2) ! 2 !}=\frac{4 \cdot 3 \cdot 2 \cdot 1}{2 \cdot 1 \cdot 2 \cdot 1}=6\nonumber\]
如果我们想知道从52张牌组中可以创建的唯一5张牌扑克牌的数量,我们只需计算一下:
\[\left(\begin{array}{c}{52} \\ {5}\end{array}\right)\nonumber\]
其中 52 是我们正在绘制的唯一元素的总数,5 是我们要将它们放入的大小组。
使用组合公式,我们可以计算样本空间中元素的数量,而不必将每个元素都写下来,对于一副52张牌中的5张牌来说,这确实是一生的工作。 现在,我们可以将此工具应用于一个非常重要的概率密度函数,即超几何分布。
请记住,概率密度函数为我们计算概率。 我们只需在公式中输入适当的数字,就可以得到特定事件的概率。 但是,要使这些公式起作用,它们必须仅适用于设计这些公式的案例。