4.1: Distribuição hipergeométrica
- Page ID
- 187036
A função de densidade de probabilidade mais simples é a hipergeométrica. Esse é o mais básico porque foi criado combinando nosso conhecimento de probabilidades dos diagramas de Venn, as regras de adição e multiplicação e a fórmula de contagem combinatória.
Para descobrir o número de maneiras de obter 2 ases dos quatro no baralho, calculamos:
\[\left(\begin{array}{l}{4} \\ {2}\end{array}\right)=\frac{4 !}{2 !(4-2) !}=6\nonumber\]
E se não nos importássemos com o que mais tínhamos em nossas mãos para as outras três cartas, computaríamos:
\[\left(\begin{array}{c}{48} \\ {3}\end{array}\right)=\frac{48 !}{3 ! 45 !}=17,296\nonumber\]
Juntando isso, podemos calcular a probabilidade de obter exatamente dois ases em uma mão de pôquer de 5 cartas da seguinte forma:
\[\frac{\left(\begin{array}{l}{4} \\ {2}\end{array}\right)\left(\begin{array}{c}{48} \\ {3}\end{array}\right)}{\left(\begin{array}{c}{52} \\ {5}\end{array}\right)}=.0399\nonumber\]
Essa solução é, na verdade, apenas a distribuição de probabilidade conhecida como hipergeométrica. A fórmula generalizada é:
\[h(x)=\frac{\left(\begin{array}{l}{A} \\ {x}\end{array}\right)\left(\begin{array}{c}{N-A} \\ {n-x}\end{array}\right)}{\left(\begin{array}{l}{N} \\ {n}\end{array}\right)}\nonumber\]
onde\(x\) = o número que estamos interessados em vir do grupo com objetos A.
\(h(x)\)é a probabilidade de\(x\) sucesso, em n tentativas, quando A (neste caso, ases) estão em uma população que contém N elementos. A distribuição hipergeométrica é um exemplo de distribuição de probabilidade discreta porque não há possibilidade de sucesso parcial, ou seja, não pode haver mãos de pôquer com 2 1/2 ases. Dito de outra forma, uma variável aleatória discreta deve ser um número inteiro, ou apenas contando. Essa distribuição de probabilidade funciona nos casos em que a probabilidade de sucesso muda a cada sorteio. Outra forma de dizer isso é que os eventos NÃO são independentes. Ao usar um baralho de cartas, estamos testando SEM substituição. Se colocarmos cada cartão de volta após o sorteio, a distribuição hipergeométrica será um PDF inadequado.
Para que o hipergeométrico funcione,
- a população deve ser dividida em dois e apenas dois subconjuntos independentes (ases e não ases em nosso exemplo). A variável aleatória\(X\) = o número de itens do grupo de interesse.
- o experimento deve ter probabilidades variáveis de sucesso em cada experimento (o fato de as cartas não serem substituídas após o sorteio em nosso exemplo torna isso verdade neste caso). Outra forma de dizer isso é que você coleta amostras sem reposição e, portanto, cada escolha não é independente.
- a variável aleatória deve ser discreta, em vez de contínua.
Exemplo\(\PageIndex{1}\)
Um prato de doces contém 30 jujubas e 20 gomas de goma. Dez doces são colhidos aleatoriamente. Qual é a probabilidade de que 5 dos 10 sejam chicletes? Os dois grupos são jujubas e gomas. Como a pergunta probabilística pergunta sobre a probabilidade de colher chicletes, o grupo de interesse (primeiro grupo A na fórmula) é o chiclete. O tamanho do grupo de interesse (primeiro grupo) é 30. O tamanho do segundo grupo é 20. O tamanho da amostra é 10 (jujubas ou gomas). Seja\(X\) = o número de gomas na amostra de 10. \(X\)assume os valores\(x = 0, 1, 2, ..., 10\). a. Qual é a declaração de probabilidade escrita matematicamente? b. O que é a função de densidade de probabilidade hipergeométrica escrita para resolver esse problema? c. Qual é a resposta para a pergunta “Qual é a probabilidade de tirar 5 chicletes em 10 palhetas do prato?”
- Responda
-
a.\(P(x=5)\)
b.\(P(x=5)=\frac{\left(\begin{array}{c}{30} \\ {5}\end{array}\right)\left(\begin{array}{c}{20} \\ {5}\end{array}\right)}{\left(\begin{array}{c}{50} \\ {10}\end{array}\right)}\)
c.\(P(x=5)=0.215\)
Exercício\(\PageIndex{1}\)
Uma bolsa contém ladrilhos de letras. Quarenta e quatro dos blocos são vogais e 56 são consoantes. Sete peças são escolhidas aleatoriamente. Você quer saber a probabilidade de que quatro dos sete blocos sejam vogais. Qual é o grupo de interesse, o tamanho do grupo de interesse e o tamanho da amostra?