Skip to main content
Global

4.0: Introdução às variáveis aleatórias discretas

  • Page ID
    186976
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Esta foto mostra um galho clareando vindo de uma nuvem escura e atingindo o chão.
    Figura\(\PageIndex{1}\) Você pode usar probabilidade e variáveis aleatórias discretas para calcular a probabilidade de um raio atingir o solo cinco vezes durante uma tempestade de meia hora. (Crédito: Leszek Leszczynski)

    Um aluno responde a um questionário de dez perguntas, verdadeiro e falso. Como o aluno tinha uma agenda muito ocupada, ele ou ela não conseguia estudar e adivinhar aleatoriamente cada resposta. Qual é a probabilidade de o aluno passar no teste com pelo menos 70%?

    Pequenas empresas podem estar interessadas no número de chamadas telefônicas de longa distância que seus funcionários fazem durante o horário de pico do dia. Suponha que a média histórica seja de 20 chamadas. Qual é a probabilidade de os funcionários fazerem mais de 20 chamadas telefônicas de longa distância durante o horário de pico?

    Esses dois exemplos ilustram dois tipos diferentes de problemas de probabilidade envolvendo variáveis aleatórias discretas. Lembre-se de que dados discretos são dados que você pode contar, ou seja, a variável aleatória só pode assumir valores de números inteiros. Uma variável aleatória descreve os resultados de um experimento estatístico em palavras. Os valores de uma variável aleatória podem variar com cada repetição de um experimento, geralmente chamada de tentativa.

    Notação de variável aleatória

    A letra maiúscula X indica uma variável aleatória. Letras minúsculas como x ou y indicam o valor de uma variável aleatória. Se X for uma variável aleatória, X será escrito em palavras e x será dado como um número.

    Por exemplo, deixe X = o número de cabeças que você recebe ao jogar três moedas justas. O espaço amostral para o sorteio de três moedas justas é TTT; THH; HTH; HHT; HTT; TTH; HHH. Então, x = 0, 1, 2, 3. X está em palavras e x é um número. Observe que, neste exemplo, os valores de x são resultados contáveis. Como você pode contar os valores possíveis como números inteiros que X pode assumir e os resultados são aleatórios (os valores de x 0, 1, 2, 3), X é uma variável aleatória discreta.

    Funções de densidade de probabilidade (PDF) para uma variável aleatória

    Uma função de densidade de probabilidade ou função de distribuição de probabilidade tem duas características:

    1. Uma função de densidade de probabilidade é uma fórmula matemática que calcula probabilidades para tipos específicos de eventos, o que chamamos de experimentos. Há uma espécie de mágica em uma função de densidade de probabilidade (Pdf) parcialmente porque a mesma fórmula geralmente descreve tipos muito diferentes de eventos. Por exemplo, o binômio Pdf calculará probabilidades de jogar moedas, perguntas de sim/não em um exame, opiniões de eleitores em uma pesquisa de opinião positiva ou negativa, na verdade, qualquer evento binário. Outras funções de densidade de probabilidade fornecerão probabilidades de tempo até que uma peça falhe, quando um cliente chegará à cabine de pedágio, o número de chamadas telefônicas que chegam a uma central telefônica, a taxa de crescimento de uma bactéria e assim por diante. Existem famílias inteiras de funções de densidade de probabilidade que são usadas em uma ampla variedade de aplicações, incluindo medicina, negócios e finanças, física e engenharia, entre outras.

      Para nossas necessidades aqui, vamos nos concentrar em apenas algumas funções de densidade de probabilidade à medida que desenvolvemos as ferramentas da estatística inferencial.

      Fórmulas de contagem e a fórmula combinacional

      Como equação, isso é:

      \[P(A)=\frac{\text { number of ways to get } \mathrm{A}}{\text { Total number of possible outcomes }}\]

      Quando analisamos o espaço amostral para jogar 3 moedas, poderíamos facilmente escrever o espaço completo da amostra e, assim, contar facilmente o número de eventos que atingiram nosso resultado desejado, por exemplo, x = 1, onde X é a variável aleatória definida como o número de cabeças.

      Como temos um número maior de itens no espaço da amostra, como um baralho completo de 52 cartas, a capacidade de escrever o espaço da amostra se torna impossível.

      Vemos que as probabilidades nada mais são do que contar os eventos em cada grupo em que estamos interessados e dividir pelo número de elementos no universo ou espaço amostral. Isso é bastante fácil se estivermos contando alunos do segundo ano em uma aula de Stat, mas em casos mais complicados, listar todos os resultados possíveis pode levar uma vida inteira. Há, por exemplo, 36 resultados possíveis do lançamento de apenas dois dados de seis lados, onde a variável aleatória é a soma do número de pontos nos lados voltados para cima. Se houvesse quatro dados, o número total de resultados possíveis seria 1.296. Há mais de 2,5 MILHÕES possíveis de mãos de pôquer de 5 cartas em um baralho padrão de 52 cartas. Obviamente, acompanhar todas essas possibilidades e contá-las para chegar a uma única probabilidade seria, na melhor das hipóteses, tedioso.

      Uma alternativa para listar o espaço amostral completo e contar o número de elementos nos quais estamos interessados é pular a etapa de listar o espaço amostral e simplesmente descobrir o número de elementos nele contidos e fazer a divisão apropriada. Se estamos atrás de uma probabilidade, realmente não precisamos ver cada elemento no espaço amostral, só precisamos saber quantos elementos existem. As fórmulas de contagem foram inventadas para fazer exatamente isso. Eles nos dizem o número de subconjuntos não ordenados de um determinado tamanho que podem ser criados a partir de um conjunto de elementos exclusivos. Por não ordenado, significa que, por exemplo, ao distribuir cartas, não importa se você obteve {ás, ás, ás, rei} ou {rei, ás, ás, ás, ás, ás} ou {ás, rei, ás, ás, ás, ás} e assim por diante. Cada um desses subconjuntos é o mesmo porque cada um tem 4 ases e um rei.

      Fórmula combinacional

      \[\left(\begin{array}{l}{n} \\ {x}\end{array}\right)=_{n} C_{x}=\frac{n !}{x !(n-x) !}\nonumber\]

      Essa é a fórmula que informa o número de subconjuntos exclusivos não ordenados de tamanho x que podem ser criados a partir de n elementos exclusivos. A fórmula é lida como “n combinatório x”. Às vezes, é lido como “n choose x”. O ponto de exclamação “!” é chamado de fatorial e nos diz para pegar todos os números de 1 até o número antes de! e multiplique-os juntos assim 4! é 1,2·3·4=24. Por definição 0! = 1. A fórmula é chamada de Fórmula Combinatória. Também é chamado de Coeficiente Binomial, por razões que ficarão claras em breve. Embora esse conceito matemático tenha sido entendido muito antes de 1653, Blaise Pascal recebe grande crédito por sua prova que publicou naquele ano. Além disso, ele desenvolveu um método generalizado de cálculo dos valores para combinatórios conhecido por nós como Triângulo Pascal. Pascal foi um dos gênios de uma era de extraordinário avanço intelectual que incluiu o trabalho de Galileu, René Descartes, Isaac Newton, William Shakespeare e o refinamento do método científico, a própria justificativa para o tópico deste texto.

      Vamos descobrir da maneira mais difícil o número total de combinações dos quatro ases em um baralho de cartas se quisermos pegar dois de cada vez. O espaço amostral seria:

      S= {Espada, Coração), (Espada, Diamante), (Espada, Clube), (Diamante, Clube), (Coração, Diamante), (Coração, Clube)}

      Existem 6 combinações; formalmente, seis subconjuntos exclusivos não ordenados de tamanho 2 que podem ser criados a partir de 4 elementos exclusivos. Para usar a fórmula combinatória, resolveríamos a fórmula da seguinte forma:

      \[\left(\begin{array}{l}{4} \\ {2}\end{array}\right)=\frac{4 !}{(4-2) ! 2 !}=\frac{4 \cdot 3 \cdot 2 \cdot 1}{2 \cdot 1 \cdot 2 \cdot 1}=6\nonumber\]

      Se quiséssemos saber o número de mãos únicas de pôquer de 5 cartas que poderiam ser criadas a partir de um baralho de 52 cartas, simplesmente calculamos:

      \[\left(\begin{array}{c}{52} \\ {5}\end{array}\right)\nonumber\]

      onde 52 é o número total de elementos únicos dos quais estamos desenhando e 5 é o grupo de tamanhos em que os colocamos.

      Com a fórmula combinatória, podemos contar o número de elementos em um espaço de amostra sem precisar anotar cada um deles, o que é realmente um trabalho de uma vida inteira com apenas o número de 5 mãos de cartas de um baralho de 52 cartas. Agora podemos aplicar essa ferramenta a uma função de densidade de probabilidade muito importante, a distribuição hipergeométrica.

      Lembre-se de que uma função de densidade de probabilidade calcula probabilidades para nós. Simplesmente colocamos os números apropriados na fórmula e obtemos a probabilidade de eventos específicos. No entanto, para que essas fórmulas funcionem, elas devem ser aplicadas apenas aos casos para os quais foram projetadas.