Skip to main content
Global

7.3: O teorema do limite central para proporções

  • Page ID
    186852
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    O Teorema do Limite Central nos diz que a estimativa pontual para a média da amostra\(\overline x\),, vem de uma distribuição normal de\(\overline x\)'s. Essa distribuição teórica é chamada de distribuição amostral de\(\overline x\)'s. Agora investigamos a distribuição amostral para outro parâmetro importante que desejamos para estimar; a\(p\) partir da função binomial de densidade de probabilidade.

    Se a variável aleatória for discreta, como para dados categóricos, o parâmetro que desejamos estimar é a proporção da população. Essa é, obviamente, a probabilidade de obter sucesso em qualquer sorteio aleatório. Ao contrário do caso que acabamos de discutir para uma variável aleatória contínua em que não sabíamos a distribuição populacional de\(X\)'s, aqui realmente conhecemos a função de densidade de probabilidade subjacente para esses dados; é o binômio. A variável aleatória é\(X =\) o número de sucessos e o parâmetro que desejamos saber é a probabilidade de obter um sucesso que\(p\), obviamente, é a proporção de sucessos na população. A questão em questão é: de qual distribuição foi\(p^{\prime}=\frac{x}{n}\) extraída a proporção da amostra? O tamanho da amostra é\(n\) e\(X\) é o número de sucessos encontrados nessa amostra. Esta é uma pergunta paralela que acabou de ser respondida pelo Teorema do Limite Central: de qual distribuição foi extraída a média da amostra?\(\overline x\) Vimos que, uma vez que soubemos que a distribuição era a distribuição Normal, pudemos criar intervalos de confiança para o parâmetro da população,\(\mu\). Também usaremos essas mesmas informações para testar hipóteses sobre a média da população posteriormente. Desejamos agora ser capazes de desenvolver intervalos de confiança para o parâmetro populacional "\(p\)" a partir da função binomial de densidade de probabilidade.

    Para encontrar a distribuição da qual provêm as proporções amostrais, precisamos desenvolver a distribuição amostral das proporções da amostra, assim como fizemos para as médias amostrais. Então, novamente, imagine que amostramos aleatoriamente 50 pessoas e perguntamos se elas apoiam a nova questão do vínculo escolar. A partir disso\(p^{\prime}\), encontramos uma proporção amostral e a representamos graficamente no eixo\(p\) de s. Fazemos isso repetidamente, etc., etc. até termos a distribuição teórica de\(p\) s. Algumas proporções de amostra mostrarão alta favorabilidade em relação à emissão de títulos e outras mostrarão baixa favorabilidade porque a amostragem aleatória refletirá a variação das visualizações dentro da população. O que fizemos pode ser visto na Figura\(\PageIndex{9}\). O painel superior é a distribuição populacional de probabilidades para cada valor possível da variável aleatória\(X\). Embora não saibamos qual é a aparência da distribuição específica\(p\), porque não sabemos o parâmetro da população, sabemos que ela deve ser mais ou menos assim. Na realidade, não sabemos nem a média nem o desvio padrão dessa distribuição populacional, a mesma dificuldade que enfrentamos ao analisar os\(X\) anos anteriores.

    Figura\(\PageIndex{9}\)

    A figura\(\PageIndex{9}\) coloca a média na distribuição das probabilidades populacionais\(\mu=np\), mas é claro que não sabemos realmente a média da população porque não sabemos a probabilidade de sucesso da população,\(p\). Abaixo da distribuição dos valores da população está a distribuição amostral de\(p\)'s. Novamente, o Teorema do Limite Central nos diz que essa distribuição é normalmente distribuída exatamente como o caso da distribuição amostral para\(\overline x\)'s. Essa distribuição amostral também tem uma média, a média do \(p\)'s e um desvio padrão,\(\sigma_{p^{\prime}}\).

    É importante ressaltar que, no caso da análise da distribuição das médias da amostra, o Teorema do Limite Central nos disse o valor esperado da média das médias da amostra na distribuição amostral e o desvio padrão da distribuição amostral. Novamente, o Teorema do Limite Central fornece essas informações para a distribuição amostral de proporções. As respostas são:

    1. O valor esperado da média da distribuição amostral das proporções amostrais,\(\mu_{p^{\prime}}\), é a proporção da população,\(p\).
    2. O desvio padrão da distribuição amostral das proporções da amostra\(\sigma_{p^{\prime}}\),, é o desvio padrão da população dividido pela raiz quadrada do tamanho da amostra,\(n\).

    Ambas as conclusões são as mesmas que encontramos para a distribuição amostral para médias amostrais. No entanto, neste caso, como a média e o desvio padrão da distribuição binomial dependem de pp, a fórmula para o desvio padrão da distribuição amostral requer manipulação algébrica para ser útil. Abordaremos isso no próximo capítulo. A prova dessas importantes conclusões do Teorema do Limite Central é fornecida abaixo.

    \[E\left(p^{\prime}\right)=E\left(\frac{x}{n}\right)=\left(\frac{1}{n}\right) E(x)=\left(\frac{1}{n}\right) n p=p\nonumber\]

    (O valor esperado de\(X\)\(E(x)\),, é simplesmente a média da distribuição binomial que sabemos ser np.)

    \[\sigma_{\mathrm{p}}^{2}=\operatorname{Var}\left(p^{\prime}\right)=\operatorname{Var}\left(\frac{x}{n}\right)=\frac{1}{n^{2}}(\operatorname{Var}(x))=\frac{1}{n^{2}}(n p(1-p))=\frac{p(1-p)}{n}\nonumber\]

    O desvio padrão da distribuição amostral para proporções é, portanto:

    \[\sigma_{\mathrm{p}},=\sqrt{\frac{p(1-P)}{n}}\nonumber\]

    \ (\ PageIndex {2}\) “>
    Parâmetro Distribuição da população Amostra Distribuição amostral de\(p\)'s
    Significa \(\mu = np\) \(p^{\prime}=\frac{x}{n}\)\) \ (p\)'s” class="lt-stats-4585">\(p^{\prime} \text { and } E(p^{\prime})=p\)
    Desvio padrão \(\sigma=\sqrt{n p q}\) \ (p\)'s” class="lt-stats-4585">\(\sigma_{p^{\prime}}=\sqrt{\frac{p(1-p)}{n}}\)
    Tabela\(\PageIndex{2}\)

    A tabela\(\PageIndex{2}\) resume esses resultados e mostra a relação entre a população, a amostra e a distribuição da amostra. Observe o paralelo entre esta tabela e a tabela\(\PageIndex{1}\) para o caso em que a variável aleatória é contínua e estávamos desenvolvendo a distribuição amostral para médias.

    Analisando a fórmula do desvio padrão da distribuição amostral para proporções, vemos que, à medida que\(n\) aumenta, o desvio padrão diminui. Essa é a mesma observação que fizemos para o desvio padrão da distribuição amostral para médias. Novamente, à medida que o tamanho da amostra aumenta, a estimativa de pontos para um\(\mu\) ou\(p\) é encontrada como proveniente de uma distribuição com uma distribuição cada vez mais estreita. Concluímos que, com um determinado nível de probabilidade, o intervalo do qual a estimativa pontual vem é menor à medida que o tamanho da amostra,\(n\), aumenta. A figura\(\PageIndex{8}\) mostra esse resultado para o caso de médias amostrais. Basta substituir\(p^{\prime}\)\(\overline x\) e podemos ver o impacto do tamanho da amostra na estimativa da proporção da amostra.