Skip to main content
Global

8.3: Um intervalo de confiança para uma proporção populacional

  • Page ID
    186529
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Durante um ano eleitoral, vemos artigos no jornal que indicam os intervalos de confiança em termos de proporções ou porcentagens. Por exemplo, uma pesquisa para um candidato específico concorrendo à presidência pode mostrar que o candidato tem 40% dos votos dentro de três pontos percentuais (se a amostra for grande o suficiente). Muitas vezes, as pesquisas eleitorais são calculadas com 95% de confiança, portanto, os pesquisadores teriam 95% de confiança de que a proporção real de eleitores que favoreceram o candidato estaria entre 0,37 e 0,43.

    Os investidores no mercado de ações estão interessados na verdadeira proporção de ações que sobem e descem a cada semana. As empresas que vendem computadores pessoais estão interessadas na proporção de residências nos Estados Unidos que possuem computadores pessoais. Os intervalos de confiança podem ser calculados para a proporção real de estoques que sobem ou diminuem a cada semana e para a proporção real de famílias nos Estados Unidos que possuem computadores pessoais.

    O procedimento para encontrar o intervalo de confiança para uma proporção da população é semelhante ao da média da população, mas as fórmulas são um pouco diferentes, embora conceitualmente idênticas. Embora as fórmulas sejam diferentes, elas são baseadas na mesma base matemática que nos foi dada pelo Teorema do Limite Central. Por causa disso, veremos o mesmo formato básico usando as mesmas três informações: o valor amostral do parâmetro em questão, o desvio padrão da distribuição amostral relevante e o número de desvios padrão que precisamos para ter a confiança que desejamos em nossa estimativa.

    Como você sabe que está lidando com um problema de proporção? Primeiro, a distribuição subjacente tem uma variável aleatória binária e, portanto, é uma distribuição binomial. (Não há menção de uma média ou média.) Se\(X\) for uma variável aleatória binomial, então\(X \sim B(n, p)\) onde\(n\) está o número de ensaios e\(p\) a probabilidade de sucesso. Para formar uma proporção amostral\(X\), pegue a variável aleatória para o número de sucessos e divida-a pelo\(n\) número de ensaios (ou o tamanho da amostra). A variável aleatória\(P^{\prime}\) (leia-se “P prime”) é a proporção da amostra,

    \[P^{\prime}=\frac{X}{n} \nonumber\]

    (Às vezes, a variável aleatória é indicada como\(\hat{P}\), leia “P hat”.)

    • \(P^{\prime}\)= a proporção estimada de sucessos ou a proporção amostral de sucessos (\(P^{\prime}\)é uma estimativa pontual para\(p\) a proporção real da população e, portanto,\(q\) é a probabilidade de uma falha em qualquer tentativa).
    • \(x\)= o número de sucessos na amostra
    • \(n\)= o tamanho da amostra

    A fórmula para o intervalo de confiança para uma proporção da população segue o mesmo formato de uma estimativa da média da população. Lembrando a distribuição amostral para a proporção do Capítulo 7, o desvio padrão foi encontrado como:

    \[\sigma_{\mathrm{p}^{\prime}}=\sqrt{\frac{p(1-p)}{n}}\nonumber\]

    O intervalo de confiança para uma proporção da população, portanto, se torna:

    \[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

    \(Z_{\left(\frac{a}{2}\right)}\)é definido de acordo com nosso grau de confiança desejado e\(\sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\) é o desvio padrão da distribuição amostral.

    As proporções da amostra\(\bf{p^{\prime}}\) e\(\bf{q^{\prime}}\) são estimativas das proporções populacionais desconhecidas\(\bf{p}\)\(\bf{q}\) e. As proporções\(q^{\prime}\) estimadas\(p^{\prime}\) e são usadas porque\(p\) e não\(q\) são conhecidas.

    Lembre-se de que, à medida que\(p\) se afasta de 0,5, a distribuição binomial se torna menos simétrica. Como estamos estimando o binômio com a distribuição normal simétrica, quanto mais longe do simétrico o binômio se torna, menor confiança temos na estimativa.

    Essa conclusão pode ser demonstrada por meio da análise a seguir. As proporções são baseadas na distribuição binomial de probabilidade. Os resultados possíveis são binários, seja “sucesso” ou “fracasso”. Isso dá origem a uma proporção, ou seja, a porcentagem dos resultados que são “sucessos”. Foi demonstrado que a distribuição binomial poderia ser totalmente compreendida se soubéssemos apenas a probabilidade de sucesso em qualquer tentativa, chamada\(p\). A média e o desvio padrão do binômio foram encontrados em:

    \[\mu=\mathrm{np}\nonumber\]

    \[\sigma=\sqrt{npq}\nonumber\]

    Também foi demonstrado que o binômio poderia ser estimado pela distribuição normal se AMBOS\(np\) E\(nq\) fossem maiores que 5. A partir da discussão acima, constatou-se que a fórmula padronizadora para a distribuição binomial é:

    \[Z=\frac{\mathrm{p}^{\prime}-p}{\sqrt{\left(\frac{p q}{n}\right)}}\nonumber\]

    o que nada mais é do que uma reformulação da fórmula geral de padronização com substituições apropriadas para\(\mu\) e\(\sigma\) do binômio. Podemos usar a distribuição normal padrão, a razão\(Z\) está na equação, porque a distribuição normal é a distribuição limitante do binômio. Este é outro exemplo do Teorema do Limite Central. Já vimos que a distribuição amostral das médias é normalmente distribuída. Lembre-se da extensa discussão no Capítulo 7 sobre a distribuição amostral das proporções e as conclusões do Teorema do Limite Central.

    Agora podemos manipular essa fórmula da mesma forma que fizemos para encontrar os intervalos de confiança para uma média, mas para encontrar o intervalo de confiança para o parâmetro binomial da população,\(p\).

    \[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

    Onde\(p^{\prime} = x/n\), a estimativa pontual de\(p\) retirada da amostra. Observe que\(p^{\prime}\) foi substituído\(p\) na fórmula. Isso ocorre porque não sabemos\(p\), na verdade, isso é exatamente o que estamos tentando estimar.

    Infelizmente, não há fator de correção para casos em que o tamanho da amostra é pequeno\(np^{\prime}\) e\(nq^{\prime}\) deve sempre ser maior que 5 para desenvolver uma estimativa de intervalo\(p\).

    Exemplo\(\PageIndex{1}\)

    Suponha que uma empresa de pesquisa de mercado seja contratada para estimar a porcentagem de adultos que vivem em uma grande cidade que têm telefones celulares. Quinhentos residentes adultos selecionados aleatoriamente nesta cidade são pesquisados para determinar se eles têm telefones celulares. Das 500 pessoas amostradas, 421 responderam que sim — elas possuem telefones celulares. Usando um nível de confiança de 95%, calcule uma estimativa do intervalo de confiança para a proporção real de residentes adultos desta cidade que têm telefones celulares.

    Responda
    A solução passo a passo.

    Seja\(X\) = o número de pessoas na amostra que têm telefones celulares. \(X\)é binomial: a variável aleatória é binária, as pessoas têm um telefone celular ou não.

    Para calcular o intervalo de confiança, precisamos encontrar\(p^{\prime}, q^{\prime}\).

    \(n = 500\)

    \(x=\text { the number of successes in the sample }=421\)

    \(p^{\prime}=\frac{x}{n}=\frac{421}{500}=0.842\)

    \(p^{\prime}=0.842\)é a proporção da amostra; essa é a estimativa pontual da proporção da população.

    \(q^{\prime}=1-p^{\prime}=1-0.842=0.158\)

    Uma vez que o nível de confiança solicitado é\(CL = 0.95\), então\(\alpha=1-C L=1-0.95=0.05\left(\frac{\alpha}{2}\right)=0.025\).

    Então\(z_{\frac{\alpha}{2}}=z_{0.025}=1.96\)

    Isso pode ser encontrado usando a tabela de probabilidade normal padrão na Tabela\(\PageIndex{6}\). Isso também pode ser encontrado na tabela t de estudantes na coluna 0,025 e em graus infinitos de liberdade, porque em graus infinitos de liberdade, a distribuição t de estudantes se torna a distribuição normal padrão,\(Z\).

    O intervalo de confiança para a verdadeira proporção binomial da população é

    \[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

    \(\text{Substituting in the values from above we find the confidence interval is : } 0.810 \leq p \leq 0.874\)

    Interpretação

    Estimamos com 95% de confiança que entre 81% e 87,4% de todos os residentes adultos desta cidade tenham telefones celulares.

    Explicação do nível de confiança de 95%

    Noventa e cinco por cento dos intervalos de confiança construídos dessa forma conteriam o valor real da proporção da população de todos os residentes adultos desta cidade que possuem telefones celulares.

    Exercício\(\PageIndex{1}\)

    Suponha que 250 pessoas selecionadas aleatoriamente sejam pesquisadas para determinar se elas possuem um tablet. Dos 250 pesquisados, 98 relataram possuir um tablet. Usando um nível de confiança de 95%, calcule uma estimativa do intervalo de confiança para a proporção real de pessoas que possuem tablets.

    Exemplo\(\PageIndex{2}\)

    A Dundee Dog Training School tem uma proporção maior do que a média de clientes que competem em eventos profissionais competitivos. É construído um intervalo de confiança para a proporção da população de cães que competem em eventos profissionais de 150 escolas de treinamento diferentes. O limite inferior é determinado como 0,08 e o limite superior é determinado como 0,16. Determine o nível de confiança usado para construir o intervalo da proporção da população de cães que competem em eventos profissionais.

    Responda

    Começamos com a fórmula para um intervalo de confiança para uma proporção porque a variável aleatória é binária; ou o cliente compete em eventos caninos competitivos profissionais ou não.

    \[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

    Em seguida, encontramos a proporção da amostra:

    \[p^{\prime}=\frac{0.08+0.16}{2}=0.12\nonumber\]

    O\(\pm\) que compõe o intervalo de confiança é, portanto\(0.12 − 0.04 = 0.08\),\(0.04; 0.12 + 0.04 = 0.16\) e, os limites do intervalo de confiança. Finalmente, resolvemos\(Z\).

    \(\left[Z \cdot \sqrt{\frac{0.12(1-0.12)}{150}}\right]=0.04, \textbf { therefore } \bf{z=1.51}\)

    Em seguida, pesquise a probabilidade de 1,51 desvios padrão na tabela normal padrão.

    \(p(Z=1.51)=0.4345, p(Z) \cdot 2=0.8690 \textbf { or } 86.90 \%\).

    Exemplo\(\PageIndex{3}\)

    Um diretor financeiro de uma empresa deseja estimar a porcentagem de contas a receber com mais de 30 dias de atraso. Ele pesquisa 500 contas e descobre que 300 estão atrasadas há mais de 30 dias. Calcule um intervalo de confiança de 90% para a porcentagem real de contas a receber com mais de 30 dias de atraso e interprete o intervalo de confiança.

    Responda
    A solução é passo a passo:

    Noventa por cento de todos os intervalos de confiança construídos dessa forma contêm o valor real da porcentagem da população de contas a receber que estão atrasadas em 30 dias.

    Explicação do nível de confiança de 90%

    \(x = 300\)e\(n = 500\)

    \(p^{\prime}=\frac{x}{n}=\frac{300}{500}=0.600\)

    \(q^{\prime}=1-p^{\prime}=1-0.600=0.400\)

    Como o nível de confiança =\(0.90\), então\(a=1-\text { confidence level }=(1-0.90)=0.10\left(\frac{\alpha}{2}\right)=0.05\)

    \(Z_{\frac{\alpha}{2}}=Z_{0.05}=1.645\)

    Esse valor Z pode ser encontrado usando uma tabela de probabilidade normal padrão. A mesa t do aluno também pode ser usada inserindo a tabela na coluna de 0,05 e lendo na linha para obter graus infinitos de liberdade. A distribuição t é a distribuição normal em graus infinitos de liberdade. Esse é um truque útil a ser lembrado ao encontrar valores Z para os níveis de confiança comumente usados. Usamos essa fórmula para um intervalo de confiança para uma proporção:

    \[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

    Substituindo os valores acima, descobrimos que o intervalo de confiança para a verdadeira proporção binomial da população é\(0.564 \leq p \leq 0.636\)

    Interpretação

    Estimamos com 90% de confiança que a porcentagem real de todas as contas a receber vencidas em 30 dias está entre 56,4% e 63,6%. Redação alternativa: estimamos com 90% de confiança que entre 56,4% e 63,6% de TODAS as contas estão atrasadas em 30 dias.

    Exercício\(\PageIndex{2}\)

    Um estudante pesquisa sua escola para ver se os alunos do distrito escolar são a favor ou contra a nova legislação sobre uniformes escolares. Ela pesquisa 600 estudantes e descobre que 480 são contra a nova legislação.

    1. Calcule um intervalo de confiança de 90% para a porcentagem real de estudantes que são contra a nova legislação e interprete o intervalo de confiança.
    2. Em uma amostra de 300 estudantes, 68% disseram ter um iPod e um smartphone. Calcule um intervalo de confiança de 97% para a porcentagem real de estudantes que possuem um iPod e um smartphone.