Skip to main content
Global

8.4: Calculando o tamanho da amostra n- Variáveis aleatórias contínuas e binárias

  • Page ID
    186531
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    variáveis aleatórias contínuas

    Normalmente, não temos controle sobre o tamanho da amostra de um conjunto de dados. No entanto, se pudermos definir o tamanho da amostra, como nos casos em que estamos fazendo uma pesquisa, é muito útil saber o tamanho que ela deve ser para fornecer o máximo de informações. A amostragem pode ser muito cara tanto no tempo quanto no produto. Pesquisas telefônicas simples custarão aproximadamente $30,00 cada, por exemplo, e algumas amostras exigem a destruição do produto.

    Se voltarmos à nossa fórmula de padronização para a distribuição de amostras para médias, podemos ver que é possível resolvê-la para n. Se fizermos isso, temos\((\overline{X}-\mu)\) no denominador.

    \[n=\frac{Z_{\alpha}^{2} \sigma^{2}}{(\overline{X}-\mu)^{2}}=\frac{Z_{\alpha}^{2} \sigma^{2}}{e^{2}}\nonumber\]

    Como ainda não coletamos uma amostra, não conhecemos nenhuma das variáveis na fórmula, exceto que podemos\(Z_{\alpha}\) definir o nível de confiança que desejamos, assim como fizemos ao determinar os intervalos de confiança. Se definirmos um erro aceitável predeterminado, ou tolerância, para a diferença entre\(\overline{X}\) e\(\mu\), chamado e na fórmula, estamos muito mais longe na resolução do tamanho da amostra\(n\). Ainda não sabemos o desvio padrão da população,\(\sigma\). Na prática, geralmente é feita uma pré-pesquisa, o que permite o ajuste fino do questionário e fornece um desvio padrão da amostra que pode ser usado. Em outros casos, informações anteriores de outras pesquisas podem ser usadas\(\sigma\) na fórmula. Embora seja bruto, esse método de determinar o tamanho da amostra pode ajudar a reduzir significativamente os custos. Serão os dados reais coletados que determinarão as inferências sobre a população, portanto, o cuidado no tamanho da amostra é apropriado, exigindo altos níveis de confiança e pequenos erros de amostragem.

    Variáveis aleatórias binárias

    O que foi feito nos casos em que se procura a média de uma distribuição também pode ser feito na amostragem para determinar o parâmetro populacional\(p\) para proporções. A manipulação da fórmula padronizadora para proporções fornece:

    \[n=\frac{Z_{\alpha}^{2} \mathrm{pq}}{e^{2}}\nonumber\]

    onde\(e=\left(p^{\prime}-p\right)\), e é o erro de amostragem aceitável, ou tolerância, para esta aplicação. Isso será medido em pontos percentuais.

    Nesse caso, o próprio objeto de nossa pesquisa está na fórmula e\(p\), claro,\(q\) porque\(q =1-p\). Esse resultado ocorre porque a distribuição binomial é uma distribuição de um parâmetro. Se soubermos\(p\), então sabemos a média e o desvio padrão. Portanto,\(p\) aparece no desvio padrão da distribuição amostral, que é onde obtivemos essa fórmula. Se, com muita cautela, substituirmos 0,5 por,\(p\) extrairemos o maior tamanho de amostra necessário que fornecerá o nível de confiança especificado por\(Z \alpha\) e a tolerância que selecionamos. Isso é verdade porque, de todas as combinações de duas frações que se somam a uma, o maior múltiplo é quando cada uma é 0,5. Sem qualquer outra informação sobre o parâmetro da população\(p\), essa é a prática comum. Isso pode resultar em sobreamostragem, mas certamente não em subamostragem, portanto, essa é uma abordagem cautelosa.

    Há uma compensação interessante entre o nível de confiança e o tamanho da amostra que aparece aqui quando se considera o custo da amostragem. A tabela\(\PageIndex{1}\) mostra o tamanho amostral apropriado em diferentes níveis de confiança e diferentes níveis do erro aceitável ou tolerância.

    \ (\ PageIndex {1}\) “>
    Tamanho de amostra necessário (90%) Tamanho de amostra necessário (95%) Nível de tolerância
    1691 2401 2%
    752 1067 3%
    271 384 5%
    68 96 10%
    Tabela\(\PageIndex{1}\)

    Esta tabela foi projetada para mostrar o tamanho máximo da amostra necessário em diferentes níveis de confiança, considerando o pressuposto\(p= 0.5\) e\(q=0.5\) conforme discutido acima.

    O erro aceitável, chamado de tolerância na tabela, é medido em valores positivos ou negativos da proporção real. Por exemplo, um erro aceitável de 5% significa que, se a proporção da amostra fosse de 26%, a conclusão seria que a proporção real da população está entre 21 e 31%, com um nível de confiança de 90% se uma amostra de 271 tivesse sido coletada. Da mesma forma, se o erro aceitável fosse definido em 2%, a proporção da população estaria entre 24 e 28 por cento com um nível de confiança de 90 por cento, mas exigiria que o tamanho da amostra fosse aumentado de 271 para 1.691. Se quiséssemos um maior nível de confiança, precisaríamos de um tamanho de amostra maior. Passar de um nível de confiança de 90 por cento para um nível de 95 por cento com uma tolerância de mais ou menos 5% requer a alteração do tamanho da amostra de 271 para 384. Um tamanho de amostra muito comum frequentemente relatado em pesquisas políticas é 384. Com os resultados da pesquisa, é frequentemente afirmado que os resultados são bons para um nível de “precisão” de mais ou menos 5%.

    Exemplo\(\PageIndex{9}\)

    Suponha que uma empresa de telefonia móvel queira determinar a porcentagem atual de clientes com mais de 50 anos que usam mensagens de texto em seus telefones celulares. Quantos clientes com mais de 50 anos a empresa deve pesquisar para ter 90% de confiança de que a proporção estimada (amostra) está dentro de três pontos percentuais da proporção real da população de clientes com mais de 50 anos que usam mensagens de texto em seus telefones celulares.

    Responda

    Solução 8.9

    A partir do problema, sabemos que o erro aceitável,\(e\), é 0,03 (3% =0,03) e\(z_{\frac{\alpha}{2}} Z_{0.05}=1.645\) porque o nível de confiança é 90%. O erro aceitável,\(e\), é a diferença entre a proporção real da população p e a proporção da amostra que esperamos obter da amostra.

    No entanto, para encontrar\(n\), precisamos saber a proporção estimada (amostra)\(p^{\prime}\). Lembre-se disso\(q^{\prime} = 1 – p^{\prime}\). Mas,\(p^{\prime}\) ainda não sabemos. Como multiplicamos\(p^{\prime}\) e\(q^{\prime}\) juntos, fazemos com que ambos sejam iguais a 0,5 porque\(p^{\prime}q^{\prime} = (0.5)(0.5) = 0.25\) resultam no maior produto possível. (Experimente outros produtos:\((0.6)(0.4) = 0.24; (0.3)(0.7) = 0.21; (0.2)(0.8) = 0.16\) e assim por diante). O maior produto possível nos dá o maior n. Isso nos dá uma amostra grande o suficiente para que possamos ter 90% de confiança de que estamos dentro de três pontos percentuais da proporção real da população. Para calcular o tamanho da amostra n, use a fórmula e faça as substituições.

    \(n=\frac{z^{2} p^{\prime} q^{\prime}}{e^{2}} \text { gives } n=\frac{1.645^{2}(0.5)(0.5)}{0.03^{2}}=751.7\)

    Arredonde a resposta para o próximo valor mais alto. O tamanho da amostra deve ser de 752 clientes de telefones celulares com mais de 50 anos para ter 90% de confiança de que a proporção estimada (amostra) está dentro de três pontos percentuais da proporção real da população de todos os clientes com mais de 50 anos que usam mensagens de texto em seus telefones celulares.

    Exercício\(\PageIndex{9}\)

    Suponha que uma empresa de marketing na internet queira determinar a porcentagem atual de clientes que clicam em anúncios em seus smartphones. Quantos clientes a empresa deve pesquisar para ter 90% de confiança de que a proporção estimada está dentro de cinco pontos percentuais da proporção real da população de clientes que clicam em anúncios em seus smartphones?