Skip to main content
Global

8.1: Um intervalo de confiança para um desvio padrão da população, tamanho de amostra conhecido ou grande

  • Page ID
    186523
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Um intervalo de confiança para uma média populacional com um desvio padrão populacional conhecido é baseado na conclusão do Teorema do Limite Central de que a distribuição amostral das médias da amostra segue uma distribuição aproximadamente normal.

    Calculando o intervalo de confiança

    Considere a fórmula de padronização para a distribuição amostral desenvolvida na discussão do Teorema do Limite Central:

    \[Z_{1}=\frac{\overline{X}-\mu_{\overline{X}}}{\sigma_{\overline{X}}}=\frac{\overline{X}-\mu}{\sigma / \sqrt{n}}\nonumber\]

    Observe que\(\mu\) é substituído por\(\mu_{\overline{x}}\) porque sabemos que o valor esperado de\(\mu_{\overline{x}}\) é\(\mu\) do teorema do limite central e\(\sigma_{\overline{x}}\) é substituído por\(\sigma / \sqrt{n}\), também do Teorema do Limite Central.

    Nesta fórmula\(\overline X\), sabemos,\(\sigma_{\overline{x}}\) e\(n\), o tamanho da amostra. (Na verdade, não sabemos o desvio padrão da população, mas temos uma estimativa pontual para isso,\(s\), da amostra que coletamos. Mais sobre isso mais tarde.) O que não sabemos é\(\mu\) ou\(Z_1\). Podemos resolver qualquer um deles em termos do outro. Resolvendo para\(\mu\) em termos de\(Z_1\) doações:

    \[\mu=\overline{X} \pm Z_{1} {\sigma} / \sqrt{n}\nonumber\]

    Lembrando que o Teorema do Limite Central nos diz que a distribuição dos s, a distribuição amostral das médias, é normal e que a distribuição normal é simétrica, podemos reorganizar os termos da seguinte forma:\(\overline X\)

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    Essa é a fórmula para um intervalo de confiança para a média de uma população.

    Observe que\(Z_\alpha\) foi substituído\(Z_1\) nesta equação. É aqui que a escolha deve ser feita pelo estatístico. O analista deve decidir o nível de confiança que deseja impor ao intervalo de confiança. \ alpha é a probabilidade de que o intervalo não contenha a média real da população. O nível de confiança é definido como\((1-\alpha)\). \(Z_\alpha\)é o número de desvios padrão que\(\overline X\) está em relação à média com uma certa probabilidade. Se\(Z_\alpha = 1.96\) escolhermos, estamos solicitando o intervalo de confiança de 95% porque estamos definindo a probabilidade de que a média verdadeira esteja dentro da faixa em 0,95. Se estivermos\(Z_\alpha\) em 1,64, solicitaremos o intervalo de confiança de 90% porque definimos a probabilidade em 0,90. Esses números podem ser verificados consultando a tabela Normal Padrão. Divida 0,95 ou 0,90 pela metade e encontre essa probabilidade dentro do corpo da tabela. Em seguida, leia nas margens superior e esquerda o número de desvios padrão necessários para obter esse nível de probabilidade.

    Na realidade, podemos definir qualquer nível de confiança que desejamos simplesmente alterando o\(Z_\alpha\) valor na fórmula. É a escolha do analista. A convenção comum em economia e na maioria das ciências sociais define intervalos de confiança em níveis de 90, 95 ou 99 por cento. Níveis inferiores a 90% são considerados de pouco valor. O nível de confiança de uma estimativa de intervalo específica é chamado por\((1-\alpha)\).

    Uma boa maneira de ver o desenvolvimento de um intervalo de confiança é representar graficamente a solução para um problema que solicita um intervalo de confiança. Isso é apresentado na Figura\(\PageIndex{2}\) para o exemplo na introdução sobre o número de downloads do iTunes. Esse caso foi para um intervalo de confiança de 95%, mas outros níveis de confiança poderiam ter sido escolhidos com a mesma facilidade, dependendo da necessidade do analista. No entanto, o nível de confiança DEVE ser predefinido e não sujeito a revisão como resultado dos cálculos.

    Essa é uma curva de distribuição normal. O ponto z0.01 é rotulado na borda direita da curva e a região à direita desse ponto está sombreada. A área dessa região sombreada é igual a 0,01. A área sem sombra é igual a 0,99.
    Figura\(\PageIndex{2}\)

    Neste exemplo, digamos que saibamos que o número médio real de downloads do iTunes da população é 2,1. A média real da população está dentro da faixa do intervalo de confiança de 95%. Não há absolutamente nada que garanta que isso aconteça. Além disso, se a média verdadeira estiver fora do intervalo, nunca a saberemos. Devemos sempre lembrar que nunca saberemos a verdadeira média. As estatísticas simplesmente nos permitem, com um determinado nível de probabilidade (confiança), dizer que a média verdadeira está dentro do intervalo calculado. Isso é o que foi chamado na introdução, de “nível de ignorância admitido”.

    Alterando o nível de confiança ou o tamanho da amostra

    Aqui, novamente, está a fórmula para um intervalo de confiança para uma média populacional desconhecida, supondo que saibamos o desvio padrão da população:

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    É claro que o intervalo de confiança é determinado por duas coisas, o nível de confiança escolhido e o desvio padrão da distribuição amostral.\(Z_\alpha\) O desvio padrão da distribuição amostral é ainda mais afetado por duas coisas, o desvio padrão da população e o tamanho da amostra que escolhemos para nossos dados. Aqui, queremos examinar os efeitos de cada uma das escolhas que fizemos no intervalo de confiança calculado, no nível de confiança e no tamanho da amostra.

    Por um momento, devemos perguntar exatamente o que desejamos em um intervalo de confiança. Nosso objetivo era estimar a média da população de uma amostra. Abandonamos a esperança de que algum dia encontraremos a verdadeira média da população e o desvio padrão da população, em qualquer caso, exceto quando temos uma população extremamente pequena e o custo de coletar os dados de interesse é muito pequeno. Em todos os outros casos, devemos confiar em amostras. Com o Teorema do Limite Central, temos as ferramentas para fornecer um intervalo de confiança significativo com um determinado nível de confiança, o que significa uma probabilidade conhecida de estar errado. Por intervalo de confiança significativo, queremos dizer aquele que é útil. Imagine que você precise de um intervalo de confiança para a idade de seus colegas de classe. Você coletou uma amostra e encontrou uma média de 19,8 anos. Você deseja estar muito confiante para relatar um intervalo entre 9,8 anos e 29,8 anos. Esse intervalo certamente conteria a média real da população e teria um nível de confiança muito alto. No entanto, dificilmente se qualifica como significativo. O melhor intervalo de confiança é estreito, embora tenha alta confiança. Há uma tensão natural entre esses dois objetivos. Quanto maior o nível de confiança, maior o intervalo de confiança, como no caso das idades dos alunos acima. Podemos ver essa tensão na equação do intervalo de confiança.

    \[\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\nonumber\]

    O intervalo de confiança aumentará em largura à medida que\(Z_\alpha\) aumenta,\(Z_\alpha\) aumenta à medida que o nível de confiança aumenta. Há uma compensação entre o nível de confiança e a largura do intervalo. Agora, vamos examinar a fórmula novamente e ver que o tamanho da amostra também desempenha um papel importante na largura do intervalo de confiança. O tamanho da amostra, nn, aparece no denominador do desvio padrão da distribuição amostral. À medida que o tamanho da amostra aumenta, o desvio padrão da distribuição amostral diminui e, portanto, a largura do intervalo de confiança, mantendo constante o nível de confiança. Essa relação foi demonstrada na Figura\(\PageIndex{8}\). Novamente, vemos a importância de ter amostras grandes para nossa análise, embora enfrentemos uma segunda restrição, o custo da coleta de dados.

    Calculando o intervalo de confiança: uma abordagem alternativa

    Outra forma de abordar os intervalos de confiança é por meio do uso de algo chamado Error Bound. O nome Error Bound vem do reconhecimento de que fornece o limite do intervalo derivado do erro padrão da distribuição de amostragem. Nas equações acima, é visto que o intervalo é simplesmente a média estimada, a média da amostra, mais ou menos alguma coisa. Esse algo é o limite de erro e é impulsionado pela probabilidade que desejamos manter em nossa estimativa\(Z_\alpha\),, vezes o desvio padrão da distribuição amostral. O limite de erro de uma média recebe o nome de Média Limitada de Erro ou\(EBM\).

    Para construir um intervalo de confiança para uma única média populacional desconhecida\(\mu\), onde o desvio padrão da população é conhecido, precisamos\(\overline x\) como estimativa\(\mu\) e precisamos da margem de erro. Aqui, a margem de erro\((EBM)\) é chamada de limite de erro para uma média populacional (abreviado EBM). A média da amostra\(\overline x\) é a estimativa pontual da média populacional desconhecida\(\mu\).

    A estimativa do intervalo de confiança terá a forma:

    (estimativa de pontos - limite de erro, estimativa de pontos + limite de erro) ou, em símbolos,\((\overline{x}-E B M, \overline{x}+E B M)\)

    A fórmula matemática para esse intervalo de confiança é:

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\]

    A margem de erro (EBM) depende do nível de confiança (CL abreviado). O nível de confiança geralmente é considerado a probabilidade de que a estimativa do intervalo de confiança calculado contenha o verdadeiro parâmetro da população. No entanto, é mais preciso afirmar que o nível de confiança é a porcentagem dos intervalos de confiança que contêm o verdadeiro parâmetro da população quando amostras repetidas são coletadas. Na maioria das vezes, é a escolha da pessoa que constrói o intervalo de confiança escolher um nível de confiança de 90% ou mais, porque essa pessoa deseja ter uma certeza razoável de suas conclusões.

    Há outra probabilidade chamada alfa (\(\alpha\)). \(\alpha\)está relacionado ao nível de confiança,\(CL\). \(\alpha\)é a probabilidade de que o intervalo não contenha o parâmetro populacional desconhecido.
    Matematicamente,\(1 - \alpha = CL\).

    Um intervalo de confiança para uma média da população com um desvio padrão conhecido é baseado no fato de que a distribuição amostral das médias da amostra segue uma distribuição aproximadamente normal. Suponha que nossa amostra tenha uma média de\(\overline x = 10\), e nós construímos o intervalo de confiança de 90%\((5, 15)\) onde\(EBM = 5\).

    Para obter um intervalo de confiança de 90%, devemos incluir os 90% centrais da probabilidade da distribuição normal. Se incluirmos os 90% centrais, deixamos de fora um total de\(\alpha = 10%\) em ambas as caudas, ou 5% em cada cauda, da distribuição normal.

    Essa é uma curva de distribuição normal. O pico da curva coincide com o ponto 10 no eixo horizontal. Os pontos 5 e 15 são rotulados no eixo. As linhas verticais são desenhadas desses pontos até a curva, e a região entre as linhas é sombreada. A região sombreada tem área igual a 0,90.
    Figura\(\PageIndex{3}\)

    Para capturar os 90% centrais, devemos obter 1,645 desvios padrão em cada lado da média amostral calculada. O valor 1,645 é a pontuação z de uma distribuição de probabilidade normal padrão que coloca uma área de 0,90 no centro, uma área de 0,05 na extremidade esquerda da cauda e uma área de 0,05 na extremidade direita.

    É importante que o desvio padrão usado seja apropriado para o parâmetro que estamos estimando, portanto, nesta seção, precisamos usar o desvio padrão que se aplica à distribuição amostral para médias que estudamos com o Teorema do Limite Central e é,\(\frac{\sigma}{\sqrt{n}}\).

    Calculando o intervalo de confiança usando EMB

    Para construir uma estimativa do intervalo de confiança para uma média populacional desconhecida, precisamos de dados de uma amostra aleatória. As etapas para construir e interpretar o intervalo de confiança são:

    • Calcule a média\(\overline x\) da amostra a partir dos dados da amostra. Lembre-se de que, nesta seção, conhecemos o desvio padrão da população\(\sigma\).
    • Encontre a pontuação z da tabela normal padrão que corresponde ao nível de confiança desejado.
    • Calcule o limite do erro\(EBM\).
    • Construa o intervalo de confiança.
    • Escreva uma frase que interprete a estimativa no contexto da situação do problema.

    Primeiro, examinaremos cada etapa com mais detalhes e, em seguida, ilustraremos o processo com alguns exemplos.

    Encontrando a pontuação z para o nível de confiança declarado

    Quando conhecemos o desvio padrão da população\ sigma, usamos uma distribuição normal padrão para calcular o limite de erro\(EBM\) e construir o intervalo de confiança. Precisamos encontrar o valor de\(z\) que coloca uma área igual ao nível de confiança (na forma decimal) no meio da distribuição normal padrão\(Z \sim N(0, 1)\).

    O nível de confiança\(CL\),, é a área no meio da distribuição normal padrão. \(CL = 1 – \alpha\), assim\(\alpha\) como a área que é dividida igualmente entre as duas pontas. Cada uma das caudas contém uma área igual\(\frac{\alpha}{2}\) a.

    A pontuação z que tem uma área à direita de\(\frac{\alpha}{2}\) é indicada por\(Z_{\frac{\alpha}{2}}\).

    Por exemplo\(CL = 0.95\), quando\(\alpha = 0.05\) e\(\frac{\alpha}{2} = 0.025\); escrevemos\(Z_{\frac{\alpha}{2}}\) = Z_ {0.025}\).

    A área à direita de\(Z_{0.025}\) é 0,025 e a área à esquerda\(Z_{0.025}\) é\(1 – 0.025 = 0.975\).

    \(Z_{\frac{\alpha}{2}} = Z_{0.025} = 1.96\), usando uma tabela de probabilidade normal padrão. Veremos mais tarde que podemos usar uma tabela de probabilidade diferente, a distribuição t de Student, para encontrar o número de desvios padrão dos níveis de confiança comumente usados.

    Calculando o limite de erro (EBM)

    A fórmula de limite de erro para uma média populacional desconhecida\ mu quando o desvio padrão da população\ sigma é conhecido é

    • \(E B M=\left(Z \frac{\alpha}{2}\right)\left(\frac{\sigma}{\sqrt{n}}\right)\)

    Construindo o intervalo de confiança

    • A estimativa do intervalo de confiança tem o formato\((\overline{x}-E B M, \overline{x}+E B M)\) ou a fórmula:\(\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\)

    O gráfico dá uma imagem de toda a situação.

    \(C L+\frac{\alpha}{2}+\frac{\alpha}{2}=C L+\alpha=1\).

    Essa é uma curva de distribuição normal. O pico da curva coincide com a barra x do ponto no eixo horizontal. Os pontos x-bar - EBM e x-bar + EBM são rotulados no eixo. As linhas verticais são desenhadas desses pontos até a curva, e a região entre as linhas é sombreada. A região sombreada tem uma área igual a 1 - a e representa o nível de confiança. Cada cauda sem sombra tem a área a/2.

    Figura\(\PageIndex{4}\)

    Exemplo\(\PageIndex{1}\)

    Suponha que estejamos interessados nas notas médias de um exame. Uma amostra aleatória de 36 pontuações é coletada e fornece uma média da amostra (pontuação média da amostra) de 68 (X−X- = 68). Neste exemplo, temos o conhecimento incomum de que o desvio padrão da população é de 3 pontos. Não conte com o conhecimento dos parâmetros da população fora dos exemplos de livros didáticos. Encontre uma estimativa do intervalo de confiança para a pontuação média do exame da população (a pontuação média em todos os exames).

    Encontre um intervalo de confiança de 90% para a média real (populacional) das pontuações dos exames estatísticos.

    Resposta

    Solução 8.1

    • A solução é mostrada passo a passo.

    Para encontrar o intervalo de confiança, você precisa da média da amostra\(\overline x\), e\(EBM\) a.

    • \(\overline x = 68\)
    • \(EBM = \left(Z_{\frac{\alpha}{2}}\right)\left(\frac{\sigma}{\sqrt{n}}\right)\)
    • \(\sigma = 3\);\(n = 36\); O nível de confiança é de 90%\((CL = 0.90)\)

    \(CL = 0.90\)então\(\alpha = 1 – CL = 1 – 0.90 = 0.10\)

    \(\frac{\alpha}{2}=0.05, Z_{\frac{\alpha}{2}}=z_{0.05}\)

    A área à direita\(Z_{0.05}\) é\(0.05\) e a área à esquerda de\(Z_{0.05}\) é\(1 – 0.05 = 0.95\).

    \(Z_{\frac{\alpha}{2}}=Z_{0.05}=1.645\)

    Isso pode ser encontrado usando um computador ou usando uma tabela de probabilidade para a distribuição normal padrão. Como os níveis comuns de confiança nas ciências sociais são 90%, 95% e 99%, não demorará muito até que você se familiarize com os números, 1,645, 1,96 e 2,56

    \(E B M=(1.645)\left(\frac{3}{\sqrt{36}}\right)=0.8225\)

    \(\overline{x}-E B M=68-0.8225=67.1775\)

    \(\overline{x}+E B M=68+0.8225=68.8225\)

    O intervalo de confiança de 90% é (67,1775, 68,8225).

    Interpretação

    Estimamos com 90% de confiança que a pontuação média real do exame da população para todos os estudantes de estatística está entre 67,18 e 68,82.

    Exemplo\(\PageIndex{2}\)

    Suponha que mudemos o problema original no Exemplo\(\PageIndex{1}\) usando um nível de confiança de 95%. Encontre um intervalo de confiança de 95% para a pontuação média verdadeira (populacional) do exame estatístico.

    Resposta

    Solução 8.2

    Figura\(\PageIndex{5}\)

    \[\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\nonumber\]

    \[\mu=68 \pm 1.96\left(\frac{3}{\sqrt{36}}\right)\nonumber\]

    \[67.02 \leq \mu \leq 68.98\nonumber\]

    \(\sigma = 3\);\(n = 36\); O nível de confiança é de 95% (\(CL = 0.95\)).

    \(CL = 0.95\)então\(\alpha = 1 – CL = 1 – 0.95 = 0.05\)

    \(Z_{\frac{\alpha}{2}}=Z_{0.025}=1.96\)

    Observe que o\(EBM\) é maior para um nível de confiança de 95% no problema original.

    Comparando os resultados

    O intervalo de confiança de 90% é (67,18, 68,82). O intervalo de confiança de 95% é (67,02, 68,98). O intervalo de confiança de 95% é maior. Se você observar os gráficos, como a área 0,95 é maior do que a área 0,90, faz sentido que o intervalo de confiança de 95% seja maior. Para ter mais certeza de que o intervalo de confiança realmente contém o valor real da média da população para todas as pontuações dos exames estatísticos, o intervalo de confiança precisa necessariamente ser maior. Isso demonstra um princípio muito importante dos intervalos de confiança. Há uma compensação entre o nível de confiança e a largura do intervalo. Nosso desejo é ter um intervalo de confiança estreito, intervalos enormes e amplos fornecem poucas informações úteis. Mas também gostaríamos de ter um alto nível de confiança em nosso intervalo. Isso demonstra que não podemos ter os dois.

    A parte (a) mostra uma curva de distribuição normal. Uma região central com área igual a 0,90 está sombreada. Cada cauda não sombreada da curva tem uma área igual a 0,05. A parte (b) mostra uma curva de distribuição normal. Uma região central com área igual a 0,95 está sombreada. Cada cauda não sombreada da curva tem uma área igual a 0,025.

    Figura\(\PageIndex{6}\)

    Resumo: Efeito da alteração do nível de confiança

    • Aumentar o nível de confiança torna o intervalo de confiança mais amplo.
    • Diminuir o nível de confiança torna o intervalo de confiança mais estreito.

    E, novamente, aqui está a fórmula para um intervalo de confiança para uma média desconhecida, assumindo que temos o desvio padrão da população:

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    O desvio padrão da distribuição amostral foi fornecido pelo Teorema do Limite Central como\(\sigma / \sqrt{n}\). Embora raramente possamos escolher o tamanho da amostra, ele desempenha um papel importante no intervalo de confiança. Como o tamanho da amostra está no denominador da equação, à medida que\(n\) aumenta, faz com que o desvio padrão da distribuição amostral diminua e, portanto, a largura do intervalo de confiança diminua. Já vimos isso antes, quando revisamos os efeitos do tamanho da amostra no Teorema do Limite Central. Lá, vimos que, à medida que\(n\) aumenta, a distribuição da amostra se estreita até que, no limite, ela colapsa sobre a média real da população.

    Exemplo\(\PageIndex{3}\)

    Suponha que mudemos o problema original no Exemplo\(\PageIndex{1}\) para ver o que acontece com o intervalo de confiança se o tamanho da amostra for alterado.

    Deixe tudo igual, exceto o tamanho da amostra. Use o nível de confiança original de 90%. O que acontece com o intervalo de confiança se aumentarmos o tamanho da amostra e usarmos\(n = 100\) em vez de\(n = 36\)? O que acontece se diminuirmos o tamanho da amostra para\(n = 25\) em vez de\(n = 36\)?

    Resposta

    Solução 8.3

    Solução A

    \(\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\)

    \(\mu=68 \pm 1.645\left(\frac{3}{\sqrt{100}}\right)\)

    \(67.5065 \leq \mu \leq 68.4935\)

    Se aumentarmos o tamanho da amostra\(n\) para 100, diminuiremos a largura do intervalo de confiança em relação ao tamanho da amostra original de 36 observações.

    Resposta

    Solução 8.3

    Solução B

    \(\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\)

    \(\mu=68 \pm 1.645\left(\frac{3}{\sqrt{25}}\right)\)

    \(67.013 \leq \mu \leq 68.987\)

    Se diminuirmos o tamanho da amostra\(n\) para 25, aumentaremos a largura do intervalo de confiança em comparação com o tamanho da amostra original de 36 observações.

    Resumo: Efeito da alteração do tamanho da amostra

    • Aumentar o tamanho da amostra torna o intervalo de confiança mais estreito.
    • Diminuir o tamanho da amostra aumenta o intervalo de confiança.

    Já vimos esse efeito quando revisamos os efeitos da alteração do tamanho da amostra, n, no Teorema do Limite Central. Veja\(\PageIndex{7}\) a Figura para ver esse efeito. Antes de vermos que, à medida que o tamanho da amostra aumentava, o desvio padrão da distribuição da amostra diminui. Foi por isso que escolhemos a média da amostra de uma amostra grande em comparação com uma amostra pequena, todas as outras coisas se mantiveram constantes.

    Até agora, assumimos que conhecíamos o desvio padrão da população. Isso praticamente nunca será o caso. No entanto, teremos o desvio padrão da amostra. Essa é uma estimativa pontual para o desvio padrão da população e pode ser substituída na fórmula dos intervalos de confiança para uma média sob certas circunstâncias. Acabamos de ver o efeito que o tamanho da amostra tem na largura do intervalo de confiança e o impacto na distribuição da amostra em nossa discussão sobre o Teorema do Limite Central. Podemos invocar isso para substituir a estimativa pontual pelo desvio padrão se o tamanho da amostra for grande “o suficiente”. Estudos de simulação indicam que 30 observações ou mais serão suficientes para eliminar qualquer viés significativo no intervalo de confiança estimado.

    Exemplo\(\PageIndex{4}\)

    As férias de primavera podem ser um feriado muito caro. Uma amostra de 80 estudantes é pesquisada e o valor médio gasto pelos estudantes em viagens e bebidas é de $593,84. O desvio padrão da amostra é de aproximadamente $369,34.

    Construa um intervalo de confiança de 92% para a quantidade média de dinheiro da população gasta pelas férias de primavera.

    Resposta

    Solução 8.4

    Começamos com o intervalo de confiança para uma média. Usamos a fórmula para uma média porque a variável aleatória são dólares gastos e essa é uma variável aleatória contínua. A estimativa pontual para o desvio padrão da população, s, foi substituída pelo verdadeiro desvio padrão da população porque, com 80 observações, não há preocupação com o viés na estimativa do intervalo de confiança.

    \[\mu=\overline{x} \pm\left[Z_{(\mathrm{a} / 2)} \frac{s}{\sqrt{n}}\right]\nonumber\]

    Substituindo os valores na fórmula, temos:

    \[\mu=593.84 \pm\left[1.75 \frac{369.34}{\sqrt{80}}\right]\nonumber\]

    \(Z_{(a / 2)}\)é encontrado na tabela normal padrão pesquisando 0,46 no corpo da tabela e encontrando o número de desvios padrão na lateral e na parte superior da tabela; 1,75. A solução para o intervalo é assim:

    \[\mu=593.84 \pm 72.2636=(521.57,666.10)\nonumber\]

    \[\$ 521.58 \leq \mu \leq \$ 666.10\nonumber\]

    Figura\(\PageIndex{7}\)

    Revisão da fórmula

    A forma geral de um intervalo de confiança para uma única média de população, desvio padrão conhecido e distribuição normal é dada por\(\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\) Esta fórmula é usada quando o desvio padrão da população é conhecido.

    \(CL\)= nível de confiança ou a proporção dos intervalos de confiança criados que devem conter o verdadeiro parâmetro da população

    \(\alpha = 1 – CL\)= a proporção dos intervalos de confiança que não conterão o parâmetro da população

    \(z_{\frac{\alpha}{2}}\)= a pontuação z com a propriedade de que a área à direita da pontuação z é\(\frac{\propto}{2}\) essa é a pontuação z usada no cálculo de "\(EBM\)" onde\(\alpha = 1 – CL\).