Skip to main content
Global

8.0: Introdução aos intervalos de confiança

  • Page ID
    186524
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Suponha que você estivesse tentando determinar o aluguel médio de um apartamento de dois quartos em sua cidade. Você pode consultar a seção de classificados do jornal, anotar vários aluguéis listados e calculá-los juntos. Você teria obtido uma estimativa pontual da média real. Se você está tentando determinar a porcentagem de vezes que você faz uma cesta ao jogar uma bola de basquete, você pode contar o número de chutes que você faz e dividi-lo pelo número de chutes que tentou. Nesse caso, você teria obtido uma estimativa pontual para a proporção real do parâmetro\(p\) na função binomial de densidade de probabilidade.

    Esta é uma foto de M&Ms empilhados juntos. Os M&Ms são vermelho, azul, verde, amarelo, laranja e marrom.
    Figura Você\(\PageIndex{1}\) já se perguntou qual é o número médio de M&Ms em uma sacola no supermercado? Você pode usar intervalos de confiança para responder a essa pergunta. (crédito: comedy_nose/flickr)

    Usamos dados de amostra para fazer generalizações sobre uma população desconhecida. Essa parte da estatística é chamada de estatística inferencial. Os dados da amostra nos ajudam a fazer uma estimativa de um parâmetro da população. Percebemos que a estimativa pontual provavelmente não é o valor exato do parâmetro da população, mas próxima a ele. Depois de calcular as estimativas de pontos, construímos estimativas de intervalo, chamadas intervalos de confiança. O que as estatísticas nos fornecem além de uma média simples, ou estimativa pontual, é uma estimativa à qual podemos atribuir uma probabilidade de precisão, o que chamaremos de nível de confiança. Nós fazemos inferências com um nível conhecido de probabilidade.

    Neste capítulo, você aprenderá a construir e interpretar intervalos de confiança. Você também aprenderá uma nova distribuição, a Student's-T, e como ela é usada com esses intervalos. Ao longo do capítulo, é importante ter em mente que o intervalo de confiança é uma variável aleatória. É o parâmetro da população que é fixo.

    Se você trabalhou no departamento de marketing de uma empresa de entretenimento, talvez esteja interessado no número médio de músicas que um consumidor baixa por mês do iTunes. Nesse caso, você pode realizar uma pesquisa e calcular a média da amostra e o desvio padrão da amostra,\(s\).\(\overline x\) Você usaria\(\overline x\) para estimar a média da população e\(s\) estimar o desvio padrão da população. A média da amostra,\(\overline x\), é a estimativa pontual para a média da população,\(\mu\). O desvio padrão da amostra,\(s\), é a estimativa pontual para o desvio padrão da população,\(\sigma\).

    \(\overline x\)e\(s\) cada um deles é chamado de estatística.

    Um intervalo de confiança é outro tipo de estimativa, mas, em vez de ser apenas um número, é um intervalo de números. O intervalo de números é um intervalo de valores calculado a partir de um determinado conjunto de dados de amostra. É provável que o intervalo de confiança inclua o parâmetro populacional desconhecido.

    Suponha que, para o exemplo do iTunes, não saibamos a média da população\(\mu\), mas sabemos que o desvio padrão da população é\(\sigma = 1\) e nosso tamanho amostral é 100. Então, pelo teorema do limite central, o desvio padrão da distribuição amostral das médias da amostra é

    \[\frac{\sigma}{\sqrt{n}}=\frac{1}{\sqrt{100}}=0.1.\nonumber\]

    A regra empírica, que se aplica à distribuição normal, diz que em aproximadamente 95% das amostras, a média da amostra,\(\overline x\), estará dentro de dois desvios padrão da média da população\ mu. Para nosso exemplo do iTunes, dois desvios padrão são\((2)(0.1) = 0.2\). \(\overline x\)É provável que a média da amostra esteja dentro de 0,2 unidades de\(\mu\).

    Como\(\overline x\) está dentro de 0,2 unidades de\(\mu\), o que é desconhecido,\(\mu\) é provável que esteja dentro de 0,2 unidades de\(\overline x\) com 95% de probabilidade. A média da população\(\mu\) está contida em um intervalo cujo menor número é calculado tomando a média da amostra e subtraindo dois desvios padrão\((2)(0.1)\) e cujo número superior é calculado tomando a média da amostra e adicionando dois desvios padrão. Em outras palavras,\(\mu\) está entre\(\overline{x}-0.2\) e\(\overline{x}+0.2\) em 95% de todas as amostras.

    Para o exemplo do iTunes, suponha que uma amostra tenha produzido uma média amostral\(\overline{x}=2\). Então, com 95% de probabilidade, a média da população desconhecida\(\mu\) está entre

    \[\overline{x}-0.2=2-0.2=1.8 \text { and } \overline{x}+0.2=2+0.2=2.2 \nonumber\]

    Dizemos que temos 95% de confiança de que o número médio de músicas baixadas do iTunes por mês da população desconhecida está entre 1,8 e 2,2. O intervalo de confiança de 95% é (1,8, 2,2). Observe que conversamos em termos de confiança de 95% usando a regra empírica. A regra empírica para dois desvios padrão é apenas aproximadamente 95% da probabilidade sob a distribuição normal. Para ser preciso, dois desvios padrão sob uma distribuição normal são, na verdade, 95,44% da probabilidade. Para calcular o nível de confiança exato de 95%, usaríamos 1,96 desvios padrão.

    O intervalo de confiança de 95% implica duas possibilidades. Ou o intervalo (1,8, 2,2) contém a média\(\mu\) verdadeira ou nossa amostra produziu uma\(\overline x\) que não está dentro de 0,2 unidades da média real\(\mu\). A segunda possibilidade acontece para apenas 5% de todas as amostras (95% menos 100% = 5%).

    Lembre-se de que um intervalo de confiança é criado para um parâmetro populacional desconhecido, como a média da população,\(\mu\).

    Para o intervalo de confiança de uma média, a fórmula seria:

    \[\mu=\overline{X} \pm Z_{\alpha} \sigma / \sqrt{n}\nonumber\]

    Ou escrito de outra forma como:

    \[\overline{X}-Z_{\alpha} \sigma /_{\sqrt{n}} \leq \mu \leq \overline{X}+Z_{\alpha} \sigma / \sqrt{n}\nonumber\]

    Onde\(\overline x\) está a média da amostra. \(Z_{\alpha}\)é determinado pelo nível de confiança desejado pelo analista e\(\sigma / \sqrt{n}\) é o desvio padrão da distribuição de amostragem para médias dadas a nós pelo Teorema do Limite Central.