Skip to main content
Global

8.1: Prelúdio aos intervalos de confiança

  • Page ID
    190300
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de

    No final deste capítulo, o aluno deverá ser capaz de:

    • Calcule e interprete os intervalos de confiança para estimar uma média da população e uma proporção da população.
    • Interprete a distribuição de probabilidade t de Student à medida que o tamanho da amostra muda.
    • Discrimine entre problemas ao aplicar a distribuição normal e a distribuição t de Student.
    • Calcule o tamanho da amostra necessário para estimar uma média da população e uma proporção da população com base no nível de confiança e margem de erro desejados.

    Suponha que você estivesse tentando determinar o aluguel médio de um apartamento de dois quartos em sua cidade. Você pode consultar a seção de classificados do jornal, anotar vários aluguéis listados e calculá-los juntos. Você teria obtido uma estimativa pontual da média real. Se você está tentando determinar a porcentagem de vezes que você faz uma cesta ao jogar uma bola de basquete, você pode contar o número de chutes que você faz e dividi-lo pelo número de chutes que tentou. Nesse caso, você teria obtido uma estimativa pontual para a proporção real.

    Usamos dados de amostra para fazer generalizações sobre uma população desconhecida. Essa parte da estatística é chamada de estatística inferencial. Os dados da amostra nos ajudam a fazer uma estimativa de um parâmetro da população. Percebemos que a estimativa pontual provavelmente não é o valor exato do parâmetro da população, mas próxima a ele. Depois de calcular as estimativas de pontos, construímos estimativas de intervalo, chamadas intervalos de confiança.

    alt
    Figura\(\PageIndex{1}\). Você já se perguntou qual é o número médio de M&Ms em uma sacola no supermercado? Você pode usar intervalos de confiança para responder a essa pergunta. (crédito: comedy_nose/flickr)

    Neste capítulo, você aprenderá a construir e interpretar intervalos de confiança. Você também aprenderá uma nova distribuição, a Student's-T, e como ela é usada com esses intervalos. Ao longo do capítulo, é importante ter em mente que o intervalo de confiança é uma variável aleatória. É o parâmetro da população que é fixo.

    Se você trabalhou no departamento de marketing de uma empresa de entretenimento, talvez esteja interessado no número médio de músicas que um consumidor baixa por mês do iTunes. Nesse caso, você pode realizar uma pesquisa e calcular a média da amostra e o desvio padrão da amostra,\(s\).\(\bar{x}\) Você usaria\(\bar{x}\) para estimar a média da população e\(s\) estimar o desvio padrão da população. A média da amostra,\(\bar{x}\), é a estimativa pontual para a média da população,\(\mu\). O desvio padrão da amostra,\(s\), é a estimativa pontual para o desvio padrão da população,\(\sigma\).

    Cada um dos\(\bar{x}\) e\(s\) é chamado de estatística.

    Um intervalo de confiança é outro tipo de estimativa, mas, em vez de ser apenas um número, é um intervalo de números. O intervalo de números é um intervalo de valores calculado a partir de um determinado conjunto de dados de amostra. É provável que o intervalo de confiança inclua um parâmetro populacional desconhecido.

    Suponha que, para o exemplo do iTunes, não saibamos a média da população\(\mu\), mas sabemos que o desvio padrão da população é\(\sigma = 1\) e nosso tamanho amostral é 100. Então, pelo teorema do limite central, o desvio padrão para a média da amostra é

    \[\dfrac{\sigma}{\sqrt{n}} = \dfrac{1}{\sqrt{100}} = 0.1.\]

    A regra empírica, que se aplica às distribuições em forma de sino, diz que em aproximadamente 95% das amostras, a média da amostra\(\bar{x}\),, estará dentro de dois desvios padrão da média da população\(\mu\). Para nosso exemplo do iTunes, dois desvios padrão são (2) (0,1) = 0,2. \(\bar{x}\)É provável que a média da amostra esteja dentro de 0,2 unidades de\(\mu\).

    Como\(\bar{x}\) está dentro de 0,2 unidades de\(\mu\), o que é desconhecido,\(\mu\) é provável que esteja dentro de 0,2 unidades\(\bar{x}\) em 95% das amostras. A média da população\(\mu\) está contida em um intervalo cujo menor número é calculado tomando a média da amostra e subtraindo dois desvios padrão (2) (0,1) e cujo número superior é calculado tomando a média da amostra e adicionando dois desvios padrão. Em outras palavras,\(\mu\) está entre\(\bar{x} - 0.2\) e\(\bar{x} + 0.2\) em 95% de todas as amostras.

    Para o exemplo do iTunes, suponha que uma amostra tenha produzido uma média amostral\(\bar{x} = 2\). Então, a média da população desconhecida\(\mu\) está entre

    \[\bar{x} - 0.2 = 2 - 0.2 = 1.8\]

    e

    \[\bar{x} + 0.2 = 2 + 0.2 = 2.2\]

    Dizemos que temos 95% de confiança de que o número médio de músicas baixadas do iTunes por mês da população desconhecida está entre 1,8 e 2,2. O intervalo de confiança de 95% é (1,8, 2,2). Esse intervalo de confiança de 95% implica duas possibilidades. Ou o intervalo (1,8, 2,2) contém a média verdadeira\(\mu\) ou nossa amostra produziu uma\(\bar{x}\) que não está dentro de 0,2 unidades da média real\(\mu\). A segunda possibilidade acontece com apenas 5% de todas as amostras (95— 100%).

    Lembre-se de que um intervalo de confiança é criado para um parâmetro populacional desconhecido, como a média da população,\(\bar{x}\). Os intervalos de confiança para alguns parâmetros têm a forma:

    (estimativa pontual — margem de erro, estimativa pontual + margem de erro)

    A margem de erro depende do nível de confiança ou porcentagem de confiança e do erro padrão da média.

    Quando você lê jornais e periódicos, alguns relatórios usam a frase “margem de erro”. Outros relatórios não usarão essa frase, mas incluirão um intervalo de confiança como a estimativa pontual mais ou menos a margem de erro. Essas são duas formas de expressar o mesmo conceito.

    Embora o texto cubra apenas intervalos de confiança simétricos, há intervalos de confiança não simétricos (por exemplo, um intervalo de confiança para o desvio padrão).

    Exercício colaborativo

    Peça ao instrutor que registre o número de refeições que cada aluno de sua turma come fora em uma semana. Suponha que o desvio padrão seja conhecido por serem três refeições. Construa um intervalo de confiança aproximado de 95% para o número médio real de refeições que os alunos comem fora a cada semana.

    1. Calcule a média da amostra.
    2. Seja\(\sigma = 3\) e\(n\) = o número de estudantes pesquisados.
    3. Construa o intervalo\(\left(\bar{x} - 2 \cdot \frac{\sigma}{\sqrt{n}}, \bar{x} + 2 \cdot \frac{\sigma}{\sqrt{n}}\right)\).

    Dizemos que temos aproximadamente 95% de confiança de que o verdadeiro número médio de refeições que os alunos comem fora em uma semana está entre __________ e ___________.

    Glossário

    Intervalo de confiança (CI)
    uma estimativa de intervalo para um parâmetro populacional desconhecido. Isso depende de:
    • o nível de confiança desejado,
    • informações conhecidas sobre a distribuição (por exemplo, desvio padrão conhecido),
    • a amostra e seu tamanho.
    Estatísticas inferenciais
    também chamada de inferência estatística ou estatística indutiva; essa faceta da estatística lida com a estimativa de um parâmetro populacional com base em uma estatística de amostra. Por exemplo, se quatro das 100 calculadoras amostradas estiverem com defeito, podemos inferir que quatro por cento da produção está com defeito.
    Parâmetro
    uma característica numérica de uma população
    Estimativa de
    um único número calculado a partir de uma amostra e usado para estimar um parâmetro populacional