Skip to main content
Global

7.2: O teorema do limite central para médias amostrais (médias)

  • Page ID
    190397
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Suponha que\(X\) seja uma variável aleatória com uma distribuição que pode ser conhecida ou desconhecida (pode ser qualquer distribuição). Usando um subscrito que corresponda à variável aleatória, suponha que:

    1. \(\mu_{x} =\)a média de\(X\)
    2. \(\sigma_{x} =\)o desvio padrão de\(X\)

    Se você desenhar amostras aleatórias de tamanho\(n\), então, à medida que\(n\) aumenta, a variável aleatória,\(\bar{X}\) que consiste em médias amostrais, tende a ser distribuída normalmente e

    \[\bar{X} \sim N \left(\mu_{x}, \dfrac{\sigma_{x}}{\sqrt{n}}\right).\]

    O teorema do limite central para médias amostrais diz que, se você continuar desenhando amostras cada vez maiores (como rolar um, dois, cinco e, finalmente, dez dados) e calculando suas médias, as médias amostrais formam sua própria distribuição normal (a distribuição amostral). A distribuição normal tem a mesma média da distribuição original e uma variância que é igual à variância original dividida pelo tamanho da amostra. A variável\(n\) é o número de valores que são calculados em conjunto, não o número de vezes que o experimento é feito.

    Em outras palavras, se você extrair amostras aleatórias de tamanho\(n\), a distribuição da variável aleatória\(\bar{X}\), que consiste em médias amostrais, é chamada de distribuição amostral da média. A distribuição amostral da média se aproxima de uma distribuição normal à medida\(n\) que o tamanho da amostra aumenta.

    A variável aleatória\(\bar{X}\) tem um\(z\) -score associado a ela diferente daquele da variável aleatória\(X\). A média\(\bar{x}\) é o valor de\(\bar{X}\) em uma amostra.

    \[z = \dfrac{\bar{x}-\mu_{x}}{\left(\dfrac{\sigma_{x}}{\sqrt{n}}\right)}\]

    • \(\mu_{x}\)é a média de ambos\(X\)\(\bar{X}\) e.
    • \(\sigma \bar{x} = \dfrac{\sigma_{x}}{\sqrt{n}} = \)o desvio padrão de\(\bar{X}\) e é chamado de erro padrão da média.

    Como: Encontre probabilidades de médias na calculadora

    2 e DISTR

    2: cdf normal

    \(\text{normalcdf} \left(\text{lower value of the area, upper value of the area, mean}, \dfrac{\text{standard deviation}}{\sqrt{\text{sample size}}}\right)\)

    onde:

    • média é a média da distribuição original
    • desvio padrão é o desvio padrão da distribuição original
    • tamanho da amostra\(= n\)

    Exemplo\(\PageIndex{1}\)

    Uma distribuição desconhecida tem uma média de 90 e um desvio padrão de 15. Amostras de tamanho\(n = 25\) são retiradas aleatoriamente da população.

    1. Encontre a probabilidade de que a média da amostra esteja entre 85 e 92.
    2. Encontre o valor que é dois desvios padrão acima do valor esperado, 90, da média da amostra.

    Resposta

    uma.

    Deixe\(X =\) um valor da população desconhecida original. A pergunta de probabilidade pede que você encontre uma probabilidade para a média da amostra.

    Seja\(\bar{X} =\) a média de uma amostra de tamanho 25. Desde\(\mu_{x} = 90, \sigma_{x} = 15\), e\(n = 25\),

    \[\bar{X} \sim N(90, \dfrac{15}{\sqrt{25}}). \nonumber\]

    Encontre\(P(85 < x < 92)\). Desenhe um gráfico.

    \[P(85 < x < 92) = 0.6997 \nonumber\]

    A probabilidade de que a média da amostra esteja entre 85 e 92 é 0,6997.

    Figura\(\PageIndex{1}\).

    normalcdf (valor inferior, valor superior, média, erro padrão da média)

    A lista de parâmetros é abreviada (valor inferior, valor superior,\(\mu\),\(\dfrac{\sigma}{\sqrt{n}}\))

    cdf normal\((85,92,90,\dfrac{15}{\sqrt{25}}) = 0.6997\)

    b.

    Para encontrar o valor que é dois desvios padrão acima do valor esperado 90, use a fórmula:

    \[ \begin{align*} \text{value} &= \mu_{x} + (\#\text{ofTSDEVs})\left(\dfrac{\sigma_{x}}{\sqrt{n}}\right) \\[5pt] &= 90 + 2 \left(\dfrac{15}{\sqrt{25}}\right) = 96 \end{align*}\]

    O valor que é dois desvios padrão acima do valor esperado é 96.

    O erro padrão da média é

    \[\dfrac{\sigma_{x}}{\sqrt{n}} = \dfrac{15}{\sqrt{25}} = 3. \nonumber\]

    Lembre-se de que o erro padrão da média é uma descrição de quão longe (em média) a média da amostra estará da média da população em amostras aleatórias simples repetidas de tamanho\(n\).

    Exercício\(\PageIndex{1}\)

    Uma distribuição desconhecida tem uma média de 45 e um desvio padrão de oito. Amostras de tamanho\(n\) = 30 são retiradas aleatoriamente da população. Encontre a probabilidade de que a média da amostra esteja entre 42 e 50.

    Resposta

    \(P(42 < \bar{x} < 50) = \left(42, 50, 45, \dfrac{8}{\sqrt{30}}\right) = 0.9797\)

    Exemplo\(\PageIndex{2}\)

    O tempo, em horas, que um grupo de “mais de 40" leva para jogar uma partida de futebol é normalmente distribuído com uma média de duas horas e um desvio padrão de 0,5 horas. Uma amostra de tamanho\(n = 50\) é retirada aleatoriamente da população. Encontre a probabilidade de que a média da amostra esteja entre 1,8 horas e 2,3 horas.

    Resposta

    Deixe\(X =\) o tempo, em horas, necessário para jogar uma partida de futebol.

    A pergunta de probabilidade pede que você encontre uma probabilidade para o tempo médio da amostra, em horas, necessário para jogar uma partida de futebol.

    Que\(\bar{X} =\) o tempo médio, em horas, seja necessário para jogar uma partida de futebol.

    Se\(\mu_{x} =\) _________,\(\sigma_{x} =\) __________ e\(n =\) ___________, então\(X \sim N\) (______, ______) pelo teorema do limite central para médias.

    \(\mu_{x} = 2, \sigma_{x} = 0.5, n = 50\), e\(X \sim N \left(2, \dfrac{0.5}{\sqrt{50}}\right)\)

    Encontre\(P(1.8 < \bar{x} < 2.3)\). Desenhe um gráfico.

    \(P(1.8 < \bar{x} < 2.3) = 0.9977\)

    cdf normal\(\left(1.8,2.3,2,\dfrac{.5}{\sqrt{50}}\right) = 0.9977\)

    A probabilidade de que o tempo médio esteja entre 1,8 horas e 2,3 horas é 0,9977.

    Exercício\(\PageIndex{2}\)

    O tempo gasto no SAT para um grupo de estudantes é normalmente distribuído com uma média de 2,5 horas e um desvio padrão de 0,25 horas. Um tamanho de amostra de\(n = 60\) é retirado aleatoriamente da população. Encontre a probabilidade de que a média da amostra esteja entre duas horas e três horas.

    Resposta

    \[P(2 < \bar{x} < 3) = \text{normalcdf}\left(2, 3, 2.5, \dfrac{0.25}{\sqrt{60}}\right) = 1 \nonumber\]

    Calculadora Skills

    Para encontrar os percentis das médias na calculadora, siga estas etapas.

    • 2 e DiStr
    • 3: Norma INV

    \(k = \text{invNorm} \left(\text{area to the left of} k, \text{mean}, \dfrac{\text{standard deviation}}{\sqrt{sample size}}\right)\)

    onde:

    • \(k\)= o\(k\) décimo percentil
    • média é a média da distribuição original
    • desvio padrão é o desvio padrão da distribuição original
    • tamanho da amostra =\(n\)

    Exemplo\(\PageIndex{3}\)

    Em um estudo recente publicado em 29 de outubro de 2012 no Flurry Blog, a idade média dos usuários de tablets é de 34 anos. Suponha que o desvio padrão seja de 15 anos. Pegue uma amostra de tamanho\(n = 100\).

    1. Quais são a média e o desvio padrão para a idade média da amostra de usuários de tablets?
    2. Qual é a aparência da distribuição?
    3. Descubra a probabilidade de que a idade média da amostra seja superior a 30 anos (a idade média relatada dos usuários de tablets neste estudo específico).
    4. Encontre o percentil 95 para a idade média da amostra (com uma casa decimal).

    Resposta

    1. Como a média da amostra tende a atingir a média da população, temos\(\mu_{x} = \mu = 34\). O desvio padrão da amostra é dado por:\[\sigma_{x} = \dfrac{\sigma}{\sqrt{n}} = \dfrac{15}{\sqrt{100}} = \dfrac{15}{10} = 1.5 \nonumber\]
    2. O teorema do limite central afirma que, para amostras grandes (\(n\)), a distribuição da amostra será aproximadamente normal.
    3. A probabilidade de que a idade média da amostra seja maior que 30 é dada por:\[P(Χ > 30) = \text{normalcdf}(30,E99,34,1.5) = 0.9962 \nonumber\]
    4. Seja\(k\) = o percentil 95. \[k = \text{invNorm}\left(0.95, 34, \dfrac{15}{\sqrt{100}}\right) = 36.5 \nonumber\]

    Exercício\(\PageIndex{3}\)

    Em um artigo no Flurry Blog, uma lacuna de marketing de jogos para homens entre 30 e 40 anos é identificada. Você está pesquisando um jogo para startups voltado para o grupo demográfico de 35 anos. Sua ideia é desenvolver um jogo de estratégia que possa ser jogado por homens do final dos 20 aos 30 anos. Com base nos dados do artigo, pesquisas do setor mostram que o jogador médio de estratégia tem 28 anos com um desvio padrão de 4,8 anos. Você coleta uma amostra de 100 jogadores selecionados aleatoriamente. Se seu mercado-alvo é de 29 a 35 anos, você deve continuar com sua estratégia de desenvolvimento?

    Resposta

    Você precisa determinar a probabilidade de homens com idade média entre 29 e 35 anos quererem jogar um jogo de estratégia.

    \[P(29 < \bar{x} < 35) = \text{normalcdf} \left(29, 35, 28,\dfrac{4.8}{\sqrt{100}}\right) = 0.0186\]

    Você pode concluir que há aproximadamente 1,9% de chance de seu jogo ser jogado por homens com idade média entre 29 e 35 anos.

    Exemplo\(\PageIndex{4}\)

    O número médio de minutos para o engajamento do aplicativo por um usuário de tablet é de 8,2 minutos. Suponha que o desvio padrão seja de um minuto. Pegue uma amostra de 60.

    1. Quais são a média e o desvio padrão da amostra do número médio de engajamento do aplicativo por um usuário de tablet?
    2. Qual é o erro padrão da média?
    3. Encontre o percentil 90 para o tempo médio da amostra de engajamento no aplicativo para um usuário de tablet. Interprete esse valor em uma frase completa.
    4. Determine a probabilidade de que a média da amostra esteja entre oito minutos e 8,5 minutos.

    Resposta

    1. \(\mu = \mu = 8.2 \sigma_{\bar{x}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac{1}{\sqrt{60}} = 0.13\)
    2. Isso nos permite calcular a probabilidade de médias amostrais de uma distância específica da média, em amostras repetidas de tamanho 60.
    3. Seja\(k\) = o 90º percentil
      \(k = \text{invNorm}\left(0.90, 8.2, \dfrac{1}{\sqrt{60}}\right) = 8.37\). Esses valores indicam que 90% do tempo médio de engajamento do aplicativo para usuários da tabela é inferior a 8,37 minutos.
    4. \(P(8 < \bar{x} < 8.5) = \text{normalcdf}\left(8, 8.5, 8.2, \dfrac{1}{\sqrt{60}}\right) = 0.9293\)

    Exercício\(\PageIndex{4}\)

    As latas de uma bebida à base de cola afirmam conter 16 onças. As quantidades em uma amostra são medidas e as estatísticas são\(n = 34\),\(\bar{x} = 16.01\) onças. Se as latas estiverem cheias de forma que\(\mu = 16.00\) onças (conforme rotuladas) e\(\sigma = 0.143\) onças, determine a probabilidade de que uma amostra de 34 latas tenha uma quantidade média maior que 16,01 onças. Os resultados sugerem que as latas estão cheias com uma quantidade maior que 16 onças?

    Resposta

    Nós temos\(P(\bar{x} > 16.01) = \text{normalcdf} \left(16.01,E99,16, \dfrac{0.143}{\sqrt{34}}\right) = 0.3417\). Como há uma probabilidade de 34,17% de que o peso médio da amostra seja maior que 16,01 onças, devemos ser céticos em relação ao volume alegado pela empresa. Se eu sou consumidor, ficaria feliz por provavelmente estar recebendo cola grátis. Se eu for o fabricante, preciso determinar se meus processos de engarrafamento estão fora dos limites aceitáveis.

    Resumo

    Em uma população cuja distribuição pode ser conhecida ou desconhecida, se o tamanho (\(n\)) das amostras for suficientemente grande, a distribuição das médias da amostra será aproximadamente normal. A média das médias da amostra será igual à média da população. O desvio padrão da distribuição das médias da amostra, chamado erro padrão da média, é igual ao desvio padrão da população dividido pela raiz quadrada do tamanho da amostra (\(n\)).

    Revisão da fórmula

    • O teorema do limite central para amostras significa:\[\bar{X} \sim N\left(\mu_{x}, \dfrac{\sigma_{x}}{\sqrt{n}}\right) \nonumber\]
    • A média\(\bar{X}: \sigma_{x}\)
    • Teorema do limite central para médias amostrais, pontuação z e erro padrão da média:\[z = \dfrac{\bar{x}-\mu_{x}}{\left(\dfrac{\sigma_{x}}{\sqrt{n}}\right)} \nonumber\]
    • Erro padrão da média (desvio padrão (\(\bar{X}\))):\[\dfrac{\sigma_{x}}{\sqrt{n}} \nonumber\]

    Glossário

    Média
    um número que descreve a tendência central dos dados; há várias médias especializadas, incluindo a média aritmética, média ponderada, mediana, modo e média geométrica.
    Teorema do Limite Central
    Dada uma variável aleatória (VR) com média\(\mu\) e desvio padrão conhecidos\(\sigma\), estamos amostrando com tamanho\(n\) e estamos interessados em dois novos RVs: a média da amostra e a soma da amostra,\(\sum X\).\(\bar{X}\) Se o tamanho (\(n\)) da amostra for suficientemente grande, então\(\bar{X} \sim N\left(\mu, \dfrac{\sigma}{\sqrt{n}}\right)\)\(\sum X \sim N(n\mu, (\sqrt{n})(\sigma))\) e. Se o tamanho (\(n\)) da amostra for suficientemente grande, a distribuição das médias da amostra e a distribuição das somas da amostra se aproximarão de uma distribuição normal, independentemente da forma da população. A média das médias da amostra será igual à média da população, e a média das somas da amostra será igual\(n\) à média da população. O desvio padrão da distribuição das médias da amostra,\(\dfrac{\sigma}{\sqrt{n}}\), é chamado de erro padrão da média.
    Distribuição normal
    uma variável aleatória contínua (RV) com pdf\(f(x) = \dfrac{1}{\sigma \sqrt{2 \pi}}e^{\dfrac{-(x-\mu)^{2}}{2 \sigma^{2}}}\), onde\(\mu\) é a média da distribuição e\(\sigma\) é o desvio padrão; notação:\(X \sim N(\mu, \sigma)\). Se\(\mu = 0\) e\(\sigma = 1\), o RV é chamado de distribuição normal padrão.
    Erro padrão da média
    o desvio padrão da distribuição das médias da amostra, ou\(\dfrac{\sigma}{\sqrt{n}}\).

    Referências

    1. Baran, Daya. “20% dos americanos nunca usaram e-mail”. WebGuild, 2010. Disponível on-line em www.webguild.org/20080519/20-... ver-used-email (acessado em 17 de maio de 2013).
    2. Dados do The Flurry Blog, 2013. Disponível on-line em blog.flurry.com (acessado em 17 de maio de 2013).
    3. Dados do Departamento de Agricultura dos Estados Unidos.