Skip to main content
Global

10.1: Comparando duas médias populacionais independentes

  • Page ID
    186655
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    A comparação de duas médias populacionais independentes é muito comum e fornece uma maneira de testar a hipótese de que os dois grupos diferem um do outro. O turno da noite é menos produtivo do que o diurno, as taxas de retorno dos investimentos em ativos fixos são diferentes das dos investimentos em ações ordinárias e assim por diante? Uma diferença observada entre duas médias amostrais depende das médias e dos desvios padrão da amostra. Meios muito diferentes podem ocorrer por acaso se houver uma grande variação entre as amostras individuais. A estatística do teste terá que levar em conta esse fato. O teste que compara duas médias populacionais independentes com desvios padrão populacionais desconhecidos e possivelmente desiguais é chamado de\(t\) teste de Aspin-Welch. A fórmula dos graus de liberdade que veremos mais tarde foi desenvolvida pela Aspin-Welch.

    Quando desenvolvemos o teste de hipótese para a média e as proporções, começamos com o Teorema do Limite Central. Reconhecemos que uma média amostral veio de uma distribuição das médias da amostra, e as proporções da amostra vieram da distribuição amostral das proporções da amostra. Isso transformou nossos parâmetros amostrais, as médias e proporções da amostra em variáveis aleatórias. Era importante para nós conhecer a distribuição de onde essas variáveis aleatórias vieram. O Teorema do Limite Central nos deu a resposta: a distribuição normal. Nossa\(t\) estatística\(Z\) e as estatísticas vieram desse teorema. Isso nos forneceu a solução para nossa questão de como medir a probabilidade de uma média amostral vir de uma distribuição com um valor hipotético específico da média ou proporção. Em ambos os casos, essa foi a pergunta: qual é a probabilidade de que a média (ou proporção) de nossos dados de amostra tenha vindo de uma distribuição populacional com o valor hipotético em que estamos interessados?

    Agora estamos interessados em saber se duas amostras têm ou não a mesma média. Nossa pergunta não mudou: essas duas amostras vêm da mesma distribuição populacional? Para abordar esse problema, criamos uma nova variável aleatória. Reconhecemos que temos duas médias amostrais, uma de cada conjunto de dados, e, portanto, temos duas variáveis aleatórias provenientes de duas distribuições desconhecidas. Para resolver o problema, criamos uma nova variável aleatória, a diferença entre as médias da amostra. Essa nova variável aleatória também tem uma distribuição e, novamente, o Teorema do Limite Central nos diz que essa nova distribuição é normalmente distribuída, independentemente das distribuições subjacentes dos dados originais. Um gráfico pode ajudar a entender esse conceito.

    Figura\(\PageIndex{2}\)

    Na foto estão duas distribuições de dados\(X_1\) e\(X_2\), com médias e desvios padrão desconhecidos. O segundo painel mostra a distribuição amostral da variável aleatória recém-criada (\(\overline{X}_{1}-\overline{X}_{2}\)). Essa distribuição é a distribuição teórica de muitas médias amostrais da população 1 menos as médias da amostra da população 2. O Teorema do Limite Central nos diz que essa distribuição teórica de amostragem das diferenças nas médias da amostra é normalmente distribuída, independentemente da distribuição dos dados reais da população mostrados no painel superior. Como a distribuição amostral é normalmente distribuída, podemos desenvolver uma fórmula de padronização e calcular probabilidades a partir da distribuição normal padrão no painel inferior, a\(Z\) distribuição. Já vimos essa mesma análise antes na Figura do Capítulo 7\(\PageIndex{2}\).

    O Teorema do Limite Central, como antes, nos fornece o desvio padrão da distribuição amostral e, além disso, que o valor esperado da média da distribuição das diferenças nas médias da amostra é igual às diferenças nas médias da população. Matematicamente, isso pode ser afirmado:

    \[E\left(\mu_{\overline{x}_{1}}-\mu_{\overline{x}_{2}}\right)=\mu_{1}-\mu_{2}\nonumber\]

    Como não conhecemos os desvios padrão da população, nós os estimamos usando os dois desvios padrão da amostra de nossas amostras independentes. Para o teste de hipótese, calculamos o desvio padrão estimado, ou erro padrão, da diferença nas médias da amostra,\(\overline{X}_{1}-\overline{X}_{2}\).

    \[\textbf{The standard error is:}\nonumber\]

    \[\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}\nonumber\]

    Lembramos que substituir a variância amostral pela variância da população quando não tínhamos a variância da população foi a técnica que usamos ao construir o intervalo de confiança e a estatística de teste para o teste de hipótese por uma única média de volta nos intervalos de confiança e Teste de hipóteses com uma amostra. A estatística do teste (pontuação t) é calculada da seguinte forma:

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}}\nonumber\]

    onde:

    • \(s_1\)e\(s_2\), os desvios padrão da amostra, são estimativas de\(\sigma_1\) e\(\sigma_2\), respectivamente, e
    • \(\sigma_1\)e\(\sigma_2\) são os desvios padrão da população desconhecidos.
    • \(\overline{x}_{1}\)e\(\overline{x}_{2}\) são as médias da amostra. \(\mu_1\)e\(\mu_2\) são os meios populacionais desconhecidos.

    O número de graus de liberdade (df) requer um cálculo um tanto complicado. Nem sempre\(df\) são números inteiros. A estatística do teste acima é aproximada pela\(t\) distribuição de Student da\(df\) seguinte forma:

    Graus de liberdade

    \[df=\frac{\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}{\left(\frac{1}{n_{1}-1}\right)\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}\right)^{2}+\left(\frac{1}{n_{2}-1}\right)\left(\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}\nonumber\]

    Quando ambos os tamanhos\(n_1\) de amostra\(n_2\) são 30 ou maiores, a aproximação t de Student é muito boa. Se cada amostra tiver mais de 30 observações, os graus de liberdade podem ser calculados como\(n_1 + n_2 - 2\).

    O formato da distribuição amostral, diferenças nas médias da amostra, especifica que o formato da hipótese nula e alternativa é:

    \[H_{0} : \mu_{1}-\mu_{2}=\delta_{0}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1}-\mu_{2} \neq \delta_{0}\nonumber\]

    onde\(\delta_{0}\) está a diferença hipotética entre as duas médias. Se a pergunta for simplesmente “existe alguma diferença entre as médias?” então,\(\delta_{0} = 0\) e as hipóteses nulas e alternativas se tornam:

    \[H_{0} : \mu_{1}=\mu_{2}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1} \neq \mu_{2}\nonumber\]

    Um exemplo de quando\(\delta_{0}\) pode não ser zero é quando a comparação dos dois grupos exige uma diferença específica para que a decisão seja significativa. Imagine que você está fazendo um investimento de capital. Você está pensando em mudar de seu modelo de máquina atual para outro. Você mede a produtividade de suas máquinas pela velocidade com que elas produzem o produto. Pode ser que um candidato a substituir o modelo antigo seja mais rápido em termos de produtividade do produto, mas também seja mais caro. A segunda máquina também pode ter mais custos de manutenção, custos de configuração, etc. A hipótese nula seria estabelecida para que a nova máquina tivesse que ser melhor do que a antiga o suficiente para cobrir esses custos extras em termos de velocidade e custo de produção. Essa forma de hipótese nula e alternativa mostra o quão valioso esse teste de hipótese específico pode ser. Durante a maior parte do nosso trabalho, testaremos hipóteses simples perguntando se há alguma diferença entre as duas médias de distribuição.

    Exemplo\(\PageIndex{1}\) INDEPENDENT GROUPS

    A Kona Iki Corporation produz leite de coco. Eles pegam cocos e extraem o leite de dentro fazendo um furo e despejando o leite em uma cuba para processamento. Eles têm um turno diurno (chamado de turno B) e um noturno (chamado turno G) para fazer essa parte do processo. Eles gostariam de saber se o turno diurno e o noturno são igualmente eficientes no processamento dos cocos. Um estudo é feito amostrando 9 turnos do turno G e 16 turnos do turno B. Os resultados do número de horas necessárias para processar 100 libras de coco são apresentados na Tabela\(\PageIndex{1}\). Um estudo é feito e os dados são coletados, resultando nos dados na Tabela\(\PageIndex{1}\).

    \ (\ PageIndex {1}\) “>
    Tamanho da amostra Número médio de horas para processar 100 libras de coco Desvio padrão da amostra
    Mudança G 9 2 0.8660.866
    Turno B 16 3.2 1,00
    Tabela\(\PageIndex{1}\)

    Há alguma diferença na quantidade média de tempo de cada turno para processar 100 libras de coco? Teste no nível de significância de 5%.

    Responda

    Solução 10.1

    Os desvios padrão da população não são conhecidos e não se pode presumir que sejam iguais entre si. \(g\)Seja o subscrito do G Shift e\(b\) seja o subscrito do B Shift. Então,\(\mu_g\) é a média da população para o G Shift e\(\mu_b\) é a média da população para o B Shift. Este é um teste de dois grupos independentes, duas médias populacionais.

    Variável aleatória:\(\overline{X}_{g}-\overline{X}_{b}\) = diferença na quantidade média de tempo da amostra entre o G Shift e o B Shift necessário para processar os cocos.
    \(\H_{0}: \mu_g = \mu_b\)\(\H_{0}: \mu_g – \mu_b = 0\)
    \(H_a: \mu_g \neq \mu_b\)\(H_a: \mu_g – \mu_b \neq 0\)
    As palavras “o mesmo” indicam que você\(\H_{0}\) tem um “=”. Como não há outras palavras para indicar\(H_a\), é mais rápido ou mais lento. Este é um teste bicaudal.

    Distribuição para o teste: Use\(t_{df}\) onde\(df\) é calculado usando a\(df\) fórmula para grupos independentes, duas médias populacionais acima. Usando uma calculadora,\(df\) é aproximadamente 18.8462.

    Gráfico:

    Essa é uma curva de distribuição normal que representa a diferença na quantidade média de tempo que meninas e meninos praticam esportes o dia todo. A média é igual a zero e os valores -1,2, 0 e 1,2 são rotulados no eixo horizontal. Duas linhas verticais se estendem de -1,2 e 1,2 até a curva. A região à esquerda de x = -1,2 e a região à direita de x = 1,2 são sombreadas para representar o valor p. A área de cada região é 0,0028.

    Figura\(\PageIndex{3}\)

    \[\mathrm{t}_{\mathrm{c}}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=-3.01\nonumber\]

    Em seguida, encontramos o valor crítico na\(t\) tabela -usando os graus de liberdade de cima. O valor crítico, 2,093, é encontrado na coluna 0,025, ou seja\(\alpha/2\), a 19 graus de liberdade. (A convenção é reunir os graus de liberdade para tornar a conclusão mais conservadora.) Em seguida, calculamos a estatística de teste e a marcamos no gráfico\(t\) de distribuição.

    Tome uma decisão: como o\(t\) valor calculado está na cauda, não podemos aceitar a hipótese nula de que não há diferença entre os dois grupos. Os meios são diferentes.

    O gráfico incluiu a distribuição amostral das diferenças nas médias da amostra para mostrar como a distribuição t se alinha com os dados da distribuição amostral. Vemos no painel superior que a diferença calculada nas duas médias é -1,2 e o painel inferior mostra que isso é 3,01 desvios padrão da média. Normalmente, não precisamos mostrar o gráfico de distribuição da amostragem e podemos confiar no gráfico da estatística de teste, a distribuição t neste caso, para chegar à nossa conclusão.

    Conclusão: No nível de significância de 5%, os dados da amostra mostram que há evidências suficientes para concluir que o número médio de horas que o G Shift leva para processar 100 libras de cocos é diferente do turno B (o número médio de horas para o turno B é maior que o número médio de horas do turno B é maior que o número médio de horas para o G Shift).

    OBSERVAÇÃO

    Quando a soma dos tamanhos das amostras for maior do que\(30\left(n_{1}+n_{2}>30\right)\) você pode usar a distribuição normal para aproximar a do aluno\(t\).

    Exemplo\(\PageIndex{2}\)

    Um estudo é feito para determinar se a empresa A retém seus trabalhadores por mais tempo do que a empresa B. Acredita-se que a empresa A tenha uma retenção maior do que a empresa B. O estudo descobriu que, em uma amostra de 11 trabalhadores na empresa A, seu tempo médio na empresa é de quatro anos com um desvio padrão de 1,5 anos. Uma amostra de 9 trabalhadores da Empresa B mostra que o tempo médio com a empresa foi de 3,5 anos com um desvio padrão de 1 ano. Teste essa proposição no nível de significância de 1%.

    a. É um teste de duas médias ou duas proporções?

    Responda

    Solução 10.2

    a. dois significa porque o tempo é uma variável aleatória contínua.

    b. Os desvios padrão da população são conhecidos ou desconhecidos?

    Responda

    Solução 10.2

    b. desconhecido

    c. Qual distribuição você usa para realizar o teste?

    Responda

    Solução 10.2

    c. Estudantes\(t\)

    d. Qual é a variável aleatória?

    Responda

    Solução 10.2

    d.\(\overline{X}_{A}-\overline{X}_{B}\)

    e. Quais são as hipóteses nula e alternativa?

    Responda

    Solução 10.2

    e.

    • \(H_{0} : \mu_{A} \leq \mu_{B}\)
    • \(H_{a} : \mu_{A}>\mu_{B}\)

    f. Esse teste é de cauda direita, esquerda ou bicaudal?

    Responda

    Solução 10.2

    f. teste unicaudal direito

    Essa é uma curva de distribuição normal com média igual a 0. Uma linha vertical próxima à extremidade da curva à direita de zero se estende do eixo até a curva. A região abaixo da curva à direita da linha está sombreada.

    Figura\(\PageIndex{4}\)

    g. Qual é o valor da estatística do teste?

    Responda

    Solução 10.2

    g.

    \(t_{c}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=0.89\)

    h. Você pode aceitar/rejeitar a hipótese nula?

    Responda

    Solução 10.2

    h. Não é possível rejeitar a hipótese nula de que não há diferença entre os dois grupos. A estatística do teste não está na cauda. O valor crítico da distribuição t é 2,764 com 10 graus de liberdade. Este exemplo mostra como é difícil rejeitar uma hipótese nula com uma amostra muito pequena. Os valores críticos exigem estatísticas de teste muito grandes para alcançar a cauda.

    i. Conclusão:

    Responda

    Solução 10.2

    i. No nível de significância de 1%, a partir dos dados da amostra, não há evidências suficientes para concluir que a retenção de trabalhadores na Empresa A é maior do que na Empresa B, em média.

    Exemplo\(\PageIndex{3}\)

    Uma questão de pesquisa interessante é o efeito, se houver, que diferentes tipos de formatos de ensino têm nos resultados das notas dos alunos. Para investigar esse problema, uma amostra das notas dos alunos foi retirada de uma aula híbrida e outra amostra de uma aula em formato de aula padrão. Ambas as aulas eram para o mesmo assunto. A nota média do curso em porcentagem para os 35 alunos híbridos é 74 com um desvio padrão de 16. As notas médias dos 40 alunos da aula teórica padrão foram de 76 por cento com um desvio padrão de 9. Teste em 5% para ver se há alguma diferença significativa nas notas médias da população entre o curso letivo padrão e a aula híbrida.

    Responda

    Solução 10.3

    Começamos observando que temos dois grupos, alunos de uma turma híbrida e alunos de uma aula em formato de aula padrão. Também notamos que a variável aleatória, na qual estamos interessados, são as notas dos alunos, uma variável aleatória contínua. Poderíamos ter feito a pergunta de pesquisa de uma maneira diferente e ter uma variável aleatória binária. Por exemplo, poderíamos ter estudado a porcentagem de alunos com nota reprovada ou com nota A. Ambos seriam binários e, portanto, um teste de proporções e não um teste de médias, como é o caso aqui. Finalmente, não há presunção de qual formato pode levar a notas mais altas, então a hipótese é declarada como um teste bicaudal.

    \(H_{0}: \mu_1 = \mu_2 \)
    \(H_a: \mu_1 \neq \mu_2\)

    Como praticamente sempre seria o caso, não conhecemos as variâncias populacionais das duas distribuições e, portanto, nossa estatística de teste é:

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{s^{2}}{n_{1}}+\frac{s^{2}}{n_{2}}}}=\frac{(74-76)-0}{\sqrt{\frac{16^{2}}{35}+\frac{9^{2}}{40}}}=-0.65\nonumber\]

    Para determinar o valor crítico do t do aluno, precisamos dos graus de liberdade. Para este caso, usamos:\(df = n_1 + n_2 - 2 = 35 + 40 -2 = 73\). Isso é grande o suficiente para considerá-la a distribuição normal, portanto\(t_{\alpha /2} = 1.96\). Novamente, como sempre, determinamos se o valor calculado está na cauda determinado pelo valor crítico. Nesse caso, nem precisamos pesquisar o valor crítico: o valor calculado da diferença nessas duas notas médias não está nem mesmo a um desvio padrão. Certamente não na cauda.

    Conclusão: Não é possível rejeitar o nulo em\(\bf{\alpha = 5\%}\). Portanto, não existem evidências para provar que as notas nas classes híbridas e padrão são diferentes.