Skip to main content
Global

9.3: Distribuição necessária para testes de hipóteses

  • Page ID
    186983
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Anteriormente, discutimos as distribuições de amostragem. Distribuições específicas estão associadas ao teste de hipóteses. Realizaremos testes de hipóteses de uma média populacional usando uma distribuição normal ou uma\(t\) distribuição de Student. (Lembre-se de usar a\(t\) distribuição de Student quando o desvio padrão da população for desconhecido e o tamanho da amostra for pequeno, onde pequeno é considerado menor que 30 observações.) Realizamos testes de uma proporção da população usando uma distribuição normal quando podemos assumir que a distribuição está normalmente distribuída. Consideramos que isso é verdade se a proporção da amostra,\(p^{\prime}\), vezes o tamanho da amostra for maior que 5 e\(1-p^{\prime}\) vezes o tamanho da amostra também for maior que 5. Essa é a mesma regra prática que usamos ao desenvolver a fórmula para o intervalo de confiança para uma proporção da população.

    Teste de hipótese para a média

    Voltando à fórmula de padronização, podemos derivar a estatística de teste para testar hipóteses sobre médias.

    \[Z_{c}=\frac{\overline{x}-\mu_{0}}{\sigma / \sqrt{n}}\nonumber\]

    A fórmula padronizadora não pode ser resolvida como é porque não temos\(\mu\), a média da população. No entanto, se substituirmos o valor hipotético da média,\(\mu_0\) na fórmula acima, podemos calcular um\(Z\) valor. Esta é a estatística de teste para um teste de hipótese para uma média e é apresentada na Figura 9.3. Interpretamos esse\(Z\) valor como a probabilidade associada de que uma amostra com uma média amostral de\(\overline X\) possa ter vindo de uma distribuição com uma média populacional de\(H_0\) e chamamos esse\(Z\) valor\(Z_c\) de “calculado”. A Figura 9.3 e a Figura 9.4 mostram esse processo.

    Figura 9.3

    Na Figura 9.3, dois dos três resultados possíveis são apresentados. \(\overline X_1\)e\(\overline X_3\) estão na cauda da distribuição hipotética de\(H_0\). Observe que o eixo horizontal no painel superior é rotulado como\(\overline X\)'s. Essa é a mesma distribuição teórica de\(\overline X\)'s, a distribuição de amostragem, que o Teorema do Limite Central nos diz que está normalmente distribuída. É por isso que podemos desenhá-lo com essa forma. O eixo horizontal do painel inferior é rotulado\(Z\) e é a distribuição normal padrão. \(Z_{\frac{\alpha}{2}}\)e\(-Z_{\frac{\alpha}{2}}\), chamados de valores críticos, são marcados no painel inferior como os\(Z\) valores associados à probabilidade que o analista definiu como o nível de significância no teste, (\(\alpha\)). As probabilidades nas caudas de ambos os painéis são, portanto, as mesmas.

    Observe que para cada um\(\overline X\) existe um associado\(Z_c\), chamado calculado\(Z\), que vem da solução da equação acima. Esse cálculo nada mais\(Z\) é do que o número de desvios padrão que a média hipotética é da média da amostra. Se a média da amostra cair em “muitos” desvios padrão da média hipotética, concluímos que a média amostral não poderia ter vindo da distribuição com a média hipotética, dado nosso nível de significância exigido predefinido. Pode ter vindo\(H_0\), mas é considerado muito improvável. Na Figura 9.3, ambos\(\overline X_1\)\(\overline X_3\) estão nas caudas da distribuição. Eles são considerados “muito distantes” do valor hipotético da média, dado o nível de alfa escolhido. Se, de fato, essa amostra significa que ela veio\(H_0\), mas da cauda, cometemos um erro do Tipo I: rejeitamos um bom nulo. Nosso único conforto real é que sabemos a probabilidade de cometer tal erro,\ alpha, e podemos controlar o tamanho de\(\alpha\).

    A Figura 9.4 mostra a terceira possibilidade para a localização da média da amostra,\(\overline x\). Aqui, a média da amostra está dentro dos dois valores críticos. Ou seja, dentro da probabilidade de\((1-\alpha)\) e não podemos rejeitar a hipótese nula.

    Figura 9.4

    Isso nos dá a regra de decisão para testar uma hipótese para um teste bicaudal:

    Regra de decisão: teste bidimensional
    Se\(\left|\mathrm{Z}_{c}\right|<\mathrm{Z}_{\frac{\alpha}{2}}\): então não REJEITE\(H_0\)
    Se\(\left|\mathrm{Z}_{c}\right|>\mathrm{Z}_{\frac{\alpha}{2}}\): então REJEITAR\(H_0\)
    Tabela 9.3

    Essa regra sempre será a mesma, independentemente da hipótese que estamos testando ou das fórmulas que estamos usando para fazer o teste. A única alteração será mudar o para o símbolo apropriado\(Z_c\) para a estatística de teste para o parâmetro que está sendo testado. Declarando a regra de decisão de outra forma: se é improvável que a média da amostra tenha vindo da distribuição com a média hipotética, não podemos aceitar a hipótese nula. Aqui, definimos “improvável” como ter uma probabilidade menor que alfa de ocorrer.

    Abordagem de valor P

    Uma regra de decisão alternativa pode ser desenvolvida calculando a probabilidade de que uma média amostral possa ser encontrada, o que forneceria uma estatística de teste maior do que a estatística de teste encontrada a partir dos dados da amostra atual, assumindo que a hipótese nula seja verdadeira. Aqui, a noção de “provável” e “improvável” é definida pela probabilidade de extrair uma amostra com uma média de uma população com a média hipotética maior ou menor do que a encontrada nos dados da amostra. Simplificando, a abordagem de\(p\) valor -compara o nível de significância desejado\(\alpha\),, com o\(p\) valor -, que é a probabilidade de extrair uma média amostral mais longe do valor hipotético do que a média amostral real. Um grande\(p\) valor calculado a partir dos dados indica que não devemos rejeitar a hipótese nula. Quanto menor o\(p\) valor -, mais improvável é o resultado e mais forte é a evidência contra a hipótese nula. Rejeitaríamos a hipótese nula se a evidência fosse fortemente contra ela. A relação entre a regra de decisão de comparar as estatísticas de teste calculadas e o Valor Crítico e usar o\(p\) valor -pode ser vista na Figura 9.5.\(Z_c\)\(Z_\alpha\)

    Figura 9.5

    O valor calculado da estatística de teste está\(Z_c\) neste exemplo e está marcado no gráfico inferior da distribuição normal padrão porque é um\(Z\) valor. Nesse caso, o valor calculado está na cauda e, portanto, não podemos aceitar a hipótese nula, a associada\(\overline X\) é invulgarmente grande demais para acreditar que veio da distribuição com uma média de\(\mu_0\) com um nível de significância de\ alfa.

    Se usarmos a regra de decisão\(p\) -value, precisamos de mais uma etapa. Precisamos encontrar na tabela normal padrão a probabilidade associada à estatística de teste calculada,\(Z_c\). Em seguida, comparamos isso com o\ alpha associado ao nosso nível de confiança selecionado. Na Figura 9.5, vemos que o\(p\) valor -é menor que\ alpha e, portanto, não podemos aceitar o nulo. Sabemos que o\(p\) valor -é menor que\ alpha porque a área abaixo do\(p\) valor -é menor que\(\alpha/ 2\). É importante observar que dois pesquisadores retirados aleatoriamente da mesma população podem encontrar dois\(p\) valores diferentes em suas amostras. Isso ocorre porque o\(p\) valor -é calculado como a probabilidade na cauda além da média da amostra, supondo que a hipótese nula esteja correta. Como as médias da amostra provavelmente serão diferentes, isso criará dois\(p\) valores diferentes. No entanto, as conclusões quanto à hipótese nula devem ser diferentes apenas com o nível de probabilidade de\(\alpha\).

    Aqui está uma forma sistemática de decidir se você não pode aceitar ou não rejeitar uma hipótese nula usando o\(\bf{p}\) valor -e um\ (\ bf {\ alpha}\) predefinido ou preconcebido (o "nível de significância “). Uma predefinição\(\alpha\) é a probabilidade de um erro do Tipo I (rejeitar a hipótese nula quando a hipótese nula é verdadeira). Ele pode ou não ser dado a você no início do problema. Em qualquer caso, o valor de\(\alpha\) é a decisão do analista. Ao tomar a decisão de rejeitar ou não rejeitar\(H_0\), faça o seguinte:

    • Se for\(\alpha > p\) -value, não é possível aceitar\(H_0\). Os resultados dos dados da amostra são significativos. Há evidências suficientes para concluir que\(H_0\) é uma crença incorreta e que a hipótese alternativa, Ha, pode estar correta.
    • Se for\(\alpha \leq p\) -value, não é possível rejeitar\(H_0\). Os resultados dos dados da amostra não são significativos. Não há evidências suficientes para concluir que a hipótese alternativa, Ha, pode estar correta. Nesse caso, o status quo permanece.
    • Quando você “não pode rejeitar\(H_0\) “, isso não significa que você deva acreditar que isso\(H_0\) é verdade. Significa simplesmente que os dados da amostra falharam em fornecer evidências suficientes para lançar sérias dúvidas sobre a veracidade do\(H_0\). Lembre-se de que o nulo é o status quo e é preciso alta probabilidade de derrubar o status quo. Esse viés a favor da hipótese nula é o que dá origem à afirmação “tirania do status quo” ao discutir o teste de hipóteses e o método científico.

    Ambas as regras de decisão resultarão na mesma decisão e é uma questão de preferência qual delas será usada.

    Testes unicaudais e bicaudais

    A discussão da Figura 9.3 - Figura 9.5 foi baseada na hipótese nula e alternativa apresentada na Figura 9.3. Isso foi chamado de teste bicaudal porque a hipótese alternativa permitia que a média pudesse ter vindo de uma população maior ou menor do que a média hipotética na hipótese nula. Isso pode ser visto pela afirmação da hipótese alternativa\(\mu \neq 100\), como neste exemplo.

    Pode ser que o analista não se preocupe com o valor ser “muito” alto ou “muito” baixo do valor hipotético. Se for esse o caso, ele se torna um teste unicaudal e toda a probabilidade alfa é colocada em apenas uma cauda e não dividida\(\alpha /2\) como no caso acima de um teste bicaudal. Qualquer teste de uma reclamação será um teste unicaudal. Por exemplo, um fabricante de automóveis afirma que seu Modelo 17B fornece um consumo de combustível superior a 25 milhas por galão. A hipótese nula e alternativa seria:

    • \(H_0: \mu \leq 25\)
    • \(H_a: \mu > 25\)

    A alegação estaria na hipótese alternativa. O ônus da prova no teste de hipóteses é suportado na alternativa. Isso ocorre porque não rejeitar o nulo, o status quo, deve ser realizado com 90 ou 95 por cento de significância de que não pode ser mantido. Dito de outra forma, queremos ter apenas 5 ou 10 por cento de probabilidade de cometer um erro do Tipo I, rejeitar um bom nulo; derrubar o status quo.

    Este é um teste unicaudal e toda a probabilidade alfa é colocada em apenas uma cauda e não dividida\(\alpha /2\) como no caso acima de um teste bicaudal.

    A Figura 9.6 mostra os dois casos possíveis e a forma da hipótese nula e alternativa que os originou.

    Figura 9.6

    onde\(\mu_0\) é o valor hipotético da média da população.

    Tamanho da amostra Estatística do teste
    < 30
    (\(\sigma\)desconhecido)
    \(t_{c}=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}\)
    < 30
    (\(\sigma\)conhecido)
    \(Z_{c}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\)
    > 30
    (\(\sigma\)desconhecido)
    \(Z_{c}=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}\)
    > 30
    (\(\sigma\)conhecido)
    \(Z_{c}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\)
    Tabela 9.4 Estatísticas de teste para teste de médias, tamanho amostral variável, desvio padrão da população conhecido ou desconhecido

    Efeitos do tamanho da amostra na estatística de teste

    Ao desenvolver os intervalos de confiança para a média de uma amostra, descobrimos que na maioria das vezes não teríamos o desvio padrão da população,\(\sigma\). Se o tamanho da amostra fosse menor que 30, poderíamos simplesmente substituir a estimativa pontual\(\sigma\), o desvio padrão da amostra e usar a\(t\) distribuição -do aluno para corrigir essa falta de informação.\(s\)

    Ao testar hipóteses, nos deparamos com esse mesmo problema e a solução é exatamente a mesma. Ou seja: Se o desvio padrão da população for desconhecido e o tamanho da amostra for menor que 30\(s\), substitua a estimativa pontual pelo desvio padrão da população\(\sigma\),, na fórmula da estatística de teste e use a\(t\) distribuição do aluno. Todas as fórmulas e figuras acima permanecem inalteradas, exceto por essa substituição e pela alteração da\(Z\) distribuição para a distribuição t do aluno no gráfico. Lembre-se de que a distribuição t do aluno só pode ser computada sabendo os graus de liberdade adequados para o problema. Nesse caso, os graus de liberdade são calculados como antes com intervalos de confiança:\(df = (n-1)\). O valor t calculado é comparado ao valor t associado ao nível de confiança predefinido exigido no teste,\(t_{\alpha, df}\) encontrado nas tabelas t do aluno. Se não soubermos\(\sigma\), mas o tamanho da amostra for 30 ou mais, simplesmente substituímos\(s\)\(\sigma\) e usamos a distribuição normal.

    A Tabela 9.4 resume essas regras.

    Uma abordagem sistemática para testar uma hipótese

    Uma abordagem sistemática para o teste de hipóteses segue as etapas a seguir e nesta ordem. Este modelo funcionará para todas as hipóteses que você testará.

    • Configure a hipótese nula e alternativa. Normalmente, essa é a parte mais difícil do processo. Aqui, a pergunta feita é revisada. Qual parâmetro está sendo testado, uma média, uma proporção, diferenças nas médias, etc. Este é um teste unicaudal ou bicaudal? Lembre-se de que, se alguém estiver fazendo uma reclamação, sempre será um teste unilateral.
    • Decida o nível de significância necessário para esse caso específico e determine o valor crítico. Eles podem ser encontrados na tabela estatística apropriada. Os níveis de confiança típicos das empresas são 80, 90, 95, 98 e 99. No entanto, o nível de significância é uma decisão política e deve ser baseado no risco de cometer um erro do Tipo I, rejeitando um bom nulo. Considere as consequências de cometer um erro do Tipo I.

      Em seguida, com base nas hipóteses e no tamanho da amostra, selecione a estatística de teste apropriada e encontre o valor crítico relevante:\(Z_\alpha\),\(t_\alpha\), etc. Desenhar a distribuição de probabilidade relevante e marcar o valor crítico é sempre uma grande ajuda. Certifique-se de combinar o gráfico com a hipótese, especialmente se for um teste unicaudal.

    • Pegue uma amostra (s) e calcule os parâmetros relevantes: média da amostra, desvio padrão ou proporção. Usando a fórmula para a estatística de teste acima na etapa 2, agora calcule a estatística de teste para esse caso específico usando os parâmetros que você acabou de calcular.
    • Compare a estatística de teste calculada e o valor crítico. Marcá-los no gráfico fornecerá uma boa imagem visual da situação. Agora existem apenas duas situações:
      1. A estatística do teste está na cauda: Não é possível aceitar o nulo, a probabilidade de que essa média amostral (proporção) tenha vindo da distribuição hipotética é muito pequena para acreditar que é o verdadeiro lar desses dados de amostra.
      2. A estatística de teste não está na cauda: não é possível rejeitar o nulo, os dados da amostra são compatíveis com o parâmetro hipotético da população.
    • Chegue a uma conclusão. É melhor articular a conclusão de duas maneiras diferentes. Primeiro, uma conclusão estatística formal, como “Com um nível de significância de 5%, não podemos aceitar as hipóteses nulas de que a média da população é igual a XX (unidades de medida)”. A segunda declaração da conclusão é menos formal e afirma a ação, ou falta de ação, necessária. Se a conclusão formal fosse essa acima, então a informal poderia ser: “A máquina está quebrada e precisamos desligá-la e pedir reparos”.

    Todas as hipóteses testadas passarão por esse mesmo processo. As únicas mudanças são as fórmulas relevantes e elas são determinadas pela hipótese necessária para responder à pergunta original.