Skip to main content
Global

9.2: Resultados e os erros do tipo I e do tipo II

  • Page ID
    186927
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Quando você realiza um teste de hipótese, há quatro resultados possíveis, dependendo da verdade real (ou falsidade) da hipótese nula\(H_0\) e da decisão de rejeitar ou não. Os resultados estão resumidos na tabela a seguir:

    Tabela 9.2
    \(\textbf{Statistical Decision}\) \(\bf{H_0} \textbf{ is actually...}\)
    \ (\ textbf {Decisão estatística}\)” style="vertical-align:middle; "> \ (\ bf {H_0}\ textbf {é na verdade...}\)” style="vertical-align:middle; "> True Falso
    \ (\ textbf {Statistical Decision}\)” style="vertical-align:middle; ">Não é possível aceitar\(H_0\) \ (\ bf {H_0}\ textbf {na verdade é...}\)” style="vertical-align:middle; ">Erro do tipo I Resultado correto
    \ (\ textbf {Statistical Decision}\)” style="vertical-align:middle; ">Não é possível rejeitar\(H_0\) \ (\ bf {H_0}\ textbf {é na verdade...}\)” style="vertical-align:middle; ">Resultado correto Erro do tipo II

    Os quatro resultados possíveis na tabela são:

    1. A decisão não pode ser rejeitada\(\bf{H_0}\) quando\(\bf{H_0}\) é verdadeira (decisão correta).
    2. A decisão não pode aceitar\(\bf{H_0}\) quando\(\bf{H_0}\) é verdadeira (decisão incorreta conhecida como erro do Tipo I). Esse caso é descrito como “rejeição de um bom nulo”. Como veremos mais adiante, é esse tipo de erro que evitaremos ao definir a probabilidade de cometer tal erro. O objetivo é NÃO realizar uma ação que seja um erro.
    3. A decisão não pode ser rejeitada\(\bf{H_0}\) quando, na verdade,\(\bf{H_0}\) é falsa (decisão incorreta conhecida como erro do Tipo II). Isso é chamado de “aceitar um falso nulo”. Nessa situação, você permitiu que o status quo permanecesse em vigor quando deveria ser anulado. Como veremos, a hipótese nula tem a vantagem de competir com a alternativa.
    4. A decisão é não pode aceitar\(\bf{H_0}\) quando\(\bf{H_0}\) é falsa (decisão correta).

    Cada um dos erros ocorre com uma probabilidade específica. As letras gregas\(\alpha\) e\(\beta\) representam as probabilidades.

    • \(\alpha\)= probabilidade de um erro do tipo I =\(\bf{P}\) (erro do tipo I) = probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira: rejeitar um bom nulo.
    • \(\beta\)= probabilidade de um erro do tipo II =\(\bf{P}\) (erro do tipo II) = probabilidade de não rejeitar a hipótese nula quando a hipótese nula é falsa. (\(1 − \beta\)) é chamado de Poder do Teste.

    \(\alpha\)e\(\beta\) devem ser tão pequenos quanto possível porque são probabilidades de erros.

    As estatísticas nos permitem definir a probabilidade de estarmos cometendo um erro do Tipo I. A probabilidade de cometer um erro do Tipo I é\(\alpha\). Lembre-se de que os intervalos de confiança na última unidade foram definidos escolhendo um valor chamado\(Z_{\alpha}\) (ou\(t_{\alpha}\)) e o valor alfa determinou o nível de confiança da estimativa porque era a probabilidade de o intervalo falhar em capturar a média real (ou parâmetro de proporção\(p\)). Esse alfa e aquele são iguais.

    A maneira mais fácil de ver a relação entre o erro alfa e o nível de confiança é com a figura a seguir.

    Figura 9.2

    No centro da Figura 9.2 está marcada uma distribuição de amostragem normalmente distribuída\(H_0\). Esta é uma distribuição amostral de\(\overline X\) e, pelo Teorema do Limite Central, ela é normalmente distribuída. A distribuição no centro está marcada\(H_0\) e representa a distribuição das hipóteses nulas\(H_0\):\(\mu = 100\). Esse é o valor que está sendo testado. As declarações formais das hipóteses nula e alternativa estão listadas abaixo da figura.

    As distribuições em ambos os lados da\(H_0\) distribuição representam distribuições que seriam verdadeiras\(H_0\) se fossem falsas, sob a hipótese alternativa listada como Ha. Não sabemos o que é verdade e nunca saberemos. Na verdade, há um número infinito de distribuições das quais os dados poderiam ter sido extraídos se Ha fosse verdadeiro, mas apenas duas delas estão na Figura 9.2 representando todas as outras.

    Para testar uma hipótese, pegamos uma amostra da população e determinamos se ela poderia ter vindo da distribuição hipotética com um nível aceitável de significância. Esse nível de significância é o erro alfa e está marcado na Figura 9.2 como as áreas sombreadas em cada cauda da\(H_0\) distribuição. (Cada área é na verdade\ alfa/2 porque a distribuição é simétrica e a hipótese alternativa permite a possibilidade de o valor ser maior ou menor do que o valor hipotético — chamado de teste bicaudal).

    Se a média da amostra marcada como\(\overline{X}_{1}\) está na cauda da distribuição de\(H_0\), concluímos que a probabilidade de que ela possa ter vindo da\(H_0\) distribuição é menor que alfa. Consequentemente, afirmamos que “a hipótese nula não pode ser aceita com o nível de significância (\ alfa)”. A verdade pode ser que isso\(\overline{X}_{1}\) veio da\(H_0\) distribuição, mas de fora para a cauda. Se for assim, rejeitamos falsamente uma hipótese nula verdadeira e cometemos um erro do Tipo I. O que as estatísticas fizeram foi fornecer uma estimativa sobre o que sabemos e o que controlamos, e essa é a probabilidade de estarmos errados\(\alpha\).

    Também podemos ver na Figura 9.2 que a média da amostra pode ser realmente de uma distribuição Ha, mas dentro do limite definido pelo nível alfa. Esse caso está marcado como\(\overline{X}_{2}\). Há uma probabilidade de que\(\overline{X}_{2}\) realmente veio de Ha, mas aparece no intervalo\(H_0\) entre as duas caudas. Essa probabilidade é o erro beta, a probabilidade de aceitar um falso nulo.

    Nosso problema é que só podemos definir o erro alfa porque há um número infinito de distribuições alternativas das quais a média poderia ter vindo e que não são iguais\(H_0\) a. Como resultado, o estatístico coloca o ônus da prova na hipótese alternativa. Ou seja, não rejeitaremos uma hipótese nula, a menos que haja uma probabilidade maior que 90, 95 ou mesmo 99 por cento de que a nula seja falsa: o ônus da prova está na hipótese alternativa. É por isso que chamamos isso de tirania do status quo anteriormente.

    A título de exemplo, o sistema judicial americano começa com o conceito de que um réu é “presumido inocente”. Esse é o status quo e a hipótese nula. O juiz dirá ao júri que eles não podem declarar o réu culpado, a menos que as evidências indiquem culpa além de uma “dúvida razoável”, que geralmente é definida em casos criminais como 95% de certeza de culpa. Se o júri não aceitar o nulo, inocente, então serão tomadas medidas, pena de prisão. O ônus da prova sempre recai sobre a hipótese alternativa. (Em casos civis, o júri precisa ter apenas mais de 50% de certeza de irregularidades para declarar culpabilidade, chamada de “preponderância das evidências”).

    O exemplo acima foi para um teste de uma média, mas a mesma lógica se aplica aos testes de hipóteses para todos os parâmetros estatísticos que se queira testar.

    A seguir estão exemplos de erros do Tipo I e do Tipo II.

    Exemplo 9.4

    Suponha que a hipótese nula\(H_0\),, seja: o equipamento de escalada de Frank é seguro.

    Erro tipo I: Frank acha que seu equipamento de escalada pode não ser seguro quando, na verdade, é seguro.

    Erro tipo II: Frank acha que seu equipamento de escalada pode ser seguro quando, na verdade, não é seguro.

    \(\bf{\alpha =}\)probabilidade de Frank achar que seu equipamento de escalada pode não ser seguro quando, na verdade, é seguro. \(\bf{\beta =}\)probabilidade de Frank achar que seu equipamento de escalada pode ser seguro quando, na verdade, não é seguro.

    Observe que, nesse caso, o erro com maior consequência é o erro Tipo II. (Se Frank achar que seu equipamento de escalada é seguro, ele o usará.)

    Essa é uma situação descrita como “aceitar um falso nulo”.

    Exemplo 9.5

    Suponha que a hipótese nula\(H_0\),, seja: A vítima de um acidente automobilístico está viva quando chega ao pronto-socorro de um hospital. Esse é o status quo e não requer nenhuma ação se for verdade. Se a hipótese nula não puder ser aceita, é necessária uma ação e o hospital iniciará os procedimentos apropriados.

    Erro tipo I: a equipe de emergência acha que a vítima está morta quando, na verdade, a vítima está viva. Erro tipo II: A equipe de emergência não sabe se a vítima está viva quando, na verdade, a vítima está morta.

    \(\bf{\alpha =}\)probabilidade de a equipe de emergência achar que a vítima está morta quando, na verdade, ela está realmente viva = P (erro tipo I). \(\bf{\beta =}\)probabilidade de a equipe de emergência não saber se a vítima está viva quando, na verdade, a vítima está morta = P (erro tipo II).

    O erro com maior consequência é o erro do Tipo I. (Se a equipe de emergência achar que a vítima está morta, não a tratará.)

    Exercício 9.5

    Suponha que a hipótese nula\(H_0\),, seja: um paciente não está doente. Qual tipo de erro tem a maior consequência, Tipo I ou Tipo II?

    Exemplo 9.6

    É um Boy Genetic Labs que afirma ser capaz de aumentar a probabilidade de uma gravidez resultar no nascimento de um menino. Os estatísticos querem testar a afirmação. Suponha que a hipótese nula,\(H_0\), seja: It's a Boy Genetic Labs não tem efeito no resultado de gênero. O status quo é que a alegação é falsa. O ônus da prova sempre recai sobre a pessoa que faz a reclamação, neste caso, o Laboratório de Genética.

    Erro tipo I: Isso ocorre quando uma hipótese nula verdadeira é rejeitada. No contexto desse cenário, afirmaríamos que acreditamos que o It's a Boy Genetic Labs influencia o resultado de gênero, quando na verdade não tem efeito. A probabilidade desse erro ocorrer é indicada pela letra grega alpha,\ alpha.

    Erro do tipo II: Isso ocorre quando não rejeitamos uma hipótese nula falsa. No contexto, afirmaríamos que o It's a Boy Genetic Labs não influencia o resultado de gênero de uma gravidez quando, na verdade, influencia. A probabilidade desse erro ocorrer é indicada pela letra grega beta,\ beta.

    O erro de maior consequência seria o erro do Tipo I, já que os casais usariam o produto It's a Boy Genetic Labs na esperança de aumentar as chances de ter um menino.

    Exercício 9.6

    A “maré vermelha” é uma floração de algas produtoras de veneno — algumas espécies diferentes de uma classe de plâncton chamadas dinoflagelados. Quando as condições climáticas e hídricas causam essas flores, moluscos, como as amêijoas que vivem na área, desenvolvem níveis perigosos de uma toxina indutora de paralisia. Em Massachusetts, a Divisão de Pesca Marinha (DMF) monitora os níveis da toxina em moluscos por meio de amostragem regular de moluscos ao longo da costa. Se o nível médio de toxina nas amêijoas exceder 800 μg (microgramas) de toxina por kg de carne de molusco em qualquer área, a colheita de moluscos é proibida lá até que a floração termine e os níveis de toxina nas amêijoas diminuam. Descreva um erro do Tipo I e um do Tipo II nesse contexto e indique qual erro tem a maior consequência.

    Exemplo 9.7

    Um determinado medicamento experimental afirma uma taxa de cura de pelo menos 75% para homens com câncer de próstata. Descreva os erros do Tipo I e do Tipo II no contexto. Qual erro é o mais sério?

    Tipo I: Um paciente com câncer acredita que a taxa de cura do medicamento é inferior a 75%, quando na verdade é de pelo menos 75%.

    Tipo II: Um paciente com câncer acredita que o medicamento experimental tem uma taxa de cura de pelo menos 75% quando tem uma taxa de cura inferior a 75%.

    Nesse cenário, o erro Tipo II contém a consequência mais grave. Se um paciente acreditar que o medicamento funciona pelo menos 75% das vezes, isso provavelmente influenciará a escolha do paciente (e do médico) sobre o uso do medicamento como opção de tratamento.