Skip to main content
Global

11.3: Teste de adequação

  • Page ID
    186591
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Nesse tipo de teste de hipótese, você determina se os dados “se encaixam” em uma distribuição específica ou não. Por exemplo, você pode suspeitar que seus dados desconhecidos se encaixam em uma distribuição binomial. Você usa um teste de qui-quadrado (o que significa que a distribuição para o teste de hipótese é qui-quadrado) para determinar se há um ajuste ou não. As hipóteses nulas e alternativas para esse teste podem ser escritas em frases ou podem ser declaradas como equações ou desigualdades.

    A estatística de teste para um teste de adequação é:

    \[\sum_{k} \frac{(O-E)^{2}}{E}\nonumber\]

    onde:

    • \(O\)= valores observados (dados)
    • \(E\)= valores esperados (da teoria)
    • \(k\)= o número de células ou categorias de dados diferentes

    Os valores observados são os valores dos dados e os valores esperados são os valores que você esperaria obter se a hipótese nula fosse verdadeira. Não há termos do formulário\(\frac{(O-E)^{2}}{E}\).

    O número de graus de liberdade é\(df\) = (número de categorias — 1).

    O teste de adequação quase sempre tem a cauda direita. Se os valores observados e os valores esperados correspondentes não estiverem próximos um do outro, a estatística de teste poderá ficar muito grande e ficará bem na extremidade direita da curva qui-quadrada.

    OBSERVAÇÃO

    O número de valores esperados dentro de cada célula precisa ser pelo menos cinco para usar esse teste.

    Exemplo\(\PageIndex{4}\)

    O absenteísmo de estudantes universitários nas aulas de matemática é uma grande preocupação para os professores de matemática, pois a falta às aulas parece aumentar a taxa de redução. Suponha que um estudo tenha sido feito para determinar se a taxa real de absenteísmo do aluno segue a percepção do corpo docente. O corpo docente esperava que um grupo de 100 alunos faltasse às aulas, de acordo com a Tabela\(\PageIndex{1}\).

    \ (\ PageIndex {1}\) “>
    Número de ausências por período Número esperado de estudantes
    0—2 50
    3—5 30
    6—8 12
    9—11 6
    12+ 2
    Tabela\(\PageIndex{1}\)

    Uma pesquisa aleatória em todos os cursos de matemática foi então feita para determinar o número real (observado) de ausências em um curso. O gráfico na Tabela\(\PageIndex{2}\) exibe os resultados dessa pesquisa.

    \ (\ PageIndex {2}\) “>
    Número de ausências por período Número real de estudantes
    0—2 35
    3—5 40
    6—8 20
    9—11 1
    12+ 4
    Tabela\(\PageIndex{2}\)

    Determine as hipóteses nulas e alternativas necessárias para realizar um teste de adequação.

    \(\bf{H_a}\): O absenteísmo estudantil se encaixa na percepção dos professores

    A hipótese alternativa é o oposto da hipótese nula.

    \(\bf{H_a}\): O absentismo estudantil não se encaixa na percepção do corpo docente.

    a. Você pode usar as informações que aparecem nos gráficos para realizar o teste de adequação?

    Responda

    Solução 11.4

    a. Não. Observe que o número esperado de ausências para a entrada “12+” é menor que cinco (são dois). Combine esse grupo com o grupo “9—11" para criar novas tabelas em que o número de alunos para cada inscrição seja de pelo menos cinco. Os novos resultados estão na Tabela\(\PageIndex{3}\) e na Tabela\(\PageIndex{4}\).

    \ (\ PageIndex {3}\) “>
    Número de ausências por período Número esperado de estudantes
    0—2 50
    3—5 30
    6—8 12
    9+ 8

    Tabela 11.3

    \ (\ PageIndex {4}\) “>
    Número de ausências por período Número real de estudantes
    0—2 35
    3—5 40
    6—8 20
    9+ 5
    Tabela\(\PageIndex{4}\)

    b. Qual é o número de graus de liberdade (\(df\))?

    Responda

    Solução 11.4

    b. Há quatro “células” ou categorias em cada uma das novas tabelas.

    \(d f=\text { number of cells }-1=4-1=3\)

    Exercício\(\PageIndex{4}\)

    Um gerente de fábrica precisa entender quantos produtos estão com defeito versus quantos são produzidos. O número de defeitos esperados está listado na Tabela\(\PageIndex{5}\).

    \ (\ PageIndex {5}\) “>
    Número produzido Número com defeito
    0—100 5
    101—200 6
    201—300 7
    301—400 8
    401—500 10
    Tabela\(\PageIndex{5}\)

    Uma amostra aleatória foi coletada para determinar o número real de defeitos. A tabela\(\PageIndex{6}\) mostra os resultados da pesquisa.

    \ (\ PageIndex {6}\) “>
    Número produzido Número com defeito
    0—100 5
    101—200 7
    201—300 8
    301—400 9
    401—500 11
    Tabela\(\PageIndex{6}\)

    Declare as hipóteses nulas e alternativas necessárias para realizar um teste de adequação e indique os graus de liberdade.

    Exemplo\(\PageIndex{5}\)

    Os empregadores querem saber em quais dias da semana os funcionários estão ausentes em uma semana de trabalho de cinco dias. A maioria dos empregadores gostaria de acreditar que os funcionários estão ausentes igualmente durante a semana. Suponha que uma amostra aleatória de 60 gerentes tenha sido questionada em qual dia da semana eles tiveram o maior número de ausências de funcionários. Os resultados foram distribuídos conforme a Tabela\(\PageIndex{7}\). Para a população de funcionários, os dias para o maior número de ausências ocorrem com frequências iguais durante uma semana de trabalho de cinco dias? Teste em um nível de significância de 5%.

    \ (\ PageIndex {7}\) Dia da semana, os funcionários estavam mais ausentes “>
    Segunda-feira terça Quarta-feira Quinta-feira Sexta-feira
    Número de ausências 15 12 9 9 15
    Tabela\(\PageIndex{7}\) Dia da Semana Os funcionários estavam mais ausentes
    Responda

    Solução 11.5

    As hipóteses nula e alternativa são:

    • \(H_0\): Os dias ausentes ocorrem com frequências iguais, ou seja, eles se encaixam em uma distribuição uniforme.
    • \(H_a\): Os dias ausentes ocorrem com frequências desiguais, ou seja, não se encaixam em uma distribuição uniforme.

    Se os dias ausentes ocorrerem com frequências iguais, então, dos 60 dias ausentes (o total na amostra:\(15 + 12 + 9 + 9 + 15 = 60\)), haveria 12 ausências na segunda-feira, 12 na terça, 12 na quarta-feira, 12 na quinta-feira e 12 na sexta-feira. Esses números são os valores esperados (\(E\)). Os valores na tabela são os valores ou dados observados (\(O\)).

    Desta vez, calcule a estatística do teste\ chi2 manualmente. Faça um gráfico com os seguintes títulos e preencha as colunas:

    • Valores esperados (\(E\))\((12, 12, 12, 12, 12)\)
    • Valores observados (\(O\))\((15, 12, 9, 9, 15)\)
    • \((O – E)\)
    • \((O – E)^2\)
    • \(\frac{(O-E)^{2}}{E}\)

    Agora adicione (some) a última coluna. A soma é três. Essa é a estatística do\(\chi^2\) teste.

    A estatística de teste calculada é 3 e o valor crítico da\(\chi^2\) distribuição em 4 graus de liberdade, o nível de confiança de 0,05, é 9,48. Esse valor é encontrado na\(\chi^2\) tabela na coluna 0,05 na linha 4 de graus de liberdade.

    \(\text{The degrees of freedom are the number of cells }– 1 = 5 – 1 = 4\)

    Em seguida, complete um gráfico como o seguinte com o rótulo e o sombreamento adequados. (Você deve sombrear a cauda direita.)

    Esta é uma curva qui-quadrada não simétrica em branco para a estatística de teste dos dias da semana ausentes.

    Figura\(\PageIndex{5}\)

    \[\bf{\chi}_{c}^{2}=\sum_{k} \frac{(O-E)^{2}}{E}=3\nonumber\]

    A decisão é não rejeitar a hipótese nula porque o valor calculado da estatística de teste não está na cauda da distribuição.

    Conclusão: Em um nível de significância de 5%, a partir dos dados da amostra, não há evidências suficientes para concluir que os dias ausentes não ocorrem com frequências iguais.

    Exercício\(\PageIndex{5}\)

    Os professores querem saber em que noite da semana seus alunos estão fazendo a maior parte do dever de casa. A maioria dos professores acha que os alunos fazem o dever de casa da mesma forma durante a semana. Suponha que uma amostra aleatória de 56 alunos tenha sido questionada em qual noite da semana eles faziam mais trabalhos de casa. Os resultados foram distribuídos conforme a Tabela\(\PageIndex{8}\).

    \ (\ PageIndex {8}\) “>
    domingo Segunda-feira terça Quarta-feira Quinta-feira Sexta-feira sábado
    Número de estudantes 11 8 10 7 10 5 5
    Tabela\(\PageIndex{8}\)

    Da população de estudantes, as noites para o maior número de estudantes que fazem a maioria dos seus deveres de casa ocorrem com frequências iguais durante uma semana? Que tipo de teste de hipótese você deve usar?

    Exemplo\(\PageIndex{6}\)

    Um estudo indica que o número de televisores que as famílias americanas têm é distribuído (esta é a distribuição dada para a população americana) como na Tabela\(\PageIndex{9}\).

    \ (\ PageIndex {9}\) “>
    Número de televisores Porcentagem
    0 10
    1 16
    2 55
    3 11
    4+ 8
    Tabela\(\PageIndex{9}\)

    A tabela contém porcentagens esperadas (\(E\)).

    Uma amostra aleatória de 600 famílias no extremo oeste dos Estados Unidos resultou nos dados da Tabela\(\PageIndex{10}\).

    \ (\ PageIndex {10}\) “>
    Número de televisores Frequência
    Total = 600
    0 66
    1 119
    2 340
    3 60
    4+ 15
    Tabela\(\PageIndex{10}\)

    A tabela contém valores de frequência observados (\(O\)).

    No nível de significância de 1%, parece que a distribuição “número de televisores” das famílias do extremo oeste dos Estados Unidos é diferente da distribuição para a população americana como um todo?

    Responda

    Solução 11.6

    Esse problema pede que você teste se a distribuição de famílias do extremo oeste dos Estados Unidos se encaixa na distribuição das famílias americanas. Esse teste é sempre com cauda direita.

    A primeira tabela contém as porcentagens esperadas. Para obter as frequências (E) esperadas, multiplique a porcentagem por 600. As frequências esperadas são mostradas na Tabela\(\PageIndex{11}\).

    \ (\ PageIndex {11}\) “>
    Número de televisores Porcentagem Frequência esperada
    0 10 (0,10) (600) = 60
    1 16 (0,16) (600) = 96
    2 55 (0,55) (600) = 330
    3 11 (0,11) (600) = 66
    mais de 3 8 (0,08) (600) = 48
    Tabela\(\PageIndex{11}\)

    Portanto, as frequências esperadas são 60, 96, 330, 66 e 48.

    \(H_0\): A distribuição do “número de televisores” das famílias do extremo oeste dos Estados Unidos é a mesma que a distribuição do “número de televisores” da população americana.

    \(H_a\): A distribuição do “número de televisores” das famílias do extremo oeste dos Estados Unidos é diferente da distribuição do “número de televisores” da população americana.

    Distribuição para o teste:\(\chi_{4}^{2} \text { where } d f=(\text { the number of cells })-1=5-1=4\).

    Calcule a estatística do teste:\(\chi^2 = 29.65\)

    Gráfico:

    Essa é uma curva qui-quadrada não simétrica com valores de 0, 4 e 29,65 marcados no eixo horizontal. O valor 4 coincide com o pico da curva. Uma linha vertical ascendente se estende de 29,65 até a curva, e a região à direita dessa linha está sombreada. A área sombreada é igual ao valor p.
    Figura\(\PageIndex{6}\)

    O gráfico do Qui-quadrado mostra a distribuição e marca o valor crítico com quatro graus de liberdade no nível de confiança de 99%, α = 0,01, 13,277. O gráfico também marca a estatística calculada do teste de qui-quadrado de 29,65. Comparando a estatística do teste com o valor crítico, como fizemos com todos os outros testes de hipóteses, chegamos à conclusão.

    Tome uma decisão: como a estatística de teste está na cauda da distribuição, não podemos aceitar a hipótese nula.

    Isso significa que você rejeita a crença de que a distribuição para os estados do extremo oeste é a mesma da população americana como um todo.

    Conclusão: No nível de significância de 1%, a partir dos dados, há evidências suficientes para concluir que a distribuição do “número de televisores” para o extremo oeste dos Estados Unidos é diferente da distribuição do “número de televisores” para a população americana como um todo.

    Exercício\(\PageIndex{6}\)

    A porcentagem esperada do número de animais de estimação que os estudantes têm em suas casas é distribuída (esta é a distribuição dada para a população estudantil dos Estados Unidos) conforme a Tabela\(\PageIndex{12}\).

    \ (\ PageIndex {12}\) “>
    Número de animais de estimação Porcentagem
    0 18
    1 25
    2 30
    3 18
    4+ 9
    Tabela\(\PageIndex{12}\)

    Uma amostra aleatória de 1.000 estudantes do leste dos Estados Unidos resultou nos dados da Tabela\(\PageIndex{13}\).

    \ (\ PageIndex {13}\) “>
    Número de animais de estimação Frequência
    0 210
    1 240
    2 320
    3 140
    4+ 90
    Tabela\(\PageIndex{13}\)

    No nível de significância de 1%, parece que a distribuição “número de animais de estimação” dos estudantes no leste dos Estados Unidos é diferente da distribuição da população estudantil dos Estados Unidos como um todo?

    Exemplo\(\PageIndex{7}\)

    Suponha que você jogue duas moedas 100 vezes. Os resultados são\(20 HH, 27 HT, 30 TH\),\(23 TT\) e. As moedas são justas? Teste em um nível de significância de 5%.

    Responda

    Solução 11.7

    Esse problema pode ser configurado como um problema de adequação. O espaço de amostra para lançar duas moedas justas é\(\{HH, HT, TH, TT\}\). De 100 voltas, você esperaria 25\(HH, 25 HT, 25 TH\),\(25 TT\) e. Essa é a distribuição esperada da distribuição de probabilidade binomial. A pergunta: “As moedas são justas?” é o mesmo que dizer: “A distribuição das moedas\((20 HH, 27 HT, 30 TH, 23 TT)\) se encaixa na distribuição esperada?”

    Variável aleatória: Seja\(X\) = o número de cabeças em uma jogada das duas moedas. X assume os valores 0, 1, 2. (Há 0, 1 ou 2 cabeças no lançamento de duas moedas.) Portanto, o número de células é três. Como\(X\) = o número de cabeças, as frequências observadas são 20 (para duas cabeças), 57 (para uma cabeça) e 23 (para zero cabeças ou ambas as caudas). As frequências esperadas são 25 (para duas cabeças), 50 (para uma cabeça) e 25 (para zero cabeças ou ambas as caudas). Este teste tem cauda direita.

    \(\bf{H_0}\): As moedas são justas.

    \(\bf{H_a}\): As moedas não são justas.

    Distribuição para o teste:\(\chi_2^2\) onde\(df = 3 – 1 = 2\).

    Calcule a estatística do teste:\(\chi^2 = 2.14\).

    Gráfico:

    Esta é uma curva qui-quadrada não simétrica com valores de 0 e 2,14 marcados no eixo horizontal. Uma linha vertical ascendente se estende de 2,14 até a curva e a região à direita dessa linha está sombreada. A área sombreada é igual ao valor p.
    Figura\(\PageIndex{7}\)

    O gráfico do Qui-quadrado mostra a distribuição e marca o valor crítico com dois graus de liberdade no nível de confiança de 95%\(\alpha = 0.05\), 5,991. O gráfico também marca a estatística\(\chi^2\) de teste calculada de 2,14. Comparando a estatística do teste com o valor crítico, como fizemos com todos os outros testes de hipóteses, chegamos à conclusão.

    Conclusão: Não há evidências suficientes para concluir que as moedas não são justas: não podemos rejeitar a hipótese nula de que as moedas são justas.