Skip to main content
Global

11.3: Teste de adequação

  • Page ID
    189970
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Nesse tipo de teste de hipótese, você determina se os dados “se encaixam” em uma distribuição específica ou não. Por exemplo, você pode suspeitar que seus dados desconhecidos se encaixam em uma distribuição binomial. Você usa um teste de qui-quadrado (o que significa que a distribuição para o teste de hipótese é qui-quadrado) para determinar se há um ajuste ou não. As hipóteses nulas e alternativas para esse teste podem ser escritas em frases ou podem ser declaradas como equações ou desigualdades.

    A estatística de teste para um teste de adequação é:

    \[\sum_k \frac{(O - E)^{2}}{E}\]

    onde:

    • \(O =\)valores observados (dados)
    • \(E =\)valores esperados (da teoria)
    • \(k =\)o número de células ou categorias de dados diferentes

    Os valores observados são os valores dos dados e os valores esperados são os valores que você esperaria obter se a hipótese nula fosse verdadeira. Existem\(n\) termos do formulário\(\frac{(O - E)^{2}}{E}\).

    O número de graus de liberdade é\(df = (\text{number of categories} - 1)\).

    O teste de adequação quase sempre tem a cauda direita. Se os valores observados e os valores esperados correspondentes não estiverem próximos um do outro, a estatística de teste poderá ficar muito grande e ficará bem na extremidade direita da curva qui-quadrada.

    O valor esperado para cada célula precisa ser pelo menos cinco para que você possa usar esse teste.

    Exemplo 11.3.1

    O absenteísmo de estudantes universitários nas aulas de matemática é uma grande preocupação para os professores de matemática, pois a falta às aulas parece aumentar a taxa de redução. Suponha que um estudo tenha sido feito para determinar se a taxa real de absenteísmo do aluno segue a percepção do corpo docente. O corpo docente esperava que um grupo de 100 alunos faltasse às aulas, de acordo com a tabela abaixo.

    Número de ausências por período Número esperado de estudantes
    0—2 50
    3—5 30
    6—8 12
    9—11 6
    12+ 2

    Uma pesquisa aleatória em todos os cursos de matemática foi então feita para determinar o número real (observado) de ausências em um curso. O gráfico na tabela abaixo mostra os resultados dessa pesquisa.

    Número de ausências por período Número real de estudantes
    0—2 35
    3—5 40
    6—8 20
    9—11 1
    12+ 4

    Determine as hipóteses nulas e alternativas necessárias para realizar um teste de adequação.

    • \(H_{0}\): O absenteísmo estudantil se encaixa na percepção dos professores
    A hipótese alternativa é o oposto da hipótese nula.
    • \(H_{a}\): O absentismo estudantil não se encaixa na percepção do corpo docente.

    Exercício\(\PageIndex{1}\).1

    a. Você pode usar as informações que aparecem nos gráficos para realizar o teste de adequação?

    Responda

    a. Não. Observe que o número esperado de ausências para a entrada “12+” é menor que cinco (são dois). Combine esse grupo com o grupo “9—11" para criar novas tabelas em que o número de alunos para cada inscrição seja de pelo menos cinco. Os novos resultados estão na tabela abaixo.

    Número de ausências por período Número esperado de estudantes
    0—2 50
    3—5 30
    6—8 12
    9+ 8
    Número de ausências por período Número real de estudantes
    0—2 35
    3—5 40
    6—8 20
    9+ 5

    Exercício\(\PageIndex{1}\).2

    b. Qual é o número de graus de liberdade (\(df\))?

    Responda

    b. Há quatro “células” ou categorias em cada uma das novas tabelas.

    \(df = \text{number of cells} - 1 = 4 - 1 = 3\)

    Exercício\(\PageIndex{1}\)

    Um gerente de fábrica precisa entender quantos produtos estão com defeito versus quantos são produzidos. O número de defeitos esperados está listado na tabela abaixo.

    Número produzido Número com defeito
    0—100 5
    101—200 6
    201—300 7
    301—400 8
    401—500 10

    Uma amostra aleatória foi coletada para determinar o número real de defeitos. A tabela abaixo mostra os resultados da pesquisa.

    Número produzido Número com defeito
    0—100 5
    101—200 7
    201—300 8
    301—400 9
    401—500 11

    Declare as hipóteses nulas e alternativas necessárias para realizar um teste de adequação e indique os graus de liberdade.

    Responda

    \(H_{0}\): O número de defeitos atende às expectativas.

    \(H_{a}\): O número de defeitos não se encaixa nas expectativas.

    \(df = 4\)

    Exemplo 11.3.2

    Os empregadores querem saber em quais dias da semana os funcionários estão ausentes em uma semana de trabalho de cinco dias. A maioria dos empregadores gostaria de acreditar que os funcionários estão ausentes igualmente durante a semana. Suponha que uma amostra aleatória de 60 gerentes tenha sido questionada em qual dia da semana eles tiveram o maior número de ausências de funcionários. Os resultados foram distribuídos conforme a tabela abaixo. Para a população de funcionários, os dias para o maior número de ausências ocorrem com frequências iguais durante uma semana de trabalho de cinco dias? Teste em um nível de significância de 5%.

    Dia da semana, os funcionários estavam mais ausentes
      Segunda-feira Terça-feira Quarta-feira Quinta-feira Sexta-feira
    Número de ausências 15 12 9 9 15

    Responda

    As hipóteses nula e alternativa são:

    • \(H_{0}\): Os dias ausentes ocorrem com frequências iguais, ou seja, eles se encaixam em uma distribuição uniforme.
    • \(H_{a}\): Os dias ausentes ocorrem com frequências desiguais, ou seja, não se encaixam em uma distribuição uniforme.

    Se os dias ausentes ocorrerem com frequências iguais, então, dos 60 dias ausentes (o total na amostra:\(15 + 12 + 9 + 9 + 15 = 60\)), haveria 12 ausências na segunda-feira, 12 na terça, 12 na quarta-feira, 12 na quinta-feira e 12 na sexta-feira. Esses números são os valores esperados (\(E\)). Os valores na tabela são os valores ou dados observados (\(O\)).

    Desta vez, calcule a estatística do\(\chi^{2}\) teste manualmente. Faça um gráfico com os seguintes títulos e preencha as colunas:

    • Valores esperados (\(E\))\((12, 12, 12, 12, 12)\)
    • Valores observados (\(O\))\((15, 12, 9, 9, 15)\)
    • \((O – E)\)
    • \((O – E)^{2}\)
    • \(\frac{(O - E)^{2}}{E}\)

    Agora adicione (some) a última coluna. A soma é três. Essa é a estatística do\(\chi^{2}\) teste.

    Para encontrar o valor p, calcule\(P(\chi^{2} > 3)\). Este teste é de cauda direita. (Use um computador ou uma calculadora para encontrar o valor p. Você deve obter\(p\text{-value} = 0.5578\).)

    Eles\(dfs\) são os\(\text{number of cells} - 1 = 5 - 1 = 4\)

    Pressione 2nd DISTR. Seta para baixo até\(\chi^{2}\) cdf. Pressione ENTER. Digite (3,10^99,4). Arredondado para quatro casas decimais, você deve ver 0,5578, que é\(p\text{-value}\) o.

    Em seguida, complete um gráfico como o seguinte com o rótulo e o sombreamento adequados. (Você deve sombrear a cauda direita.)

    Esta é uma curva qui-quadrada não simétrica em branco para a estatística de teste dos dias da semana ausentes.
    Figura\(\PageIndex{1}\).

    A decisão é não rejeitar a hipótese nula.

    Conclusão: Em um nível de significância de 5%, a partir dos dados da amostra, não há evidências suficientes para concluir que os dias ausentes não ocorrem com frequências iguais.

    O TI-83+ e algumas calculadoras TI-84 não têm um programa especial para a estatística de teste para o teste de qualidade do ajuste. O próximo exemplo de exemplo tem as instruções da calculadora. As calculadoras TI-84 mais recentes têm em STAT TESTS o teste Chi2 GOF. Para executar o teste, coloque os valores observados (os dados) em uma primeira lista e os valores esperados (os valores que você espera se a hipótese nula for verdadeira) em uma segunda lista. Pressione STAT TESTS e Chi2 GOF. Insira os nomes das listas Observados e Esperados. Insira os graus de liberdade e pressione calcular ou desenhar. Certifique-se de limpar todas as listas antes de começar. Para limpar listas nas calculadoras: Vá para STAT EDIT e vá até a área do nome da lista específica. Pressione CLEAR e, em seguida, seta para baixo. A lista será apagada. Como alternativa, você pode pressionar STAT e pressionar 4 (para CLRlist). Insira o nome da lista e pressione ENTER.

     

    Exercício\(\PageIndex{2}\)

    Os professores querem saber em que noite da semana seus alunos estão fazendo a maior parte do dever de casa. A maioria dos professores acha que os alunos fazem o dever de casa da mesma forma durante a semana. Suponha que uma amostra aleatória de 49 estudantes tenha sido questionada em qual noite da semana eles faziam mais trabalhos de casa. Os resultados foram distribuídos conforme a tabela abaixo.

      domingo Segunda-feira Terça-feira Quarta-feira Quinta-feira Sexta-feira Sábado
    Número de estudantes 11 8 10 7 10 5 5

    Da população de estudantes, as noites para o maior número de estudantes que fazem a maioria dos seus deveres de casa ocorrem com frequências iguais durante uma semana? Que tipo de teste de hipótese você deve usar?

    Responda

    \(df = 6\)

    \(p\text{-value} = 0.6093\)

    Nós nos recusamos a rejeitar a hipótese nula. Não há evidências suficientes para afirmar que os alunos não fazem a maior parte do dever de casa da mesma forma durante a semana.

    Exemplo 11.3.3

    Um estudo indica que o número de televisores que as famílias americanas têm é distribuído (essa é a distribuição dada para a população americana) conforme a tabela abaixo.

    Número de televisores Porcentagem
    0 10
    1 16
    2 55
    3 11
    4+ 8

    A tabela contém porcentagens esperadas (\(E\)).

    Uma amostra aleatória de 600 famílias no extremo oeste dos Estados Unidos resultou nos dados da tabela abaixo.

    Número de televisores Frequência
      Total = 600
    0 66
    1 119
    2 340
    3 60
    4+ 15

    A tabela contém valores de frequência observados (\(O\)).

    Exercício\(\PageIndex{3}\).1

    No nível de significância de 1%, parece que a distribuição “número de televisores” das famílias do extremo oeste dos Estados Unidos é diferente da distribuição para a população americana como um todo?

    Responda

    Esse problema pede que você teste se a distribuição de famílias do extremo oeste dos Estados Unidos se encaixa na distribuição das famílias americanas. Esse teste é sempre com cauda direita.

    A primeira tabela contém as porcentagens esperadas. Para obter as frequências (E) esperadas, multiplique a porcentagem por 600. As frequências esperadas são mostradas na tabela abaixo.

    Número de televisores Porcentagem Frequência esperada
    0 10 (0,10) (600) = 60
    1 16 (0,16) (600) = 96
    2 55 (0,55) (600) = 330
    3 11 (0,11) (600) = 66
    mais de 3 8 (0,08) (600) = 48

    Portanto, as frequências esperadas são 60, 96, 330, 66 e 48. Nas calculadoras de TI, você pode deixar a calculadora fazer as contas. Por exemplo, em vez de 60, insira\(0.10*600\).

    \(H_{0}\): A distribuição do “número de televisores” das famílias do extremo oeste dos Estados Unidos é a mesma que a distribuição do “número de televisores” da população americana.

    \(H_{a}\): A distribuição do “número de televisores” das famílias do extremo oeste dos Estados Unidos é diferente da distribuição do “número de televisores” da população americana.

    Distribuição para o teste:\(\chi^{2}_{4}\) onde\(df = (\text{the number of cells}) - 1 = 5 - 1 = 4\).

    Nota 11.3.3.1

    \(df \neq 600 - 1\)

    Calcule a estatística do teste:\(\chi^{2} = 29.65\)

    Gráfico:

    Essa é uma curva qui-quadrada não simétrica com valores de 0, 4 e 29,65 marcados no eixo horizontal. O valor 4 coincide com o pico da curva. Uma linha vertical ascendente se estende de 29,65 até a curva, e a região à direita dessa linha está sombreada. A área sombreada é igual ao valor p.
    Figura\(\PageIndex{2}\).

    Declaração de probabilidade:\(p\text{-value} = P(\chi^{2} > 29.65) = 0.000006\)

    Compare α e o valor p:

    \(\alpha = 0.01\)

    \(p\text{-value} = 0.000006\)

    Então,\(\alpha > p\text{-value}\).

    Tome uma decisão: desde então\(\alpha > p\text{-value}\), rejeite\(H_{0}\).

    Isso significa que você rejeita a crença de que a distribuição para os estados do extremo oeste é a mesma da população americana como um todo.

    Conclusão: No nível de significância de 1%, a partir dos dados, há evidências suficientes para concluir que a distribuição do “número de televisores” para o extremo oeste dos Estados Unidos é diferente da distribuição do “número de televisores” para a população americana como um todo.

    Pressione STAT e ENTER. Certifique-se de limpar as listas L1, L2 e L3 se elas tiverem dados nelas (veja a nota no final do Exemplo). Em L1, coloque as frequências observadas 66, 119, 349, 60, 15. Em L2, coloque as frequências esperadas .10*600, .16*600, .55*600, .11*600, .08*600. Seta até a lista L3 e até a área de nome “L3". Insira (L1-L2) ^2/L2 e ENTER. Pressione o 2º QUIT. Pressione 2ª LISTA e flecha até MATH. Pressione 5. Você deve ver “soma” (Digite L3). Arredondado para 2 casas decimais, você deve ver 29,65. Pressione 2nd DISTR. Pressione 7 ou a seta para baixo até 7:÷ 2cdf e pressione ENTER. Digite (29,65, E99, 4). Arredondado para quatro casas, você deve ver 5,77E-6 = 0,000006 (arredondado para seis casas decimais), que é o valor p.

    As calculadoras TI-84 mais recentes têm em STAT TESTS o teste Chi2 GOF. Para executar o teste, coloque os valores observados (os dados) em uma primeira lista e os valores esperados (os valores que você espera se a hipótese nula for verdadeira) em uma segunda lista. Pressione STAT TESTS e Chi2 GOF. Insira os nomes das listas Observados e Esperados. Insira os graus de liberdade e pressione calcular ou desenhar. Certifique-se de limpar todas as listas antes de começar.

    Exercício\(\PageIndex{3}\)

    A porcentagem esperada do número de animais de estimação que os estudantes têm em suas casas é distribuída (esta é a distribuição dada para a população estudantil dos Estados Unidos) conforme a tabela abaixo.

    Número de animais de estimação Porcentagem
    0 18
    1 25
    2 30
    3 18
    4+ 9

    Uma amostra aleatória de 1.000 estudantes do leste dos Estados Unidos resultou nos dados da tabela abaixo.

    Número de animais de estimação Frequência
    0 210
    1 240
    2 320
    3 140
    4+ 90

    No nível de significância de 1%, parece que a distribuição “número de animais de estimação” dos estudantes no leste dos Estados Unidos é diferente da distribuição da população estudantil dos Estados Unidos como um todo? O que é o\(p\text{-value}\)?

    Responda

    \(p\text{-value} = 0.0036\)

    Rejeitamos a hipótese nula de que as distribuições são as mesmas. Há evidências suficientes para concluir que a distribuição do “número de animais de estimação” dos estudantes no leste dos Estados Unidos é diferente da distribuição da população estudantil dos Estados Unidos como um todo.

    Exemplo 11.3.4

    Suponha que você jogue duas moedas 100 vezes. Os resultados são 20 HH, 27 HT, 30 TH e 23 TT. As moedas são justas? Teste em um nível de significância de 5%.

    Responda

    Esse problema pode ser configurado como um problema de adequação. O espaço de amostra para lançar duas moedas justas é\({HH, HT, TH, TT}\). De 100 voltas, você esperaria 25 HH, 25 HT, 25 TH e 25 TT. Essa é a distribuição esperada. A pergunta: “As moedas são justas?” é o mesmo que dizer: “A distribuição das moedas (\(20 HH, 27 HT, 30 TH, 23 TT\)) se encaixa na distribuição esperada?”

    Variável aleatória: Deixe\(X =\) o número de cabeças em uma jogada das duas moedas. \(X\)assume os valores 0, 1, 2. (Há 0, 1 ou 2 cabeças no lançamento de duas moedas.) Portanto, o número de células é três. Como\(X =\) o número de cabeças, as frequências observadas são 20 (para duas cabeças), 57 (para uma cabeça) e 23 (para zero cabeças ou ambas as caudas). As frequências esperadas são 25 (para duas cabeças), 50 (para uma cabeça) e 25 (para zero cabeças ou ambas as caudas). Este teste é de cauda direita.

    \(H_{0}\): As moedas são justas.

    \(H_{a}\): As moedas não são justas.

    Distribuição para o teste:\(\chi^{2}_{2}\) onde\(df = 3 - 1 = 2\).

    Calcule a estatística do teste:\(\chi^{2} = 2.14\)

    Gráfico:

    Esta é uma curva qui-quadrada não simétrica com valores de 0 e 2,14 marcados no eixo horizontal. Uma linha vertical ascendente se estende de 2,14 até a curva e a região à direita dessa linha está sombreada. A área sombreada é igual ao valor p.
    Figura\(\PageIndex{3}\).

    Declaração de probabilidade:\(p\text{-value} = P(\chi^{2} > 2.14) = 0.3430\)

    Compare α e o valor p:

    \(\alpha = 0.05\)

    \(p\text{-value} = 0.3430\)

    \(\alpha < p\text{-value}\).

    Tome uma decisão: desde então\(\alpha < p\text{-value}\), não rejeite\(H_{0}\).

    Conclusão: Não há evidências suficientes para concluir que as moedas não são justas.

    Pressione STAT e ENTER. Certifique-se de limpar as listas L1, L2 e L3 se elas tiverem dados nelas. Em L1, coloque as frequências observadas 20, 57, 23. Em L2, coloque as frequências esperadas 25, 50, 25. Seta até a lista L3 e até a área de nome “L3". Insira (L1-L2) ^2/L2 e ENTER. Pressione o 2º QUIT. Pressione 2ª LISTA e flecha até MATH. Pressione 5. Você deve ver “soma”. Digite L3. Arredondado para duas casas decimais, você deve ver 2,14. Pressione 2nd DISTR. Seta para baixo até 7:÷ 2cdf (ou pressione 7). Pressione ENTER. Insira 2.14,1E99,2). Arredondado para quatro lugares, você deve ver .3430, que é o valor p.

    As calculadoras TI-84 mais recentes têm em STAT TESTS o teste Chi2 GOF. Para executar o teste, coloque os valores observados (os dados) em uma primeira lista e os valores esperados (os valores que você espera se a hipótese nula for verdadeira) em uma segunda lista. Pressione STAT TESTS e Chi2 GOF. Insira os nomes das listas Observados e Esperados. Insira os graus de liberdade e pressione calcular ou desenhar. Certifique-se de limpar todas as listas antes de começar.

     

    Exercício\(\PageIndex{4}\)

    Estudantes em uma aula de estudos sociais levantam a hipótese de que as taxas de alfabetização em todo o mundo para todas as regiões são de 82%. A tabela abaixo mostra as taxas reais de alfabetização em todo o mundo, divididas por região. Quais são as estatísticas do teste e os graus de liberdade?

    Região MDG Taxa de alfabetização de adultos (%)
    Regiões desenvolvidas 99,0
    Comunidade dos Estados Independentes 99,5
    Norte da África 67,3
    África Subsaariana 62,5
    América Latina e Caribe 91,0
    Ásia Oriental 93,8
    Ásia meridional 61,9
    Sudeste Asiático 91,9
    Ásia Ocidental 84,5
    Oceania 66,4

    Responda

    \(df = 9\)

    \(\chi^{2} \text{ test statistic} = 26.38\)

    Esta é uma curva qui-quadrada não simétrica com df = 9. Os valores 0, 9 e 26,38 são rotulados no eixo horizontal. O valor 9 coincide com o pico da curva. Uma linha vertical ascendente se estende de 26,38 até a curva, e a região à direita dessa linha está sombreada. A área sombreada é igual ao valor p.
    Figura\(\PageIndex{4}\).

    Pressione STAT e ENTER. Certifique-se de limpar as listas L1, L2 e L3 se elas tiverem dados nelas. Em L1, coloque as frequências observadas 99, 99,5, 67,3, 62,5, 91, 93,8, 61,9, 91,9, 84,5, 66,4. Em L2, coloque as frequências esperadas 82, 82, 82, 82, 82, 82, 82, 82, 82, 82, 82. Seta até a lista L3 e até a área de nome “L3". Insira (L1-L2) ^2/L2 e ENTER. Pressione o 2º QUIT. Pressione 2ª LISTA e flecha até MATH. Pressione 5. Você deve ver “soma”. Digite L3. Arredondado para duas casas decimais, você deve ver 26,38. Pressione 2nd DISTR. Seta para baixo até 7:÷ 2cdf (ou pressione 7). Pressione ENTER. Digite 26.38,1E99,9). Arredondado para quatro lugares, você deve ver 0,0018, que é o valor p.

    As calculadoras TI-84 mais recentes têm em STAT TESTS o teste Chi2 GOF. Para executar o teste, coloque os valores observados (os dados) em uma primeira lista e os valores esperados (os valores que você espera se a hipótese nula for verdadeira) em uma segunda lista. Pressione STAT TESTS e Chi2 GOF. Insira os nomes das listas Observados e Esperados. Insira os graus de liberdade e pressione calcular ou desenhar. Certifique-se de limpar todas as listas antes de começar.

    Referências

    1. Dados do Departamento de Censo dos EUA
    2. Dados do College Board. Disponível on-line em http://www.collegeboard.com.
    3. Dados do Departamento de Censo dos EUA, Current Population Reports.
    4. Ma, Y., E.R. Bertone, E.J. Stanek III, G.W. Reed, J.R. Hebert, N.L. Cohen, P.A. Merriam, I.S. Ockene, “Associação entre padrões alimentares e obesidade em uma população adulta americana de vida livre”. American Journal of Epidemiology, volume 158, nº 1, páginas 85-92.
    5. Ogden, Cynthia L., Margaret D. Carroll, Brian K. Kit, Katherine M. Flegal, “Prevalência da obesidade nos Estados Unidos, 2009—2010”. Resumo de dados do NCHS nº 82, janeiro de 2012. Disponível on-line em http://www.cdc.gov/nchs/data/databriefs/db82.pdf (acessado em 24 de maio de 2013).
    6. Stevens, Barbara J., “Pesquisa multifamiliar e comercial de resíduos sólidos e reciclagem”. Condado de Arlington, VA. Disponível on-line em www.arlingtonva.us/department... /file84429.pdf (acessado em 24 de maio de 2013).

    Revisão

    Para avaliar se um conjunto de dados se encaixa em uma distribuição específica, você pode aplicar o teste de hipótese de adequação que usa a distribuição qui-quadrado. A hipótese nula para esse teste afirma que os dados vêm da distribuição assumida. O teste compara os valores observados com os valores que você esperaria ter se seus dados seguissem a distribuição assumida. O teste é quase sempre com cauda direita. Cada observação ou categoria de célula deve ter um valor esperado de pelo menos cinco.

    Revisão da fórmula

    \(\sum_k \frac{(O - E)^{2}}{E}\)estatística de teste de qualidade de ajuste em que:

    \(O\): valores observados

    \(E\): valor esperado

    \(k\): número de células ou categorias de dados diferentes

    \(df = k - 1\)graus de liberdade

    Determine o teste apropriado a ser usado nos próximos três exercícios.

    Exercício\(\PageIndex{5}\)

    Uma arqueóloga está calculando a distribuição da frequência do número de artefatos que ela encontra em um local de escavação. Com base em escavações anteriores, o arqueólogo cria uma distribuição esperada dividida por seções da grade no local da escavação. Depois que o local foi totalmente escavado, ela compara o número real de artefatos encontrados em cada seção da grade para ver se sua expectativa era precisa.

    Exercício\(\PageIndex{6}\)

    Um economista está desenvolvendo um modelo para prever resultados no mercado de ações. Ele cria uma lista de pontos esperados no índice do mercado de ações para as próximas duas semanas. No final de cada dia de negociação, ele registra os pontos reais no índice. Ele quer ver o quão bem seu modelo combina com o que realmente aconteceu.

    Responda

    um teste de qualidade de ajuste

    Exercício\(\PageIndex{7}\)

    Uma personal trainer está montando um programa de levantamento de peso para seus clientes. Para um programa de 90 dias, ela espera que cada cliente levante um peso máximo específico a cada semana. À medida que avança, ela registra os pesos máximos reais que seus clientes levantaram. Ela quer saber o quão bem suas expectativas atenderam ao que foi observado.

    Use as seguintes informações para responder aos próximos cinco exercícios: Um professor prevê que a distribuição das notas no exame final será e elas estão registradas na tabela abaixo.

    Grau Proporção
    UMA 0,25
    B 0,30
    C 0,35
    D 0,10

    A distribuição real para uma classe de 20 está na tabela abaixo.

    Grau Frequência
    UMA 7
    B 7
    C 5
    D 1

    Exercício\(\PageIndex{8}\)

    \(df =\)______

    Responda

    3

    Exercício\(\PageIndex{9}\)

    Indique as hipóteses nulas e alternativas.

    Exercício\(\PageIndex{10}\)

    \(\chi^{2} \text{test statistic} =\)______

    Responda

    2.04

    Exercício\(\PageIndex{11}\)

    \(p\text{-value} =\)______

    Exercício\(\PageIndex{12}\)

    No nível de significância de 5%, o que você pode concluir?

    Responda

    Nós nos recusamos a rejeitar a hipótese nula. Não há evidências suficientes para sugerir que as pontuações dos testes observados sejam significativamente diferentes das pontuações esperadas.

    Use as informações a seguir para responder aos próximos nove exercícios: Os dados a seguir são reais. O número cumulativo de casos de AIDS relatados no Condado de Santa Clara é dividido por etnia, conforme a tabela abaixo.

    Etnia Número de casos
    Branco 2.229
    Hispânica 1.157
    Negro/afro-americano 457
    Asiático, das Ilhas do Pacífico 232
      Total = 4.075

    A porcentagem de cada grupo étnico no Condado de Santa Clara é a tabela abaixo.

    Etnia Porcentagem da população total do condado Número esperado (arredondado para duas casas decimais)
    Branco 42,9% 1748,18
    Hispânica 26,7%  
    Negro/afro-americano 2,6%  
    Asiático, das Ilhas do Pacífico 27,8%  
      Total = 100%

    Exercício\(\PageIndex{13}\)

    Se as etnias das vítimas da AIDS seguirem as etnias da população total do condado, preencha o número esperado de casos por grupo étnico.

    Faça um teste de adequação para determinar se a ocorrência de casos de AIDS segue as etnias da população geral do Condado de Santa Clara.

    Exercício\(\PageIndex{14}\)

    \(H_{0}\): _______

    Responda

    \(H_{0}\): a distribuição dos casos de AIDS segue as etnias da população geral do Condado de Santa Clara.

    Exercício\(\PageIndex{15}\)

    \(H_{a}\): _______

    Exercício\(\PageIndex{16}\)

    É um teste de cauda direita, cauda esquerda ou bicaudal?

    Responda

    de cauda direita

    Exercício\(\PageIndex{17}\)

    graus de liberdade = _______

    Exercício\(\PageIndex{18}\)

    \(\chi^{2} \text{test statistic}\)= _______

    Responda

    88.621

    Exercício\(\PageIndex{19}\)

    \(p\text{-value} =\)_______

    Exercício\(\PageIndex{20}\)

    Faça um gráfico da situação. Identifique e escale o eixo horizontal. Marque a média e teste a estatística. Sombra na região correspondente ao\(p\text{-value}\).

    Este é um modelo gráfico em branco. Os eixos vertical e horizontal não estão identificados.
    Figura\(\PageIndex{5}\).

    Deixe\(\alpha = 0.05\)

    Decisão: ________________

    Motivo da decisão: ________________

    Conclusão (escreva em frases completas): ________________

    Responda

    Gráfico: Verifique a solução do aluno.

    Decisão: Rejeite a hipótese nula.

    Motivo da decisão:\(p\text{-value} < \alpha\)

    Conclusão (escreva em frases completas): A composição dos casos de AIDS não se encaixa nas etnias da população geral do Condado de Santa Clara.

    Exercício\(\PageIndex{21}\)

    Parece que o padrão de casos de AIDS no Condado de Santa Clara corresponde à distribuição dos grupos étnicos nesse condado? Por que ou por que não?