Skip to main content
Global

3.5: Tabelas de contingência

  • Page ID
    190066
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Uma tabela de contingência fornece uma forma de retratar dados que pode facilitar o cálculo de probabilidades. A tabela ajuda a determinar as probabilidades condicionais com bastante facilidade. A tabela exibe valores de amostra em relação a duas variáveis diferentes que podem ser dependentes ou dependentes uma da outra. Posteriormente, usaremos as tabelas de contingência novamente, mas de outra forma.

    Exemplo\(\PageIndex{1}\)

    Suponha que um estudo sobre violações de velocidade e motoristas que usam telefones celulares tenha produzido os seguintes dados fictícios:

      Violação por excesso de velocidade no último ano Nenhuma violação de velocidade no último ano Total
    Usuário de telefone celular 25 280 305
    Não é usuário de celular 45 405 450
    Total 70 685 755

    O número total de pessoas na amostra é 755. Os totais das linhas são 305 e 450. Os totais das colunas são 70 e 685. Observe que 305 + 450 = 755 e 70 + 685 = 755.

    Calcule as seguintes probabilidades usando a tabela.

    1. Encontre\(P(\text{Person is a cell phone user})\).
    2. Encontre\(P(\text{person had no violation in the last year})\).
    3. Encontre\(P(\text{Person had no violation in the last year AND was a cell phone user})\).
    4. Encontre\(P(\text{Person is a cell phone user OR person had no violation in the last year})\).
    5. Encontre\(P(\text{Person is a cell phone user GIVEN person had a violation in the last year})\).
    6. Encontre\(P(\text{Person had no violation last year GIVEN person was not a cell phone user})\)

    Responda

    1. \(\dfrac{\text{number of cell phone users}}{\text{total number in study}}\)=\(\dfrac{305}{755}\)
    2. \(\dfrac{\text{number that had no violation}}{\text{total number in study}} = \dfrac{685}{755}\)
    3. \(\dfrac{280}{755}\)
    4. \(\left(\dfrac{305}{755} + \dfrac{685}{755}\right) - \dfrac{280}{755} = \dfrac{710}{755}\)
    5. \(\dfrac{25}{70}\)(O espaço da amostra é reduzido ao número de pessoas que cometeram uma violação.)
    6. \(\dfrac{405}{450}\)(O espaço da amostra é reduzido ao número de pessoas que não eram usuários de telefones celulares.)

    Exercício\(\PageIndex{1}\)

    A tabela mostra o número de atletas que se alongam antes do exercício e quantos sofreram lesões no último ano.

      Lesão no ano passado Nenhuma lesão no ano passado Total
    Alongamentos 55 295 350
    Não estica 231 219 450
    Total 286 514 800
    1. O que é\(P(\text{athlete stretches before exercising})\)?
    2. O que é\(P(\text{athlete stretches before exercising|no injury in the last year})\)?

    Responda

    1. \(P(\text{athlete stretches before exercising}) = \dfrac{350}{800} = 0.4375\)
    2. \(P(\text{athlete stretches before exercising|no injury in the last year}) = \dfrac{295}{514} = 0.5739\)

    Exemplo\(\PageIndex{2}\)

    A tabela mostra uma amostra aleatória de 100 caminhantes e as áreas de caminhada que eles preferem.

    Preferência de área para caminhadas
    Sexo O litoral Perto de lagos e riachos Nos picos das montanhas Total
    Feminino 18 16 ___ 45
    Masculino ___ ___ 14 55
    Total ___ 41 ___ ___
    1. Complete a tabela.
    2. Os eventos “ser feminino” e “preferir o litoral” são eventos independentes? Seja F = ser mulher e C = preferindo o litoral.
      1. Encontre P (F E C).
      2. Encontre P (F) P (C)
      3. Esses dois números são iguais? Se forem, então F e C são independentes. Se não forem, então F e C não são independentes.
    3. Descubra a probabilidade de uma pessoa ser do sexo masculino, já que prefere caminhar perto de lagos e riachos. Deixe\(\text{M} =\) ser homem, e deixe\(\text{L} =\) preferir caminhar perto de lagos e riachos.
      1. Que palavra diz que isso é condicional?
      2. Preencha os espaços em branco e calcule a probabilidade:\(P\) (___|___) = ___.
      3. O espaço amostral para este problema é para todos os 100 caminhantes? Se não, o que é?
    4. Descubra a probabilidade de uma pessoa ser mulher ou preferir caminhar nos picos das montanhas. Deixe\(\text{F} =\) ser mulher, e deixe\(\text{P} =\) preferir picos de montanhas.
      1. Encontre\(P(\text{F})\).
      2. Encontre\(P(\text{P})\).
      3. Encontre\(P(\text{F AND P})\).
      4. Encontre\(P(\text{F OR P})\).

    Resposta s

    uma.

    Preferência de área para caminhadas
    Gênero O litoral Perto de lagos e riachos Nos picos das montanhas Total
    Feminino 18 16 11 45
    Masculino 16 25 14 55
    Total 34

    41

    25 100

    b.

    \(P(\text{F AND C}) = \dfrac{18}{100} = 0.18\)

    \(P(\text{F})P(\text{C}) = \left(\dfrac{45}{100}\right) \left(\dfrac{34}{100}\right) = (0.45)(0.34) = 0.153\)

    \(P(\text{F AND C}) \neq P(\text{F})P(\text{C})\), então os eventos\(\text{F}\) e não\(\text{C}\) são independentes.

    c.

    1. A palavra “dado” diz que isso é condicional.
    2. \(P(\text{M|L}) = \dfrac{25}{41}\)
    3. Não, o espaço amostral para esse problema são os 41 caminhantes que preferem lagos e riachos.

    d.

    1. Encontre\(P(\text{F})\).
    2. Encontre\(P(\text{P})\).
    3. Encontre\(P(\text{F AND P})\).
    4. Encontre\(P(\text{F OR P})\).

    d.

    1. \(P(\text{F}) = \dfrac{45}{100}\)
    2. \(P(\text{P}) = \dfrac{25}{100}\)
    3. \(P(\text{F AND P}) = \dfrac{11}{100}\)
    4. \(P(\text{F OR P}) = \dfrac{45}{100} + \dfrac{25}{100} - \dfrac{11}{100} = \dfrac{59}{100}\)

    Exercício\(\PageIndex{2}\)

    A tabela mostra uma amostra aleatória de 200 ciclistas e as rotas que eles preferem. Deixe\(\text{M} =\) os machos e o caminho\(\text{H} =\) montanhoso.

    Gênero Caminho do Lago Caminho montanhoso Caminho arborizado Total
    Feminino 45 38 27 110
    Masculino 26 52 12 90
    Total 71 90 39 200
    1. Dos homens, qual é a probabilidade de o ciclista preferir um caminho montanhoso?
    2. Os eventos “ser masculino” e “preferir o caminho montanhoso” são eventos independentes?

    Responda

    1. P (H | M)\(\dfrac{52}{90}\) = 0,5778
    2. Para que M e H sejam independentes, mostre P (H | M) = P (H)
      P (H | M) = 0,5778, P (H)\(\dfrac{90}{200}\) = 0,45
      P (H | M) não é igual a P (H), então M e H NÃO são independentes.

    Exemplo\(\PageIndex{3}\)

    Muddy Mouse mora em uma gaiola com três portas. Se Muddy sair pela primeira porta, a probabilidade de ele ser pego pela gata Alissa é\(\dfrac{1}{5}\) e a probabilidade de ele não ser pego é\(\dfrac{4}{5}\). Se ele sair pela segunda porta, a probabilidade de ele ser pego por Alissa é\(\dfrac{1}{4}\) e a probabilidade de ele não ser pego é\(\dfrac{3}{4}\). A probabilidade de Alissa pegar Muddy saindo pela terceira porta é\(\dfrac{1}{2}\) e a probabilidade de ela não pegar Muddy é\(\dfrac{1}{2}\). É igualmente provável que Muddy escolha qualquer uma das três portas, então a probabilidade de escolher cada porta é\(\dfrac{1}{3}\).

    Escolha de porta
    Capturado ou não Porta Um Porta dois Porta três Total
    Capturado \(\dfrac{1}{15}\) \(\dfrac{1}{12}\) \(\dfrac{1}{6}\) ____
    Não foi pego \(\dfrac{4}{15}\) \(\dfrac{3}{12}\) \(\dfrac{1}{6}\) ____
    Total ____ ____ ____ 1
    • A primeira entrada\(\dfrac{1}{15} = \left(\dfrac{1}{5}\right) \left(\dfrac{1}{3}\right)\) é\(P(\text{Door One AND Caught})\)
    • A entrada\(\dfrac{4}{15} = \left(\dfrac{4}{5}\right) \left(\dfrac{1}{3}\right)\) é\(P(\text{Door One AND Not Caught})\)

    Verifique as entradas restantes.

    1. Preencha a tabela de contingência de probabilidade. Calcule as entradas para os totais. Verifique se a entrada do canto inferior direito é 1.
    2. Qual é a probabilidade de Alissa não pegar Muddy?
    3. Qual é a probabilidade de Muddy escolher a Porta Um OU a Porta Dois, já que Muddy foi pego por Alissa?

    Solução

    Escolha de porta
    Capturado ou não Porta Um Porta dois Porta três Total
    Capturado \(\dfrac{1}{15}\) \(\dfrac{1}{12}\) \(\dfrac{1}{6}\) \(\dfrac{19}{60}\)
    Não foi pego \(\dfrac{4}{15}\) \(\dfrac{3}{12}\) \(\dfrac{1}{6}\) \(\dfrac{41}{60}\)
    Total \(\dfrac{5}{15}\) \(\dfrac{4}{12}\) \(\dfrac{2}{6}\) 1

    b.\(\dfrac{41}{60}\)

    c.\(\dfrac{9}{19}\)

    Exemplo\(\PageIndex{4}\)

    A tabela contém o número de crimes por 100.000 habitantes de 2008 a 2011 nos EUA

    Taxas do índice de criminalidade dos Estados Unidos por 100.000 habitantes 2008—2011
    Ano Roubo Roubo Estupro Veículo Total
    2008 145,7 732,1 29,7 314,7  
    2009 13.1 717,7 29,1 259,2  
    2010 119,3 701 27,7 239,1  
    2011 13,7 702.2 26,8 229,6  
    Total          

    TOTAL de cada coluna e cada linha. Total de dados = 4.520,7

    1. Encontre\(P(\text{2009 AND Robbery})\).
    2. Encontre\(P(\text{2010 AND Burglary})\).
    3. Encontre\(P(\text{2010 OR Burglary})\).
    4. Encontre\(P(\text{2011|Rape})\).
    5. Encontre\(P(\text{Vehicle|2008})\).

    Responda

    a. 0,0294, b. 0,1551, c. 0,7165, d. 0,2365, e. 0,2575

    Exercício\(\PageIndex{3}\)

    A tabela relaciona os pesos e alturas de um grupo de indivíduos participantes de um estudo observacional.

    Peso/altura Alto Médio Curto Totais
    Obesa 18 28 14  
    Normal 20 51 28  
    Baixo peso 12 25 9  
    Totais        
    1. Encontre o total para cada linha e coluna
    2. Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja alto.
    3. Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja obeso e alto.
    4. Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja alto, já que o indivíduo é obeso.
    5. Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja obeso, já que o indivíduo é alto.
    6. Encontre a probabilidade de um indivíduo escolhido aleatoriamente desse grupo ser alto e com baixo peso.
    7. Os eventos Obese e Tall são independentes?

    Responda

    Peso/altura Alto Médio Curto Totais
    Obesa 18 28 14 60
    Normal 20 51 28 99
    Baixo peso 12 25 9 46
    Totais 50 104 51 205
    1. Totais de linha: 60, 99, 46. Totais das colunas: 50, 104, 51.
    2. \(P(\text{Tall}) = \dfrac{50}{205} = 0.244\)
    3. \(P(\text{Obese AND Tall}) = \dfrac{18}{205} = 0.088\)
    4. \(P(\text{Tall|Obese}) = \dfrac{18}{60} = 0.3\)
    5. \(P(\text{Obese|Tall}) = \dfrac{18}{50} = 0.36\)
    6. \(P(\text{Tall AND Underweight}) = \dfrac{12}{205} = 0.0585\)
    7. Não. \(P(\text{Tall})\)não é igual\(P(\text{Tall|Obese})\).

    Referências

    1. “Tipos de sangue”. Cruz Vermelha Americana, 2013. Disponível on-line em www.redcrossblood.org/learn-a... od/blood-types (acessado em 3 de maio de 2013).
    2. Dados do National Center for Health Statistics, parte do Departamento de Saúde e Serviços Humanos dos Estados Unidos.
    3. Dados do Senado dos Estados Unidos. Disponível on-line em www.senate.gov (acessado em 2 de maio de 2013).
    4. Haiman, Christopher A., Daniel O. Stram, Lynn R. Wilkens, Malcom C. Pike, Laurence N. Kolonel, Brien E. Henderson e Loīc Le Marchand. “Diferenças étnicas e raciais no risco de câncer de pulmão relacionado ao tabagismo”. The New England Journal of Medicine, 2013. Disponível on-line em http://www.nejm.org/doi/full/10.1056/NEJMoa033250 (acessado em 2 de maio de 2013).
    5. “Tipos de sangue humano”. Unite Blood Services, 2011. Disponível on-line em www.UnitedBloodServices.org/learnMore.aspx (acessado em 2 de maio de 2013).
    6. Samuel, T. M. “Fatos estranhos sobre sangue RH negativo”. eHow Health, 2013. Disponível on-line em www.ehow.com/facts_5552003_st... ive-blood.html (acessado em 2 de maio de 2013).
    7. “Estados Unidos: Relatório Uniforme de Crimes — Estatísticas estaduais de 1960 a 2011.” O Centro de Desastres. Disponível on-line em http://www.disastercenter.com/crime/ (acessado em 2 de maio de 2013).

    Revisão

    Há várias ferramentas que você pode usar para ajudar a organizar e classificar os dados ao calcular probabilidades. As tabelas de contingência ajudam a exibir dados e são particularmente úteis ao calcular probabilidades que têm várias variáveis dependentes.

    Use as informações a seguir para responder aos próximos quatro exercícios. A tabela mostra uma amostra aleatória de músicos e como eles aprenderam a tocar seus instrumentos.

    Gênero Autodidata Estudou na escola Instrução particular Total
    Feminino 12 38 22 72
    Masculino 19 24 15 58
    Total 31 62 37 130

    Exercício 3.5.4

    Encontre P (o músico é uma mulher).

    Exercício 3.5.5

    Encontre\(P(\text{musician is a male AND had private instruction})\).

    Responda

    \(P(\text{musician is a male AND had private instruction}) = \dfrac{15}{130} = \dfrac{3}{26} = 0.12\)

    Exercício 3.5.6

    Encontre P (o músico é uma mulher OU é autodidata).

    Exercício 3.5.7

    Os eventos “ser musicista feminina” e “aprender música na escola” são eventos mutuamente exclusivos?

    Responda

    Os eventos não são mutuamente exclusivos. É possível ser uma musicista que aprendeu música na escola.

    Reunindo tudo

    Use as informações a seguir para responder aos próximos sete exercícios. Um artigo no New England Journal of Medicine, relatou sobre um estudo com fumantes na Califórnia e no Havaí. Em uma parte do relatório, a etnia autorrelatada e os níveis de tabagismo por dia foram fornecidos. Das pessoas que fumavam no máximo dez cigarros por dia, havia 9.886 afro-americanos, 2.745 nativos havaianos, 12.831 latinos, 8.378 nipo-americanos e 7.650 brancos. Das pessoas que fumavam de 11 a 20 cigarros por dia, havia 6.514 afro-americanos, 3.062 nativos havaianos, 4.932 latinos, 10.680 nipo-americanos e 9.877 brancos. Das pessoas que fumavam de 21 a 30 cigarros por dia, havia 1.671 afro-americanos, 1.419 nativos havaianos, 1.406 latinos, 4.715 nipo-americanos e 6.062 brancos. Das pessoas que fumavam pelo menos 31 cigarros por dia, havia 759 afro-americanos, 788 nativos havaianos, 800 latinos, 2.305 nipo-americanos e 3.970 brancos.

    Exercício 3.5.8

    Preencha a tabela usando os dados fornecidos. Suponha que uma pessoa do estudo seja selecionada aleatoriamente. Descubra a probabilidade dessa pessoa ter fumado de 11 a 20 cigarros por dia.

    Níveis de tabagismo por etnia
    Nível de fumo afro-americano Nativo havaiano Latino Nipo-americanos Branco TOTAIS
    1—10            
    11—20            
    21—30            
    31+            
    TOTAIS            

    Exercício 3.5.9

    Suponha que uma pessoa do estudo seja selecionada aleatoriamente. Descubra a probabilidade dessa pessoa ter fumado de 11 a 20 cigarros por dia.

    Responda

    \(\dfrac{35,065}{100,450}\)

    Exercício 3.5.10

    Descubra a probabilidade de a pessoa ser latina.

    Exercício 3.5.11

    Em palavras, explique o que significa escolher uma pessoa do estudo que seja “nipo-americana AND fuma de 21 a 30 cigarros por dia”. Além disso, encontre a probabilidade.

    Responda

    Escolher uma pessoa do estudo que seja nipo-americana e fume de 21 a 30 cigarros por dia significa que a pessoa deve atender aos dois critérios: nipo-americana e fuma de 21 a 30 cigarros. O espaço amostral deve incluir todos no estudo. A probabilidade é\(\dfrac{4,715}{100,450}\).

    Exercício 3.5.12

    Em palavras, explique o que significa escolher uma pessoa do estudo que seja “nipo-americana OR fuma de 21 a 30 cigarros por dia”. Além disso, encontre a probabilidade.

    Exercício 3.5.13

    Em palavras, explique o que significa escolher uma pessoa do estudo que seja “nipo-americana, considerando que essa pessoa fuma de 21 a 30 cigarros por dia”. Além disso, encontre a probabilidade.

    Responda

    Escolher uma pessoa do estudo que seja nipo-americana, já que essa pessoa fuma de 21 a 30 cigarros por dia, significa que a pessoa deve preencher os dois critérios e o espaço da amostra é reduzido para aqueles que fumam de 21 a 30 cigarros por dia. A probabilidade é\(\dfrac{4,715}{15,273}\).

    Exercício 3.5.14

    Prove que o nível/dia de tabagismo e a etnia são eventos dependentes.

    Glossário

    tabela de contingência
    o método de exibir uma distribuição de frequência como uma tabela com linhas e colunas para mostrar como duas variáveis podem ser dependentes (contingentes) uma da outra; a tabela fornece uma maneira fácil de calcular probabilidades condicionais.