3.5: Tabelas de contingência
- Page ID
- 190066
Uma tabela de contingência fornece uma forma de retratar dados que pode facilitar o cálculo de probabilidades. A tabela ajuda a determinar as probabilidades condicionais com bastante facilidade. A tabela exibe valores de amostra em relação a duas variáveis diferentes que podem ser dependentes ou dependentes uma da outra. Posteriormente, usaremos as tabelas de contingência novamente, mas de outra forma.
Exemplo\(\PageIndex{1}\)
Suponha que um estudo sobre violações de velocidade e motoristas que usam telefones celulares tenha produzido os seguintes dados fictícios:
Violação por excesso de velocidade no último ano | Nenhuma violação de velocidade no último ano | Total | |
---|---|---|---|
Usuário de telefone celular | 25 | 280 | 305 |
Não é usuário de celular | 45 | 405 | 450 |
Total | 70 | 685 | 755 |
O número total de pessoas na amostra é 755. Os totais das linhas são 305 e 450. Os totais das colunas são 70 e 685. Observe que 305 + 450 = 755 e 70 + 685 = 755.
Calcule as seguintes probabilidades usando a tabela.
- Encontre\(P(\text{Person is a cell phone user})\).
- Encontre\(P(\text{person had no violation in the last year})\).
- Encontre\(P(\text{Person had no violation in the last year AND was a cell phone user})\).
- Encontre\(P(\text{Person is a cell phone user OR person had no violation in the last year})\).
- Encontre\(P(\text{Person is a cell phone user GIVEN person had a violation in the last year})\).
- Encontre\(P(\text{Person had no violation last year GIVEN person was not a cell phone user})\)
Responda
- \(\dfrac{\text{number of cell phone users}}{\text{total number in study}}\)=\(\dfrac{305}{755}\)
- \(\dfrac{\text{number that had no violation}}{\text{total number in study}} = \dfrac{685}{755}\)
- \(\dfrac{280}{755}\)
- \(\left(\dfrac{305}{755} + \dfrac{685}{755}\right) - \dfrac{280}{755} = \dfrac{710}{755}\)
- \(\dfrac{25}{70}\)(O espaço da amostra é reduzido ao número de pessoas que cometeram uma violação.)
- \(\dfrac{405}{450}\)(O espaço da amostra é reduzido ao número de pessoas que não eram usuários de telefones celulares.)
Exercício\(\PageIndex{1}\)
A tabela mostra o número de atletas que se alongam antes do exercício e quantos sofreram lesões no último ano.
Lesão no ano passado | Nenhuma lesão no ano passado | Total | |
---|---|---|---|
Alongamentos | 55 | 295 | 350 |
Não estica | 231 | 219 | 450 |
Total | 286 | 514 | 800 |
- O que é\(P(\text{athlete stretches before exercising})\)?
- O que é\(P(\text{athlete stretches before exercising|no injury in the last year})\)?
Responda
- \(P(\text{athlete stretches before exercising}) = \dfrac{350}{800} = 0.4375\)
- \(P(\text{athlete stretches before exercising|no injury in the last year}) = \dfrac{295}{514} = 0.5739\)
Exemplo\(\PageIndex{2}\)
A tabela mostra uma amostra aleatória de 100 caminhantes e as áreas de caminhada que eles preferem.
Sexo | O litoral | Perto de lagos e riachos | Nos picos das montanhas | Total |
---|---|---|---|---|
Feminino | 18 | 16 | ___ | 45 |
Masculino | ___ | ___ | 14 | 55 |
Total | ___ | 41 | ___ | ___ |
- Complete a tabela.
- Os eventos “ser feminino” e “preferir o litoral” são eventos independentes? Seja F = ser mulher e C = preferindo o litoral.
- Encontre P (F E C).
- Encontre P (F) P (C)
- Esses dois números são iguais? Se forem, então F e C são independentes. Se não forem, então F e C não são independentes.
- Descubra a probabilidade de uma pessoa ser do sexo masculino, já que prefere caminhar perto de lagos e riachos. Deixe\(\text{M} =\) ser homem, e deixe\(\text{L} =\) preferir caminhar perto de lagos e riachos.
- Que palavra diz que isso é condicional?
- Preencha os espaços em branco e calcule a probabilidade:\(P\) (___|___) = ___.
- O espaço amostral para este problema é para todos os 100 caminhantes? Se não, o que é?
- Descubra a probabilidade de uma pessoa ser mulher ou preferir caminhar nos picos das montanhas. Deixe\(\text{F} =\) ser mulher, e deixe\(\text{P} =\) preferir picos de montanhas.
- Encontre\(P(\text{F})\).
- Encontre\(P(\text{P})\).
- Encontre\(P(\text{F AND P})\).
- Encontre\(P(\text{F OR P})\).
Resposta s
uma.
Gênero | O litoral | Perto de lagos e riachos | Nos picos das montanhas | Total |
---|---|---|---|---|
Feminino | 18 | 16 | 11 | 45 |
Masculino | 16 | 25 | 14 | 55 |
Total | 34 |
41 |
25 | 100 |
b.
\(P(\text{F AND C}) = \dfrac{18}{100} = 0.18\)
\(P(\text{F})P(\text{C}) = \left(\dfrac{45}{100}\right) \left(\dfrac{34}{100}\right) = (0.45)(0.34) = 0.153\)
\(P(\text{F AND C}) \neq P(\text{F})P(\text{C})\), então os eventos\(\text{F}\) e não\(\text{C}\) são independentes.
c.
- A palavra “dado” diz que isso é condicional.
- \(P(\text{M|L}) = \dfrac{25}{41}\)
- Não, o espaço amostral para esse problema são os 41 caminhantes que preferem lagos e riachos.
d.
- Encontre\(P(\text{F})\).
- Encontre\(P(\text{P})\).
- Encontre\(P(\text{F AND P})\).
- Encontre\(P(\text{F OR P})\).
d.
- \(P(\text{F}) = \dfrac{45}{100}\)
- \(P(\text{P}) = \dfrac{25}{100}\)
- \(P(\text{F AND P}) = \dfrac{11}{100}\)
- \(P(\text{F OR P}) = \dfrac{45}{100} + \dfrac{25}{100} - \dfrac{11}{100} = \dfrac{59}{100}\)
Exercício\(\PageIndex{2}\)
A tabela mostra uma amostra aleatória de 200 ciclistas e as rotas que eles preferem. Deixe\(\text{M} =\) os machos e o caminho\(\text{H} =\) montanhoso.
Gênero | Caminho do Lago | Caminho montanhoso | Caminho arborizado | Total |
---|---|---|---|---|
Feminino | 45 | 38 | 27 | 110 |
Masculino | 26 | 52 | 12 | 90 |
Total | 71 | 90 | 39 | 200 |
- Dos homens, qual é a probabilidade de o ciclista preferir um caminho montanhoso?
- Os eventos “ser masculino” e “preferir o caminho montanhoso” são eventos independentes?
Responda
- P (H | M)\(\dfrac{52}{90}\) = 0,5778
- Para que M e H sejam independentes, mostre P (H | M) = P (H)
P (H | M) = 0,5778, P (H)\(\dfrac{90}{200}\) = 0,45
P (H | M) não é igual a P (H), então M e H NÃO são independentes.
Exemplo\(\PageIndex{3}\)
Muddy Mouse mora em uma gaiola com três portas. Se Muddy sair pela primeira porta, a probabilidade de ele ser pego pela gata Alissa é\(\dfrac{1}{5}\) e a probabilidade de ele não ser pego é\(\dfrac{4}{5}\). Se ele sair pela segunda porta, a probabilidade de ele ser pego por Alissa é\(\dfrac{1}{4}\) e a probabilidade de ele não ser pego é\(\dfrac{3}{4}\). A probabilidade de Alissa pegar Muddy saindo pela terceira porta é\(\dfrac{1}{2}\) e a probabilidade de ela não pegar Muddy é\(\dfrac{1}{2}\). É igualmente provável que Muddy escolha qualquer uma das três portas, então a probabilidade de escolher cada porta é\(\dfrac{1}{3}\).
Capturado ou não | Porta Um | Porta dois | Porta três | Total |
---|---|---|---|---|
Capturado | \(\dfrac{1}{15}\) | \(\dfrac{1}{12}\) | \(\dfrac{1}{6}\) | ____ |
Não foi pego | \(\dfrac{4}{15}\) | \(\dfrac{3}{12}\) | \(\dfrac{1}{6}\) | ____ |
Total | ____ | ____ | ____ | 1 |
- A primeira entrada\(\dfrac{1}{15} = \left(\dfrac{1}{5}\right) \left(\dfrac{1}{3}\right)\) é\(P(\text{Door One AND Caught})\)
- A entrada\(\dfrac{4}{15} = \left(\dfrac{4}{5}\right) \left(\dfrac{1}{3}\right)\) é\(P(\text{Door One AND Not Caught})\)
Verifique as entradas restantes.
- Preencha a tabela de contingência de probabilidade. Calcule as entradas para os totais. Verifique se a entrada do canto inferior direito é 1.
- Qual é a probabilidade de Alissa não pegar Muddy?
- Qual é a probabilidade de Muddy escolher a Porta Um OU a Porta Dois, já que Muddy foi pego por Alissa?
Solução
Capturado ou não | Porta Um | Porta dois | Porta três | Total |
---|---|---|---|---|
Capturado | \(\dfrac{1}{15}\) | \(\dfrac{1}{12}\) | \(\dfrac{1}{6}\) | \(\dfrac{19}{60}\) |
Não foi pego | \(\dfrac{4}{15}\) | \(\dfrac{3}{12}\) | \(\dfrac{1}{6}\) | \(\dfrac{41}{60}\) |
Total | \(\dfrac{5}{15}\) | \(\dfrac{4}{12}\) | \(\dfrac{2}{6}\) | 1 |
b.\(\dfrac{41}{60}\)
c.\(\dfrac{9}{19}\)
Exemplo\(\PageIndex{4}\)
A tabela contém o número de crimes por 100.000 habitantes de 2008 a 2011 nos EUA
Ano | Roubo | Roubo | Estupro | Veículo | Total |
---|---|---|---|---|---|
2008 | 145,7 | 732,1 | 29,7 | 314,7 | |
2009 | 13.1 | 717,7 | 29,1 | 259,2 | |
2010 | 119,3 | 701 | 27,7 | 239,1 | |
2011 | 13,7 | 702.2 | 26,8 | 229,6 | |
Total |
TOTAL de cada coluna e cada linha. Total de dados = 4.520,7
- Encontre\(P(\text{2009 AND Robbery})\).
- Encontre\(P(\text{2010 AND Burglary})\).
- Encontre\(P(\text{2010 OR Burglary})\).
- Encontre\(P(\text{2011|Rape})\).
- Encontre\(P(\text{Vehicle|2008})\).
Responda
a. 0,0294, b. 0,1551, c. 0,7165, d. 0,2365, e. 0,2575
Exercício\(\PageIndex{3}\)
A tabela relaciona os pesos e alturas de um grupo de indivíduos participantes de um estudo observacional.
Peso/altura | Alto | Médio | Curto | Totais |
---|---|---|---|---|
Obesa | 18 | 28 | 14 | |
Normal | 20 | 51 | 28 | |
Baixo peso | 12 | 25 | 9 | |
Totais |
- Encontre o total para cada linha e coluna
- Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja alto.
- Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja obeso e alto.
- Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja alto, já que o indivíduo é obeso.
- Encontre a probabilidade de que um indivíduo escolhido aleatoriamente desse grupo seja obeso, já que o indivíduo é alto.
- Encontre a probabilidade de um indivíduo escolhido aleatoriamente desse grupo ser alto e com baixo peso.
- Os eventos Obese e Tall são independentes?
Responda
Peso/altura | Alto | Médio | Curto | Totais |
---|---|---|---|---|
Obesa | 18 | 28 | 14 | 60 |
Normal | 20 | 51 | 28 | 99 |
Baixo peso | 12 | 25 | 9 | 46 |
Totais | 50 | 104 | 51 | 205 |
- Totais de linha: 60, 99, 46. Totais das colunas: 50, 104, 51.
- \(P(\text{Tall}) = \dfrac{50}{205} = 0.244\)
- \(P(\text{Obese AND Tall}) = \dfrac{18}{205} = 0.088\)
- \(P(\text{Tall|Obese}) = \dfrac{18}{60} = 0.3\)
- \(P(\text{Obese|Tall}) = \dfrac{18}{50} = 0.36\)
- \(P(\text{Tall AND Underweight}) = \dfrac{12}{205} = 0.0585\)
- Não. \(P(\text{Tall})\)não é igual\(P(\text{Tall|Obese})\).
Referências
- “Tipos de sangue”. Cruz Vermelha Americana, 2013. Disponível on-line em www.redcrossblood.org/learn-a... od/blood-types (acessado em 3 de maio de 2013).
- Dados do National Center for Health Statistics, parte do Departamento de Saúde e Serviços Humanos dos Estados Unidos.
- Dados do Senado dos Estados Unidos. Disponível on-line em www.senate.gov (acessado em 2 de maio de 2013).
- Haiman, Christopher A., Daniel O. Stram, Lynn R. Wilkens, Malcom C. Pike, Laurence N. Kolonel, Brien E. Henderson e Loīc Le Marchand. “Diferenças étnicas e raciais no risco de câncer de pulmão relacionado ao tabagismo”. The New England Journal of Medicine, 2013. Disponível on-line em http://www.nejm.org/doi/full/10.1056/NEJMoa033250 (acessado em 2 de maio de 2013).
- “Tipos de sangue humano”. Unite Blood Services, 2011. Disponível on-line em www.UnitedBloodServices.org/learnMore.aspx (acessado em 2 de maio de 2013).
- Samuel, T. M. “Fatos estranhos sobre sangue RH negativo”. eHow Health, 2013. Disponível on-line em www.ehow.com/facts_5552003_st... ive-blood.html (acessado em 2 de maio de 2013).
- “Estados Unidos: Relatório Uniforme de Crimes — Estatísticas estaduais de 1960 a 2011.” O Centro de Desastres. Disponível on-line em http://www.disastercenter.com/crime/ (acessado em 2 de maio de 2013).
Revisão
Há várias ferramentas que você pode usar para ajudar a organizar e classificar os dados ao calcular probabilidades. As tabelas de contingência ajudam a exibir dados e são particularmente úteis ao calcular probabilidades que têm várias variáveis dependentes.
Use as informações a seguir para responder aos próximos quatro exercícios. A tabela mostra uma amostra aleatória de músicos e como eles aprenderam a tocar seus instrumentos.
Gênero | Autodidata | Estudou na escola | Instrução particular | Total |
---|---|---|---|---|
Feminino | 12 | 38 | 22 | 72 |
Masculino | 19 | 24 | 15 | 58 |
Total | 31 | 62 | 37 | 130 |
Exercício 3.5.4
Encontre P (o músico é uma mulher).
Exercício 3.5.5
Encontre\(P(\text{musician is a male AND had private instruction})\).
Responda
\(P(\text{musician is a male AND had private instruction}) = \dfrac{15}{130} = \dfrac{3}{26} = 0.12\)
Exercício 3.5.6
Encontre P (o músico é uma mulher OU é autodidata).
Exercício 3.5.7
Os eventos “ser musicista feminina” e “aprender música na escola” são eventos mutuamente exclusivos?
Responda
Os eventos não são mutuamente exclusivos. É possível ser uma musicista que aprendeu música na escola.
Reunindo tudo
Use as informações a seguir para responder aos próximos sete exercícios. Um artigo no New England Journal of Medicine, relatou sobre um estudo com fumantes na Califórnia e no Havaí. Em uma parte do relatório, a etnia autorrelatada e os níveis de tabagismo por dia foram fornecidos. Das pessoas que fumavam no máximo dez cigarros por dia, havia 9.886 afro-americanos, 2.745 nativos havaianos, 12.831 latinos, 8.378 nipo-americanos e 7.650 brancos. Das pessoas que fumavam de 11 a 20 cigarros por dia, havia 6.514 afro-americanos, 3.062 nativos havaianos, 4.932 latinos, 10.680 nipo-americanos e 9.877 brancos. Das pessoas que fumavam de 21 a 30 cigarros por dia, havia 1.671 afro-americanos, 1.419 nativos havaianos, 1.406 latinos, 4.715 nipo-americanos e 6.062 brancos. Das pessoas que fumavam pelo menos 31 cigarros por dia, havia 759 afro-americanos, 788 nativos havaianos, 800 latinos, 2.305 nipo-americanos e 3.970 brancos.
Exercício 3.5.8
Preencha a tabela usando os dados fornecidos. Suponha que uma pessoa do estudo seja selecionada aleatoriamente. Descubra a probabilidade dessa pessoa ter fumado de 11 a 20 cigarros por dia.
Nível de fumo | afro-americano | Nativo havaiano | Latino | Nipo-americanos | Branco | TOTAIS |
---|---|---|---|---|---|---|
1—10 | ||||||
11—20 | ||||||
21—30 | ||||||
31+ | ||||||
TOTAIS |
Exercício 3.5.9
Suponha que uma pessoa do estudo seja selecionada aleatoriamente. Descubra a probabilidade dessa pessoa ter fumado de 11 a 20 cigarros por dia.
Responda
\(\dfrac{35,065}{100,450}\)
Exercício 3.5.10
Descubra a probabilidade de a pessoa ser latina.
Exercício 3.5.11
Em palavras, explique o que significa escolher uma pessoa do estudo que seja “nipo-americana AND fuma de 21 a 30 cigarros por dia”. Além disso, encontre a probabilidade.
Responda
Escolher uma pessoa do estudo que seja nipo-americana e fume de 21 a 30 cigarros por dia significa que a pessoa deve atender aos dois critérios: nipo-americana e fuma de 21 a 30 cigarros. O espaço amostral deve incluir todos no estudo. A probabilidade é\(\dfrac{4,715}{100,450}\).
Exercício 3.5.12
Em palavras, explique o que significa escolher uma pessoa do estudo que seja “nipo-americana OR fuma de 21 a 30 cigarros por dia”. Além disso, encontre a probabilidade.
Exercício 3.5.13
Em palavras, explique o que significa escolher uma pessoa do estudo que seja “nipo-americana, considerando que essa pessoa fuma de 21 a 30 cigarros por dia”. Além disso, encontre a probabilidade.
Responda
Escolher uma pessoa do estudo que seja nipo-americana, já que essa pessoa fuma de 21 a 30 cigarros por dia, significa que a pessoa deve preencher os dois critérios e o espaço da amostra é reduzido para aqueles que fumam de 21 a 30 cigarros por dia. A probabilidade é\(\dfrac{4,715}{15,273}\).
Exercício 3.5.14
Prove que o nível/dia de tabagismo e a etnia são eventos dependentes.
Glossário
- tabela de contingência
- o método de exibir uma distribuição de frequência como uma tabela com linhas e colunas para mostrar como duas variáveis podem ser dependentes (contingentes) uma da outra; a tabela fornece uma maneira fácil de calcular probabilidades condicionais.