2.6: Medidas do Centro dos Dados
- Page ID
- 190137
O “centro” de um conjunto de dados também é uma forma de descrever a localização. As duas medidas mais usadas do “centro” dos dados são a média (média) e a mediana. Para calcular o peso médio de 50 pessoas, adicione os 50 pesos e divida por 50. Para encontrar o peso médio das 50 pessoas, ordene os dados e encontre o número que divide os dados em duas partes iguais. A mediana geralmente é uma medida melhor do centro quando há valores extremos ou valores atípicos porque não é afetada pelos valores numéricos precisos dos valores atípicos. A média é a medida mais comum do centro.
As palavras “média” e “média” são frequentemente usadas de forma intercambiável. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é “média aritmética” e “média” é tecnicamente uma localização central. No entanto, na prática entre não estatísticos, “média” é comumente aceita como “média aritmética”.
Quando cada valor no conjunto de dados não é exclusivo, a média pode ser calculada multiplicando cada valor distinto por sua frequência e, em seguida, dividindo a soma pelo número total de valores de dados. A letra usada para representar a média da amostra é a\(x\) com uma barra sobre ela (pronunciado “\(x\)bar”):\(\overline{x}\).
A letra grega\(\mu\) (pronunciada “mew”) representa a média da população. Um dos requisitos para que a média da amostra seja uma boa estimativa da média da população é que a amostra coletada seja verdadeiramente aleatória.
Para ver que as duas formas de calcular a média são iguais, considere a amostra:
1; 1; 1; 2; 2; 3; 4; 4; 4; 4;
\[\bar{x} = \dfrac{1+1+1+2+2+3+4+4+4+4+4}{11} = 2.7\]
No segundo cálculo, as frequências são 3, 2, 1 e 5.
Você pode encontrar rapidamente a localização da mediana usando a expressão
\[\dfrac{n+1}{2}\]
A letra\(n\) é o número total de valores de dados na amostra. Se\(n\) for um número ímpar, a mediana é o valor médio dos dados ordenados (ordenados do menor para o maior). Se\(n\) for um número par, a mediana é igual aos dois valores médios somados e divididos por dois depois que os dados foram ordenados. Por exemplo, se o número total de valores de dados for 97, então
\[\dfrac{n+1}{2} = \dfrac{97+1}{2} = 49.\]
A mediana é o 49º valor nos dados ordenados. Se o número total de valores de dados for 100, então
\[\dfrac{n+1}{2} = \dfrac{100+1}{2} = 50.5.\]
A mediana ocorre a meio caminho entre os valores do 50º e do 51º. A localização da mediana e o valor da mediana não são os mesmos. A letra maiúscula\(M\) é frequentemente usada para representar a mediana. O próximo exemplo ilustra a localização da mediana e o valor da mediana.
Exemplo\(\PageIndex{1}\)
Os dados da AIDS que indicam o número de meses que um paciente com AIDS vive após tomar um novo medicamento com anticorpos são os seguintes (do menor para o maior):
3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 35; 37; 40; 44; 44; 47
Calcule a média e a mediana.
Responda
O cálculo da média é:
\[\bar{x} = \dfrac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+(16)(2)+...+35+37+40+(44)(2)+47]}{40} = 23.6\]
Para encontrar a mediana\(M\), primeiro use a fórmula para a localização. A localização é:\[\dfrac{n+1}{2} = \dfrac{40+1}{2} = 20.5\]
Começando pelo menor valor, a mediana está localizada entre os valores 20 e 21 (os dois 24s):
3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 35; 37; 40; 44; 44; 47
\[M = \dfrac{24+24}{2} = 24\]
Calculadora
Para encontrar a média e a mediana:
Limpar a lista L1. Pressione START 4:CLRList. Insira o 2º 1 para a lista L1. Pressione ENTER.
Insira os dados no editor de listas. Pressione STAT 1:EDIT.
Coloque os valores dos dados na lista L1.
Pressione STAT e seta para CALC. Pressione 1:1 -VARStats. Pressione 2nd 1 para L1 e depois ENTER.
Pressione as teclas de seta para baixo e para cima para rolar.
\(\bar{x}\)= 23,6, M = 24
Exercício\(\PageIndex{1}\)
Os dados a seguir mostram o número de meses que os pacientes normalmente esperam em uma lista de transplantes antes de serem submetidos à cirurgia. Os dados são ordenados do menor para o maior. Calcule a média e a mediana.
3; 4; 5; 7; 7; 7; 8; 8; 9; 9; 10; 10; 10; 10; 10; 11; 12; 12; 13; 14; 14; 15; 15; 17; 17; 18; 19; 19; 19; 21; 22; 23; 24; 24; 24; 24; 24; 24; 24; 24
Responda
Média:\(3 + 4 + 5 + 7 + 7 + 7 + 7 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 10 + 10 + 11 + 12 + 12 + 13 + 14 + 14 + 15 + 15 + 17 + 17 + 18 + 19 + 19 + 19 + 21 + 21 + 22 + 22 + 23 + 24 + 24 + 24 = 544\)
\[\dfrac{544}{39} = 13.95\]
Mediana: Começando pelo menor valor, a mediana é o 20º termo, que é 13.
Exemplo\(\PageIndex{2}\)
Suponha que em uma pequena cidade de 50 pessoas, uma pessoa ganhe $5.000.000 por ano e as outras 49 ganhem $30.000 cada. Qual é a melhor medida do “centro”: a média ou a mediana?
Solução
\[\bar{x} = \dfrac{5,000,000+49(30,000)}{50} = 129,400\]
\(M = 30,000\)
(Há 49 pessoas que ganham $30.000 e uma pessoa que ganha $5.000.000.)
A mediana é uma medida melhor do “centro” do que a média porque 49 dos valores são 30.000 e um é 5.000.000. O 5.000.000 é um outlier. Os 30.000 nos dão uma melhor noção do meio dos dados.
Exercício\(\PageIndex{2}\)
Em uma amostra de 60 famílias, uma casa vale $2.500.000. Metade do resto vale $280.000 e todos os outros valem $315.000. Qual é a melhor medida do “centro”: a média ou a mediana?
Responda
A mediana é a melhor medida do “centro” do que a média porque 59 dos valores são $280.000 e um é $2.500.000. Os $2.500.000 são um outlier. Ou $280.000 ou $315.000 nos dão uma melhor noção do meio dos dados.
Outra medida do centro é o modo. O modo é o valor mais frequente. Pode haver mais de um modo em um conjunto de dados, desde que esses valores tenham a mesma frequência e essa frequência seja a mais alta. Um conjunto de dados com dois modos é chamado de bimodal.
Exemplo\(\PageIndex{3}\)
As notas dos exames estatísticos para 20 alunos são as seguintes:
50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93
Encontre o modo.
Responda
A pontuação mais frequente é 72, o que ocorre cinco vezes. Modo = 72.
Exercício\(\PageIndex{3}\)
O número de livros retirados da biblioteca de 25 estudantes é o seguinte:
0; 0; 0; 1; 2; 3; 4; 4; 5; 5; 7; 7; 7; 7; 8; 8; 8; 9; 10; 11; 11; 12; 12; 12
Encontre o modo.
Responda
O número mais frequente de livros é 7, o que ocorre quatro vezes. Modo = 7.
Exemplo\(\PageIndex{4}\)
Cinco notas de exames imobiliários são 430, 430, 480, 480, 495. O conjunto de dados é bimodal porque as pontuações 430 e 480 ocorrem duas vezes cada.
Quando o modo é a melhor medida do “centro”? Considere um programa de perda de peso que anuncia uma perda média de peso de seis libras na primeira semana do programa. O modo pode indicar que a maioria das pessoas perde dois quilos na primeira semana, tornando o programa menos atraente.
O modo pode ser calculado tanto para dados qualitativos quanto para dados quantitativos. Por exemplo, se o conjunto de dados for: vermelho, vermelho, verde, verde, amarelo, roxo, preto, azul, o modo será vermelho.
O software estatístico calculará facilmente a média, a mediana e o modo. Algumas calculadoras gráficas também podem fazer esses cálculos. No mundo real, as pessoas fazem esses cálculos usando software.
Exercício\(\PageIndex{4}\)
Cinco pontuações de crédito são 680, 680, 700, 720, 720. O conjunto de dados é bimodal porque as pontuações 680 e 720 ocorrem duas vezes. Considere os ganhos anuais dos trabalhadores em uma fábrica. O modo é de $25.000 e ocorre 150 vezes em 301. A mediana é de $50.000 e a média é de $47.500. Qual seria a melhor medida do “centro”?
Responda
Como $25.000 ocorre quase a metade do tempo, o modo seria a melhor medida do centro porque a mediana e a média não representam o que a maioria das pessoas faz na fábrica.
A Lei dos Grandes Números e a Média
A Lei dos Grandes Números diz que, se você coletar amostras de tamanho cada vez maior de qualquer população, é muito provável que a média\(\bar{x}\) da amostra se aproxime cada vez mais\(\mu\). Isso é discutido com mais detalhes posteriormente no texto.
Distribuições de amostragem e estatística de uma distribuição amostral
Você pode pensar em uma distribuição de amostragem como uma distribuição de frequência relativa com muitas amostras. (Consulte Amostragem e dados para uma revisão da frequência relativa). Suponha que trinta estudantes selecionados aleatoriamente tenham sido questionados sobre o número de filmes que assistiram na semana anterior. Os resultados estão na tabela de frequência relativa mostrada abaixo.
Nº de filmes | Frequência relativa |
---|---|
0 |
\(\dfrac{5}{30}\) |
1 |
\(\dfrac{15}{30}\) |
2 |
\(\dfrac{6}{30}\) |
3 |
\(\dfrac{3}{30}\) |
4 |
\(\dfrac{1}{30}\) |
Se você deixar o número de amostras ficar muito grande (digamos, 300 milhões ou mais), a tabela de frequência relativa se torna uma distribuição de frequência relativa.
Uma estatística é um número calculado a partir de uma amostra. Os exemplos estatísticos incluem a média, a mediana e o modo, além de outros. A média da amostra\(\bar{x}\) é um exemplo de estatística que estima a média da população\(\mu\).
Calculando a média das tabelas de frequência agrupadas
Quando somente dados agrupados estão disponíveis, você não conhece os valores de dados individuais (só conhecemos intervalos e frequências de intervalo); portanto, você não pode calcular uma média exata para o conjunto de dados. O que devemos fazer é estimar a média real calculando a média de uma tabela de frequência. Uma tabela de frequência é uma representação de dados na qual dados agrupados são exibidos junto com as frequências correspondentes. Para calcular a média de uma tabela de frequência agrupada, podemos aplicar a definição básica de média:
\[mean = \dfrac{\text{data sum}}{\text{number of data values}}.\]
Simplesmente precisamos modificar a definição para caber nas restrições de uma tabela de frequência.
Como não conhecemos os valores de dados individuais, podemos encontrar o ponto médio de cada intervalo. O ponto médio é
\[\dfrac{\text{lower boundary+upper boundary}}{2}.\]
Agora podemos modificar a definição média para ser
\[\text{Mean of Frequency Table} = \dfrac{\sum{fm}}{\sum{f}}\]
onde\(f\) é a frequência do intervalo e\(m \) é o ponto médio do intervalo.
Exemplo\(\PageIndex{5}\)
Uma tabela de frequência exibindo o último teste estatístico do professor Blount é mostrada. Encontre a melhor estimativa da média da classe.
Intervalo escolar | Número de estudantes |
---|---|
50—56,5 | 1 |
56,5—62,5 | 0 |
62,5—68,5 | 4 |
68,5 a 74,5 | 4 |
74,5—80,5 | 2 |
80,5—86,5 | 3 |
86,5—92,5 | 4 |
92,5 a 98,5 | 1 |
Solução
- Encontre os pontos médios para todos os intervalos
Intervalo escolar | Ponto médio |
---|---|
50—56,5 | 53,25 |
56,5—62,5 | 59,5 |
62,5—68,5 | 65,5 |
68,5 a 74,5 | 71,5 |
74,5—80,5 | 77,5 |
80,5—86,5 | 83,5 |
86,5—92,5 | 89,5 |
92,5 a 98,5 | 95,5 |
- Calcule a soma do produto de cada intervalo, frequência e ponto médio. \(\sum{fm} 53.25(1) + 59.5(0) + 65.5(4 )+ 71.5(4) + 77.5(2) + 83.5(3) + 89.5(4) + 95.5(1) = 1460.25\)
- \(\mu = \dfrac{\sum{fm}}{\sum{f}} = \dfrac{1460.25}{19} = 76.86\)
Exercício\(\PageIndex{5}\)
Maris conduziu um estudo sobre o efeito que jogar videogame tem na recuperação da memória. Como parte de seu estudo, ela compilou os seguintes dados:
Horas que os adolescentes gastam em videogames | Número de adolescentes |
---|---|
0—3,5 | 3 |
3,5—7,5 | 7 |
7,5—11,5 | 12 |
11,5—15,5 | 7 |
15,5—19,5 | 9 |
Qual é a melhor estimativa para o número médio de horas gastas jogando videogame?
Responda
Encontre o ponto médio de cada intervalo, multiplique pelo número correspondente de adolescentes, adicione os resultados e divida pelo número total de adolescentes
Os pontos médios são 1,75, 5,5, 9,5, 13,5, 17,5.\[Mean = (1.75)(3) + (5.5)(7) + (9.5)(12) + (13.5)(7) + (17.5)(9) = 409.75\]
Referências
- Dados do Banco Mundial, disponíveis on-line em http://www.worldbank.org (acessado em 3 de abril de 2013).
- “Demografia: obesidade — taxa de prevalência em adultos.” Indexmundi. Disponível on-line em http://www.indexmundi.com/g/r.aspx?t=50&v=2228&l=en (acessado em 3 de abril de 2013).
Revisão
A média e a mediana podem ser calculadas para ajudar você a encontrar o “centro” de um conjunto de dados. A média é a melhor estimativa para o conjunto de dados real, mas a mediana é a melhor medida quando um conjunto de dados contém vários valores atípicos ou valores extremos. O modo mostrará os dados (ou dados) que ocorrem com mais frequência em seu conjunto de dados. A média, a mediana e o modo são extremamente úteis quando você precisa analisar seus dados, mas se o conjunto de dados consistir em intervalos sem valores específicos, a média pode parecer impossível de calcular. No entanto, a média pode ser aproximada se você adicionar o limite inferior com o limite superior e dividir por dois para encontrar o ponto médio de cada intervalo. Multiplique cada ponto médio pelo número de valores encontrados no intervalo correspondente. Divida a soma desses valores pelo número total de valores de dados no conjunto.
Revisão da fórmula
\[\mu = \dfrac{\sum{fm}}{\sum{f}} \]
onde\(f\) = frequências de intervalo e\(m\) = pontos médios do intervalo.
Exercício 2.6.6
Encontre a média para as tabelas de frequência a seguir.
-
Grau Frequência 49,5 a 59,5 2 59,5 a 69,5 3 69,5 a 79,5 8 79,5 a 89,5 12 89,5 a 99,5 5 -
Baixa temperatura diária Frequência 49,5 a 59,5 53 59,5 a 69,5 32 69,5 a 79,5 15 79,5 a 89,5 1 89,5 a 99,5 0 -
Pontos por jogo Frequência 49,5 a 59,5 14 59,5 a 69,5 32 69,5 a 79,5 15 79,5 a 89,5 23 89,5 a 99,5 2
Exercício 2.6.7
Calcule a média.
Responda
Significa:\(16 + 17 + 19 + 20 + 20 + 21 + 23 + 24 + 25 + 25 + 25 + 26 + 26 + 27 + 27 + 27 + 28 + 29 + 30 + 32 + 33 + 33 + 34 + 35 + 37 + 39 + 40 = 738\);
\(\dfrac{738}{27} = 27.33\)
Exercício 2.6.8
Identifique a mediana.
Exercício 2.6.9
Identifique o modo.
Responda
Os comprimentos mais frequentes são 25 e 27, que ocorrem três vezes. Modo = 25, 27
Use as seguintes informações para responder aos próximos três exercícios: Sessenta e cinco vendedores de carros selecionados aleatoriamente foram questionados sobre o número de carros que eles geralmente vendem em uma semana. Quatorze pessoas responderam que geralmente vendem três carros; dezenove geralmente vendem quatro carros; doze geralmente vendem cinco carros; nove geralmente vendem seis carros; onze geralmente vendem sete carros. Calcule o seguinte:
Exercício 2.6.10
média da amostra =\(\bar{x}\) = _______
Exercício 2.6.11
mediana = _______
Responda
4
Reunindo tudo
Exercício 2.6.12
Javier e Ercilia são supervisores em um shopping center. Cada um recebeu a tarefa de estimar a distância média que os compradores vivem do shopping. Cada um deles entrevistou aleatoriamente 100 compradores. As amostras produziram as seguintes informações.
Javier | Ercilia | |
---|---|---|
\(\bar{x}\) | 6,0 milhas | 6,0 milhas |
s | 4,0 milhas | 7,0 milhas |
- Como você pode determinar qual pesquisa estava correta?
- Explique o que a diferença nos resultados das pesquisas implica sobre os dados.
- Se os dois histogramas mostrarem a distribuição de valores para cada supervisor, qual deles representa a amostra de Ercilia? Como você sabe?
- Se os gráficos de duas caixas mostrarem a distribuição de valores para cada supervisor, qual deles mostra a amostra de Ercilia? Como você sabe? <figure >
Use as informações a seguir para responder aos próximos três exercícios: Estamos interessados no número de anos em que os alunos de uma determinada aula de estatística elementar moraram na Califórnia. As informações na tabela a seguir são de toda a seção.
Número de anos | Frequência | Número de anos | Frequência |
---|---|---|---|
Total = 20 | |||
7 | 1 | 22 | 1 |
14 | 3 | 23 | 1 |
15 | 1 | 26 | 1 |
18 | 1 | 40 | 2 |
19 | 4 | 42 | 2 |
20 | 3 |
Exercício 2.6.13
O que é o IQR?
- 8
- 11
- 15
- 35
Responda
uma
Exercício 2.6.14
Qual é o modo?
- 19
- 19,5
- 14 e 20
- 22,65
Exercício 2.6.15
Isso é uma amostra ou toda a população?
- amostra
- população inteira
- nem
Responda
b
Glossário
- Tabela de frequências
- uma representação de dados na qual os dados agrupados são exibidos junto com as frequências correspondentes
- Significa
- um número que mede a tendência central dos dados; um nome comum para média é “média”. O termo “média” é uma forma abreviada de “média aritmética”. Por definição, a média de uma amostra (indicada por\(\bar{x}\)) é\(\bar{x} = \dfrac{\text{Sum of all values in the sample}}{\text{Number of values in the sample}}\), e a média de uma população (indicada por\(\mu\)) é\(\mu = \dfrac{\text{Sum of all values in the population}}{\text{Number of values in the population}}\).
- Mediana
- um número que separa os dados ordenados em metades; metade dos valores são o mesmo número ou menores que a mediana e metade dos valores são o mesmo número ou maiores que a mediana. A mediana pode ou não fazer parte dos dados.
- Ponto médio
- a média de um intervalo em uma tabela de frequência
- Modo
- o valor que aparece com mais frequência em um conjunto de dados