2.3: Medidas do centro dos dados
- Page ID
- 186609
O “centro” de um conjunto de dados também é uma forma de descrever a localização. As duas medidas mais usadas do “centro” dos dados são a média (média) e a mediana. Para calcular o peso médio de 50 pessoas, adicione os 50 pesos e divida por 50. Tecnicamente, essa é a média aritmética. Discutiremos a média geométrica mais tarde. Para encontrar o peso médio das 50 pessoas, ordene os dados e encontre o número que divide os dados em duas partes iguais, o que significa um número igual de observações em cada lado. O peso de 25 pessoas está abaixo desse peso e 25 pessoas são mais pesadas que esse peso. A mediana geralmente é uma medida melhor do centro quando há valores extremos ou valores atípicos porque não é afetada pelos valores numéricos precisos dos valores atípicos. A média é a medida mais comum do centro.
NOTA
As palavras “média” e “média” são frequentemente usadas de forma intercambiável. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é “média aritmética” e “média” é tecnicamente uma localização central. Formalmente, a média aritmética é chamada de primeiro momento da distribuição pelos matemáticos. No entanto, na prática entre não estatísticos, “média” é comumente aceita como “média aritmética”.
Quando cada valor no conjunto de dados não é exclusivo, a média pode ser calculada multiplicando cada valor distinto por sua frequência e, em seguida, dividindo a soma pelo número total de valores de dados. A letra usada para representar a média da amostra é um x com uma barra sobre ela (pronunciado “\(x\)bar”):\(\overline x\).
A letra grega\(\mu\) (pronunciada “mew”) representa a média da população. Um dos requisitos para que a média da amostra seja uma boa estimativa da média da população é que a amostra coletada seja verdadeiramente aleatória.
Para ver que as duas formas de calcular a média são iguais, considere a amostra:
1; 1; 1; 2; 2; 3; 4; 4; 4; 4; 4; 4
\[\overline{x}=\frac{1+1+1+2+2+3+4+4+4+4+4}{11}=2.7\nonumber\]
\[\overline{x}=\frac{3(1)+2(2)+1(3)+5(4)}{11}=2.7\nonumber\]
No segundo cálculo, as frequências são 3, 2, 1 e 5.
Você pode encontrar rapidamente a localização da mediana usando a expressão\(\frac{n+1}{2}\).
A letra\(n\) é o número total de valores de dados na amostra. Se\(n\) for um número ímpar, a mediana é o valor médio dos dados ordenados (ordenados do menor para o maior). Se\(n\) for um número par, a mediana é igual aos dois valores médios somados e divididos por dois depois que os dados foram ordenados. Por exemplo, se o número total de valores de dados for 97, então\(\frac{n+1}{2}=\frac{97+1}{2}=49\). A mediana é o 49º valor nos dados ordenados. Se o número total de valores de dados for 100, então\(\frac{n+1}{2}=\frac{100+1}{2}=50.5\). A mediana ocorre a meio caminho entre os valores 50 e 51. A localização da mediana e o valor da mediana não são os mesmos. A letra maiúscula\(M\) é frequentemente usada para representar a mediana. O próximo exemplo ilustra a localização da mediana e o valor da mediana.
Exemplo 2.24
Os dados da AIDS que indicam o número de meses que um paciente com AIDS vive após tomar um novo anticorpo são os seguintes (do menor para o maior):
3; 4; 8; 10; 11; 12; 13; 14; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 25; 26; 26; 27; 29; 29; 31; 33; 22; 24; 25; 26; 27; 29; 31; 32; 33; 33; 34;; 35; 37; 40; 44; 44; 47;
Calcule a média e a mediana.
- Resposta
-
Solução 2.24
O cálculo da média é:
\(\overline{x}=\frac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+\ldots+35+37+40+(44)(2)+47]}{40}=23.6\)
Para encontrar a mediana\(M\), primeiro use a fórmula para a localização. A localização é:
\(\frac{n+1}{2}=\frac{40+1}{2}=20.5\)
Começando pelo menor valor, a mediana está localizada entre os valores 20 e 21 (os dois 24s):
\(3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47;\)\(M=\frac{24+24}{2}=24\)
Exemplo 2.25
Suponha que em uma pequena cidade de 50 pessoas, uma pessoa ganhe $5.000.000 por ano e as outras 49 ganhem $30.000 cada. Qual é a melhor medida do “centro”: a média ou a mediana?
- Resposta
-
Solução 2.25
\(\overline{x}=\frac{5,000,000+49(30,000)}{50}=129,400\)
\(M = 30,000\)
(Há 49 pessoas que ganham $30.000 e uma pessoa que ganha $5.000.000.)
A mediana é uma medida melhor do “centro” do que a média porque 49 dos valores são 30.000 e um é 5.000.000. O 5.000.000 é um outlier. Os 30.000 nos dão uma melhor noção do meio dos dados.
Outra medida do centro é o modo. O modo é o valor mais frequente. Pode haver mais de um modo em um conjunto de dados, desde que esses valores tenham a mesma frequência e essa frequência seja a mais alta. Um conjunto de dados com dois modos é chamado de bimodal.
Exemplo 2.26
As notas dos exames estatísticos para 20 alunos são as seguintes:
50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93
Encontre o modo.
- Resposta
-
Solução 2.26
A pontuação mais frequente é 72, que ocorre cinco vezes. Modo = 72.
Exemplo 2.27
Cinco notas de exames imobiliários são 430, 430, 480, 480, 495. O conjunto de dados é bimodal porque as pontuações 430 e 480 ocorrem duas vezes cada.
Quando o modo é a melhor medida do “centro”? Considere um programa de perda de peso que anuncia uma perda média de peso de seis libras na primeira semana do programa. O modo pode indicar que a maioria das pessoas perde dois quilos na primeira semana, tornando o programa menos atraente.
NOTA
O modo pode ser calculado tanto para dados qualitativos quanto para dados quantitativos. Por exemplo, se o conjunto de dados for: vermelho, vermelho, verde, verde, amarelo, roxo, preto, azul, o modo será vermelho.
Calculando a média aritmética de tabelas de frequência agrupadas
Quando somente dados agrupados estão disponíveis, você não conhece os valores de dados individuais (só conhecemos intervalos e frequências de intervalo); portanto, você não pode calcular uma média exata para o conjunto de dados. O que devemos fazer é estimar a média real calculando a média de uma tabela de frequência. Uma tabela de frequência é uma representação de dados na qual dados agrupados são exibidos junto com as frequências correspondentes. Para calcular a média de uma tabela de frequência agrupada, podemos aplicar a definição básica de média: média = Simplesmente\(\frac{\text { data sum }}{\text { number of data values }}\) precisamos modificar a definição para caber nas restrições de uma tabela de frequência.
Como não conhecemos os valores de dados individuais, podemos encontrar o ponto médio de cada intervalo. O ponto médio é\(\frac{\text { lower boundary+upper boundary}}{2}\). Agora podemos modificar a definição da média para\(\textbf{Mean of Frequency Table}=\frac{\sum f m}{\sum f}\) que f = a frequência do intervalo e m = o ponto médio do intervalo.
Exemplo 2.28
Uma tabela de frequência exibindo o último teste estatístico do professor Blount é mostrada. Encontre a melhor estimativa da média da classe.
Intervalo escolar | Número de estudantes |
---|---|
50—56,5 | 1 |
56,5—62,5 | 0 |
62,5 a 68,5 | 4 |
68,5 a 74,5 | 4 |
74,5—80,5 | 2 |
80,5—86,5 | 3 |
86,5—92,5 | 4 |
92,5 a 98,5 | 1 |
- Resposta
-
Solução 2.28
Encontre os pontos médios para todos os intervalosIntervalo escolar Ponto médio 50—56,5 53,25 56,5—62,5 59,5 62,5 a 68,5 65,5 68,5 a 74,5 71,5 74,5—80,5 77,5 80,5—86,5 83,5 86,5—92,5 89,5 92,5 a 98,5 95,5 Tabela 2.25 - Calcule a soma do produto de cada intervalo, frequência e ponto médio. \(\sum f m\)\(53.25(1)+59.5(0)+65.5(4)+71.5(4)+77.5(2)+83.5(3)+89.5(4)+95.5(1)=1460.25\)
- \(\mu=\frac{\sum f m}{\sum f}=\frac{1460.25}{19}=76.86\)
Exercício 2.28
Maris conduziu um estudo sobre o efeito que jogar videogame tem na recuperação da memória. Como parte de seu estudo, ela compilou os seguintes dados:
Horas que os adolescentes passam em videogames | Número de adolescentes |
---|---|
0—3,5 | 3 |
3,5—7,5 | 7 |
7,5—11,5 | 12 |
11,5—15,5 | 7 |
15,5—19,5 | 9 |
Qual é a melhor estimativa para o número médio de horas gastas jogando videogame?