2.6: Medidas do Centro dos Dados

Last updated
Save as PDF

Page ID: 190137

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $ $ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $$\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$ $\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$$\newcommand{\AA}{\unicode[.8,0]{x212B}}$

O “centro” de um conjunto de dados também é uma forma de descrever a localização. As duas medidas mais usadas do “centro” dos dados são a média (média) e a mediana. Para calcular o peso médio de 50 pessoas, adicione os 50 pesos e divida por 50. Para encontrar o peso médio das 50 pessoas, ordene os dados e encontre o número que divide os dados em duas partes iguais. A mediana geralmente é uma medida melhor do centro quando há valores extremos ou valores atípicos porque não é afetada pelos valores numéricos precisos dos valores atípicos. A média é a medida mais comum do centro.

As palavras “média” e “média” são frequentemente usadas de forma intercambiável. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é “média aritmética” e “média” é tecnicamente uma localização central. No entanto, na prática entre não estatísticos, “média” é comumente aceita como “média aritmética”.

Quando cada valor no conjunto de dados não é exclusivo, a média pode ser calculada multiplicando cada valor distinto por sua frequência e, em seguida, dividindo a soma pelo número total de valores de dados. A letra usada para representar a média da amostra é a$x$ com uma barra sobre ela (pronunciado “$x$bar”):$\overline{x}$.

A letra grega$\mu$ (pronunciada “mew”) representa a média da população. Um dos requisitos para que a média da amostra seja uma boa estimativa da média da população é que a amostra coletada seja verdadeiramente aleatória.

Para ver que as duas formas de calcular a média são iguais, considere a amostra:

1; 1; 1; 2; 2; 3; 4; 4; 4; 4;

\[\bar{x} = \dfrac{1+1+1+2+2+3+4+4+4+4+4}{11} = 2.7\]

\[\bar{x} = \dfrac{3(1) + 2(2) + 1(3) + 5(4)}{11} = 2.7\]

No segundo cálculo, as frequências são 3, 2, 1 e 5.

Você pode encontrar rapidamente a localização da mediana usando a expressão

\[\dfrac{n+1}{2}\]

A letra$n$ é o número total de valores de dados na amostra. Se$n$ for um número ímpar, a mediana é o valor médio dos dados ordenados (ordenados do menor para o maior). Se$n$ for um número par, a mediana é igual aos dois valores médios somados e divididos por dois depois que os dados foram ordenados. Por exemplo, se o número total de valores de dados for 97, então

\[\dfrac{n+1}{2} = \dfrac{97+1}{2} = 49.\]

A mediana é o ^49º valor nos dados ordenados. Se o número total de valores de dados for 100, então

\[\dfrac{n+1}{2} = \dfrac{100+1}{2} = 50.5.\]

A mediana ocorre a meio caminho entre os valores do ^{50º e do} ^51º. A localização da mediana e o valor da mediana não são os mesmos. A letra maiúscula$M$ é frequentemente usada para representar a mediana. O próximo exemplo ilustra a localização da mediana e o valor da mediana.

Exemplo$\PageIndex{1}$

Os dados da AIDS que indicam o número de meses que um paciente com AIDS vive após tomar um novo medicamento com anticorpos são os seguintes (do menor para o maior):

3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 35; 37; 40; 44; 44; 47

Calcule a média e a mediana.

Responda

O cálculo da média é:

\[\bar{x} = \dfrac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+(16)(2)+...+35+37+40+(44)(2)+47]}{40} = 23.6\]

Para encontrar a mediana$M$, primeiro use a fórmula para a localização. A localização é:

\[\dfrac{n+1}{2} = \dfrac{40+1}{2} = 20.5\]

^{Começando pelo menor valor, a mediana está localizada entre os valores 20 e ²¹ (os dois 24s):}

3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 35; 37; 40; 44; 44; 47

\[M = \dfrac{24+24}{2} = 24\]

Calculadora

Para encontrar a média e a mediana:

Limpar a lista L1. Pressione START 4:CLRList. Insira o 2º 1 para a lista L1. Pressione ENTER.

Insira os dados no editor de listas. Pressione STAT 1:EDIT.

Coloque os valores dos dados na lista L1.

Pressione STAT e seta para CALC. Pressione 1:1 -VARStats. Pressione 2nd 1 para L1 e depois ENTER.

Pressione as teclas de seta para baixo e para cima para rolar.

$\bar{x}$= 23,6, M = 24

Exercício$\PageIndex{1}$

Os dados a seguir mostram o número de meses que os pacientes normalmente esperam em uma lista de transplantes antes de serem submetidos à cirurgia. Os dados são ordenados do menor para o maior. Calcule a média e a mediana.

3; 4; 5; 7; 7; 7; 8; 8; 9; 9; 10; 10; 10; 10; 10; 11; 12; 12; 13; 14; 14; 15; 15; 17; 17; 18; 19; 19; 19; 21; 22; 23; 24; 24; 24; 24; 24; 24; 24; 24

Responda

Média:$3 + 4 + 5 + 7 + 7 + 7 + 7 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 10 + 10 + 11 + 12 + 12 + 13 + 14 + 14 + 15 + 15 + 17 + 17 + 18 + 19 + 19 + 19 + 21 + 21 + 22 + 22 + 23 + 24 + 24 + 24 = 544$

\[\dfrac{544}{39} = 13.95\]

Mediana: Começando pelo menor valor, a mediana é o ^20º termo, que é 13.

Exemplo$\PageIndex{2}$

Suponha que em uma pequena cidade de 50 pessoas, uma pessoa ganhe $5.000.000 por ano e as outras 49 ganhem $30.000 cada. Qual é a melhor medida do “centro”: a média ou a mediana?

Solução

\[\bar{x} = \dfrac{5,000,000+49(30,000)}{50} = 129,400\]

$M = 30,000$

(Há 49 pessoas que ganham $30.000 e uma pessoa que ganha $5.000.000.)

A mediana é uma medida melhor do “centro” do que a média porque 49 dos valores são 30.000 e um é 5.000.000. O 5.000.000 é um outlier. Os 30.000 nos dão uma melhor noção do meio dos dados.

Exercício$\PageIndex{2}$

Em uma amostra de 60 famílias, uma casa vale $2.500.000. Metade do resto vale $280.000 e todos os outros valem $315.000. Qual é a melhor medida do “centro”: a média ou a mediana?

Responda

A mediana é a melhor medida do “centro” do que a média porque 59 dos valores são $280.000 e um é $2.500.000. Os $2.500.000 são um outlier. Ou $280.000 ou $315.000 nos dão uma melhor noção do meio dos dados.

Outra medida do centro é o modo. O modo é o valor mais frequente. Pode haver mais de um modo em um conjunto de dados, desde que esses valores tenham a mesma frequência e essa frequência seja a mais alta. Um conjunto de dados com dois modos é chamado de bimodal.

Exemplo$\PageIndex{3}$

As notas dos exames estatísticos para 20 alunos são as seguintes:

50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93

Encontre o modo.

Responda

A pontuação mais frequente é 72, o que ocorre cinco vezes. Modo = 72.

Exercício$\PageIndex{3}$

O número de livros retirados da biblioteca de 25 estudantes é o seguinte:

0; 0; 0; 1; 2; 3; 4; 4; 5; 5; 7; 7; 7; 7; 8; 8; 8; 9; 10; 11; 11; 12; 12; 12

Encontre o modo.

Responda

O número mais frequente de livros é 7, o que ocorre quatro vezes. Modo = 7.

Exemplo$\PageIndex{4}$

Cinco notas de exames imobiliários são 430, 430, 480, 480, 495. O conjunto de dados é bimodal porque as pontuações 430 e 480 ocorrem duas vezes cada.

Quando o modo é a melhor medida do “centro”? Considere um programa de perda de peso que anuncia uma perda média de peso de seis libras na primeira semana do programa. O modo pode indicar que a maioria das pessoas perde dois quilos na primeira semana, tornando o programa menos atraente.

O modo pode ser calculado tanto para dados qualitativos quanto para dados quantitativos. Por exemplo, se o conjunto de dados for: vermelho, vermelho, verde, verde, amarelo, roxo, preto, azul, o modo será vermelho.

O software estatístico calculará facilmente a média, a mediana e o modo. Algumas calculadoras gráficas também podem fazer esses cálculos. No mundo real, as pessoas fazem esses cálculos usando software.

Exercício$\PageIndex{4}$

Cinco pontuações de crédito são 680, 680, 700, 720, 720. O conjunto de dados é bimodal porque as pontuações 680 e 720 ocorrem duas vezes. Considere os ganhos anuais dos trabalhadores em uma fábrica. O modo é de $25.000 e ocorre 150 vezes em 301. A mediana é de $50.000 e a média é de $47.500. Qual seria a melhor medida do “centro”?

Responda

Como $25.000 ocorre quase a metade do tempo, o modo seria a melhor medida do centro porque a mediana e a média não representam o que a maioria das pessoas faz na fábrica.

A Lei dos Grandes Números e a Média

A Lei dos Grandes Números diz que, se você coletar amostras de tamanho cada vez maior de qualquer população, é muito provável que a média$\bar{x}$ da amostra se aproxime cada vez mais$\mu$. Isso é discutido com mais detalhes posteriormente no texto.

Distribuições de amostragem e estatística de uma distribuição amostral

Você pode pensar em uma distribuição de amostragem como uma distribuição de frequência relativa com muitas amostras. (Consulte Amostragem e dados para uma revisão da frequência relativa). Suponha que trinta estudantes selecionados aleatoriamente tenham sido questionados sobre o número de filmes que assistiram na semana anterior. Os resultados estão na tabela de frequência relativa mostrada abaixo.

Nº de filmes	Frequência relativa
0	$\dfrac{5}{30}$
1	$\dfrac{15}{30}$
2	$\dfrac{6}{30}$
3	$\dfrac{3}{30}$
4	$\dfrac{1}{30}$

Se você deixar o número de amostras ficar muito grande (digamos, 300 milhões ou mais), a tabela de frequência relativa se torna uma distribuição de frequência relativa.

Uma estatística é um número calculado a partir de uma amostra. Os exemplos estatísticos incluem a média, a mediana e o modo, além de outros. A média da amostra$\bar{x}$ é um exemplo de estatística que estima a média da população$\mu$.

Calculando a média das tabelas de frequência agrupadas

Quando somente dados agrupados estão disponíveis, você não conhece os valores de dados individuais (só conhecemos intervalos e frequências de intervalo); portanto, você não pode calcular uma média exata para o conjunto de dados. O que devemos fazer é estimar a média real calculando a média de uma tabela de frequência. Uma tabela de frequência é uma representação de dados na qual dados agrupados são exibidos junto com as frequências correspondentes. Para calcular a média de uma tabela de frequência agrupada, podemos aplicar a definição básica de média:

\[mean = \dfrac{\text{data sum}}{\text{number of data values}}.\]

Simplesmente precisamos modificar a definição para caber nas restrições de uma tabela de frequência.

Como não conhecemos os valores de dados individuais, podemos encontrar o ponto médio de cada intervalo. O ponto médio é

\[\dfrac{\text{lower boundary+upper boundary}}{2}.\]

Agora podemos modificar a definição média para ser

\[\text{Mean of Frequency Table} = \dfrac{\sum{fm}}{\sum{f}}\]

onde$f$ é a frequência do intervalo e$m $ é o ponto médio do intervalo.

Exemplo$\PageIndex{5}$

Uma tabela de frequência exibindo o último teste estatístico do professor Blount é mostrada. Encontre a melhor estimativa da média da classe.

Intervalo escolar	Número de estudantes
50—56,5	1
56,5—62,5	0
62,5—68,5	4
68,5 a 74,5	4
74,5—80,5	2
80,5—86,5	3
86,5—92,5	4
92,5 a 98,5	1

Solução

Encontre os pontos médios para todos os intervalos

Intervalo escolar	Ponto médio
50—56,5	53,25
56,5—62,5	59,5
62,5—68,5	65,5
68,5 a 74,5	71,5
74,5—80,5	77,5
80,5—86,5	83,5
86,5—92,5	89,5
92,5 a 98,5	95,5

Calcule a soma do produto de cada intervalo, frequência e ponto médio. $\sum{fm} 53.25(1) + 59.5(0) + 65.5(4 )+ 71.5(4) + 77.5(2) + 83.5(3) + 89.5(4) + 95.5(1) = 1460.25$
$\mu = \dfrac{\sum{fm}}{\sum{f}} = \dfrac{1460.25}{19} = 76.86$

Exercício$\PageIndex{5}$

Maris conduziu um estudo sobre o efeito que jogar videogame tem na recuperação da memória. Como parte de seu estudo, ela compilou os seguintes dados:

Horas que os adolescentes gastam em videogames	Número de adolescentes
0—3,5	3
3,5—7,5	7
7,5—11,5	12
11,5—15,5	7
15,5—19,5	9

Qual é a melhor estimativa para o número médio de horas gastas jogando videogame?

Responda

Encontre o ponto médio de cada intervalo, multiplique pelo número correspondente de adolescentes, adicione os resultados e divida pelo número total de adolescentes

Os pontos médios são 1,75, 5,5, 9,5, 13,5, 17,5.

\[Mean = (1.75)(3) + (5.5)(7) + (9.5)(12) + (13.5)(7) + (17.5)(9) = 409.75\]

Referências

Dados do Banco Mundial, disponíveis on-line em http://www.worldbank.org (acessado em 3 de abril de 2013).
“Demografia: obesidade — taxa de prevalência em adultos.” Indexmundi. Disponível on-line em http://www.indexmundi.com/g/r.aspx?t=50&v=2228&l=en (acessado em 3 de abril de 2013).

Revisão

A média e a mediana podem ser calculadas para ajudar você a encontrar o “centro” de um conjunto de dados. A média é a melhor estimativa para o conjunto de dados real, mas a mediana é a melhor medida quando um conjunto de dados contém vários valores atípicos ou valores extremos. O modo mostrará os dados (ou dados) que ocorrem com mais frequência em seu conjunto de dados. A média, a mediana e o modo são extremamente úteis quando você precisa analisar seus dados, mas se o conjunto de dados consistir em intervalos sem valores específicos, a média pode parecer impossível de calcular. No entanto, a média pode ser aproximada se você adicionar o limite inferior com o limite superior e dividir por dois para encontrar o ponto médio de cada intervalo. Multiplique cada ponto médio pelo número de valores encontrados no intervalo correspondente. Divida a soma desses valores pelo número total de valores de dados no conjunto.

Revisão da fórmula

\[\mu = \dfrac{\sum{fm}}{\sum{f}} \]

onde$f$ = frequências de intervalo e$m$ = pontos médios do intervalo.

Exercício 2.6.6

Encontre a média para as tabelas de frequência a seguir.

Grau	Frequência
49,5 a 59,5	2
59,5 a 69,5	3
69,5 a 79,5	8
79,5 a 89,5	12
89,5 a 99,5	5

Baixa temperatura diária	Frequência
49,5 a 59,5	53
59,5 a 69,5	32
69,5 a 79,5	15
79,5 a 89,5	1
89,5 a 99,5	0

Pontos por jogo	Frequência
49,5 a 59,5	14
59,5 a 69,5	32
69,5 a 79,5	15
79,5 a 89,5	23
89,5 a 99,5	2

Use as informações a seguir para responder aos próximos três exercícios: Os dados a seguir mostram o comprimento dos barcos atracados em uma marina. Os dados são ordenados do menor para o maior: 16; 17; 19; 20; 20; 21; 23; 24; 25; 25; 25; 26; 27; 27; 27; 27; 28; 29; 30; 32; 33; 33; 34; 35; 37; 39; 40

Exercício 2.6.7

Calcule a média.

Responda

Significa:$16 + 17 + 19 + 20 + 20 + 21 + 23 + 24 + 25 + 25 + 25 + 26 + 26 + 27 + 27 + 27 + 28 + 29 + 30 + 32 + 33 + 33 + 34 + 35 + 37 + 39 + 40 = 738$;

$\dfrac{738}{27} = 27.33$

Exercício 2.6.8

Identifique a mediana.

Exercício 2.6.9

Identifique o modo.

Responda

Os comprimentos mais frequentes são 25 e 27, que ocorrem três vezes. Modo = 25, 27

Use as seguintes informações para responder aos próximos três exercícios: Sessenta e cinco vendedores de carros selecionados aleatoriamente foram questionados sobre o número de carros que eles geralmente vendem em uma semana. Quatorze pessoas responderam que geralmente vendem três carros; dezenove geralmente vendem quatro carros; doze geralmente vendem cinco carros; nove geralmente vendem seis carros; onze geralmente vendem sete carros. Calcule o seguinte:

Exercício 2.6.10

média da amostra =$\bar{x}$ = _______

Exercício 2.6.11

mediana = _______

Responda

Reunindo tudo

Exercício 2.6.12

Javier e Ercilia são supervisores em um shopping center. Cada um recebeu a tarefa de estimar a distância média que os compradores vivem do shopping. Cada um deles entrevistou aleatoriamente 100 compradores. As amostras produziram as seguintes informações.

	Javier	Ercilia
$\bar{x}$	6,0 milhas	6,0 milhas
s	4,0 milhas	7,0 milhas

Como você pode determinar qual pesquisa estava correta?
Explique o que a diferença nos resultados das pesquisas implica sobre os dados.
Se os dois histogramas mostrarem a distribuição de valores para cada supervisor, qual deles representa a amostra de Ercilia? Como você sabe?

Isso mostra dois histogramas. O primeiro histograma mostra uma distribuição bastante simétrica com um modo de 6. O segundo histograma mostra uma distribuição uniforme. — Figura$\PageIndex{1}$

Se os gráficos de duas caixas mostrarem a distribuição de valores para cada supervisor, qual deles mostra a amostra de Ercilia? Como você sabe? <figure >

Isso mostra dois boxplots horizontais. O primeiro boxplot é representado graficamente sobre uma reta numérica de 0 a 21. O primeiro bigode se estende de 0 a 1. A caixa começa no primeiro quartil, 1, e termina no terceiro quartil, 14. Uma linha vertical tracejada marca a mediana em 6. O segundo bigode se estende do terceiro quartil até o maior valor, 21. O segundo boxplot é representado graficamente sobre uma reta numérica de 0 a 12. O primeiro bigode se estende de 0 a 4. A caixa começa no primeiro quartil, 4, e termina no terceiro quartil, 9. Uma linha vertical tracejada marca a mediana em 6. O segundo bigode se estende do terceiro quartil até o maior valor, 12. — Figura$\PageIndex{2}$

Use as informações a seguir para responder aos próximos três exercícios: Estamos interessados no número de anos em que os alunos de uma determinada aula de estatística elementar moraram na Califórnia. As informações na tabela a seguir são de toda a seção.

Número de anos	Frequência	Número de anos	Frequência
			Total = 20
7	1	22	1
14	3	23	1
15	1	26	1
18	1	40	2
19	4	42	2
20	3

Exercício 2.6.13

O que é o IQR?

Responda

uma

Exercício 2.6.14

Qual é o modo?

19
19,5
14 e 20
22,65

Exercício 2.6.15

Isso é uma amostra ou toda a população?

amostra
população inteira
nem

Responda

Glossário

Tabela de frequências: uma representação de dados na qual os dados agrupados são exibidos junto com as frequências correspondentes
Significa: um número que mede a tendência central dos dados; um nome comum para média é “média”. O termo “média” é uma forma abreviada de “média aritmética”. Por definição, a média de uma amostra (indicada por$\bar{x}$) é$\bar{x} = \dfrac{\text{Sum of all values in the sample}}{\text{Number of values in the sample}}$, e a média de uma população (indicada por$\mu$) é$\mu = \dfrac{\text{Sum of all values in the population}}{\text{Number of values in the population}}$.
Mediana: um número que separa os dados ordenados em metades; metade dos valores são o mesmo número ou menores que a mediana e metade dos valores são o mesmo número ou maiores que a mediana. A mediana pode ou não fazer parte dos dados.
Ponto médio: a média de um intervalo em uma tabela de frequência
Modo: o valor que aparece com mais frequência em um conjunto de dados

Nº de filmes	Frequência relativa
0	\(\dfrac{5}{30}\)
1	\(\dfrac{15}{30}\)
2	\(\dfrac{6}{30}\)
3	\(\dfrac{3}{30}\)
4	\(\dfrac{1}{30}\)