Skip to main content
Global

2.6: Medidas do Centro dos Dados

  • Page ID
    190137
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    O “centro” de um conjunto de dados também é uma forma de descrever a localização. As duas medidas mais usadas do “centro” dos dados são a média (média) e a mediana. Para calcular o peso médio de 50 pessoas, adicione os 50 pesos e divida por 50. Para encontrar o peso médio das 50 pessoas, ordene os dados e encontre o número que divide os dados em duas partes iguais. A mediana geralmente é uma medida melhor do centro quando há valores extremos ou valores atípicos porque não é afetada pelos valores numéricos precisos dos valores atípicos. A média é a medida mais comum do centro.

    As palavras “média” e “média” são frequentemente usadas de forma intercambiável. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é “média aritmética” e “média” é tecnicamente uma localização central. No entanto, na prática entre não estatísticos, “média” é comumente aceita como “média aritmética”.

    Quando cada valor no conjunto de dados não é exclusivo, a média pode ser calculada multiplicando cada valor distinto por sua frequência e, em seguida, dividindo a soma pelo número total de valores de dados. A letra usada para representar a média da amostra é a\(x\) com uma barra sobre ela (pronunciado “\(x\)bar”):\(\overline{x}\).

    A letra grega\(\mu\) (pronunciada “mew”) representa a média da população. Um dos requisitos para que a média da amostra seja uma boa estimativa da média da população é que a amostra coletada seja verdadeiramente aleatória.

    Para ver que as duas formas de calcular a média são iguais, considere a amostra:

    1; 1; 1; 2; 2; 3; 4; 4; 4; 4;

    \[\bar{x} = \dfrac{1+1+1+2+2+3+4+4+4+4+4}{11} = 2.7\]

    \[\bar{x} = \dfrac{3(1) + 2(2) + 1(3) + 5(4)}{11} = 2.7\]

    No segundo cálculo, as frequências são 3, 2, 1 e 5.

    Você pode encontrar rapidamente a localização da mediana usando a expressão

    \[\dfrac{n+1}{2}\]

    A letra\(n\) é o número total de valores de dados na amostra. Se\(n\) for um número ímpar, a mediana é o valor médio dos dados ordenados (ordenados do menor para o maior). Se\(n\) for um número par, a mediana é igual aos dois valores médios somados e divididos por dois depois que os dados foram ordenados. Por exemplo, se o número total de valores de dados for 97, então

    \[\dfrac{n+1}{2} = \dfrac{97+1}{2} = 49.\]

    A mediana é o 49º valor nos dados ordenados. Se o número total de valores de dados for 100, então

    \[\dfrac{n+1}{2} = \dfrac{100+1}{2} = 50.5.\]

    A mediana ocorre a meio caminho entre os valores do 50º e do 51º. A localização da mediana e o valor da mediana não são os mesmos. A letra maiúscula\(M\) é frequentemente usada para representar a mediana. O próximo exemplo ilustra a localização da mediana e o valor da mediana.

    Exemplo\(\PageIndex{1}\)

    Os dados da AIDS que indicam o número de meses que um paciente com AIDS vive após tomar um novo medicamento com anticorpos são os seguintes (do menor para o maior):

    3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 35; 37; 40; 44; 44; 47

    Calcule a média e a mediana.

    Responda

    O cálculo da média é:

    \[\bar{x} = \dfrac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+(16)(2)+...+35+37+40+(44)(2)+47]}{40} = 23.6\]

    Para encontrar a mediana\(M\), primeiro use a fórmula para a localização. A localização é:

    \[\dfrac{n+1}{2} = \dfrac{40+1}{2} = 20.5\]

    Começando pelo menor valor, a mediana está localizada entre os valores 20 e 21 (os dois 24s):

    3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 35; 37; 40; 44; 44; 47

    \[M = \dfrac{24+24}{2} = 24\]

    Calculadora

    Para encontrar a média e a mediana:

    Limpar a lista L1. Pressione START 4:CLRList. Insira o 2º 1 para a lista L1. Pressione ENTER.

    Insira os dados no editor de listas. Pressione STAT 1:EDIT.

    Coloque os valores dos dados na lista L1.

    Pressione STAT e seta para CALC. Pressione 1:1 -VARStats. Pressione 2nd 1 para L1 e depois ENTER.

    Pressione as teclas de seta para baixo e para cima para rolar.

    \(\bar{x}\)= 23,6, M = 24

    Exercício\(\PageIndex{1}\)

    Os dados a seguir mostram o número de meses que os pacientes normalmente esperam em uma lista de transplantes antes de serem submetidos à cirurgia. Os dados são ordenados do menor para o maior. Calcule a média e a mediana.

    3; 4; 5; 7; 7; 7; 8; 8; 9; 9; 10; 10; 10; 10; 10; 11; 12; 12; 13; 14; 14; 15; 15; 17; 17; 18; 19; 19; 19; 21; 22; 23; 24; 24; 24; 24; 24; 24; 24; 24

    Responda

    Média:\(3 + 4 + 5 + 7 + 7 + 7 + 7 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 10 + 10 + 11 + 12 + 12 + 13 + 14 + 14 + 15 + 15 + 17 + 17 + 18 + 19 + 19 + 19 + 21 + 21 + 22 + 22 + 23 + 24 + 24 + 24 = 544\)

    \[\dfrac{544}{39} = 13.95\]

    Mediana: Começando pelo menor valor, a mediana é o 20º termo, que é 13.

    Exemplo\(\PageIndex{2}\)

    Suponha que em uma pequena cidade de 50 pessoas, uma pessoa ganhe $5.000.000 por ano e as outras 49 ganhem $30.000 cada. Qual é a melhor medida do “centro”: a média ou a mediana?

    Solução

    \[\bar{x} = \dfrac{5,000,000+49(30,000)}{50} = 129,400\]

    \(M = 30,000\)

    (Há 49 pessoas que ganham $30.000 e uma pessoa que ganha $5.000.000.)

    A mediana é uma medida melhor do “centro” do que a média porque 49 dos valores são 30.000 e um é 5.000.000. O 5.000.000 é um outlier. Os 30.000 nos dão uma melhor noção do meio dos dados.

    Exercício\(\PageIndex{2}\)

    Em uma amostra de 60 famílias, uma casa vale $2.500.000. Metade do resto vale $280.000 e todos os outros valem $315.000. Qual é a melhor medida do “centro”: a média ou a mediana?

    Responda

    A mediana é a melhor medida do “centro” do que a média porque 59 dos valores são $280.000 e um é $2.500.000. Os $2.500.000 são um outlier. Ou $280.000 ou $315.000 nos dão uma melhor noção do meio dos dados.

    Outra medida do centro é o modo. O modo é o valor mais frequente. Pode haver mais de um modo em um conjunto de dados, desde que esses valores tenham a mesma frequência e essa frequência seja a mais alta. Um conjunto de dados com dois modos é chamado de bimodal.

    Exemplo\(\PageIndex{3}\)

    As notas dos exames estatísticos para 20 alunos são as seguintes:

    50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93

    Encontre o modo.

    Responda

    A pontuação mais frequente é 72, o que ocorre cinco vezes. Modo = 72.

    Exercício\(\PageIndex{3}\)

    O número de livros retirados da biblioteca de 25 estudantes é o seguinte:

    0; 0; 0; 1; 2; 3; 4; 4; 5; 5; 7; 7; 7; 7; 8; 8; 8; 9; 10; 11; 11; 12; 12; 12

    Encontre o modo.

    Responda

    O número mais frequente de livros é 7, o que ocorre quatro vezes. Modo = 7.

    Exemplo\(\PageIndex{4}\)

    Cinco notas de exames imobiliários são 430, 430, 480, 480, 495. O conjunto de dados é bimodal porque as pontuações 430 e 480 ocorrem duas vezes cada.

    Quando o modo é a melhor medida do “centro”? Considere um programa de perda de peso que anuncia uma perda média de peso de seis libras na primeira semana do programa. O modo pode indicar que a maioria das pessoas perde dois quilos na primeira semana, tornando o programa menos atraente.

    O modo pode ser calculado tanto para dados qualitativos quanto para dados quantitativos. Por exemplo, se o conjunto de dados for: vermelho, vermelho, verde, verde, amarelo, roxo, preto, azul, o modo será vermelho.

    O software estatístico calculará facilmente a média, a mediana e o modo. Algumas calculadoras gráficas também podem fazer esses cálculos. No mundo real, as pessoas fazem esses cálculos usando software.

    Exercício\(\PageIndex{4}\)

    Cinco pontuações de crédito são 680, 680, 700, 720, 720. O conjunto de dados é bimodal porque as pontuações 680 e 720 ocorrem duas vezes. Considere os ganhos anuais dos trabalhadores em uma fábrica. O modo é de $25.000 e ocorre 150 vezes em 301. A mediana é de $50.000 e a média é de $47.500. Qual seria a melhor medida do “centro”?

    Responda

    Como $25.000 ocorre quase a metade do tempo, o modo seria a melhor medida do centro porque a mediana e a média não representam o que a maioria das pessoas faz na fábrica.

    A Lei dos Grandes Números e a Média

    A Lei dos Grandes Números diz que, se você coletar amostras de tamanho cada vez maior de qualquer população, é muito provável que a média\(\bar{x}\) da amostra se aproxime cada vez mais\(\mu\). Isso é discutido com mais detalhes posteriormente no texto.

    Distribuições de amostragem e estatística de uma distribuição amostral

    Você pode pensar em uma distribuição de amostragem como uma distribuição de frequência relativa com muitas amostras. (Consulte Amostragem e dados para uma revisão da frequência relativa). Suponha que trinta estudantes selecionados aleatoriamente tenham sido questionados sobre o número de filmes que assistiram na semana anterior. Os resultados estão na tabela de frequência relativa mostrada abaixo.

    Nº de filmes Frequência relativa
    0

    \(\dfrac{5}{30}\)

    1

    \(\dfrac{15}{30}\)

    2

    \(\dfrac{6}{30}\)

    3

    \(\dfrac{3}{30}\)

    4

    \(\dfrac{1}{30}\)

    Se você deixar o número de amostras ficar muito grande (digamos, 300 milhões ou mais), a tabela de frequência relativa se torna uma distribuição de frequência relativa.

    Uma estatística é um número calculado a partir de uma amostra. Os exemplos estatísticos incluem a média, a mediana e o modo, além de outros. A média da amostra\(\bar{x}\) é um exemplo de estatística que estima a média da população\(\mu\).

    Calculando a média das tabelas de frequência agrupadas

    Quando somente dados agrupados estão disponíveis, você não conhece os valores de dados individuais (só conhecemos intervalos e frequências de intervalo); portanto, você não pode calcular uma média exata para o conjunto de dados. O que devemos fazer é estimar a média real calculando a média de uma tabela de frequência. Uma tabela de frequência é uma representação de dados na qual dados agrupados são exibidos junto com as frequências correspondentes. Para calcular a média de uma tabela de frequência agrupada, podemos aplicar a definição básica de média:

    \[mean = \dfrac{\text{data sum}}{\text{number of data values}}.\]

    Simplesmente precisamos modificar a definição para caber nas restrições de uma tabela de frequência.

    Como não conhecemos os valores de dados individuais, podemos encontrar o ponto médio de cada intervalo. O ponto médio é

    \[\dfrac{\text{lower boundary+upper boundary}}{2}.\]

    Agora podemos modificar a definição média para ser

    \[\text{Mean of Frequency Table} = \dfrac{\sum{fm}}{\sum{f}}\]

    onde\(f\) é a frequência do intervalo e\(m \) é o ponto médio do intervalo.

    Exemplo\(\PageIndex{5}\)

    Uma tabela de frequência exibindo o último teste estatístico do professor Blount é mostrada. Encontre a melhor estimativa da média da classe.

    Intervalo escolar Número de estudantes
    50—56,5 1
    56,5—62,5 0
    62,5—68,5 4
    68,5 a 74,5 4
    74,5—80,5 2
    80,5—86,5 3
    86,5—92,5 4
    92,5 a 98,5 1

    Solução

    • Encontre os pontos médios para todos os intervalos
    Intervalo escolar Ponto médio
    50—56,5 53,25
    56,5—62,5 59,5
    62,5—68,5 65,5
    68,5 a 74,5 71,5
    74,5—80,5 77,5
    80,5—86,5 83,5
    86,5—92,5 89,5
    92,5 a 98,5 95,5
    • Calcule a soma do produto de cada intervalo, frequência e ponto médio. \(\sum{fm} 53.25(1) + 59.5(0) + 65.5(4 )+ 71.5(4) + 77.5(2) + 83.5(3) + 89.5(4) + 95.5(1) = 1460.25\)
    • \(\mu = \dfrac{\sum{fm}}{\sum{f}} = \dfrac{1460.25}{19} = 76.86\)

    Exercício\(\PageIndex{5}\)

    Maris conduziu um estudo sobre o efeito que jogar videogame tem na recuperação da memória. Como parte de seu estudo, ela compilou os seguintes dados:

    Horas que os adolescentes gastam em videogames Número de adolescentes
    0—3,5 3
    3,5—7,5 7
    7,5—11,5 12
    11,5—15,5 7
    15,5—19,5 9

    Qual é a melhor estimativa para o número médio de horas gastas jogando videogame?

    Responda

    Encontre o ponto médio de cada intervalo, multiplique pelo número correspondente de adolescentes, adicione os resultados e divida pelo número total de adolescentes

    Os pontos médios são 1,75, 5,5, 9,5, 13,5, 17,5.

    \[Mean = (1.75)(3) + (5.5)(7) + (9.5)(12) + (13.5)(7) + (17.5)(9) = 409.75\]

    Referências

    1. Dados do Banco Mundial, disponíveis on-line em http://www.worldbank.org (acessado em 3 de abril de 2013).
    2. “Demografia: obesidade — taxa de prevalência em adultos.” Indexmundi. Disponível on-line em http://www.indexmundi.com/g/r.aspx?t=50&v=2228&l=en (acessado em 3 de abril de 2013).

    Revisão

    A média e a mediana podem ser calculadas para ajudar você a encontrar o “centro” de um conjunto de dados. A média é a melhor estimativa para o conjunto de dados real, mas a mediana é a melhor medida quando um conjunto de dados contém vários valores atípicos ou valores extremos. O modo mostrará os dados (ou dados) que ocorrem com mais frequência em seu conjunto de dados. A média, a mediana e o modo são extremamente úteis quando você precisa analisar seus dados, mas se o conjunto de dados consistir em intervalos sem valores específicos, a média pode parecer impossível de calcular. No entanto, a média pode ser aproximada se você adicionar o limite inferior com o limite superior e dividir por dois para encontrar o ponto médio de cada intervalo. Multiplique cada ponto médio pelo número de valores encontrados no intervalo correspondente. Divida a soma desses valores pelo número total de valores de dados no conjunto.

    Revisão da fórmula

    \[\mu = \dfrac{\sum{fm}}{\sum{f}} \]

    onde\(f\) = frequências de intervalo e\(m\) = pontos médios do intervalo.

    Exercício 2.6.6

    Encontre a média para as tabelas de frequência a seguir.

    1. Grau Frequência
      49,5 a 59,5 2
      59,5 a 69,5 3
      69,5 a 79,5 8
      79,5 a 89,5 12
      89,5 a 99,5 5
    2. Baixa temperatura diária Frequência
      49,5 a 59,5 53
      59,5 a 69,5 32
      69,5 a 79,5 15
      79,5 a 89,5 1
      89,5 a 99,5 0
    3. Pontos por jogo Frequência
      49,5 a 59,5 14
      59,5 a 69,5 32
      69,5 a 79,5 15
      79,5 a 89,5 23
      89,5 a 99,5 2
    Use as informações a seguir para responder aos próximos três exercícios: Os dados a seguir mostram o comprimento dos barcos atracados em uma marina. Os dados são ordenados do menor para o maior: 16; 17; 19; 20; 20; 21; 23; 24; 25; 25; 25; 26; 27; 27; 27; 27; 28; 29; 30; 32; 33; 33; 34; 35; 37; 39; 40

    Exercício 2.6.7

    Calcule a média.

    Responda

    Significa:\(16 + 17 + 19 + 20 + 20 + 21 + 23 + 24 + 25 + 25 + 25 + 26 + 26 + 27 + 27 + 27 + 28 + 29 + 30 + 32 + 33 + 33 + 34 + 35 + 37 + 39 + 40 = 738\);

    \(\dfrac{738}{27} = 27.33\)

    Exercício 2.6.8

    Identifique a mediana.

    Exercício 2.6.9

    Identifique o modo.

    Responda

    Os comprimentos mais frequentes são 25 e 27, que ocorrem três vezes. Modo = 25, 27

    Use as seguintes informações para responder aos próximos três exercícios: Sessenta e cinco vendedores de carros selecionados aleatoriamente foram questionados sobre o número de carros que eles geralmente vendem em uma semana. Quatorze pessoas responderam que geralmente vendem três carros; dezenove geralmente vendem quatro carros; doze geralmente vendem cinco carros; nove geralmente vendem seis carros; onze geralmente vendem sete carros. Calcule o seguinte:

    Exercício 2.6.10

    média da amostra =\(\bar{x}\) = _______

    Exercício 2.6.11

    mediana = _______

    Responda

    4

    Reunindo tudo

    Exercício 2.6.12

    Javier e Ercilia são supervisores em um shopping center. Cada um recebeu a tarefa de estimar a distância média que os compradores vivem do shopping. Cada um deles entrevistou aleatoriamente 100 compradores. As amostras produziram as seguintes informações.

      Javier Ercilia
    \(\bar{x}\) 6,0 milhas 6,0 milhas
    s 4,0 milhas 7,0 milhas
    1. Como você pode determinar qual pesquisa estava correta?
    2. Explique o que a diferença nos resultados das pesquisas implica sobre os dados.
    3. Se os dois histogramas mostrarem a distribuição de valores para cada supervisor, qual deles representa a amostra de Ercilia? Como você sabe?
    Isso mostra dois histogramas. O primeiro histograma mostra uma distribuição bastante simétrica com um modo de 6. O segundo histograma mostra uma distribuição uniforme.
    Figura\(\PageIndex{1}\)
    1. Se os gráficos de duas caixas mostrarem a distribuição de valores para cada supervisor, qual deles mostra a amostra de Ercilia? Como você sabe? <figure >
    Isso mostra dois boxplots horizontais. O primeiro boxplot é representado graficamente sobre uma reta numérica de 0 a 21. O primeiro bigode se estende de 0 a 1. A caixa começa no primeiro quartil, 1, e termina no terceiro quartil, 14. Uma linha vertical tracejada marca a mediana em 6. O segundo bigode se estende do terceiro quartil até o maior valor, 21. O segundo boxplot é representado graficamente sobre uma reta numérica de 0 a 12. O primeiro bigode se estende de 0 a 4. A caixa começa no primeiro quartil, 4, e termina no terceiro quartil, 9. Uma linha vertical tracejada marca a mediana em 6. O segundo bigode se estende do terceiro quartil até o maior valor, 12.
    Figura\(\PageIndex{2}\)

    Use as informações a seguir para responder aos próximos três exercícios: Estamos interessados no número de anos em que os alunos de uma determinada aula de estatística elementar moraram na Califórnia. As informações na tabela a seguir são de toda a seção.

    Número de anos Frequência Número de anos Frequência
          Total = 20
    7 1 22 1
    14 3 23 1
    15 1 26 1
    18 1 40 2
    19 4 42 2
    20 3    

    Exercício 2.6.13

    O que é o IQR?

    1. 8
    2. 11
    3. 15
    4. 35

    Responda

    uma

    Exercício 2.6.14

    Qual é o modo?

    1. 19
    2. 19,5
    3. 14 e 20
    4. 22,65

    Exercício 2.6.15

    Isso é uma amostra ou toda a população?

    1. amostra
    2. população inteira
    3. nem

    Responda

    b

    Glossário

    Tabela de frequências
    uma representação de dados na qual os dados agrupados são exibidos junto com as frequências correspondentes
    Significa
    um número que mede a tendência central dos dados; um nome comum para média é “média”. O termo “média” é uma forma abreviada de “média aritmética”. Por definição, a média de uma amostra (indicada por\(\bar{x}\)) é\(\bar{x} = \dfrac{\text{Sum of all values in the sample}}{\text{Number of values in the sample}}\), e a média de uma população (indicada por\(\mu\)) é\(\mu = \dfrac{\text{Sum of all values in the population}}{\text{Number of values in the population}}\).
    Mediana
    um número que separa os dados ordenados em metades; metade dos valores são o mesmo número ou menores que a mediana e metade dos valores são o mesmo número ou maiores que a mediana. A mediana pode ou não fazer parte dos dados.
    Ponto médio
    a média de um intervalo em uma tabela de frequência
    Modo
    o valor que aparece com mais frequência em um conjunto de dados