Skip to main content
Global

2.3: Medidas do centro dos dados

  • Page ID
    186609
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    O “centro” de um conjunto de dados também é uma forma de descrever a localização. As duas medidas mais usadas do “centro” dos dados são a média (média) e a mediana. Para calcular o peso médio de 50 pessoas, adicione os 50 pesos e divida por 50. Tecnicamente, essa é a média aritmética. Discutiremos a média geométrica mais tarde. Para encontrar o peso médio das 50 pessoas, ordene os dados e encontre o número que divide os dados em duas partes iguais, o que significa um número igual de observações em cada lado. O peso de 25 pessoas está abaixo desse peso e 25 pessoas são mais pesadas que esse peso. A mediana geralmente é uma medida melhor do centro quando há valores extremos ou valores atípicos porque não é afetada pelos valores numéricos precisos dos valores atípicos. A média é a medida mais comum do centro.

    NOTA

    As palavras “média” e “média” são frequentemente usadas de forma intercambiável. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é “média aritmética” e “média” é tecnicamente uma localização central. Formalmente, a média aritmética é chamada de primeiro momento da distribuição pelos matemáticos. No entanto, na prática entre não estatísticos, “média” é comumente aceita como “média aritmética”.

    Quando cada valor no conjunto de dados não é exclusivo, a média pode ser calculada multiplicando cada valor distinto por sua frequência e, em seguida, dividindo a soma pelo número total de valores de dados. A letra usada para representar a média da amostra é um x com uma barra sobre ela (pronunciado “\(x\)bar”):\(\overline x\).

    A letra grega\(\mu\) (pronunciada “mew”) representa a média da população. Um dos requisitos para que a média da amostra seja uma boa estimativa da média da população é que a amostra coletada seja verdadeiramente aleatória.

    Para ver que as duas formas de calcular a média são iguais, considere a amostra:
    1; 1; 1; 2; 2; 3; 4; 4; 4; 4; 4; 4

    \[\overline{x}=\frac{1+1+1+2+2+3+4+4+4+4+4}{11}=2.7\nonumber\]

    \[\overline{x}=\frac{3(1)+2(2)+1(3)+5(4)}{11}=2.7\nonumber\]

    No segundo cálculo, as frequências são 3, 2, 1 e 5.

    Você pode encontrar rapidamente a localização da mediana usando a expressão\(\frac{n+1}{2}\).

    A letra\(n\) é o número total de valores de dados na amostra. Se\(n\) for um número ímpar, a mediana é o valor médio dos dados ordenados (ordenados do menor para o maior). Se\(n\) for um número par, a mediana é igual aos dois valores médios somados e divididos por dois depois que os dados foram ordenados. Por exemplo, se o número total de valores de dados for 97, então\(\frac{n+1}{2}=\frac{97+1}{2}=49\). A mediana é o 49º valor nos dados ordenados. Se o número total de valores de dados for 100, então\(\frac{n+1}{2}=\frac{100+1}{2}=50.5\). A mediana ocorre a meio caminho entre os valores 50 e 51. A localização da mediana e o valor da mediana não são os mesmos. A letra maiúscula\(M\) é frequentemente usada para representar a mediana. O próximo exemplo ilustra a localização da mediana e o valor da mediana.

    Exemplo 2.24

    Os dados da AIDS que indicam o número de meses que um paciente com AIDS vive após tomar um novo anticorpo são os seguintes (do menor para o maior):
    3; 4; 8; 10; 11; 12; 13; 14; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 25; 26; 26; 27; 29; 29; 31; 33; 22; 24; 25; 26; 27; 29; 31; 32; 33; 33; 34;; 35; 37; 40; 44; 44; 47;
    Calcule a média e a mediana.

    Resposta

    Solução 2.24

    O cálculo da média é:

    \(\overline{x}=\frac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+\ldots+35+37+40+(44)(2)+47]}{40}=23.6\)
    Para encontrar a mediana\(M\), primeiro use a fórmula para a localização. A localização é:
    \(\frac{n+1}{2}=\frac{40+1}{2}=20.5\)
    Começando pelo menor valor, a mediana está localizada entre os valores 20 e 21 (os dois 24s):

    \(3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47;\)

    \(M=\frac{24+24}{2}=24\)

    Exemplo 2.25

    Suponha que em uma pequena cidade de 50 pessoas, uma pessoa ganhe $5.000.000 por ano e as outras 49 ganhem $30.000 cada. Qual é a melhor medida do “centro”: a média ou a mediana?

    Resposta

    Solução 2.25

    \(\overline{x}=\frac{5,000,000+49(30,000)}{50}=129,400\)

    \(M = 30,000\)

    (Há 49 pessoas que ganham $30.000 e uma pessoa que ganha $5.000.000.)

    A mediana é uma medida melhor do “centro” do que a média porque 49 dos valores são 30.000 e um é 5.000.000. O 5.000.000 é um outlier. Os 30.000 nos dão uma melhor noção do meio dos dados.

    Outra medida do centro é o modo. O modo é o valor mais frequente. Pode haver mais de um modo em um conjunto de dados, desde que esses valores tenham a mesma frequência e essa frequência seja a mais alta. Um conjunto de dados com dois modos é chamado de bimodal.

    Exemplo 2.26

    As notas dos exames estatísticos para 20 alunos são as seguintes:

    50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93

    Encontre o modo.

    Resposta

    Solução 2.26

    A pontuação mais frequente é 72, que ocorre cinco vezes. Modo = 72.

    Exemplo 2.27

    Cinco notas de exames imobiliários são 430, 430, 480, 480, 495. O conjunto de dados é bimodal porque as pontuações 430 e 480 ocorrem duas vezes cada.

    Quando o modo é a melhor medida do “centro”? Considere um programa de perda de peso que anuncia uma perda média de peso de seis libras na primeira semana do programa. O modo pode indicar que a maioria das pessoas perde dois quilos na primeira semana, tornando o programa menos atraente.

    NOTA

    O modo pode ser calculado tanto para dados qualitativos quanto para dados quantitativos. Por exemplo, se o conjunto de dados for: vermelho, vermelho, verde, verde, amarelo, roxo, preto, azul, o modo será vermelho.

    Calculando a média aritmética de tabelas de frequência agrupadas

    Quando somente dados agrupados estão disponíveis, você não conhece os valores de dados individuais (só conhecemos intervalos e frequências de intervalo); portanto, você não pode calcular uma média exata para o conjunto de dados. O que devemos fazer é estimar a média real calculando a média de uma tabela de frequência. Uma tabela de frequência é uma representação de dados na qual dados agrupados são exibidos junto com as frequências correspondentes. Para calcular a média de uma tabela de frequência agrupada, podemos aplicar a definição básica de média: média = Simplesmente\(\frac{\text { data sum }}{\text { number of data values }}\) precisamos modificar a definição para caber nas restrições de uma tabela de frequência.

    Como não conhecemos os valores de dados individuais, podemos encontrar o ponto médio de cada intervalo. O ponto médio é\(\frac{\text { lower boundary+upper boundary}}{2}\). Agora podemos modificar a definição da média para\(\textbf{Mean of Frequency Table}=\frac{\sum f m}{\sum f}\) que f = a frequência do intervalo e m = o ponto médio do intervalo.

    Exemplo 2.28

    Uma tabela de frequência exibindo o último teste estatístico do professor Blount é mostrada. Encontre a melhor estimativa da média da classe.

    Intervalo escolar Número de estudantes
    50—56,5 1
    56,5—62,5 0
    62,5 a 68,5 4
    68,5 a 74,5 4
    74,5—80,5 2
    80,5—86,5 3
    86,5—92,5 4
    92,5 a 98,5 1
    Tabela 2.24
    Resposta

    Solução 2.28

    Encontre os pontos médios para todos os intervalos
    Intervalo escolar Ponto médio
    50—56,5 53,25
    56,5—62,5 59,5
    62,5 a 68,5 65,5
    68,5 a 74,5 71,5
    74,5—80,5 77,5
    80,5—86,5 83,5
    86,5—92,5 89,5
    92,5 a 98,5 95,5
    Tabela 2.25
    • Calcule a soma do produto de cada intervalo, frequência e ponto médio. \(\sum f m\)\(53.25(1)+59.5(0)+65.5(4)+71.5(4)+77.5(2)+83.5(3)+89.5(4)+95.5(1)=1460.25\)
    • \(\mu=\frac{\sum f m}{\sum f}=\frac{1460.25}{19}=76.86\)

    Exercício 2.28

    Maris conduziu um estudo sobre o efeito que jogar videogame tem na recuperação da memória. Como parte de seu estudo, ela compilou os seguintes dados:

    Horas que os adolescentes passam em videogames Número de adolescentes
    0—3,5 3
    3,5—7,5 7
    7,5—11,5 12
    11,5—15,5 7
    15,5—19,5 9
    Tabela 2.26

    Qual é a melhor estimativa para o número médio de horas gastas jogando videogame?