Skip to main content
Global

2.2: Medidas da localização dos dados

  • Page ID
    186684
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    As medidas comuns de localização são quartis e percentis

    Os quartis são percentis especiais. O primeiro quartil,\(Q_1\), é o mesmo que o\(25^{th}\) percentil, e o terceiro quartil,\(Q_3\), é o mesmo que o\(75^{th}\) percentil. A mediana, M, é chamada tanto de segundo quartil quanto de percentil 50.

    Para calcular quartis e percentis, os dados devem ser ordenados do menor para o maior. Os quartis dividem os dados ordenados em trimestres. Os percentis dividem os dados ordenados em centésimos. Pontuar no\(90^{th}\) percentil de um exame não significa, necessariamente, que você recebeu 90% em um teste. Isso significa que 90% das pontuações dos testes são iguais ou menores que a sua pontuação e 10% das pontuações do teste são iguais ou superiores à sua pontuação no teste.

    Os percentis são úteis para comparar valores. Por esse motivo, universidades e faculdades usam percentis extensivamente. Um exemplo em que faculdades e universidades usam percentis é quando os resultados do SAT são usados para determinar uma pontuação mínima do teste que será usada como um fator de aceitação. Por exemplo, suponha que Duke aceite pontuações do SAT iguais ou superiores ao\(75^{th}\) percentil. Isso se traduz em uma pontuação de pelo menos 1220.

    Os percentis são usados principalmente com populações muito grandes. Portanto, se você dissesse que 90% das pontuações dos testes são menores (e não iguais ou menores) do que sua pontuação, seria aceitável porque a remoção de um determinado valor de dados não é significativa.

    A mediana é um número que mede o “centro” dos dados. Você pode pensar na mediana como o “valor médio”, mas na verdade ela não precisa ser um dos valores observados. É um número que separa os dados ordenados em metades. Metade dos valores são do mesmo número ou menores que a mediana, e metade dos valores são o mesmo número ou maiores. Por exemplo, considere os dados a seguir.
    \(1; 11.5; 6; 7.2; 4; 8; 9; 10; 6.8; 8.3; 2; 2; 10; 1\)
    Ordenado do menor para o maior:
    \(1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5\)

    Como existem 14 observações, a mediana está entre o sétimo valor, 6,8, e o oitavo valor, 7,2. Para encontrar a mediana, adicione os dois valores e divida por dois.

    \[\frac{6.8+7.2}{2}=7\nonumber\]

    A mediana é sete. Metade dos valores são menores que sete e metade dos valores são maiores que sete.

    Os quartis são números que separam os dados em trimestres. Os quartis podem ou não fazer parte dos dados. Para encontrar os quartis, primeiro encontre a mediana ou o segundo quartil. O primeiro quartil\(Q_1\),, é o valor médio da metade inferior dos dados, e o terceiro quartil,\(Q_3\), é o valor médio, ou mediana, da metade superior dos dados. Para ter uma ideia, considere o mesmo conjunto de dados:
    1; 1; 2; 2; 4; 6; 6,8; 7,2; 8; 8,3; 9; 10; 10; 11,5

    A mediana ou o segundo quartil é sete. A metade inferior dos dados é 1, 1, 2, 2, 4, 6, 6,8. O valor médio da metade inferior é dois.
    1; 1; 2; 2; 4; 6; 6,8

    O número dois, que faz parte dos dados, é o primeiro quartil. Um quarto dos conjuntos inteiros de valores são iguais ou menores que dois e três quartos dos valores são maiores que dois.

    A metade superior dos dados é 7,2, 8, 8,3, 9, 10, 10, 11,5. O valor médio da metade superior é nove.

    O terceiro quartil,\(Q_3\), é nove. Três quartos (75%) do conjunto de dados ordenado são menores que nove. Um quarto (25%) do conjunto de dados ordenado é maior que nove. O terceiro quartil faz parte do conjunto de dados neste exemplo.

    O intervalo interquartil é um número que indica a dispersão da metade média ou dos 50% médios dos dados. É a diferença entre o terceiro quartil (\(Q_3\)) e o primeiro quartil (\(Q_1\)).

    \(IQR = Q_3 – Q_1\)

    Isso\(IQR\) pode ajudar a determinar possíveis valores atípicos. Suspeita-se que um valor seja um valor atípico em potencial se for menor que\(\bf{(1.5)(IQR)\) abaixo do primeiro quartil ou maior do que\(\bf{(1.5)(IQR)}\) acima do terceiro quartil. Possíveis valores atípicos sempre exigem uma investigação mais aprofundada.

    potencial outlier

    Um potencial outlier é um ponto de dados significativamente diferente dos outros pontos de dados. Esses pontos de dados especiais podem ser erros ou algum tipo de anormalidade ou podem ser a chave para entender os dados.

    Exemplo\(\PageIndex{14}\)

    Para os 13 preços imobiliários a seguir,\(IQR\) calcule e determine se os preços são possíveis valores atípicos. Os preços estão em dólares.
    \(389,950; 230,500; 158,000; 479,000; 639,000; 114,950; 5,500,000; 387,000; 659,000; 529,000; 575,000; 488,800; 1,095,000\)

    Responda

    Solução 2.14

    Ordene os dados do menor para o maior.

    \(114,950; 158,000; 230,500; 387,000; 389,950; 479,000; 488,800; 529,000; 575,000; 639,000; 659,000; 1,095,000; 5,500,000\)

    \(M = 488,800\)

    \(Q_{1}=\frac{230,500+387,000}{2}=308,750\)

    \(Q_{3}=\frac{639,000+659,000}{2}=649,000\)

    \(IQR = 649,000 – 308,750 = 340,250\)

    \((1.5)(IQR) = (1.5)(340,250) = 510,375\)

    \(Q_1 – (1.5)(IQR) = 308,750 – 510,375 = –201,625\)

    \(Q_3 + (1.5)(IQR) = 649,000 + 510,375 = 1,159,375\)

    Nenhum preço da casa é menor que\(–201,625\). No entanto,\(5,500,000\) é mais do que\(1,159,375\). Portanto,\(5,500,000\) é um potencial outlier.

    Exemplo\(\PageIndex{15}\)

    Para os dois conjuntos de dados no exemplo das pontuações dos testes, encontre o seguinte:

    1. A faixa interquartil. Compare os dois intervalos interquartis.
    2. Quaisquer valores atípicos em qualquer conjunto.
    Responda

    Solução 2.15

    O resumo de cinco números para as aulas diurnas e noturnas é

    \ (\ PageIndex {21}\) “>
    Mínimo \(Q_1\) Mediana \(Q_3\) Máximo
    Dia 32 \ (Q_1\)” class="lt-stats-4548">56 74,5 \ (Q_3\)” class="lt-stats-4548">82,5 99
    Noite 25,5 \ (Q_1\)” class="lt-stats-4548">78 81 \ (Q_3\)” class="lt-stats-4548">89 98
    Tabela\(\PageIndex{21}\)

    a. O\(IQR\) grupo do dia é\(Q_3 – Q_1 = 82.5 – 56 = 26.5\)

    O grupo\(IQR\) para a noite é\(Q_3 – Q_1 = 89 – 78 = 11\)

    A faixa interquartil (a dispersão ou variabilidade) da aula diurna é maior do que a da aula noturna\(IQR\). Isso sugere que mais variações serão encontradas nas notas dos testes da aula diurna.

    b. Os valores atípicos das classes diurnas são encontrados usando a regra de\(IQR\) vezes 1,5. Então,
    • \(Q_1 - IQR(1.5) = 56 – 26.5(1.5) = 16.25\)
    • \(Q_3 + IQR(1.5) = 82.5 + 26.5(1.5) = 122.25\)

    Como os valores mínimo e máximo para a classe diurna são maiores\(16.25\) e menores que\(122.25\), não há valores atípicos.

    Os valores atípicos das classes noturnas são calculados como:

    • \(Q_1 – IQR (1.5) = 78 – 11(1.5) = 61.5\)
    • \(Q_3 + IQR(1.5) = 89 + 11(1.5) = 105.5\)

    Para essa classe, qualquer pontuação de teste menor que\(61.5\) é um outlier. Portanto, as pontuações de\(45\) e\(25.5\) são discrepantes. Como nenhuma pontuação no teste é maior que 105,5, não há valores atípicos superiores.

    Exemplo\(\PageIndex{16}\)

    Cinquenta estudantes de estatística foram questionados sobre a quantidade de sono que dormem por noite escolar (arredondada para a hora mais próxima). Os resultados foram:

    \ (\ PageIndex {22}\) “>
    Quantidade de sono por noite escolar (horas) Frequência Frequência relativa Frequência relativa cumulativa
    4 2 0,04 0,04
    5 5 0,10 0,14
    6 7 0,14 0,28
    7 12 0,24 0,52
    8 14 0,28 0,80
    9 7 0,14 0,94
    10 3 0,06 1,00
    Tabela\(\PageIndex{22}\)

    Encontre o 28º percentil. Observe o 0,28 na coluna “frequência relativa cumulativa”. Vinte e oito por cento dos 50 valores de dados são 14 valores. Existem 14 valores menores que o 28º percentil. Eles incluem os dois 4s, os cinco 5s e os sete 6s. O 28º percentil está entre os últimos seis e os primeiros sete. O 28º percentil é 6,5.

    Encontre a mediana. Veja novamente a coluna “frequência relativa cumulativa” e encontre 0,52. A mediana é o percentil 50 ou o segundo quartil. 50% de 50 é 25. Há 25 valores a menos do que a mediana. Eles incluem os dois 4s, os cinco 5s, os sete 6s e onze dos 7s. A mediana ou o 50º percentil está entre os valores 25, ou sete, e 26, ou sete. A mediana é sete.

    Encontre o terceiro quartil. O terceiro quartil é o mesmo que o\(75^{th}\) percentil. Você pode “olhar” essa resposta. Se você observar a coluna “frequência relativa cumulativa”, encontrará 0,52 e 0,80. Quando você tem todos os quatro, cinco, seis e setes, você tem 52% dos dados. Quando você inclui todos os 8s, você tem 80% dos dados. O\(bf{75^{th}}\) percentil, então, deve ser oito. Outra forma de analisar o problema é encontrar 75% de 50, que é 37,5, e arredondar para 38. O terceiro quartil,\(Q_3\), é o 38º valor, que é um oito. Você pode verificar essa resposta contando os valores. (Há 37 valores abaixo do terceiro quartil e 12 valores acima.)

    Exercício\(\PageIndex{16}\)

    Quarenta motoristas de ônibus foram questionados sobre quantas horas eles passam por dia percorrendo suas rotas (arredondadas para a hora mais próxima). Encontre o 65º percentil.

    \ (\ PageIndex {23}\) “>
    Tempo gasto na rota (horas) Frequência Frequência relativa Frequência relativa cumulativa
    2 12 0,30 0,30
    3 14 0,35 0,65
    4 10 0,25 0,90
    5 4 0,10 1,00
    Tabela\(\PageIndex{23}\)

    Exemplo\(\PageIndex{17}\)

    Usando a tabela\(\PageIndex{22}\):

    1. Encontre o\(80^{th}\) percentil.
    2. Encontre o\(90^{th}\) percentil.
    3. Encontre o primeiro quartil. Qual é outro nome para o primeiro quartil?
    Responda

    Solução 2.17

    Usando os dados da tabela de frequência, temos:

    a. O\(80^{th}\) percentil está entre os últimos oito e os primeiros nove na tabela (entre os\(41^{st}\) valores\(40^{th}\) e). Portanto, precisamos tomar a\(40^{th}\) média dos\(41^{st}\) valores de a. O\(80^{th}\) percentil\(=\frac{8+9}{2}=8.5\)

    b. O\(90^{th}\) percentil será o valor dos\(45^{th}\) dados (a localização é\(0.90(50) = 45\)) e o 45º valor dos dados é nove.

    c. também\(Q_1\) é o 25º percentil. O cálculo da localização do\(25^{th}\) percentil:\(P_{25}=0.25(50)=12.5 \approx 13\) o valor\(13^{th}\) dos dados. Assim, o\(25^{th}\) percentil é seis.

    Uma fórmula para encontrar o\(k\) enésimo percentil

    Se você fizesse uma pequena pesquisa, encontraria várias fórmulas para calcular o\(k^{th}\) percentil. Aqui está um deles.

    \(k =\)o\(k^{th}\) percentil. Pode ou não fazer parte dos dados.

    \(i =\)o índice (classificação ou posição de um valor de dados)

    \(n =\)o número total de pontos de dados ou observações

    • Ordene os dados do menor para o maior.
    • Calcular\(i=\frac{k}{100}(n+1)\)
    • Se i for um número inteiro, o\(k^{th}\) percentil é o valor dos dados na\(i^{th}\) posição no conjunto ordenado de dados.
    • Se i não for um número inteiro, arredonde i para cima e arredonde i para baixo até os números inteiros mais próximos. Calcule a média dos dois valores de dados nessas duas posições no conjunto de dados ordenado. Isso é mais fácil de entender em um exemplo.

    Exemplo\(\PageIndex{18}\)

    Estão listadas 29 idades dos melhores atores vencedores do Oscar, da menor para a maior.
    \(18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77\)

    1. Encontre o\(70^{th}\) percentil.
    2. Encontre o\(83^{rd}\) percentil.
    Responda

    Solução 2.18

    1.

    • \(k = 70\)
    • \(i\)= o índice
    • \(n = 29\)
    \(i=\frac{k}{100}(n+1)=\left(\frac{70}{100}\right)(29+1)=21\). Vinte e um é um número inteiro e o valor dos dados na 21ª posição no conjunto de dados ordenado é 64. O 70º percentil é 64 anos.

    2.

    • \(k = 83^{rd}\)percentil
    • \(i\)= o índice
    • \(n = 29\)
    \(i=\frac{k}{100}(n+1)=( \frac{83}{100} )(29+1)=24.9\), que NÃO é um número inteiro. Arredonde para 24 e para 25. A idade na\(24^{th}\) posição é 71 e a idade na\(25^{th}\) posição é 72. Média de 71 e 72. O\(83^{rd}\) percentil é de 71,5 anos.

    Exercício\(\PageIndex{18}\)

    Estão listadas 29 idades dos melhores atores vencedores do Oscar, da menor para a maior.

    \(18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77\)
    Calcule o 20º percentil e o 55º percentil.

    Uma fórmula para encontrar o percentil de um valor em um conjunto de dados

    • Ordene os dados do menor para o maior.
    • \(x\)= o número de valores de dados contados da parte inferior da lista de dados até, mas sem incluir, o valor de dados para o qual você deseja encontrar o percentil.
    • \(y\)= o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil.
    • \(n\)= o número total de dados.
    • Calcule\(\frac{x+0.5 y}{n}(100)\). Em seguida, arredonde para o número inteiro mais próximo.

    Exemplo\(\PageIndex{19}\)

    Estão listadas 29 idades dos melhores atores vencedores do Oscar, da menor para a maior.
    \(18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77\)

    1. Encontre o percentil para 58.
    2. Encontre o percentil para 25.
    Responda

    Solução 2.19

    1. Contando do final da lista, há 18 valores de dados menores que 58. Há um valor de 58.

    \(x = 18\)\(y=1 . \frac{x+0.5 y}{n}(100)=\frac{18+0.5(1)}{29}(100)=63.80\)e. 58 é o\(64^{th}\) percentil.

    2. Contando do final da lista, há três valores de dados menores que 25. Há um valor de 25.

    \(x = 3\)\(y=1 . \frac{x+0.5 y}{n}(100)=\frac{3+0.5(1)}{29}(100)=12.07\)e. Vinte e cinco é o\(12^{th}\) percentil.

    Interpretação de percentis, quartis e mediana

    Um percentil indica a posição relativa de um valor de dados quando os dados são classificados em ordem numérica do menor para o maior. As porcentagens dos valores dos dados são menores ou iguais ao percentil pth. Por exemplo, 15% dos valores dos dados são menores ou iguais ao 15º percentil.

    • Percentis baixos sempre correspondem a valores de dados mais baixos.
    • Percentis altos sempre correspondem a valores de dados mais altos.

    Um percentil pode ou não corresponder a um julgamento de valor sobre se é “bom” ou “ruim”. A interpretação de se um determinado percentil é “bom” ou “ruim” depende do contexto da situação à qual os dados se aplicam. Em algumas situações, um percentil baixo seria considerado “bom”; em outros contextos, um percentil alto pode ser considerado “bom”. Em muitas situações, não há julgamento de valor que se aplique.

    Entender como interpretar os percentis corretamente é importante não apenas ao descrever dados, mas também ao calcular probabilidades em capítulos posteriores deste texto.

    OBSERVAÇÃO

    Ao escrever a interpretação de um percentil no contexto dos dados fornecidos, a frase deve conter as seguintes informações.

    • informações sobre o contexto da situação que está sendo considerada
    • o valor dos dados (valor da variável) que representa o percentil
    • a porcentagem de indivíduos ou itens com valores de dados abaixo do percentil
    • a porcentagem de indivíduos ou itens com valores de dados acima do percentil.

    Exemplo\(\PageIndex{20}\)

    Em um teste de matemática cronometrado, o primeiro quartil de tempo necessário para concluir o exame foi de 35 minutos. Interprete o primeiro quartil no contexto dessa situação.

    Responda

    Solução 2.20

    Vinte e cinco por cento dos estudantes terminaram o exame em 35 minutos ou menos. Setenta e cinco por cento dos estudantes concluíram o exame em 35 minutos ou mais. Um percentil baixo pode ser considerado bom, pois é desejável terminar mais rapidamente em um exame cronometrado. (Se você demorar muito, talvez não consiga terminar.)

    Exemplo\(\PageIndex{21}\)

    Em um teste de matemática de 20 perguntas, o percentil 70 para o número de respostas corretas foi 16. Interprete o 70º percentil no contexto dessa situação.

    Responda

    Solução 2.21

    Setenta por cento dos estudantes responderam 16 perguntas ou menos corretamente. Trinta por cento dos estudantes responderam a 16 ou mais perguntas corretamente. Um percentil mais alto pode ser considerado bom, pois é desejável responder mais perguntas corretamente.

    Exercício\(\PageIndex{21}\)

    Em uma tarefa escrita de 60 pontos, o\(80^{th}\) percentil para o número de pontos ganhos foi 49. Interprete o\(80^{th}\) percentil no contexto dessa situação.

    Exemplo\(\PageIndex{22}\)

    Em uma faculdade comunitária, verificou-se que o\(30^{th}\) percentil de unidades de crédito nas quais os estudantes estão matriculados é de sete unidades. Interprete o\(30^{th}\) percentil no contexto dessa situação.

    Responda

    Solução 2.22

    • Trinta por cento dos estudantes estão matriculados em sete ou menos unidades de crédito.
    • Setenta por cento dos estudantes estão matriculados em sete ou mais unidades de crédito.
    • Neste exemplo, não há julgamento de valor “bom” ou “ruim” associado a um percentil maior ou menor. Os estudantes frequentam faculdades comunitárias por motivos e necessidades variadas, e a carga horária varia de acordo com suas necessidades.

    Exemplo\(\PageIndex{23}\)

    A Sharpe Middle School está se candidatando a uma bolsa que será usada para adicionar equipamentos de ginástica à academia. O diretor entrevistou 15 estudantes anônimos para determinar quantos minutos por dia os alunos passam se exercitando. Os resultados dos 15 estudantes anônimos são mostrados.

    0 minutos; 40 minutos; 60 minutos; 30 minutos; 60 minutos

    10 minutos; 45 minutos; 30 minutos; 300 minutos; 90 minutos;

    30 minutos; 120 minutos; 60 minutos; 0 minutos; 20 minutos

    Determine os cinco valores a seguir.

    • Mín = 0
    • \(Q_1 = 20\)
    • Med = 40
    • \(Q_3 = 60\)
    • Máximo = 300

    Se você fosse o diretor, teria justificativa para comprar novos equipamentos de ginástica? Como 75% dos alunos se exercitam por 60 minutos ou menos diariamente, e como\(IQR\) são 40 minutos\((60 – 20 = 40)\), sabemos que metade dos estudantes pesquisados se exercita entre 20 minutos e 60 minutos diariamente. Parece uma quantidade razoável de tempo gasto se exercitando, então o diretor teria justificativa na compra do novo equipamento.

    No entanto, o diretor precisa ter cuidado. O valor 300 parece ser um potencial outlier.

    \(Q_3 + 1.5(IQR) = 60 + (1.5)(40) = 120\).

    O valor 300 é maior que 120, portanto, é um potencial outlier. Se o excluirmos e calcularmos os cinco valores, obteremos os seguintes valores:

    • Mín = 0
    • \(Q_1 = 20\)
    • \(Q_3 = 60\)
    • Máximo = 120

    Ainda temos 75% dos alunos se exercitando por 60 minutos ou menos diariamente e metade dos alunos se exercitando entre 20 e 60