Skip to main content
Global

2.4: Medidas da localização dos dados

  • Page ID
    190112
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    As medidas comuns de localização são quartis e percentis. Os quartis são percentis especiais. O primeiro quartil, Q 1, é o mesmo que o 25º percentil, e o terceiro quartil, Q 3, é o mesmo que o 75º percentil. A mediana, M, é chamada tanto de segundo quartil quanto de percentil 50.

    Para calcular quartis e percentis, os dados devem ser ordenados do menor para o maior. Os quartis dividem os dados ordenados em trimestres. Os percentis dividem os dados ordenados em centésimos. Pontuar no percentil 90 de um exame não significa, necessariamente, que você recebeu 90% em um teste. Isso significa que 90% das pontuações dos testes são iguais ou menores que a sua pontuação e 10% das pontuações do teste são iguais ou superiores à sua pontuação no teste.

    Os percentis são úteis para comparar valores. Por esse motivo, universidades e faculdades usam percentis extensivamente. Um exemplo em que faculdades e universidades usam percentis é quando os resultados do SAT são usados para determinar uma pontuação mínima do teste que será usada como um fator de aceitação. Por exemplo, suponha que Duke aceite pontuações SAT iguais ou superiores ao percentil 75. Isso se traduz em uma pontuação de pelo menos 1220.

    Os percentis são usados principalmente com populações muito grandes. Portanto, se você dissesse que 90% das pontuações dos testes são menores (e não iguais ou menores) do que sua pontuação, seria aceitável porque a remoção de um determinado valor de dados não é significativa.

    A mediana é um número que mede o “centro” dos dados. Você pode pensar na mediana como o “valor médio”, mas na verdade ela não precisa ser um dos valores observados. É um número que separa os dados ordenados em metades. Metade dos valores são do mesmo número ou menores que a mediana, e metade dos valores são o mesmo número ou maiores. Por exemplo, considere os dados a seguir.

    1; 11,5; 6; 7,2; 4; 8; 9; 10; 6,8; 8,3; 2; 2; 10; 1

    Ordenado do menor para o maior:

    1; 1; 2; 2; 4; 6; 6,8; 7,2; 8; 8,3; 9; 10; 10; 11,5

    Como existem 14 observações, a mediana está entre o sétimo valor, 6,8, e o oitavo valor, 7,2. Para encontrar a mediana, adicione os dois valores e divida por dois.

    \[\dfrac{6.8+7.2}{2} = 7\]

    A mediana é sete. Metade dos valores são menores que sete e metade dos valores são maiores que sete.

    Os quartis são números que separam os dados em trimestres. Os quartis podem ou não fazer parte dos dados. Para encontrar os quartis, primeiro encontre a mediana ou o segundo quartil. O primeiro quartil, Q 1, é o valor médio da metade inferior dos dados, e o terceiro quartil, Q 3, é o valor médio, ou mediana, da metade superior dos dados. Para ter uma ideia, considere o mesmo conjunto de dados:

    1; 1; 2; 2; 4; 6; 6,8; 7,2; 8; 8,3; 9; 10; 10; 11,5

    A mediana ou o segundo quartil é sete. A metade inferior dos dados é 1, 1, 2, 2, 4, 6, 6,8. O valor médio da metade inferior é dois.

    1; 1; 2; 2; 4; 6; 6,8

    O número dois, que faz parte dos dados, é o primeiro quartil. Um quarto dos conjuntos inteiros de valores são iguais ou menores que dois e três quartos dos valores são maiores que dois.

    A metade superior dos dados é 7,2, 8, 8,3, 9, 10, 10, 11,5. O valor médio da metade superior é nove.

    O terceiro quartil, Q 3, é nove. Três quartos (75%) do conjunto de dados ordenado são menores que nove. Um quarto (25%) do conjunto de dados ordenado é maior que nove. O terceiro quartil faz parte do conjunto de dados neste exemplo.

    O intervalo interquartil é um número que indica a dispersão da metade média ou dos 50% médios dos dados. É a diferença entre o terceiro quartil (Q 3) e o primeiro quartil (Q 1).

    \[IQR = Q_3 – Q_1 \tag{2.4.1}\]

    O IQR pode ajudar a determinar possíveis valores atípicos. Suspeita-se que um valor seja uma exceção potencial se for menor que (1,5) (IQR) abaixo do primeiro quartil ou maior que (1,5) (IQR) acima do terceiro quartil. Possíveis valores atípicos sempre exigem uma investigação mais aprofundada.

    Definição: Outliers

    Um potencial outlier é um ponto de dados significativamente diferente dos outros pontos de dados. Esses pontos de dados especiais podem ser erros ou algum tipo de anormalidade ou podem ser a chave para entender os dados.

    Exemplo 2.4.1

    Para os 13 preços imobiliários a seguir, calcule o IQR e determine se algum preço é um valor discrepante em potencial. Os preços estão em dólares.

    389.950; 230.500; 158.000; 479.000; 639.000; 114.950; 5.500.000; 387.000; 659.000; 529.000; 575.000; 488.800; 1.095.000

    Resposta

    Ordene os dados do menor para o maior.

    114.950; 158.000; 230.500; 387.000; 389.950; 479.000; 488.800; 529.000; 575.000; 639.000; 659.000; 1.095.000; 5.500.000

    \[M = 488,800 \nonumber\]

    \[Q_{1} = \dfrac{230,500 + 387,000}{2} = 308,750\nonumber\]

    \[Q_{3} = \dfrac{639,000 + 659,000}{2} = 649,000\nonumber\]

    \[IQR = 649,000 - 308,750 = 340,250\nonumber\]

    \[(1.5)(IQR) = (1.5)(340,250) = 510,375\nonumber\]

    \[Q_{1} - (1.5)(IQR) = 308,750 - 510,375 = –201,625\nonumber\]

    \[Q_{3} + (1.5)(IQR) = 649,000 + 510,375 = 1,159,375\nonumber\]

    Nenhum preço da casa é inferior a —201.625. No entanto, 5.500.000 é mais do que 1.159.375. Portanto, 5.500.000 é um potencial outlier.

    Exercício\(\PageIndex{1}\)

    Para os 11 salários a seguir, calcule o IQR e determine se algum salário é discrepante. Os salários estão em dólares.

    $33.000; $64.500; $28.000; $54.000; $72.000; $68.500; $69.000; $42.000; $54.000; $120.000; $40.500

    Resposta

    Ordene os dados do menor para o maior.

    $28.000; $33.000; $40.500; $42.000; $54.000; $54.000; $64.500; $68.500; $69.000; $72.000; $120.000

    Mediana = $54.000

    \[Q_{1} = $40,500\nonumber\]

    \[Q_{3} = $69,000\nonumber\]

    \[IQR = $69,000 - $40,500 = $28,500\nonumber\]

    \[(1.5)(IQR) = (1.5)($28,500) = $42,750\nonumber\]

    \[Q_{1} - (1.5)(IQR) = $40,500 - $42,750 = -$2,250\nonumber\]

    \[Q_{3} + (1.5)(IQR) = $69,000 + $42,750 = $111,750\nonumber\]

    Nenhum salário é inferior a —$2.250. No entanto, $120.000 é mais do que $11.750, então $120.000 é um potencial outlier.

    Exemplo 2.4.2

    Para os dois conjuntos de dados no exemplo das pontuações dos testes, encontre o seguinte:

    1. A faixa interquartil. Compare os dois intervalos interquartis.
    2. Quaisquer valores atípicos em qualquer conjunto.

    Resposta

    O resumo de cinco números para as aulas diurnas e noturnas é

      Mínimo Q 1 Mediana Q 3 Máximo
    Dia 32 56 74,5 82,5 99
    Noite 25,5 78 81 89 98
    1. O IQR para o grupo diurno é\(Q_{3} - Q_{1} = 82.5 - 56 = 26.5\)

      O IQR para o grupo noturno é\(Q_{3} - Q_{1} = 89 - 78 = 11\)

      A faixa interquartil (a dispersão ou variabilidade) para a classe diurna é maior do que a classe noturna IQR. Isso sugere que mais variações serão encontradas nas notas dos testes da aula diurna.

    2. Os valores atípicos das classes diurnas são encontrados usando a regra IQR vezes 1,5. Então,
      • \(Q_{1} - IQR(1.5) = 56 – 26.5(1.5) = 16.25\)
      • \(Q_{3} + IQR(1.5) = 82.5 + 26.5(1.5) = 122.25\)

      Como os valores mínimo e máximo para a classe diurna são maiores que 16,25 e menores que 122,25, não há valores atípicos.

      Os valores atípicos das classes noturnas são calculados como:

      • \(Q_{1} - IQR (1.5) = 78 – 11(1.5) = 61.5\)
      • \(Q_{3} + IQR(1.5) = 89 + 11(1.5) = 105.5\)

      Para esta classe, qualquer pontuação de teste menor que 61,5 é um outlier. Portanto, as pontuações de 45 e 25,5 são discrepantes. Como nenhuma pontuação no teste é maior que 105,5, não há valores atípicos superiores.

    Exercício\(\PageIndex{2}\)

    Encontre o intervalo interquartil para os dois conjuntos de dados a seguir e compare-os.

    Pontuações dos testes para a classe A

    69; 96; 81; 79; 65; 76; 83; 99; 89; 67; 90; 77; 85; 98; 66; 91; 77; 69; 80; 94

    Pontuações dos testes para a classe B

    90; 72; 80; 92; 90; 97; 92; 75; 79; 68; 70; 80; 99; 95; 78; 73; 71; 68; 95; 100

    Responda

    Classe A

    Ordene os dados do menor para o maior.

    65; 66; 67; 69; 69; 76; 77; 77; 79; 80; 81; 83; 85; 89; 90; 91; 94; 96; 98; 99

    \(Median = \dfrac{80 + 81}{2}\)= 80,5

    \(Q_{1} = \dfrac{69 + 76}{2} = 72.5\)

    \(Q_{3} = \dfrac{90 + 91}{2} = 90.5\)

    \(IQR = 90.5 - 72.5 = 18\)

    Classe B

    Ordene os dados do menor para o maior.

    68; 68; 70; 71; 72; 73; 75; 78; 79; 80; 80; 90; 90; 92; 92; 95; 95; 97; 99; 100

    \(Median = \dfrac{80 + 80}{2} = 80\)

    \(Q_{1} = \dfrac{72 + 73}{2} = 72.5\)

    \(Q_{3} = \dfrac{92 + 95}{2} = 93.5\)

    \(IQR = 93.5 - 72.5 = 21\)

    Os dados da Classe B têm um IQR maior, então as pontuações entre Q 3 e Q 1 (50% médios) para os dados da Classe B são mais dispersas e não agrupadas em torno da mediana.

    Exemplo 2.4.3

    Cinquenta estudantes de estatística foram questionados sobre a quantidade de sono que dormem por noite escolar (arredondada para a hora mais próxima). Os resultados foram:

    QUANTIDADE DE SONO POR NOITE ESCOLAR (HORAS) FREQUÊNCIA FREQUÊNCIA RELATIVA FREQUÊNCIA RELATIVA CUMULATIVA
    4 2 0,04 0,04
    5 5 0,10 0,14
    6 7 0,14 0,28
    7 12 0,24 0,52
    8 14 0,28 0,80
    9 7 0,14 0,94
    10 3 0,06 1,00

    Encontre o 28º percentil. Observe o 0,28 na coluna “frequência relativa cumulativa”. Vinte e oito por cento dos 50 valores de dados são 14 valores. Existem 14 valores menores que o 28º percentil. Eles incluem os dois 4s, os cinco 5s e os sete 6s. O 28º percentil está entre os últimos seis e os primeiros sete. O 28º percentil é 6,5.

    Encontre a mediana. Veja novamente a coluna “frequência relativa cumulativa” e encontre 0,52. A mediana é o percentil 50 ou o segundo quartil. 50% de 50 é 25. Há 25 valores menores que a mediana. Eles incluem os dois 4s, os cinco 5s, os sete 6s e onze dos 7s. A mediana ou o 50º percentil está entre os valores 25, ou sete, e 26, ou sete. A mediana é sete.

    Encontre o terceiro quartil. O terceiro quartil é igual ao percentil 75. Você pode “olhar” essa resposta. Se você observar a coluna “frequência relativa cumulativa”, encontrará 0,52 e 0,80. Quando você tem todos os quatro, cinco, seis e setes, você tem 52% dos dados. Quando você inclui todos os 8s, você tem 80% dos dados. O percentil 75, então, deve ser um oito. Outra forma de analisar o problema é encontrar 75% de 50, que é 37,5, e arredondar para 38. O terceiro quartil, Q 3, é o 38º valor, que é um oito. Você pode verificar essa resposta contando os valores. (Há 37 valores abaixo do terceiro quartil e 12 valores acima.)

    Exercício\(\PageIndex{3}\)

    Quarenta motoristas de ônibus foram questionados sobre quantas horas eles passam por dia percorrendo suas rotas (arredondadas para a hora mais próxima). Encontre o 65º percentil.

    Quantidade de tempo gasto na rota (horas) Frequência Frequência relativa Frequência relativa cumulativa
    2 12 0,30 0,30
    3 14 0,35 0,65
    4 10 0,25 0,90
    5 4 0,10 1,00

    Responda

    O 65º percentil está entre os últimos três e os primeiros quatro.

    O percentil 65 é 3,5.

    Exemplo 2.4.4

    Usando a tabela:

    1. Encontre o 80º percentil.
    2. Encontre o 90º percentil.
    3. Encontre o primeiro quartil. Qual é outro nome para o primeiro quartil?

    Solução

    Usando os dados da tabela de frequência, temos:

    1. O percentil 80 está entre os últimos oito e os primeiros nove na tabela (entre os valores 40 e 41). Portanto, precisamos tomar a média dos valores 40º e 41º. O 80º percentil\(= \dfrac{8+9}{2} = 8.5\)
    2. O 90º percentil será o 45º valor dos dados (a localização é\(0.90(50) = 45\)) e o 45º valor dos dados é nove.
    3. Q 1 também é o 25º percentil. O cálculo da localização do 25º percentil:\(P_{25} = 0.25(50) = 12.5 \approx 13\) o 13º valor dos dados. Assim, o 25º percentil é seis.

    Exercício\(\PageIndex{4}\)

    Consulte a tabela. Encontre o terceiro quartil. Qual é outro nome para o terceiro quartil?

    Responda

    O terceiro quartil é o 75º percentil, que é quatro. O 65º percentil está entre três e quatro, e o 90º percentil está entre quatro e 5,75. O terceiro quartil está entre 65 e 90, então deve ser quatro.

    ESTATÍSTICAS COLABORATIVAS

    Seu instrutor ou um membro da turma perguntará a todos na classe quantos suéteres eles têm. Responda às seguintes perguntas:

    1. Quantos estudantes foram pesquisados?
    2. Que tipo de amostragem você fez?
    3. Construa dois histogramas diferentes. Para cada um, valor inicial = _____ valor final = ____.
    4. Encontre a mediana, o primeiro quartil e o terceiro quartil.
    5. Crie uma tabela dos dados para encontrar o seguinte:
      1. o 10º percentil
      2. o 70º percentil
      3. a porcentagem de estudantes que possuem menos de quatro suéteres

    Uma fórmula para encontrar o k ésimo percentil

    Se você fizesse uma pequena pesquisa, encontraria várias fórmulas para calcular o késimo percentil. Aqui está um deles.

    • \(k =\)o késimo percentil. Pode ou não fazer parte dos dados.
    • \(i =\)o índice (classificação ou posição de um valor de dados)
    • \(n =\)o número total de dados

    Ordene os dados do menor para o maior.

    Calcule\(i = \dfrac{k}{100}(n + 1)\) i

    Se\(i\) for um número inteiro, o\(k^{th}\) percentil é o valor dos dados na\(i^{th}\) posição no conjunto ordenado de dados.

    Se não\(i\) for um número inteiro, arredonde para\(i\) cima e para\(i\) baixo até os números inteiros mais próximos. Calcule a média dos dois valores de dados nessas duas posições no conjunto de dados ordenado. Isso é mais fácil de entender em um exemplo.

    Exemplo 2.4.5

    Estão listadas 29 idades dos melhores atores vencedores do Oscar, da menor para a maior.

    18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77
    1. Encontre o 70º percentil.
    2. Encontre o 83º percentil.

    Solução

      • \(k = 70\)
      • \(i\)= o índice
      • \(n = 29\)
      \(i = \dfrac{k}{100}(n + 1) = \dfrac{70}{100}(29 + 1) = 21\). Vinte e um é um inteiro e o valor dos dados na 21ª posição no conjunto de dados ordenado é 64. O 70º percentil é 64 anos.
      • \(k\)= 83 percentil
      • \(i = the index\)
      • \(n = 29\)
      \(i = \dfrac{k}{100}(n + 1) = (\dfrac{83}{100})(29 + 1) = 24.9\), que NÃO é um número inteiro. Arredonde para 24 e para 25. A idade na 24ª posição é 71 e a idade na 25ª posição é 72. Média 71 e 72. O percentil 83 é de 71,5 anos.

    Exercício\(\PageIndex{5}\)

    Estão listadas 29 idades dos melhores atores vencedores do Oscar, da menor para a maior.

    18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

    Calcule o 20º percentil e o 55º percentil.

    Responda

    \(k = 20\). Índice\(= i = \dfrac{k}{100}(n+1) = \dfrac{20}{100}(29 + 1) = 6\). A idade na sexta posição é 27. O 20º percentil é de 27 anos.

    \(k = 55\). Índice\(= i = \dfrac{k}{100}(n+1) = \dfrac{55}{100}(29 + 1) = 16.5\). Arredonde para 16 e para cima para 17. A idade na 16ª posição é 52 e a idade na 17ª posição é 55. A média de 52 e 55 é 53,5. O percentil 55 é de 53,5 anos.

    Nota 2.4.2

    Você pode calcular percentis usando calculadoras e computadores. Há uma variedade de calculadoras on-line.

    Uma fórmula para encontrar o percentil de um valor em um conjunto de dados

    • Ordene os dados do menor para o maior.
    • \(x =\)o número de valores de dados contados da parte inferior da lista de dados até, mas sem incluir, o valor de dados para o qual você deseja encontrar o percentil.
    • \(y =\)o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil.
    • \(n =\)o número total de dados.
    • Calcule\(\dfrac{x + 0.5y}{n}(100)\). Em seguida, arredonde para o número inteiro mais próximo.

    Exemplo 2.4.6

    Estão listadas 29 idades dos melhores atores vencedores do Oscar, da menor para a maior.

    18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77
    1. Encontre o percentil para 58.
    2. Encontre o percentil para 25.

    Solução

    1. Contando do final da lista, há 18 valores de dados menores que 58. Há um valor de 58.

      \(x = 18\)\(y = 1\)e. \(\dfrac{x + 0.5y}{n}(100) = \dfrac{18 + 0.5(1)}{29}(100) = 63.80\). 58 é o percentil 64.

    2. Contando do final da lista, há três valores de dados menores que 25. Há um valor de 25.

      \(x = 3\)\(y = 1\)e. \(\dfrac{x + 0.5y}{n}(100) = \dfrac{3 + 0.5(1)}{29}(100) = 12.07\). Vinte e cinco é o 12º percentil.

    Exercício\(\PageIndex{6}\)

    Estão listadas 30 idades dos melhores atores vencedores do Oscar, da menor para a maior.

    18; 21; 22; 25; 26; 27; 29; 30; 31, 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

    Encontre os percentis para 47 e 31.

    Responda

    Percentil para 47: contando da parte inferior da lista, há 15 valores de dados menores que 47. Há um valor de 47.

    \(x = 15\)\(y = 1\)e. \(\dfrac{x + 0.5y}{n}(100) = \dfrac{15 + 0.5(1)}{30}(100) = 51.67\). 47 é o 52º percentil.

    Percentil para 31: contando da parte inferior da lista, há oito valores de dados menores que 31. Existem dois valores de 31.

    \(x = 8\)\(y = 2\)e. \(\dfrac{x + 0.5y}{n}(100) = \dfrac{8 + 0.5(2)}{30}(100) = 30\). 31 é o 30º percentil.

    Interpretação de percentis, quartis e mediana

    Um percentil indica a posição relativa de um valor de dados quando os dados são classificados em ordem numérica do menor para o maior. As porcentagens dos valores dos dados são menores ou iguais ao p ésimo percentil. Por exemplo, 15% dos valores dos dados são menores ou iguais ao 15º percentil.

    • Percentis baixos sempre correspondem a valores de dados mais baixos.
    • Percentis altos sempre correspondem a valores de dados mais altos.

    Um percentil pode ou não corresponder a um julgamento de valor sobre se é “bom” ou “ruim”. A interpretação de se um determinado percentil é “bom” ou “ruim” depende do contexto da situação à qual os dados se aplicam. Em algumas situações, um percentil baixo seria considerado “bom”; em outros contextos, um percentil alto pode ser considerado “bom”. Em muitas situações, não há julgamento de valor que se aplique.

    Entender como interpretar os percentis corretamente é importante não apenas ao descrever dados, mas também ao calcular probabilidades em capítulos posteriores deste texto.

    DIRETRIZ

    Ao escrever a interpretação de um percentil no contexto dos dados fornecidos, a frase deve conter as seguintes informações.

    • informações sobre o contexto da situação que está sendo considerada
    • o valor dos dados (valor da variável) que representa o percentil
    • a porcentagem de indivíduos ou itens com valores de dados abaixo do percentil
    • a porcentagem de indivíduos ou itens com valores de dados acima do percentil.

    Exemplo 2.4.7

    Em um teste de matemática cronometrado, o primeiro quartil de tempo necessário para concluir o exame foi de 35 minutos. Interprete o primeiro quartil no contexto dessa situação.

    Responda

    • Vinte e cinco por cento dos estudantes terminaram o exame em 35 minutos ou menos.
    • Setenta e cinco por cento dos estudantes concluíram o exame em 35 minutos ou mais.
    • Um percentil baixo pode ser considerado bom, pois é desejável terminar mais rapidamente em um exame cronometrado. (Se você demorar muito, talvez não consiga terminar.)

    Exercício\(\PageIndex{7}\)

    Para a corrida de 100 metros, o terceiro quartil de tempos para terminar a corrida foi de 11,5 segundos. Interprete o terceiro quartil no contexto da situação.

    Responda

    Vinte e cinco por cento dos corredores terminaram a corrida em 11,5 segundos ou mais. Setenta e cinco por cento dos corredores terminaram a corrida em 11,5 segundos ou menos. Um percentil mais baixo é bom porque terminar uma corrida mais rapidamente é desejável.

    Exemplo 2.4.8

    Em um teste de matemática de 20 perguntas, o percentil 70 para o número de respostas corretas foi 16. Interprete o 70º percentil no contexto dessa situação.

    Responda

    • Setenta por cento dos estudantes responderam 16 perguntas ou menos corretamente.
    • Trinta por cento dos estudantes responderam a 16 ou mais perguntas corretamente.
    • Um percentil mais alto pode ser considerado bom, pois é desejável responder mais perguntas corretamente.

    Exercício\(\PageIndex{8}\)

    Em uma tarefa escrita de 60 pontos, o percentil 80 para o número de pontos ganhos foi 49. Interprete o percentil 80 no contexto dessa situação.

    Responda

    Oitenta por cento dos estudantes ganharam 49 pontos ou menos. Vinte por cento dos estudantes ganharam 49 ou mais pontos. Um percentil mais alto é bom porque é desejável obter mais pontos em uma tarefa.

    Exemplo 2.4.9

    Em uma faculdade comunitária, verificou-se que o percentil 30 de unidades de crédito nas quais os estudantes estão matriculados é de sete unidades. Interprete o 30º percentil no contexto dessa situação.

    Responda

    • Trinta por cento dos estudantes estão matriculados em sete ou menos unidades de crédito.
    • Setenta por cento dos estudantes estão matriculados em sete ou mais unidades de crédito.
    • Neste exemplo, não há julgamento de valor “bom” ou “ruim” associado a um percentil maior ou menor. Os estudantes frequentam faculdades comunitárias por motivos e necessidades variadas, e a carga horária varia de acordo com suas necessidades.

    Exercício\(\PageIndex{9}\)

    Durante uma temporada, o 40º percentil para pontos marcados por jogador em um jogo é oito. Interprete o 40º percentil no contexto dessa situação.

    Responda

    Quarenta por cento dos jogadores marcaram oito pontos ou menos. Sessenta por cento dos jogadores marcaram oito pontos ou mais. Um percentil mais alto é bom porque conseguir mais pontos em um jogo de basquete é desejável.

    Exemplo 2.4.10

    A Sharpe Middle School está se candidatando a uma bolsa que será usada para adicionar equipamentos de ginástica à academia. O diretor entrevistou 15 estudantes anônimos para determinar quantos minutos por dia os alunos passam se exercitando. Os resultados dos 15 estudantes anônimos são mostrados.

    0 minutos; 40 minutos; 60 minutos; 30 minutos; 60 minutos

    10 minutos; 45 minutos; 30 minutos; 300 minutos; 90 minutos;

    30 minutos; 120 minutos; 60 minutos; 0 minutos; 20 minutos

    Determine os cinco valores a seguir.

    • Mín = 0
    • Q 1 = 20
    • Med = 40
    • Q 3 = 60
    • Máximo = 300

    Se você fosse o diretor, teria justificativa para comprar novos equipamentos de ginástica? Como 75% dos alunos se exercitam por 60 minutos ou menos diariamente, e como o IQR é de 40 minutos (60 - 20 = 40), sabemos que metade dos estudantes pesquisados se exercita entre 20 minutos e 60 minutos diariamente. Parece uma quantidade razoável de tempo gasto se exercitando, então o diretor teria justificativa na compra do novo equipamento.

    No entanto, o diretor precisa ter cuidado. O valor 300 parece ser um potencial outlier.

    \[Q_{3} + 1.5(IQR) = 60 + (1.5)(40) = 120\].

    O valor 300 é maior que 120, portanto, é um potencial outlier. Se o excluirmos e calcularmos os cinco valores, obteremos os seguintes valores:

    • Mín = 0
    • Q 1 = 20
    • Q 3 = 60
    • Máximo = 120

    Ainda temos 75% dos alunos se exercitando por 60 minutos ou menos diariamente e metade dos alunos se exercitando entre 20 e 60 minutos por dia. No entanto, 15 alunos são uma amostra pequena e o diretor deve pesquisar mais alunos para ter certeza dos resultados da pesquisa.

    Referências

    1. Cauchon, Dennis, Paul Overberg. “Os dados do censo mostram que as minorias agora são a maioria dos nascimentos nos EUA.” USA Today, 2012. Disponível on-line em usatoday30.usatoday.com/news/... sus/55029100/1 (acessado em 3 de abril de 2013).
    2. Dados do Departamento de Comércio dos Estados Unidos: Departamento do Censo dos Estados Unidos. Disponível on-line em http://www.census.gov/ (acessado em 3 de abril de 2013).
    3. “Censo de 1990.” Departamento de Comércio dos Estados Unidos: Departamento do Censo dos Estados Unidos. Disponível on-line em http://www.census.gov/main/www/cen1990.html (acessado em 3 de abril de 2013).
    4. Dados do San Jose Mercury News.
    5. Dados da revista Time; pesquisa da Yankelovich Partners, Inc.

    Revisão

    Os valores que dividem um conjunto de dados ordenado por classificação em 100 partes iguais são chamados de percentis. Os percentis são usados para comparar e interpretar dados. Por exemplo, uma observação no percentil 50 seria maior que 50 por cento das outras observações no conjunto. Os quartis dividem os dados em trimestres. O primeiro quartil (Q 1) é o 25º percentil, o segundo quartil (Q 2 ou mediana) é o percentil 50 e o terceiro quartil (Q 3) é o 75º percentil. O intervalo interquartil, ou IQR, é o intervalo dos 50% médios dos valores dos dados. O IQR é encontrado subtraindo Q 1 de Q 3 e pode ajudar a determinar valores atípicos usando as duas expressões a seguir.

    • \(Q_{3} + IQR(1.5)\)
    • \(Q_{1} - IQR(1.5)\)

    Revisão da fórmula

    \[i = \dfrac{k}{100}(n+1) \nonumber\]

    onde\(i\) = a classificação ou posição de um valor de dados,

    • \(k\)= o k, o percentil,
    • \(n\)= número total de dados.

    Expressão para encontrar o percentil de um valor de dados:\(\left(\dfrac{x + 0.5y}{n}\right)(100)\)

    onde\(x =\) o número de valores contados da parte inferior da lista de dados até, mas não incluindo, o valor de dados para o qual você deseja encontrar o percentil,

    \(y =\)o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil,

    \(n =\)número total de dados

    Glossário

    Intervalo interquartil
    ou IQR, é o intervalo dos 50 por cento médios dos valores dos dados; o IQR é encontrado subtraindo o primeiro quartil do terceiro quartil.
    Outlier
    uma observação que não se encaixa no resto dos dados
    Percentil
    um número que divide os dados ordenados em centésimos; os percentis podem ou não fazer parte dos dados. A mediana dos dados é o segundo quartil e o percentil 50. O primeiro e o terceiro quartis são os percentis 25 e 75, respectivamente.
    Quartis
    os números que separam os dados em trimestres; quartis podem ou não fazer parte dos dados. O segundo quartil é a mediana dos dados.