Skip to main content
Global

2.6: Distorção e média, mediana e modo

  • Page ID
    186618
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Considere o conjunto de dados a seguir.
    4; 5; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10

    Esse conjunto de dados pode ser representado pelo seguinte histograma. Cada intervalo tem uma largura e cada valor está localizado no meio de um intervalo.

    Esse histograma corresponde aos dados fornecidos. Consiste em 7 barras adjacentes com o eixo x dividido em intervalos de 1 de 4 a 10. As alturas das barras atingem o pico no meio e diminuem simetricamente para a direita e para a esquerda.

    Figura 2.11

    O histograma exibe uma distribuição simétrica dos dados. Uma distribuição é simétrica se uma linha vertical puder ser desenhada em algum ponto do histograma, de forma que as formas à esquerda e à direita da linha vertical sejam imagens espelhadas uma da outra. A média, a mediana e o modo são, cada um, sete para esses dados. Em uma distribuição perfeitamente simétrica, a média e a mediana são as mesmas. Este exemplo tem um modo (unimodal), e o modo é o mesmo que a média e a mediana. Em uma distribuição simétrica que tem dois modos (bimodal), os dois modos seriam diferentes da média e da mediana.

    O histograma dos dados: 4; 5; 6; 6; 6; 7; 7; 7; 7; 8 não é simétrico. O lado direito parece “cortado” em comparação com o lado esquerdo. Uma distribuição desse tipo é chamada de distorcida para a esquerda porque é puxada para a esquerda. Podemos medir formalmente a distorção de uma distribuição, assim como podemos medir matematicamente o peso central dos dados ou sua “velocidade” geral. A fórmula matemática para distorção é:

    \[a_{3}=\sum \frac{\left(x_{t}-\overline{x}\right)^{3}}{n s^{3}}.\nonumber\]

    Quanto maior o desvio de zero, indica um maior grau de distorção. Se a distorção for negativa, a distribuição será distorcida para a esquerda, como na Figura\(\PageIndex{13}\).

    Esse histograma corresponde aos dados fornecidos. Consiste em 5 barras adjacentes com o eixo x dividido em intervalos de 1 de 4 a 8. O pico está à direita e as alturas das barras diminuem para a esquerda.

    Figura 2.12

    A média é 6,3, a mediana é 6,5 e o modo é sete. Observe que a média é menor que a mediana e ambas são menores que o modo. A média e a mediana refletem a distorção, mas a média a reflete mais ainda.

    O histograma dos dados: 6; 7; 7; 7; 7; 8; 8; 9; 10 também não é simétrico. Está inclinado para a direita.

    Esse histograma corresponde aos dados fornecidos. Consiste em 5 barras adjacentes com o eixo x dividido em intervalos de 1 de 6 a 10. O pico está à esquerda e as alturas das barras diminuem para a direita.

    Figura 2.13

    A média é 7,7, a mediana é 7,5 e o modo é sete. Das três estatísticas, a média é a maior, enquanto o modo é a menor. Novamente, a média reflete mais a inclinação.

    Resumindo, geralmente, se a distribuição dos dados for distorcida para a esquerda, a média é menor que a mediana, que geralmente é menor do que o modo. Se a distribuição dos dados estiver distorcida para a direita, o modo geralmente é menor que a mediana, que é menor que a média.

    Assim como a média, a mediana e o modo, e como veremos em breve, a variância, existem fórmulas matemáticas que nos fornecem medidas precisas dessas características da distribuição dos dados. Novamente, examinando a fórmula da distorção, vemos que essa é uma relação entre a média dos dados e as observações individuais em cubos.

    \[a_{3}=\sum \frac{\left(x_{i}-\overline{x}\right)^{3}}{n s^{3}}\nonumber\]

    onde ss é o desvio padrão da amostra dos dados,\(\mathrm{X}_{i}\), e\(\overline{x}\) é a média aritmética e\(n\) é o tamanho da amostra.

    Formalmente, a média aritmética é conhecida como o primeiro momento da distribuição. O segundo momento que veremos é a variação, e a distorção é o terceiro momento. A variância mede as diferenças quadradas dos dados em relação à média e a distorção mede as diferenças em cubos dos dados em relação à média. Embora uma variação nunca possa ser um número negativo, a medida da distorção pode e é assim que determinamos se os dados estão distorcidos para a direita ou para a esquerda. A distorção de uma distribuição normal é zero, e qualquer dado simétrico deve ter distorção próxima de zero. Valores negativos para a distorção indicam dados que estão distorcidos para a esquerda e valores positivos para a distorção indicam dados que estão distorcidos para a direita. Por inclinado para a esquerda, queremos dizer que a cauda esquerda é longa em relação à cauda direita. Da mesma forma, inclinado para a direita significa que a cauda direita é longa em relação à cauda esquerda. A distorção caracteriza o grau de assimetria de uma distribuição em torno de sua média. Embora a média e o desvio padrão sejam quantidades dimensionais (é por isso que usaremos a raiz quadrada da variância), ou seja, tenham as mesmas unidades que as quantidades medidas\(\mathrm{X}_{i}\), a distorção é convencionalmente definida de forma a torná-la não dimensional. É um número puro que caracteriza apenas a forma da distribuição. Um valor positivo de distorção significa uma distribuição com uma cauda assimétrica se estendendo em direção a mais positiva\(X\) e um valor negativo significa uma distribuição cuja cauda se estende em direção a mais negativa\(X\). Uma medida zero de distorção indicará uma distribuição simétrica.

    A distorção e a simetria se tornam importantes quando discutimos distribuições de probabilidade em capítulos posteriores.