Skip to main content
Global

2.6 : L'asymétrie et la moyenne, la médiane et le mode

  • Page ID
    191528
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Examinez l'ensemble de données suivant.
    4 ; 5 ; 6 ; 6 ; 6 ; 7 ; 7 ; 7 ; 7 ; 7 ; 7 ; 8 ; 8 ; 8 ; 8 ; 9 ; 10

    Cet ensemble de données peut être représenté par l'histogramme suivant. Chaque intervalle a une largeur et chaque valeur est située au milieu d'un intervalle.

    Cet histogramme correspond aux données fournies. Il se compose de 7 barres adjacentes dont l'axe X est divisé en intervalles de 1 de 4 à 10. La hauteur des barres culmine au milieu et diminue symétriquement vers la droite et vers la gauche.

    Graphique 2.11

    L'histogramme affiche une distribution symétrique des données. Une distribution est symétrique si une ligne verticale peut être tracée à un point de l'histogramme de telle sorte que les formes situées à gauche et à droite de la ligne verticale soient des images miroir l'une de l'autre. La moyenne, la médiane et le mode sont chacun de sept pour ces données. Dans une distribution parfaitement symétrique, la moyenne et la médiane sont identiques. Cet exemple comporte un mode (unimodal), et le mode est identique à la moyenne et à la médiane. Dans une distribution symétrique comportant deux modes (bimodale), les deux modes seraient différents de la moyenne et de la médiane.

    L'histogramme des données : 4 ; 5 ; 6 ; 6 ; 6 ; 7 ; 7 ; 7 ; 7 ; 7 ; 8 n'est pas symétrique. Le côté droit semble « coupé » par rapport au côté gauche. Une distribution de ce type est appelée asymétrique vers la gauche car elle est retirée vers la gauche. Nous pouvons mesurer formellement l'asymétrie d'une distribution tout comme nous pouvons mesurer mathématiquement le poids central des données ou leur « dispersion » générale. La formule mathématique de l'asymétrie est la suivante :

    \[a_{3}=\sum \frac{\left(x_{t}-\overline{x}\right)^{3}}{n s^{3}}.\nonumber\]

    Plus l'écart par rapport à zéro est important, plus le degré d'asymétrie est important. Si l'asymétrie est négative, la distribution est inclinée vers la gauche, comme dans la figure\(\PageIndex{13}\).

    Cet histogramme correspond aux données fournies. Il se compose de 5 barres adjacentes dont l'axe X est divisé en intervalles de 1 de 4 à 8. Le sommet se trouve sur la droite et la hauteur des barres diminue vers la gauche.

    Graphique 2.12

    La moyenne est de 6,3, la médiane est de 6,5 et le mode est de sept. Notez que la moyenne est inférieure à la médiane et que les deux sont inférieures au mode. La moyenne et la médiane reflètent toutes deux l'asymétrie, mais la moyenne le reflète davantage.

    L'histogramme des données : 6 ; 7 ; 7 ; 7 ; 7 ; 8 ; 8 ; 8 ; 9 ; 10 n'est pas non plus symétrique. Elle est inclinée vers la droite.

    Cet histogramme correspond aux données fournies. Il se compose de 5 barres adjacentes dont l'axe X est divisé en intervalles de 1 de 6 à 10. Le sommet se trouve à gauche et la hauteur des barres diminue vers la droite.

    Graphique 2.13

    La moyenne est de 7,7, la médiane est de 7,5 et le mode est de sept. Parmi les trois statistiques, la moyenne est la plus grande, tandis que le mode est le plus petit. Encore une fois, c'est la moyenne qui reflète le plus l'asymétrie.

    En résumé, en général, si la distribution des données est inclinée vers la gauche, la moyenne est inférieure à la médiane, qui est souvent inférieure au mode. Si la distribution des données est inclinée vers la droite, le mode est souvent inférieur à la médiane, qui est inférieure à la moyenne.

    Comme pour la moyenne, la médiane et le mode, et comme nous le verrons sous peu, pour la variance, il existe des formules mathématiques qui nous donnent des mesures précises de ces caractéristiques de la distribution des données. En examinant à nouveau la formule de l'asymétrie, nous constatons qu'il s'agit d'une relation entre la moyenne des données et les observations individuelles cubiques.

    \[a_{3}=\sum \frac{\left(x_{i}-\overline{x}\right)^{3}}{n s^{3}}\nonumber\]

    où ss est l'écart type des données\(\mathrm{X}_{i}\), et\(\overline{x}\) est la moyenne arithmétique et\(n\) la taille de l'échantillon.

    Formellement, la moyenne arithmétique est connue comme le premier moment de la distribution. Le deuxième moment que nous verrons est la variance, et l'asymétrie est le troisième moment. La variance mesure les différences au carré entre les données et la moyenne et l'asymétrie mesure les différences cubiques entre les données et la moyenne. Bien qu'une variance ne puisse jamais être un nombre négatif, la mesure de l'asymétrie le peut et c'est ainsi que nous déterminons si les données sont asymétriques à droite ou à gauche. L'asymétrie d'une distribution normale est nulle, et toute donnée symétrique doit présenter une asymétrie proche de zéro. Les valeurs négatives pour l'asymétrie indiquent les données qui sont inclinées vers la gauche et les valeurs positives pour l'asymétrie indiquent les données qui sont inclinées vers la droite. Par inclinée vers la gauche, nous entendons que la queue gauche est longue par rapport à la queue droite. De même, une queue inclinée vers la droite signifie que la queue droite est longue par rapport à la queue gauche. L'asymétrie caractérise le degré d'asymétrie d'une distribution autour de sa moyenne. Alors que la moyenne et l'écart type sont des quantités dimensionnelles (c'est pourquoi nous allons prendre la racine carrée de la variance), c'est-à-dire avoir les mêmes unités que les quantités mesurées\(\mathrm{X}_{i}\), l'asymétrie est définie de manière conventionnelle de manière à la rendre non dimensionnelle. Il s'agit d'un nombre pur qui caractérise uniquement la forme de la distribution. Une valeur positive d'asymétrie signifie une distribution avec une queue asymétrique s'étendant vers le plus positif\(X\) et une valeur négative signifie une distribution dont la queue s'étend vers le plus négatif\(X\). Une mesure nulle de l'asymétrie indiquera une distribution symétrique.

    L'asymétrie et la symétrie deviennent importantes lorsque nous aborderons les distributions de probabilité dans les chapitres suivants.