Skip to main content
Global

2.3 : Mesures du centre des données

  • Page ID
    191514
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Le « centre » d'un ensemble de données permet également de décrire l'emplacement. Les deux mesures du « centre » des données les plus couramment utilisées sont la moyenne et la médiane. Pour calculer le poids moyen de 50 personnes, additionnez les 50 poids et divisez par 50. Techniquement, c'est la moyenne arithmétique. Nous discuterons de la moyenne géométrique plus tard. Pour déterminer le poids médian des 50 personnes, classez les données et trouvez le nombre qui divise les données en deux parties égales, ce qui signifie un nombre égal d'observations de chaque côté. Le poids de 25 personnes est inférieur à ce poids et 25 personnes sont plus lourdes que ce poids. La médiane est généralement une meilleure mesure du centre lorsqu'il existe des valeurs extrêmes ou des valeurs aberrantes, car elle n'est pas affectée par les valeurs numériques précises des valeurs aberrantes. La moyenne est la mesure la plus courante du centre.

    REMARQUE

    Les mots « moyenne » et « moyenne » sont souvent utilisés de manière interchangeable. La substitution d'un mot à l'autre est une pratique courante. Le terme technique est « moyenne arithmétique » et « moyenne » désigne techniquement un emplacement central. Formellement, la moyenne arithmétique est appelée le premier moment de la distribution par les mathématiciens. Toutefois, dans la pratique, parmi les non-statisticiens, la « moyenne » est communément acceptée pour la « moyenne arithmétique ».

    Lorsque chaque valeur de l'ensemble de données n'est pas unique, la moyenne peut être calculée en multipliant chaque valeur distincte par sa fréquence, puis en divisant la somme par le nombre total de valeurs de données. La lettre utilisée pour représenter la moyenne de l'échantillon est un x surmonté d'une barre (prononcé «\(x\) barre ») :\(\overline x\).

    La lettre grecque\(\mu\) (prononcée « mew ») représente la moyenne de la population. L'une des exigences pour que la moyenne de l'échantillon soit une bonne estimation de la moyenne de la population est que l'échantillon prélevé soit vraiment aléatoire.

    Pour vérifier que les deux méthodes de calcul de la moyenne sont identiques, considérez l'échantillon :
    1 ; 1 ; 1 ; 2 ; 2 ; 2 ; 3 ; 4 ; 4 ; 4 ; 4 ; 4 ; 4 ; 4

    \[\overline{x}=\frac{1+1+1+2+2+3+4+4+4+4+4}{11}=2.7\nonumber\]

    \[\overline{x}=\frac{3(1)+2(2)+1(3)+5(4)}{11}=2.7\nonumber\]

    Dans le second calcul, les fréquences sont 3, 2, 1 et 5.

    Vous pouvez rapidement trouver l'emplacement de la médiane à l'aide de l'expression\(\frac{n+1}{2}\).

    La lettre\(n\) est le nombre total de valeurs de données dans l'échantillon. S'il s'\(n\)agit d'un nombre impair, la médiane est la valeur médiane des données ordonnées (de la plus petite à la plus grande). S'il s'\(n\)agit d'un nombre pair, la médiane est égale aux deux valeurs médianes additionnées et divisées par deux une fois les données ordonnées. Par exemple, si le nombre total de valeurs de données est de 97, alors\(\frac{n+1}{2}=\frac{97+1}{2}=49\). La médiane est la 49e valeur des données ordonnées. Si le nombre total de valeurs de données est de 100, alors\(\frac{n+1}{2}=\frac{100+1}{2}=50.5\). La médiane se situe à mi-chemin entre les 50 e et 51 e valeurs. L'emplacement de la médiane et la valeur de la médiane ne sont pas identiques. La lettre majuscule\(M\) est souvent utilisée pour représenter la médiane. L'exemple suivant illustre l'emplacement de la médiane et la valeur de la médiane.

    Exemple 2.24

    Les données sur le SIDA indiquant le nombre de mois pendant lesquels un patient atteint du sida vit après avoir pris un nouvel anticorps sont les suivantes (du plus petit au plus grand) :
    3 ; 4 ; 8 ; 8 ; 10 ; 11 ; 12 ; 13 ; 14 ; 15 ; 15 ; 16 ; 16 ; 16 ; 17 ; 17 ; 18 ; 21 ; 22 ; 22 ; 22 ; 24 ; 24 ; 24 ; 25 ; 26 ; 26 ; 27 ; 27 ; 27 ; 29 ; 31 ; 32 ; 33 ; 33 ; 24 ; 24 ; 24 ; 25 ; 26 ; 26 ; 27 ; 27 ; 29 ; 31 ; 32 ; 33 ; 33 ; 24 ; 24 ; 24 ; 25 ; 26 35 ; 37 ; 40 ; 44 ; 44 ; 47 ;
    Calculez la moyenne et la médiane.

    Réponse

    Solution 2.24

    Le calcul de la moyenne est le suivant :

    \(\overline{x}=\frac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+\ldots+35+37+40+(44)(2)+47]}{40}=23.6\)
    Pour trouver la médiane\(M\), utilisez d'abord la formule de l'emplacement. L'emplacement est le
    \(\frac{n+1}{2}=\frac{40+1}{2}=20.5\)
    suivant : en partant de la plus petite valeur, la médiane se situe entre les 20 e et 21 e valeurs (les deux 24) :
    \(3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47;\)

    \(M=\frac{24+24}{2}=24\)

    Exemple 2.25

    Supposons que dans une petite ville de 50 habitants, une personne gagne 5 000 000$ par an et que les 49 autres gagnent chacune 30 000$. Quelle est la meilleure mesure du « centre » : la moyenne ou la médiane ?

    Réponse

    Solution 2.25

    \(\overline{x}=\frac{5,000,000+49(30,000)}{50}=129,400\)

    \(M = 30,000\)

    (Il y a 49 personnes qui gagnent 30 000$ et une personne qui gagne 5 000 000$.)

    La médiane est une meilleure mesure du « centre » que la moyenne, car 49 des valeurs sont de 30 000 et une est de 5 000 000. Les 5 000 000 sont une valeur aberrante. Les 30 000 nous donnent une meilleure idée du milieu des données.

    Le mode est une autre mesure du centre. Le mode est la valeur la plus fréquente. Il peut y avoir plusieurs modes dans un ensemble de données, à condition que ces valeurs aient la même fréquence et que cette fréquence soit la plus élevée. Un ensemble de données comportant deux modes est appelé bimodal.

    Exemple 2.26

    Les résultats des examens statistiques pour 20 étudiants sont les suivants :

    50 ; 53 ; 59 ; 59 ; 63 ; 63 ; 72 ; 72 ; 72 ; 72 ; 72 ; 72 ; 76 ; 78 ; 81 ; 83 ; 84 ; 84 ; 84 ; 84 ; 90 ; 93

    Trouvez le mode.

    Réponse

    Solution 2.26

    Le score le plus fréquent est de 72, qui se produit cinq fois. Modèle = 7,2

    Exemple 2.27

    Cinq résultats d'examens immobiliers sont 430, 430, 480, 480, 480, 495. L'ensemble de données est bimodal car les scores 430 et 480 apparaissent chacun deux fois.

    Quand le mode est-il la meilleure mesure du « centre » ? Envisagez un programme de perte de poids qui annonce une perte de poids moyenne de six livres la première semaine du programme. Le mode peut indiquer que la plupart des gens perdent deux kilos la première semaine, ce qui rend le programme moins attrayant.

    REMARQUE

    Le mode peut être calculé pour des données qualitatives ainsi que pour des données quantitatives. Par exemple, si l'ensemble de données est : rouge, rouge, rouge, vert, vert, jaune, violet, noir, bleu, le mode est rouge.

    Calcul de la moyenne arithmétique des tables de fréquences groupées

    Lorsque seules des données groupées sont disponibles, vous ne connaissez pas les valeurs de données individuelles (nous ne connaissons que les intervalles et les fréquences des intervalles) ; par conséquent, vous ne pouvez pas calculer de moyenne exacte pour l'ensemble de données. Ce que nous devons faire, c'est estimer la moyenne réelle en calculant la moyenne d'un tableau de fréquences. Un tableau de fréquences est une représentation de données dans laquelle des données groupées sont affichées avec les fréquences correspondantes. Pour calculer la moyenne à partir d'un tableau de fréquences groupé, nous pouvons appliquer la définition de base de la moyenne : moyenne =\(\frac{\text { data sum }}{\text { number of data values }}\) Il suffit de modifier la définition pour l'adapter aux restrictions d'un tableau de fréquences.

    Comme nous ne connaissons pas les valeurs de données individuelles, nous pouvons trouver le point médian de chaque intervalle. Le point médian est\(\frac{\text { lower boundary+upper boundary}}{2}\). Nous pouvons maintenant modifier la définition de la moyenne pour qu'\(\textbf{Mean of Frequency Table}=\frac{\sum f m}{\sum f}\)elle soit où f = la fréquence de l'intervalle et m = le point médian de l'intervalle.

    Exemple 2.28

    Un tableau de fréquences présentant le dernier test statistique du professeur Blount est présenté. Trouvez la meilleure estimation de la moyenne de la classe.

    Intervalle de notes Nombre d'élèves
    50—56,5 1
    56,5 à 62,5 0
    62,5 à 68,5 4
    68,5 À 74,5 4
    74,5 à 80,5 2
    80,5 à 86,5 3
    86,5 à 92,5 4
    92,5 à 98,5 1
    Tableau 2.24
    Réponse

    Solution 2.28

    Trouvez les points médians de tous les intervalles
    Intervalle de notes Point médian
    50—56,5 53,25
    56,5 à 62,5 59,5
    62,5 à 68,5 65,5
    68,5 À 74,5 71,5
    74,5 à 80,5 77,5
    80,5 à 86,5 83,5
    86,5 à 92,5 89,5
    92,5 à 98,5 95,5
    Tableau 2.25
    • Calculez la somme du produit de la fréquence et du point médian de chaque intervalle. \(\sum f m\)\(53.25(1)+59.5(0)+65.5(4)+71.5(4)+77.5(2)+83.5(3)+89.5(4)+95.5(1)=1460.25\)
    • \(\mu=\frac{\sum f m}{\sum f}=\frac{1460.25}{19}=76.86\)

    Exercice 2.28

    Maris a mené une étude sur l'effet des jeux vidéo sur la mémoire. Dans le cadre de son étude, elle a compilé les données suivantes :

    Heures que les adolescents passent à jouer aux jeux vidéo Nombre d'adolescents
    0 à 3,5 3
    3,5 à 7,5 7
    7,5 à 11,5 12
    11,5 à 15,5 7
    15,5 à 19,5 9
    Tableau 2.26

    Quelle est la meilleure estimation du nombre moyen d'heures passées à jouer à des jeux vidéo ?