1.3 : Niveaux de mesure
- Page ID
- 191452
Une fois que vous disposez d'un ensemble de données, vous devez l'organiser de manière à pouvoir analyser la fréquence à laquelle chaque donnée apparaît dans l'ensemble. Toutefois, lorsque vous calculez la fréquence, vous devrez peut-être arrondir vos réponses afin qu'elles soient aussi précises que possible.
Niveaux de mesure
La façon dont un ensemble de données est mesuré s'appelle son niveau de mesure. Les procédures statistiques correctes dépendent de la familiarité du chercheur avec les niveaux de mesure. Toutes les opérations statistiques ne peuvent pas être utilisées avec tous les ensembles de données. Les données peuvent être classées en quatre niveaux de mesure. Ils sont (du niveau le plus bas au niveau le plus élevé) :
- Niveau d'échelle nominal
- Niveau d'échelle ordinale
- Niveau d'échelle d'intervalle
- Niveau d'échelle de ratio
Les données mesurées à l'aide d'une échelle nominale sont qualitatives (catégorielles). Les catégories, les couleurs, les noms, les étiquettes et les aliments préférés ainsi que les réponses par oui ou par non sont des exemples de données relatives au niveau nominal. Les données de l'échelle nominale ne sont pas ordonnées. Par exemple, essayer de classer les gens selon leur nourriture préférée n'a aucun sens. Mettre la pizza en premier et les sushis en second ne signifie pas.
Les fabricants de smartphones sont un autre exemple de données à l'échelle nominale. Les données sont les noms des entreprises qui fabriquent des smartphones, mais il n'y a pas d'ordre convenu pour ces marques, même si les utilisateurs peuvent avoir des préférences personnelles. Les données d'échelle nominale ne peuvent pas être utilisées dans les calculs.
Les données mesurées à l'aide d'une échelle ordinale sont similaires aux données d'échelle nominale, mais il existe une grande différence. Les données de l'échelle ordinale peuvent être ordonnées. La liste des cinq principaux parcs nationaux des États-Unis est un exemple de données à l'échelle ordinale. Les cinq meilleurs parcs nationaux des États-Unis peuvent être classés de 1 à 5, mais nous ne pouvons pas mesurer les différences entre les données.
Un autre exemple d'utilisation de l'échelle ordinale est une enquête sur les croisières où les réponses aux questions concernant la croisière sont « excellente », « bonne », « satisfaisante » et « insatisfaisante ». Ces réponses sont classées de la réponse la plus souhaitée à la moins souhaitée. Mais les différences entre deux données ne peuvent pas être mesurées. Comme les données d'échelle nominale, les données d'échelle ordinale ne peuvent pas être utilisées dans les calculs.
Les données mesurées à l'aide de l'échelle d'intervalles sont similaires aux données de niveau ordinal car leur ordre est défini mais il existe une différence entre les données. Les différences entre les données d'échelle d'intervalle peuvent être mesurées même si les données n'ont pas de point de départ.
Les échelles de température telles que Celsius (C) et Fahrenheit (F) sont mesurées à l'aide de l'échelle d'intervalles. Dans les deux mesures de température, 40° est égal à 100° moins 60°. Les différences ont du sens. Mais 0 degré ne l'est pas parce que, sur les deux échelles, 0 n'est pas la température la plus basse absolue. Des températures telles que -10° F et -15° C existent et sont inférieures à 0.
Les données de niveau d'intervalle peuvent être utilisées dans les calculs, mais aucun type de comparaison ne peut être effectué. 80° C n'est pas quatre fois plus chaud que 20° C (et 80° F n'est pas quatre fois plus chaud que 20° F). Le ratio de 80 à 20 (ou de quatre pour un) n'a aucune signification.
Les données mesurées à l'aide de l'échelle de ratio résolvent le problème de ratio et vous fournissent le plus d'informations possible. Les données d'échelle de ratio sont similaires aux données d'échelle d'intervalles, mais elles ont un point 0 et des ratios peuvent être calculés. Par exemple, les notes obtenues à l'examen final pour quatre statistiques à choix multiples sont de 80, 68, 20 et 92 (sur 100 points possibles). Les examens sont notés à la machine.
Les données peuvent être classées du plus bas au plus élevé : 20, 68, 80, 92.
Les différences entre les données ont un sens. Le score 92 est supérieur de 24 points au score 68. Les ratios peuvent être calculés. Le plus petit score est 0. Donc 80, c'est quatre fois 20. Le score de 80 est quatre fois meilleur que le score de 20.
Fréquence
On a demandé à 20 étudiants combien d'heures ils travaillaient par jour. Leurs réponses, en heures, sont les suivantes : 5 ; 6 ; 3 ; 3 ; 2 ; 4 ; 7 ; 5 ; 2 ; 3 ; 5 ; 5 ; 6 ; 5 ; 4 ; 4 ; 3 ; 3 ; 5 ; 2 ; 5 ; 3.
Le tableau\(\PageIndex{5}\) répertorie les différentes valeurs de données par ordre croissant et leurs fréquences.
\ (\ PageIndex {5} \) Tableau de fréquence des heures de travail des étudiants « >Valeur des données | Fréquence |
---|---|
2 | 3 |
3 | 5 |
4 | 3 |
5 | 6 |
6 | 2 |
7 | 1 |
Tableau 1.5 Tableau de fréquence des heures de travail des étudiants
Une fréquence est le nombre de fois qu'une valeur des données se produit. Selon Table\(\PageIndex{5}\), trois étudiants travaillent deux heures, cinq étudiants travaillent trois heures, et ainsi de suite. La somme des valeurs de la colonne des fréquences, 20, représente le nombre total d'élèves inclus dans l'échantillon.
Une fréquence relative est le rapport (fraction ou proportion) entre le nombre de fois qu'une valeur des données apparaît dans l'ensemble de résultats par rapport au nombre total de résultats. Pour trouver les fréquences relatives, divisez chaque fréquence par le nombre total d'élèves de l'échantillon, dans ce cas, 20. Les fréquences relatives peuvent être écrites sous forme de fractions, de pourcentages ou de décimales.
\ (\ PageIndex {6} \) Tableau de fréquence des heures de travail des étudiants avec fréquences relatives « >Valeur des données | Fréquence | Fréquence relative |
---|---|---|
2 | 3 | \(\frac{3}{20}\)ou 0,15 |
3 | 5 | \(\frac{5}{20}\)ou 0,25 |
4 | 3 | \(\frac{3}{20}\)ou 0,15 |
5 | 6 | \(\frac{6}{20}\)ou 0,30 |
6 | 2 | \(\frac{2}{20}\)ou 0,10 |
7 | 1 | \(\frac{1}{20}\)ou 0,05 |
Tableau 1.6 Tableau de fréquence des heures de travail des étudiants avec fréquences relatives
La somme des valeurs de la colonne de fréquence relative du tableau\(\PageIndex{6}\) est\(\frac{20}{20}\), ou 1.
La fréquence relative cumulée est l'accumulation des fréquences relatives précédentes. Pour trouver les fréquences relatives cumulées, ajoutez toutes les fréquences relatives précédentes à la fréquence relative de la ligne en cours, comme indiqué dans le tableau\(\PageIndex{7}\).
\ (\ PageIndex {7} \) Tableau de fréquence des heures de travail des étudiants avec fréquences relatives et cumulées « >Valeur des données | Fréquence | Fréquence relative | Fréquence relative cumulée |
---|---|---|---|
2 | 3 | \(\frac{3}{20}\)ou 0,15 | 0,15 |
3 | 5 | \(\frac{5}{20}\)ou 0,25 | 0,15 + 0,25 = 0,40 |
4 | 3 | \(\frac{3}{20}\)ou 0,15 | 0,40 + 0,15 = 0,55 |
5 | 6 | \(\frac{6}{20}\)ou 0,30 | 0,55 + 0,30 = 0,85 |
6 | 2 | \(\frac{2}{20}\)ou 0,10 | 0,85 + 0,10 = 0,95 |
7 | 1 | \(\frac{1}{20}\)ou 0,05 | 0,95 + 0,05 = 1,00 |
Tableau 1.7 Tableau de fréquence des heures de travail des étudiants avec fréquences relatives et cumulées
La dernière entrée de la colonne des fréquences relatives cumulées est une, indiquant que cent pour cent des données ont été accumulées.
REMARQUE
En raison de l'arrondissement, la somme de la colonne des fréquences relatives peut ne pas toujours être égale à un, et la dernière entrée de la colonne des fréquences relatives cumulées peut ne pas être une. Cependant, ils doivent tous être proches d'un.
Le tableau\(\PageIndex{8}\) représente les hauteurs, en pouces, d'un échantillon de 100 joueurs de football semi-professionnels masculins.
\ (\ PageIndex {8} \) Tableau de fréquence de la taille des joueurs de football « >Hauteurs (pouces) | Fréquence | Fréquence relative | Fréquence relative cumulée |
---|---|---|---|
59,95 — 61,95 | 5 | \(\frac{5}{10}\)= 0,05 | 0,05 |
61,95 — 63,95 | 3 | \(\frac{3}{100}\)= 0,03 | 0,05 + 0,03 = 0,08 |
63,95 — 65,95 | 15 | \(\frac{15}{100}\)= 0,15 | 0,08 + 0,15 = 0,23 |
65,95 à 67,95 | 40 | \(\frac{40}{100}\)= 0,40 | 0,23 + 0,40 = 0,63 |
67,95—69,95 | 17 | \(\frac{17}{100}\)= 0,17 | 0,63 + 0,17 = 0,80 |
69,95 — 71,95 | 12 | \(\frac{12}{100}\)= 0,12 | 0,80 + 0,12 = 0,92 |
71,95 — 73,95 | 7 | \(\frac{7}{100}\)= 0,07 | 0,92 + 0,07 = 0,99 |
73,95 à 75,95 | 1 | \(\frac{1}{100}\)= 0,01 | 0,99 + 0,01 = 1,00 |
Total = 100 | Total = 1,00 |
Tableau 1.8 Tableau de fréquence de la taille des joueurs de football
Les données de ce tableau ont été regroupées selon les intervalles suivants :
- 59,95 à 61,95 pouces
- 61,95 à 63,95 pouces
- 63,95 à 65,95 pouces
- 65,95 à 67,95 pouces
- 67,95 à 69,95 pouces
- 69,95 à 71,95 pouces
- 71,95 à 73,95 pouces
- 73,95 à 75,95 pouces
Dans cet exemple, il y a cinq joueurs dont la taille se situe dans l'intervalle 59,95 à 61,95 pouces, trois joueurs dont la taille se situe dans l'intervalle 61,95 à 63,95 pouces, 15 joueurs dont la hauteur se situe dans l'intervalle 63,95 à 65,95 pouces, 40 joueurs dont les hauteurs se situent dans l'intervalle 65,95 à 67,95 pouces, 17 joueurs dont les hauteurs se situent dans l'intervalle 67,95 à 69,95 pouces, 12 joueurs dont les hauteurs se situent dans l'intervalle 69,95 à 71,95 pouces, sept joueurs dont les hauteurs se situent dans l'intervalle 71,95 à 73,95 pouces et un joueur dont les hauteurs se situent dans l'intervalle 73,95 à 75,95. Toutes les hauteurs se situent entre les extrémités d'un intervalle et non entre les extrémités.
Exemple\(\PageIndex{14}\)
Dans le tableau\(\PageIndex{8}\), trouvez le pourcentage de hauteurs inférieures à 65,95 pouces.
Exercice\(\PageIndex{14}\)
Le tableau\(\PageIndex{9}\) montre la quantité, en pouces, de précipitations annuelles dans un échantillon de villes.
\ (\ PageIndex {9} \) « >Pluie (pouces) | Fréquence | Fréquence relative | Fréquence relative cumulée |
---|---|---|---|
2,95 à 4,97 | 6 | \(\frac{6}{50}\)= 0,12 | 0,12 |
4,97 à 6,99 | 7 | \(\frac{7}{50}\)= 0,14 | 0,12 + 0,14 = 0,26 |
6,99—9,01 | 15 | \(\frac{15}{50}\)= 0,30 | 0,26 + 0,30 = 0,56 |
9 janvier à 11 h 03 | 8 | \(\frac{8}{50}\)= 0,16 | 0,56 + 0,16 = 0,72 |
11 h 03 à 13 h 05 | 9 | \(\frac{9}{50}\)= 0,18 | 0,72 + 0,18 = 0,90 |
13 h 05 à 15 h 07 | 5 | \(\frac{5}{50}\)= 0,10 | 0,90 + 0,10 = 1,00 |
Total = 50 | Total = 1,00 |
Dans le tableau\(\PageIndex{9}\), trouvez le pourcentage de précipitations inférieures à 9,01 pouces.
Exemple\(\PageIndex{15}\)
Dans le tableau\(\PageIndex{8}\), trouvez le pourcentage de hauteurs comprises entre 61,95 et 65,95 pouces.
- Réponse
-
Solution 1.15
Additionnez les fréquences relatives dans les deuxième et troisième rangées :\(0.03 + 0.15 = 0.18\) soit 18 %.
Exercice\(\PageIndex{15}\)
Dans le tableau\(\PageIndex{9}\), trouvez le pourcentage de précipitations comprises entre 6,99 et 13,05 pouces.
Exemple\(\PageIndex{16}\)
Utilisez les tailles des 100 joueurs de football semi-professionnels masculins du tableau\(\PageIndex{8}\). Remplissez les champs et vérifiez vos réponses.
- Le pourcentage de hauteurs comprises entre 67,95 et 71,95 pouces est : ____.
- Le pourcentage de hauteurs comprises entre 67,95 et 73,95 pouces est : ____.
- Le pourcentage de hauteurs supérieures à 65,95 pouces est le suivant : ____.
- Le nombre de joueurs de l'échantillon mesurant entre 61,95 et 71,95 pouces est de : ____.
- Quels types de données correspondent aux hauteurs ?
- Décrivez comment vous pourriez recueillir ces données (les hauteurs) afin qu'elles soient caractéristiques de tous les joueurs de football semi-professionnels masculins.
N'oubliez pas que vous comptez les fréquences. Pour trouver la fréquence relative, divisez-la par le nombre total de valeurs de données. Pour trouver la fréquence relative cumulée, ajoutez toutes les fréquences relatives précédentes à la fréquence relative de la ligne en cours.
- Réponse
-
Solution 1.16
- 29 %
- 36 %
- 77 %
- 87
- quantitatif continu
- obtenez les listes de chaque équipe et choisissez un échantillon aléatoire simple parmi chacune
Exemple\(\PageIndex{17}\)
Dix-neuf personnes ont été invitées à indiquer combien de kilomètres, au mille le plus proche, elles se rendaient au travail chaque jour. Les données sont les suivantes : 2 ; 5 ; 7 ; 3 ; 2 ; 10 ; 18 ; 15 ; 20 ; 7 ; 10 ; 18 ; 5 ; 12 ; 13 ; 12 ; 12 ; 12 ; 12 ; 12 ; 4 ; 5 ; 10. La table\(\PageIndex{10}\) a été produite :
\ (\ PageIndex {10} \) Fréquence des distances de trajet « >Données | Fréquence | Fréquence relative | Fréquence relative cumulée |
---|---|---|---|
3 | 3 | \(\frac{3}{19}\) | 0,1579 |
4 | 1 | \(\frac{1}{19}\) | 0,2 105 |
5 | 3 | \(\frac{3}{19}\) | 0,1579 |
7 | 2 | \(\frac{2}{19}\) | 0,2632 |
10 | 3 | \(\frac{4}{19}\) | 0,4737 |
12 | 2 | \(\frac{2}{19}\) | 0,7895 |
13 | 1 | \(\frac{1}{19}\) | 0,8421 |
15 | 1 | \(\frac{1}{19}\) | 0,8948 |
18 | 1 | \(\frac{1}{19}\) | 0,9474 |
20 | 1 | \(\frac{1}{19}\) | 1 000 |
- Le tableau est-il correct ? Si ce n'est pas le cas, qu'est-ce qui ne va pas ?
- Vrai ou faux : Trois pour cent des personnes interrogées parcourent cinq kilomètres. Si la déclaration n'est pas correcte, quelle devrait-elle être ? Si le tableau est incorrect, apportez les corrections nécessaires.
- Quelle fraction des personnes interrogées parcourent cinq ou sept miles ?
- Quelle fraction des personnes interrogées parcourent 20 miles ou plus ? À moins de 20 km ? Entre 5 et 13 miles (sans compter les 5 et 13 miles) ?
- Réponse
-
Solution 1.17
- Non. La colonne de fréquence est égale à 18, et non à 19. Les fréquences relatives cumulées ne sont pas toutes correctes.
- Faux. La fréquence pour trois miles devrait être de un ; pour deux miles (à gauche), deux. La colonne des fréquences relatives cumulées doit se lire comme suit : 0,1052, 0,1579, 0,2105, 0,3684, 0,4737, 0,6316, 0,7368, 0,7895, 0,8421, 0,9474, 1,0000.
- \(\frac{5}{19}\)
- \(\frac{7}{19}, \frac{12}{19}, \frac{7}{19)\)
Exercice\(\PageIndex{17}\)
Le tableau\(\PageIndex{9}\) représente la quantité, en pouces, de précipitations annuelles dans un échantillon de villes. Quelle fraction des villes étudiées reçoit entre 11,03 et 13,05 pouces de pluie chaque année ?
Exemple\(\PageIndex{18}\)
Le tableau\(\PageIndex{11}\) présente le nombre total de décès dans le monde à la suite de tremblements de terre pour la période allant de 2000 à 2012.
\ (\ PageIndex {11} \) « >Année | Nombre total de décès |
---|---|
2000 | 231 |
2001 | 21 357 |
2002 | 11 685 |
2003 | 33 819 |
2004 | 228 802 |
2005 | 88 003 |
2006 | 6 605 |
2007 | 712 |
2008 | 88 011 |
2009 | 1 790 |
2010 | 320 120 |
2011 | 21 953 |
2012 | 768 |
Totale | 823 856 |
Répondez aux questions suivantes.
- Quelle est la fréquence des décès mesurée de 2006 à 2009 ?
- Quel est le pourcentage de décès survenus après 2009 ?
- Quelle est la fréquence relative des décès survenus en 2003 ou avant ?
- Quel est le pourcentage de décès survenus en 2004 ?
- De quel type de données s'agit-il du nombre de décès ?
- L'échelle de Richter est utilisée pour quantifier l'énergie produite par un tremblement de terre. Des exemples de numéros d'échelle de Richter sont 2,3, 4,0, 6,1 et 7,0. De quel type de données s'agit-il de chiffres ?
- Réponse
-
Solution 1.18
- 97 118 (11,8 %)
- 41,6 %
- 67 092/823 356 ou 0,081 ou 8,1 %
- 27,8 %
- Quantitatif discret
- Quantitatif continu
Exercice\(\PageIndex{18}\)
Le tableau\(\PageIndex{12}\) contient le nombre total d'accidents mortels de la route aux États-Unis pour la période allant de 1994 à 2011.
\ (\ PageIndex {12} \) « >Année | Nombre total d'accidents | Année | Nombre total d'accidents |
---|---|---|---|
1994 | 36 254 | 2004 | 38 444 |
1995 | 37 241 | 2005 | 39 252 |
1996 | 37 494 | 2006 | 38 648 |
1997 | 37 324 | 2007 | 37 435 |
1998 | 37 107 | 2008 | 34 172 |
1999 | 37 140 | 2009 | 30 862 |
2000 | 37 526 | 2010 | 30 296 |
2001 | 37 862 | 2011 | 29 757 |
2002 | 38 491 | Totale | 653 782 |
2003 | 38 477 |
Répondez aux questions suivantes.
- Quelle est la fréquence des décès mesurée entre 2000 et 2004 ?
- Quel est le pourcentage de décès survenus après 2006 ?
- Quelle est la fréquence relative des décès survenus en 2000 ou avant ?
- Quel est le pourcentage de décès survenus en 2011 ?
- Quelle est la fréquence relative cumulée pour 2006 ? Expliquez ce que ce chiffre vous indique à propos des données.