6.2 : Utilisation de la distribution normale
- Page ID
- 191366
La zone ombrée du graphique suivant indique la zone située à droite de\(x\). Cette zone est représentée par la probabilité\(P(X > x)\). Les tables normales fournissent la probabilité entre la moyenne, zéro pour la distribution normale standard et une valeur spécifique telle que\(x_1\). Il s'agit de la partie non ombrée du graphique allant de la moyenne à\(x_1\).
Comme la distribution normale est symétrique, si elle\(x_1\) était à la même distance à gauche de la moyenne de l'aire, la probabilité, dans la queue gauche, serait la même que dans la zone ombrée dans la queue droite. Gardez également à l'esprit qu'en raison de la symétrie de cette distribution, la moitié de la probabilité se trouve à droite de la moyenne et l'autre moitié à gauche de la moyenne.
Calculs de probabilités
Pour déterminer la probabilité des fonctions de densité de probabilité avec une variable aléatoire continue, nous devons calculer l'aire sous la fonction à travers les valeurs qui\(X\) nous intéressent. Pour la distribution normale, cela semble difficile compte tenu de la complexité de la formule. Il existe cependant un moyen simple d'obtenir ce que nous voulons. Voici à nouveau la formule de la distribution normale :
\[f(x)=\frac{1}{\sigma \cdot \sqrt{2 \cdot \pi}} \cdot \mathrm{e}^{-\frac{1}{2} \cdot\left(\frac{x-\mu}{\sigma}\right)^{2}}\nonumber\]
En examinant la formule de la distribution normale, il n'est pas clair comment nous allons résoudre la probabilité en procédant de la même manière que nous l'avons fait avec les fonctions de probabilité précédentes. Nous y avons intégré les données dans la formule et avons fait le calcul.
Pour résoudre ce casse-tête, nous commençons à savoir que la zone sous une fonction de densité de probabilité est la probabilité.
Cela montre que l'aire entre\(X_1\) et\(X_2\) est la probabilité indiquée dans la formule :\(P (X_1 \leq X \leq X_2)\)
L'outil mathématique nécessaire pour trouver l'aire sous une courbe est le calcul intégral. L'intégrale de la fonction de densité de probabilité normale entre les deux points x 1 et x 2 est l'aire sous la courbe entre ces deux points et est la probabilité entre ces deux points.
Faire ces intégrales n'est pas amusant et peut prendre beaucoup de temps. Mais maintenant, en nous souvenant qu'il existe un nombre infini de distributions normales, nous pouvons considérer celle avec une moyenne de zéro et un écart type de 1. Cette distribution normale particulière porte le nom de distribution normale standard. En mettant ces valeurs dans la formule, cela se réduit à une équation très simple. Nous pouvons maintenant calculer assez facilement toutes les probabilités pour n'importe quelle valeur de x, pour cette distribution normale particulière, qui a une moyenne de zéro et un écart type de 1. Ils ont été produits et sont disponibles ici en annexe au texte ou partout sur le Web. Ils sont présentés de différentes manières. Le tableau de ce texte est la présentation la plus courante et est configuré avec des probabilités pour la moitié de la distribution commençant par zéro, la moyenne, et se déplaçant vers l'extérieur. La zone ombrée du graphique en haut du tableau des tableaux statistiques représente la probabilité entre zéro et la\(Z\) valeur spécifique notée sur l'axe horizontal\(Z\).
Le seul problème est que même avec ce tableau, ce serait une coïncidence ridicule que nos données aient une moyenne de zéro et un écart type de un. La solution consiste à convertir la distribution que nous avons avec sa moyenne et son écart type en cette nouvelle distribution normale standard. La normale standard possède une variable aléatoire appelée\(Z\).
À l'aide de la table normale standard, généralement appelée table normale, pour déterminer la probabilité d'un écart type, allez dans la\(Z\) colonne, lisez jusqu'à 1,0, puis lisez la colonne 0. Ce nombre\(0.3413\) est la probabilité entre zéro et 1 écart type. En haut du tableau se trouve la zone ombrée de la distribution qui représente la probabilité d'un écart type. Le tableau a résolu notre problème de calcul intégral. Mais uniquement si nos données ont une moyenne de zéro et un écart type de 1.
Cependant, le point essentiel ici est que la probabilité d'un écart type sur une distribution normale est la même pour toutes les lois normales. Si l'ensemble de données sur la population a une moyenne de 10 et un écart type de 5, la probabilité de 10 à 15, soit un écart type, est la même que celle de zéro à 1, soit un écart type sur la distribution normale standard. Pour calculer les probabilités, les aires, pour n'importe quelle distribution normale, il suffit de convertir la distribution normale particulière en distribution normale standard et de rechercher la réponse dans les tableaux. À titre de rappel, voici à nouveau la formule de normalisation :
\[Z=\frac{x-\mu}{\sigma}\nonumber\]
où\(Z\) est la valeur de la distribution normale standard,\(X\) est la valeur d'une distribution normale que l'on souhaite convertir en normale standard\(\mu\) et\(\sigma\) sont, respectivement, la moyenne et l'écart type de cette population. Notez que l'équation utilise\(\mu\) et\(\sigma\) qui indique des paramètres de population. Il s'agit toujours d'une question de probabilité, donc nous avons toujours affaire à la population, avec des valeurs de paramètres et une distribution connues. Il est également important de noter que la distribution normale étant symétrique, peu importe que le score z soit positif ou négatif lors du calcul d'une probabilité. Un écart type vers la gauche (score Z négatif) couvre la même zone qu'un écart type vers la droite (score Z positif). C'est pourquoi les tables normales standard ne fournissent pas de zones pour le côté gauche de la distribution. En raison de cette symétrie, la formule du score Z s'écrit parfois comme suit :
\[Z=\frac{|x-\mu|}{\sigma}\nonumber\]
Où les lignes verticales de l'équation indiquent la valeur absolue du nombre.
Ce que fait réellement la formule de normalisation, c'est de calculer le nombre d'écarts types\(X\) à partir de la moyenne de sa propre distribution. La formule de normalisation et le concept de comptage des écarts types par rapport à la moyenne sont le secret de tout ce que nous allons faire dans cette classe de statistiques. Cela s'explique par le fait que toutes les statistiques se résument à la variation et que le comptage des écarts types est une mesure de la variation.
Cette formule, sous de nombreux déguisements, réapparaîtra encore et encore tout au long de ce cours.
Exemple\(\PageIndex{1}\)
Les résultats des examens finaux d'un cours de statistiques étaient normalement répartis avec une moyenne de 63 et un écart type de cinq.
a. Déterminez la probabilité qu'un étudiant sélectionné au hasard ait obtenu plus de 65 points à l'examen.
b. Déterminez la probabilité qu'un élève sélectionné au hasard ait obtenu un score inférieur à 85.
Répondez à une
Soit\(X\) une note à l'examen final. \(X \sim N(63, 5)\), où\(\mu = 63\) et\(\sigma = 5\).
Dessine un graphique.
Ensuite, trouvez\(P(x > 65)\).
\(P(x > 65) = 0.3446\)
\[Z_{1}=\frac{x_{1}-\mu}{\sigma}=\frac{65-63}{5}=0.4\nonumber\]
\(P\left(x \geq x_{1}\right)=P\left(Z \geq Z_{1}\right)=0.3446\)
La probabilité qu'un étudiant sélectionné au hasard ait un score supérieur à 65 est de 0,3446. Voici comment nous avons trouvé cette réponse.
Réponse b
La table normale fournit des probabilités comprises entre zéro et la valeur\(Z_1\). Pour ce problème, la question peut être écrite comme suit :\(P(X \geq 65) = P(Z \geq Z1)\), qui est la zone de la queue. Pour trouver cette zone, la formule serait\(0.5 – P(X \leq 65)\). La moitié de la probabilité est supérieure à la valeur moyenne car il s'agit d'une distribution symétrique. Le graphique montre comment trouver l'aire dans la queue en soustrayant cette partie de la moyenne, zéro, à la\(Z_1\) valeur. La réponse finale est la suivante :\(P(X \geq 63) = P(Z \geq 0.4) = 0.3446\)
\(z=\frac{65-63}{5}=0.4\)
L'aire située à gauche\(Z_1\) de la moyenne de zéro est\(0.1554\)
\(P(x > 65) = P(z > 0.4) = 0.5 – 0.1554 = 0.3446\)
\(Z=\frac{x-\mu}{\sigma}=\frac{85-63}{5}=4.4\)qui est supérieure à la valeur maximale du tableau normal standard. Par conséquent, la probabilité qu'un élève obtienne moins de 85 points est d'environ 1 ou 100 %.
Un score de 85 correspond à 4,4 écarts types par rapport à la moyenne de 63, ce qui se situe au-delà de la plage du tableau des normales standard. Par conséquent, la probabilité qu'un élève obtienne moins de 85 points est d'environ 1 (soit 100 %).
Exercice\(\PageIndex{1}\)
Les scores de golf d'une équipe scolaire étaient normalement distribués avec une moyenne de 68 et un écart type de trois. Déterminez la probabilité qu'un golfeur sélectionné au hasard ait obtenu moins de 65 points.
Exemple\(\PageIndex{2A}\)
Un ordinateur personnel est utilisé pour le travail de bureau à la maison, la recherche, la communication, les finances personnelles, l'éducation, le divertissement, les réseaux sociaux et une myriade d'autres choses. Supposons que le nombre moyen d'heures pendant lesquelles un ordinateur personnel domestique est utilisé à des fins de divertissement est de deux heures par jour. Supposons que les heures de divertissement soient normalement réparties et que l'écart type des heures soit d'une demi-heure.
a. Déterminez la probabilité qu'un ordinateur personnel domestique soit utilisé à des fins de divertissement entre 1,8 et 2,75 heures par jour.
- Réponse
-
a. Soit la\(X\) durée (en heures) pendant laquelle un ordinateur personnel domestique est utilisé à des fins de divertissement. \(X \sim N(2, 0.5)\)où\(\mu= 2\) et\(\sigma = 0.5\).
Trouve\(P(1.8 < X < 2.75)\).
La probabilité que vous recherchez est la zone comprise entre\(X = 1.8\) et\(X = 2.75\). \(P(1.8 < X < 2.75) = 0.5886\)
\(P(1.8 \leq X \leq 2.75) = P(Z_1 \leq Z \leq Z_2)\)
La probabilité qu'un ordinateur personnel domestique soit utilisé entre 1,8 et 2,75 heures par jour à des fins de divertissement est de 0,5886.
Exemple\(\PageIndex{2B}\)
b. Déterminez le nombre maximum d'heures par jour pendant lesquelles le quartile inférieur des ménages utilise un ordinateur personnel à des fins de divertissement.
- Réponse
-
Solution 6.4
b. Pour déterminer le nombre maximum d'heures par jour pendant lesquelles le quartile inférieur des ménages utilise un ordinateur personnel à des fins de divertissement, déterminez le 25e percentile\(k\), où\(P(x < k) = 0.25\).
\(f(Z)=0.5-0.25=0.25, \text { therefore } Z \approx-0.675(\text { or just } 0.67 \text { using the table) } Z=\frac{x-\mu}{\sigma}=\frac{x-2}{0.5}=-0.675 , \text {therefore } x=-0.675 * 0.5+2=1.66\)
Le nombre maximum d'heures par jour pendant lesquelles le quartile inférieur des ménages utilise un ordinateur personnel à des fins de divertissement est de 1,66 heure.
Exercice\(\PageIndex{2}\)
Les scores de golf d'une équipe scolaire étaient normalement distribués avec une moyenne de 68 et un écart type de trois. Déterminez la probabilité qu'un golfeur marque entre 66 et 70.
Exemple\(\PageIndex{3}\)
Aux États-Unis, les utilisateurs de smartphones âgés de 13 à 55 ans et plus suivent approximativement une distribution normale avec une moyenne et un écart type approximatifs de 36,9 ans et 13,9 ans, respectivement.
a. Déterminez la probabilité qu'un utilisateur aléatoire de smartphone âgé de 13 à 55 ans et plus ait entre 23 et 64,7 ans.
Réponse
- Réponse
-
environ 0,8186
-
b. 0,8413
Exemple\(\PageIndex{4}\)
Un cultivateur d'agrumes qui cultive des mandarines constate que les diamètres des mandarines récoltées sur sa ferme suivent une distribution normale avec un diamètre moyen de 5,85 cm et un écart type de 0,24 cm.
a. Déterminez la probabilité qu'une mandarine sélectionnée au hasard dans cette ferme ait un diamètre supérieur à 6,0 cm. Esquissez le graphique.
- Réponse
-
\[Z_{1}=\frac{6-5.85}{.24}=.625\nonumber\]
\(P(x \geq 6) = P(z \geq 0.625) = 0.2670\)
b. Les 20 % moyens des mandarines de cette ferme ont un diamètre compris entre ______ et ______.
\(f(Z)=\frac{0.20}{2}=0.10, \text { therefore } Z \approx \pm 0.25\)
\(Z=\frac{x-\mu}{\sigma}=\frac{x-5.85}{0.24}=\pm 0.25 \rightarrow \pm 0.25 \cdot 0.24+5.85=(5.79,5.91)\)