4.3 : Distribution géométrique
La fonction de densité de probabilité géométrique s'appuie sur ce que nous avons appris de la distribution binomiale. Dans ce cas, l'expérience se poursuit jusqu'à ce qu'elle soit un succès ou un échec plutôt que pour un certain nombre d'essais. Une expérience géométrique présente trois caractéristiques principales.
- Il y a un ou plusieurs procès de Bernoulli avec tous les échecs sauf le dernier, qui est un succès. En d'autres termes, vous continuez à répéter ce que vous faites jusqu'au premier succès. Alors tu arrêtes. Par exemple, vous lancez une fléchette sur une cible jusqu'à ce que vous la touchiez. La première fois que vous frappez la cible est un « succès », alors vous arrêtez de lancer la fléchette. Cela peut prendre six essais avant de toucher la cible. Vous pouvez considérer les essais comme un échec, un échec, un échec, un échec, un succès, un ARRÊT.
- En théorie, le nombre d'essais pourrait durer indéfiniment.
- La probabilitép de succès et la probabilité d'qéchec sont les mêmes pour chaque essai. p+q=1etq=1−p. Par exemple, la probabilité de lancer un trois lorsque vous lancez un dé équitable est de16. Cela est vrai quel que soit le nombre de fois que vous lancez le dé. Supposons que vous souhaitiez connaître la probabilité d'obtenir les trois premiers au cinquième rouleau. Sur les rouleaux 1 à 4, vous n'obtenez pas un visage avec un trois. La probabilité pour chacun des rouleaux est q =56, la probabilité d'une défaillance. La probabilité d'obtenir un trois au cinquième rouleau est(56)(56)(56)(56)(16)=0.0804
- X= le nombre d'essais indépendants jusqu'au premier succès.
Exemple4.3.5
Vous jouez à un jeu de hasard que vous pouvez gagner ou perdre (il n'y a pas d'autres possibilités) jusqu'à ce que vous perdiez. Votre probabilité de perdre est dep=0.57. Quelle est la probabilité qu'il vous faille cinq matchs avant de perdre ? Soit leX nombre de parties que vous jouez jusqu'à ce que vous perdiez (y compris la partie perdante). Alors X prend les valeurs 1, 2, 3,... (pourrait durer indéfiniment). La question de probabilité estP(x=5).
Exercice4.3.5
Vous lancez des fléchettes sur une planche jusqu'à atteindre la zone centrale. Votre probabilité d'atteindre la zone centrale est dep=0.17. Vous voulez déterminer la probabilité qu'il faille huit lancers pour atteindre le centre. Quelles sont les valeurs queX nous inculquent ?
Exemple4.3.6
Une ingénieure de sécurité estime que 35 % de tous les accidents industriels survenus dans son usine sont dus au non-respect des instructions par les employés. Elle décide d'examiner les rapports d'accident (sélectionnés au hasard et remplacés dans la pile après les avoir lus) jusqu'à ce qu'elle en trouve un qui montre un accident causé par le non-respect des instructions par les employés. En moyenne, combien de rapports l'ingénieure de sécurité s'attendrait-elle à examiner jusqu'à ce qu'elle trouve un rapport faisant état d'un accident causé par le non-respect des instructions par un employé ? Quelle est la probabilité que l'ingénieur de sécurité doive examiner au moins trois rapports jusqu'à ce qu'elle trouve un rapport faisant état d'un accident causé par le non-respect des instructions par un employé ?
Soit leX nombre d'accidents que l'ingénieur de sécurité doit examiner jusqu'à ce qu'elle trouve un rapport faisant état d'un accident causé par le non-respect des instructions par un employé. X prend les valeurs 1, 2, 3,... La première question vous demande de trouver la valeur attendue ou la moyenne. La deuxième question vous demande de trouverP(x≥3). (« Au moins » se traduit par un symbole « supérieur ou égal à »).
Exercice4.3.6
Un professeur estime que 15 % des étudiants obtiennent un score inférieur à un C lors de leur examen final. Elle décide de regarder les examens finaux (sélectionnés au hasard et remplacés dans la pile après la lecture) jusqu'à ce qu'elle en trouve un qui indique une note inférieure à C. Nous voulons connaître la probabilité que l'enseignante doive examiner au moins dix examens jusqu'à ce qu'elle en trouve un avec une note inférieure à C. Quelle est la question de probabilité indiqué mathématiquement ?
Exemple4.3.7
Supposons que vous recherchiez un étudiant dans votre université qui habite à moins de huit kilomètres de vous. Vous savez que 55 % des 25 000 étudiants vivent dans un rayon de huit kilomètres de chez vous. Vous contactez des étudiants du collège au hasard jusqu'à ce que l'un d'eux dise qu'ils vivent à moins de huit kilomètres de vous. Quelle est la probabilité que vous ayez besoin de contacter quatre personnes ?
Il s'agit d'un problème géométrique car vous pouvez avoir un certain nombre d'échecs avant d'obtenir le succès que vous souhaitez. De plus, la probabilité de réussite reste à peu près la même chaque fois que vous demandez à un étudiant s'il habite à moins de huit kilomètres de vous. Il n'y a pas de nombre précis d'essais (nombre de fois que vous demandez à un étudiant).
a. Soit leX numéro de ____________ que vous devez demander à ____________ dont l'un répond oui.
- Réponse
-
a. SoitX le nombre d'étudiants que vous devez demander jusqu'à ce que l'un d'eux dise oui.
b. Quelles sont les valeurs queX vous adoptez ?
- Réponse
-
b. 1, 2, 3,..., (nombre total d'élèves)
c. Quels sontp etq ?
- Réponse
-
c.p=0.55;q=0.45
d. La question de probabilité estP (_______).
- Réponse
-
d.P(x=4)
Notation pour la géométrie : G = fonction de distribution de probabilité géométrique
X∼G(p)
Lisez ceci comme «X est une variable aléatoire avec une distribution géométrique ». Le paramètre estp ;p = la probabilité de succès de chaque essai.
Le PDF géométrique nous indique la probabilité que la première occurrence de succès nécessite unx certain nombre d'essais indépendants, chacun ayant une probabilité de succès p. Si la probabilité de succès de chaque essai est p, alors la probabilité que lex e essai (horsx essais) soit le premier succès c'est :
P(X=x)=(1−p)x−1p
pourx=1,2,3,...
La valeur attendue deX, la moyenne de cette distribution, est1/p. Cela nous indique le nombre d'essais auxquels nous devons nous attendre jusqu'à ce que nous obtenions le premier succès, y compris dans le décompte de l'essai qui aboutit à un succès. La forme ci-dessus de la distribution géométrique est utilisée pour modéliser le nombre d'essais jusqu'au premier succès. Le nombre d'essais inclut celui qui est un succès :x = tous les essais, y compris celui qui est un succès. Cela se voit dans la forme de la formule. SiX = nombre d'essais, y compris le succès, alors nous devons multiplier la probabilité d'échec par le nombre d'échecs, c'est-à-direX−1.(1−p)
En revanche, la forme suivante de la distribution géométrique est utilisée pour modéliser le nombre de défaillances jusqu'au premier succès :
P(X=x)=(1−p)xp
pourx=0,1,2,3,...
Dans ce cas, l'essai réussi n'est pas compté comme un essai dans la formule :x = nombre d'échecs. La valeur attendue, moyenne, de cette distribution estμ=(1−p)p. Cela nous indique à combien d'échecs il faut s'attendre avant de réussir. Dans les deux cas, la séquence de probabilités est une séquence géométrique.
Exemple4.3.8
Supposons que la probabilité d'un composant informatique défectueux est de 0,02. Les composants sont sélectionnés de manière aléatoire. Déterminez la probabilité que le premier défaut soit causé par le septième composant testé. Combien de composants comptez-vous tester jusqu'à ce que l'un d'eux soit jugé défectueux ?
SoitX le nombre de composants informatiques testés jusqu'à ce que le premier défaut soit détecté.
X prend les valeurs1,2,3,... oùp=0.02.X∼G(0.02)
TrouveP(x=7). Réponse :P(x=7)=(1−0.02)7−1×0.02=0.0177.
La probabilité que le septième composant soit le premier défaut est de 0,0177.
Le graphique deX∼G(0.02) est le suivant :
L'yaxe -contient la probabilité dex, oùX = le nombre de composants informatiques testés. Remarquez que les probabilités diminuent d'un incrément commun. Cet incrément est le même rapport entre chaque nombre et est appelé progression géométrique, d'où le nom de cette fonction de densité de probabilité.
Le nombre de composants que vous vous attendez à tester jusqu'à ce que vous trouviez le premier composant défectueux est la moyenneμ=50.
La formule pour la moyenne de la variable aléatoire définie comme le nombre d'échecs jusqu'au premier succès estμ=1p=10.02=50
Voir Exemple4.3.9 pour un exemple où la variable aléatoire géométrique est définie comme le nombre d'essais jusqu'au premier succès. La valeur attendue de cette formule pour la géométrie sera différente de cette version de la distribution.
La formule de la variance estσ2=(1p)(1p−1)=(10.02)(10.02−1)=2,450
L'écart type estσ=√(1p)(1p−1)=√(10.02)(10.02−1)=49.5
Le risque à vie de développer un cancer du pancréas est d'environ un sur 78 (1,28 %). Soit X le nombre de personnes à qui vous posez la question avant que l'une d'elles ne dise qu'elle est atteinte d'un cancer du pancréas. Dans ce cas, la variable aléatoire X inclut uniquement le nombre d'essais qui se sont soldés par des échecs et ne compte pas l'essai qui a permis de trouver une personne atteinte de la maladie. La formule appropriée pour cette variable aléatoire est la deuxième présentée ci-dessus. Alors X est une variable aléatoire discrète avec une distribution géométrique : X ~ G(178) ou X ~ G (0,0128).
- Quelle est la probabilité que vous interrogiez 9 personnes avant que l'une d'elles dise qu'elle est atteinte d'un cancer du pancréas ? C'est demander : quelle est la probabilité que vous interrogiez 9 personnes sans succès et que la dixième personne soit un succès ?
- Quelle est la probabilité que vous deviez poser la question à 20 personnes ?
- Détermine la (i) moyenne et (ii) l'écart type de X.
- Réponse
-
un.P(x=9)=(1−0.0128)9⋅0.0128=0.0114
b.P(x=20)=(1−0.0128)19⋅0.0128=0.01
- Moyenne =μ=(1−p)p=(1−0.0128)0.0128=77.12
- Écart type =σ=√1−pp2=√1−0.01280.01282≈77.62
Exercice4.3.9
Le taux d'alphabétisation d'un pays mesure la proportion de personnes âgées de 15 ans et plus qui savent lire et écrire. Le taux d'alphabétisation des femmes dans les Colonies unies pour l'indépendance est de 12 %. Soit leX nombre de femmes que vous demandez jusqu'à ce que l'une d'elles dise qu'elle est alphabétisée.
- Quelle est la distribution de probabilité deX ?
- Quelle est la probabilité que vous interrogiez cinq femmes avant que l'une d'elles dise qu'elle est alphabétisée ?
- Quelle est la probabilité que vous deviez demander à dix femmes ?
Exemple4.3.10
Un joueur de baseball a une moyenne au bâton de 0,320. C'est la probabilité générale qu'il soit touché à chaque fois qu'il est à la batte.
Quelle est la probabilité qu'il obtienne son premier coup lors du troisième passage à la batte ?
- Réponse
-
P(x=3)=(1−0.32)3−1×.32=0.1480
Dans ce cas, la séquence est échec, échec, succès.
De combien de déplacements à la batte pensez-vous que le frappeur aura besoin avant de toucher un coup ?
- Réponse
-
μ=1p=10.320=3.125≈3
Il s'agit simplement de la valeur attendue des réussites et donc de la moyenne de distribution.
Exemple4.3.11
Il y a 80 % de chances qu'un chien dalmate ait 13 points noirs. Vous allez à une exposition canine et comptez les places des Dalmatiens. Quelle est la probabilité que vous examiniez les taches sur 3 chiens avant d'en trouver un qui présente 13 points noirs ?
- Réponse
-
P(x=3)=(1−0.80)3×0.80=0.0064
Notes
1 « Prévalence du VIH, totale (% de la population âgée de 15 à 49 ans) », Banque mondiale, 2013. Disponible en ligne à l'adresse http://data.worldbank.org/indicator/...last&sort=desc (consulté le 15 mai 2013).