Skip to main content
Global

8.3 : Intervalle de confiance pour une proportion de population

  • Page ID
    191371
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Au cours d'une année électorale, des articles de journaux indiquent les intervalles de confiance en termes de proportions ou de pourcentages. Par exemple, un sondage auprès d'un candidat en particulier qui se présente à la présidence peut montrer que le candidat obtient 40 % des voix avec une marge de trois points de pourcentage (si l'échantillon est suffisamment large). Souvent, les sondages électoraux sont calculés avec un niveau de confiance de 95 %, de sorte que les sondeurs seraient sûrs à 95 % que la proportion réelle d'électeurs favorables au candidat se situerait entre 0,37 et 0,43.

    Les investisseurs boursiers s'intéressent à la proportion réelle d'actions qui augmentent et diminuent chaque semaine. Les entreprises qui vendent des ordinateurs personnels s'intéressent à la proportion de ménages américains qui possèdent des ordinateurs personnels. Les intervalles de confiance peuvent être calculés pour la proportion réelle de stocks qui augmentent ou diminuent chaque semaine et pour la proportion réelle de ménages aux États-Unis qui possèdent des ordinateurs personnels.

    La procédure permettant de déterminer l'intervalle de confiance pour une proportion de population est similaire à celle utilisée pour la moyenne de la population, mais les formules sont légèrement différentes, bien que conceptuellement identiques. Bien que les formules soient différentes, elles sont basées sur les mêmes bases mathématiques que nous ont données le théorème de la limite centrale. C'est pourquoi nous utiliserons le même format de base utilisant les trois mêmes informations : la valeur d'échantillon du paramètre en question, l'écart type de la distribution d'échantillonnage pertinente et le nombre d'écarts types dont nous avons besoin pour avoir la confiance que nous souhaitons dans notre estimation.

    Comment savez-vous que vous faites face à un problème de proportion ? Tout d'abord, la distribution sous-jacente possède une variable aléatoire binaire et est donc une distribution binomiale. (Il n'est pas fait mention d'une moyenne ou d'une moyenne.) S'il s'\(X\)agit d'une variable aléatoire binomiale, alors\(X \sim B(n, p)\)\(n\) sont le nombre d'essais et\(p\) la probabilité de succès. Pour former une proportion d'échantillon\(X\), prenez la variable aléatoire correspondant au nombre de réussites et divisez-la par\(n\) le nombre d'essais (ou la taille de l'échantillon). La variable aléatoire\(P^{\prime}\) (lire « P prime ») est la proportion de l'échantillon,

    \[P^{\prime}=\frac{X}{n} \nonumber\]

    (Parfois, la variable aléatoire est désignée\(\hat{P}\) par « P hat ».)

    • \(P^{\prime}\)= la proportion estimée de réussites ou la proportion de succès de l'échantillon (\(P^{\prime}\)est une estimation\(p\) ponctuelle de la proportion réelle de la population, et donc\(q\) de la probabilité d'échec dans un essai donné.)
    • \(x\)= le nombre de succès dans l'échantillon
    • \(n\)= la taille de l'échantillon

    La formule de l'intervalle de confiance pour une proportion de population suit le même format que celle utilisée pour une estimation de la moyenne de la population. En se souvenant de la distribution d'échantillonnage pour la proportion indiquée au chapitre 7, l'écart type s'est révélé être le suivant :

    \[\sigma_{\mathrm{p}^{\prime}}=\sqrt{\frac{p(1-p)}{n}}\nonumber\]

    L'intervalle de confiance pour une proportion de population devient donc :

    \[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

    \(Z_{\left(\frac{a}{2}\right)}\)est défini en fonction du degré de confiance souhaité et\(\sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\) représente l'écart type de la distribution d'échantillonnage.

    Les proportions de l'échantillon\(\bf{p^{\prime}}\) et\(\bf{q^{\prime}}\) sont des estimations des proportions de population inconnues\(\bf{p}\) et\(\bf{q}\). Les proportions estimées\(p^{\prime}\) et\(q^{\prime}\) sont utilisées parce que\(p\) et ne\(q\) sont pas connues.

    Rappelez-vous qu'à mesure que l'on\(p\) s'éloigne de 0,5, la distribution binomiale devient moins symétrique. Comme nous estimons le binôme avec la distribution normale symétrique, plus le binôme s'éloigne de la symétrie, moins nous avons confiance en l'estimation.

    Cette conclusion peut être démontrée par l'analyse suivante. Les proportions sont basées sur la distribution de probabilité binomiale. Les résultats possibles sont binaires, qu'il s'agisse d'un « succès » ou d'un « échec ». Cela donne lieu à une proportion, c'est-à-dire le pourcentage des résultats qui sont des « réussites ». Il a été démontré que la distribution binomiale pouvait être parfaitement comprise si nous ne connaissions que la probabilité de succès d'un essai, appelé\(p\). La moyenne et l'écart type du binôme se sont révélés être les suivants :

    \[\mu=\mathrm{np}\nonumber\]

    \[\sigma=\sqrt{npq}\nonumber\]

    Il a également été démontré que le binôme pouvait être estimé par la distribution normale si LES DEUX\(np\) ET\(nq\) étaient supérieurs à 5. À partir de la discussion ci-dessus, il a été constaté que la formule de normalisation pour la distribution binomiale est la suivante :

    \[Z=\frac{\mathrm{p}^{\prime}-p}{\sqrt{\left(\frac{p q}{n}\right)}}\nonumber\]

    qui n'est rien de plus qu'une reformulation de la formule générale de normalisation avec des substitutions appropriées pour\(\mu\) et\(\sigma\) depuis le binôme. Nous pouvons utiliser la distribution normale standard, la raison\(Z\) se trouve dans l'équation, car la distribution normale est la distribution limite du binôme. Il s'agit d'un autre exemple du théorème de la limite centrale. Nous avons déjà vu que la distribution des moyennes par échantillonnage est normalement distribuée. Rappelons la discussion approfondie du chapitre 7 concernant la distribution des proportions par échantillonnage et les conclusions du théorème de la limite centrale.

    Nous pouvons maintenant manipuler cette formule de la même manière que nous l'avons fait pour déterminer les intervalles de confiance pour une moyenne, mais pour trouver l'intervalle de confiance pour le paramètre de population binomiale,\(p\).

    \[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

    \(p^{\prime} = x/n\), estimation ponctuelle de\(p\) prélevée sur l'échantillon. Notez que cela\(p^{\prime}\) a été remplacé\(p\) dans la formule. C'est parce que nous ne savons pas\(p\), en fait, que c'est exactement ce que nous essayons d'estimer.

    Malheureusement, il n'existe pas de facteur de correction pour les cas où la taille de l'échantillon est petite\(np^{\prime}\) et\(nq^{\prime}\) doit toujours être supérieure à 5 pour établir une estimation de l'intervalle\(p\).

    Exemple\(\PageIndex{1}\)

    Supposons qu'une société d'études de marché soit engagée pour estimer le pourcentage d'adultes vivant dans une grande ville qui possèdent un téléphone portable. Cinq cents résidents adultes sélectionnés au hasard dans cette ville sont interrogés pour déterminer s'ils possèdent un téléphone portable. Sur les 500 personnes interrogées, 421 ont répondu oui, car elles possèdent un téléphone portable. À l'aide d'un niveau de confiance de 95 %, calculez une estimation de l'intervalle de confiance pour la proportion réelle de résidents adultes de cette ville qui possèdent un téléphone portable.

    Réponse
    La solution étape par étape.

    Soit\(X\) le nombre de personnes de l'échantillon qui possèdent un téléphone portable. \(X\)est binomiale : la variable aléatoire est binaire, les gens ont un téléphone portable ou non.

    Pour calculer l'intervalle de confiance, nous devons trouver\(p^{\prime}, q^{\prime}\).

    \(n = 500\)

    \(x=\text { the number of successes in the sample }=421\)

    \(p^{\prime}=\frac{x}{n}=\frac{421}{500}=0.842\)

    \(p^{\prime}=0.842\)est la proportion de l'échantillon ; il s'agit de l'estimation ponctuelle de la proportion de la population.

    \(q^{\prime}=1-p^{\prime}=1-0.842=0.158\)

    Puisque le niveau de confiance demandé est\(CL = 0.95\), alors\(\alpha=1-C L=1-0.95=0.05\left(\frac{\alpha}{2}\right)=0.025\).

    Alors\(z_{\frac{\alpha}{2}}=z_{0.025}=1.96\)

    Cela peut être trouvé à l'aide de la table de probabilité normale standard dans le tableau\(\PageIndex{6}\). Cela se trouve également dans le tableau t des étudiants dans la colonne de 0,025 et dans les degrés de liberté infinis, car à des degrés de liberté infinis, la distribution t des étudiants devient la distribution normale standard,\(Z\).

    L'intervalle de confiance pour la véritable proportion binomiale de la population est

    \[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

    \(\text{Substituting in the values from above we find the confidence interval is : } 0.810 \leq p \leq 0.874\)

    L'interprétation

    Nous estimons avec 95 % de confiance qu'entre 81 % et 87,4 % de tous les résidents adultes de cette ville possèdent un téléphone portable.

    Explication du niveau de confiance à 95

    Quatre-vingt-quinze pour cent des intervalles de confiance ainsi construits contiendraient la valeur réelle de la proportion de tous les résidents adultes de cette ville qui possèdent un téléphone portable.

    Exercice\(\PageIndex{1}\)

    Supposons que 250 personnes sélectionnées au hasard soient interrogées pour déterminer si elles possèdent une tablette. Sur les 250 personnes interrogées, 98 ont déclaré posséder une tablette. À l'aide d'un niveau de confiance de 95 %, calculez une estimation de l'intervalle de confiance pour la proportion réelle de personnes possédant des tablettes.

    Exemple\(\PageIndex{2}\)

    L'école de dressage canin de Dundee compte une proportion plus importante que la moyenne de clients qui participent à des événements professionnels compétitifs. Un intervalle de confiance pour la proportion de la population de chiens participant à des épreuves professionnelles dans 150 écoles de formation différentes est construit. La limite inférieure est fixée à 0,08 et la limite supérieure à 0,16. Déterminez le niveau de confiance utilisé pour construire l'intervalle entre la proportion de la population de chiens participant à des compétitions professionnelles.

    Réponse

    Nous commençons par la formule d'un intervalle de confiance pour une proportion, car la variable aléatoire est binaire ; soit le client participe à des compétitions canines professionnelles, soit il ne le fait pas.

    \[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

    Ensuite, nous trouvons la proportion de l'échantillon :

    \[p^{\prime}=\frac{0.08+0.16}{2}=0.12\nonumber\]

    \(\pm\)Ce qui constitue l'intervalle de confiance est donc\(0.04; 0.12 + 0.04 = 0.16\) et\(0.12 − 0.04 = 0.08\), les limites de l'intervalle de confiance. Enfin, nous résolvons\(Z\).

    \(\left[Z \cdot \sqrt{\frac{0.12(1-0.12)}{150}}\right]=0.04, \textbf { therefore } \bf{z=1.51}\)

    Ensuite, recherchez la probabilité de 1,51 écart-type sur le tableau des normales standard.

    \(p(Z=1.51)=0.4345, p(Z) \cdot 2=0.8690 \textbf { or } 86.90 \%\).

    Exemple\(\PageIndex{3}\)

    Le responsable financier d'une entreprise souhaite estimer le pourcentage de comptes clients en retard de plus de 30 jours. Il examine 500 comptes et constate que 300 sont en retard de plus de 30 jours. Calculez un intervalle de confiance de 90 % pour le pourcentage réel de comptes clients en retard de plus de 30 jours et interprétez l'intervalle de confiance.

    Réponse
    La solution est étape par étape :

    Quatre-vingt-dix pour cent de tous les intervalles de confiance construits de cette manière contiennent la valeur réelle pour le pourcentage de la population de comptes à recevoir qui sont en retard de 30 jours.

    Explication du niveau de confiance de 90

    \(x = 300\)et\(n = 500\)

    \(p^{\prime}=\frac{x}{n}=\frac{300}{500}=0.600\)

    \(q^{\prime}=1-p^{\prime}=1-0.600=0.400\)

    Puisque le niveau de confiance =\(0.90\), alors\(a=1-\text { confidence level }=(1-0.90)=0.10\left(\frac{\alpha}{2}\right)=0.05\)

    \(Z_{\frac{\alpha}{2}}=Z_{0.05}=1.645\)

    Cette valeur Z peut être trouvée à l'aide d'une table de probabilité normale standard. La table en T de l'étudiant peut également être utilisée en saisissant le tableau dans la colonne 0,05 et en le lisant sur la ligne pour obtenir des degrés de liberté infinis. La distribution t est la distribution normale à des degrés de liberté infinis. Il s'agit d'une astuce pratique à retenir pour trouver des valeurs Z correspondant aux niveaux de confiance couramment utilisés. Nous utilisons cette formule pour établir un intervalle de confiance pour une proportion :

    \[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

    En substituant les valeurs ci-dessus, nous trouvons que l'intervalle de confiance pour la véritable proportion binomiale de la population est\(0.564 \leq p \leq 0.636\)

    L'interprétation

    Nous estimons avec 90 % de certitude que le pourcentage réel de tous les comptes à recevoir en retard de 30 jours se situe entre 56,4 % et 63,6 %. Autre formulation : Nous estimons avec 90 % de certitude qu'entre 56,4 % et 63,6 % de TOUS les comptes sont en retard de 30 jours.

    Exercice\(\PageIndex{2}\)

    Un élève interroge son école pour savoir si les élèves du district scolaire sont pour ou contre la nouvelle législation concernant les uniformes scolaires. Elle enquête auprès de 600 étudiants et constate que 480 sont contre la nouvelle législation.

    1. Calculez un intervalle de confiance de 90 % pour le pourcentage réel d'étudiants qui s'opposent à la nouvelle législation et interprétez l'intervalle de confiance.
    2. Sur un échantillon de 300 élèves, 68 % ont déclaré posséder un iPod et un téléphone intelligent. Calculez un intervalle de confiance de 97 % pour le pourcentage réel d'élèves qui possèdent un iPod et un smartphone.