Skip to main content
Global

7.3 : Le théorème de la limite centrale pour les proportions

  • Page ID
    191714
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Le théorème de la limite centrale nous indique que l'estimation ponctuelle de la moyenne de l'échantillon provient d'une distribution normale de\(\overline x\)'s. Cette distribution théorique est appelée distribution d'échantillonnage de\(\overline x\)'s. Nous étudions maintenant la distribution d'échantillonnage pour un autre paramètre important que nous souhaitons\(\overline x\) pour estimer ; à\(p\) partir de la fonction de densité de probabilité binomiale.

    Si la variable aléatoire est discrète, par exemple pour les données catégorielles, le paramètre que nous souhaitons estimer est la proportion de la population. Il s'agit, bien entendu, de la probabilité de réussir lors d'un tirage au sort. Contrairement au cas qui vient d'être discuté pour une variable aléatoire continue où nous ne connaissions pas la distribution\(X\) de la population de s, nous connaissons ici la fonction de densité de probabilité sous-jacente pour ces données ; il s'agit du binôme. La variable aléatoire est\(X =\) le nombre de succès et le paramètre que nous souhaitons connaître est\(p\) la probabilité d'obtenir un succès qui est bien entendu la proportion de succès dans la population. La question qui se pose est la suivante : de quelle distribution a été\(p^{\prime}=\frac{x}{n}\) tirée la proportion de l'échantillon ? La taille de l'échantillon\(X\) est\(n\) et est le nombre de succès trouvés dans cet échantillon. Il s'agit d'une question parallèle à laquelle vient de répondre le théorème de la limite centrale : à partir de quelle distribution a été tirée la moyenne de l'échantillon ?\(\overline x\) Nous avons constaté qu'une fois que nous savions que la distribution était la distribution normale, nous pouvions créer des intervalles de confiance pour le paramètre de population\(\mu\). Nous utiliserons également ces mêmes informations pour tester des hypothèses concernant la moyenne de la population ultérieurement. Nous souhaitons maintenant être en mesure de développer des intervalles de confiance pour le paramètre de population «\(p\) » à partir de la fonction de densité de probabilité binomiale.

    Afin de déterminer la distribution d'où proviennent les proportions d'échantillons, nous devons développer la distribution d'échantillonnage des proportions d'échantillons comme nous l'avons fait pour les moyennes d'échantillons. Imaginez à nouveau que nous échantillonnions au hasard, disons 50 personnes, et que nous leur demandions si elles soutiennent la nouvelle émission d'obligations scolaires. À partir de là, nous trouvons une proportion d'échantillon\(p^{\prime}\), et nous la\(p\) graphions sur l'axe des. Nous le faisons encore et encore, etc., jusqu'à obtenir la distribution théorique des\(p\). Certaines proportions d'échantillon montreront une forte faveur à l'égard de l'émission obligataire et d'autres une faible favorabilité parce que l'échantillonnage aléatoire reflétera la variation des points de vue au sein de la population. Ce que nous avons fait peut être vu sur la figure\(\PageIndex{9}\). Le panneau supérieur présente les distributions de probabilités de la population pour chaque valeur possible de la variable aléatoire\(X\). Bien que nous ne sachions pas à quoi ressemble la distribution spécifique parce que nous ne connaissons\(p\) pas le paramètre de population, nous savons qu'il doit ressembler à ceci. En réalité, nous ne connaissons ni la moyenne ni l'écart-type de cette distribution de population, la même difficulté que celle que nous avons rencontrée lors\(X\) de l'analyse des données précédentes.

    Figurine\(\PageIndex{9}\)

    La figure\(\PageIndex{9}\) place la moyenne sur la distribution des probabilités de population,\(\mu=np\) mais bien sûr, nous ne connaissons pas réellement la moyenne de la population parce que nous ne connaissons pas la probabilité de succès de la population,\(p\). Sous la distribution des valeurs de population se trouve la distribution d'échantillonnage\(p\) de. Encore une fois, le théorème de la limite centrale nous indique que cette distribution est normalement distribuée, tout comme dans le cas de la distribution d'échantillonnage pour\(\overline x\). Cette distribution d'échantillonnage possède également une moyenne, la moyenne des \(p\), et un écart type,\(\sigma_{p^{\prime}}\).

    Il est important de noter que dans le cas de l'analyse de la distribution des moyennes des échantillons, le théorème de la limite centrale nous a indiqué la valeur attendue de la moyenne des moyennes des échantillons dans la distribution d'échantillonnage et l'écart type de la distribution d'échantillonnage. Encore une fois, le théorème de la limite centrale fournit ces informations pour la distribution d'échantillonnage pour les proportions. Les réponses sont les suivantes :

    1. La valeur attendue de la moyenne de la distribution d'échantillonnage des proportions d'échantillons\(\mu_{p^{\prime}}\), est la proportion de la population,\(p\).
    2. L'écart type de la distribution d'échantillonnage des proportions d'échantillon\(\sigma_{p^{\prime}}\), est l'écart type de la population divisé par la racine carrée de la taille de l'échantillon,\(n\).

    Ces deux conclusions sont les mêmes que celles que nous avons trouvées pour la distribution d'échantillonnage pour les moyennes d'échantillons. Toutefois, dans ce cas, étant donné que la moyenne et l'écart type de la distribution binomiale reposent tous deux sur pp, la formule de l'écart type de la distribution d'échantillonnage nécessite une manipulation algébrique pour être utile. Nous aborderons cette question dans le prochain chapitre. La preuve de ces importantes conclusions du théorème de la limite centrale est fournie ci-dessous.

    \[E\left(p^{\prime}\right)=E\left(\frac{x}{n}\right)=\left(\frac{1}{n}\right) E(x)=\left(\frac{1}{n}\right) n p=p\nonumber\]

    (La valeur attendue de\(X\)\(E(x)\), est simplement la moyenne de la distribution binomiale dont nous savons qu'elle est np.)

    \[\sigma_{\mathrm{p}}^{2}=\operatorname{Var}\left(p^{\prime}\right)=\operatorname{Var}\left(\frac{x}{n}\right)=\frac{1}{n^{2}}(\operatorname{Var}(x))=\frac{1}{n^{2}}(n p(1-p))=\frac{p(1-p)}{n}\nonumber\]

    L'écart type de la distribution d'échantillonnage pour les proportions est donc de :

    \[\sigma_{\mathrm{p}},=\sqrt{\frac{p(1-P)}{n}}\nonumber\]

    \ (\ PageIndex {2} \) « >
    Paramètre Répartition de la population échantillon Distribution d'échantillonnage\(p\) de
    Moyen \(\mu = np\) \(p^{\prime}=\frac{x}{n}\)\) \ (p \)'s » class="lt-stats-4585">\(p^{\prime} \text { and } E(p^{\prime})=p\)
    Écart type \(\sigma=\sqrt{n p q}\) \ (p \)'s » class="lt-stats-4585">\(\sigma_{p^{\prime}}=\sqrt{\frac{p(1-p)}{n}}\)
    Tableau\(\PageIndex{2}\)

    \(\PageIndex{2}\)Le tableau résume ces résultats et montre la relation entre la population, l'échantillon et la distribution de l'échantillon. Remarquez le parallèle entre ce tableau et ce tableau\(\PageIndex{1}\) dans le cas où la variable aléatoire est continue et où nous développions la distribution d'échantillonnage pour les moyennes.

    En examinant la formule de l'écart type de la distribution d'échantillonnage pour les proportions, nous constatons que l'écart type diminue à mesure qu'il\(n\) augmente. Il s'agit de la même observation que celle que nous avons faite pour l'écart type de la distribution d'échantillonnage pour les moyennes. Encore une fois, à mesure que la taille de l'échantillon augmente, l'estimation ponctuelle pour l'un\(\mu\) ou\(p\) l'autre provient d'une distribution de plus en plus étroite. Nous avons conclu qu'avec un niveau de probabilité donné, la plage d'où provient l'estimation ponctuelle diminue à mesure que la taille de l'échantillon augmente.\(n\) La figure\(\PageIndex{8}\) montre ce résultat pour le cas des moyennes d'échantillon. Il suffit\(p^{\prime}\) de le remplacer\(\overline x\) et nous pouvons voir l'impact de la taille de l'échantillon sur l'estimation de la proportion de l'échantillon.