Skip to main content
Global

7.2 : Utilisation du théorème de la limite centrale

  • Page ID
    191713
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Exemples du théorème de la limite centrale

    Loi des grands nombres

    La loi des grands nombres dit que si vous prélevez des échantillons de plus en plus importants dans n'importe quelle population, alors la moyenne de la distribution d'échantillonnage\(\mu_{\overline x}\) tend à se rapprocher de plus en plus de la moyenne réelle de la population\(\mu\). À partir du théorème de la limite centrale, nous savons qu'à mesure que les moyennes de l'échantillon\(n\) s'agrandissent, suivent une distribution normale. Plus n est grand, plus l'écart type de la distribution d'échantillonnage diminue. (N'oubliez pas que l'écart type pour la distribution d'échantillonnage de\(\overline X\) est\(\frac{\sigma}{\sqrt{n}}\).) Cela signifie que la moyenne de l'échantillon\(\overline x\) doit être plus proche de la moyenne de la population à\(\mu\) mesure qu'elle\(n\) augmente. Nous pouvons dire que\(\mu\) c'est la valeur que signifie l'approche de l'échantillon lorsque n augmente. Le théorème de la limite centrale illustre la loi des grands nombres.

    Ce concept est tellement important et joue un rôle tellement critique dans ce qui suit qu'il mérite d'être développé davantage. En effet, deux problèmes critiques découlent du théorème de la limite centrale et de l'application de la loi des grands nombres à ce théorème. Ce sont

    1. La fonction de densité de probabilité de la distribution des moyennes d'échantillonnage est normalement distribuée indépendamment de la distribution sous-jacente des observations de population et
    2. l'écart type de la distribution d'échantillonnage diminue à mesure que la taille des échantillons utilisés pour calculer les moyennes de la distribution d'échantillonnage augmente.

    Je les prends dans l'ordre. Il semblerait contre-intuitif que la population puisse avoir une distribution quelconque et que la distribution des moyens provenant de cette population soit normalement distribuée. À l'aide d'ordinateurs, il est possible de simuler des expériences qui montrent le processus par lequel la distribution de l'échantillon change à mesure que la taille de l'échantillon augmente. Ces simulations montrent visuellement les résultats de la preuve mathématique du théorème de la limite centrale.

    Voici trois exemples de distributions de population très différentes et de l'évolution de la distribution d'échantillonnage vers une distribution normale à mesure que la taille de l'échantillon augmente. Dans ces cas, le panneau supérieur représente l'histogramme des données d'origine. Les trois panneaux présentent les histogrammes de 1 000 échantillons tirés au hasard pour différentes tailles d'échantillons :\(n=10\),\(n= 25\) et\(n=50\). À mesure que la taille de l'échantillon augmente et que le nombre d'échantillons prélevés reste constant, la distribution de la moyenne de 1 000 échantillons se rapproche de la ligne lisse qui représente la distribution normale.

    La figure\(\PageIndex{3}\) représente une distribution normale des observations individuelles et nous pouvons nous attendre à ce que la distribution d'échantillonnage converge rapidement vers la normale. Les résultats le montrent et montrent que même pour un échantillon de très petite taille, la distribution est proche de la distribution normale.

    Figurine\(\PageIndex{3}\)

    La figure\(\PageIndex{4}\) est une distribution uniforme qui, étonnamment, s'est rapidement rapprochée de la distribution normale, même avec un échantillon de 10 personnes seulement.

    Figurine\(\PageIndex{4}\)

    La figure\(\PageIndex{5}\) est une distribution asymétrique. Cette dernière peut être exponentielle, géométrique ou binomiale avec une faible probabilité de succès créant l'asymétrie de la distribution. Pour les distributions asymétriques, notre intuition voudrait qu'il faille des échantillons de plus grande taille pour passer à une distribution normale et c'est d'ailleurs ce que nous observons à partir de la simulation. Néanmoins, pour un échantillon de 50 personnes, ce qui n'est pas considéré comme un très grand échantillon, la distribution des moyennes d'échantillons a très nettement pris la forme de la distribution normale.

    Figurine\(\PageIndex{5}\)

    Le théorème de la limite centrale fournit plus que la preuve que la distribution d'échantillonnage des moyennes est normalement distribuée. Il nous fournit également la moyenne et l'écart type de cette distribution. En outre, comme indiqué ci-dessus, la valeur attendue de la moyenne est égale à la moyenne de la population des données originales\(\mu_{\overline{x}}\), ce que nous souhaitons estimer à partir de l'échantillon que nous avons prélevé. Nous avons déjà inséré cette conclusion du théorème de la limite centrale dans la formule que nous utilisons pour normaliser la distribution d'échantillonnage à la distribution normale standard. Enfin, le théorème de la limite centrale a également fourni l'écart type de la distribution d'échantillonnage\(\sigma_{\overline{x}}=\frac{\sigma}{\sqrt{n}}\), ce qui est essentiel pour calculer les probabilités des valeurs de la nouvelle variable aléatoire\(\overline x\).

    La figure\(\PageIndex{6}\) montre une distribution d'échantillonnage. La moyenne a été marquée sur l'axe horizontal des et\(\overline X\) l'écart type a été écrit à droite au-dessus de la distribution. Notez que l'écart type de la distribution d'échantillonnage est l'écart type initial de la population, divisé par la taille de l'échantillon. Nous avons déjà vu qu'à mesure que la taille de l'échantillon augmente, la distribution de l'échantillon se rapproche de plus en plus de la distribution normale. Lorsque cela se produit, l'écart type de la distribution d'échantillonnage change d'une autre manière ; l'écart type diminue à mesure qu'il\(n\) augmente. À très très grande échelle\(n\), l'écart type de la distribution d'échantillonnage devient très faible et, à l'infini, il s'effondre au-dessus de la moyenne de la population. C'est ce que cela signifie que la valeur attendue de\(\mu_{\overline{x}}\) est la moyenne de la population,\(\mu\).

    ..

    Figurine\(\PageIndex{6}\)

    À des valeurs non extrêmes de\(n\), cette relation entre l'écart type de la distribution d'échantillonnage et la taille de l'échantillon joue un rôle très important dans notre capacité à estimer les paramètres qui nous intéressent.

    La figure\(\PageIndex{7}\) montre trois distributions d'échantillonnage. La seule modification apportée concerne la taille de l'échantillon qui a été utilisée pour obtenir les moyennes d'échantillon pour chaque distribution. À mesure que la taille de l'échantillon\(n\) augmente, passant de 10 à 30 à 50, les écarts types des distributions d'échantillonnage respectives diminuent car la taille de l'échantillon se situe dans le dénominateur des écarts types des distributions d'échantillonnage.

    ..

    Figurine\(\PageIndex{7}\)

    Les implications à cet égard sont très importantes. La figure\(\PageIndex{8}\) montre l'effet de la taille de l'échantillon sur la confiance que nous aurons dans nos estimations. Il s'agit de deux distributions d'échantillonnage provenant de la même population. Une distribution d'échantillonnage a été créée avec des échantillons de taille 10 et l'autre avec des échantillons de taille 50. Toutes choses étant constantes par ailleurs, la distribution d'échantillonnage avec une taille d'échantillon de 50 présente un écart type plus faible, ce qui fait que le graphique est plus haut et plus étroit. Cela a pour effet important que, pour une même probabilité d'un écart type par rapport à la moyenne, cette distribution couvre beaucoup moins de valeurs possibles que l'autre distribution. Un écart type est marqué sur l'\(\overline X\)axe pour chaque distribution. Cela est illustré par les deux flèches qui indiquent plus ou moins un écart type pour chaque distribution. Si la probabilité que la moyenne réelle soit éloignée d'un écart type par rapport à la moyenne, alors pour la distribution d'échantillonnage avec la plus petite taille d'échantillon, la plage de valeurs possible est beaucoup plus grande. Une question simple est la suivante : préférez-vous une moyenne d'échantillon issue de la distribution étroite et étroite ou une distribution plate et large comme estimation de la moyenne de la population ? Votre réponse nous explique pourquoi les utilisateurs choisissent toujours de manière intuitive des données provenant d'un grand échantillon plutôt que d'un petit échantillon. L'échantillon qu'ils obtiennent provient d'une distribution plus compacte. Ce concept sera à la base de ce que l'on appellera le niveau de confiance dans la prochaine unité.

    ..

    Figurine\(\PageIndex{8}\)