Skip to main content
Global

8.0 : Introduction aux intervalles de confiance

  • Page ID
    191359
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Supposons que vous essayiez de déterminer le loyer moyen d'un appartement de deux chambres dans votre ville. Vous pouvez consulter la section des petites annonces du journal, noter plusieurs loyers répertoriés et en faire la moyenne. Vous auriez obtenu une estimation ponctuelle de la moyenne réelle. Si vous essayez de déterminer le pourcentage de fois que vous faites un panier lorsque vous tirez un ballon de basket, vous pouvez compter le nombre de tirs que vous faites et le diviser par le nombre de tirs que vous avez tentés. Dans ce cas, vous auriez obtenu une estimation ponctuelle de la proportion réelle du paramètre\(p\) dans la fonction de densité de probabilité binomiale.

    Voici une photo de M&Ms empilés. Les M&Ms sont rouges, bleus, verts, jaunes, oranges et bruns.
    Figure Vous\(\PageIndex{1}\) êtes-vous déjà demandé quel est le nombre moyen de M&M dans un sac à l'épicerie ? Vous pouvez utiliser des intervalles de confiance pour répondre à cette question. (crédit : comedy_nose/flickr)

    Nous utilisons des échantillons de données pour faire des généralisations sur une population inconnue. Cette partie des statistiques est appelée statistique inférentielle. Les données de l'échantillon nous aident à estimer un paramètre de population. Nous sommes conscients que l'estimation ponctuelle n'est probablement pas la valeur exacte du paramètre de population, mais qu'elle s'en rapproche. Après avoir calculé des estimations ponctuelles, nous construisons des estimations par intervalles, appelées intervalles de confiance. Au-delà d'une simple moyenne, ou estimation ponctuelle, les statistiques nous fournissent une estimation à laquelle nous pouvons associer une probabilité de précision, ce que nous appellerons un niveau de confiance. Nous faisons des inférences avec un niveau de probabilité connu.

    Dans ce chapitre, vous allez apprendre à construire et à interpréter des intervalles de confiance. Vous découvrirez également une nouvelle distribution, le Student's-T, et comment elle est utilisée avec ces intervalles. Tout au long du chapitre, il est important de garder à l'esprit que l'intervalle de confiance est une variable aléatoire. C'est le paramètre de population qui est fixe.

    Si vous avez travaillé dans le service marketing d'une entreprise de divertissement, vous pourriez être intéressé par le nombre moyen de chansons qu'un consommateur télécharge par mois sur iTunes. Si tel est le cas, vous pouvez mener une enquête et calculer la moyenne de l'échantillon\(\overline x\), et l'écart type de l'échantillon\(s\). Vous utiliseriez\(\overline x\) pour estimer la moyenne de la population et\(s\) pour estimer l'écart type de la population. La moyenne de l'échantillon\(\overline x\), est l'estimation ponctuelle de la moyenne de la population,\(\mu\). L'écart type de l'échantillon,\(s\), est l'estimation ponctuelle de l'écart type de la population,\(\sigma\).

    \(\overline x\)et\(s\) sont toutes appelées statistiques.

    Un intervalle de confiance est un autre type d'estimation mais, au lieu de n'être qu'un seul nombre, il s'agit d'un intervalle de nombres. L'intervalle des nombres est une plage de valeurs calculées à partir d'un ensemble donné de données d'échantillon. L'intervalle de confiance est susceptible d'inclure le paramètre de population inconnu.

    Supposons que, pour l'exemple d'iTunes, nous ne connaissions pas la moyenne de la population\(\mu\), mais que nous savions que l'écart type de la population est de 100\(\sigma = 1\) et que la taille de notre échantillon est de 100. Ensuite, selon le théorème de la limite centrale, l'écart type de la distribution d'échantillonnage des moyennes d'échantillonnage est

    \[\frac{\sigma}{\sqrt{n}}=\frac{1}{\sqrt{100}}=0.1.\nonumber\]

    La règle empirique, qui s'applique à la distribution normale, indique que dans environ 95 % des échantillons, la moyenne de l'échantillon se\(\overline x\) situera dans les deux écarts types de la moyenne de la population \ mu. Pour notre exemple iTunes, deux écarts types sont\((2)(0.1) = 0.2\). La moyenne de l'échantillon\(\overline x\) est susceptible de se situer à moins de 0,2 unité de\(\mu\).

    Parce que\(\overline x\) se trouve à moins de 0,2 unité de\(\mu\), ce qui est inconnu, alors\(\mu\) est susceptible de se trouver à moins de 0,2 unité\(\overline x\) avec une probabilité de 95 %. La moyenne de la population\(\mu\) est comprise dans un intervalle dont le nombre inférieur est calculé en prenant la moyenne de l'échantillon et en soustrayant deux écarts types\((2)(0.1)\) et dont le chiffre supérieur est calculé en prenant la moyenne de l'échantillon et en ajoutant deux écarts types. En d'autres termes,\(\mu\) se situe entre\(\overline{x}-0.2\) et\(\overline{x}+0.2\) dans 95 % de tous les échantillons.

    Pour l'exemple d'iTunes, supposons qu'un échantillon produise une moyenne d'échantillon\(\overline{x}=2\). Ensuite, avec une probabilité de 95 %, la moyenne de population inconnue\(\mu\) se situe

    \[\overline{x}-0.2=2-0.2=1.8 \text { and } \overline{x}+0.2=2+0.2=2.2 \nonumber\]

    Nous disons que nous sommes convaincus à 95 % que le nombre moyen de chansons téléchargées sur iTunes par mois par la population inconnue se situe entre 1,8 et 2,2. L'intervalle de confiance à 95 % est (1,8, 2,2). Veuillez noter que nous avons parlé en termes de confiance de 95 % en utilisant la règle empirique. La règle empirique pour deux écarts types n'est que d'environ 95 % de la probabilité selon la distribution normale. Pour être précis, deux écarts types dans le cadre d'une distribution normale représentent en fait 95,44 % de la probabilité. Pour calculer le niveau de confiance exact de 95 %, nous utiliserions 1,96 écart-type.

    L'intervalle de confiance de 95 % implique deux possibilités. Soit l'intervalle (1,8, 2,2) contient la moyenne réelle\(\mu\), soit notre échantillon a produit une valeur\(\overline x\) qui ne se situe pas à moins de 0,2 unité de la moyenne réelle\(\mu\). La deuxième possibilité ne se produit que pour 5 % de tous les échantillons (95 % moins 100 % = 5 %).

    N'oubliez pas qu'un intervalle de confiance est créé pour un paramètre de population inconnu, tel que la moyenne de la population,\(\mu\).

    Pour l'intervalle de confiance pour une moyenne, la formule serait la suivante :

    \[\mu=\overline{X} \pm Z_{\alpha} \sigma / \sqrt{n}\nonumber\]

    Ou écrit d'une autre manière comme suit :

    \[\overline{X}-Z_{\alpha} \sigma /_{\sqrt{n}} \leq \mu \leq \overline{X}+Z_{\alpha} \sigma / \sqrt{n}\nonumber\]

    \(\overline x\) est la moyenne de l'échantillon ? \(Z_{\alpha}\)est déterminé par le niveau de confiance souhaité par l'analyste et\(\sigma / \sqrt{n}\) représente l'écart type de la distribution d'échantillonnage pour les moyennes qui nous sont données par le théorème de la limite centrale.