Skip to main content
Global

8.1 : Un intervalle de confiance pour un écart type de population, une taille d'échantillon connue ou de grande taille

  • Page ID
    191357
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Un intervalle de confiance pour une moyenne de population avec un écart type connu est basé sur la conclusion du théorème de la limite centrale selon laquelle la distribution d'échantillonnage des moyennes de l'échantillon suit une distribution approximativement normale.

    Calcul de l'intervalle de confiance

    Examinons la formule de normalisation pour la distribution d'échantillonnage développée dans la discussion sur le théorème de la limite centrale :

    \[Z_{1}=\frac{\overline{X}-\mu_{\overline{X}}}{\sigma_{\overline{X}}}=\frac{\overline{X}-\mu}{\sigma / \sqrt{n}}\nonumber\]

    Notez que cela\(\mu\) est remplacé\(\mu_{\overline{x}}\) parce que nous savons que la valeur attendue de provient du\(\mu_{\overline{x}}\) théorème\(\mu\) de la limite centrale et\(\sigma_{\overline{x}}\) est remplacée par\(\sigma / \sqrt{n}\), également, du théorème de la limite centrale.

    Dans cette formule\(\overline X\), nous connaissons\(\sigma_{\overline{x}}\) et connaissons\(n\) la taille de l'échantillon. (En réalité, nous ne connaissons pas l'écart type de la population, mais nous avons une estimation ponctuelle à partir de l'échantillon que nous avons prélevé.\(s\) Plus d'informations à ce sujet plus tard.) Ce que nous ne savons pas, c'est\(\mu\) ou\(Z_1\). Nous pouvons résoudre l'un ou l'autre de ces problèmes en fonction de l'autre. Résoudre\(\mu\) en termes de\(Z_1\) dons :

    \[\mu=\overline{X} \pm Z_{1} {\sigma} / \sqrt{n}\nonumber\]

    En nous souvenant que le théorème de la limite centrale nous indique que\(\overline X\) la distribution des s, la distribution d'échantillonnage pour les moyennes, est normale et que la distribution normale est symétrique, nous pouvons réorganiser les termes ainsi :

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    Il s'agit de la formule de l'intervalle de confiance pour la moyenne d'une population.

    Notez que cela\(Z_\alpha\) a été remplacé\(Z_1\) dans cette équation. C'est là qu'un choix doit être fait par le statisticien. L'analyste doit décider du niveau de confiance qu'il souhaite imposer à l'intervalle de confiance. \ alpha est la probabilité que l'intervalle ne contienne pas la moyenne réelle de la population. Le niveau de confiance est défini comme\((1-\alpha)\). \(Z_\alpha\)est que le nombre d'écarts types\(\overline X\) se situe par rapport à la moyenne avec une certaine probabilité. Si nous le\(Z_\alpha = 1.96\) choisissons, nous demandons l'intervalle de confiance de 95 %, car nous fixons la probabilité que la moyenne réelle se situe dans l'intervalle à 0,95. Si nous fixons\(Z_\alpha\) à 1,64, nous demandons l'intervalle de confiance de 90 % car nous avons fixé la probabilité à 0,90. Ces chiffres peuvent être vérifiés en consultant le tableau des normales standard. Divisez 0,95 ou 0,90 en deux et trouvez cette probabilité dans le corps du tableau. Lisez ensuite dans les marges supérieure et gauche le nombre d'écarts types nécessaires pour obtenir ce niveau de probabilité.

    En réalité, nous pouvons définir le niveau de confiance que nous souhaitons simplement en modifiant la\(Z_\alpha\) valeur de la formule. C'est le choix de l'analyste. Une convention commune en économie et dans la plupart des sciences sociales fixe des intervalles de confiance à des niveaux de 90, 95 ou 99 %. Les niveaux inférieurs à 90 % sont considérés comme ayant peu de valeur. Le niveau de confiance d'une estimation d'intervalle donnée est appelé par\((1-\alpha)\).

    Un bon moyen d'observer l'évolution d'un intervalle de confiance consiste à représenter graphiquement la solution à un problème demandant un intervalle de confiance. Ceci est présenté dans la figure\(\PageIndex{2}\) pour l'exemple de l'introduction concernant le nombre de téléchargements depuis iTunes. Ce cas était pour un intervalle de confiance de 95 %, mais d'autres niveaux de confiance auraient tout aussi bien pu être choisis en fonction des besoins de l'analyste. Toutefois, le niveau de confiance DOIT être prédéfini et ne pas être sujet à révision à la suite des calculs.

    Il s'agit d'une courbe de distribution normale. Le point z0.01 est marqué sur le bord droit de la courbe et la région située à droite de ce point est ombrée. L'aire de cette région ombrée est égale à 0,01. La zone non ombrée est égale à 0,99.
    Figurine\(\PageIndex{2}\)

    Pour cet exemple, supposons que nous sachions que le nombre moyen de téléchargements iTunes par la population réelle est de 2,1. La moyenne réelle de la population se situe dans la fourchette de l'intervalle de confiance de 95 %. Il n'y a absolument rien qui puisse garantir que cela se produira. De plus, si la moyenne réelle se situe en dehors de l'intervalle, nous ne la connaîtrons jamais. Nous devons toujours nous rappeler que nous ne connaîtrons jamais le vrai moyen. Les statistiques nous permettent simplement, avec un niveau de probabilité (confiance) donné, de dire que la moyenne réelle se situe dans la fourchette calculée. C'est ce que l'on a appelé dans l'introduction, le « niveau d'ignorance admis ».

    Modifier le niveau de confiance ou la taille de l'échantillon

    Voici à nouveau la formule de l'intervalle de confiance pour une moyenne de population inconnue en supposant que nous connaissons l'écart type de la population :

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    Il est clair que l'intervalle de confiance dépend de deux facteurs, à savoir le niveau de confiance choisi et l'écart type de la distribution d'échantillonnage.\(Z_\alpha\) L'écart type de la distribution d'échantillonnage est également influencé par deux facteurs : l'écart type de la population et la taille de l'échantillon que nous avons choisie pour nos données. Nous souhaitons ici examiner les effets de chacun des choix que nous avons faits sur l'intervalle de confiance calculé, le niveau de confiance et la taille de l'échantillon.

    Pendant un moment, nous devrions nous demander exactement ce que nous désirons dans un intervalle de confiance. Notre objectif était d'estimer la moyenne de la population à partir d'un échantillon. Nous avons abandonné l'espoir de trouver un jour la moyenne réelle de la population, et l'écart-type de la population d'ailleurs, dans tous les cas, sauf lorsque notre population est extrêmement petite et que le coût de la collecte des données intéressantes est très faible. Dans tous les autres cas, nous devons nous fier à des échantillons. Avec le théorème de la limite centrale, nous disposons des outils nécessaires pour fournir un intervalle de confiance significatif avec un niveau de confiance donné, c'est-à-dire une probabilité connue d'erreur. Par intervalle de confiance significatif, nous entendons celui qui est utile. Imaginez qu'on vous demande un intervalle de confiance en fonction de l'âge de vos camarades de classe. Vous avez prélevé un échantillon et vous avez trouvé une moyenne de 19,8 ans. Vous souhaitez être très confiant et signalez donc un intervalle compris entre 9,8 ans et 29,8 ans. Cet intervalle contiendrait certainement la moyenne réelle de la population et présenterait un niveau de confiance très élevé. Cependant, cela ne peut guère être considéré comme significatif. Le meilleur intervalle de confiance est étroit tout en ayant un niveau de confiance élevé. Il existe une tension naturelle entre ces deux objectifs. Plus le niveau de confiance est élevé, plus l'intervalle de confiance est large, comme dans le cas des étudiants âgés de plus de 6 ans. Nous pouvons voir cette tension dans l'équation de l'intervalle de confiance.

    \[\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\nonumber\]

    L'intervalle de confiance augmentera en largeur au fur\(Z_\alpha\) et à\(Z_\alpha\) mesure que le niveau de confiance augmente. Il existe un compromis entre le niveau de confiance et la largeur de l'intervalle. Regardons maintenant la formule et nous voyons que la taille de l'échantillon joue également un rôle important dans la largeur de l'intervalle de confiance. La taille de l'échantillon, nn, apparaît au dénominateur de l'écart type de la distribution d'échantillonnage. À mesure que la taille de l'échantillon augmente, l'écart type de la distribution d'échantillonnage diminue et donc la largeur de l'intervalle de confiance, tout en maintenant le niveau de confiance constant. Cette relation a été démontrée dans la Figure\(\PageIndex{8}\). Encore une fois, nous sommes conscients de l'importance de disposer de grands échantillons pour notre analyse, bien que nous soyons alors confrontés à une deuxième contrainte, le coût de la collecte des données.

    Calcul de l'intervalle de confiance : une approche alternative

    Une autre façon d'aborder les intervalles de confiance consiste à utiliser ce que l'on appelle la limite d'erreur. La limite d'erreur tire son nom de la reconnaissance du fait qu'elle fournit la limite de l'intervalle dérivé de l'erreur type de la distribution d'échantillonnage. Dans les équations ci-dessus, on voit que l'intervalle est simplement la moyenne estimée, la moyenne de l'échantillon, plus ou moins quelque chose. Ce phénomène est la limite d'erreur et dépend de la probabilité que nous souhaitons maintenir dans notre estimation\(Z_\alpha\), multipliée par l'écart type de la distribution d'échantillonnage. La limite d'erreur d'une moyenne est nommée Error Bound Mean ou\(EBM\).

    Pour construire un intervalle de confiance pour une seule moyenne de population inconnue\(\mu\), lorsque l'écart type de la population est connu, nous avons besoin\(\overline x\) d'une estimation\(\mu\) et de la marge d'erreur. Ici, la marge d'erreur\((EBM)\) est appelée limite d'erreur pour une moyenne de population (EBM en abrégé). La moyenne de l'échantillon\(\overline x\) est l'estimation ponctuelle de la moyenne de la population inconnue\(\mu\).

    L'estimation de l'intervalle de confiance aura la forme suivante :

    (estimation ponctuelle - limite d'erreur, estimation ponctuelle + limite d'erreur) ou, en symboles,\((\overline{x}-E B M, \overline{x}+E B M)\)

    La formule mathématique de cet intervalle de confiance est la suivante :

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\]

    La marge d'erreur (EBM) dépend du niveau de confiance (en abrégé CL). Le niveau de confiance est souvent considéré comme la probabilité que l'estimation de l'intervalle de confiance calculé contienne le véritable paramètre de population. Toutefois, il est plus exact d'indiquer que le niveau de confiance est le pourcentage des intervalles de confiance qui contiennent le véritable paramètre de population lorsque des échantillons répétés sont prélevés. Le plus souvent, c'est à la personne qui construit l'intervalle de confiance de choisir un niveau de confiance de 90 % ou plus parce qu'elle veut être raisonnablement certaine de ses conclusions.

    Il existe une autre probabilité appelée alpha (\(\alpha\)). \(\alpha\)est lié au niveau de confiance,\(CL\). \(\alpha\)est la probabilité que l'intervalle ne contienne pas le paramètre de population inconnu.
    Mathématiquement,\(1 - \alpha = CL\).

    Un intervalle de confiance pour une moyenne de population avec un écart type connu est basé sur le fait que la distribution d'échantillonnage des moyennes de l'échantillon suit une distribution approximativement normale. Supposons que notre échantillon ait une moyenne de\(\overline x = 10\), et que nous ayons construit l'intervalle de confiance à 90 %\((5, 15)\)\(EBM = 5\).

    Pour obtenir un intervalle de confiance de 90 %, nous devons inclure les 90 % centraux de la probabilité de la distribution normale. Si nous incluons les 90 % centraux, nous omettons un total\(\alpha = 10%\) dans les deux queues, soit 5 % dans chaque queue, de la distribution normale.

    Il s'agit d'une courbe de distribution normale. Le sommet de la courbe coïncide avec le point 10 sur l'axe horizontal. Les points 5 et 15 sont marqués sur l'axe. Des lignes verticales sont tracées à partir de ces points jusqu'à la courbe, et la région entre les lignes est ombrée. La zone ombrée a une surface égale à 0,90.
    Figurine\(\PageIndex{3}\)

    Pour capturer les 90 % centraux, nous devons extraire 1,645 écart-type de chaque côté de la moyenne de l'échantillon calculée. La valeur 1,645 est le score z d'une distribution de probabilité normale standard qui place une aire de 0,90 au centre, une aire de 0,05 à l'extrême gauche et une aire de 0,05 à l'extrême droite.

    Il est important que l'écart type utilisé soit approprié au paramètre que nous estimons. Dans cette section, nous devons donc utiliser l'écart type qui s'applique à la distribution d'échantillonnage pour les moyennes que nous avons étudiées avec le théorème de la limite centrale et est,\(\frac{\sigma}{\sqrt{n}}\).

    Calcul de l'intervalle de confiance avec l'EMB

    Pour construire une estimation de l'intervalle de confiance pour une moyenne de population inconnue, nous avons besoin de données provenant d'un échantillon aléatoire. Les étapes pour construire et interpréter l'intervalle de confiance sont les suivantes :

    • Calculez la moyenne\(\overline x\) de l'échantillon à partir de ses données. N'oubliez pas que dans cette section, nous connaissons l'écart type de la population\(\sigma\).
    • Trouvez le score z dans le tableau normal standard qui correspond au niveau de confiance souhaité.
    • Calculez la limite d'erreur\(EBM\).
    • Construisez l'intervalle de confiance.
    • Écrivez une phrase qui interprète l'estimation dans le contexte de la situation du problème.

    Nous allons d'abord examiner chaque étape plus en détail, puis illustrer le processus à l'aide de quelques exemples.

    Déterminer le score z pour le niveau de confiance déclaré

    Lorsque nous connaissons l'écart type \ sigma de la population, nous utilisons une distribution normale standard pour calculer la limite d'erreur\(EBM\) et construire l'intervalle de confiance. Nous devons trouver la valeur\(z\) qui place une aire égale au niveau de confiance (sous forme décimale) au milieu de la distribution normale standard\(Z \sim N(0, 1)\).

    Le niveau de confiance\(CL\),, est la zone située au milieu de la distribution normale standard. \(CL = 1 – \alpha\), il en\(\alpha\) va de même pour la zone divisée à parts égales entre les deux queues. Chacune des queues contient une surface égale à\(\frac{\alpha}{2}\).

    Le score z qui possède une zone à droite de\(\frac{\alpha}{2}\) est indiqué par\(Z_{\frac{\alpha}{2}}\).

    Par exemple\(CL = 0.95\), quand\(\alpha = 0.05\) et\(\frac{\alpha}{2} = 0.025\) ; nous écrivons\(Z_{\frac{\alpha}{2}}\) = Z_ {0.025} \).

    La zone à droite de\(Z_{0.025}\) est de 0,025 et la zone à gauche de\(Z_{0.025}\) est\(1 – 0.025 = 0.975\).

    \(Z_{\frac{\alpha}{2}} = Z_{0.025} = 1.96\), à l'aide d'une table de probabilité normale standard. Nous verrons plus loin que nous pouvons utiliser une autre table de probabilité, la distribution t de Student, pour déterminer le nombre d'écarts types des niveaux de confiance couramment utilisés.

    Calcul de la limite d'erreur (EBM)

    La formule liée à l'erreur pour une moyenne de population inconnue \ mu lorsque l'écart type \ sigma de la population est connu est

    • \(E B M=\left(Z \frac{\alpha}{2}\right)\left(\frac{\sigma}{\sqrt{n}}\right)\)

    Construction de l'intervalle de confiance

    • L'estimation de l'intervalle de confiance a le format\((\overline{x}-E B M, \overline{x}+E B M)\) ou la formule :\(\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\)

    Le graphique donne une image de la situation dans son ensemble.

    \(C L+\frac{\alpha}{2}+\frac{\alpha}{2}=C L+\alpha=1\).

    Il s'agit d'une courbe de distribution normale. Le sommet de la courbe coïncide avec le point X sur l'axe horizontal. Les points x-bar - EBM et x-bar + EBM sont étiquetés sur l'axe. Des lignes verticales sont tracées à partir de ces points jusqu'à la courbe, et la région entre les lignes est ombrée. La zone ombrée a une surface égale à 1 - a et représente le niveau de confiance. Chaque queue non ombrée possède une zone a/2.

    Figurine\(\PageIndex{4}\)

    Exemple\(\PageIndex{1}\)

    Supposons que nous nous intéressions aux notes moyennes d'un examen. Un échantillon aléatoire de 36 scores est prélevé et donne une moyenne d'échantillon (score moyen de l'échantillon) de 68 (X−X- = 68). Dans cet exemple, nous avons la connaissance inhabituelle que l'écart type de la population est de 3 points. Ne comptez pas connaître les paramètres de la population en dehors des exemples tirés des manuels. Trouvez une estimation de l'intervalle de confiance pour le score moyen aux examens de la population (le score moyen de tous les examens).

    Déterminez un intervalle de confiance de 90 % pour la moyenne réelle (population) des résultats des examens statistiques.

    Réponse

    Solution 8.1

    • La solution est présentée étape par étape.

    Pour déterminer l'intervalle de confiance, vous avez besoin de la moyenne de\(\overline x\) l'échantillon et du\(EBM\).

    • \(\overline x = 68\)
    • \(EBM = \left(Z_{\frac{\alpha}{2}}\right)\left(\frac{\sigma}{\sqrt{n}}\right)\)
    • \(\sigma = 3\);\(n = 36\) ; Le niveau de confiance est de 90 %\((CL = 0.90)\)

    \(CL = 0.90\)donc\(\alpha = 1 – CL = 1 – 0.90 = 0.10\)

    \(\frac{\alpha}{2}=0.05, Z_{\frac{\alpha}{2}}=z_{0.05}\)

    La zone à droite de\(Z_{0.05}\) est\(0.05\) et la zone à gauche de\(Z_{0.05}\) est\(1 – 0.05 = 0.95\).

    \(Z_{\frac{\alpha}{2}}=Z_{0.05}=1.645\)

    Cela peut être trouvé à l'aide d'un ordinateur ou d'une table de probabilité pour la distribution normale standard. Comme les niveaux de confiance courants dans les sciences sociales sont de 90 %, 95 % et 99 %, vous ne tarderez pas à vous familiariser avec les chiffres de 1,645, 1,96 et 2,56

    \(E B M=(1.645)\left(\frac{3}{\sqrt{36}}\right)=0.8225\)

    \(\overline{x}-E B M=68-0.8225=67.1775\)

    \(\overline{x}+E B M=68+0.8225=68.8225\)

    L'intervalle de confiance à 90 % est (67,1775, 68,8225).

    L'interprétation

    Nous estimons avec 90 % de certitude que la note moyenne aux examens de la population réelle pour tous les étudiants en statistiques se situe entre 67,18 et 68,82.

    Exemple\(\PageIndex{2}\)

    Supposons que nous modifiions le problème initial dans l'exemple en\(\PageIndex{1}\) utilisant un niveau de confiance de 95 %. Trouvez un intervalle de confiance de 95 % pour le résultat moyen réel (de la population) à l'examen des statistiques.

    Réponse

    Solution 8.2

    Figurine\(\PageIndex{5}\)

    \[\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\nonumber\]

    \[\mu=68 \pm 1.96\left(\frac{3}{\sqrt{36}}\right)\nonumber\]

    \[67.02 \leq \mu \leq 68.98\nonumber\]

    \(\sigma = 3\);\(n = 36\) ; Le niveau de confiance est de 95 % (\(CL = 0.95\)).

    \(CL = 0.95\)donc\(\alpha = 1 – CL = 1 – 0.95 = 0.05\)

    \(Z_{\frac{\alpha}{2}}=Z_{0.025}=1.96\)

    Notez que la valeur\(EBM\) est plus grande pour un niveau de confiance de 95 % dans le problème d'origine.

    Comparaison des résultats

    L'intervalle de confiance à 90 % est (67,18, 68,82). L'intervalle de confiance à 95 % est (67,02, 68,98). L'intervalle de confiance à 95 % est plus large. Si vous regardez les graphiques, étant donné que la zone 0,95 est plus grande que la zone 0,90, il est logique que l'intervalle de confiance à 95 % soit plus large. Pour être plus sûr que l'intervalle de confiance contient réellement la valeur réelle de la moyenne de la population pour tous les résultats des examens statistiques, l'intervalle de confiance doit nécessairement être plus large. Cela démontre un principe très important des intervalles de confiance. Il existe un compromis entre le niveau de confiance et la largeur de l'intervalle. Notre souhait est d'avoir un intervalle de confiance étroit, des intervalles très larges fournissant peu d'informations utiles. Mais nous aimerions également avoir un haut niveau de confiance dans notre intervalle. Cela montre que nous ne pouvons pas avoir les deux.

    La partie (a) montre une courbe de distribution normale. Une région centrale d'une surface égale à 0,90 est ombrée. Chaque extrémité non ombrée de la courbe a une aire égale à 0,05. La partie (b) montre une courbe de distribution normale. Une région centrale d'une surface égale à 0,95 est ombrée. Chaque extrémité non ombrée de la courbe a une aire égale à 0,025.

    Figurine\(\PageIndex{6}\)

    Résumé : Effet de la modification du niveau de confiance

    • L'augmentation du niveau de confiance élargit l'intervalle de confiance.
    • La diminution du niveau de confiance réduit l'intervalle de confiance.

    Encore une fois, voici la formule de l'intervalle de confiance pour une moyenne inconnue en supposant que nous avons l'écart type de la population :

    \[\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\nonumber\]

    L'écart type de la distribution d'échantillonnage a été fourni par le théorème de la limite centrale sous la forme\(\sigma / \sqrt{n}\). Bien que nous ayons rarement à choisir la taille de l'échantillon, elle joue un rôle important dans l'intervalle de confiance. Comme la taille de l'échantillon se situe dans le dénominateur de l'équation, lorsqu'elle\(n\) augmente, elle entraîne une diminution de l'écart type de la distribution d'échantillonnage et donc de la largeur de l'intervalle de confiance. Nous y sommes déjà parvenus lorsque nous avons examiné les effets de la taille de l'échantillon sur le théorème de la limite centrale. Nous y avons vu qu'à mesure qu'elle\(n\) augmente, la distribution d'échantillonnage se rétrécit jusqu'à ce que, dans la limite, elle s'effondre par rapport à

    Exemple\(\PageIndex{3}\)

    Supposons que nous modifiions le problème initial dans Example\(\PageIndex{1}\) pour voir ce qu'il advient de l'intervalle de confiance si la taille de l'échantillon est modifiée.

    Laissez les choses inchangées, sauf la taille de l'échantillon. Utilisez le niveau de confiance initial de 90 %. Qu'arrive-t-il à l'intervalle de confiance si nous augmentons la taille de l'échantillon et l'utilisons à la\(n = 100\) place de\(n = 36\) ? Que se passe-t-il si nous réduisons la taille de l'échantillon à\(n = 25\) au lieu de\(n = 36\) ?

    Réponse

    Solution 8.3

    Solution A

    \(\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\)

    \(\mu=68 \pm 1.645\left(\frac{3}{\sqrt{100}}\right)\)

    \(67.5065 \leq \mu \leq 68.4935\)

    Si nous augmentons la taille de l'échantillon\(n\) à 100, nous diminuons la largeur de l'intervalle de confiance par rapport à la taille d'échantillon initiale de 36 observations.

    Réponse

    Solution 8.3

    Solution B

    \(\mu=\overline{x} \pm Z_{\alpha}\left(\frac{\sigma}{\sqrt{n}}\right)\)

    \(\mu=68 \pm 1.645\left(\frac{3}{\sqrt{25}}\right)\)

    \(67.013 \leq \mu \leq 68.987\)

    Si nous réduisons la taille de l'échantillon\(n\) à 25, nous augmentons la largeur de l'intervalle de confiance par rapport à la taille d'échantillon initiale de 36 observations.

    Résumé : Effet de la modification de la taille de l'échantillon

    • L'augmentation de la taille de l'échantillon réduit l'intervalle de confiance.
    • La diminution de la taille de l'échantillon élargit l'intervalle de confiance.

    Nous avons déjà constaté cet effet lorsque nous avons examiné les effets de la modification de la taille de l'échantillon, n, sur le théorème de la limite centrale. Reportez-vous\(\PageIndex{7}\) à la figure pour voir cet effet. Auparavant, nous avons vu qu'à mesure que la taille de l'échantillon augmentait, l'écart type de la distribution d'échantillonnage diminuait. C'est pourquoi nous avons choisi la moyenne de l'échantillon à partir d'un grand échantillon par rapport à un petit échantillon, toutes choses restant constantes par ailleurs.

    Jusqu'à présent, nous avons supposé connaître l'écart type de la population. Cela ne sera pratiquement jamais le cas. Nous aurons toutefois l'écart type de l'échantillon. Il s'agit d'une estimation ponctuelle de l'écart type de la population qui peut être substituée dans la formule des intervalles de confiance pour une moyenne dans certaines circonstances. Nous venons de voir l'effet de la taille de l'échantillon sur la largeur de l'intervalle de confiance et l'impact sur la distribution de l'échantillonnage pour notre discussion sur le théorème de la limite centrale. Nous pouvons l'invoquer pour remplacer l'écart type par l'estimation ponctuelle si la taille de l'échantillon est « suffisante ». Des études de simulation indiquent que 30 observations ou plus seront suffisantes pour éliminer tout biais significatif dans l'intervalle de confiance estimé.

    Exemple\(\PageIndex{4}\)

    Les vacances de printemps peuvent être très chères. Un échantillon de 80 étudiants est interrogé, et le montant moyen dépensé par les étudiants en voyages et en boissons est de 593,84$. L'écart type de l'échantillon est d'environ 369,34$.

    Établissez un intervalle de confiance de 92 % pour le montant moyen d'argent dépensé par la population pendant les vacances de printemps.

    Réponse

    Solution 8.4

    Nous commençons par l'intervalle de confiance pour une moyenne. Nous utilisons la formule pour établir une moyenne parce que la variable aléatoire représente les dollars dépensés et qu'il s'agit d'une variable aléatoire continue. L'estimation ponctuelle de l'écart type de la population, s, a été remplacée par l'écart type de la population réelle car, avec 80 observations, il n'y a aucun risque de biais dans l'estimation de l'intervalle de confiance.

    \[\mu=\overline{x} \pm\left[Z_{(\mathrm{a} / 2)} \frac{s}{\sqrt{n}}\right]\nonumber\]

    En substituant les valeurs dans la formule, nous avons :

    \[\mu=593.84 \pm\left[1.75 \frac{369.34}{\sqrt{80}}\right]\nonumber\]

    \(Z_{(a / 2)}\)se trouve sur le tableau des normales standard en recherchant 0,46 dans le corps du tableau et en trouvant le nombre d'écarts types sur le côté et en haut du tableau ; 1,75. La solution pour l'intervalle est donc la suivante :

    \[\mu=593.84 \pm 72.2636=(521.57,666.10)\nonumber\]

    \[\$ 521.58 \leq \mu \leq \$ 666.10\nonumber\]

    Figurine\(\PageIndex{7}\)

    Examen de la formule

    La forme générale d'un intervalle de confiance pour une moyenne de population unique, un écart type connu, une distribution normale est donnée par\(\overline{X}-Z_{\alpha}(\sigma / \sqrt{n}) \leq \mu \leq \overline{X}+Z_{\alpha}(\sigma / \sqrt{n})\) Cette formule est utilisée lorsque l'écart type de la population est connu.

    \(CL\)= niveau de confiance, ou proportion des intervalles de confiance créés qui sont censés contenir le paramètre de population réel

    \(\alpha = 1 – CL\)= la proportion des intervalles de confiance qui ne contiendront pas le paramètre de population

    \(z_{\frac{\alpha}{2}}\)= le score z dont la propriété correspond à la zone située à droite du score z.\(\frac{\propto}{2}\) Il s'agit du score z utilisé dans le calcul de «\(EBM\) » où\(\alpha = 1 – CL\).