Skip to main content
Global

10.1 : Comparaison de deux moyennes de population indépendantes

  • Page ID
    191561
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    La comparaison de deux moyennes de population indépendantes est très courante et permet de vérifier l'hypothèse selon laquelle les deux groupes diffèrent l'un de l'autre. Le travail de nuit est-il moins productif que le travail de jour, les taux de rendement des investissements en actifs fixes sont-ils différents de ceux des investissements en actions ordinaires, etc. La différence observée entre les moyennes de deux échantillons dépend à la fois des moyennes et des écarts types de l'échantillon. Des moyens très différents peuvent se produire par hasard s'il existe de grandes variations entre les échantillons individuels. Les statistiques du test devront tenir compte de ce fait. Le test comparant deux moyennes de population indépendantes avec des écarts types de population inconnus et peut-être inégaux est appelé\(t\) test d'Aspin-Welch. La formule des degrés de liberté que nous verrons plus tard a été développée par Aspin-Welch.

    Lorsque nous avons développé le test d'hypothèse pour la moyenne et les proportions, nous avons commencé par le théorème de la limite centrale. Nous avons reconnu qu'une moyenne d'échantillon provenait d'une distribution de moyennes d'échantillons et que les proportions d'échantillon provenaient de la distribution d'échantillonnage des proportions d'échantillons. Cela a transformé les paramètres de notre échantillon, les moyennes et les proportions de l'échantillon, en variables aléatoires. Il était important pour nous de connaître la distribution d'où provenaient ces variables aléatoires. Le théorème de la limite centrale nous a donné la réponse : la distribution normale. Nos\(t\) statistiques\(Z\) et proviennent de ce théorème. Cela nous a fourni la solution à notre question de savoir comment mesurer la probabilité qu'une moyenne d'échantillon provienne d'une distribution avec une valeur hypothétisée particulière de la moyenne ou de la proportion. Dans les deux cas, la question était la suivante : quelle est la probabilité que la moyenne (ou la proportion) de nos données d'échantillonnage provienne d'une distribution de la population avec la valeur hypothétisée qui nous intéresse ?

    Nous voulons maintenant savoir si deux échantillons ont la même moyenne. Notre question n'a pas changé : ces deux échantillons proviennent-ils de la même distribution de population ? Pour résoudre ce problème, nous créons une nouvelle variable aléatoire. Nous reconnaissons que nous avons deux moyennes d'échantillon, une pour chaque ensemble de données, et que nous avons donc deux variables aléatoires provenant de deux distributions inconnues. Pour résoudre le problème, nous créons une nouvelle variable aléatoire, la différence entre les moyennes de l'échantillon. Cette nouvelle variable aléatoire possède également une distribution et, encore une fois, le théorème de la limite centrale nous indique que cette nouvelle distribution est normalement distribuée, quelles que soient les distributions sous-jacentes des données d'origine. Un graphique peut aider à comprendre ce concept.

    Figurine\(\PageIndex{2}\)

    La photo montre deux distributions de données,\(X_1\) et\(X_2\), avec des moyennes et des écarts types inconnus. Le deuxième panneau montre la distribution d'échantillonnage de la variable aléatoire nouvellement créée (\(\overline{X}_{1}-\overline{X}_{2}\)). Cette distribution est la distribution théorique de nombreuses moyennes d'échantillons de la population 1 moins les moyennes de l'échantillon de la population 2. Le théorème de la limite centrale nous indique que cette distribution d'échantillonnage théorique des différences dans les moyennes des échantillons est normalement distribuée, quelle que soit la distribution des données démographiques réelles présentées dans le panneau supérieur. Comme la distribution d'échantillonnage est distribuée normalement, nous pouvons développer une formule de normalisation et calculer les probabilités à partir de la distribution normale standard dans le panneau inférieur, la\(Z\) distribution. Nous avons déjà vu cette même analyse dans le chapitre 7 Figure\(\PageIndex{2}\).

    Le théorème de la limite centrale, comme précédemment, nous fournit l'écart type de la distribution d'échantillonnage et, en outre, nous indique que la valeur attendue de la moyenne de la distribution des différences dans les moyennes des échantillons est égale aux différences entre les moyennes de population. Mathématiquement, cela peut être indiqué :

    \[E\left(\mu_{\overline{x}_{1}}-\mu_{\overline{x}_{2}}\right)=\mu_{1}-\mu_{2}\nonumber\]

    Comme nous ne connaissons pas les écarts types de la population, nous les estimons à l'aide des deux écarts types d'échantillons provenant de nos échantillons indépendants. Pour le test d'hypothèse, nous calculons l'écart type estimé, ou erreur type, de la différence entre les moyennes de l'échantillon\(\overline{X}_{1}-\overline{X}_{2}\).

    \[\textbf{The standard error is:}\nonumber\]

    \[\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}\nonumber\]

    Nous nous souvenons que la technique que nous avons utilisée pour établir l'intervalle de confiance et la statistique de test pour le test d'hypothèse pour une moyenne unique dans les intervalles de confiance et la statistique de test pour le test d'hypothèse pour une moyenne unique dans les intervalles de confiance et Test d'hypothèse avec un seul échantillon. La statistique du test (score t) est calculée comme suit :

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}}\nonumber\]

    où :

    • \(s_1\)et\(s_2\), les écarts types de l'échantillon, sont des estimations de\(\sigma_1\) et\(\sigma_2\), respectivement, et
    • \(\sigma_1\)et\(\sigma_2\) sont les écarts types de population inconnus.
    • \(\overline{x}_{1}\)et\(\overline{x}_{2}\) sont les moyens de l'échantillon. \(\mu_1\)et\(\mu_2\) sont les moyennes inconnues de la population.

    Le nombre de degrés de liberté (df) nécessite un calcul quelque peu compliqué. \(df\)Il ne s'agit pas toujours d'un nombre entier. La statistique du test ci-dessus est approximée par la\(t\) distribution de l'étudiant\(df\) comme suit :

    Degrés de liberté

    \[df=\frac{\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}{\left(\frac{1}{n_{1}-1}\right)\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}\right)^{2}+\left(\frac{1}{n_{2}-1}\right)\left(\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}\nonumber\]

    Lorsque la taille\(n_1\) de l'échantillon est égale ou supérieure à 30, l'approximation t de Student est très bonne.\(n_2\) Si chaque échantillon comporte plus de 30 observations, les degrés de liberté peuvent être calculés comme suit\(n_1 + n_2 - 2\) :

    Le format de la distribution d'échantillonnage, différences dans les moyennes des échantillons, indique que le format de l'hypothèse nulle et alternative est le suivant :

    \[H_{0} : \mu_{1}-\mu_{2}=\delta_{0}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1}-\mu_{2} \neq \delta_{0}\nonumber\]

    \(\delta_{0}\) est la différence hypothétisée entre les deux moyennes. Si la question est simplement « y a-t-il une différence entre les moyens ? » alors\(\delta_{0} = 0\) et les hypothèses nulles et alternatives deviennent :

    \[H_{0} : \mu_{1}=\mu_{2}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1} \neq \mu_{2}\nonumber\]

    Par exemple, lorsque la comparaison des deux groupes nécessite une différence spécifique pour que la décision soit significative,\(\delta_{0}\) peut ne pas être nulle. Imaginez que vous faites un investissement en capital. Vous envisagez de passer de votre modèle de machine actuel à un autre. Vous mesurez la productivité de vos machines en fonction de la vitesse à laquelle elles produisent le produit. Il se peut qu'un candidat au remplacement de l'ancien modèle soit plus rapide en termes de débit de production, mais qu'il soit également plus cher. La deuxième machine peut également avoir des coûts de maintenance, de mise en place, etc. L'hypothèse nulle serait mise en place de telle sorte que la nouvelle machine devrait être meilleure que l'ancienne d'une manière suffisante pour couvrir ces coûts supplémentaires en termes de vitesse et de coût de production. Cette forme d'hypothèse nulle et alternative montre à quel point ce test d'hypothèse particulier peut être précieux. Pour la plupart de nos travaux, nous testerons des hypothèses simples en demandant s'il existe une différence entre les deux moyennes de distribution.

    Exemple\(\PageIndex{1}\) INDEPENDENT GROUPS

    La société Kona Iki produit du lait de coco. Ils prélèvent des noix de coco et extraient le lait à l'intérieur en perçant un trou et en versant le lait dans une cuve pour le traitement. Ils disposent à la fois d'un quart de jour (appelé poste B) et d'un quart de nuit (appelé poste G) pour effectuer cette partie du processus. Ils aimeraient savoir si les équipes de jour et de nuit sont aussi efficaces dans la transformation des noix de coco. Une étude est réalisée en échantillonnant 9 quarts du décalage G et 16 quarts du décalage B. Les résultats du nombre d'heures nécessaires pour traiter 100 livres de noix de coco sont présentés dans le tableau\(\PageIndex{1}\). Une étude est réalisée et des données sont collectées, ce qui donne les données du tableau\(\PageIndex{1}\).

    \ (\ PageIndex {1} \) « >
    Taille de l'échantillon Nombre moyen d'heures nécessaires pour transformer 100 livres de noix de coco Écart type d'échantillon
    Changement de vitesse G 9 2 0,866 0,866
    B Shift 16 3.2 1,00
    Tableau\(\PageIndex{1}\)

    Y a-t-il une différence dans le temps moyen nécessaire à chaque quart de travail pour transformer 100 livres de noix de coco ? Test au seuil de signification de 5 %.

    Réponse

    Solution 10.1

    Les écarts types de population ne sont pas connus et on ne peut pas présumer qu'ils sont égaux. \(g\)Soit l'indice du G Shift et\(b\) l'indice du B Shift. Ensuite,\(\mu_g\) est la moyenne de population pour G Shift et\(\mu_b\) est la moyenne de population pour B Shift. Il s'agit d'un test de deux groupes indépendants, de deux moyennes de population.

    Variable aléatoire :\(\overline{X}_{g}-\overline{X}_{b}\) = différence entre le temps moyen de l'échantillon entre le décalage G et le décalage B pour traiter les noix de coco.
    \(\H_{0}: \mu_g = \mu_b\)\(\H_{0}: \mu_g – \mu_b = 0\)
    \(H_a: \mu_g \neq \mu_b\)\(H_a: \mu_g – \mu_b \neq 0\)
    Les mots « pareil » indiquent que vous avez\(\H_{0}\) un « = ». Comme il n'y a pas d'autres mots pour l'indiquer\(H_a\), il est soit plus rapide, soit plus lent. Il s'agit d'un test bilatéral.

    Distribution pour le test : Utilisez l'\(t_{df}\)endroit où\(df\) est calculé à l'aide de la\(df\) formule pour les groupes indépendants, deux moyennes de population ci-dessus. À l'aide d'une calculatrice,\(df\) c'est environ 18,8462.

    Graphique :

    Il s'agit d'une courbe de distribution normale représentant la différence entre la durée moyenne pendant laquelle les filles et les garçons font du sport toute la journée. La moyenne est égale à zéro et les valeurs -1,2, 0 et 1,2 sont étiquetées sur l'axe horizontal. Deux lignes verticales s'étendent de -1,2 et 1,2 jusqu'à la courbe. La région à gauche de x = -1,2 et la région à droite de x = 1,2 sont ombrées pour représenter la valeur de p. La superficie de chaque région est de 0,0028.

    Figurine\(\PageIndex{3}\)

    \[\mathrm{t}_{\mathrm{c}}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=-3.01\nonumber\]

    Nous trouvons ensuite la valeur critique sur la\(t\) table en utilisant les degrés de liberté vus d'en haut. La valeur critique, 2,093, se trouve dans la colonne 0,025, c'est-à-dire\(\alpha/2\) à 19 degrés de liberté. (La convention consiste à arrondir les degrés de liberté afin de rendre la conclusion plus conservatrice.) Ensuite, nous calculons la statistique du test et la marquons sur le graphique\(t\) de distribution.

    Prenez une décision : étant donné que la\(t\) valeur calculée se trouve dans la queue, nous ne pouvons pas accepter l'hypothèse nulle selon laquelle il n'y a aucune différence entre les deux groupes. Les moyens sont différents.

    Le graphique a inclus la distribution d'échantillonnage des différences dans les moyennes de l'échantillon afin de montrer comment la distribution en t s'aligne sur les données de distribution d'échantillonnage. Nous voyons dans le panneau supérieur que la différence calculée entre les deux moyennes est de -1,2 et que le panneau inférieur indique qu'il s'agit de 3,01 écart-type par rapport à la moyenne. En général, nous n'avons pas besoin de montrer le graphique de distribution de l'échantillonnage et nous pouvons nous fier au graphique de la statistique du test, la distribution t dans ce cas, pour parvenir à notre conclusion.

    Conclusion : Au seuil de signification de 5 %, les données de l'échantillon montrent qu'il existe suffisamment de preuves pour conclure que le nombre moyen d'heures nécessaires au quart de travail G pour traiter 100 livres de noix de coco est différent de celui du quart B (le nombre moyen d'heures pour le quart B est supérieur au nombre moyen de heures pour le G Shift).

    REMARQUE

    Lorsque la somme des tailles d'échantillon est supérieure à celle de l'étudiant,\(30\left(n_{1}+n_{2}>30\right)\) vous pouvez utiliser la distribution normale pour obtenir une approximation de celle de l'étudiant\(t\).

    Exemple\(\PageIndex{2}\)

    Une étude est réalisée pour déterminer si l'entreprise A conserve ses travailleurs plus longtemps que la société B. On estime que l'entreprise A a un taux de rétention plus élevé que la société B. L'étude révèle que sur un échantillon de 11 travailleurs de l'entreprise A, leur temps moyen passé dans l'entreprise est de quatre ans avec un écart type de 1,5 an. Un échantillon de 9 travailleurs de l'entreprise B révèle que le temps moyen passé dans l'entreprise était de 3,5 ans avec un écart-type de 1 an. Testez cette proposition au seuil de signification de 1 %.

    a. S'agit-il d'un test de deux moyennes ou de deux proportions ?

    Réponse

    Solution 10.2

    a. deux signifient que le temps est une variable aléatoire continue.

    b. Les écarts types des populations sont-ils connus ou inconnus ?

    Réponse

    Solution 10.2

    b. inconnu

    c. Quelle distribution utilisez-vous pour effectuer le test ?

    Réponse

    Solution 10.2

    c. Étudiants\(t\)

    d. Qu'est-ce que la variable aléatoire ?

    Réponse

    Solution 10.2

    d.\(\overline{X}_{A}-\overline{X}_{B}\)

    e. Quelles sont les hypothèses nulles et alternatives ?

    Réponse

    Solution 10.2

    e.

    • \(H_{0} : \mu_{A} \leq \mu_{B}\)
    • \(H_{a} : \mu_{A}>\mu_{B}\)

    f. S'agit-il d'un test à droite, à gauche ou à double sens ?

    Réponse

    Solution 10.2

    f. bon test unilatéral

    Il s'agit d'une courbe de distribution normale dont la moyenne est égale à 0. Une ligne verticale située près de la fin de la courbe, à droite du zéro, s'étend de l'axe à la courbe. La région située sous la courbe à droite de la ligne est ombrée.

    Figurine\(\PageIndex{4}\)

    g. Quelle est la valeur de la statistique du test ?

    Réponse

    Solution 10.2

    g.

    \(t_{c}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=0.89\)

    h. Pouvez-vous accepter/rejeter l'hypothèse nulle ?

    Réponse

    Solution 10.2

    h. Impossible de rejeter l'hypothèse nulle selon laquelle il n'y a pas de différence entre les deux groupes. La statistique du test n'est pas dans la queue. La valeur critique de la distribution t est de 2,764 avec 10 degrés de liberté. Cet exemple montre à quel point il est difficile de rejeter une hypothèse nulle avec un très petit échantillon. Les valeurs critiques nécessitent des statistiques de test très importantes pour atteindre la queue.

    i. Conclusion :

    Réponse

    Solution 10.2

    i. Au seuil de signification de 1 %, les données de l'échantillon ne permettent pas de conclure que la rétention des travailleurs dans l'entreprise A est plus longue que dans l'entreprise B, en moyenne.

    Exemple\(\PageIndex{3}\)

    Une question de recherche intéressante concerne l'effet, le cas échéant, des différents types de formats d'enseignement sur les résultats scolaires des étudiants. Pour étudier cette question, un échantillon des notes des étudiants a été prélevé dans une classe hybride et un autre échantillon a été prélevé dans une classe de type cours standard. Les deux cours portaient sur la même matière. La note moyenne en pourcentage du cours pour les 35 étudiants hybrides est de 74 avec un écart-type de 16. Les notes moyennes des 40 étudiants du cours magistral standard étaient de 76 % avec un écart-type de 9. Testez à 5 % pour voir s'il existe une différence significative dans les notes moyennes de la population entre le cours magistral standard et le cours hybride.

    Réponse

    Solution 10.3

    Nous commençons par noter que nous avons deux groupes, les étudiants d'une classe hybride et les étudiants d'une classe de type cours standard. Nous notons également que la variable aléatoire, ce qui nous intéresse, ce sont les notes des étudiants, une variable aléatoire continue. Nous aurions pu poser la question de recherche d'une manière différente et avoir une variable aléatoire binaire. Par exemple, nous aurions pu étudier le pourcentage d'élèves ayant une note d'échec ou une note A. Les deux seraient binaires et constitueraient donc un test de proportions et non un test de moyennes comme c'est le cas ici. Enfin, il n'existe aucune présomption quant au format qui pourrait mener à des notes plus élevées, de sorte que l'hypothèse est formulée sous la forme d'un test bilatéral.

    \(H_{0}: \mu_1 = \mu_2 \)
    \(H_a: \mu_1 \neq \mu_2\)

    Comme ce serait pratiquement toujours le cas, nous ne connaissons pas les variances démographiques des deux distributions et notre statistique de test est donc la suivante :

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{s^{2}}{n_{1}}+\frac{s^{2}}{n_{2}}}}=\frac{(74-76)-0}{\sqrt{\frac{16^{2}}{35}+\frac{9^{2}}{40}}}=-0.65\nonumber\]

    Pour déterminer la valeur critique du t de l'étudiant, nous avons besoin des degrés de liberté. Pour ce cas, nous utilisons :\(df = n_1 + n_2 - 2 = 35 + 40 -2 = 73\). Il s'agit donc d'une distribution suffisamment grande pour la considérer comme la distribution normale\(t_{\alpha /2} = 1.96\). Comme toujours, nous déterminons si la valeur calculée se trouve dans la queue déterminée par la valeur critique. Dans ce cas, il n'est même pas nécessaire de rechercher la valeur critique : la valeur calculée de la différence entre ces deux notes moyennes n'est même pas séparée d'un écart type. Sûrement pas dans la queue.

    Conclusion : Impossible de rejeter la valeur nulle à\(\bf{\alpha = 5\%}\). Il n'existe donc aucune preuve démontrant que les notes dans les classes hybrides et standard diffèrent.