Skip to main content
Global

12.1 : Test de deux variances

  • Page ID
    191417
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Ce chapitre présente une nouvelle fonction de densité de probabilité, la\(F\) distribution. Cette distribution est utilisée pour de nombreuses applications, y compris l'ANOVA, et pour tester l'égalité entre plusieurs moyens. Nous commençons par la\(F\) distribution et le test d'hypothèse des différences de variances. Il est souvent souhaitable de comparer deux variances plutôt que deux moyennes. Par exemple, les administrateurs des collèges aimeraient que deux professeurs d'université qui évaluent des examens aient la même variation dans leur notation. Pour qu'un couvercle s'adapte à un récipient, la variation entre le couvercle et le récipient doit être approximativement la même. Un supermarché pourrait être intéressé par la variabilité des heures de départ pour deux vérificateurs. En finance, la variance est une mesure du risque et une question intéressante serait donc de tester l'hypothèse selon laquelle deux portefeuilles d'investissement différents ont la même variance, la volatilité.

    Pour effectuer un\(F\) test de deux variances, il est important que les conditions suivantes soient vraies :

    1. Les populations à partir desquelles les deux échantillons sont prélevés sont réparties à peu près normalement.
    2. Les deux populations sont indépendantes l'une de l'autre.

    Contrairement à la plupart des autres tests d'hypothèse présentés dans ce livre, le\(F\) test d'égalité de deux variances est très sensible aux écarts par rapport à la normalité. Si les deux distributions ne sont pas normales ou proches, le test peut donner un résultat biaisé pour la statistique du test.

    Supposons que nous échantillonnions au hasard deux populations normales indépendantes. Soyons\(\sigma_1^2\)\(\sigma_2^2\) les variances inconnues de la population et\(s_1^2\) et\(s_2^2\) soyez les variances de l'échantillon. Supposons que la taille des échantillons soit\(n_1\) et\(n_2\). Comme nous souhaitons comparer les deux variances de l'échantillon, nous utilisons le\(F\) ratio suivant :

    \(F=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}\)

    \(F\)a la distribution\(F \sim F\left(n_{1}-1, n_{2}-1\right)\)

    \(n_1 – 1\) sont les degrés de liberté du numérateur et\(n_2 – 1\) les degrés de liberté du dénominateur.

    Si l'hypothèse nulle est\(\sigma_{1}^{2}=\sigma_{2}^{2}\), alors le\(F\) ratio, statistique de test, devient\(F_{c}=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}=\frac{s_{1}^{2}}{s_{2}^{2}}\)

    Les différentes formes d'hypothèses testées sont les suivantes :

    Test bilatéral Test unilatéral Test unilatéral
    \(\mathrm{H}_{0} : \sigma_{1}^{2}=\sigma_{2}^{2}\) \(\mathrm{H}_{0} : \sigma_{1}^{2} \leq \sigma_{2}^{2}\) \(\mathrm{H}_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\)
    \(\mathrm{H}_{1} : \sigma_{1}^{2} \neq \sigma_{2}^{2}\) \(\mathrm{H}_{1} : \sigma_{1}^{2}>\sigma_{2}^{2}\) \(\mathrm{H}_{1} : \sigma_{1}^{2}<\sigma_{2}^{2}\)
    Tableau 12.1

    Une forme plus générale de l'hypothèse nulle et alternative pour un test bilatéral serait la suivante :

    \[H_{0} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}}=\delta_{0}\nonumber\]

    \[H_{a} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}} \neq \delta_{0}\nonumber\]

    Où s'\(\delta_{0}=1\)il s'agit d'un simple test de l'hypothèse selon laquelle les deux variances sont égales. Cette forme d'hypothèse présente l'avantage de permettre des tests qui ne se limitent pas à de simples différences et peuvent permettre des tests pour des différences spécifiques, comme nous l'avons fait pour les différences de moyennes et les différences de proportions. Cette forme d'hypothèse montre également la relation entre la\(F\) distribution et\(\chi^2\) :\(F\) il s'agit d'un ratio de deux distributions du chi carré, une distribution que nous avons vue dans le dernier chapitre. Cela est utile pour déterminer les degrés de liberté de la\(F\) distribution résultante.

    Si les deux populations présentent des variances égales, leur valeur est proche et la statistique du test\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\) est proche de 1.\(s_1^2\)\(s_2^2\) Mais si les deux variances de population sont très différentes\(s_1^2\) et\(s_2^2\) ont tendance à l'être également. Si vous choisissez\(s_1^2\) la plus grande variance de l'échantillon, le ratio sera supérieur\(\frac{s_{1}^{2}}{s_{2}^{2}}\) à un. Si\(s_1^2\) et\(s_2^2\) sont éloignés l'un de l'autre, alors\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\) c'est un grand nombre.

    Par conséquent, si cette valeur\(F\) est proche de 1, les preuves militent en faveur de l'hypothèse nulle (les deux variances de population sont égales). Mais si\(F\) c'est beaucoup plus grand qu'un, alors les preuves vont à l'encontre de l'hypothèse nulle. Essentiellement, nous nous demandons si la statistique F calculée, la statistique de test, est significativement différente d'une.

    Pour déterminer les points critiques que nous devons trouver\(F_{\alpha,df1,df2}\). Voir le\(F\) tableau à l'annexe A. Ce\(F\) tableau contient des valeurs pour différents niveaux de signification allant de 0,1 à 0,001 désignés par « p » dans la première colonne. Pour trouver la valeur critique, choisissez le seuil de signification souhaité et suivez les étapes suivantes pour trouver la valeur critique à l'intersection des deux différents degrés de liberté. La\(F\) distribution possède deux degrés de liberté différents, l'un associé au numérateur et l'autre associé au dénominateur,\(_{df2}\) et pour compliquer les choses, la\(F\) distribution n'est pas symétrique et change le degré d'asymétrie à mesure que les degrés de liberté changent.\(_{df1}\) Les degrés de liberté dans le numérateur sont\(n_1-1\), où\(n_1\) est la taille de l'échantillon pour le groupe 1, et les degrés de liberté dans le dénominateur sont\(n_2-1\), où\(n_2\) est la taille de l'échantillon pour le groupe 2. \(F_{\alpha,df1,df2}\)donnera la valeur critique à l'extrémité supérieure de la\(F\) distribution.

    Pour trouver la valeur critique correspondant à l'extrémité inférieure de la distribution, inversez les degrés de liberté et divisez la\(F\) valeur -du tableau en une seule.

    • Valeur critique supérieure de la queue :\(F_{\alpha,df1,df2}\)
    • Valeur critique inférieure de la queue :\(1/F_{\alpha,df2,df1}\)

    Lorsque la valeur calculée de\(F\) se situe entre les valeurs critiques et non pas dans la queue, nous ne pouvons pas rejeter l'hypothèse nulle selon laquelle les deux variances provenaient d'une population présentant la même variance. Si la valeur F calculée se situe dans l'une ou l'autre des extrémités, nous ne pouvons pas accepter l'hypothèse nulle comme nous l'avons fait pour tous les tests d'hypothèse précédents.

    Une autre méthode de recherche des valeurs critiques de la\(F\) distribution facilite l'utilisation de la\(F\) table. Nous notons dans le\(F\) tableau que toutes les valeurs de\(F\) sont supérieures à un, donc la\(F\) valeur critique pour la queue gauche sera toujours inférieure à un, car pour trouver la valeur critique sur la queue gauche, nous divisons une\(F\) valeur par le chiffre un, comme indiqué ci-dessus. Nous remarquons également que si la variance de l'échantillon dans le numérateur de la statistique de test est supérieure à la variance de l'échantillon dans le dénominateur, la\(F\) valeur résultante sera supérieure à un. La méthode abrégée de ce test consiste donc à s'assurer que la plus grande des deux variances de l'échantillon est placée dans le numérateur pour calculer la statistique du test. Cela signifie que seule la valeur critique de la queue droite devra être trouvée dans la\(F\) table.

    Exemple 12.1

    Deux professeurs d'université souhaitent savoir s'il existe ou non des variations dans la façon dont ils évaluent les examens de mathématiques. Ils évaluent chacun la même série de 10 examens. Les notes du premier instructeur présentent un écart de 52,3. Les notes du deuxième professeur présentent un écart de 89,9. Testez l'affirmation selon laquelle la variance du premier instructeur est plus faible. (Dans la plupart des collèges, il est souhaitable que les écarts entre les notes des examens soient à peu près les mêmes entre les professeurs.) Le niveau de signification est de 10 %.

    Réponse

    Solution 12.1

    Soit 1 et 2 les indices qui indiquent le premier et le deuxième instructeur, respectivement.

    \(n_1 = n_2 = 10\).

    \(H_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\)et\(H_{a} : \sigma_{1}^{2}<\sigma_{2}^{2}\)

    Calculez la statistique du test : selon l'hypothèse nulle (\(\sigma_{1}^{2} \geq \sigma_{2}^{2}\)), la\(F\) statistique est la suivante :

    \(F_{c}=\frac{s_{2}^{2}}{s_{1}^{2}}=\frac{89.9}{52.3}=1.719\)

    Valeur critique pour le test :\(F_{9,9}=5.35\)\(n_1 – 1 = 9\) et\(n_2 – 1 = 9\).

    Ce graphique montre une courbe de distribution F non symétrique. La courbe est légèrement inclinée vers la droite, mais elle est à peu près normale. La valeur 0,5818 est indiquée sur l'axe vertical à droite du pic de la courbe. Une ligne verticale ascendante s'étend de 0,5818 jusqu'à la courbe et la zone située à gauche de cette ligne est ombrée pour représenter la valeur de p.
    Graphique 12.2

    Prenez une décision : étant donné que la\(F\) valeur calculée n'est pas dans la queue, nous ne pouvons pas la rejeter\(H_0\).

    Conclusion : Avec un seuil de signification de 10 %, les données ne permettent pas de conclure que la variance des notes du premier instructeur est plus faible.

    Exercice 12.1

    La New York Choral Society divise les chanteurs masculins en quatre catégories, des voix les plus hautes aux plus graves : Tenor1, Tenor2, Bass1, Bass2. Le tableau indique la taille des hommes des groupes Tenor1 et Bass2. On soupçonne que les hommes de grande taille auront une voix plus basse et que la variation de taille peut également augmenter avec les voix plus basses. Avons-nous de bonnes preuves que la variance des hauteurs des chanteurs de chacun de ces deux groupes (Tenor1 et Bass2) est différente ?

    Ténor 1 Basse 2 Ténor 1 Basse 2 Ténor 1 Basse 2
    69 72 67 72 68 67
    72 75 70 74 67 70
    71 67 65 70 64 70
    66 75 72 66 69
    76 74 70 68 72
    74 72 68 75 71
    71 72 64 68 74
    66 74 73 70 75
    68 72 66 72
    Tableau 12.2