Skip to main content
Global

9.2 : Les résultats et les erreurs de type I et de type II

  • Page ID
    191785
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Lorsque vous effectuez un test d'hypothèse, quatre résultats sont possibles en fonction de la véracité (ou de la fausseté) réelle de l'hypothèse nulle\(H_0\) et de la décision de la rejeter ou non. Les résultats sont résumés dans le tableau suivant :

    Tableau 9.2
    \(\textbf{Statistical Decision}\) \(\bf{H_0} \textbf{ is actually...}\)
    \ (\ textbf {Décision statistique} \) » style="vertical-align:middle ; "> \ (\ bf {H_0} \ textbf {est en fait...} \) » style="vertical-align:middle ; « > Vrai Faux
    \ (\ textbf {Décision statistique} \) » style="vertical-align:middle ; ">Impossible d'accepter\(H_0\) \ (\ bf {H_0} \ textbf {est en fait...} \) » style="vertical-align:middle ; « >Erreur de type I Résultat correct
    \ (\ textbf {Décision statistique} \) » style="vertical-align:middle ; ">Impossible de rejeter\(H_0\) \ (\ bf {H_0} \ textbf {est en fait...} \) » style="vertical-align:middle ; « >Résultat correct Erreur de type II

    Les quatre résultats possibles présentés dans le tableau sont les suivants :

    1. La décision ne peut pas être rejetée\(\bf{H_0}\) lorsqu'elle\(\bf{H_0}\) est vraie (décision correcte).
    2. La décision ne peut pas être acceptée\(\bf{H_0}\) lorsqu'elle\(\bf{H_0}\) est vraie (décision incorrecte connue sous le nom d'erreur de type I). Ce cas est décrit comme « le rejet d'une bonne valeur nulle ». Comme nous le verrons plus loin, c'est contre ce type d'erreur que nous allons nous prémunir en fixant la probabilité de commettre une telle erreur. L'objectif est de NE PAS entreprendre une action qui constitue une erreur.
    3. La décision ne peut pas être rejetée\(\bf{H_0}\) alors qu'elle\(\bf{H_0}\) est en fait fausse (décision incorrecte connue sous le nom d'erreur de type II). C'est ce que l'on appelle « accepter un faux nul ». Dans cette situation, vous avez laissé le statu quo rester en vigueur alors qu'il devait être renversé. Comme nous le verrons, l'hypothèse nulle a l'avantage de concurrencer l'alternative.
    4. La décision ne peut pas être acceptée\(\bf{H_0}\) lorsqu'elle\(\bf{H_0}\) est fausse (décision correcte).

    Chacune des erreurs se produit avec une probabilité particulière. Les lettres grecques\(\alpha\) et\(\beta\) représentent les probabilités.

    • \(\alpha\)= probabilité d'une erreur de type I =\(\bf{P}\) (erreur de type I) = probabilité de rejeter l'hypothèse nulle lorsque l'hypothèse nulle est vraie : rejet d'une bonne valeur nulle.
    • \(\beta\)= probabilité d'une erreur de type II =\(\bf{P}\) (erreur de type II) = probabilité de ne pas rejeter l'hypothèse nulle lorsque l'hypothèse nulle est fausse. (\(1 − \beta\)) s'appelle le pouvoir du test.

    \(\alpha\)et\(\beta\) devraient être aussi faibles que possible parce qu'il s'agit de probabilités d'erreurs.

    Les statistiques nous permettent de définir la probabilité que nous commettions une erreur de type I. La probabilité de commettre une erreur de type I est de\(\alpha\). Rappelons que les intervalles de confiance de la dernière unité étaient définis en choisissant une valeur appelée\(Z_{\alpha}\) (ou\(t_{\alpha}\)) et que la valeur alpha déterminait le niveau de confiance de l'estimation, car il s'agissait de la probabilité que l'intervalle ne saisisse pas la moyenne réelle (ou le paramètre de proportion\(p\)). Cet alpha et celui-ci sont identiques.

    La figure suivante est la façon la plus simple de voir la relation entre l'erreur alpha et le niveau de confiance.

    Graphique 9.2

    Au centre de la figure 9.2 se trouve une distribution d'échantillonnage normalement distribuée\(H_0\). Il s'agit d'une distribution d'échantillonnage de\(\overline X\) et selon le théorème de la limite centrale, elle est normalement distribuée. La distribution au centre est marquée\(H_0\) et représente la distribution des hypothèses nulles\(H_0\) :\(\mu = 100\). Il s'agit de la valeur qui est testée. Les énoncés formels des hypothèses nulles et alternatives sont listés sous la figure.

    Les distributions de chaque côté de la\(H_0\) distribution représentent des distributions qui seraient vraies si\(H_0\) elles étaient fausses, selon l'hypothèse alternative répertoriée sous la forme Ha. Nous ne savons pas ce qui est vrai et nous ne le saurons jamais. Il existe en fait un nombre infini de distributions à partir desquelles les données auraient pu être extraites si Ha est vrai, mais seules deux d'entre elles se trouvent sur la Figure 9.2 et représentent toutes les autres.

    Pour vérifier une hypothèse, nous prélevons un échantillon de la population et déterminons si elle pourrait provenir de la distribution hypothétisée avec un niveau de signification acceptable. Ce niveau de signification est l'erreur alpha et est indiqué sur la Figure 9.2 sous la forme de zones ombrées à chaque extrémité de la\(H_0\) distribution. (Chaque zone est en fait \ alpha/2 car la distribution est symétrique et l'hypothèse alternative permet la possibilité que la valeur soit supérieure ou inférieure à la valeur hypothétisée, ce que l'on appelle un test bilatéral).

    Si la moyenne de l'échantillon\(\overline{X}_{1}\) est marquée comme se trouve à la fin de la distribution de\(H_0\), nous concluons que la probabilité qu'elle puisse provenir de la\(H_0\) distribution est inférieure à alpha. Nous déclarons donc que « l'hypothèse nulle ne peut être acceptée avec un niveau de signification (\ alpha) ». La vérité est peut-être que cela est\(\overline{X}_{1}\) venu de la\(H_0\) distribution, mais de la queue. Si tel est le cas, nous avons faussement rejeté une véritable hypothèse nulle et avons commis une erreur de type I. Ce que les statistiques ont fait, c'est fournir une estimation de ce que nous savons et de ce que nous contrôlons, c'est-à-dire la probabilité que nous nous trompions\(\alpha\).

    Nous pouvons également voir sur la Figure 9.2 que la moyenne de l'échantillon peut réellement provenir d'une distribution Ha, mais à l'intérieur de la limite définie par le niveau alpha. Un tel boîtier est marqué comme\(\overline{X}_{2}\). Il y a une probabilité que cela\(\overline{X}_{2}\) provienne réellement de Ha mais qu'il apparaisse dans la plage\(H_0\) comprise entre les deux queues. Cette probabilité est l'erreur bêta, la probabilité d'accepter un faux nul.

    Notre problème est que nous ne pouvons définir l'erreur alpha que parce qu'il existe un nombre infini de distributions alternatives dont la moyenne aurait pu provenir qui ne sont pas égales à\(H_0\). Par conséquent, le statisticien place la charge de la preuve sur l'hypothèse alternative. En d'autres termes, nous ne rejetterons pas une hypothèse nulle à moins qu'il n'y ait une probabilité supérieure à 90, 95, voire 99 pour cent que la valeur nulle soit fausse : la charge de la preuve incombe à l'hypothèse alternative. C'est pourquoi nous avons appelé cela la tyrannie du statu quo tout à l'heure.

    À titre d'exemple, le système judiciaire américain part du concept selon lequel un accusé est « présumé innocent ». Il s'agit du statu quo et de l'hypothèse nulle. Le juge indiquera au jury qu'il ne peut pas déclarer l'accusé coupable à moins que les preuves n'indiquent sa culpabilité hors de tout « doute raisonnable », ce qui est généralement défini dans les affaires pénales comme une certitude de culpabilité à 95 %. Si le jury ne peut pas accepter la nullité et l'innocence, alors des mesures seront prises, une peine de prison. La charge de la preuve repose toujours sur l'hypothèse alternative. (Dans les affaires civiles, il suffit que le jury soit certain à plus de 50 % d'actes répréhensibles pour conclure à la culpabilité, ce que l'on appelle « la prépondérance de la preuve »).

    L'exemple ci-dessus était destiné à tester une moyenne, mais la même logique s'applique aux tests d'hypothèses pour tous les paramètres statistiques que l'on peut souhaiter tester.

    Voici des exemples d'erreurs de type I et de type II.

    Exemple 9.4

    Supposons que l'hypothèse nulle soit la suivante : l'équipement d'escalade de Frank est sûr.\(H_0\)

    Erreur de type I : Frank pense que son équipement d'escalade n'est peut-être pas sûr alors qu'en fait, il l'est vraiment.

    Erreur de type II : Frank pense que son équipement d'escalade peut être sûr alors qu'en fait, il ne l'est pas.

    \(\bf{\alpha =}\)probabilité que Frank pense que son équipement d'escalade ne soit pas sûr alors qu'en fait, il l'est vraiment. \(\bf{\beta =}\)probabilité que Frank pense que son équipement d'escalade peut être sûr alors qu'en fait, il ne l'est pas.

    Notez que, dans ce cas, l'erreur ayant la plus grande conséquence est l'erreur de type II. (Si Frank pense que son équipement d'escalade est sûr, il s'en servira.)

    Il s'agit d'une situation décrite comme « l'acceptation d'un faux nul ».

    Exemple 9.5

    Supposons que l'hypothèse nulle soit : La victime d'un accident de voiture est vivante lorsqu'elle arrive aux urgences d'un hôpital.\(H_0\) C'est le statu quo et aucune action n'est requise si c'est vrai. Si l'hypothèse nulle ne peut être acceptée, des mesures sont nécessaires et l'hôpital entamera les procédures appropriées.

    Erreur de type I : l'équipe d'urgence pense que la victime est morte alors qu'elle est en vie. Erreur de type II : L'équipe de secours ne sait pas si la victime est en vie alors qu'en fait, elle est décédée.

    \(\bf{\alpha =}\)probabilité que l'équipe d'urgence pense que la victime est morte alors qu'elle est réellement en vie = P (erreur de type I). \(\bf{\beta =}\)probabilité que l'équipe d'urgence ne sache pas si la victime est en vie alors que, en fait, la victime est décédée = P (erreur de type II).

    L'erreur qui a la plus grande conséquence est l'erreur de type I. (Si l'équipe d'urgence pense que la victime est morte, elle ne la soignera pas.)

    Exercice 9.5

    Supposons que l'hypothèse nulle soit : un patient n'est pas malade.\(H_0\) Quel type d'erreur a la plus grande conséquence, de type I ou de type II ?

    Exemple 9.6

    Boy Genetic Labs prétend être en mesure d'augmenter la probabilité qu'une grossesse entraîne la naissance d'un garçon. Les statisticiens veulent tester cette affirmation. Supposons que l'hypothèse nulle soit : It's a Boy Genetic Labs n'a aucun effet sur les résultats sexospécifiques.\(H_0\) Le statu quo est que cette affirmation est fausse. La charge de la preuve incombe toujours à la personne qui fait la demande, en l'occurrence le laboratoire de génétique.

    Erreur de type I : cela se produit lorsqu'une véritable hypothèse nulle est rejetée. Dans le contexte de ce scénario, nous affirmons que nous pensons que It's a Boy Genetic Labs influence les résultats sexospécifiques, alors qu'en fait, cela n'a aucun effet. La probabilité que cette erreur se produise est indiquée par la lettre grecque alpha, \ alpha.

    Erreur de type II : Cela se produit lorsque nous ne rejetons pas une fausse hypothèse nulle. Dans le contexte, nous affirmons que It's a Boy Genetic Labs n'influence pas l'issue sexuelle d'une grossesse alors que c'est le cas. La probabilité que cette erreur se produise est indiquée par la lettre grecque beta, \ beta.

    L'erreur la plus grave serait l'erreur de type I puisque les couples utiliseraient le produit It's a Boy Genetic Labs dans l'espoir d'augmenter leurs chances d'avoir un garçon.

    Exercice 9.6

    La « marée rouge » est une prolifération d'algues toxiques, quelques espèces différentes d'une classe de plancton appelée dinoflagellés. Lorsque les conditions météorologiques et aquatiques sont à l'origine de ces efflorescences, les crustacés tels que les palourdes vivant dans la région développent des niveaux dangereux d'une toxine provoquant la paralysie. Dans le Massachusetts, la Division of Marine Fisheries (DMF) surveille les niveaux de toxine dans les mollusques et crustacés en prélevant régulièrement des échantillons de mollusques le long du littoral. Si le niveau moyen de toxine dans les palourdes dépasse 800 μg (microgrammes) de toxine par kg de chair de palourde dans n'importe quelle zone, la récolte des palourdes y est interdite jusqu'à la fin de la floraison et que les niveaux de toxine dans les palourdes diminuent. Décrivez à la fois une erreur de type I et une erreur de type II dans ce contexte, et indiquez quelle erreur a la plus grande conséquence.

    Exemple 9.7

    Un certain médicament expérimental affirme un taux de guérison d'au moins 75 % chez les hommes atteints d'un cancer de la prostate. Décrivez les erreurs de type I et de type II dans leur contexte. Quelle erreur est la plus grave ?

    Type I : Un patient atteint d'un cancer estime que le taux de guérison du médicament est inférieur à 75 % alors qu'il est réellement d'au moins 75 %.

    Type II : Un patient atteint d'un cancer croit que le médicament expérimental a un taux de guérison d'au moins 75 % lorsqu'il est inférieur à 75 %.

    Dans ce scénario, c'est l'erreur de type II qui a la conséquence la plus grave. Si un patient pense que le médicament agit au moins 75 % du temps, cela aura probablement une influence sur le choix du patient (et du médecin) quant à l'utilisation du médicament comme option thérapeutique.