Skip to main content
Global

10.4 : Comparaison de deux proportions de population indépendantes

  • Page ID
    191571
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Lors d'un test d'hypothèse qui compare deux proportions de population indépendantes, les caractéristiques suivantes doivent être présentes :

    1. Les deux échantillons indépendants sont des échantillons aléatoires indépendants.
    2. Le nombre de réussites est d'au moins cinq, et le nombre d'échecs est d'au moins cinq, pour chacun des échantillons.
    3. De plus en plus de publications indiquent que la taille de la population doit être au moins dix, voire 20 fois supérieure à celle de l'échantillon. Cela permet d'éviter que chaque population soit suréchantillonnée et que les résultats soient biaisés.

    La comparaison de deux proportions, comme la comparaison de deux moyennes, est courante. Si deux proportions estimées sont différentes, cela peut être dû à une différence entre les populations ou au hasard de l'échantillonnage. Un test d'hypothèse peut aider à déterminer si une différence entre les proportions estimées reflète une différence entre les deux proportions de la population.

    Comme dans le cas des différences de moyennes d'échantillons, nous établissons une distribution d'échantillonnage pour les différences dans les proportions d'échantillons :\(\left(p_{A}^{\prime}-p_{B}^{\prime}\right)\)\(p_{A}^{\prime}=X_{\frac{A}{n_{A}}}\) et\(p_{B}^{\prime}=X_{\frac{B}{n_{B}}}\) sont les proportions d'échantillons pour les deux ensembles de données en question. \(X_A\)et\(X_B\) sont le nombre de succès dans chaque groupe échantillon respectivement, et\(n_A\) et\(n_B\) sont les tailles d'échantillon respectives des deux groupes. Encore une fois, nous passons à la figure centrale\(\PageIndex{5}\).

    Figurine\(\PageIndex{5}\)

    En général, l'hypothèse nulle permet de tester une différence d'une valeur particulière\(\delta_{0}\), tout comme nous l'avons fait pour les différences de moyennes.

    \[H_{0} : p_{1}-p_{2}=\delta_{0}\nonumber\]

    \[H_{1} : p_{1}-p_{2} \neq \delta_{0}\nonumber\]

    Le plus courant, cependant, est le test selon lequel les deux proportions sont identiques. C'est-à-dire

    \[H_{0} : p_{\mathrm{A}}=p_{B}\nonumber\]

    \[H_{a} : p_{\mathrm{A}} \neq p_{B}\nonumber\]

    Pour effectuer le test, nous utilisons une proportion groupée,\(p_c\).

    \[\textbf{The pooled proportion is calculated as follows:}\nonumber\]

    \[p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}\nonumber\]

    \[\textbf{The test statistic (z-score) is:}\nonumber\]

    \[Z_{c}=\frac{\left(p_{A}^{\prime}-p_{B}^{\prime}\right)-\delta_{0}}{\sqrt{p_{c}\left(1-p_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}}\nonumber\]

    \(\delta_{0}\) est la différence hypothétisée entre les deux proportions et p c est la variance regroupée à partir de la formule ci-dessus.

    Exemple\(\PageIndex{6}\)

    Une banque a récemment acquis une nouvelle agence et a donc des clients sur ce nouveau territoire. Ils s'intéressent au taux de défaut sur leur nouveau territoire. Ils souhaitent tester l'hypothèse selon laquelle le taux de défaut est différent de leur clientèle actuelle. Ils échantillonnent 200 fichiers dans la zone A, leurs clients actuels, et constatent que 20 d'entre eux sont défaillants. Dans la zone B, les nouveaux clients, un autre échantillon de 200 dossiers montre que 12 n'ont pas remboursé leurs prêts. À un seuil de signification de 10 %, pouvons-nous dire que les taux de défaut sont identiques ou différents ?

    Réponse

    Solution 10.6

    Il s'agit d'un test de proportions. Nous le savons parce que la variable aléatoire sous-jacente est binaire, par défaut ou non par défaut. De plus, nous savons qu'il s'agit d'un test des différences de proportions, car nous avons deux groupes d'échantillons, la clientèle actuelle et la clientèle nouvellement acquise. Soit A et B les indices des deux groupes de clients. Alors p A et p B sont les deux proportions de population que nous souhaitons tester.

    Variable aléatoire :

    \(P_{A}^{\prime}-P_{B}^{\prime}\)= différence entre les proportions de clients en défaut de paiement dans les deux groupes.

    \(H_{0} : p_{A}=p_{B}\)

    \(H_{a} : p_{A} \neq p_{B}\)

    Les mots « fait une différence » vous indiquent que le test est bilatéral.

    Distribution pour le test : Comme il s'agit d'un test de deux proportions binomiales de population, la distribution est normale :

    \(p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}=\frac{20+12}{200+200}=0.08\)\(1-p_{c}=0.92\)

    \(\left(p^{\prime} A-p^{\prime} B\right)=0.04\)suit une distribution normale approximative.

    Proportion estimée pour le groupe A :\(p^{\prime}_{A}=\frac{x_{A}}{n_{A}}=\frac{20}{200}=0.1\)

    Proportion estimée pour le groupe B :\(p^{\prime}_{B}=\frac{x_{B}}{n_{B}}=\frac{12}{200}=0.06\)

    La différence estimée entre les deux groupes est :\(p_{A}^{\prime}-p_{B}^{\prime}=0.1-0.06=0.04\).

    Courbe de distribution normale de la différence entre les pourcentages de patients adultes qui ne réagissent pas aux médicaments A et B après 30 minutes. La moyenne est égale à zéro et les valeurs -0,04, 0 et 0,04 sont étiquetées sur l'axe horizontal. Deux lignes verticales s'étendent de -0,04 et 0,04 jusqu'à la courbe. La région à gauche de -0,04 et la région à droite de 0,04 sont chacune ombrées pour représenter 1/2 (valeur de p) = 0,0702.

    Figurine\(\PageIndex{6}\)

    \[Z_{c}=\frac{\left(\mathrm{P}_{A}^{\prime}-\mathrm{P}_{B}^{\prime}\right)-\delta_{0}}{P_{c}\left(1-P_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}=0.54\nonumber\]

    La statistique de test calculée est de 0,54 et ne se situe pas à la fin de la distribution.

    Prenez une décision : étant donné que la statistique du test de calcul ne se trouve pas à la fin de la distribution, nous ne pouvons pas la rejeter\(H_0\).

    Conclusion : À un seuil de signification de 1 %, les données de l'échantillon ne permettent pas de conclure à une différence entre les proportions de clients en défaut de paiement dans les deux groupes.

    Exercice\(\PageIndex{6}\)

    Deux types de soupapes sont testés pour déterminer s'il existe une différence dans les tolérances de pression. Quinze des 100 échantillons prélevés au hasard sur la valve A se sont fissurés à une pression inférieure à 4 500 psi. Six d'un échantillon aléatoire de 100 de la vanne B se sont fissurées à moins de 4 500 psi. Test à un seuil de signification de 5 %.