10.4: مقارنة نسبتين سكانيتين مستقلتين
- Page ID
- 198858
عند إجراء اختبار فرضية يقارن نسبتين سكانيتين مستقلتين، يجب أن تكون الخصائص التالية موجودة:
- العينتان المستقلتان عبارة عن عينات عشوائية مستقلة.
- عدد النجاحات هو خمسة على الأقل، وعدد حالات الفشل خمسة على الأقل، لكل عينة.
- تشير الأدبيات المتزايدة إلى أن عدد السكان يجب أن يكون على الأقل عشرة أو ربما 20 مرة من حجم العينة. هذا يمنع كل مجموعة من السكان من الإفراط في أخذ العينات والتسبب في نتائج متحيزة.
ومن الشائع مقارنة نسبتين، مثل مقارنة وسيلتين. في حالة اختلاف نسبتين تقديريتين، فقد يكون ذلك بسبب اختلاف في عدد السكان أو قد يكون بسبب الصدفة في أخذ العينات. يمكن أن يساعد اختبار الفرضيات في تحديد ما إذا كان الاختلاف في النسب المقدرة يعكس اختلافًا في النسبتين السكانيتين.
كما هو الحال في حالة الاختلافات في وسائل العينة، نقوم بإنشاء توزيع العينات للاختلافات في نسب العينات:\(\left(p_{A}^{\prime}-p_{B}^{\prime}\right)\) أين\(p_{A}^{\prime}=X_{\frac{A}{n_{A}}}\)\(p_{B}^{\prime}=X_{\frac{B}{n_{B}}}\) هي نسب العينة لمجموعتي البيانات المعنية. \(X_A\)\(X_B\)وهي عدد النجاحات في كل مجموعة عينات على التوالي،\(n_A\) وأحجام\(n_B\) العينات ذات الصلة من المجموعتين. مرة أخرى نذهب إلى الشكل المركزي\(\PageIndex{5}\).
بشكل عام، تسمح فرضية الصفر باختبار اختلاف قيمة معينة\(\delta_{0}\)، تمامًا كما فعلنا في حالة الاختلافات في الوسائل.
\[H_{0} : p_{1}-p_{2}=\delta_{0}\nonumber\]
\[H_{1} : p_{1}-p_{2} \neq \delta_{0}\nonumber\]
ومع ذلك، فإن الأكثر شيوعًا هو اختبار أن النسبتين متماثلتان. وهذا هو،
\[H_{0} : p_{\mathrm{A}}=p_{B}\nonumber\]
\[H_{a} : p_{\mathrm{A}} \neq p_{B}\nonumber\]
لإجراء الاختبار، نستخدم نسبة مجمعة،\(p_c\).
\[\textbf{The pooled proportion is calculated as follows:}\nonumber\]
\[p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}\nonumber\]
\[\textbf{The test statistic (z-score) is:}\nonumber\]
\[Z_{c}=\frac{\left(p_{A}^{\prime}-p_{B}^{\prime}\right)-\delta_{0}}{\sqrt{p_{c}\left(1-p_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}}\nonumber\]
أين\(\delta_{0}\) توجد الاختلافات المفترضة بين النسبتين و p c هو التباين المجمع من الصيغة أعلاه.
مثال\(\PageIndex{6}\)
استحوذ أحد البنوك مؤخرًا على فرع جديد وبالتالي لديه عملاء في هذه المنطقة الجديدة. إنهم مهتمون بالسعر الافتراضي في منطقتهم الجديدة. إنهم يرغبون في اختبار الفرضية القائلة بأن المعدل الافتراضي يختلف عن قاعدة عملائهم الحالية. يقومون بأخذ عينات من 200 ملف في المنطقة A، وعملائهم الحاليين، ووجدوا أن 20 ملفًا قد تخلفوا عن السداد. في المنطقة B، العملاء الجدد، تُظهر عينة أخرى من 200 ملف أن 12 ملفًا قد تخلفوا عن سداد قروضهم. عند مستوى الأهمية بنسبة 10٪، هل يمكننا القول أن المعدلات الافتراضية هي نفسها أو مختلفة؟
- إجابة
-
الحل 10.6
هذا اختبار للنسب. نحن نعرف ذلك لأن المتغير العشوائي الأساسي ثنائي أو افتراضي أو غير افتراضي. علاوة على ذلك، نعلم أنه اختبار للاختلافات في النسب لأن لدينا مجموعتين من العينات، قاعدة العملاء الحالية وقاعدة العملاء المكتسبة حديثًا. دع A و B يكونان البرامج الفرعية لمجموعتي العملاء. ثم p A و p B هما النسبتان السكانيتان اللتان نرغب في اختبارهما.
متغير عشوائي:
\(P_{A}^{\prime}-P_{B}^{\prime}\)= الفرق في نسب العملاء الذين تخلفوا في المجموعتين.
\(H_{0} : p_{A}=p_{B}\)
\(H_{a} : p_{A} \neq p_{B}\)
تخبرك عبارة «فرق» أن الاختبار ذو شقين.
التوزيع للاختبار: نظرًا لأن هذا اختبار لنسبتين من السكان ذات الحدين، فإن التوزيع طبيعي:
\(p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}=\frac{20+12}{200+200}=0.08\)\(1-p_{c}=0.92\)
\(\left(p^{\prime} A-p^{\prime} B\right)=0.04\)يتبع توزيعًا طبيعيًا تقريبيًا.
النسبة المقدرة للمجموعة أ:\(p^{\prime}_{A}=\frac{x_{A}}{n_{A}}=\frac{20}{200}=0.1\)
النسبة المقدرة للمجموعة B:\(p^{\prime}_{B}=\frac{x_{B}}{n_{B}}=\frac{12}{200}=0.06\)
الفرق المقدر بين المجموعتين هو:\(p_{A}^{\prime}-p_{B}^{\prime}=0.1-0.06=0.04\).
\[Z_{c}=\frac{\left(\mathrm{P}_{A}^{\prime}-\mathrm{P}_{B}^{\prime}\right)-\delta_{0}}{P_{c}\left(1-P_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}=0.54\nonumber\]
إحصائية الاختبار المحسوبة هي .54 وليست في ذيل التوزيع.
اتخاذ قرار: نظرًا لأن إحصائية اختبار الحساب ليست في ذيل التوزيع، فلا يمكننا رفضه\(H_0\).
الخلاصة: عند مستوى الأهمية بنسبة 1٪، من بيانات العينة، لا توجد أدلة كافية لاستنتاج وجود فرق بين نسب العملاء الذين تخلفوا في المجموعتين.
التمارين\(\PageIndex{6}\)
يتم اختبار نوعين من الصمامات لتحديد ما إذا كان هناك اختلاف في تحمل الضغط. تصدع خمسة عشر من عينة عشوائية مكونة من 100 من الصمام A تحت 4500 رطل لكل بوصة مربعة. تصدع ستة من أصل عينة عشوائية مكونة من 100 من الصمام B تحت 4500 رطل لكل بوصة مربعة. اختبار بمستوى 5٪ من الأهمية.