11.4: اختبار الاستقلال
- Page ID
- 198822
تتضمن اختبارات الاستقلالية استخدام جدول الطوارئ للقيم (البيانات) المرصودة. تتشابه إحصائية الاختبار الخاصة باختبار الاستقلالية مع اختبار جودة الملاءمة:
\[\sum_{(i \cdot j)} \frac{(O-E)^{2}}{E}\nonumber\]
حيث:
- \(O\)= القيم المرصودة
- \(E\)= القيم المتوقعة
- \(i\)= عدد الصفوف في الجدول
- \(j\)= عدد الأعمدة في الجدول
هناك\(i \cdot j\) شروط النموذج\(\frac{(O-E)^{2}}{E}\).
يحدد اختبار الاستقلال ما إذا كان هناك عاملان مستقلان أم لا. لقد واجهت لأول مرة مصطلح الاستقلال في الجدول 3.1 سابقًا. كمراجعة، خذ بعين الاعتبار المثال التالي.
ملاحظة
يجب أن تكون القيمة المتوقعة داخل كل خلية خمسة على الأقل حتى تتمكن من استخدام هذا الاختبار.
المثال 11.8
لنفترض\(A\) = مخالفة السرعة في العام الماضي و\(B\) = مستخدم الهاتف الخلوي أثناء القيادة. إذا كان\(A\) السائق مستقلاً أم\(P(A \cap B)=P(A) P(B) . A \cap B\) لا، فهذا هو الحدث الذي تعرض فيه السائق لمخالفة السرعة العام الماضي واستخدم أيضًا هاتفًا خلويًا أثناء القيادة.\(B\) لنفترض، في دراسة للسائقين الذين تعرضوا لمخالفات السرعة في العام الماضي، والذين استخدموا الهاتف الخلوي أثناء القيادة، أنه تم مسح 755 شخصًا. من بين 755، كان هناك 70 مخالفًا للسرعة و 685 لم يفعل ذلك؛ استخدم 305 هواتف محمولة أثناء القيادة و 450 لم يفعلوا ذلك.
Let y = العدد المتوقع للسائقين الذين استخدموا الهاتف الخلوي أثناء القيادة وتلقوا مخالفات السرعة.
إذا كانت\(A\) مستقلة أم\(B\) لا، إذن\(P(A \cap B)=P(A) P(B)\). عن طريق الاستبدال،
\[\frac{y}{755}=\left(\frac{70}{755}\right)\left(\frac{305}{755}\right)\nonumber\]
حل لـ\(y\):\(y=\frac{(70)(305)}{755}=28.3\)
من المتوقع أن يستخدم حوالي 28 شخصًا من العينة الهواتف المحمولة أثناء القيادة وأن يتلقوا مخالفات السرعة.
في اختبار الاستقلال، نذكر الفرضيات الباطلة والبديلة بالكلمات. نظرًا لأن جدول الطوارئ يتكون من عاملين، فإن الفرضية الصفرية تنص على أن العوامل مستقلة والفرضية البديلة تنص على أنها ليست مستقلة (تابعة). إذا قمنا باختبار الاستقلالية باستخدام المثال، فإن الفرضية الصفرية هي:
\(H_0\): يعد استخدام الهاتف الخلوي أثناء القيادة وتلقي مخالفة السرعة أحداثًا مستقلة؛ بمعنى آخر، ليس لها أي تأثير على بعضها البعض.
إذا كانت فرضية العدم صحيحة، فإننا نتوقع أن يستخدم حوالي 28 شخصًا الهواتف المحمولة أثناء القيادة وأن يتعرضوا لمخالفة السرعة.
يتم اختبار الاستقلالية دائمًا في الاتجاه الصحيح بسبب حساب إحصائية الاختبار. إذا لم تكن القيم المتوقعة والملاحظة قريبة من بعضها البعض، فإن إحصائية الاختبار كبيرة جدًا وتخرج في الذيل الأيمن لمنحنى مربع كاي، كما هو الحال في حالة الملاءمة الجيدة.
عدد درجات الحرية لاختبار الاستقلال هو:
\(d f=(\text { number of columns }-1)(\text { number of rows }-1)\)
تقوم الصيغة التالية بحساب الرقم المتوقع (E):
\[E=\frac{(\text { row total })(\text { column total })}{\text { total number surveyed }}\nonumber\]
التمرين 11.8
تم أخذ عينة من 300 طالب. من بين الطلاب الذين شملهم الاستطلاع، كان 50 طالبًا في الموسيقى، بينما لم يكن 250 طالبًا. كان سبعة وتسعون من أصل 300 شخص شملهم الاستطلاع مدرجين في قائمة الشرف، في حين لم يكن 203 مدرجين. إذا افترضنا أن كونك طالبًا في الموسيقى وكوننا في قائمة الشرف من الأحداث المستقلة، فما هو العدد المتوقع لطلاب الموسيقى المدرجين أيضًا في قائمة الشرف؟
المثال 11.9
توفر مجموعة تطوعية من ساعة إلى تسع ساعات كل أسبوع مع كبار السن المعاقين. يتم تجنيد البرنامج بين طلاب كليات المجتمع وطلاب الجامعات لمدة أربع سنوات وغير الطلاب. في الجدول 11.14 توجد عينة من المتطوعين البالغين وعدد الساعات التي يتطوعون بها في الأسبوع.
نوع المتطوع | 1-3 ساعات | 4-6 ساعات | 7-9 ساعات | إجمالي الصفوف |
---|---|---|---|---|
طلاب كلية المجتمع | 111 | 96 | 48 | 255 |
طلاب الجامعات لمدة أربع سنوات | 96 | 133 | 61 | 290 |
غير الطلاب | 91 | 150 | 53 | 294 |
إجمالي العمود | 298 | 379 | 162 | 839 |
هل عدد ساعات التطوع مستقل عن نوع المتطوع؟
- إجابة
-
الحل 11.9
الجدول المرصود والسؤال في نهاية المشكلة، «هل عدد ساعات التطوع مستقل عن نوع المتطوع؟» أقول لكم هذا هو اختبار الاستقلال. العاملان هما عدد ساعات التطوع ونوع المتطوع. يتم إجراء هذا الاختبار دائمًا بالطريقة الصحيحة.
\(H_0\): عدد ساعات التطوع مستقل عن نوع المتطوع.
\(H_a\): يعتمد عدد ساعات التطوع على نوع المتطوع.
النتيجة المتوقعة في الجدول 11.15.
يحتوي الجدول على القيم (E) المتوقعة (البيانات). نوع المتطوع 1-3 ساعات 4-6 ساعات 7-9 ساعات طلاب كلية المجتمع 90.57 115.19 49.24 طلاب الجامعات لمدة أربع سنوات 103.00 131.00 56.00 غير الطلاب 104.42 132.81 56.77 الجدول 11.15 عدد ساعات العمل في الأسبوع حسب نوع المتطوعين (متوقع) على سبيل المثال، حساب التردد المتوقع للخلية العلوية اليسرى هو
\[E=\frac{(\text { row total })(\text { column total })}{\text { total number surveyed }}=\frac{(255)(298)}{839}=90.57\nonumber\]
احسب إحصائية الاختبار:\(\chi^2 = 12.99\) (الآلة الحاسبة أو الكمبيوتر)
التوزيع للاختبار:\(\chi_4^2\)
\(d f=(3 \text { columns }-1)(3 \text { rows }-1)=(2)(2)=4\)
رسم بياني:
يُظهر الرسم البياني لمربع CHI التوزيع ويحدد القيمة الحرجة بأربع درجات من الحرية عند مستوى 95٪ من الثقة\(\alpha = 0.05\)، 9.488. يشير الرسم البياني أيضًا إلى إحصائية\(\chi_{c}^{2}\) الاختبار المحسوبة لـ 12.99. وبمقارنة إحصائية الاختبار بالقيمة الحرجة، كما فعلنا مع جميع اختبارات الفرضيات الأخرى، نصل إلى النتيجة.
اتخاذ قرار: نظرًا لوجود إحصائية الاختبار المحسوبة في الذيل، لا يمكننا قبول H 0. هذا يعني أن العوامل ليست مستقلة.
الخلاصة: عند مستوى 5٪ من الأهمية، من البيانات، هناك أدلة كافية لاستنتاج أن عدد ساعات التطوع ونوع المتطوع يعتمدان على بعضهما البعض.
على سبيل المثال في الجدول 11.15، إذا كان هناك نوع آخر من المتطوعين، المراهقين، فماذا ستكون درجات الحرية؟
التمرين 11.9
يجمع مكتب إحصاءات العمل بيانات حول التوظيف في الولايات المتحدة. يتم أخذ عينة لحساب عدد المواطنين الأمريكيين الذين يعملون في أحد قطاعات الصناعة المتعددة بمرور الوقت. يوضح الجدول 11.16 النتائج:
قطاع الصناعة | 2000 | 2010 | 2020 | الإجمالي |
---|---|---|---|---|
الأجر والراتب غير الزراعي | 13,243 | 13,044 | 15,018 | 41,305 |
إنتاج السلع، باستثناء الزراعة | 2,457 | 1,771 | 1,950 | 6,178 |
تقديم الخدمات | 10,786 | 11,273 | 13,068 | 35,127 |
الزراعة والغابات وصيد الأسماك والقنص | 240 | 214 | 201 | 655 |
العاملون لحسابهم الخاص غير الزراعيين والعاملين في الأسرة بدون أجر | 931 | 894 | 972 | 2,797 |
وظائف الأجور والرواتب الثانوية في الزراعة والصناعات المنزلية الخاصة | 14 | 11 | 11 | 36 |
الوظائف الثانوية كعامل مستقل أو عامل عائلي غير مدفوع الأجر | 196 | 144 | 152 | 492 |
الإجمالي | 27,867 | 27,351 | 31,372 | 86,590 |
نريد أن نعرف ما إذا كان التغيير في عدد الوظائف مستقلاً عن التغيير في السنوات. اذكر الفرضيات الباطلة والبديلة ودرجات الحرية.
المثال 11.10
تهتم كلية De Anza بالعلاقة بين مستوى القلق والحاجة إلى النجاح في المدرسة. قامت عينة عشوائية من 400 طالب بإجراء اختبار لقياس مستوى القلق والحاجة إلى النجاح في المدرسة. يوضح الجدول 11.17 النتائج. تريد De Anza College معرفة ما إذا كان مستوى القلق والحاجة إلى النجاح في المدرسة من الأحداث المستقلة.
تحتاج إلى النجاح في المدرسة | القلق الشديد |
القلق عند منتصف العمر |
قلق متوسط |
القلق بين المتوسط والمنخفض |
قلق منخفض |
إجمالي الصفوف |
---|---|---|---|---|---|---|
حاجة عالية | 35 | 42 | 53 | 15 | 10 | 155 |
حاجة متوسطة | 18 | 48 | 63 | 33 | 31 | 193 |
حاجة منخفضة | 4 | 5 | 11 | 15 | 17 | 52 |
إجمالي العمود | 57 | 95 | 127 | 63 | 58 | 400 |
أ- كم عدد الطلاب الذين يعانون من ارتفاع مستوى القلق المتوقع أن تكون لديهم حاجة عالية للنجاح في المدرسة؟
- إجابة
-
الحل 11.10
أ- إجمالي العمود لمستوى القلق المرتفع هو 57. إجمالي الصف للحاجة العالية للنجاح في المدرسة هو 155. حجم العينة أو الإجمالي الذي تم مسحه هو 400.
\[E=\frac{(\text { row total })(\text { column total })}{\text { total surveyed }}=\frac{155 \cdot 57}{400}=22.09\nonumber\]
يبلغ العدد المتوقع من الطلاب الذين يعانون من مستوى عالٍ من القلق والحاجة العالية للنجاح في المدرسة حوالي 22 طالبًا.
ب- إذا كان المتغيران مستقلين، فكم عدد الطلاب الذين تتوقع أن تكون حاجتهم منخفضة للنجاح في المدرسة ومستوى متوسط إلى منخفض من القلق؟
- إجابة
-
الحل 11.10
ب- إجمالي العمود الخاص بمستوى القلق المتوسط والمنخفض هو 63. إجمالي الصفوف لذوي الحاجة المنخفضة للنجاح في المدرسة هو 52. حجم العينة أو الإجمالي الذي تم مسحه هو 400.
ج.\(E=\frac{(\text { row total })(\text { column total })}{\text { total surveyed }}=\) ________
- إجابة
-
الحل 11.10
ج.\(E=\frac{(\text { row total })(\text { column total })}{\text { total surveyed }}=8.19\)
د- يبلغ العدد المتوقع للطلاب الذين يعانون من مستوى قلق متوسط ومنخفض وحاجتهم المنخفضة للنجاح في المدرسة حوالي ________.
- إجابة
-
الحل 11.10
د. 8