Skip to main content
Global

11.4: اختبار الاستقلال

  • Page ID
    198822
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    تتضمن اختبارات الاستقلالية استخدام جدول الطوارئ للقيم (البيانات) المرصودة. تتشابه إحصائية الاختبار الخاصة باختبار الاستقلالية مع اختبار جودة الملاءمة:

    \[\sum_{(i \cdot j)} \frac{(O-E)^{2}}{E}\nonumber\]

    حيث:

    • \(O\)= القيم المرصودة
    • \(E\)= القيم المتوقعة
    • \(i\)= عدد الصفوف في الجدول
    • \(j\)= عدد الأعمدة في الجدول

    هناك\(i \cdot j\) شروط النموذج\(\frac{(O-E)^{2}}{E}\).

    يحدد اختبار الاستقلال ما إذا كان هناك عاملان مستقلان أم لا. لقد واجهت لأول مرة مصطلح الاستقلال في الجدول 3.1 سابقًا. كمراجعة، خذ بعين الاعتبار المثال التالي.

    ملاحظة

    يجب أن تكون القيمة المتوقعة داخل كل خلية خمسة على الأقل حتى تتمكن من استخدام هذا الاختبار.

    المثال 11.8

    لنفترض\(A\) = مخالفة السرعة في العام الماضي و\(B\) = مستخدم الهاتف الخلوي أثناء القيادة. إذا كان\(A\) السائق مستقلاً أم\(P(A \cap B)=P(A) P(B) . A \cap B\) لا، فهذا هو الحدث الذي تعرض فيه السائق لمخالفة السرعة العام الماضي واستخدم أيضًا هاتفًا خلويًا أثناء القيادة.\(B\) لنفترض، في دراسة للسائقين الذين تعرضوا لمخالفات السرعة في العام الماضي، والذين استخدموا الهاتف الخلوي أثناء القيادة، أنه تم مسح 755 شخصًا. من بين 755، كان هناك 70 مخالفًا للسرعة و 685 لم يفعل ذلك؛ استخدم 305 هواتف محمولة أثناء القيادة و 450 لم يفعلوا ذلك.

    Let y = العدد المتوقع للسائقين الذين استخدموا الهاتف الخلوي أثناء القيادة وتلقوا مخالفات السرعة.

    إذا كانت\(A\) مستقلة أم\(B\) لا، إذن\(P(A \cap B)=P(A) P(B)\). عن طريق الاستبدال،

    \[\frac{y}{755}=\left(\frac{70}{755}\right)\left(\frac{305}{755}\right)\nonumber\]

    حل لـ\(y\):\(y=\frac{(70)(305)}{755}=28.3\)

    من المتوقع أن يستخدم حوالي 28 شخصًا من العينة الهواتف المحمولة أثناء القيادة وأن يتلقوا مخالفات السرعة.

    في اختبار الاستقلال، نذكر الفرضيات الباطلة والبديلة بالكلمات. نظرًا لأن جدول الطوارئ يتكون من عاملين، فإن الفرضية الصفرية تنص على أن العوامل مستقلة والفرضية البديلة تنص على أنها ليست مستقلة (تابعة). إذا قمنا باختبار الاستقلالية باستخدام المثال، فإن الفرضية الصفرية هي:

    \(H_0\): يعد استخدام الهاتف الخلوي أثناء القيادة وتلقي مخالفة السرعة أحداثًا مستقلة؛ بمعنى آخر، ليس لها أي تأثير على بعضها البعض.

    إذا كانت فرضية العدم صحيحة، فإننا نتوقع أن يستخدم حوالي 28 شخصًا الهواتف المحمولة أثناء القيادة وأن يتعرضوا لمخالفة السرعة.

    يتم اختبار الاستقلالية دائمًا في الاتجاه الصحيح بسبب حساب إحصائية الاختبار. إذا لم تكن القيم المتوقعة والملاحظة قريبة من بعضها البعض، فإن إحصائية الاختبار كبيرة جدًا وتخرج في الذيل الأيمن لمنحنى مربع كاي، كما هو الحال في حالة الملاءمة الجيدة.

    عدد درجات الحرية لاختبار الاستقلال هو:

    \(d f=(\text { number of columns }-1)(\text { number of rows }-1)\)

    تقوم الصيغة التالية بحساب الرقم المتوقع (E):

    \[E=\frac{(\text { row total })(\text { column total })}{\text { total number surveyed }}\nonumber\]

    التمرين 11.8

    تم أخذ عينة من 300 طالب. من بين الطلاب الذين شملهم الاستطلاع، كان 50 طالبًا في الموسيقى، بينما لم يكن 250 طالبًا. كان سبعة وتسعون من أصل 300 شخص شملهم الاستطلاع مدرجين في قائمة الشرف، في حين لم يكن 203 مدرجين. إذا افترضنا أن كونك طالبًا في الموسيقى وكوننا في قائمة الشرف من الأحداث المستقلة، فما هو العدد المتوقع لطلاب الموسيقى المدرجين أيضًا في قائمة الشرف؟

    المثال 11.9

    توفر مجموعة تطوعية من ساعة إلى تسع ساعات كل أسبوع مع كبار السن المعاقين. يتم تجنيد البرنامج بين طلاب كليات المجتمع وطلاب الجامعات لمدة أربع سنوات وغير الطلاب. في الجدول 11.14 توجد عينة من المتطوعين البالغين وعدد الساعات التي يتطوعون بها في الأسبوع.

    يحتوي الجدول على قيم (O) الملاحظة (البيانات).
    نوع المتطوع 1-3 ساعات 4-6 ساعات 7-9 ساعات إجمالي الصفوف
    طلاب كلية المجتمع 111 96 48 255
    طلاب الجامعات لمدة أربع سنوات 96 133 61 290
    غير الطلاب 91 150 53 294
    إجمالي العمود 298 379 162 839
    الجدول 11.14 عدد ساعات العمل في الأسبوع حسب نوع المتطوعين (تمت الملاحظة)

    هل عدد ساعات التطوع مستقل عن نوع المتطوع؟

    إجابة

    الحل 11.9

    الجدول المرصود والسؤال في نهاية المشكلة، «هل عدد ساعات التطوع مستقل عن نوع المتطوع؟» أقول لكم هذا هو اختبار الاستقلال. العاملان هما عدد ساعات التطوع ونوع المتطوع. يتم إجراء هذا الاختبار دائمًا بالطريقة الصحيحة.

    \(H_0\): عدد ساعات التطوع مستقل عن نوع المتطوع.

    \(H_a\): يعتمد عدد ساعات التطوع على نوع المتطوع.

    النتيجة المتوقعة في الجدول 11.15.

    يحتوي الجدول على القيم (E) المتوقعة (البيانات).
    نوع المتطوع 1-3 ساعات 4-6 ساعات 7-9 ساعات
    طلاب كلية المجتمع 90.57 115.19 49.24
    طلاب الجامعات لمدة أربع سنوات 103.00 131.00 56.00
    غير الطلاب 104.42 132.81 56.77
    الجدول 11.15 عدد ساعات العمل في الأسبوع حسب نوع المتطوعين (متوقع)

    على سبيل المثال، حساب التردد المتوقع للخلية العلوية اليسرى هو

    \[E=\frac{(\text { row total })(\text { column total })}{\text { total number surveyed }}=\frac{(255)(298)}{839}=90.57\nonumber\]

    احسب إحصائية الاختبار:\(\chi^2 = 12.99\) (الآلة الحاسبة أو الكمبيوتر)

    التوزيع للاختبار:\(\chi_4^2\)

    \(d f=(3 \text { columns }-1)(3 \text { rows }-1)=(2)(2)=4\)

    رسم بياني:

    منحنى مربع كاي غير متماثل بقيم 0 و 12.99 على المحور السيني يمثل إحصائية الاختبار لعدد ساعات العمل من قبل متطوعين من أنواع مختلفة. يمتد الخط الرأسي التصاعدي من 12.99 إلى المنحنى والمساحة الموجودة على يمينه تساوي قيمة p.

    الشكل 11.8

    يُظهر الرسم البياني لمربع CHI التوزيع ويحدد القيمة الحرجة بأربع درجات من الحرية عند مستوى 95٪ من الثقة\(\alpha = 0.05\)، 9.488. يشير الرسم البياني أيضًا إلى إحصائية\(\chi_{c}^{2}\) الاختبار المحسوبة لـ 12.99. وبمقارنة إحصائية الاختبار بالقيمة الحرجة، كما فعلنا مع جميع اختبارات الفرضيات الأخرى، نصل إلى النتيجة.

    اتخاذ قرار: نظرًا لوجود إحصائية الاختبار المحسوبة في الذيل، لا يمكننا قبول H 0. هذا يعني أن العوامل ليست مستقلة.

    الخلاصة: عند مستوى 5٪ من الأهمية، من البيانات، هناك أدلة كافية لاستنتاج أن عدد ساعات التطوع ونوع المتطوع يعتمدان على بعضهما البعض.

    على سبيل المثال في الجدول 11.15، إذا كان هناك نوع آخر من المتطوعين، المراهقين، فماذا ستكون درجات الحرية؟

    التمرين 11.9

    يجمع مكتب إحصاءات العمل بيانات حول التوظيف في الولايات المتحدة. يتم أخذ عينة لحساب عدد المواطنين الأمريكيين الذين يعملون في أحد قطاعات الصناعة المتعددة بمرور الوقت. يوضح الجدول 11.16 النتائج:

    قطاع الصناعة 2000 2010 2020 الإجمالي
    الأجر والراتب غير الزراعي 13,243 13,044 15,018 41,305
    إنتاج السلع، باستثناء الزراعة 2,457 1,771 1,950 6,178
    تقديم الخدمات 10,786 11,273 13,068 35,127
    الزراعة والغابات وصيد الأسماك والقنص 240 214 201 655
    العاملون لحسابهم الخاص غير الزراعيين والعاملين في الأسرة بدون أجر 931 894 972 2,797
    وظائف الأجور والرواتب الثانوية في الزراعة والصناعات المنزلية الخاصة 14 11 11 36
    الوظائف الثانوية كعامل مستقل أو عامل عائلي غير مدفوع الأجر 196 144 152 492
    الإجمالي 27,867 27,351 31,372 86,590
    الجدول 11-16

    نريد أن نعرف ما إذا كان التغيير في عدد الوظائف مستقلاً عن التغيير في السنوات. اذكر الفرضيات الباطلة والبديلة ودرجات الحرية.

    المثال 11.10

    تهتم كلية De Anza بالعلاقة بين مستوى القلق والحاجة إلى النجاح في المدرسة. قامت عينة عشوائية من 400 طالب بإجراء اختبار لقياس مستوى القلق والحاجة إلى النجاح في المدرسة. يوضح الجدول 11.17 النتائج. تريد De Anza College معرفة ما إذا كان مستوى القلق والحاجة إلى النجاح في المدرسة من الأحداث المستقلة.

    تحتاج إلى النجاح في المدرسة
    القلق الشديد

    القلق عند منتصف العمر

    قلق متوسط

    القلق بين المتوسط والمنخفض

    قلق منخفض
    إجمالي الصفوف
    حاجة عالية 35 42 53 15 10 155
    حاجة متوسطة 18 48 63 33 31 193
    حاجة منخفضة 4 5 11 15 17 52
    إجمالي العمود 57 95 127 63 58 400
    الجدول 11.17 الحاجة إلى النجاح في المدرسة مقابل مستوى القلق

    أ- كم عدد الطلاب الذين يعانون من ارتفاع مستوى القلق المتوقع أن تكون لديهم حاجة عالية للنجاح في المدرسة؟

    إجابة

    الحل 11.10

    أ- إجمالي العمود لمستوى القلق المرتفع هو 57. إجمالي الصف للحاجة العالية للنجاح في المدرسة هو 155. حجم العينة أو الإجمالي الذي تم مسحه هو 400.

    \[E=\frac{(\text { row total })(\text { column total })}{\text { total surveyed }}=\frac{155 \cdot 57}{400}=22.09\nonumber\]

    يبلغ العدد المتوقع من الطلاب الذين يعانون من مستوى عالٍ من القلق والحاجة العالية للنجاح في المدرسة حوالي 22 طالبًا.

    ب- إذا كان المتغيران مستقلين، فكم عدد الطلاب الذين تتوقع أن تكون حاجتهم منخفضة للنجاح في المدرسة ومستوى متوسط إلى منخفض من القلق؟

    إجابة

    الحل 11.10

    ب- إجمالي العمود الخاص بمستوى القلق المتوسط والمنخفض هو 63. إجمالي الصفوف لذوي الحاجة المنخفضة للنجاح في المدرسة هو 52. حجم العينة أو الإجمالي الذي تم مسحه هو 400.

    ج.\(E=\frac{(\text { row total })(\text { column total })}{\text { total surveyed }}=\) ________

    إجابة

    الحل 11.10

    ج.\(E=\frac{(\text { row total })(\text { column total })}{\text { total surveyed }}=8.19\)

    د- يبلغ العدد المتوقع للطلاب الذين يعانون من مستوى قلق متوسط ومنخفض وحاجتهم المنخفضة للنجاح في المدرسة حوالي ________.

    إجابة

    الحل 11.10

    د. 8