Skip to main content
Global

11.3: اختبار جودة الملاءمة

  • Page ID
    198806
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    في هذا النوع من اختبارات الفرضيات، يمكنك تحديد ما إذا كانت البيانات «تناسب» توزيعًا معينًا أم لا. على سبيل المثال، قد تشك في أن بياناتك غير المعروفة تناسب التوزيع ذي الحدين. يمكنك استخدام اختبار مربع كاي (بمعنى أن توزيع اختبار الفرضيات هو مربع كاي) لتحديد ما إذا كان هناك توافق أم لا. يمكن كتابة الباطل والفرضيات البديلة لهذا الاختبار في جمل أو يمكن ذكرها كمعادلات أو عدم مساواة.

    إحصائية الاختبار لاختبار جودة الملاءمة هي:

    \[\sum_{k} \frac{(O-E)^{2}}{E}\nonumber\]

    حيث:

    • \(O\)= القيم المرصودة (البيانات)
    • \(E\)= القيم المتوقعة (من الناحية النظرية)
    • \(k\)= عدد خلايا البيانات أو الفئات المختلفة

    القيم المرصودة هي قيم البيانات والقيم المتوقعة هي القيم التي تتوقع الحصول عليها إذا كانت الفرضية الصفرية صحيحة. لا توجد شروط للنموذج\(\frac{(O-E)^{2}}{E}\).

    عدد درجات الحرية\(df\) = (عدد الفئات - 1).

    دائمًا ما يكون اختبار جودة الملاءمة مناسبًا. إذا لم تكن القيم المرصودة والقيم المتوقعة المقابلة قريبة من بعضها البعض، فيمكن أن تصبح إحصائية الاختبار كبيرة جدًا وستكون في الذيل الأيمن لمنحنى مربع كاي.

    ملاحظة

    يجب أن يكون عدد القيم المتوقعة داخل كل خلية خمسة على الأقل لاستخدام هذا الاختبار.

    مثال\(\PageIndex{4}\)

    يعد غياب طلاب الجامعات عن فصول الرياضيات مصدر قلق كبير لمدرسي الرياضيات لأن الغياب عن الفصل يبدو أنه يزيد من معدل الانخفاض. لنفترض أنه تم إجراء دراسة لتحديد ما إذا كان معدل تغيب الطلاب الفعلي يتبع تصور أعضاء هيئة التدريس. توقعت الكلية أن مجموعة من 100 طالب سيتغيبون عن الفصل وفقًا للجدول\(\PageIndex{1}\).

    \ (\ فهرس الصفحات {1}\) «>
    عدد حالات الغياب لكل فصل عدد الطلاب المتوقع
    0—2 50
    3-5 30
    6-8 12
    9-11 6
    12+ 2
    طاولة\(\PageIndex{1}\)

    ثم تم إجراء مسح عشوائي عبر جميع دورات الرياضيات لتحديد العدد الفعلي (الملحوظ) للغياب في الدورة. \(\PageIndex{2}\)يعرض المخطط في الجدول نتائج هذا الاستطلاع.

    \ (\ فهرس الصفحات {2}\) «>
    عدد حالات الغياب لكل فصل العدد الفعلي للطلاب
    0—2 35
    3-5 40
    6-8 20
    9-11 1
    12+ 4
    طاولة\(\PageIndex{2}\)

    حدد الفرضيات الباطلة والبديلة اللازمة لإجراء اختبار حسن الملاءمة.

    \(\bf{H_a}\): غياب الطلاب يناسب تصور أعضاء هيئة التدريس.

    الفرضية البديلة هي عكس الفرضية الصفرية.

    \(\bf{H_a}\): غياب الطلاب لا يتناسب مع تصور أعضاء هيئة التدريس.

    أ- هل يمكنك استخدام المعلومات كما تظهر في الرسوم البيانية لإجراء اختبار جودة الملاءمة؟

    إجابة

    الحل 11.4

    أ. لا. لاحظ أن عدد حالات الغياب المتوقعة لإدخال «12+» أقل من خمسة (اثنان). قم بدمج هذه المجموعة مع مجموعة «9—11" لإنشاء جداول جديدة بحيث يكون عدد الطلاب لكل إدخال خمسة على الأقل. النتائج الجديدة موجودة في الجدول\(\PageIndex{3}\) والجدول\(\PageIndex{4}\).

    \ (\ فهرس الصفحات {3}\) «>
    عدد حالات الغياب لكل فصل عدد الطلاب المتوقع
    0—2 50
    3-5 30
    6-8 12
    9+ 8

    الجدول 11.3

    \ (\ فهرس الصفحات {4}\) «>
    عدد حالات الغياب لكل فصل العدد الفعلي للطلاب
    0—2 35
    3-5 40
    6-8 20
    9+ 5
    طاولة\(\PageIndex{4}\)

    ب- ما هو عدد درجات الحرية (\(df\)

    إجابة

    الحل 11.4

    (ب) هناك أربع «خلايا» أو فئات في كل من الجداول الجديدة.

    \(d f=\text { number of cells }-1=4-1=3\)

    التمارين الرياضية\(\PageIndex{4}\)

    يحتاج مدير المصنع إلى فهم عدد المنتجات المعيبة مقابل عدد المنتجات التي يتم إنتاجها. يتم سرد عدد العيوب المتوقعة في الجدول\(\PageIndex{5}\).

    \ (\ فهرس الصفحات {5}\) «>
    الرقم الذي تم إنتاجه رقم معيب
    0—100 5
    101—200 6
    201—30 7
    301-400 8
    401-500 10
    طاولة\(\PageIndex{5}\)

    تم أخذ عينة عشوائية لتحديد العدد الفعلي للعيوب. \(\PageIndex{6}\)يوضح الجدول نتائج المسح.

    \ (\ فهرس الصفحات {6}\) «>
    الرقم الذي تم إنتاجه رقم معيب
    0—100 5
    101—200 7
    201—30 8
    301-400 9
    401-500 11
    طاولة\(\PageIndex{6}\)

    اذكر الفرضيات الباطلة والبديلة اللازمة لإجراء اختبار حسن الملاءمة، وحدد درجات الحرية.

    مثال\(\PageIndex{5}\)

    يرغب أصحاب العمل في معرفة أيام الأسبوع التي يتغيب فيها الموظفون في أسبوع عمل مدته خمسة أيام. يرغب معظم أصحاب العمل في الاعتقاد بأن الموظفين غائبون بالتساوي خلال الأسبوع. لنفترض أنه تم سؤال عينة عشوائية من 60 مديرًا في أي يوم من الأسبوع كان لديهم أكبر عدد من حالات غياب الموظفين. تم توزيع النتائج كما في الجدول\(\PageIndex{7}\). بالنسبة لمجموعة الموظفين، هل تحدث الأيام لأكبر عدد من حالات الغياب بتواتر متساوٍ خلال أسبوع عمل مدته خمسة أيام؟ اختبار بمستوى أهمية بنسبة 5٪.

    \ (\ pageIndex {7}\) يوم الأسبوع كان الموظفون غائبين للغاية «>
    الإثنين الثلاثاء الأربعاء الخميس الجمعة
    عدد الغيابات 15 12 9 9 15
    جدول\(\PageIndex{7}\) يوم الأسبوع كان الموظفون غائبين للغاية
    إجابة

    الحل 11.5

    الفرضيات الفارغة والبديلة هي:

    • \(H_0\): تحدث أيام الغياب بترددات متساوية، أي أنها تناسب توزيعًا موحدًا.
    • \(H_a\): تحدث أيام الغياب بترددات غير متساوية، أي أنها لا تتناسب مع توزيع موحد.

    إذا حدثت أيام الغياب بترددات متساوية، فمن أصل 60 يومًا غائبًا (الإجمالي في العينة:\(15 + 12 + 9 + 9 + 15 = 60\))، سيكون هناك 12 غيابًا يوم الاثنين، و 12 يوم الثلاثاء، و 12 يوم الأربعاء، و 12 يوم الخميس، و 12 يوم الجمعة. هذه الأرقام هي القيم المتوقعة (\(E\)). القيم في الجدول هي القيم أو البيانات الملاحظة (\(O\)).

    هذه المرة، قم بحساب إحصائية اختبار\ chi2 يدويًا. قم بعمل مخطط بالعناوين التالية واملأ الأعمدة:

    • القيم المتوقعة (\(E\))\((12, 12, 12, 12, 12)\)
    • القيم الملاحظة (\(O\))\((15, 12, 9, 9, 15)\)
    • \((O – E)\)
    • \((O – E)^2\)
    • \(\frac{(O-E)^{2}}{E}\)

    الآن أضف (مجموع) العمود الأخير. المبلغ هو ثلاثة. هذه هي إحصائية\(\chi^2\) الاختبار.

    إحصائيات الاختبار المحسوبة هي 3 والقيمة الحرجة\(\chi^2\) للتوزيع عند 4 درجات من الحرية ومستوى الثقة 0.05 هو 9.48. توجد هذه القيمة في\(\chi^2\) الجدول في عمود 0.05 في صف درجات الحرية 4.

    \(\text{The degrees of freedom are the number of cells }– 1 = 5 – 1 = 4\)

    بعد ذلك، أكمل رسمًا بيانيًا مثل الرسم التالي مع وضع العلامات والتظليل المناسبين. (يجب عليك تظليل الذيل الأيمن.)

    هذا هو منحنى مربع مربع مربع فارغ غير متماثل لإحصائية الاختبار لأيام الأسبوع الغائبة.

    الشكل\(\PageIndex{5}\)

    \[\bf{\chi}_{c}^{2}=\sum_{k} \frac{(O-E)^{2}}{E}=3\nonumber\]

    لا يتمثل القرار في رفض الفرضية الصفرية لأن القيمة المحسوبة لإحصائية الاختبار ليست في ذيل التوزيع.

    الخلاصة: عند مستوى الأهمية بنسبة 5٪، من بيانات العينة، لا توجد أدلة كافية لاستنتاج أن أيام الغياب لا تحدث بترددات متساوية.

    التمارين الرياضية\(\PageIndex{5}\)

    يرغب المعلمون في معرفة الليلة التي يقوم فيها طلابهم كل أسبوع بمعظم واجباتهم المدرسية. يعتقد معظم المعلمين أن الطلاب يقومون بالواجبات المنزلية بالتساوي على مدار الأسبوع. لنفترض أنه تم سؤال عينة عشوائية من 56 طالبًا في أي ليلة من الأسبوع قاموا بمعظم الواجبات المنزلية. تم توزيع النتائج كما في الجدول\(\PageIndex{8}\).

    \ (\ فهرس الصفحات {8}\) «>
    الأحد الإثنين الثلاثاء الأربعاء الخميس الجمعة يوم السبت
    عدد الطلاب 11 8 10 7 10 5 5
    طاولة\(\PageIndex{8}\)

    من بين عدد الطلاب، هل تتم الليالي لأكبر عدد من الطلاب الذين يقومون بمعظم واجباتهم المدرسية بتواتر متساوٍ خلال الأسبوع؟ ما نوع اختبار الفرضيات الذي يجب أن تستخدمه؟

    مثال\(\PageIndex{6}\)

    تشير إحدى الدراسات إلى أن عدد أجهزة التلفزيون التي تمتلكها العائلات الأمريكية يتم توزيعها (هذا هو التوزيع المحدد للسكان الأمريكيين) كما هو موضح في الجدول\(\PageIndex{9}\).

    \ (\ فهرس الصفحات {9}\) «>
    عدد التلفزيونات بالمائة
    0 10
    1 16
    2 55
    3 11
    4+ 8
    طاولة\(\PageIndex{9}\)

    يحتوي الجدول على النسب المئوية المتوقعة (\(E\)).

    أسفرت عينة عشوائية من 600 عائلة في أقصى غرب الولايات المتحدة عن البيانات في الجدول\(\PageIndex{10}\).

    \ (\ فهرس الصفحات {10}\) «>
    عدد التلفزيونات التردد
    الإجمالي = 600
    0 66
    1 119
    2 340
    3 60
    4+ 15
    طاولة\(\PageIndex{10}\)

    يحتوي الجدول على قيم التردد الملاحظة (\(O\)).

    عند مستوى الأهمية البالغ 1٪، هل يبدو أن توزيع «عدد أجهزة التلفزيون» لعائلات أقصى غرب الولايات المتحدة يختلف عن التوزيع للسكان الأمريكيين ككل؟

    إجابة

    الحل 11.6

    تطلب منك هذه المشكلة اختبار ما إذا كان توزيع العائلات في أقصى غرب الولايات المتحدة يناسب توزيع العائلات الأمريكية. يتم إجراء هذا الاختبار دائمًا بالطريقة الصحيحة.

    يحتوي الجدول الأول على النسب المئوية المتوقعة. للحصول على الترددات (E) المتوقعة، اضرب النسبة المئوية في 600. يتم عرض الترددات المتوقعة في الجدول\(\PageIndex{11}\).

    \ (\ فهرس الصفحات {11}\) «>
    عدد التلفزيونات بالمائة التردد المتوقع
    0 10 (0.10) (600) = 60
    1 16 (0.16) (600) = 96
    2 55 (0.55) (600) = 330
    3 11 (0.11) (600) = 66
    أكثر من 3 8 (0.08) (600) = 48
    طاولة\(\PageIndex{11}\)

    لذلك، الترددات المتوقعة هي 60 و 96 و 330 و 66 و 48.

    \(H_0\): توزيع «عدد أجهزة التلفزيون» للأسر في أقصى غرب الولايات المتحدة هو نفس توزيع «عدد أجهزة التلفزيون» للسكان الأمريكيين.

    \(H_a\): يختلف توزيع «عدد أجهزة التلفزيون» للأسر في أقصى غرب الولايات المتحدة عن توزيع «عدد أجهزة التلفزيون» للسكان الأمريكيين.

    التوزيع للاختبار:\(\chi_{4}^{2} \text { where } d f=(\text { the number of cells })-1=5-1=4\).

    احسب إحصائية الاختبار:\(\chi^2 = 29.65\)

    رسم بياني:

    هذا منحنى مربع كاي غير متماثل بقيم 0 و4 و29.65 مُصنَّفة على المحور الأفقي. تتزامن القيمة 4 مع ذروة المنحنى. يمتد الخط الرأسي الصاعد من 29.65 إلى المنحنى، والمنطقة الواقعة على يمين هذا الخط مظللة. المنطقة المظللة تساوي قيمة p.
    الشكل\(\PageIndex{6}\)

    يُظهر الرسم البياني لمربع CHI التوزيع ويحدد القيمة الحرجة بأربع درجات من الحرية عند مستوى 99٪ من الثقة، α = .01، 13.277. يشير الرسم البياني أيضًا إلى إحصائية اختبار مربع تشي المحسوبة البالغة 29.65. وبمقارنة إحصائية الاختبار بالقيمة الحرجة، كما فعلنا مع جميع اختبارات الفرضيات الأخرى، نصل إلى النتيجة.

    اتخاذ قرار: نظرًا لوجود إحصائية الاختبار في ذيل التوزيع، لا يمكننا قبول الفرضية الصفرية.

    هذا يعني أنك ترفض الاعتقاد بأن التوزيع للولايات الغربية البعيدة هو نفسه توزيع السكان الأمريكيين ككل.

    الخلاصة: عند مستوى الأهمية البالغ 1٪، من البيانات، هناك أدلة كافية لاستنتاج أن توزيع «عدد أجهزة التلفزيون» في أقصى غرب الولايات المتحدة يختلف عن توزيع «عدد أجهزة التلفزيون» للسكان الأمريكيين ككل.

    التمارين الرياضية\(\PageIndex{6}\)

    يتم توزيع النسبة المئوية المتوقعة من عدد الحيوانات الأليفة التي يمتلكها الطلاب في منازلهم (هذا هو التوزيع المعطى للطلاب في الولايات المتحدة) كما هو موضح في الجدول\(\PageIndex{12}\).

    \ (\ فهرس الصفحات {12}\) «>
    عدد الحيوانات الأليفة بالمائة
    0 18
    1 25
    2 30
    3 18
    4+ 9
    طاولة\(\PageIndex{12}\)

    أسفرت عينة عشوائية من 1000 طالب من شرق الولايات المتحدة عن البيانات في الجدول\(\PageIndex{13}\).

    \ (\ فهرس الصفحات {13}\) «>
    عدد الحيوانات الأليفة التردد
    0 210
    1 240
    2 320
    3 140
    4+ 90
    طاولة\(\PageIndex{13}\)

    عند مستوى الأهمية البالغ 1٪، هل يبدو أن توزيع «عدد الحيوانات الأليفة» للطلاب في شرق الولايات المتحدة يختلف عن التوزيع الخاص بطلاب الولايات المتحدة ككل؟

    مثال\(\PageIndex{7}\)

    لنفترض أنك قلبت عملتين 100 مرة. النتائج هي\(20 HH, 27 HT, 30 TH\)، و\(23 TT\). هل العملات عادلة؟ اختبار بمستوى أهمية بنسبة 5٪.

    إجابة

    الحل 11.7

    يمكن إعداد هذه المشكلة كمشكلة تتعلق بحسن الملاءمة. مساحة العينة لقلب عملتين عادلتين هي\(\{HH, HT, TH, TT\}\). من أصل 100 تقلب، تتوقع 25\(HH, 25 HT, 25 TH\)، و\(25 TT\). هذا هو التوزيع المتوقع من التوزيع الاحتمالي ذي الحدين. السؤال «هل العملات عادلة؟» هو نفس القول: «هل\((20 HH, 27 HT, 30 TH, 23 TT)\) يتناسب توزيع العملات مع التوزيع المتوقع؟»

    المتغير العشوائي:\(X\) Let = عدد الرؤوس في قلب واحد من العملتين. يأخذ X القيم 0، 1، 2. (هناك 0 أو 1 أو 2 رأس في قلب عملتين.) لذلك، عدد الخلايا هو ثلاثة. نظرًا لأن\(X\) = عدد الرؤوس، فإن الترددات المرصودة هي 20 (لرأسين) و 57 (لرأس واحد) و 23 (للرؤوس الصفرية أو كلا الذيلان). الترددات المتوقعة هي 25 (لرأسين) و 50 (لرأس واحد) و 25 (للرؤوس الصفرية أو كلا الذيلين). تم إجراء هذا الاختبار بالطريقة الصحيحة.

    \(\bf{H_0}\): العملات المعدنية عادلة.

    \(\bf{H_a}\): العملات ليست عادلة.

    التوزيع للاختبار:\(\chi_2^2\) أين\(df = 3 – 1 = 2\).

    احسب إحصائية الاختبار:\(\chi^2 = 2.14\).

    رسم بياني:

    هذا هو منحنى مربع كاي غير متماثل بقيم 0 و2.14 مُصنَّفة على المحور الأفقي. يمتد الخط الرأسي الصاعد من 2.14 إلى المنحنى والمنطقة الموجودة على يمين هذا الخط مظللة. المنطقة المظللة تساوي قيمة p.
    الشكل\(\PageIndex{7}\)

    يُظهر الرسم البياني لمربع CHI التوزيع ويحدد القيمة الحرجة بدرجتين من الحرية عند مستوى 95٪ من الثقة\(\alpha = 0.05\)، 5.991. يشير الرسم البياني أيضًا إلى إحصائية\(\chi^2\) الاختبار المحسوبة لـ 2.14. وبمقارنة إحصائية الاختبار بالقيمة الحرجة، كما فعلنا مع جميع اختبارات الفرضيات الأخرى، نصل إلى النتيجة.

    الخلاصة: لا توجد أدلة كافية لاستنتاج أن العملات ليست عادلة: لا يمكننا رفض الفرضية الباطلة بأن العملات عادلة.