Skip to main content
Global

9.2: النتائج والأخطاء من النوع الأول والنوع الثاني

  • Page ID
    199091
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    عند إجراء اختبار الفرضية، هناك أربع نتائج محتملة اعتمادًا على الحقيقة الفعلية (أو زيف) الفرضية\(H_0\) الصفرية وقرار الرفض أم لا. يتم تلخيص النتائج في الجدول التالي:

    الجدول 9.2
    \(\textbf{Statistical Decision}\) \(\bf{H_0} \textbf{ is actually...}\)
    \ (\ textbf {القرار الإحصائي}\)» النمط = «محاذاة رأسية: متوسطة؛" > \ (\ bf {H_0}\ textbf {هو في الواقع...}\)» النمط= المحاذاة الرأسية: الوسطى؛ "> صحيح خاطئة
    \ (\ textbf {القرار الإحصائي}\)» النمط = «محاذاة رأسية: متوسطة؛" >لا يمكن القبول\(H_0\) \ (\ bf {H_0}\ textbf {هو في الواقع...}\)» النمط = محاذاة رأسية: متوسطة؛ ">خطأ من النوع الأول النتيجة الصحيحة
    \ (\ textbf {القرار الإحصائي}\)» النمط = «محاذاة رأسية: متوسطة؛" >لا يمكن الرفض\(H_0\) \ (\ bf {H_0}\ textbf {هو في الواقع...}\)» النمط = المحاذاة الرأسية: الوسطى؛ ">النتيجة الصحيحة خطأ من النوع الثاني

    النتائج الأربعة المحتملة في الجدول هي:

    1. لا يمكن رفض القرار\(\bf{H_0}\) عندما يكون\(\bf{H_0}\) صحيحًا (القرار الصحيح).
    2. لا يمكن قبول القرار\(\bf{H_0}\) عندما يكون\(\bf{H_0}\) صحيحًا (القرار غير الصحيح المعروف باسم خطأ النوع الأول). يتم وصف هذه الحالة بأنها «رفض قيمة خالية جيدة». كما سنرى لاحقًا، فإن هذا النوع من الأخطاء هو الذي سنحترس منه من خلال تحديد احتمالية ارتكاب مثل هذا الخطأ. الهدف هو عدم اتخاذ إجراء خطأ.
    3. لا يمكن رفض القرار\(\bf{H_0}\) عندما يكون في الواقع خاطئًا (القرار غير الصحيح المعروف باسم خطأ النوع الثاني).\(\bf{H_0}\) وهذا ما يسمى «قبول قيمة خالية خاطئة». في هذه الحالة، سمحت للوضع الراهن بالبقاء ساريًا عندما يجب نقضه. كما سنرى، فإن الفرضية الصفرية لها ميزة المنافسة مع البديل.
    4. لا يمكن قبول القرار\(\bf{H_0}\) عندما\(\bf{H_0}\) يكون خاطئًا (القرار الصحيح).

    يحدث كل خطأ باحتمالية معينة. الحروف اليونانية\(\alpha\)\(\beta\) وتمثل الاحتمالات.

    • \(\alpha\)= احتمال حدوث خطأ من النوع الأول =\(\bf{P}\) (خطأ من النوع الأول) = احتمال رفض فرضية الصفر عندما تكون فرضية العدم صحيحة: رفض قيمة خالية جيدة.
    • \(\beta\)= احتمال حدوث خطأ من النوع الثاني =\(\bf{P}\) (خطأ من النوع الثاني) = احتمال عدم رفض الفرضية الصفرية عندما تكون الفرضية الصفرية خاطئة. (\(1 − \beta\)) تسمى قوة الاختبار.

    \(\alpha\)\(\beta\)ويجب أن تكون صغيرة قدر الإمكان لأنها احتمالات حدوث أخطاء.

    تسمح لنا الإحصائيات بتعيين احتمال ارتكاب خطأ من النوع الأول. احتمال حدوث خطأ من النوع الأول هو\(\alpha\). تذكر أن فترات الثقة في الوحدة الأخيرة تم تعيينها عن طريق اختيار قيمة تسمى\(Z_{\alpha}\) (أو\(t_{\alpha}\)) وحددت قيمة ألفا مستوى الثقة في التقدير لأنها كانت احتمالية فشل الفاصل الزمني في التقاط المتوسط الحقيقي (أو معامل النسبة\(p\)). هذا ألفا وذاك متماثلان.

    أسهل طريقة لمعرفة العلاقة بين خطأ ألفا ومستوى الثقة هي بالشكل التالي.

    الشكل 9.2

    في وسط الشكل 9.2 يتم وضع علامة على توزيع العينات الموزع بشكل طبيعي\(H_0\). هذا هو توزيع العينات\(\overline X\) ويتم توزيعه بشكل طبيعي من خلال نظرية الحد المركزي. تم وضع علامة\(H_0\) على التوزيع في المركز ويمثل توزيع الفرضيات الصفرية\(H_0\):\(\mu = 100\). هذه هي القيمة التي يتم اختبارها. يتم سرد البيانات الرسمية للفرضيات الفارغة والبديلة أسفل الشكل.

    تمثل التوزيعات على جانبي\(H_0\) التوزيع توزيعات ستكون صحيحة إذا كانت\(H_0\) خاطئة، بموجب الفرضية البديلة المدرجة باسم Ha. نحن لا نعرف ما هو الصحيح، ولن نعرف أبدًا. يوجد، في الواقع، عدد لا حصر له من التوزيعات التي كان من الممكن استخلاص البيانات منها إذا كانت Ha صحيحة، ولكن اثنين منها فقط في الشكل 9.2 يمثلان جميع التوزيعات الأخرى.

    لاختبار الفرضية، نأخذ عينة من السكان ونحدد ما إذا كان من الممكن أن تأتي من التوزيع المفترض بمستوى مقبول من الأهمية. هذا المستوى من الأهمية هو خطأ ألفا ويتم تمييزه في الشكل 9.2 كمناطق مظللة في كل ذيل\(H_0\) للتوزيع. (كل منطقة هي في الواقع\ alpha/2 لأن التوزيع متماثل وتسمح الفرضية البديلة بإمكانية أن تكون القيمة إما أكبر من أو أقل من القيمة المفترضة - والتي تسمى الاختبار ثنائي الذيل).

    إذا كان متوسط العينة محددًا كما\(\overline{X}_{1}\) هو في ذيل التوزيع\(H_0\)، فإننا نستنتج أن احتمال أن يكون قد جاء من\(H_0\) التوزيع أقل من ألفا. ونذكر بالتالي أنه «لا يمكن قبول الفرضية الصفرية بمستوى الأهمية (\ ألفا)». قد تكون الحقيقة أن\(\overline{X}_{1}\) هذا جاء من\(H_0\) التوزيع، ولكن من الخارج. إذا كان الأمر كذلك، فقد رفضنا بشكل خاطئ فرضية العدم الحقيقية وارتكبنا خطأ من النوع الأول. ما قامت به الإحصائيات هو تقديم تقدير حول ما نعرفه، وما نتحكم فيه، وهذا هو احتمال خطأنا،\(\alpha\).

    يمكننا أيضًا أن نرى في الشكل 9.2 أن متوسط العينة يمكن أن يكون حقًا من توزيع Ha، ولكن ضمن الحدود التي حددها مستوى ألفا. تم وضع علامة على هذه الحالة على أنها\(\overline{X}_{2}\). هناك احتمال جاء\(\overline{X}_{2}\) بالفعل من Ha ولكنه يظهر في النطاق\(H_0\) بين الذيلين. هذا الاحتمال هو خطأ بيتا، احتمال قبول قيمة خالية خاطئة.

    مشكلتنا هي أنه يمكننا فقط تعيين خطأ ألفا لأن هناك عددًا لا نهائيًا من التوزيعات البديلة التي يمكن أن يأتي منها المتوسط الذي لا يساوي\(H_0\). ونتيجة لذلك، يضع الإحصائي عبء الإثبات على الفرضية البديلة. أي أننا لن نرفض الفرضية الصفرية ما لم يكن هناك احتمال أكبر من 90 أو 95 أو حتى 99 بالمائة بأن قيمة اللاغية خاطئة: يقع عبء الإثبات على الفرضية البديلة. هذا هو السبب في أننا أطلقنا على هذا اسم طغيان الوضع الراهن في وقت سابق.

    على سبيل المثال، يبدأ النظام القضائي الأمريكي بمفهوم أن المدعى عليه «بريء مفترض». هذا هو الوضع الراهن وهو الفرضية الصفرية. سيخبر القاضي هيئة المحلفين أنه لا يمكنهم العثور على المدعى عليه مذنبًا ما لم تشير الأدلة إلى الشعور بالذنب بما لا يتجاوز «الشك المعقول» والذي يتم تعريفه عادةً في القضايا الجنائية على أنه يقين بنسبة 95٪ من الذنب. إذا لم تستطع هيئة المحلفين قبول البراءة الباطلة، فسيتم اتخاذ الإجراءات، والسجن. يكمن عبء الإثبات دائمًا في الفرضية البديلة. (في القضايا المدنية، تحتاج هيئة المحلفين فقط إلى أن تكون متأكدة بنسبة تزيد عن 50٪ من الخطأ لإثبات الذنب، وهو ما يسمى «رجحان الأدلة»).

    كان المثال أعلاه لاختبار المتوسط، ولكن نفس المنطق ينطبق على اختبارات الفرضيات لجميع المعلمات الإحصائية التي قد يرغب المرء في اختبارها.

    فيما يلي أمثلة لأخطاء النوع الأول والنوع الثاني.

    المثال 9.4

    لنفترض أن الفرضية\(H_0\) الصفرية هي: معدات فرانك لتسلق الصخور آمنة.

    خطأ من النوع الأول: يعتقد فرانك أن معدات تسلق الصخور الخاصة به قد لا تكون آمنة في حين أنها في الواقع آمنة حقًا.

    خطأ من النوع الثاني: يعتقد فرانك أن معدات تسلق الصخور الخاصة به قد تكون آمنة عندما تكون في الواقع غير آمنة.

    \(\bf{\alpha =}\)احتمال أن فرانك يعتقد أن معدات تسلق الصخور الخاصة به قد لا تكون آمنة في حين أنها، في الواقع، آمنة حقًا. \(\bf{\beta =}\)احتمال أن فرانك يعتقد أن معدات تسلق الصخور الخاصة به قد تكون آمنة في حين أنها، في الواقع، ليست آمنة.

    لاحظ أنه في هذه الحالة، يكون الخطأ ذو النتيجة الأكبر هو الخطأ من النوع الثاني. (إذا كان فرانك يعتقد أن معدات تسلق الصخور الخاصة به آمنة، فسوف يمضي قدمًا ويستخدمها.)

    يتم وصف هذه الحالة بأنها «قبول قيمة خالية خاطئة».

    المثال 9.5

    لنفترض أن الفرضية\(H_0\) الصفرية هي: ضحية حادث سيارة على قيد الحياة عندما يصل إلى غرفة الطوارئ في المستشفى. هذا هو الوضع الراهن ولا يتطلب أي إجراء إذا كان صحيحًا. إذا لم يتم قبول فرضية اللاغية، فسيكون الإجراء مطلوبًا وسيبدأ المستشفى الإجراءات المناسبة.

    خطأ من النوع الأول: يعتقد طاقم الطوارئ أن الضحية قد ماتت عندما تكون الضحية في الواقع على قيد الحياة. خطأ من النوع الثاني: لا يعرف طاقم الطوارئ ما إذا كانت الضحية على قيد الحياة في حين أن الضحية قد ماتت في الواقع.

    \(\bf{\alpha =}\)احتمال أن يعتقد طاقم الطوارئ أن الضحية قد مات عندما يكون في الواقع على قيد الحياة = P (خطأ من النوع الأول). \(\bf{\beta =}\)احتمال أن طاقم الطوارئ لا يعرف ما إذا كانت الضحية على قيد الحياة عندما تكون الضحية في الواقع ميتة = P (خطأ من النوع الثاني).

    الخطأ ذو النتيجة الأكبر هو خطأ النوع الأول. (إذا اعتقد طاقم الطوارئ أن الضحية قد مات، فلن يعالجوه.)

    التمرين 9.5

    لنفترض أن الفرضية\(H_0\) الصفرية هي: المريض ليس مريضًا. أي نوع من الأخطاء له النتيجة الأكبر، النوع الأول أم النوع الثاني؟

    المثال 9.6

    تدعي شركة Boy Genetic Labs أنها قادرة على زيادة احتمالية أن يؤدي الحمل إلى ولادة صبي. يريد الإحصائيون اختبار المطالبة. لنفترض أن الفرضية\(H_0\) الصفرية هي: ليس للمختبرات الجينية للفتى أي تأثير على النتائج الجنسانية. الوضع الراهن هو أن الادعاء كاذب. يقع عبء الإثبات دائمًا على عاتق الشخص الذي يقدم المطالبة، في هذه الحالة مختبر علم الوراثة.

    خطأ من النوع الأول: ينتج عن هذا عندما يتم رفض فرضية القيمة الصفرية الحقيقية. في سياق هذا السيناريو، نود أن نذكر أننا نعتقد أن مختبرات It's a Boy Genetic Labs تؤثر على النتيجة بين الجنسين، في حين أنها في الواقع ليس لها أي تأثير. يتم الإشارة إلى احتمال حدوث هذا الخطأ بالحرف اليوناني alpha\ alpha.

    خطأ من النوع الثاني: ينتج هذا عندما نفشل في رفض فرضية العدم الكاذبة. في السياق، نود أن نذكر أن مختبرات It's a Boy Genetic Labs لا تؤثر على النتيجة الجنسانية للحمل في حين أنها تؤثر في الواقع. يُشار إلى احتمال حدوث هذا الخطأ بالحرف اليوناني beta\ beta.

    سيكون الخطأ الأكبر هو الخطأ من النوع الأول لأن الأزواج سيستخدمون منتج It's a Boy Genetic Labs على أمل زيادة فرص إنجاب صبي.

    التمرين 9.6

    «المد الأحمر» عبارة عن إزهار من الطحالب المنتجة للسموم - وهو عدد قليل من الأنواع المختلفة من فئة العوالق تسمى الدينوفلاجيلات. عندما تتسبب ظروف الطقس والمياه في حدوث هذه الإزهار، فإن المحار مثل المحار الذي يعيش في المنطقة يصاب بمستويات خطيرة من السموم المسببة للشلل. في ماساتشوستس، يراقب قسم مصايد الأسماك البحرية (DMF) مستويات السم في المحار عن طريق أخذ عينات منتظمة من المحار على طول الساحل. إذا تجاوز متوسط مستوى السم في المحار 800 ميكروغرام (ميكروغرام) من السم لكل كيلوغرام من لحم البطلينوس في أي منطقة، فسيتم حظر حصاد البطلينوس هناك حتى ينتهي الإزهار وتهدأ مستويات السم في المحار. قم بوصف كل من الخطأ من النوع الأول والنوع الثاني في هذا السياق، وحدد الخطأ الذي له النتيجة الأكبر.

    المثال 9.7

    يدعي دواء تجريبي معين أن معدل الشفاء لا يقل عن 75٪ للذكور المصابين بسرطان البروستاتا. قم بوصف أخطاء النوع الأول والنوع الثاني في السياق. أي خطأ هو الأكثر خطورة؟

    النوع الأول: يعتقد مريض السرطان أن معدل علاج الدواء أقل من 75٪ عندما يكون في الواقع 75٪ على الأقل.

    النوع الثاني: يعتقد مريض السرطان أن الدواء التجريبي لديه معدل علاج 75٪ على الأقل عندما يكون معدل الشفاء أقل من 75٪.

    في هذا السيناريو، يحتوي خطأ النوع الثاني على النتيجة الأكثر خطورة. إذا اعتقد المريض أن الدواء يعمل بنسبة 75٪ على الأقل من الوقت، فسيؤثر ذلك على الأرجح على اختيار المريض (والطبيب) بشأن استخدام الدواء كخيار علاجي.