Skip to main content
Library homepage
 
Global

9.3: التوزيع المطلوب لاختبار الفرضيات

في وقت سابق، ناقشنا توزيعات العينات. ترتبط التوزيعات الخاصة باختبار الفرضيات. سنقوم بإجراء اختبارات فرضيات للمتوسط السكاني باستخدام التوزيع العادي أوt توزيع الطلاب. (تذكر، استخدمt توزيع الطلاب عندما يكون الانحراف المعياري للسكان غير معروف وحجم العينة صغيرًا، حيث يعتبر الحجم الصغير أقل من 30 ملاحظة.) نقوم بإجراء اختبارات لنسبة السكان باستخدام التوزيع العادي عندما يمكننا افتراض أن التوزيع يتم توزيعه بشكل طبيعي. نعتبر هذا صحيحًا إذا كانت نسبة العينةp، مضروبة في حجم العينة أكبر من 51p مرات وحجم العينة أكبر أيضًا من 5. هذه هي نفس القاعدة العامة التي استخدمناها عند تطوير صيغة فترة الثقة لنسبة السكان.

اختبار الفرضيات للمتوسط

وبالعودة إلى الصيغة الموحدة، يمكننا استخلاص إحصائية الاختبار لاختبار الفرضيات المتعلقة بالوسائل.

Zc=¯xμ0σ/n

لا يمكن حل صيغة التوحيد كما هي لأننا لا نملكμ، يعني عدد السكان. ومع ذلك، إذا استبدلنا القيمة المفترضة للمتوسط،μ0 في الصيغة على النحو الوارد أعلاه، يمكننا حسابZ القيمة. هذه هي إحصائية الاختبار لاختبار الفرضية للمتوسط ويتم تقديمها في الشكل 9.3. نحن نفسر هذهZ القيمة على أنها الاحتمال المرتبط بأن العينة ذات متوسط العينة¯X يمكن أن تأتي من توزيع بمتوسط سكانيH0 ونطلق على هذهZ القيمةZc اسم «محسوب». يوضح الشكل 9.3 والشكل 9.4 هذه العملية.

الشكل 9.3

في الشكل 9.3 يتم عرض اثنين من النتائج الثلاثة المحتملة. ¯X1¯X3وهي في ذيل التوزيع المفترض لـH0. لاحظ أن المحور الأفقي في اللوحة العلوية¯X مُصنَّف بالعلامات، وهذا هو نفس التوزيع النظري لتوزيع العينات، الذي تخبرنا نظرية الحد المركزي أنه يتم توزيعه بشكل طبيعي.¯X لهذا السبب يمكننا رسمه بهذا الشكل. تم تسمية المحور الأفقي للوحة السفليةZ وهو التوزيع العادي القياسي. Zα2وتسمى القيم الحرجة، ويتم تمييزها على اللوحة السفليةZ كقيم مرتبطة بالاحتمال الذي حدده المحلل كمستوى الأهمية في الاختبار، (α).Zα2 وبالتالي فإن الاحتمالات في ذيول كلتا اللوحتين هي نفسها.

لاحظ¯X أنه لكل منها ارتباطZc، يسمى المحسوبZ، يأتي من حل المعادلة أعلاه. هذاZ الحساب ليس أكثر من عدد الانحرافات المعيارية التي يكون المتوسط المفترض من متوسط العينة. إذا انخفض متوسط العينة «كثيرًا» عن الانحرافات المعيارية عن المتوسط المفترض، فإننا نستنتج أن متوسط العينة لا يمكن أن يأتي من التوزيع بالمتوسط المفترض، نظرًا لمستوى الأهمية المطلوب المحدد مسبقًا. كان من الممكن أن يأتي ذلكH0، لكنه يعتبر مستبعدًا جدًا. في الشكل 9.3¯X3 كلاهما¯X1 وهما في ذيل التوزيع. تعتبر «بعيدة جدًا» عن القيمة المفترضة للمتوسط بالنظر إلى المستوى المختار من ألفا. إذا كانت هذه العينة تعني في الواقع أنها جاءت من الذيلH0، ولكن من الذيل، فقد ارتكبنا خطأ من النوع الأول: لقد رفضنا قيمة خالية جيدة. راحتنا الحقيقية الوحيدة هي أننا نعرف احتمال ارتكاب مثل هذا الخطأ،\ ألفا، ويمكننا التحكم في حجمهα.

يوضح الشكل 9.4 الاحتمال الثالث لموقع متوسط العينة،¯x. هنا يكون متوسط العينة ضمن القيمتين الحاسمتين. أي ضمن الاحتمال(1α) ولا يمكننا رفض الفرضية الصفرية.

الشكل 9.4

يمنحنا هذا قاعدة القرار لاختبار فرضية الاختبار ثنائي الذيل:

قاعدة القرار: اختبار ذو ذيلين
إذا|Zc|<Zα2: ثم لا ترفضH0
إذا|Zc|>Zα2: ثم ارفضH0
الجدول 9.3

ستكون هذه القاعدة هي نفسها دائمًا بغض النظر عن الفرضية التي نختبرها أو الصيغ التي نستخدمها لإجراء الاختبار. سيكون التغيير الوحيد هوZc تغيير الرمز المناسب لإحصائية الاختبار للمعلمة التي يتم اختبارها. تحديد قاعدة القرار بطريقة أخرى: إذا كان من غير المحتمل أن يأتي متوسط العينة من التوزيع بالمتوسط المفترض، فلا يمكننا قبول الفرضية الصفرية. نحدد هنا كلمة «غير محتمل» على أنها وجود احتمال أقل من ألفا للحدوث.

نهج القيمة P

يمكن تطوير قاعدة قرار بديلة من خلال حساب احتمال العثور على متوسط عينة من شأنه أن يعطي إحصائية اختبار أكبر من إحصائية الاختبار الموجودة من بيانات العينة الحالية على افتراض أن الفرضية الصفرية صحيحة. هنا يتم تعريف مفهوم «المحتمل» و «غير المحتمل» من خلال احتمال رسم عينة بمتوسط من مجموعة سكانية ذات متوسط مفترض أكبر أو أصغر من ذلك الموجود في بيانات العينة. ببساطة، يقارن نهجp القيمة -value مستوى الأهمية المطلوبα،p بالقيمة -التي تمثل احتمال رسم عينة وسط أبعد عن القيمة المفترضة عن متوسط العينة الفعلي. تشيرp القيمة الكبيرة المحسوبة من البيانات إلى أننا يجب ألا نرفض فرضية العدم. كلما كانتp القيمة -أصغر، زادت احتمالية النتيجة، وكلما كانت الأدلة أقوى ضد الفرضية الصفرية. سنرفض فرضية اللاغية إذا كانت الأدلة ضدها بشدة. يمكن رؤية العلاقة بين قاعدة القرار لمقارنة إحصائيات الاختبار المحسوبة والقيمة الحرجة واستخدامp القيمة -في الشكل 9.5.ZcZα

الشكل 9.5

القيمة المحسوبة لإحصائية الاختبار موجودةZc في هذا المثال ويتم تمييزها على الرسم البياني السفلي للتوزيع العادي القياسي لأنهاZ قيمة. في هذه الحالة، تكون القيمة المحسوبة في الذيل، وبالتالي لا يمكننا قبول فرضية الصفر، فالقيمة المرتبطة¯X كبيرة جدًا بشكل غير عادي للاعتقاد بأنها جاءت منμ0 التوزيع بمتوسط مستوى أهمية\ ألفا.

إذا استخدمنا قاعدة القرارp -value، نحتاج إلى خطوة أخرى. نحتاج أن نجد في الجدول العادي القياسي الاحتمال المرتبط بإحصائية الاختبار المحسوبةZc. ثم نقارن ذلك بـ\ alpha المرتبط بمستوى الثقة الذي اخترناه. في الشكل 9.5 نرى أنp القيمة -أقل من\ alpha وبالتالي لا يمكننا قبول القيمة الخالية. نحن نعلم أنp القيمة -أقل من\ alpha لأن المنطقة تحتp القيمة -أصغر منα/2. من المهم ملاحظة أن اثنين من الباحثين الذين يرسمون عشوائيًا من نفس المجموعة قد يجدونp قيمتين مختلفتين من عيناتهما. يحدث هذا بسبب حسابp القيمة -على أنها الاحتمالية في الذيل وراء العينة تعني افتراض أن الفرضية الصفرية صحيحة. نظرًا لأن وسائل العينة ستكون مختلفة في جميع الاحتمالات، فسيؤدي ذلك إلى إنشاءp قيمتين مختلفتين. ومع ذلك، يجب أن تكون الاستنتاجات المتعلقة بالفرضية الصفرية مختلفة مع مستوى الاحتمال فقطα.

فيما يلي طريقة منهجية لاتخاذ قرار بشأن ما إذا كان لا يمكنك قبول أو عدم رفض فرضية خالية في حالة استخدامp القيمة -value والإعداد المسبق أو المسبق\ (\ bf {\ alpha}\) ("مستوى الأهمية «). الإعداد المسبقα هو احتمال حدوث خطأ من النوع الأول (رفض الفرضية الصفرية عندما تكون الفرضية الصفرية صحيحة). قد يتم إعطاؤها لك أو لا يتم إعطاؤها لك في بداية المشكلة. على أي حال، فإن القيمةα هي قرار المحلل. عند اتخاذ قرار بالرفض أو عدم الرفضH0، قم بما يلي:

  • إذا كانتα>p -value، فلا يمكن قبولهاH0 نتائج بيانات العينة مهمة. هناك أدلة كافية لاستنتاج أنH0 هذا اعتقاد غير صحيح وأن الفرضية البديلة، ها، قد تكون صحيحة.
  • إذا كانتαp -value، فلا يمكن رفضهاH0 نتائج بيانات العينة ليست مهمة. لا توجد أدلة كافية لاستنتاج أن الفرضية البديلة، ها، قد تكون صحيحة. في هذه الحالة، يظل الوضع الراهن قائمًا.
  • عندما «لا يمكنك الرفضH0»، فهذا لا يعني أنه يجب عليك الاعتقاد بأنH0 هذا صحيح. هذا يعني ببساطة أن بيانات العينة فشلت في تقديم أدلة كافية للتشكيك الجاد في صدقهاH0. تذكر أن القيمة الصفرية هي الوضع الراهن وأن الأمر يتطلب احتمالًا كبيرًا للإطاحة بالوضع الراهن. هذا التحيز لصالح الفرضية الصفرية هو ما أدى إلى ظهور عبارة «طغيان الوضع الراهن» عند مناقشة اختبار الفرضيات والمنهج العلمي.

ستؤدي كلتا قاعدتي القرار إلى نفس القرار وهي مسألة تفضيل يتم استخدامها.

اختبارات ذات ذيل واحد وثنائي

استندت مناقشة الشكل 9.3 - الشكل 9.5 إلى الفرضية الصفرية والبديلة الواردة في الشكل 9.3. كان هذا يسمى الاختبار ثنائي الذيل لأن الفرضية البديلة سمحت بأن المتوسط يمكن أن يأتي من مجموعة سكانية أكبر أو أصغر من المتوسط المفترض في الفرضية الصفرية. يمكن ملاحظة ذلك من خلال بيان الفرضية البديلة كماμ100 في هذا المثال.

قد لا يشعر المحلل بالقلق من أن القيمة «مرتفعة جدًا» أو «منخفضة جدًا» عن القيمة المفترضة. إذا كانت هذه هي الحالة، يصبح اختبارًا أحادي الذيل ويتم وضع كل احتمالية ألفا في ذيل واحد فقط ولا يتم تقسيمهاα/2 كما في الحالة المذكورة أعلاه للاختبار ثنائي الذيل. أي اختبار للمطالبة سيكون اختبارًا أحادي الذيل. على سبيل المثال، تدعي إحدى شركات تصنيع السيارات أن طرازها 17B يوفر أميال غاز تزيد عن 25 ميلًا لكل جالون. الفرضية الصفرية والبديلة ستكون:

  • H0:μ25
  • Ha:μ>25

سيكون الادعاء في الفرضية البديلة. يتم تحمل عبء الإثبات في اختبار الفرضيات في البديل. هذا لأن الفشل في رفض الإلغاء، أي الوضع الراهن، يجب أن يتم بنسبة 90 أو 95 في المائة بحيث لا يمكن الحفاظ عليه. بطريقة أخرى، نريد أن يكون لدينا احتمال بنسبة 5 أو 10 بالمائة فقط لارتكاب خطأ من النوع الأول، ورفض القيمة الصفرية الجيدة؛ الإطاحة بالوضع الراهن.

هذا اختبار ذو ذيل واحد ويتم وضع كل احتمالية ألفا في ذيل واحد فقط ولا يتم تقسيمهاα/2 كما في الحالة المذكورة أعلاه للاختبار ثنائي الذيل.

يوضح الشكل 9.6 الحالتين المحتملتين وشكل الفرضية الصفرية والبديلة التي أدت إلى ظهورهما.

الشكل 9.6

μ0أين القيمة المفترضة للمتوسط السكاني.

حجم العينة إحصائية الاختبار
< 30
(σغير معروف)
tc=¯Xμ0s/n
أقل من 30
(σمعروف)
Zc=¯Xμ0σ/n
> 30
(σغير معروف)
Zc=¯Xμ0s/n
> 30
(σمعروف)
Zc=¯Xμ0σ/n
الجدول 9.4 إحصائيات الاختبار لاختبار الوسائل، وحجم العينة المتغير، والانحراف المعياري للسكان المعروف أو غير المعروف

تأثيرات حجم العينة على إحصائيات الاختبار

عند تطوير فترات الثقة للمتوسط من العينة، وجدنا أنه في أغلب الأحيان لن يكون لدينا انحراف معياري للسكانσ. إذا كان حجم العينة أقل من 30، فيمكننا ببساطة استبدال تقدير النقاط بالانحراف المعياريσ للعينة واستخدامt توزيع الطالب لتصحيح هذا النقص في المعلومات.s

عند اختبار الفرضيات، نواجه نفس المشكلة والحل هو نفسه تمامًا. أي: إذا كان الانحراف المعياري للسكان غير معروف، وكان حجم العينة أقل من 30s، استبدل تقدير النقاط بالانحراف المعياري للسكانσ، في صيغة إحصائية الاختبار واستخدمt توزيع الطالب. لم تتغير جميع الصيغ والأرقام أعلاه باستثناء هذا الاستبدال وتغييرZ التوزيع إلى توزيع t للطالب على الرسم البياني. تذكر أنه لا يمكن حساب توزيع t الخاص بالطالب إلا بمعرفة درجات الحرية المناسبة للمشكلة. في هذه الحالة، يتم حساب درجات الحرية كما كان من قبل مع فترات الثقة:df=(n1). تتم مقارنة قيمة t المحسوبة بقيمة t المرتبطة بمستوى الثقة المحدد مسبقًا المطلوب في الاختبار، والموجودtα,df في جداول t الخاصة بالطالب. إذا كنا لا نعرفσ، ولكن حجم العينة هو 30 أو أكثر، فإننا ببساطةs نستبدل التوزيع العاديσ ونستخدمه.

يلخص الجدول 9.4 هذه القواعد.

نهج منهجي لاختبار الفرضية

يتبع النهج المنهجي لاختبار الفرضيات الخطوات التالية وبهذا الترتيب. سيعمل هذا القالب مع جميع الفرضيات التي ستختبرها في أي وقت.

  • قم بإعداد الفرضية الصفرية والبديلة. عادة ما يكون هذا هو أصعب جزء من العملية. هنا تتم مراجعة السؤال المطروح. ما هي المعلمة التي يتم اختبارها، والمتوسط، والنسبة، والاختلافات في الوسائل، وما إلى ذلك. هل هذا اختبار ذو ذيل واحد أم اختبار ثنائي الذيل؟ تذكر أنه إذا قام شخص ما بتقديم مطالبة، فسيكون ذلك دائمًا اختبارًا أحادي الذيل.
  • حدد مستوى الأهمية المطلوب لهذه الحالة بالذات وحدد القيمة الحرجة. يمكن العثور عليها في الجدول الإحصائي المناسب. مستويات الثقة النموذجية للشركات هي 80 و 90 و 95 و 98 و 99. ومع ذلك، فإن مستوى الأهمية هو قرار سياسي ويجب أن يستند إلى خطر ارتكاب خطأ من النوع الأول، ورفض القيمة الصفرية الجيدة. ضع في اعتبارك عواقب ارتكاب خطأ من النوع الأول.

    بعد ذلك، استنادًا إلى الفرضيات وحجم العينة، حدد إحصائية الاختبار المناسبة وابحث عن القيمة الحرجة ذات الصلة:Zαtα، وما إلى ذلك، يعد رسم توزيع الاحتمالات ذي الصلة وتحديد القيمة الحرجة دائمًا مساعدة كبيرة. تأكد من مطابقة الرسم البياني مع الفرضية، خاصة إذا كان اختبارًا أحادي الذيل.

  • خذ عينة (عينات) واحسب المعلمات ذات الصلة: متوسط العينة أو الانحراف المعياري أو النسبة. باستخدام صيغة إحصائية الاختبار من الأعلى في الخطوة 2، قم الآن بحساب إحصائية الاختبار لهذه الحالة بالذات باستخدام المعلمات التي قمت بحسابها للتو.
  • قارن إحصائيات الاختبار المحسوبة والقيمة الحرجة. سيؤدي وضع علامة عليها على الرسم البياني إلى إعطاء صورة مرئية جيدة للوضع. هناك الآن حالتان فقط:
    1. إحصائية الاختبار موجودة في الذيل: لا يمكن قبول القيمة الصفرية، واحتمال أن متوسط العينة (النسبة) جاء من التوزيع المفترض صغير جدًا بحيث لا يمكن الاعتقاد بأنه الموطن الحقيقي لبيانات العينة هذه.
    2. إحصائية الاختبار ليست في الذيل: لا يمكن رفض القيمة الفارغة، بيانات العينة متوافقة مع معلمة السكان المفترضة.
  • الوصول إلى نتيجة. من الأفضل توضيح الاستنتاج بطريقتين مختلفتين. أولاً استنتاج إحصائي رسمي مثل «بمستوى 5٪ من الأهمية لا يمكننا قبول الفرضيات الصفرية بأن متوسط السكان يساوي XX (وحدات القياس)». أما البيان الثاني للاستنتاج فهو أقل رسمية وينص على الإجراء المطلوب، أو عدم اتخاذ إجراء. إذا كان الاستنتاج الرسمي هو ما ورد أعلاه، فقد يكون الاستنتاج غير الرسمي هو «الآلة مكسورة ونحن بحاجة إلى إغلاقها والدعوة إلى إجراء إصلاحات».

جميع الفرضيات التي تم اختبارها ستخضع لهذه العملية نفسها. التغييرات الوحيدة هي الصيغ ذات الصلة ويتم تحديدها من خلال الفرضية المطلوبة للإجابة على السؤال الأصلي.