Skip to main content
Global

9.3: التوزيع المطلوب لاختبار الفرضيات

  • Page ID
    199149
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    في وقت سابق، ناقشنا توزيعات العينات. ترتبط التوزيعات الخاصة باختبار الفرضيات. سنقوم بإجراء اختبارات فرضيات للمتوسط السكاني باستخدام التوزيع العادي أو\(t\) توزيع الطلاب. (تذكر، استخدم\(t\) توزيع الطلاب عندما يكون الانحراف المعياري للسكان غير معروف وحجم العينة صغيرًا، حيث يعتبر الحجم الصغير أقل من 30 ملاحظة.) نقوم بإجراء اختبارات لنسبة السكان باستخدام التوزيع العادي عندما يمكننا افتراض أن التوزيع يتم توزيعه بشكل طبيعي. نعتبر هذا صحيحًا إذا كانت نسبة العينة\(p^{\prime}\)، مضروبة في حجم العينة أكبر من 5\(1-p^{\prime}\) مرات وحجم العينة أكبر أيضًا من 5. هذه هي نفس القاعدة العامة التي استخدمناها عند تطوير صيغة فترة الثقة لنسبة السكان.

    اختبار الفرضيات للمتوسط

    وبالعودة إلى الصيغة الموحدة، يمكننا استخلاص إحصائية الاختبار لاختبار الفرضيات المتعلقة بالوسائل.

    \[Z_{c}=\frac{\overline{x}-\mu_{0}}{\sigma / \sqrt{n}}\nonumber\]

    لا يمكن حل صيغة التوحيد كما هي لأننا لا نملك\(\mu\)، يعني عدد السكان. ومع ذلك، إذا استبدلنا القيمة المفترضة للمتوسط،\(\mu_0\) في الصيغة على النحو الوارد أعلاه، يمكننا حساب\(Z\) القيمة. هذه هي إحصائية الاختبار لاختبار الفرضية للمتوسط ويتم تقديمها في الشكل 9.3. نحن نفسر هذه\(Z\) القيمة على أنها الاحتمال المرتبط بأن العينة ذات متوسط العينة\(\overline X\) يمكن أن تأتي من توزيع بمتوسط سكاني\(H_0\) ونطلق على هذه\(Z\) القيمة\(Z_c\) اسم «محسوب». يوضح الشكل 9.3 والشكل 9.4 هذه العملية.

    الشكل 9.3

    في الشكل 9.3 يتم عرض اثنين من النتائج الثلاثة المحتملة. \(\overline X_1\)\(\overline X_3\)وهي في ذيل التوزيع المفترض لـ\(H_0\). لاحظ أن المحور الأفقي في اللوحة العلوية\(\overline X\) مُصنَّف بالعلامات، وهذا هو نفس التوزيع النظري لتوزيع العينات، الذي تخبرنا نظرية الحد المركزي أنه يتم توزيعه بشكل طبيعي.\(\overline X\) لهذا السبب يمكننا رسمه بهذا الشكل. تم تسمية المحور الأفقي للوحة السفلية\(Z\) وهو التوزيع العادي القياسي. \(Z_{\frac{\alpha}{2}}\)وتسمى القيم الحرجة، ويتم تمييزها على اللوحة السفلية\(Z\) كقيم مرتبطة بالاحتمال الذي حدده المحلل كمستوى الأهمية في الاختبار، (\(\alpha\)).\(-Z_{\frac{\alpha}{2}}\) وبالتالي فإن الاحتمالات في ذيول كلتا اللوحتين هي نفسها.

    لاحظ\(\overline X\) أنه لكل منها ارتباط\(Z_c\)، يسمى المحسوب\(Z\)، يأتي من حل المعادلة أعلاه. هذا\(Z\) الحساب ليس أكثر من عدد الانحرافات المعيارية التي يكون المتوسط المفترض من متوسط العينة. إذا انخفض متوسط العينة «كثيرًا» عن الانحرافات المعيارية عن المتوسط المفترض، فإننا نستنتج أن متوسط العينة لا يمكن أن يأتي من التوزيع بالمتوسط المفترض، نظرًا لمستوى الأهمية المطلوب المحدد مسبقًا. كان من الممكن أن يأتي ذلك\(H_0\)، لكنه يعتبر مستبعدًا جدًا. في الشكل 9.3\(\overline X_3\) كلاهما\(\overline X_1\) وهما في ذيل التوزيع. تعتبر «بعيدة جدًا» عن القيمة المفترضة للمتوسط بالنظر إلى المستوى المختار من ألفا. إذا كانت هذه العينة تعني في الواقع أنها جاءت من الذيل\(H_0\)، ولكن من الذيل، فقد ارتكبنا خطأ من النوع الأول: لقد رفضنا قيمة خالية جيدة. راحتنا الحقيقية الوحيدة هي أننا نعرف احتمال ارتكاب مثل هذا الخطأ،\ ألفا، ويمكننا التحكم في حجمه\(\alpha\).

    يوضح الشكل 9.4 الاحتمال الثالث لموقع متوسط العينة،\(\overline x\). هنا يكون متوسط العينة ضمن القيمتين الحاسمتين. أي ضمن الاحتمال\((1-\alpha)\) ولا يمكننا رفض الفرضية الصفرية.

    الشكل 9.4

    يمنحنا هذا قاعدة القرار لاختبار فرضية الاختبار ثنائي الذيل:

    قاعدة القرار: اختبار ذو ذيلين
    إذا\(\left|\mathrm{Z}_{c}\right|<\mathrm{Z}_{\frac{\alpha}{2}}\): ثم لا ترفض\(H_0\)
    إذا\(\left|\mathrm{Z}_{c}\right|>\mathrm{Z}_{\frac{\alpha}{2}}\): ثم ارفض\(H_0\)
    الجدول 9.3

    ستكون هذه القاعدة هي نفسها دائمًا بغض النظر عن الفرضية التي نختبرها أو الصيغ التي نستخدمها لإجراء الاختبار. سيكون التغيير الوحيد هو\(Z_c\) تغيير الرمز المناسب لإحصائية الاختبار للمعلمة التي يتم اختبارها. تحديد قاعدة القرار بطريقة أخرى: إذا كان من غير المحتمل أن يأتي متوسط العينة من التوزيع بالمتوسط المفترض، فلا يمكننا قبول الفرضية الصفرية. نحدد هنا كلمة «غير محتمل» على أنها وجود احتمال أقل من ألفا للحدوث.

    نهج القيمة P

    يمكن تطوير قاعدة قرار بديلة من خلال حساب احتمال العثور على متوسط عينة من شأنه أن يعطي إحصائية اختبار أكبر من إحصائية الاختبار الموجودة من بيانات العينة الحالية على افتراض أن الفرضية الصفرية صحيحة. هنا يتم تعريف مفهوم «المحتمل» و «غير المحتمل» من خلال احتمال رسم عينة بمتوسط من مجموعة سكانية ذات متوسط مفترض أكبر أو أصغر من ذلك الموجود في بيانات العينة. ببساطة، يقارن نهج\(p\) القيمة -value مستوى الأهمية المطلوب\(\alpha\)،\(p\) بالقيمة -التي تمثل احتمال رسم عينة وسط أبعد عن القيمة المفترضة عن متوسط العينة الفعلي. تشير\(p\) القيمة الكبيرة المحسوبة من البيانات إلى أننا يجب ألا نرفض فرضية العدم. كلما كانت\(p\) القيمة -أصغر، زادت احتمالية النتيجة، وكلما كانت الأدلة أقوى ضد الفرضية الصفرية. سنرفض فرضية اللاغية إذا كانت الأدلة ضدها بشدة. يمكن رؤية العلاقة بين قاعدة القرار لمقارنة إحصائيات الاختبار المحسوبة والقيمة الحرجة واستخدام\(p\) القيمة -في الشكل 9.5.\(Z_c\)\(Z_\alpha\)

    الشكل 9.5

    القيمة المحسوبة لإحصائية الاختبار موجودة\(Z_c\) في هذا المثال ويتم تمييزها على الرسم البياني السفلي للتوزيع العادي القياسي لأنها\(Z\) قيمة. في هذه الحالة، تكون القيمة المحسوبة في الذيل، وبالتالي لا يمكننا قبول فرضية الصفر، فالقيمة المرتبطة\(\overline X\) كبيرة جدًا بشكل غير عادي للاعتقاد بأنها جاءت من\(\mu_0\) التوزيع بمتوسط مستوى أهمية\ ألفا.

    إذا استخدمنا قاعدة القرار\(p\) -value، نحتاج إلى خطوة أخرى. نحتاج أن نجد في الجدول العادي القياسي الاحتمال المرتبط بإحصائية الاختبار المحسوبة\(Z_c\). ثم نقارن ذلك بـ\ alpha المرتبط بمستوى الثقة الذي اخترناه. في الشكل 9.5 نرى أن\(p\) القيمة -أقل من\ alpha وبالتالي لا يمكننا قبول القيمة الخالية. نحن نعلم أن\(p\) القيمة -أقل من\ alpha لأن المنطقة تحت\(p\) القيمة -أصغر من\(\alpha/ 2\). من المهم ملاحظة أن اثنين من الباحثين الذين يرسمون عشوائيًا من نفس المجموعة قد يجدون\(p\) قيمتين مختلفتين من عيناتهما. يحدث هذا بسبب حساب\(p\) القيمة -على أنها الاحتمالية في الذيل وراء العينة تعني افتراض أن الفرضية الصفرية صحيحة. نظرًا لأن وسائل العينة ستكون مختلفة في جميع الاحتمالات، فسيؤدي ذلك إلى إنشاء\(p\) قيمتين مختلفتين. ومع ذلك، يجب أن تكون الاستنتاجات المتعلقة بالفرضية الصفرية مختلفة مع مستوى الاحتمال فقط\(\alpha\).

    فيما يلي طريقة منهجية لاتخاذ قرار بشأن ما إذا كان لا يمكنك قبول أو عدم رفض فرضية خالية في حالة استخدام\(\bf{p}\) القيمة -value والإعداد المسبق أو المسبق\ (\ bf {\ alpha}\) ("مستوى الأهمية «). الإعداد المسبق\(\alpha\) هو احتمال حدوث خطأ من النوع الأول (رفض الفرضية الصفرية عندما تكون الفرضية الصفرية صحيحة). قد يتم إعطاؤها لك أو لا يتم إعطاؤها لك في بداية المشكلة. على أي حال، فإن القيمة\(\alpha\) هي قرار المحلل. عند اتخاذ قرار بالرفض أو عدم الرفض\(H_0\)، قم بما يلي:

    • إذا كانت\(\alpha > p\) -value، فلا يمكن قبولها\(H_0\) نتائج بيانات العينة مهمة. هناك أدلة كافية لاستنتاج أن\(H_0\) هذا اعتقاد غير صحيح وأن الفرضية البديلة، ها، قد تكون صحيحة.
    • إذا كانت\(\alpha \leq p\) -value، فلا يمكن رفضها\(H_0\) نتائج بيانات العينة ليست مهمة. لا توجد أدلة كافية لاستنتاج أن الفرضية البديلة، ها، قد تكون صحيحة. في هذه الحالة، يظل الوضع الراهن قائمًا.
    • عندما «لا يمكنك الرفض\(H_0\)»، فهذا لا يعني أنه يجب عليك الاعتقاد بأن\(H_0\) هذا صحيح. هذا يعني ببساطة أن بيانات العينة فشلت في تقديم أدلة كافية للتشكيك الجاد في صدقها\(H_0\). تذكر أن القيمة الصفرية هي الوضع الراهن وأن الأمر يتطلب احتمالًا كبيرًا للإطاحة بالوضع الراهن. هذا التحيز لصالح الفرضية الصفرية هو ما أدى إلى ظهور عبارة «طغيان الوضع الراهن» عند مناقشة اختبار الفرضيات والمنهج العلمي.

    ستؤدي كلتا قاعدتي القرار إلى نفس القرار وهي مسألة تفضيل يتم استخدامها.

    اختبارات ذات ذيل واحد وثنائي

    استندت مناقشة الشكل 9.3 - الشكل 9.5 إلى الفرضية الصفرية والبديلة الواردة في الشكل 9.3. كان هذا يسمى الاختبار ثنائي الذيل لأن الفرضية البديلة سمحت بأن المتوسط يمكن أن يأتي من مجموعة سكانية أكبر أو أصغر من المتوسط المفترض في الفرضية الصفرية. يمكن ملاحظة ذلك من خلال بيان الفرضية البديلة كما\(\mu \neq 100\) في هذا المثال.

    قد لا يشعر المحلل بالقلق من أن القيمة «مرتفعة جدًا» أو «منخفضة جدًا» عن القيمة المفترضة. إذا كانت هذه هي الحالة، يصبح اختبارًا أحادي الذيل ويتم وضع كل احتمالية ألفا في ذيل واحد فقط ولا يتم تقسيمها\(\alpha /2\) كما في الحالة المذكورة أعلاه للاختبار ثنائي الذيل. أي اختبار للمطالبة سيكون اختبارًا أحادي الذيل. على سبيل المثال، تدعي إحدى شركات تصنيع السيارات أن طرازها 17B يوفر أميال غاز تزيد عن 25 ميلًا لكل جالون. الفرضية الصفرية والبديلة ستكون:

    • \(H_0: \mu \leq 25\)
    • \(H_a: \mu > 25\)

    سيكون الادعاء في الفرضية البديلة. يتم تحمل عبء الإثبات في اختبار الفرضيات في البديل. هذا لأن الفشل في رفض الإلغاء، أي الوضع الراهن، يجب أن يتم بنسبة 90 أو 95 في المائة بحيث لا يمكن الحفاظ عليه. بطريقة أخرى، نريد أن يكون لدينا احتمال بنسبة 5 أو 10 بالمائة فقط لارتكاب خطأ من النوع الأول، ورفض القيمة الصفرية الجيدة؛ الإطاحة بالوضع الراهن.

    هذا اختبار ذو ذيل واحد ويتم وضع كل احتمالية ألفا في ذيل واحد فقط ولا يتم تقسيمها\(\alpha /2\) كما في الحالة المذكورة أعلاه للاختبار ثنائي الذيل.

    يوضح الشكل 9.6 الحالتين المحتملتين وشكل الفرضية الصفرية والبديلة التي أدت إلى ظهورهما.

    الشكل 9.6

    \(\mu_0\)أين القيمة المفترضة للمتوسط السكاني.

    حجم العينة إحصائية الاختبار
    < 30
    (\(\sigma\)غير معروف)
    \(t_{c}=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}\)
    أقل من 30
    (\(\sigma\)معروف)
    \(Z_{c}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\)
    > 30
    (\(\sigma\)غير معروف)
    \(Z_{c}=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}\)
    > 30
    (\(\sigma\)معروف)
    \(Z_{c}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\)
    الجدول 9.4 إحصائيات الاختبار لاختبار الوسائل، وحجم العينة المتغير، والانحراف المعياري للسكان المعروف أو غير المعروف

    تأثيرات حجم العينة على إحصائيات الاختبار

    عند تطوير فترات الثقة للمتوسط من العينة، وجدنا أنه في أغلب الأحيان لن يكون لدينا انحراف معياري للسكان\(\sigma\). إذا كان حجم العينة أقل من 30، فيمكننا ببساطة استبدال تقدير النقاط بالانحراف المعياري\(\sigma\) للعينة واستخدام\(t\) توزيع الطالب لتصحيح هذا النقص في المعلومات.\(s\)

    عند اختبار الفرضيات، نواجه نفس المشكلة والحل هو نفسه تمامًا. أي: إذا كان الانحراف المعياري للسكان غير معروف، وكان حجم العينة أقل من 30\(s\)، استبدل تقدير النقاط بالانحراف المعياري للسكان\(\sigma\)، في صيغة إحصائية الاختبار واستخدم\(t\) توزيع الطالب. لم تتغير جميع الصيغ والأرقام أعلاه باستثناء هذا الاستبدال وتغيير\(Z\) التوزيع إلى توزيع t للطالب على الرسم البياني. تذكر أنه لا يمكن حساب توزيع t الخاص بالطالب إلا بمعرفة درجات الحرية المناسبة للمشكلة. في هذه الحالة، يتم حساب درجات الحرية كما كان من قبل مع فترات الثقة:\(df = (n-1)\). تتم مقارنة قيمة t المحسوبة بقيمة t المرتبطة بمستوى الثقة المحدد مسبقًا المطلوب في الاختبار، والموجود\(t_{\alpha, df}\) في جداول t الخاصة بالطالب. إذا كنا لا نعرف\(\sigma\)، ولكن حجم العينة هو 30 أو أكثر، فإننا ببساطة\(s\) نستبدل التوزيع العادي\(\sigma\) ونستخدمه.

    يلخص الجدول 9.4 هذه القواعد.

    نهج منهجي لاختبار الفرضية

    يتبع النهج المنهجي لاختبار الفرضيات الخطوات التالية وبهذا الترتيب. سيعمل هذا القالب مع جميع الفرضيات التي ستختبرها في أي وقت.

    • قم بإعداد الفرضية الصفرية والبديلة. عادة ما يكون هذا هو أصعب جزء من العملية. هنا تتم مراجعة السؤال المطروح. ما هي المعلمة التي يتم اختبارها، والمتوسط، والنسبة، والاختلافات في الوسائل، وما إلى ذلك. هل هذا اختبار ذو ذيل واحد أم اختبار ثنائي الذيل؟ تذكر أنه إذا قام شخص ما بتقديم مطالبة، فسيكون ذلك دائمًا اختبارًا أحادي الذيل.
    • حدد مستوى الأهمية المطلوب لهذه الحالة بالذات وحدد القيمة الحرجة. يمكن العثور عليها في الجدول الإحصائي المناسب. مستويات الثقة النموذجية للشركات هي 80 و 90 و 95 و 98 و 99. ومع ذلك، فإن مستوى الأهمية هو قرار سياسي ويجب أن يستند إلى خطر ارتكاب خطأ من النوع الأول، ورفض القيمة الصفرية الجيدة. ضع في اعتبارك عواقب ارتكاب خطأ من النوع الأول.

      بعد ذلك، استنادًا إلى الفرضيات وحجم العينة، حدد إحصائية الاختبار المناسبة وابحث عن القيمة الحرجة ذات الصلة:\(Z_\alpha\)\(t_\alpha\)، وما إلى ذلك، يعد رسم توزيع الاحتمالات ذي الصلة وتحديد القيمة الحرجة دائمًا مساعدة كبيرة. تأكد من مطابقة الرسم البياني مع الفرضية، خاصة إذا كان اختبارًا أحادي الذيل.

    • خذ عينة (عينات) واحسب المعلمات ذات الصلة: متوسط العينة أو الانحراف المعياري أو النسبة. باستخدام صيغة إحصائية الاختبار من الأعلى في الخطوة 2، قم الآن بحساب إحصائية الاختبار لهذه الحالة بالذات باستخدام المعلمات التي قمت بحسابها للتو.
    • قارن إحصائيات الاختبار المحسوبة والقيمة الحرجة. سيؤدي وضع علامة عليها على الرسم البياني إلى إعطاء صورة مرئية جيدة للوضع. هناك الآن حالتان فقط:
      1. إحصائية الاختبار موجودة في الذيل: لا يمكن قبول القيمة الصفرية، واحتمال أن متوسط العينة (النسبة) جاء من التوزيع المفترض صغير جدًا بحيث لا يمكن الاعتقاد بأنه الموطن الحقيقي لبيانات العينة هذه.
      2. إحصائية الاختبار ليست في الذيل: لا يمكن رفض القيمة الفارغة، بيانات العينة متوافقة مع معلمة السكان المفترضة.
    • الوصول إلى نتيجة. من الأفضل توضيح الاستنتاج بطريقتين مختلفتين. أولاً استنتاج إحصائي رسمي مثل «بمستوى 5٪ من الأهمية لا يمكننا قبول الفرضيات الصفرية بأن متوسط السكان يساوي XX (وحدات القياس)». أما البيان الثاني للاستنتاج فهو أقل رسمية وينص على الإجراء المطلوب، أو عدم اتخاذ إجراء. إذا كان الاستنتاج الرسمي هو ما ورد أعلاه، فقد يكون الاستنتاج غير الرسمي هو «الآلة مكسورة ونحن بحاجة إلى إغلاقها والدعوة إلى إجراء إصلاحات».

    جميع الفرضيات التي تم اختبارها ستخضع لهذه العملية نفسها. التغييرات الوحيدة هي الصيغ ذات الصلة ويتم تحديدها من خلال الفرضية المطلوبة للإجابة على السؤال الأصلي.