12.1: اختبار تباينين
- Page ID
- 198747
يقدم هذا الفصل دالة الكثافة الاحتمالية الجديدة، وهي\(F\) التوزيع. يتم استخدام هذا التوزيع للعديد من التطبيقات بما في ذلك ANOVA ولاختبار المساواة عبر وسائل متعددة. نبدأ\(F\) بالتوزيع واختبار فرضية الاختلافات في الفروق. غالبًا ما يكون من المستحسن مقارنة تباينين بدلاً من متوسطين. على سبيل المثال، يرغب مسؤولو الكلية في أن يكون لامتحاني تقدير اثنين من أساتذة الكلية نفس الاختلاف في درجاتهم. لكي يتناسب الغطاء مع الحاوية، يجب أن يكون الاختلاف في الغطاء والحاوية هو نفسه تقريبًا. قد يكون السوبر ماركت مهتمًا بتنوع أوقات تسجيل المغادرة لشخصين. في مجال التمويل، يعتبر التباين مقياسًا للمخاطر، وبالتالي فإن السؤال المثير للاهتمام هو اختبار الفرضية القائلة بأن محفظتين استثماريتين مختلفتين لهما نفس التباين، وهو التقلب.
من أجل إجراء\(F\) اختبار لنوعين مختلفين، من المهم أن يكون ما يلي صحيحًا:
- يتم توزيع المجموعات السكانية التي تم استخلاص العينتين منها بشكل طبيعي تقريبًا.
- السكان مستقلون عن بعضهم البعض.
على عكس معظم اختبارات الفرضيات الأخرى في هذا الكتاب، فإن\(F\) اختبار المساواة بين تباينين حساس جدًا للانحرافات عن الحالة الطبيعية. إذا كان التوزيعان غير طبيعيين أو قريبين، يمكن أن يعطي الاختبار نتيجة متحيزة لإحصائية الاختبار.
لنفترض أننا نأخذ عينات عشوائية من مجموعتين عاديتين مستقلتين. دعونا\(\sigma_1^2\)\(\sigma_2^2\) نكون الفروق السكانية غير المعروفة\(s_1^2\)\(s_2^2\) وكن عينة من الفروق. دع أحجام العينات تكون\(n_1\) و\(n_2\). نظرًا لأننا مهتمون بمقارنة تبايني العينة، فإننا نستخدم\(F\) النسبة:
\(F=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}\)
\(F\)لديه التوزيع\(F \sim F\left(n_{1}-1, n_{2}-1\right)\)
أين\(n_1 – 1\) هي درجات حرية البسط\(n_2 – 1\) وهي درجات الحرية للقاسم.
إذا كانت الفرضية الصفرية هي\(\sigma_{1}^{2}=\sigma_{2}^{2}\)، تصبح\(F\) النسبة، إحصائية الاختبار،\(F_{c}=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}=\frac{s_{1}^{2}}{s_{2}^{2}}\)
الأشكال المختلفة للفرضيات التي تم اختبارها هي:
اختبار ذو ذيلين | اختبار ذو ذيل واحد | اختبار ذو ذيل واحد |
---|---|---|
\(\mathrm{H}_{0} : \sigma_{1}^{2}=\sigma_{2}^{2}\) | \(\mathrm{H}_{0} : \sigma_{1}^{2} \leq \sigma_{2}^{2}\) | \(\mathrm{H}_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\) |
\(\mathrm{H}_{1} : \sigma_{1}^{2} \neq \sigma_{2}^{2}\) | \(\mathrm{H}_{1} : \sigma_{1}^{2}>\sigma_{2}^{2}\) | \(\mathrm{H}_{1} : \sigma_{1}^{2}<\sigma_{2}^{2}\) |
سيكون الشكل الأكثر عمومية للفرضية الصفرية والبديلة للاختبار ثنائي الذيل هو:
\[H_{0} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}}=\delta_{0}\nonumber\]
\[H_{a} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}} \neq \delta_{0}\nonumber\]
حيث إذا\(\delta_{0}=1\) كان اختبارًا بسيطًا للفرضية القائلة بأن المتغيرين متساويان. يتمتع هذا الشكل من الفرضية بميزة السماح بإجراء اختبارات أكثر من الاختلافات البسيطة ويمكن أن تستوعب اختبارات الاختلافات المحددة كما فعلنا للاختلافات في الوسائل والاختلافات في النسب. يوضح هذا الشكل من الفرضية أيضًا العلاقة بين\(F\) التوزيع و\(\chi^2\):\(F\) وهي نسبة توزيعين مربعين للتشي، وهو توزيع رأيناه في الفصل الأخير. هذا مفيد في تحديد درجات حرية\(F\) التوزيع الناتج.
إذا كانت\(s_2^2\) هناك تباينات متساوية بين\(s_1^2\) المجموعتين، فستكون القيمة قريبة وكانت إحصائية الاختبار\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\) قريبة من واحدة. ولكن إذا كان التباين السكاني مختلفين جدًا،\(s_1^2\)\(s_2^2\) ويميلان إلى الاختلاف الشديد أيضًا. يؤدي اختيار\(s_1^2\) التباين الأكبر للعينة\(\frac{s_{1}^{2}}{s_{2}^{2}}\) إلى أن تكون النسبة أكبر من واحد. إذا كانت\(s_1^2\) المسافة\(s_2^2\) متباعدة،\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\) فهذا رقم كبير.
لذلك، إذا كانت\(F\) قريبة من واحدة، فإن الأدلة تفضل الفرضية الصفرية (التباينان السكانيان متساويان). ولكن\(F\) إذا كانت أكبر بكثير من واحدة، فإن الدليل يتعارض مع الفرضية الصفرية. في الأساس، نسأل عما إذا كانت إحصائية F المحسوبة، إحصائية الاختبار، مختلفة بشكل كبير عن واحدة.
لتحديد النقاط الحرجة التي يتعين علينا العثور عليها\(F_{\alpha,df1,df2}\). انظر الملحق أ\(F\) للجدول. يحتوي هذا\(F\) الجدول على قيم لمستويات مختلفة من الأهمية من 0.1 إلى 0.001 المعينة كـ «p» في العمود الأول. للعثور على القيمة الحرجة، اختر مستوى الأهمية المطلوب وقم بالمتابعة والعبور للعثور على القيمة الحرجة عند تقاطع درجتي الحرية المختلفتين. يتمتع\(F\) التوزيع بدرجتين مختلفتين من الحرية، واحدة مرتبطة بالبسط\(_{df1}\)، والأخرى مرتبطة بالقاسم،\(_{df2}\) ولتعقيد الأمور، فإن\(F\) التوزيع ليس متماثلًا ويغير درجة الانحراف مع تغير درجات الحرية. درجات الحرية في البسط هي\(n_1-1\)، أين\(n_1\) حجم العينة للمجموعة 1، ودرجات الحرية في المقام هي\(n_2-1\)، أين\(n_2\) حجم العينة للمجموعة 2. \(F_{\alpha,df1,df2}\)سيعطي القيمة الحرجة في الطرف العلوي من\(F\) التوزيع.
للعثور على القيمة الحرجة للطرف الأدنى من التوزيع، قم بعكس درجات الحرية وتقسيم\(F\) القيمة -من الجدول إلى واحدة.
- القيمة الحرجة للذيل العلوي:\(F_{\alpha,df1,df2}\)
- القيمة الحرجة السفلية للذيل:\(1/F_{\alpha,df2,df1}\)
عندما تكون القيمة المحسوبة بين القيم الحرجة، وليس في الذيل، لا يمكننا رفض الفرضية الصفرية بأن المتغيرين جاءا من مجموعة بنفس التباين.\(F\) إذا كانت قيمة F المحسوبة في أي من الذيلين، فلا يمكننا قبول الفرضية الصفرية تمامًا كما فعلنا في جميع الاختبارات السابقة للفرضية.
طريقة بديلة للعثور على القيم الحرجة\(F\) للتوزيع تجعل استخدام\(F\) -table أسهل. نلاحظ في\(F\) الجدول -أن جميع\(F\) القيم أكبر من واحدة، وبالتالي فإن\(F\) القيمة الحرجة للذيل الأيسر ستكون دائمًا أقل من واحدة لأنه للعثور على القيمة الحرجة على الذيل الأيسر، نقسم\(F\) القيمة إلى الرقم واحد كما هو موضح أعلاه. نلاحظ أيضًا أنه إذا كان تباين العينة في عداد إحصائية الاختبار أكبر من تباين العينة في المقام، فستكون\(F\) القيمة الناتجة أكبر من واحد. وبالتالي فإن طريقة الاختزال لهذا الاختبار هي التأكد من وضع أكبر تباينَي العينة في البسط لحساب إحصائية الاختبار. هذا يعني أنه يجب العثور على القيمة الحرجة للذيل الأيمن فقط في\(F\) الجدول -table.
المثال 12.1
يهتم اثنان من معلمي الكلية بما إذا كان هناك أي اختلاف في طريقة تقييمهم لامتحانات الرياضيات أم لا. كل منهم يصنف نفس المجموعة المكونة من 10 اختبارات. تختلف درجات المعلم الأول بمقدار 52.3. تختلف درجات المعلم الثاني بنسبة 89.9. اختبر الادعاء بأن التباين الخاص بالمدرس الأول أصغر. (في معظم الكليات، من المستحسن أن تكون الاختلافات في درجات الاختبار هي نفسها تقريبًا بين المعلمين.) مستوى الأهمية هو 10٪.
- إجابة
-
الحل 12.1
اجعل 1 و 2 هما النصين الفرعيين اللذين يشيران إلى المعلم الأول والثاني، على التوالي.
\(n_1 = n_2 = 10\).
\(H_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\)و\(H_{a} : \sigma_{1}^{2}<\sigma_{2}^{2}\)
احسب إحصائية الاختبار: من خلال الفرضية الصفرية (\(\sigma_{1}^{2} \geq \sigma_{2}^{2}\))، تكون\(F\) الإحصائية:
\(F_{c}=\frac{s_{2}^{2}}{s_{1}^{2}}=\frac{89.9}{52.3}=1.719\)
القيمة الحرجة للاختبار:\(F_{9,9}=5.35\) أين\(n_1 – 1 = 9\) و\(n_2 – 1 = 9\).
اتخاذ قرار: نظرًا لأن\(F\) القيمة المحسوبة ليست في الذيل، فلا يمكننا رفضها\(H_0\).
الخلاصة: مع مستوى الأهمية بنسبة 10٪، من البيانات، لا توجد أدلة كافية لاستنتاج أن التباين في الدرجات للمدرب الأول أصغر.
التمرين 12.1
تقسم جمعية نيويورك الكورالية المطربين الذكور إلى أربع فئات من أعلى الأصوات إلى الأدنى: Tenor1 و Tenor2 و Bass1 و Bass2. في الجدول توجد ارتفاعات الرجال في مجموعتي Tenor1 و Bass2. يشك المرء في أن الرجال الأطول سيكون لديهم أصوات أقل، وأن تباين الارتفاع قد يرتفع مع الأصوات المنخفضة أيضًا. هل لدينا دليل جيد على اختلاف ارتفاعات المطربين في كل من هاتين المجموعتين (Tenor1 و Bass2)؟
المدة 1 | باس 2 | تينور 1 | باس 2 | تينور 1 | باس 2 |
---|---|---|---|---|---|
69 | 72 | 67 | 72 | 68 | 67 |
72 | 75 | 70 | 74 | 67 | 70 |
71 | 67 | 65 | 70 | 64 | 70 |
66 | 75 | 72 | 66 | 69 | |
76 | 74 | 70 | 68 | 72 | |
74 | 72 | 68 | 75 | 71 | |
71 | 72 | 64 | 68 | 74 | |
66 | 74 | 73 | 70 | 75 | |
68 | 72 | 66 | 72 |