12.3: توزيع F ونسبة F
- Page ID
- 198743
التوزيع المستخدم لاختبار الفرضيات هو توزيع جديد. يُطلق عليه اسم F Distribution، الذي ابتكره جورج سنيديكور ولكن تم تسميته تكريمًا للسير رونالد فيشر، وهو إحصائي إنجليزي. \(F\)الإحصائية هي نسبة (كسر). هناك مجموعتان من درجات الحرية؛ واحدة للبسط والأخرى للقاسم.
على سبيل المثال، إذا كان\(F\) يتبع\(F\) توزيعًا وكان عدد درجات حرية البسط هو أربعة، وعدد درجات الحرية للقاسم هو عشرة، إذن\(F \sim F_{4,10}\).
لحساب\(\bf{F}\) النسبة، يتم إجراء تقديرين للتباين.
- التباين بين العينات: تقدير\(\sigma^2\) ذلك هو تباين متوسط العينة مضروبًا في\(n\) (عندما تكون أحجام العينات هي نفسها.). إذا كانت العينات بأحجام مختلفة، يتم ترجيح التباين بين العينات لحساب أحجام العينات المختلفة. يُطلق على التباين أيضًا اسم الاختلاف بسبب العلاج أو الاختلاف الموضح.
- التباين داخل العينات: تقدير\(\sigma^2\) ذلك هو متوسط تباينات العينة (المعروف أيضًا باسم التباين المجمع). عندما تختلف أحجام العينات، يتم ترجيح التباين داخل العينات. يُطلق على التباين أيضًا اسم الاختلاف بسبب الخطأ أو الاختلاف غير المبرر.
- \(SS_{between}\)هو مجموع المربعات التي تمثل الاختلاف بين العينات المختلفة
- \(SS_{within}\)هو مجموع المربعات التي تمثل الاختلاف داخل العينات بسبب الصدفة.
العثور على «مجموع المربعات» يعني جمع كميات مربعة يمكن ترجيحها في بعض الحالات. استخدمنا مجموع المربعات لحساب تباين العينة والانحراف المعياري للعينة في الجدول 1.19.
مرض التصلب العصبي المتعدد يعني «مربع متوسط». \(MS_{between}\)هو التباين بين المجموعات،\(MS_{within}\) وهو التباين داخل المجموعات.
حساب مجموع المربعات ومتوسط المربع
- \(k\)هو عدد المجموعات المختلفة
- \(n_j\)هو حجم\(j^{th}\) المجموعة
- \(s_j\)= مجموع القيم في\(j^{th}\) المجموعة
- \(n\)هو العدد الإجمالي لجميع القيم المجمعة (إجمالي حجم العينة:\(\Sigma n_{j}\))
- \(x\)هي القيمة الوحيدة:\[\sum x=\sum s_{j} \nonumber\]
- مجموع مربعات جميع القيم من كل مجموعة مجتمعة:\[\sum x^{2} \nonumber\]
- بين تقلبات المجموعة:\[SS_{total} =\sum x^{2}-\frac{\left(\sum x^{2}\right)}{n} \nonumber\]
- مجموع المربعات:\[\sum x^{2}-\frac{\left(\sum x\right)^{2}}{n} \nonumber \]
- الاختلاف الموضح: مجموع المربعات التي تمثل الاختلاف بين العينات المختلفة:
\[SS_{between} =\sum\left[\frac{\left(s_{j}\right)^{2}}{n_{j}}\right]-\frac{\left(\sum s_{j}\right)^{2}}{n} \nonumber\] - الاختلاف غير المبرر: مجموع المربعات التي تمثل الاختلاف داخل العينات بسبب الصدفة:\[S S_{\text { within }}=S S_{\text { total }}-S S_{\text { between }} \nonumber\]
- \(df\)للمجموعات المختلفة (\(df\)البسط):\[df = k – 1 \nonumber\]
- معادلة الأخطاء داخل العينات (\(df\)للقاسم):\[df_{within} = n – k \nonumber\]
- متوسط المربع (تقدير التباين) موضح بالمجموعات المختلفة:\[M S_{\text { between }}=\frac{S S_{\text { between }}}{d f_{\text { between }}} \nonumber\]
- متوسط المربع (تقدير التباين) الذي يرجع إلى الصدفة (غير مفسر):\[M S_{\mathrm{within}}=\frac{S S_{\mathrm{within}}}{d f_{\mathrm{within}}} \nonumber\]
\(MS_{between}\)\(MS_{within}\)ويمكن كتابتها على النحو التالي:
\[\begin{align*} M S_{\mathrm{between}} & =\frac{S S_{\mathrm{between}}}{d f_{\mathrm{between}}}=\frac{S S_{\mathrm{between}}}{k-1} \\[4pt] M S_{within} &=\frac{SS_{w ithin}}{df_{within}}=\frac{SS_{within}}{n-k}\end{align*} \]
يعتمد اختبار ANOVA أحادي الاتجاه على حقيقة أنه\(M S_{between}\) يمكن أن يتأثر بالاختلافات السكانية بين وسائل المجموعات المتعددة. نظرًا لأن\(M S_{within}\) مقارنة قيم كل مجموعة بمعناها الخاص، فإن حقيقة أن وسائل المجموعة قد تكون مختلفة لا تؤثر\(M S_{within}\).
تقول الفرضية الصفرية أن جميع المجموعات هي عينات من مجموعات لها نفس التوزيع الطبيعي. تقول الفرضية البديلة أن مجموعتين على الأقل من مجموعات العينات تأتي من مجموعات ذات توزيعات طبيعية مختلفة. إذا كانت الفرضية الصفرية صحيحة،\(M S_{between}\)\(M S_{within}\) فيجب على كليهما تقدير نفس القيمة.
ملاحظة
تقول الفرضية الصفرية أن جميع وسائل مجموعة السكان متساوية. تشير فرضية الوسائل المتساوية إلى أن السكان لديهم نفس التوزيع الطبيعي، لأنه من المفترض أن السكان طبيعيون وأن لديهم تباينات متساوية.
تعريف: نسبة F أو إحصائية F
\[F=\frac{M S_{\text { between }}}{M S_{\text { within }}}\]
إذا تم\(M S_{between}\)\(M S_{within}\) تقدير القيمة نفسها (وفقًا للاعتقاد بأن\(H_0\) هذا صحيح)، فيجب أن تكون\(F\) النسبة -مساوية تقريبًا لواحد. في الغالب، ستساهم أخطاء أخذ العينات فقط في حدوث اختلافات بعيدة عن واحدة. كما تبين،\(M S_{between}\) يتكون من التباين السكاني بالإضافة إلى التباين الناتج عن الاختلافات بين العينات. \(M S_{within}\)هو تقدير التباين السكاني. نظرًا لأن الفروق تكون دائمًا إيجابية، إذا كانت الفرضية الصفرية خاطئة،\(M S_{between}\) فستكون عمومًا أكبر من\(MS_{within}\) .ثم ستكون\(F\) نسبة -أكبر من واحدة. ومع ذلك، إذا كان التأثير السكاني صغيرًا، فليس من\(M S_{within}\) المستبعد أن يكون أكبر في عينة معينة.
تم إجراء الحسابات السابقة مع مجموعات ذات أحجام مختلفة. إذا كانت المجموعات بنفس الحجم، يتم تبسيط العمليات الحسابية إلى حد ما ويمكن كتابة نسبة F على النحو التالي:
صيغة F-Ratio عندما تكون المجموعات بنفس الحجم
تم إجراء الحسابات السابقة مع مجموعات ذات أحجام مختلفة. إذا كانت المجموعات بنفس الحجم، يتم تبسيط العمليات الحسابية إلى حد ما ويمكن كتابة نسبة F كـ
\[F=\frac{n \cdot s_{\overline{x}}^{2}}{s^{2}_{ pooled }}\]
حيث
- \(n\)= حجم العينة
- \(d f_{\text {numerator}}=k-1\)
- \(d f_{\text {denominator}}=n-k\)
- \(s_{pooled}^2\)= متوسط تباينات العينة (التباين المجمع)
- \(s_{\overline x}^2\)= تباين العينة يعني
عادةً ما يتم وضع البيانات في جدول لسهولة المشاهدة. غالبًا ما يتم عرض نتائج ANOVA أحادية الاتجاه بهذه الطريقة بواسطة برامج الكمبيوتر.
مصدر الاختلاف | مجموع المربعات (\(SS\)) | درجات الحرية (\(df\)) | يعني مربع (\(MS\)) | \(F\) |
---|---|---|---|---|
عامل (بين) |
\ (SS\) ">\(SS\) (عامل) | \ (df\)) ">\(k – 1\) | \ (MS\)) ">\(MS(Factor) = \dfrac{SS(Factor)}{k– 1}\) | \ (F\) ">\(F = \dfrac{MS(Factor)}{MS(Error)}\) |
خطأ (في غضون) |
\ (SS\) ">\(SS\) (خطأ) | \ (df\)) ">\(n – k\) | \ (MS\)) ">\(MS(Error) = \dfrac{SS(Error)}{n – k}\) | \ (F\) "> |
الإجمالي | \ (SS\)) ">\(SS\) (المجموع) | \ (df\)) ">\(n – 1\) | \ (الآنسة\)) "> | \ (F\) "> |
المثال 12.2
يجب اختبار ثلاث خطط غذائية مختلفة لفقدان الوزن المتوسط. الإدخالات في الجدول هي خسائر الوزن للخطط المختلفة. يتم عرض نتائج ANOVA أحادية الاتجاه في الجدول\(\PageIndex{2}\).
الخطة 1:\(n_1 = 4\) | الخطة 2:\(n_2 = 3\) | الخطة 3:\(n_3 = 3\) |
---|---|---|
\ (n_1 = 4\) ">5 | \ (n_2 = 3\) ">3.5 | \ (n_3 = 3\) ">8 |
\ (n_1 = 4\) ">4.5 | \ (n_2 = 3\) ">7 | \ (n_3 = 3\) ">4 |
\ (n_1 = 4\) ">4 | \ (n_2 = 3\) "> | \ (n_3 = 3\) ">3.5 |
\ (n_1 = 4\) ">3 | \ (n_2 = 3\) ">4.5 | \ (n_3 = 3\) "> |
\(s_{1}=16.5, s_{2}=15, s_{3}=15.5\)
فيما يلي الحسابات اللازمة لملء جدول ANOVA أحادي الاتجاه. يتم استخدام الجدول لإجراء اختبار الفرضيات.
\[\begin{align*} S(\text { between }) &=\sum\left[\frac{\left(s_{j}\right)^{2}}{n_{j}}\right]-\frac{\left(\displaystyle \sum s_{j}\right)^{2}}{n} \\[4pt] &=\frac{s_{1}^{2}}{4}+\frac{s_{2}^{2}}{3}+\frac{s_{3}^{2}}{3}-\frac{\left(s_{1}+s_{2}+s_{3}\right)^{2}}{10}\end{align*}\]
أين\(n_{1}=4, n_{2}=3, n_{3}=3\) و\(n=n_{1}+n_{2}+n_{3}=10\).
\[\begin{align*} S(\text { between }) &= \frac{(16.5)^{2}}{4}+\frac{(15)^{2}}{3}+\frac{(15.5)^{2}}{3}-\frac{(16.5+15+15.5)^{2}}{10} \\[4pt] &=2.2458 \\[4pt] S(\text {total}) &=\sum x^{2}-\frac{\left(\sum x\right)^{2}}{n} \\[4pt] &=\left(5^{2}+4.5^{2}+4^{2}+3^{2}+3.5^{2}+7^{2}+4.5^{2}+8^{2}+4^{2}+3.5^{2}\right) -\frac{(5+4.5+4+3+3.5+7+4.5+8+4+3.5)^{2}}{10}\\[4pt] &=244-\frac{47^{2}}{10} \\[4pt] &=244-220.9 \\[4pt] & =23.1 \\[4pt] S(\text {within}) & = S(\text {total})-S S(\text {between}) \\[4pt] &=23.1-2.2458 \\[4pt] &=20.8542 \end{align*}\]
مصدر الاختلاف | مجموع المربعات (\(SS\)) | درجات الحرية (\(df\)) | يعني مربع (\(MS\)) | \(F\) |
---|---|---|---|---|
عامل (بين) |
\ (SS\) ">\(SS(Factor) = SS(Between) \\= 2.2458\) | \ (df\)) ">\(k – 1 = 3 groups – 1 \\= 2\) | \ (MS\)) ">\(MS(Factor) = \dfrac{SS(Factor)}{k – 1} \\= 2.2458/2 \\= 1.1229\) | \ (F\) ">\(F = \dfrac{MS(Factor)}{MS(Error)} \\ = \dfrac{1.1229}{2.9792} \\= 0.3769\) |
خطأ (في غضون) |
\ (SS\) ">\(SS(Error) = SS(Within) \\ = 20.8542\) | \ (df\)) ">\(n – k = 10 total data – 3 groups \\= 7\) | \ (MS\)) ">\(MS(Error) = \dfrac{SS(Error)}{n – k} \\= \dfrac{20.8542}{7} \\= 2.9792\) | \ (F\) "> |
الإجمالي | \ (SS\) ">\(SS(Total) = 2.2458 + 20.8542 \\= 23.1\) | \ (df\)) ">\(n – 1 = 10 total data – 1 \\= 9\) | \ (الآنسة\)) "> | \ (F\) "> |
التمرين 12.2
كجزء من تجربة لمعرفة كيف ستؤثر الأنواع المختلفة من غطاء التربة على إنتاج الطماطم إلى شرائح، قام طلاب Marist College بزراعة نباتات الطماطم تحت ظروف غطاء التربة المختلفة. حصلت كل مجموعة من ثلاث نباتات على أحد العلاجات التالية
- تربة عارية
- غطاء أرضي تجاري
- بلاستيك أسود
- قش
- سماد
نمت جميع النباتات في نفس الظروف وكانت من نفس الصنف. سجل الطلاب وزن الطماطم (بالجرام) التي ينتجها كل نبات من نباتات n = 15:
عارية:\(n_1 = 3\) | الغطاء الأرضي:\(n_2 = 3\) | البلاستيك:\(n_3 = 3\) | سترو:\(n_4 = 3\) | السماد:\(n_5 = 3\) |
---|---|---|---|---|
\ (n_1 = 3\) ">2,625 | \ (n_2 = 3\) ">5,348 | \ (n_3 = 3\) ">6,583 | \ (n_4 = 3\) ">7285 | \ (n_5 = 3\) ">6,277 |
\ (n_1 = 3\) ">2,997 | \ (n_2 = 3\) ">5,682 | \ (n_3 = 3\) ">8560 | \ (n_4 = 3\) ">6,897 | \ (n_5 = 3\) ">7,818 |
\ (n_1 = 3\) "> 4,915 | \ (n_2 = 3\) ">5,482 | \ (n_3 = 3\) ">3830 | \ (n_4 = 3\) ">9230 | \ (n_5 = 3\) ">8,677 |
قم بإنشاء جدول ANOVA أحادي الاتجاه.
دائمًا ما يكون اختبار فرضية ANOVA أحادي الاتجاه في الاتجاه الصحيح لأن\(F\) القيم الأكبر تظهر في الذيل الأيمن لمنحنى التوزيع F وتميل إلى جعلنا نرفض\(H_0\).
المثال 12.3
دعونا نعود إلى تمرين تقطيع الطماطم في Try It. يتم تمثيل وسائل إنتاج الطماطم في ظل ظروف التغطية الخمسة بـ\(\mu_{1}, \mu_{2}, \mu_{3}, \mu_{4}, \mu_{5}\). سنجري اختبارًا فرضيًا لتحديد ما إذا كانت جميع الوسائل متشابهة أو واحدة على الأقل مختلفة. باستخدام مستوى الدلالة البالغ 5%، اختبر الفرضية الصفرية التي تفيد بعدم وجود فرق في متوسط العوائد بين المجموعات الخمس مقابل الفرضية البديلة القائلة بأن متوسط واحد على الأقل يختلف عن الباقي.
- إجابة
-
الفرضيات الفارغة والبديلة هي:
\(H_{0} : \mu_{1}=\mu_{2}=\mu_{3}=\mu_{4}=\mu_{5}\)
\(H_{a} : \mu_{i} \neq \mu_{j}\)بعض\(i \neq j\)
يتم عرض نتائج ANOVA أحادية الاتجاه في الجدول\(\PageIndex{5}\)
طاولة\(\PageIndex{5}\) مصدر الاختلاف مجموع المربعات (\(SS\)) درجات الحرية (\(df\)) يعني مربع (\(MS\)) و عامل (بين) \ (SS\) ">36,648,561 \ (df\)) ">\(5 – 1 = 4\) \ (MS\)) ">\(\frac{36,648,561}{4}=9,162,140\) \(\frac{9,162,140}{2,044,672.6}=4.4810\) خطأ (في غضون) \ (SS\) ">20,446,726 \ (df\)) ">\(15 – 5 = 10\) \ (MS\)» class="mt-align-center>\(\frac{20,446,726}{10}=2,044,672.6\) الإجمالي \ (SS\) ">57,095,287 \ (df\)) ">\(15 – 1 = 14\) \ (الآنسة\)) "> التوزيع للاختبار:\(F_{4,10}\)
\(df(num) = 5 – 1 = 4\)
\(df(denom) = 15 – 5 = 10\)
إحصائية الاختبار:\(F = 4.4810\)
بيان الاحتمالات:\(p\text{-value }= P(F > 4.481) = 0.0248.\)
قارن\(\bf{\alpha}\)\(\bf p\) والقيمة -:\(\alpha = 0.05\),\(p\text{-value }= 0.0248\)
اتخذ قرارًا: نظرًا لأن\(\alpha > p\) -value، لا يمكننا قبوله\(H_0\).
الخلاصة: عند مستوى الأهمية البالغ 5٪، لدينا أدلة قوية إلى حد معقول على أن الاختلافات في متوسط المحاصيل لتقطيع نباتات الطماطم المزروعة في ظروف تغطية مختلفة من غير المرجح أن تكون بسبب الصدفة وحدها. قد نستنتج أن بعض المهاد على الأقل أدت إلى عوائد متوسطة مختلفة.
التمرين 12.3
يمكن أن تسبب MRSA، أو Staphylococcus aureus، عدوى بكتيرية خطيرة في مرضى المستشفيات. \(\PageIndex{6}\)يوضح الجدول أعداد المستعمرات المختلفة من مختلف المرضى الذين قد يكونون مصابين أو لا يعانون من MRSA. يتم رسم البيانات من الجدول في الشكل\(\PageIndex{2}\).
كونك = 0.6 | كونك = 0.8 | كونك = 1.0 | كونك = 1.2 | كونك = 1.4 |
---|---|---|---|---|
9 | 16 | 22 | 30 | 27 |
66 | 93 | 147 | 199 | 168 |
98 | 82 | 120 | 148 | 132 |
رسم بياني للبيانات للتركيزات المختلفة:
اختبر ما إذا كان متوسط عدد المستعمرات هو نفسه أو مختلفًا. قم ببناء جدول ANOVA، وابحث عن قيمة p، وحدد استنتاجك. استخدم مستوى أهمية بنسبة 5٪.
المثال 12.4
أخذت أربع جمعيات نسائية عينة عشوائية من الأخوات فيما يتعلق بوسائل درجاتهن في الفصل الدراسي الماضي. يتم عرض النتائج في الجدول\(\PageIndex{7}\).
نادي نسائي 1 | نادي نسائي 2 | نادي نسائي 3 | نادي نسائي 4 |
---|---|---|---|
2.17 | 2.63 | 2.63 | 3.79 |
1.85 | 1.77 | 3.78 | 3.45 |
2.83 | 3.25 | 4.00 | 3.08 |
1.69 | 1.86 | 2.55 | 2.26 |
3.33 | 2.21 | 2.45 | 3.18 |
باستخدام مستوى أهمية قدره 1٪، هل هناك فرق في متوسط الدرجات بين الجمعيات النسائية؟
- إجابة
-
دعونا\(\mu_{1}, \mu_{2}, \mu_{3}, \mu_{4}\) نكون الوسيلة السكانية للجمعيات النسائية. تذكر أن الفرضية الصفرية تدعي أن مجموعات نادي نسائي من نفس التوزيع الطبيعي. تقول الفرضية البديلة أن مجموعتين على الأقل من مجموعات نادي نسائي تأتي من مجموعات ذات توزيعات طبيعية مختلفة. لاحظ أن أحجام العينات الأربعة هي كل خمسة.
ملاحظة: هذا مثال للتصميم المتوازن، لأن كل عامل (أي نادي نسائي) له نفس عدد الملاحظات.
\(H_{0}: \mu_{1}=\mu_{2}=\mu_{3}=\mu_{4}\)
\(H_a\): ليست كل\(\mu_{1}, \mu_{2}, \mu_{3}, \mu_{4}\) الوسائل متساوية.
التوزيع للاختبار:\(F_{3,16}\)
حيث\(k = 4\) المجموعات\(n = 20\) والعينات في المجموع
\(df(num)= k – 1 = 4 – 1 = 3\)
\(df(denom) = n – k = 20 – 4 = 16\)
احسب إحصائية الاختبار:\(F = 2.23\)
رسم بياني:
بيان الاحتمالات:\(p\text{-value }= P(F > 2.23) = 0.1241\)
قارن\(\bf{\alpha}\)\(\bf p\) والقيمة -:\(\alpha = 0.01\)
\(p\text{-value }= 0.1241\)
\(\alpha < p\) -valueاتخذ قرارًا: نظرًا لأن\(\alpha < p\) -value، لا يمكنك رفضه\(H_0\).
الخلاصة: لا توجد أدلة كافية لاستنتاج وجود فرق بين متوسط الدرجات للجمعيات النسائية.
التمرين 12.4
أخذت أربعة فرق رياضية عينة عشوائية من اللاعبين فيما يتعلق بالمعدلات الإجمالية للعام الماضي. يتم عرض النتائج في الجدول\(\PageIndex{8}\).
كرة سلة | البيسبول | هوكي | اللاكروس |
---|---|---|---|
3.6 | 2.1 | 4.0 | 2.0 |
2.9 | 2.6 | 2.0 | 3.6 |
2.5 | 3.9 | 2.6 | 3.9 |
3.3 | 3.1 | 3.2 | 2.7 |
3.8 | 3.4 | 3.2 | 2.5 |
استخدم مستوى أهمية بنسبة 5٪، وحدد ما إذا كان هناك فرق في GPA بين الفرق.
المثال 12.5
يدرس فصل الصف الرابع البيئة. تتمثل إحدى المهام في زراعة نباتات الفول في أنواع مختلفة من التربة. اختار تومي زراعة نباتات الفول الخاصة به في التربة الموجودة خارج الفصل الدراسي الممزوجة بالوبر المجفف. اختارت تارا زراعة نباتات الفول الخاصة بها في التربة المزروعة التي تم شراؤها من المشتل المحلي. اختار Nick زراعة نباتات الفول الخاصة به في التربة من حديقة والدته. لم يتم استخدام أي مواد كيميائية في النباتات، فقط الماء. تم زراعتها داخل الفصل الدراسي بجوار نافذة كبيرة. قام كل طفل بزراعة خمسة نباتات. في نهاية فترة النمو، تم قياس كل نبات، وإنتاج البيانات (بالبوصة) في الجدول\(\PageIndex{9}\).
نباتات تومي | نباتات تارا | نباتات نك |
---|---|---|
24 | 25 | 23 |
21 | 31 | 27 |
23 | 23 | 22 |
30 | 20 | 30 |
23 | 28 | 20 |
هل يبدو أن الوسائط الثلاثة التي نمت فيها نباتات الفول تنتج نفس متوسط الارتفاع؟ اختبار بمستوى 3٪ من الأهمية.
- إجابة
-
هذه المرة، سنقوم بإجراء العمليات الحسابية التي تؤدي إلى إحصائية F. لاحظ أن كل مجموعة لها نفس عدد النباتات، لذلك سنستخدم الصيغة\(F^{\prime}=\frac{n \cdot s_{\overline{x}}^{2}}{s^{2}_{pooled}}\).
أولاً، احسب متوسط العينة وتباين العينة لكل مجموعة.
نباتات تومي نباتات تارا نباتات نك يعني العينة 24.2 25.4 24.4 تباين العينة 11.7 18.3 16.3 طاولة\(\PageIndex{10}\) بعد ذلك، احسب تباين وسائل المجموعة الثلاث (احسب الفرق البالغ 24.2 و 25.4 و 24.4). تباين المجموعة يعني = 0.413 =\(s_{\overline{x}}^{2}\)
ثم\(M S_{b e t w e e n}=n s_{\overline{x}}^{2}=(5)(0.413)\)\(n = 5\) أين حجم العينة (عدد النباتات التي زرعها كل طفل).
احسب متوسط تباينات العينة الثلاثة (احسب متوسط 11.7 و18.3 و16.3). متوسط تباينات العينة = 15.433 =\(\bf{s^2}\) مجمعة
ثم\(M S_{\text {within}}=s^{2} \text { pooled }=15.433\).
\(F\)الإحصائية (أو\(F\) النسبة) هي\(F=\frac{M S_{\text { between }}}{M S_{\text { within }}}=\frac{n s_{\overline{x}}^{2}}{s^{2} \text { pooled }}=\frac{(5)(0.413)}{15.433}=0.134\)
\(df\)s الخاصة بالبسط = عدد المجموعات\(– 1 = 3 – 1 = 2\).
\(df\)s للقاسم = العدد الإجمالي للعينات - عدد المجموعات\(= 15 – 3 = 12\)
توزيع الاختبار هو\(F_{2,12}\)\(F\) والإحصاء هو\(F = 0.134\)
\(p\)القيمة -هي\(P(F > 0.134) = 0.8759\).
الحل: منذ ذلك الحين\(\alpha = 0.03\) والآخر\(p\text{-value }= 0.8759\)، لا يمكنك رفض H0. (لماذا؟)
الخلاصة: مع مستوى الأهمية بنسبة 3٪، من بيانات العينة، لا تكفي الأدلة لاستنتاج أن متوسط ارتفاعات نباتات الفول مختلفة.
الترميز
الترميز الخاص\(F\) بالتوزيع هو\(F \sim F_{d f(n u m), d f(d e n o m)}\) أين\(df(num) = df_{between}\) و\(df(denom) = df_{within}\). متوسط\(F\) التوزيع هو\(\mu=\frac{d f(n u m)}{d f(\text {denom})-2}\)