Skip to main content
Global

8.2: فترة الثقة للانحراف المعياري للسكان غير معروفة، حالة عينة صغيرة

  • Page ID
    198721
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    في الممارسة العملية، نادرًا ما نعرف الانحراف المعياري للسكان. في الماضي، عندما كان حجم العينة كبيرًا، لم يمثل هذا مشكلة للإحصائيين. لقد استخدموا الانحرافات المعيارية للعينة كتقدير\(\sigma\) وتابعوا كما كان من قبل لحساب فترة الثقة بنتائج قريبة بدرجة كافية. هذا ما فعلناه في المثال\(\PageIndex{4}\) أعلاه. تم استبدال التقدير النقطي للانحراف المعياري في صيغة فترة الثقة للانحراف المعياري للسكان.\(s\) في هذه الحالة، هناك 80 ملاحظة أعلى بكثير من الملاحظات الثلاثين المقترحة لإزالة أي تحيز من عينة صغيرة. ومع ذلك، واجه الإحصائيون مشاكل عندما كان حجم العينة صغيرًا. تسبب حجم العينة الصغير في عدم الدقة في فترة الثقة.

    واجه ويليام إس جوسيت (1876-1937) من مصنع جينيس للبيرة في دبلن بأيرلندا هذه المشكلة. أنتجت تجاربه مع القفزات والشعير عينات قليلة جدًا. \(s\)لم ينتج عن مجرد الاستبدال\(\sigma\) بـ نتائج دقيقة عندما حاول حساب فترة الثقة. لقد أدرك أنه لا يمكنه استخدام التوزيع العادي للحساب؛ ووجد أن التوزيع الفعلي يعتمد على حجم العينة. دفعته هذه المشكلة إلى «اكتشاف» ما يسمى بتوزيع t للطالب. يأتي الاسم من حقيقة أن Gosset كتب تحت الاسم المستعار «A Student».

    حتى منتصف السبعينيات، استخدم بعض الإحصائيين تقريب التوزيع الطبيعي لأحجام العينات الكبيرة واستخدموا توزيع t الخاص بالطالب فقط لأحجام العينات التي لا تزيد عن 30 ملاحظة.

    إذا قمت برسم عينة عشوائية بسيطة من الحجم\(n\) من مجموعة سكانية ذات انحراف معياري متوسط\(\mu\) وغير معروف للسكان\(\sigma\) وقمت بحساب درجة t

    \[t=\frac{\overline{x}-\mu}{\left(\frac{s}{\sqrt{n}}\right)}\]

    ثم تتبع درجات t توزيع t للطالب\(\bf{n – 1}\) بدرجات من الحرية. درجة t لها نفس تفسير درجة z-score. يقيس مدى المسافة في وحدات الانحراف المعياري\(\overline x\) عن المتوسط\ mu. لكل حجم عينة\(n\)، يوجد توزيع حرف T مختلف للطلاب.

    تأتي درجات الحرية من حساب الانحراف المعياري للعينة\(\bf{s}\).\(\bf{n – 1}\) تذكر أنه عندما قمنا بحساب الانحراف المعياري للعينة لأول مرة، قمنا بتقسيم مجموع الانحرافات المربعة\(n – 1\) عليه، ولكننا استخدمنا\(n\) الانحرافات (\(\overline x\)القيم) للحساب\(\bf{s}\). نظرًا لأن مجموع الانحرافات هو صفر، يمكننا العثور على الانحراف الأخير بمجرد معرفة\(\bf{n – 1}\) الانحرافات الأخرى. يمكن أن تتغير\(\bf{n – 1}\) الانحرافات الأخرى أو تختلف بحرية. نسمي\(\bf{n – 1}\) الرقم بدرجات الحرية (\(df\)) اعترافًا بضياع المرء في الحسابات. تأثير فقدان درجة من الحرية هو زيادة قيمة t وزيادة فترة الثقة في العرض.

    خصائص توزيع T للطالب

    • يشبه الرسم البياني لتوزيع t للطالب المنحنى العادي القياسي وبدرجات لا نهائية من الحرية يكون التوزيع الطبيعي. يمكنك تأكيد ذلك من خلال قراءة الخلاصة بدرجات لا نهائية من الحرية للحصول على مستوى مألوف من الثقة، على سبيل المثال في العمود 0.05، مستوى 95٪ من الثقة، نجد قيمة t البالغة 1.96 بدرجات لا نهائية من الحرية.
    • متوسط توزيع t للطالب هو صفر والتوزيع متماثل حول الصفر، مرة أخرى مثل التوزيع العادي القياسي.
    • يتمتع توزيع t الخاص بالطالب باحتمالية أكبر في ذيوله مقارنة بالتوزيع العادي القياسي لأن انتشار توزيع t أكبر من انتشار المعيار العادي. لذلك سيكون الرسم البياني لتوزيع t للطالب أكثر سمكًا في الذيول وأقصر في الوسط من الرسم البياني للتوزيع العادي القياسي.
    • يعتمد الشكل الدقيق لتوزيع t للطالب على درجات الحرية. مع زيادة درجات الحرية، يصبح الرسم البياني لتوزيع t للطالب أشبه بالرسم البياني للتوزيع العادي القياسي.
    • يُفترض أن المجموعة الأساسية للملاحظات الفردية موزعة بشكل طبيعي مع متوسط عدد السكان غير المعروف\\(mu\) والانحراف المعياري السكاني غير المعروف\(\sigma\). يأتي هذا الافتراض من نظرية الحد المركزي لأن الملاحظات الفردية في هذه الحالة هي\(\overline x\) s لتوزيع العينات. لا يكون حجم السكان الأساسيين مناسبًا بشكل عام ما لم يكن صغيرًا جدًا. إذا كان الأمر طبيعيًا، فسيتم استيفاء الافتراض ولا يحتاج إلى مناقشة.

    يتم استخدام جدول الاحتمالات لتوزيع t للطالب لحساب قيم t في مختلف مستويات الثقة الشائعة الاستخدام. يعطي الجدول درجات t التي تتوافق مع مستوى الثقة (العمود) ودرجات الحرية (الصف). عند استخدام t-table، لاحظ أن بعض الجداول منسقة لإظهار مستوى الثقة في عناوين الأعمدة، بينما قد تعرض عناوين الأعمدة في بعض الجداول المنطقة المقابلة فقط في أحد الذيلين أو كليهما. لاحظ أنه في الجزء السفلي سيعرض الجدول قيمة t لدرجات لا نهائية من الحرية. رياضياً، مع زيادة درجات الحرية، يقترب\(t\) التوزيع من التوزيع العادي القياسي. يمكنك العثور على قيم Z المألوفة من خلال البحث في عمود ألفا ذي الصلة وقيمة القراءة في الصف الأخير.

    يعطي جدول t الخاص بالطالب (الجدول\(\PageIndex{6}\)) درجات t بالنظر إلى درجات الحرية والاحتمال الأيمن.

    يحتوي توزيع t الخاص بالطالب على واحدة من أكثر الخصائص المرغوبة للنظام الطبيعي: فهو متماثل. ما يفعله توزيع t الخاص بالطالب هو توزيع المحور الأفقي بحيث يتطلب الأمر عددًا أكبر من الانحرافات المعيارية لالتقاط نفس القدر من الاحتمال. في الواقع، هناك عدد لا نهائي من توزيعات t الخاصة بالطالب، واحدة لكل تعديل لحجم العينة. ومع زيادة حجم العينة، يصبح توزيع t الخاص بالطالب أكثر شبهاً بالتوزيع العادي. عندما يصل حجم العينة إلى 30، يتم عادةً استبدال التوزيع الطبيعي بـ t الخاص بالطالب لأنهم متشابهون كثيرًا. تظهر هذه العلاقة بين توزيع t الخاص بالطالب والتوزيع العادي في الشكل\(\PageIndex{8}\).

    الشكل\(\PageIndex{1}\)

    هذا مثال آخر على توزيع واحد يحد من توزيع آخر، وفي هذه الحالة يكون التوزيع الطبيعي هو التوزيع المحدود لـ t للطالب عندما تقترب درجات الحرية في الطالب من اللانهاية. يأتي هذا الاستنتاج مباشرة من اشتقاق الطلاب للتوزيع من قبل السيد جوسيت. واعترف بأن المشكلة تكمن في قلة الملاحظات وعدم وجود تقدير للانحراف المعياري للسكان. كان يستبدل الانحراف المعياري للعينة ويحصل على نتائج متقلبة. لذلك قام بإنشاء توزيع t الخاص بالطالب كنسبة من التوزيع الطبيعي وتوزيع Chi squared. إن توزيع مربع تشي هو في حد ذاته نسبة من نوعين مختلفين، في هذه الحالة تباين العينة والتباين السكاني غير المعروف. وبالتالي فإن توزيع t الخاص بالطالب مرتبط بالتوزيع الطبيعي، ولكنه يتمتع بدرجات من الحرية تأتي من تلك الخاصة بتوزيع Chi squared. يوضح الحل الجبري هذه النتيجة.

    تطوير التوزيع الإلكتروني للطلاب:

    1. \(t=\frac{z}{\sqrt{\frac{\chi^{2}}{v}}}\)

      \(Z\)أين التوزيع العادي القياسي\(X^2\) وهو التوزيع المربّع\(v\) بدرجات من الحرية.

    2. \(t=\frac{\frac{(\overline x-\mu)}{\sigma}}{\sqrt{\frac{\frac{s^{2}}{(n-1)}}{\frac{\sigma^{2}}{(n-1)}}}}\)

      عن طريق الاستبدال، وبالتالي فإن درجة حرارة الطالب مع\(v = n − 1\) درجات الحرية هي:

    3. \(t=\frac{\overline{x}-\mu}{\frac{s}{\sqrt{n}}}\)

    إعادة صياغة صيغة فترة الثقة للمتوسط للحالات التي يكون فيها حجم العينة أصغر من 30 ولا نعرف الانحراف المعياري للسكان،\(\sigma\):

    \[\overline{x}-t_{\nu, \alpha}\left(\frac{s}{\sqrt{n}}\right) \leq \mu \leq \overline{x}+t_{\nu, \alpha}\left(\frac{s}{\sqrt{n}}\right)\nonumber\]

    هنا\(s\) تم استبدال التقدير النقطي للانحراف المعياري للسكان بالانحراف المعياري للسكان\(\sigma\)\(t_{\nu}\)،\(\alpha\) وتم استبداله\(Z_{\alpha}\). يتم وضع الحرف اليوناني\(\nu\) (يُنطق nu) في الصيغة العامة اعترافًا بوجود العديد من\(t_{\nu}\) توزيعات الطلاب، واحدة لكل حجم عينة. \(\nu\)هو رمز درجات حرية التوزيع ويعتمد على حجم العينة. غالبًا ما يتم استخدام df لاختصار درجات الحرية. بالنسبة لهذا النوع من المشاكل، فإن درجات الحرية هي\(\nu = n-1\)، أين\(n\) حجم العينة. للبحث عن احتمال في جدول t الخاص بالطالب، يجب أن نعرف درجات الحرية في المشكلة.

    مثال\(\PageIndex{1}\)

    تم العثور على متوسط ربحية السهم (EPS) لـ 10 أسهم صناعية تم اختيارها عشوائيًا من تلك المدرجة في مؤشر داو جونز الصناعي بانحراف معياري قدره\(s=0.395\).\(\overline X = 1.85\) احسب فترة ثقة بنسبة 99% لمتوسط EPS لجميع الصناعات المدرجة في\(DJIA\).

    \[\overline{x}-t_{v, \alpha}\left(\frac{s}{\sqrt{n}}\right) \leq \mu \leq \overline{x}+t_{\nu, \alpha}\left(\frac{s}{\sqrt{n}}\right)\nonumber\]

    إجابة

    للمساعدة في تصور عملية حساب الفاصل الزمني الواثق، نرسم التوزيع المناسب للمشكلة. في هذه الحالة يكون هذا هو حرف الطالب لأننا لا نعرف الانحراف المعياري للسكان والعينة صغيرة، أقل من 30.

    الشكل\(\PageIndex{2}\)

    يتطلب العثور على قيمة t المناسبة قطعتين من المعلومات، مستوى الثقة المطلوب ودرجات الحرية. السؤال المطروح هو مستوى ثقة بنسبة 99٪. يظهر هذا على الرسم البياني حيث توجد (\(1-\alpha\))، مستوى الثقة، في المنطقة غير المظللة. وبالتالي، فإن احتمال كل ذيول يبلغ 0.005\(\alpha/2\). درجات الحرية لهذا النوع من المشاكل هي\(n-1= 9\). من جدول t الخاص بالطالب، في الصف الذي يحمل علامة 9 والعمود الذي يحمل علامة 0.005، يوجد عدد الانحرافات المعيارية لالتقاط 99٪ من الاحتمال، 3.2498. ثم يتم وضعها على الرسم البياني مع تذكر أن قيمة الطالب\(t\) متماثلة وبالتالي فإن قيمة t هي زائد أو ناقص على كل جانب من المتوسط.

    يؤدي إدراج هذه القيم في الصيغة إلى إعطاء النتيجة. يمكن وضع هذه القيم على الرسم البياني لمعرفة العلاقة بين توزيع وسائل العينة وتوزيع t الخاص بالطالب.\(\overline X\)

    \[\mu=\overline{X} \pm t_{\alpha / 2, \mathrm{df}=n-1} \frac{s}{\sqrt{n}}=1.851 \pm 3.2498 \frac{0.395}{\sqrt{10}}=1.8551 \pm 0.406\nonumber\]

    \[1.445 \leq \mu \leq 2.257\nonumber\]

    نذكر الاستنتاج الرسمي على النحو التالي:

    مع مستوى ثقة بنسبة 99٪، يتراوح متوسط\(EPS\) جميع الصناعات المدرجة من\(DJIA\) 1.44 دولارًا إلى 2.26 دولارًا.

    التمارين\(\PageIndex{2}\)

    تقوم بدراسة العلاج بالتنويم المغناطيسي لتحديد مدى فعاليته في زيادة عدد ساعات النوم التي يحصل عليها الأشخاص كل ليلة. يمكنك قياس ساعات النوم لـ 12 شخصًا بالنتائج التالية. قم بإنشاء فاصل ثقة بنسبة 95٪ لمتوسط عدد ساعات النوم للسكان (يُفترض أنها طبيعية) التي أخذت منها البيانات.

    8.2؛ 9.1؛ 7.7؛ 8.6؛ 6.9؛ 11.2؛ 10.1؛ 9.9؛ 8.9؛ 9.2؛ 7.5؛ 10.5