Skip to main content
Global

7.1: نظرية الحد المركزي لوسائل العينة

  • Page ID
    198985
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    توزيع العينات هو توزيع نظري. تم إنشاؤه من خلال أخذ العديد من العينات ذات الحجم\(n\) من السكان. ثم يتم التعامل مع كل عينة كملاحظة واحدة لهذا التوزيع الجديد، توزيع العينات. إن عبقرية التفكير بهذه الطريقة هي أنها تدرك أنه عندما نقوم بأخذ عينات نقوم بإنشاء ملاحظة وأن هذه الملاحظة يجب أن تأتي من توزيع معين. تجيب نظرية الحد المركزي على السؤال التالي: من أي توزيع جاء متوسط العينة؟ إذا تم اكتشاف ذلك، فيمكننا معالجة متوسط العينة تمامًا مثل أي ملاحظة أخرى وحساب الاحتمالات حول القيم التي قد تتخذها. لقد انتقلنا بشكل فعال من عالم الإحصاء حيث نعرف فقط ما لدينا من العينة، إلى عالم الاحتمالات حيث نعرف التوزيع الذي جاء منه متوسط العينة ومعايير هذا التوزيع.

    الأسباب التي تجعل المرء يأخذ عينة من السكان واضحة. قد يتجاوز الوقت والنفقات لفحص كل فاتورة لتحديد صلاحيتها أو كل شحنة لمعرفة ما إذا كانت تحتوي على جميع العناصر تكلفة الأخطاء في الفواتير أو الشحن. بالنسبة لبعض المنتجات، قد يتطلب أخذ العينات تدميرها، وهو ما يسمى بأخذ العينات المدمرة. أحد الأمثلة على ذلك هو قياس قدرة المعدن على تحمل تآكل المياه المالحة لأجزاء من السفن العابرة للمحيطات.

    وبالتالي فإن أخذ العينات يثير سؤالًا مهمًا؛ فقط ما هي العينة التي تم سحبها. حتى لو تم سحب العينة عشوائيًا، فهناك نظريًا عدد لا نهائي تقريبًا من العينات. مع 100 عنصر فقط، هناك أكثر من 75 مليون عينة فريدة من الحجم الخامس يمكن استخلاصها. إذا كانت هناك ست عينات في العينة، فإن عدد العينات المحتملة يزيد إلى أكثر من مليار فقط. من بين 75 مليون عينة ممكنة، إذن، ما هي العينة التي حصلت عليها؟ إذا كان هناك اختلاف في العناصر التي سيتم أخذ عينات منها، فسيكون هناك اختلاف في العينات. يمكن للمرء أن يرسم عينة «غير محظوظة» ويخلص إلى استنتاجات خاطئة للغاية فيما يتعلق بالسكان. هذا الإدراك بأن أي عينة نرسمها هي في الحقيقة عينة واحدة فقط من توزيع العينات يزودنا بما قد يكون أهم نظرية هي الإحصاء: نظرية الحد المركزي. بدون نظرية الحد المركزي سيكون من المستحيل المضي قدمًا في الإحصاء الاستنتاجي من نظرية الاحتمالات البسيطة. في أبسط صورها، تنص نظرية الحد المركزي على أنه بغض النظر عن دالة الكثافة الاحتمالية الأساسية لبيانات السكان، فإن التوزيع النظري لوسائل العينات من السكان سيتم توزيعه بشكل طبيعي. في الأساس، يشير هذا إلى أنه يجب التعامل مع متوسط العينة كملاحظة مستمدة من التوزيع الطبيعي. لا تنطبق نظرية الحد المركزي إلا إذا كان حجم العينة «كبيرًا بما يكفي» والذي ثبت أنه يتكون من 30 ملاحظة فقط أو أكثر.

    يعرض الشكل 7.2 بيانياً هذا الاقتراح المهم للغاية.

    الشكل 7.2

    لاحظ أن المحور الأفقي في اللوحة العلوية مُسمى\(X\). هذه هي الملاحظات الفردية للسكان. هذا هو التوزيع غير المعروف لقيم السكان. تم رسم الرسم البياني بشكل هادف بشكل متعرج لإظهار أنه لا يهم مدى غرابة الكرة حقًا. تذكر أننا لن نعرف أبدًا كيف يبدو هذا التوزيع، أو الانحراف المتوسط أو المعياري لهذا الأمر.

    يتم تسمية المحور الأفقي في اللوحة السفلية بـ\(\overline{X}\) «أ». هذا هو التوزيع النظري الذي يسمى توزيع عينات الوسائل. كل ملاحظة على هذا التوزيع هي نموذج متوسط. تم حساب جميع وسائل العينة هذه من عينات فردية بنفس حجم العينة. يحتوي التوزيع النظري لأخذ العينات على جميع القيم المتوسطة للعينة من جميع العينات الممكنة التي كان من الممكن أخذها من السكان. بالطبع، لن يأخذ أي شخص بالفعل كل هذه العينات، ولكن إذا فعلوا ذلك فهذا هو الشكل الذي سيبدو عليه. وتقول نظرية الحد المركزي أنه سيتم توزيعها بشكل طبيعي.

    تذهب نظرية الحد المركزي إلى أبعد من ذلك وتخبرنا بالانحراف المتوسط والمعياري لهذا التوزيع النظري.

    الجدول 7.1
    المعلمة توزيع السكان عينة توزيع العينات\(\overline{X}\) لـ
    يعني \(\mu\) \(\overline{X}\) \ (\ السطر العلوي {X}\)» النمط = «المحاذاة الرأسية: متوسطة؛" >\(\mu_{\overline{x}} \text { and } \mathrm{E}\left(\mu_{\overline{x}}\right)=\mu\)
    الانحراف المعياري \(\sigma\) \(s\) \ (\ السطر العلوي {X}\)» النمط = «المحاذاة الرأسية: متوسطة؛" >\(\sigma_{\overline{x}}=\frac{\sigma}{\sqrt{n}}\)

    الأهمية العملية لنظرية الحد المركزي هي أنه يمكننا الآن حساب الاحتمالات لرسم متوسط العينة\(\overline{X}\)، بنفس الطريقة التي قمنا بها لرسم ملاحظات محددة، عندما عرفنا المتوسط السكاني والانحراف المعياري وأن بيانات السكان كانت\(X\) يتم توزيعها بشكل طبيعي.. يجب تعديل صيغة التوحيد للاعتراف بأن المتوسط والانحراف المعياري لتوزيع العينات، والذي يُطلق عليه أحيانًا الخطأ المعياري للمتوسط، يختلفان عن التوزيع السكاني، ولكن بخلاف ذلك لم يتغير شيء. صيغة التوحيد الجديدة هي

    \[Z=\frac{\overline{X}-\mu_{\overline{X}}}{\sigma_{\overline{X}}}=\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\nonumber\]

    لاحظ أنه\(\mu_{\overline{X}}\) في الصيغة الأولى تم تغييرها ببساطة\(\mu\) إلى الإصدار الثاني. والسبب هو أنه من الناحية الرياضية يمكن إثبات أن القيمة المتوقعة\(\mu_{\overline{X}}\) لـ تساوي\(\mu\). جاء ذلك في الجدول 7.1 أعلاه. رياضياً، يقرأ\(E(x)\) الرمز «القيمة المتوقعة لـ\(x\)». سيتم استخدام هذه الصيغة في الوحدة التالية لتوفير تقديرات لمعلمة السكان غير المعروفة\(\mu\).