7.3: نظرية الحد المركزي للنسب

Last updated
Save as PDF

Page ID: 199009

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

تخبرنا نظرية الحد المركزي أن تقدير النقاط لمتوسط العينة يأتي من التوزيع الطبيعي لـ s.\(\overline x\) هذا التوزيع النظري يسمى توزيع العينات\(\overline x\) لـ s. نحن الآن نبحث في توزيع العينات لمعامل مهم آخر نرغب فيه\(\overline x\) للتقدير؛\(p\) من دالة الكثافة الاحتمالية ذات الحدين.

إذا كان المتغير العشوائي منفصلًا، مثل البيانات الفئوية، فإن المعلمة التي نرغب في تقديرها هي نسبة السكان. هذا هو، بالطبع، احتمال تحقيق النجاح في أي سحب عشوائي واحد. على عكس الحالة التي تمت مناقشتها للتو للمتغير العشوائي المستمر حيث لم نكن نعرف التوزيع السكاني\(X\) لـ s، فإننا هنا نعرف بالفعل دالة الكثافة الاحتمالية الأساسية لهذه البيانات؛ إنها المعادلة ذات الحدين. المتغير العشوائي\(X =\) هو عدد النجاحات والمعامل الذي نرغب في معرفته هو\(p\) احتمال رسم النجاح وهو بالطبع نسبة النجاحات في عدد السكان. السؤال المطروح هو: من أي توزيع تم\(p^{\prime}=\frac{x}{n}\) استخلاص نسبة العينة؟ حجم العينة\(X\) هو\(n\) ولا يزال عدد النجاحات التي تم العثور عليها في تلك العينة. هذا سؤال متوازي تمت الإجابة عليه للتو من خلال نظرية الحد المركزي: من أي توزيع تم رسم متوسط العينة؟\(\overline x\) لقد رأينا أنه بمجرد علمنا أن التوزيع هو التوزيع العادي، تمكنا من إنشاء فترات ثقة لمعامل السكان,\(\mu\). سنستخدم أيضًا هذه المعلومات نفسها لاختبار الفرضيات حول متوسط السكان لاحقًا. نتمنى الآن أن نكون قادرين على تطوير فترات الثقة لعامل السكان "\(p\)" من دالة الكثافة الاحتمالية ذات الحدين.

من أجل العثور على التوزيع الذي تأتي منه نسب العينة، نحتاج إلى تطوير توزيع العينات لنسب العينة تمامًا كما فعلنا لوسائل العينة. لذا تخيل مرة أخرى أننا نقوم بأخذ عينة عشوائية من 50 شخصًا واسألهم عما إذا كانوا يدعمون إصدار السندات المدرسية الجديدة. من هذا نجد عينة من النسب ونرسمها بيانيًا على محور\(p\) s. نقوم بذلك مرارًا وتكرارًا وما إلى ذلك، حتى نحصل على التوزيع النظري\(p\) للنسب. بعض نسب العينة ستظهر تفضيلاً كبيرًا لإصدار السندات بينما سيظهر البعض الآخر تفضيلاً منخفضًا بسبب\(p^{\prime}\) سيعكس أخذ العينات العشوائية تباين وجهات النظر داخل السكان. يمكن رؤية ما قمنا به في الشكل\(\PageIndex{9}\). اللوحة العلوية هي التوزيعات السكانية للاحتمالات لكل قيمة ممكنة للمتغير العشوائي\(X\). في حين أننا لا نعرف كيف يبدو التوزيع المحدد لأننا لا نعرف\(p\)، المعلمة السكانية، إلا أننا نعلم أنها يجب أن تبدو على هذا النحو. في الواقع، لا نعرف المتوسط أو الانحراف المعياري لهذا التوزيع السكاني، وهي نفس الصعوبة التي واجهناها عند تحليل الأرقام\(X\) السابقة.

\(\PageIndex{9}\)يضع الشكل المتوسط على توزيع الاحتمالات السكانية\(\mu=np\) ولكننا بالطبع لا نعرف في الواقع المتوسط السكاني لأننا لا نعرف احتمالية نجاح السكان,\(p\). تحت توزيع القيم السكانية يوجد توزيع العينات\(p\) لـ s. مرة أخرى تخبرنا نظرية الحد المركزي أن هذا التوزيع يتم توزيعه بشكل طبيعي تمامًا مثل حالة توزيع العينات\(\overline x\) لـ s. توزيع العينات هذا له أيضًا متوسط، وهو متوسط \(p\)'s، والانحراف المعياري،\(\sigma_{p^{\prime}}\).

والأهم من ذلك، في حالة تحليل توزيع وسائل العينة، أخبرتنا نظرية الحد المركزي بالقيمة المتوقعة لمتوسط وسائل العينة في توزيع العينات، والانحراف المعياري لتوزيع العينات. مرة أخرى، توفر نظرية الحد المركزي هذه المعلومات لتوزيع العينات للنسب. الإجابات هي:

القيمة المتوقعة لمتوسط توزيع العينات لنسب العينة,\(\mu_{p^{\prime}}\), هي نسبة السكان,\(p\).
الانحراف المعياري لتوزيع العينات لنسب العينة,\(\sigma_{p^{\prime}}\), هو الانحراف المعياري للسكان مقسومًا على الجذر التربيعي لحجم العينة,\(n\).

كلا الاستنتاجين هما نفس ما وجدناه لتوزيع العينات لوسائل العينة. ولكن في هذه الحالة، نظرًا لأن المتوسط والانحراف المعياري للتوزيع ذي الحدين يعتمدان على pp، فإن صيغة الانحراف المعياري لتوزيع العينات تتطلب التلاعب الجبري لتكون مفيدة. سنتناول ذلك في الفصل التالي. فيما يلي دليل على هذه الاستنتاجات المهمة من نظرية الحد المركزي.

\[E\left(p^{\prime}\right)=E\left(\frac{x}{n}\right)=\left(\frac{1}{n}\right) E(x)=\left(\frac{1}{n}\right) n p=p\nonumber\]

(القيمة المتوقعة لـ\(X\)\(E(x)\)،، هي ببساطة متوسط التوزيع ذي الحدين الذي نعرف أنه لا.)

\[\sigma_{\mathrm{p}}^{2}=\operatorname{Var}\left(p^{\prime}\right)=\operatorname{Var}\left(\frac{x}{n}\right)=\frac{1}{n^{2}}(\operatorname{Var}(x))=\frac{1}{n^{2}}(n p(1-p))=\frac{p(1-p)}{n}\nonumber\]

وبالتالي فإن الانحراف المعياري لتوزيع العينات للنسب هو:

\[\sigma_{\mathrm{p}},=\sqrt{\frac{p(1-P)}{n}}\nonumber\]

\ (\ فهرس الصفحات {2}\) «>

طاولة\(\PageIndex{2}\)
المعلمة	توزيع السكان	عينة	توزيع العينات\(p\) لـ
يعني	\(\mu = np\)	\(p^{\prime}=\frac{x}{n}\)\)	\ (p\)» class="lt-stats-4585>\(p^{\prime} \text { and } E(p^{\prime})=p\)
الإنحراف المعياري	\(\sigma=\sqrt{n p q}\)		\ (p\)» class="lt-stats-4585>\(\sigma_{p^{\prime}}=\sqrt{\frac{p(1-p)}{n}}\)

\(\PageIndex{2}\)يلخص الجدول هذه النتائج ويوضح العلاقة بين السكان والعينة وتوزيع العينات. لاحظ التوازي بين هذا الجدول والجدول\(\PageIndex{1}\) للحالة التي يكون فيها المتغير العشوائي مستمرًا وكنا نعمل على تطوير توزيع العينات للوسائل.

عند مراجعة صيغة الانحراف المعياري لتوزيع العينات للنسب، نرى أنه مع\(n\) زيادة الانحراف المعياري يتناقص. هذه هي نفس الملاحظة التي قدمناها للانحراف المعياري لتوزيع العينات للوسائل. مرة أخرى، مع زيادة حجم العينة، يتبين أن تقدير النقاط لأي منهما\(\mu\) يأتي من توزيع ذي توزيع أضيق وأضيق.\(p\) لقد خلصنا إلى أنه مع مستوى معين من الاحتمال، يكون النطاق الذي يأتي منه تقدير النقاط أصغر كلما زاد حجم العينة.\(n\) \(\PageIndex{8}\)يوضح الشكل هذه النتيجة لحالة وسائل العينة. ما\(p^{\prime}\) عليك سوى الاستبدال\(\overline x\) ويمكننا رؤية تأثير حجم العينة على تقدير نسبة العينة.