7.3: نظرية الحد المركزي للنسب
تخبرنا نظرية الحد المركزي أن تقدير النقاط لمتوسط العينة يأتي من التوزيع الطبيعي لـ s.¯x هذا التوزيع النظري يسمى توزيع العينات¯x لـ s. نحن الآن نبحث في توزيع العينات لمعامل مهم آخر نرغب فيه¯x للتقدير؛p من دالة الكثافة الاحتمالية ذات الحدين.
إذا كان المتغير العشوائي منفصلًا، مثل البيانات الفئوية، فإن المعلمة التي نرغب في تقديرها هي نسبة السكان. هذا هو، بالطبع، احتمال تحقيق النجاح في أي سحب عشوائي واحد. على عكس الحالة التي تمت مناقشتها للتو للمتغير العشوائي المستمر حيث لم نكن نعرف التوزيع السكانيX لـ s، فإننا هنا نعرف بالفعل دالة الكثافة الاحتمالية الأساسية لهذه البيانات؛ إنها المعادلة ذات الحدين. المتغير العشوائيX= هو عدد النجاحات والمعامل الذي نرغب في معرفته هوp احتمال رسم النجاح وهو بالطبع نسبة النجاحات في عدد السكان. السؤال المطروح هو: من أي توزيع تمp′=xn استخلاص نسبة العينة؟ حجم العينةX هوn ولا يزال عدد النجاحات التي تم العثور عليها في تلك العينة. هذا سؤال متوازي تمت الإجابة عليه للتو من خلال نظرية الحد المركزي: من أي توزيع تم رسم متوسط العينة؟¯x لقد رأينا أنه بمجرد علمنا أن التوزيع هو التوزيع العادي، تمكنا من إنشاء فترات ثقة لمعامل السكان,μ. سنستخدم أيضًا هذه المعلومات نفسها لاختبار الفرضيات حول متوسط السكان لاحقًا. نتمنى الآن أن نكون قادرين على تطوير فترات الثقة لعامل السكان "p" من دالة الكثافة الاحتمالية ذات الحدين.
من أجل العثور على التوزيع الذي تأتي منه نسب العينة، نحتاج إلى تطوير توزيع العينات لنسب العينة تمامًا كما فعلنا لوسائل العينة. لذا تخيل مرة أخرى أننا نقوم بأخذ عينة عشوائية من 50 شخصًا واسألهم عما إذا كانوا يدعمون إصدار السندات المدرسية الجديدة. من هذا نجد عينة من النسب ونرسمها بيانيًا على محورp s. نقوم بذلك مرارًا وتكرارًا وما إلى ذلك، حتى نحصل على التوزيع النظريp للنسب. بعض نسب العينة ستظهر تفضيلاً كبيرًا لإصدار السندات بينما سيظهر البعض الآخر تفضيلاً منخفضًا بسببp′ سيعكس أخذ العينات العشوائية تباين وجهات النظر داخل السكان. يمكن رؤية ما قمنا به في الشكل7.3.9. اللوحة العلوية هي التوزيعات السكانية للاحتمالات لكل قيمة ممكنة للمتغير العشوائيX. في حين أننا لا نعرف كيف يبدو التوزيع المحدد لأننا لا نعرفp، المعلمة السكانية، إلا أننا نعلم أنها يجب أن تبدو على هذا النحو. في الواقع، لا نعرف المتوسط أو الانحراف المعياري لهذا التوزيع السكاني، وهي نفس الصعوبة التي واجهناها عند تحليل الأرقامX السابقة.
الشكل7.3.9
7.3.9يضع الشكل المتوسط على توزيع الاحتمالات السكانيةμ=np ولكننا بالطبع لا نعرف في الواقع المتوسط السكاني لأننا لا نعرف احتمالية نجاح السكان,p. تحت توزيع القيم السكانية يوجد توزيع العيناتp لـ s. مرة أخرى تخبرنا نظرية الحد المركزي أن هذا التوزيع يتم توزيعه بشكل طبيعي تمامًا مثل حالة توزيع العينات¯x لـ s. توزيع العينات هذا له أيضًا متوسط، وهو متوسط p's، والانحراف المعياري،σp′.
والأهم من ذلك، في حالة تحليل توزيع وسائل العينة، أخبرتنا نظرية الحد المركزي بالقيمة المتوقعة لمتوسط وسائل العينة في توزيع العينات، والانحراف المعياري لتوزيع العينات. مرة أخرى، توفر نظرية الحد المركزي هذه المعلومات لتوزيع العينات للنسب. الإجابات هي:
- القيمة المتوقعة لمتوسط توزيع العينات لنسب العينة,μp′, هي نسبة السكان,p.
- الانحراف المعياري لتوزيع العينات لنسب العينة,σp′, هو الانحراف المعياري للسكان مقسومًا على الجذر التربيعي لحجم العينة,n.
كلا الاستنتاجين هما نفس ما وجدناه لتوزيع العينات لوسائل العينة. ولكن في هذه الحالة، نظرًا لأن المتوسط والانحراف المعياري للتوزيع ذي الحدين يعتمدان على pp، فإن صيغة الانحراف المعياري لتوزيع العينات تتطلب التلاعب الجبري لتكون مفيدة. سنتناول ذلك في الفصل التالي. فيما يلي دليل على هذه الاستنتاجات المهمة من نظرية الحد المركزي.
E(p′)=E(xn)=(1n)E(x)=(1n)np=p
(القيمة المتوقعة لـXE(x)،، هي ببساطة متوسط التوزيع ذي الحدين الذي نعرف أنه لا.)
σ2p=Var(p′)=Var(xn)=1n2(Var(x))=1n2(np(1−p))=p(1−p)n
وبالتالي فإن الانحراف المعياري لتوزيع العينات للنسب هو:
σp,=√p(1−P)n
\ (\ فهرس الصفحات {2}\) «>المعلمة | توزيع السكان | عينة | توزيع العيناتp لـ |
---|---|---|---|
يعني | μ=np | p′=xn\) | \ (p\)» class="lt-stats-4585>p′ and E(p′)=p |
الإنحراف المعياري | σ=√npq | \ (p\)» class="lt-stats-4585>σp′=√p(1−p)n |
7.3.2يلخص الجدول هذه النتائج ويوضح العلاقة بين السكان والعينة وتوزيع العينات. لاحظ التوازي بين هذا الجدول والجدول7.3.1 للحالة التي يكون فيها المتغير العشوائي مستمرًا وكنا نعمل على تطوير توزيع العينات للوسائل.
عند مراجعة صيغة الانحراف المعياري لتوزيع العينات للنسب، نرى أنه معn زيادة الانحراف المعياري يتناقص. هذه هي نفس الملاحظة التي قدمناها للانحراف المعياري لتوزيع العينات للوسائل. مرة أخرى، مع زيادة حجم العينة، يتبين أن تقدير النقاط لأي منهماμ يأتي من توزيع ذي توزيع أضيق وأضيق.p لقد خلصنا إلى أنه مع مستوى معين من الاحتمال، يكون النطاق الذي يأتي منه تقدير النقاط أصغر كلما زاد حجم العينة.n 7.3.8يوضح الشكل هذه النتيجة لحالة وسائل العينة. ماp′ عليك سوى الاستبدال¯x ويمكننا رؤية تأثير حجم العينة على تقدير نسبة العينة.