Skip to main content
Global

8.4: حساب حجم العينة n- المتغيرات العشوائية المستمرة والثنائية

  • Page ID
    198733
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    المتغيرات العشوائية المستمرة

    عادة لا نتحكم في حجم عينة مجموعة البيانات. ومع ذلك، إذا تمكنا من تحديد حجم العينة، كما هو الحال في الحالات التي نجري فيها استطلاعًا، فمن المفيد جدًا معرفة الحجم الذي يجب أن يكون عليه تقديم أكبر قدر من المعلومات. يمكن أن يكون أخذ العينات مكلفًا جدًا من حيث الوقت والمنتج. ستكلف المسوحات الهاتفية البسيطة حوالي 30.00 دولارًا لكل منها، على سبيل المثال، وتتطلب بعض العينات تدمير المنتج.

    إذا عدنا إلى صيغتنا الموحدة لتوزيع العينات للوسائل، يمكننا أن نرى أنه من الممكن حلها لـ n، وإذا فعلنا ذلك\((\overline{X}-\mu)\) فلدينا المقام.

    \[n=\frac{Z_{\alpha}^{2} \sigma^{2}}{(\overline{X}-\mu)^{2}}=\frac{Z_{\alpha}^{2} \sigma^{2}}{e^{2}}\nonumber\]

    نظرًا لأننا لم نأخذ عينة حتى الآن، فإننا لا نعرف أيًا من المتغيرات في الصيغة باستثناء أنه يمكننا ضبط\(Z_{\alpha}\) مستوى الثقة الذي نرغب فيه تمامًا كما فعلنا عند تحديد فترات الثقة. إذا وضعنا خطأً مقبولًا محددًا مسبقًا، أو تسامحًا، للفرق بين\(\overline{X}\) و\(\mu\)، والمسمى e في الصيغة، فإننا نتقدم كثيرًا في حل حجم العينة\(n\). ما زلنا لا نعرف الانحراف المعياري للسكان\(\sigma\). في الممارسة العملية، عادة ما يتم إجراء مسح مسبق يسمح بضبط الاستبيان ويعطي عينة من الانحراف المعياري الذي يمكن استخدامه. في حالات أخرى، يمكن استخدام المعلومات السابقة من الاستطلاعات الأخرى\(\sigma\) في الصيغة. في حين أن النفط الخام، فإن هذه الطريقة لتحديد حجم العينة قد تساعد في خفض التكلفة بشكل كبير. ستكون البيانات الفعلية التي تم جمعها هي التي تحدد الاستدلالات حول السكان، لذا فإن الحذر في حجم العينة مناسب ويدعو إلى مستويات عالية من الثقة وأخطاء صغيرة في أخذ العينات.

    المتغيرات العشوائية الثنائية

    ما تم القيام به في الحالات التي يتم فيها البحث عن متوسط التوزيع يمكن القيام به أيضًا عند أخذ العينات لتحديد المعلمة السكانية\(p\) للنسب. يعطي التلاعب بصيغة توحيد النسب ما يلي:

    \[n=\frac{Z_{\alpha}^{2} \mathrm{pq}}{e^{2}}\nonumber\]

    أين\(e=\left(p^{\prime}-p\right)\)، وهو الخطأ المقبول في أخذ العينات، أو التسامح، لهذا التطبيق. سيتم قياس هذا بالنقاط المئوية.

    في هذه الحالة، يكون الهدف الأساسي من بحثنا هو الصيغة\(p\)، وبالطبع\(q\) بسبب ذلك\(q =1-p\). تحدث هذه النتيجة لأن التوزيع ذي الحدين هو توزيع معلمة واحدة. إذا علمنا\(p\) فإننا نعرف المتوسط والانحراف المعياري. لذلك،\(p\) يظهر في الانحراف المعياري لتوزيع العينات وهو المكان الذي حصلنا فيه على هذه الصيغة. إذا قمنا، بحذر شديد، باستبدال 0.5،\(p\) فسنقوم بسحب أكبر حجم للعينة مطلوب والذي سيوفر مستوى الثقة المحدد\(Z \alpha\) والتسامح الذي اخترناه. وهذا صحيح لأن جميع مجموعات الكسور التي تضيف إلى كسر واحد، يكون المضاعف الأكبر عندما يكون كل كسر 0.5. بدون أي معلومات أخرى تتعلق بمعيار السكان\(p\)، هذه هي الممارسة الشائعة. قد يؤدي هذا إلى الإفراط في أخذ العينات، ولكن بالتأكيد ليس تحت أخذ العينات، وبالتالي، هذا نهج حذر.

    هناك مفاضلة مثيرة للاهتمام بين مستوى الثقة وحجم العينة الذي يظهر هنا عند النظر في تكلفة أخذ العينات. \(\PageIndex{1}\)يوضح الجدول حجم العينة المناسب بمستويات مختلفة من الثقة ومستوى مختلف من الخطأ المقبول أو التسامح.

    \ (\ فهرس الصفحات {1}\) «>
    حجم العينة المطلوب (90٪) حجم العينة المطلوب (95٪) مستوى التسامح
    1691 2401 2%
    752 1067 3%
    271 384 5%
    68 96 10%
    طاولة\(\PageIndex{1}\)

    تم تصميم هذا الجدول لإظهار الحد الأقصى لحجم العينة المطلوب على مستويات مختلفة من الثقة بالنظر إلى الافتراض\(p= 0.5\)\(q=0.5\) وكما تمت مناقشته أعلاه.

    يتم قياس الخطأ المقبول، المسمى التسامح في الجدول، بقيم زائد أو ناقص من النسبة الفعلية. على سبيل المثال، الخطأ المقبول بنسبة 5٪ يعني أنه إذا تم العثور على نسبة العينة بنسبة 26 بالمائة، فسيكون الاستنتاج هو أن نسبة السكان الفعلية تتراوح بين 21 و 31 بالمائة مع مستوى ثقة بنسبة 90 بالمائة إذا تم أخذ عينة من 271. وبالمثل، إذا تم تحديد الخطأ المقبول عند 2%، فإن نسبة السكان ستكون بين 24 و28 بالمائة مع مستوى ثقة بنسبة 90 بالمائة، ولكنها ستتطلب زيادة حجم العينة من 271 إلى 1,691. إذا أردنا مستوى أعلى من الثقة، فسنطلب حجم عينة أكبر. يتطلب الانتقال من مستوى ثقة بنسبة 90 بالمائة إلى مستوى 95 بالمائة بتفاوت زائد أو ناقص 5٪ تغيير حجم العينة من 271 إلى 384. حجم العينة الشائع جدًا الذي غالبًا ما يتم الإبلاغ عنه في الاستطلاعات السياسية هو 384. من خلال نتائج الاستطلاع، يُذكر بشكل متكرر أن النتائج جيدة إلى مستوى «الدقة» الزائد أو الناقص بنسبة 5٪.

    مثال\(\PageIndex{9}\)

    لنفترض أن شركة الهاتف المحمول تريد تحديد النسبة المئوية الحالية للعملاء الذين تزيد أعمارهم عن 50 عامًا والذين يستخدمون الرسائل النصية على هواتفهم المحمولة. كم عدد العملاء الذين تزيد أعمارهم عن 50 عامًا والذين يجب أن تستطلع الشركة آراءهم حتى يكونوا واثقين بنسبة 90٪ من أن النسبة المقدرة (العينة) تقع ضمن ثلاث نقاط مئوية من نسبة السكان الحقيقية للعملاء الذين تزيد أعمارهم عن 50 عامًا والذين يستخدمون الرسائل النصية على هواتفهم المحمولة.

    إجابة

    الحل 8.9

    من المشكلة، نعلم أن الخطأ المقبول\(e\)، هو 0.03 (3٪ = 0.03)\(z_{\frac{\alpha}{2}} Z_{0.05}=1.645\) ولأن مستوى الثقة هو 90٪. الخطأ المقبول\(e\)، هو الفرق بين نسبة السكان الفعلية p، ونسبة العينة التي نتوقع الحصول عليها من العينة.

    ومع ذلك، من أجل العثور\(n\)، نحتاج إلى معرفة النسبة المقدرة (العينة)\(p^{\prime}\). تذكر ذلك\(q^{\prime} = 1 – p^{\prime}\). لكننا لا نعرف\(p^{\prime}\) حتى الآن. نظرًا لأننا نضرب\(p^{\prime}\)\(q^{\prime}\) معًا، فإننا نجعل كلاهما يساوي 0.5 لأن\(p^{\prime}q^{\prime} = (0.5)(0.5) = 0.25\) النتائج تؤدي إلى أكبر منتج ممكن. (جرب منتجات أخرى:\((0.6)(0.4) = 0.24; (0.3)(0.7) = 0.21; (0.2)(0.8) = 0.16\) وهكذا). أكبر منتج ممكن يمنحنا أكبر عدد من العينات، وهذا يعطينا عينة كبيرة بما يكفي حتى نكون واثقين بنسبة 90٪ من أننا في حدود ثلاث نقاط مئوية من نسبة السكان الحقيقية. لحساب حجم العينة n، استخدم الصيغة وقم بعمل البدائل.

    \(n=\frac{z^{2} p^{\prime} q^{\prime}}{e^{2}} \text { gives } n=\frac{1.645^{2}(0.5)(0.5)}{0.03^{2}}=751.7\)

    قرِّب الإجابة إلى القيمة الأعلى التالية. يجب أن يكون حجم العينة 752 عميلًا للهواتف المحمولة الذين تزيد أعمارهم عن 50 عامًا حتى يكونوا واثقين بنسبة 90٪ من أن نسبة (العينة) المقدرة تقع ضمن ثلاث نقاط مئوية من نسبة السكان الحقيقية لجميع العملاء الذين تزيد أعمارهم عن 50 عامًا والذين يستخدمون الرسائل النصية على هواتفهم المحمولة.

    التمارين الرياضية\(\PageIndex{9}\)

    لنفترض أن شركة تسويق عبر الإنترنت تريد تحديد النسبة المئوية الحالية للعملاء الذين ينقرون على الإعلانات على هواتفهم الذكية. كم عدد العملاء الذين يجب على الشركة إجراء استطلاع آرائهم حتى يكونوا واثقين بنسبة 90٪ من أن النسبة المقدرة تقع في حدود خمس نقاط مئوية من النسبة السكانية الحقيقية للعملاء الذين ينقرون على الإعلانات على هواتفهم الذكية؟