Skip to main content
Global

13.6: التنبؤ باستخدام معادلة الانحدار

  • Page ID
    199040
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    تتمثل إحدى القيم المهمة لمعادلة الانحدار المقدرة في قدرتها على التنبؤ\(Y\) بتأثيرات التغيير في قيمة واحدة أو أكثر للمتغيرات المستقلة. قيمة هذا واضحة. لا يمكن وضع سياسة حذرة دون تقديرات للآثار التي قد تنتج. وفي الواقع، فإن الرغبة في تحقيق نتائج معينة هي التي تدفع إلى تشكيل معظم السياسات. يمكن أن تكون نماذج الانحدار، ولا تزال، مساعدات لا تقدر بثمن في تشكيل مثل هذه السياسات.

    تؤكد لنا نظرية Gauss-Markov أن تقدير النقاط للتأثير على المتغير التابع المشتق عن طريق وضع القيم الافتراضية للمتغيرات المستقلة التي يرغب المرء في محاكاتها في المعادلة سيؤدي إلى تقدير المتغير التابع الذي يمثل الحد الأدنى من التباين وغير المتحيز. وهذا يعني أنه من هذه المعادلة يأتي أفضل تقدير غير متحيز للنقاط y بالنظر إلى قيم\(x\).

    \[\hat{y}=b_{0}+b, X_{1 i}+\cdots+b_{k} X_{k i}\nonumber\]

    تذكر أن تقديرات النقاط لا تحمل مستوى معينًا من الاحتمالية أو مستوى الثقة، لأن النقاط ليس لها «عرض» توجد فوقه منطقة للقياس. هذا هو السبب في أننا طورنا فترات الثقة للمتوسط والنسبة في وقت سابق. نفس القلق ينشأ هنا أيضًا. هناك بالفعل طريقتان مختلفتان لمسألة تطوير تقديرات التغييرات في المتغير المستقل، أو المتغيرات، على المتغير التابع. يرغب النهج الأول في قياس القيمة المتوسطة المتوقعة لـ y من تغيير محدد في قيمة\(x\): تشير هذه القيمة المحددة إلى القيمة المتوقعة. السؤال هنا هو: ما هو التأثير المتوسط على\(y\) ذلك الذي قد ينتج عن تجارب افتراضية متعددة\(y\) على هذه القيمة المحددة لـ\(x\). تذكر أن هناك تباينًا حول المعلمة المقدرة\(x\) وبالتالي ستؤدي كل تجربة إلى تقدير مختلف قليلاً للقيمة المتوقعة لـ\(y\).

    الطريقة الثانية لتقدير تأثير قيمة محددة لـ x على y تتعامل مع الحدث كتجربة واحدة: تختار x وتضربه في المعامل ويوفر ذلك تقديرًا واحدًا لـ y. لأن هذا الأسلوب يعمل كما لو كانت هناك تجربة واحدة - التباين الموجود في المعلمة التقدير أكبر من التباين المرتبط بنهج القيمة المتوقعة.

    الاستنتاج هو أن لدينا طريقتين مختلفتين للتنبؤ بتأثير قيم المتغير (المتغيرات) المستقلة على المتغير التابع وبالتالي لدينا فترتان مختلفتان. كلاهما إجابات صحيحة على السؤال المطروح، ولكن هناك سؤالان مختلفان. لتجنب الارتباك، فإن الحالة الأولى التي نطلب فيها القيمة المتوقعة للمتوسط التقديري\(y\)، تسمى فترة الثقة كما قمنا بتسمية هذا المفهوم من قبل. الحالة الثانية، حيث نطلب تقدير التأثير على المتغير التابع y لتجربة واحدة باستخدام قيمة\(x\)، تسمى فترة التنبؤ. إحصائيات الاختبار لهذين القياسين الفتراليين اللذين ستنخفض فيهما القيمة المقدرة لـ\(y\) will هي:

    \[\text { Confidence Interval for Expected Value of Mean Value of y for } \mathrm{x}=\mathrm{x}_{\mathrm{p}}\nonumber\]

    \[\hat{y}=\pm t_{\alpha / 2} s_{e}\left(\sqrt{\frac{1}{n}+\frac{\left(x_{p}-\overline{x}\right)^{2}}{s_{x}}}\right)\nonumber\]

    \[\text { Prediction Interval for an Individual y for } x=x_{p}\nonumber\]

    \[\hat{y}=\pm t_{\alpha / 2} s_{e}\left(\sqrt{1+\frac{1}{n}+\frac{\left(x_{p}-\overline{x}\right)^{2}}{s_{x}}}\right)\nonumber\]

    \(s_e\)أين الانحراف المعياري لمصطلح الخطأ\(s_x\) وهو الانحراف المعياري\(x\) للمتغير.

    تعتبر الحسابات الرياضية لإحصاءي الاختبار هذين معقدة. توفر حزم برامج الانحدار المختلفة في الكمبيوتر برامج ضمن وظائف الانحدار إلى الشكل\(\PageIndex{15}\).

    الشكل 13.15 فترات التنبؤ والثقة لمعادلة الانحدار؛ مستوى الثقة 95٪.

    \(\PageIndex{15}\)يوضح الشكل بصريًا الفرق الذي يحدثه الانحراف المعياري في حجم الفواصل الزمنية المقدرة. وتكون فترة الثقة، التي تقيس القيمة المتوقعة للمتغير التابع، أصغر من فترة التنبؤ لنفس مستوى الثقة. تفترض طريقة القيمة المتوقعة أن التجربة أجريت عدة مرات بدلاً من مرة واحدة كما هو الحال في الطريقة الأخرى. المنطق هنا مشابه، وإن لم يكن مطابقًا، للمنطق الذي تمت مناقشته عند تطوير العلاقة بين حجم العينة والفاصل الزمني للثقة باستخدام نظرية الحد المركزي. هناك، مع زيادة عدد التجارب، تقلص التوزيع وأصبحت فترة الثقة أكثر إحكامًا حول القيمة المتوقعة للمتوسط.

    من المهم أيضًا ملاحظة أن الفواصل الزمنية حول تقدير النقاط تعتمد بشكل كبير على نطاق البيانات المستخدمة لتقدير المعادلة بغض النظر عن النهج المستخدم للتنبؤ. تذكر أن جميع معادلات الانحدار تمر بنقطة المتوسط، أي القيمة المتوسطة\(y\) والقيم المتوسطة لجميع المتغيرات المستقلة في المعادلة. نظرًا لأن القيمة\(x\) المختارة لتقدير القيمة المرتبطة بـ\(y\) هي أبعد عن نقطة المتوسط، فإن عرض الفاصل الزمني المقدر حول الشكل\(\PageIndex{16}\) يوضح هذه العلاقة.

    الشكل 13.16 فترة الثقة لقيمة فردية تبلغ\(x\)،\(X_p\)، عند مستوى ثقة بنسبة 95%

    \(\PageIndex{16}\)يوضح الشكل الاهتمام بجودة الفاصل الزمني المقدر سواء كان فترة تنبؤ أو فترة ثقة. نظرًا لأن القيمة المختارة للتنبؤ\(y\)،\(X_p\) في الرسم البياني، بعيدة عن الوزن المركزي للبيانات\(\overline X\)، فإننا نرى الفاصل الزمني يتوسع في العرض حتى مع الحفاظ على مستوى الثقة ثابتًا. يوضح هذا أن دقة أي تقدير ستتناقص عندما يحاول المرء التنبؤ بما يتجاوز الوزن الأكبر للبيانات وبالتأكيد سوف تتحلل بسرعة للتنبؤات خارج نطاق البيانات. لسوء الحظ، هذا هو المكان الذي ترغب فيه معظم التنبؤات. يمكن صنعها، لكن عرض فترة الثقة قد يكون كبيرًا جدًا بحيث يجعل التنبؤ عديم الفائدة. ومع ذلك، يمكن فقط للحساب الفعلي والتطبيق المحدد تحديد ذلك.

    مثال\(\PageIndex{6}\)

    تذكر مثال الاختبار الثالث/الاختبار النهائي.

    لقد وجدنا معادلة الخط الأنسب لدرجة الاختبار النهائي كدالة للدرجة في الاختبار الثالث. يمكننا الآن استخدام خط انحدار المربعات الصغرى للتنبؤ. افترض أن المعامل الخاص بـ\(X\) قد تم تحديده ليكون مختلفًا بشكل كبير عن الصفر.

    لنفترض أنك تريد تقدير أو توقع متوسط درجة الاختبار النهائي لطلاب الإحصاء الذين حصلوا على 73 في الاختبار الثالث. تتراوح درجات الاختبار (\(\bf x\)-القيم) من 65 إلى 75. نظرًا لأن 73 تقع بين القيمتين x 65 و 75، فإننا نشعر بالراحة لاستبدال\(x = 73\) المعادلة. ثم:

    \[\hat{y}=-173.51+4.83(73)=179.08\nonumber\]

    نتوقع أن طلاب الإحصاء الذين يحصلون على درجة 73 في الاختبار الثالث سيحصلون على درجة 179.08 في الاختبار النهائي، في المتوسط.

    أ: ماذا تتوقع أن تكون درجة الاختبار النهائي للطالب الذي حصل على 66 في الاختبار الثالث؟

    إجابة

    الحل 13.6

    (أ) 145.27

    ب- ماذا تتوقع أن تكون درجة الاختبار النهائي للطالب الذي حصل على 90 في الاختبار الثالث؟

    إجابة

    الحل 13.6

    ب- تتراوح\(x\) القيم في البيانات بين 65 و 75. تقع التسعين خارج نطاق\(x\) القيم المرصودة في البيانات (المتغير المستقل)، لذلك لا يمكنك التنبؤ بشكل موثوق بنتيجة الاختبار النهائي لهذا الطالب. (على الرغم من أنه من الممكن إدخال 90 في المعادلة لحساب\(x\)\(y\) القيمة المقابلة، فإن\(y\) القيمة التي تحصل عليها ستحتوي على فاصل ثقة قد لا يكون ذا معنى.)

    لكي نفهم حقًا مدى عدم موثوقية التنبؤ خارج\(x\) القيم المرصودة في البيانات، قم بإجراء الاستبدال\(x = 90\) في المعادلة.

    \(\hat{y}=-173.51+4.83(90)=261.19\)

    من المتوقع أن تكون درجة الاختبار النهائي 261.19. أكبر درجة يمكن أن تصل إليها في الاختبار النهائي هي 200.