2.4: تحليل النتائج
- Page ID
- 199522
هل تعلم أنه مع زيادة مبيعات الآيس كريم، يزداد المعدل الإجمالي للجريمة؟ هل من الممكن أن يؤدي الانغماس في نكهة الآيس كريم المفضلة لديك إلى موجة من الجريمة؟ أو بعد ارتكاب الجريمة، هل تعتقد أنك قد تقرر علاج نفسك بالمخروط؟ ليس هناك شك في وجود علاقة بين الآيس كريم والجريمة (على سبيل المثال، هاربر، 2013)، ولكن سيكون من الحماقة جدًا أن نقرر أن شيئًا واحدًا تسبب بالفعل في حدوث الآخر.
من المرجح أن تكون مبيعات الآيس كريم ومعدلات الجريمة مرتبطة بدرجة الحرارة في الخارج. عندما تكون درجة الحرارة دافئة، يكون هناك الكثير من الناس خارج منازلهم، يتفاعلون مع بعضهم البعض، وينزعجون من بعضهم البعض، وأحيانًا يرتكبون جرائم. أيضًا، عندما يكون الجو دافئًا بالخارج، فمن المرجح أن نبحث عن علاج رائع مثل الآيس كريم. كيف نحدد ما إذا كانت هناك بالفعل علاقة بين شيئين؟ وعندما تكون هناك علاقة، كيف يمكننا تمييز ما إذا كانت تُعزى إلى الصدفة أو السببية؟
البحث الارتباطي
الارتباط يعني أن هناك علاقة بين متغيرين أو أكثر (مثل استهلاك الآيس كريم والجريمة)، ولكن هذه العلاقة لا تعني بالضرورة السبب والنتيجة. عندما يتم ربط متغيرين، فهذا يعني ببساطة أنه عندما يتغير أحد المتغيرات، يتغير الآخر أيضًا. يمكننا قياس الارتباط من خلال حساب إحصائية تعرف باسم معامل الارتباط. معامل الارتباط هو رقم من -1 إلى +1 يشير إلى قوة واتجاه العلاقة بين المتغيرات. عادة ما يتم تمثيل معامل الارتباط بالحرف r.
يشير الجزء الرقمي من معامل الارتباط إلى قوة العلاقة. كلما اقترب الرقم من 1 (سواء كان سالبًا أو إيجابيًا)، زادت قوة ارتباط المتغيرات، وستكون التغييرات التي يمكن التنبؤ بها في متغير واحد مع تغير المتغير الآخر. كلما اقترب الرقم من الصفر، كلما كانت العلاقة أضعف، وكلما قلت إمكانية التنبؤ بالعلاقات بين المتغيرات. على سبيل المثال، يشير معامل الارتباط البالغ 0.9 إلى علاقة أقوى بكثير من معامل الارتباط البالغ 0.3. إذا لم تكن المتغيرات مرتبطة ببعضها البعض على الإطلاق، فإن معامل الارتباط هو 0. المثال أعلاه حول الآيس كريم والجريمة هو مثال لمتغيرين قد نتوقع عدم وجود علاقة بينهما.
تشير العلامة - الإيجابية أو السلبية - لمعامل الارتباط إلى اتجاه العلاقة (الشكل 2.12). الارتباط الإيجابي يعني أن المتغيرات تتحرك في نفس الاتجاه. وبعبارة أخرى، فهذا يعني أنه كلما زاد أحد المتغيرات يزداد الآخر، وعلى العكس، عندما ينخفض أحد المتغيرات، يزداد الآخر. الارتباط السلبي يعني أن المتغيرات تتحرك في اتجاهين متعاكسين. إذا كان هناك متغيران مترابطين بشكل سلبي، فإن الانخفاض في أحد المتغيرات يرتبط بزيادة في المتغير الآخر والعكس صحيح.
يعتبر مثال الآيس كريم ومعدلات الجريمة ارتباطًا إيجابيًا لأن كلا المتغيرين يزيدان عندما تكون درجات الحرارة أكثر دفئًا. ومن الأمثلة الأخرى على الارتباطات الإيجابية العلاقة بين طول الفرد ووزنه أو العلاقة بين عمر الشخص وعدد التجاعيد. قد يتوقع المرء وجود علاقة سلبية بين إرهاق شخص ما أثناء النهار وعدد ساعات نومه في الليلة السابقة: تقل كمية النوم مع زيادة الشعور بالتعب. في مثال واقعي للارتباط السلبي، وجد الباحثون الطلاب في جامعة مينيسوتا ارتباطًا سلبيًا ضعيفًا (r = -0.29) بين متوسط عدد الأيام في الأسبوع التي يحصل فيها الطلاب على أقل من 5 ساعات من النوم ومعدل GPA (Lowry, Dean, & Manders, 2010). ضع في اعتبارك أن الارتباط السلبي ليس مثل عدم الارتباط. على سبيل المثال، ربما لن نجد أي ارتباط بين ساعات النوم وحجم الحذاء.
كما ذكرنا سابقًا، فإن الارتباطات لها قيمة تنبؤية. تخيل أنك عضو في لجنة القبول في إحدى الجامعات الكبرى. تواجه عددًا كبيرًا من الطلبات، ولكنك قادر على استيعاب نسبة صغيرة فقط من مجموعة المتقدمين. كيف يمكنك أن تقرر من يجب قبوله؟ يمكنك محاولة ربط المعدل التراكمي للطلاب الحاليين في الكلية بدرجاتهم في الاختبارات الموحدة مثل SAT أو ACT. من خلال ملاحظة الارتباطات الأقوى لطلابك الحاليين، يمكنك استخدام هذه المعلومات للتنبؤ بالنجاح النسبي للطلاب الذين تقدموا للقبول في الجامعة.
الارتباط لا يشير إلى السببية
يعد البحث الارتباطي مفيدًا لأنه يسمح لنا باكتشاف قوة واتجاه العلاقات الموجودة بين متغيرين. ومع ذلك، فإن الارتباط محدود لأن إثبات وجود علاقة يخبرنا القليل عن السبب والنتيجة. في حين أن المتغيرات ترتبط أحيانًا لأن أحدهما يسبب الآخر، فقد يكون أيضًا أن هناك عاملاً آخر، وهو متغير مربك، يتسبب بالفعل في الحركة المنهجية في المتغيرات ذات الاهتمام لدينا. في مثال معدل الآيس كريم/الجريمة المذكور سابقًا، تعد درجة الحرارة متغيرًا مربكًا يمكن أن يفسر العلاقة بين المتغيرين.
حتى عندما لا نستطيع الإشارة إلى متغيرات مربكة واضحة، يجب ألا نفترض أن الارتباط بين متغيرين يعني أن أحد المتغيرات يسبب تغييرات في متغير آخر. قد يكون هذا محبطًا عندما تبدو علاقة السبب والنتيجة واضحة وبديهية. فكر مرة أخرى في مناقشتنا للبحث الذي أجرته جمعية السرطان الأمريكية وكيف كانت مشاريعهم البحثية من أوائل العروض التوضيحية للعلاقة بين التدخين والسرطان. يبدو من المعقول افتراض أن التدخين يسبب السرطان، ولكن إذا اقتصرنا على البحث المرتبط، فسوف نتجاوز حدودنا من خلال وضع هذا الافتراض.
لسوء الحظ، يقدم الناس عن طريق الخطأ ادعاءات السببية كدالة للارتباطات طوال الوقت. هذه الادعاءات شائعة بشكل خاص في الإعلانات والقصص الإخبارية. على سبيل المثال، وجدت الأبحاث الحديثة أن الأشخاص الذين يتناولون الحبوب بشكل منتظم يحققون أوزان صحية أكثر من أولئك الذين نادراً ما يتناولون الحبوب (فرانتزن، تريفينيو، إيتشون، غارسيا دومينيك، وديماركو، 2013؛ بارتون وآخرون، 2005). خمن كيف تبلغ شركات الحبوب عن هذه النتيجة. هل يؤدي تناول الحبوب حقًا إلى الحفاظ على وزن صحي للفرد، أو هل هناك تفسيرات أخرى محتملة، مثل أن شخصًا يتمتع بوزن صحي أكثر عرضة لتناول وجبة إفطار صحية بانتظام من شخص يعاني من السمنة أو شخص يتجنب الوجبات في محاولة لنظام غذائي (الشكل 2). 13)؟ في حين أن البحث الارتباطي لا يقدر بثمن في تحديد العلاقات بين المتغيرات، فإن أحد القيود الرئيسية هو عدم القدرة على إثبات السببية. يريد علماء النفس الإدلاء ببيانات حول السبب والنتيجة، ولكن الطريقة الوحيدة للقيام بذلك هي إجراء تجربة للإجابة على سؤال بحثي. يصف القسم التالي كيف تدمج التجارب العلمية طرقًا تقضي على التفسيرات البديلة أو تتحكم فيها، مما يسمح للباحثين باستكشاف كيفية تغير التغييرات في متغير واحد في متغير آخر.
ارتباطات وهمية
إن إغراء الإدلاء ببيانات السبب والنتيجة الخاطئة بناءً على البحث الارتباطي ليس الطريقة الوحيدة التي نميل بها إلى إساءة تفسير البيانات. نميل أيضًا إلى ارتكاب خطأ الارتباطات الوهمية، خاصة مع الملاحظات غير المنهجية. تحدث الارتباطات الوهمية، أو الارتباطات الخاطئة، عندما يعتقد الناس أن العلاقات موجودة بين شيئين عندما لا توجد مثل هذه العلاقة. أحد الارتباطات الوهمية المعروفة هو التأثير المفترض لمراحل القمر على السلوك البشري. يؤكد الكثير من الناس بشغف أن السلوك البشري يتأثر بمرحلة القمر، وعلى وجه التحديد، أن الناس يتصرفون بشكل غريب عندما يكتمل القمر (الشكل 2.14).
لا يمكن إنكار أن القمر يمارس تأثيرًا قويًا على كوكبنا. يرتبط المد والجزر في المحيط ارتباطًا وثيقًا بقوى الجاذبية للقمر. لذلك يعتقد الكثير من الناس أنه من المنطقي أن نتأثر بالقمر أيضًا. بعد كل شيء، تتكون أجسامنا إلى حد كبير من الماء. ومع ذلك، أظهر التحليل التلوي لما يقرب من 40 دراسة باستمرار أن العلاقة بين القمر وسلوكنا غير موجودة (Rotton & Kelly، 1985). في حين أننا قد نولي المزيد من الاهتمام للسلوك الغريب خلال المرحلة الكاملة من القمر، إلا أن معدلات السلوك الغريب تظل ثابتة طوال دورة القمر.
لماذا نحن مستعدون جدًا للإيمان بعلاقات وهمية كهذه؟ غالبًا ما نقرأ أو نسمع عنها ونقبل ببساطة المعلومات على أنها صالحة. أو، لدينا حدس حول كيفية عمل شيء ما ثم نبحث عن أدلة لدعم هذا الحدس، متجاهلين الأدلة التي من شأنها أن تخبرنا أن حدسنا خاطئ؛ وهذا ما يعرف بالتحيز التأكيدي. في أحيان أخرى، نجد ارتباطات وهمية تستند إلى المعلومات التي تتبادر إلى الذهن بسهولة، حتى لو كانت هذه المعلومات محدودة للغاية. وبينما قد نشعر بالثقة في أنه يمكننا استخدام هذه العلاقات لفهم العالم من حولنا والتنبؤ به بشكل أفضل، إلا أن الارتباطات الوهمية يمكن أن تكون لها عيوب كبيرة. على سبيل المثال، تشير الأبحاث إلى أن الارتباطات الوهمية - التي تُنسب فيها بعض السلوكيات بشكل غير دقيق إلى مجموعات معينة - تشارك في تكوين مواقف متحيزة يمكن أن تؤدي في النهاية إلى سلوك تمييزي (Fiedler، 2004).
السببية: إجراء التجارب واستخدام البيانات
كما تعلمت، فإن الطريقة الوحيدة لإثبات وجود علاقة السبب والنتيجة بين متغيرين هي إجراء تجربة علمية. التجربة لها معنى مختلف في السياق العلمي عنه في الحياة اليومية. في المحادثة اليومية، غالبًا ما نستخدمه لوصف تجربة شيء ما لأول مرة، مثل تجربة أسلوب شعر جديد أو طعام جديد. ومع ذلك، في السياق العلمي، تحتوي التجربة على متطلبات دقيقة للتصميم والتنفيذ.
الفرضية التجريبية
من أجل إجراء تجربة، يجب أن يكون لدى الباحث فرضية محددة ليتم اختبارها. كما تعلمت، يمكن صياغة الفرضيات إما من خلال الملاحظة المباشرة للعالم الحقيقي أو بعد مراجعة دقيقة للبحث السابق. على سبيل المثال، إذا كنت تعتقد أن استخدام التكنولوجيا في الفصل الدراسي له تأثيرات سلبية على التعلم، فأنت قد صاغت أساسًا فرضية - وهي أن استخدام التكنولوجيا في الفصل الدراسي يجب أن يكون محدودًا لأنها تقلل من التعلم. كيف يمكن أن تكون قد وصلت إلى هذه الفرضية بالذات؟ ربما لاحظت أن زملائك في الفصل الذين يقومون بتدوين الملاحظات على أجهزة الكمبيوتر المحمولة الخاصة بهم يؤدون مستويات أقل في اختبارات الفصل مقارنة بمن يقومون بتدوين الملاحظات يدويًا، أو أولئك الذين يتلقون درسًا عبر برنامج كمبيوتر مقابل مدرس شخصي لديهم مستويات مختلفة من الأداء عند الاختبار (الشكل 2.15) ).
هذه الأنواع من الملاحظات الشخصية هي التي تقودنا غالبًا إلى صياغة فرضية محددة، ولكن لا يمكننا استخدام الملاحظات الشخصية المحدودة والأدلة القصصية لاختبار فرضيتنا بدقة. بدلاً من ذلك، لمعرفة ما إذا كانت بيانات العالم الحقيقي تدعم فرضيتنا، يتعين علينا إجراء تجربة.
تصميم تجربة
يتضمن التصميم التجريبي الأساسي مجموعتين: المجموعة التجريبية ومجموعة التحكم. تم تصميم المجموعتين ليكونا متماثلتين باستثناء اختلاف واحد - التلاعب التجريبي. تحصل المجموعة التجريبية على المعالجة التجريبية - أي العلاج أو المتغير الذي يتم اختباره (في هذه الحالة، استخدام التكنولوجيا) - ولا تحصل المجموعة الضابطة على ذلك. نظرًا لأن التلاعب التجريبي هو الفرق الوحيد بين المجموعات التجريبية والمجموعات الضابطة، يمكننا التأكد من أن أي اختلافات بين الاثنين ترجع إلى التلاعب التجريبي وليس الصدفة.
في مثالنا عن كيفية تقييد استخدام التكنولوجيا في الفصل الدراسي، لدينا مجموعة تجريبية تتعلم الجبر باستخدام برنامج كمبيوتر ثم تختبر تعلمها. نقيس التعلم في مجموعة التحكم الخاصة بنا بعد أن يتم تعليمهم الجبر من قبل معلم في فصل دراسي تقليدي. من المهم أن يتم التعامل مع المجموعة الضابطة بشكل مشابه للمجموعة التجريبية، باستثناء أن المجموعة الضابطة لا تتلقى المعالجة التجريبية.
نحتاج أيضًا إلى تحديد أو تفعيل كيفية قياس تعلم الجبر بدقة. التعريف التشغيلي هو وصف دقيق لمتغيراتنا، وهو مهم في السماح للآخرين بفهم كيف وماذا يقيسه الباحث بالضبط في تجربة معينة. عند تفعيل التعلم، قد نختار النظر إلى الأداء في اختبار يغطي المواد التي تم تعليم الأفراد عليها من قبل المعلم أو برنامج الكمبيوتر. قد نطلب أيضًا من المشاركين تلخيص المعلومات التي تم تقديمها للتو بطريقة ما. مهما كان ما نحدده، فمن المهم أن نقوم بتفعيل التعلم بطريقة تجعل أي شخص يسمع عن دراستنا لأول مرة يعرف بالضبط ما نعنيه بالتعلم. هذا يساعد الناس على تفسير بياناتنا وكذلك قدرتهم على تكرار تجربتنا إذا اختاروا القيام بذلك.
بمجرد تفعيل ما يعتبر استخدامًا للتكنولوجيا وما يعتبر تعلمًا لدى المشاركين في تجربتنا، نحتاج إلى تحديد كيفية إجراء تجربتنا. في هذه الحالة، قد نطلب من المشاركين قضاء 45 دقيقة في تعلم الجبر (إما من خلال برنامج كمبيوتر أو مع مدرس رياضيات شخصي) ثم إجراء اختبار لهم على المواد التي تمت تغطيتها خلال 45 دقيقة.
من الناحية المثالية، لا يكون الأشخاص الذين يسجلون الاختبارات على دراية بمن تم تعيينه في المجموعة التجريبية أو المجموعة الضابطة، من أجل التحكم في تحيز المجرب. يشير تحيز المجرب إلى احتمال أن تؤدي توقعات الباحث إلى تحريف نتائج الدراسة. تذكر أن إجراء التجربة يتطلب الكثير من التخطيط، والأشخاص المشاركين في المشروع البحثي لديهم مصلحة راسخة في دعم فرضياتهم. إذا كان المراقبون يعرفون الطفل الذي ينتمي إلى أي مجموعة، فقد يؤثر ذلك على كيفية تفسيرهم للردود الغامضة، مثل الكتابة اليدوية القذرة أو الأخطاء الحسابية البسيطة. من خلال عدم معرفة أي طفل في أي مجموعة، فإننا نحمي من تلك التحيزات. هذا الموقف عبارة عن دراسة أحادية التعمية، مما يعني أن إحدى المجموعات (المشاركين) لا تعرف المجموعة التي تنتمي إليها (التجربة أو المجموعة الضابطة) بينما يعرف الباحث الذي طور التجربة المشاركين في كل مجموعة.
في دراسة مزدوجة التعمية، يعمى كل من الباحثين والمشاركين عن المهام الجماعية. لماذا يرغب الباحث في إجراء دراسة لا يعرف فيها أحد من هم في أي مجموعة؟ لأنه من خلال القيام بذلك، يمكننا التحكم في توقعات كل من المجرب والمشاركين. إذا كنت على دراية بعبارة تأثير الدواء الوهمي، فلديك بالفعل فكرة عن سبب أهمية هذا الأمر. يحدث تأثير الدواء الوهمي عندما تؤثر توقعات الناس أو معتقداتهم أو تحدد تجربتهم في موقف معين. بعبارة أخرى، مجرد توقع حدوث شيء ما يمكن أن يجعله يحدث بالفعل.
عادة ما يتم وصف تأثير الدواء الوهمي من حيث اختبار فعالية الدواء الجديد. تخيل أنك تعمل في شركة أدوية، وتعتقد أن لديك دواءً جديدًا فعالًا في علاج الاكتئاب. لإثبات فعالية الدواء الخاص بك، يمكنك إجراء تجربة على مجموعتين: المجموعة التجريبية تتلقى الدواء، والمجموعة الضابطة لا تفعل ذلك. لكنك لا تريد أن يعرف المشاركون ما إذا كانوا قد تلقوا الدواء أم لا.
لماذا هذا؟ تخيل أنك مشارك في هذه الدراسة، وقد تناولت للتو حبة تعتقد أنها ستحسن مزاجك. نظرًا لأنك تتوقع أن يكون للحبوب تأثير، فقد تشعر بتحسن لمجرد أنك تناولت حبوب منع الحمل وليس بسبب أي دواء موجود بالفعل في حبوب منع الحمل - هذا هو تأثير الدواء الوهمي.
للتأكد من أن أي تأثيرات على الحالة المزاجية ترجع إلى الدواء وليس بسبب التوقعات، تتلقى المجموعة الضابطة دواءً وهميًا (في هذه الحالة حبة سكر). الآن يحصل الجميع على حبوب منع الحمل، ومرة أخرى لا يعرف الباحث ولا المشاركون التجريبيون من حصل على الدواء ومن حصل على حبة السكر. يمكن الآن أن تُعزى أي اختلافات في الحالة المزاجية بين المجموعتين التجريبية والضابطة إلى الدواء نفسه وليس إلى تحيز المجرب أو توقعات المشاركين (الشكل 2.16).
المتغيرات المستقلة والمعتمدة
في تجربة بحثية، نسعى جاهدين لدراسة ما إذا كانت التغييرات في شيء ما تسبب تغييرات في شيء آخر. ولتحقيق ذلك، يجب الانتباه إلى متغيرين مهمين، أو أشياء يمكن تغييرها، في أي دراسة تجريبية: المتغير المستقل والمتغير التابع. يتم التلاعب بالمتغير المستقل أو التحكم فيه من قبل المجرب. في دراسة تجريبية جيدة التصميم، يكون المتغير المستقل هو الفرق الوحيد المهم بين المجموعات التجريبية والضابطة. في مثالنا عن كيفية تأثير استخدام التكنولوجيا في الفصل الدراسي على التعلم، فإن المتغير المستقل هو نوع التعلم من قبل المشاركين في الدراسة (الشكل 2.17). المتغير التابع هو ما يقيسه الباحث لمعرفة مدى تأثير المتغير المستقل. في مثالنا، المتغير التابع هو التعلم الذي أظهره المشاركون لدينا.
نتوقع أن المتغير التابع سيتغير كدالة للمتغير المستقل. بمعنى آخر، يعتمد المتغير التابع على المتغير المستقل. هناك طريقة جيدة للتفكير في العلاقة بين المتغيرات المستقلة والمتغيرات التابعة وهي بهذا السؤال: ما تأثير المتغير المستقل على المتغير التابع؟ بالعودة إلى مثالنا، ما هو تأثير تعلم الدرس من خلال برنامج كمبيوتر مقابل من خلال مدرب شخصي؟
اختيار المشاركين التجريبيين وتعيينهم
الآن بعد أن تم تصميم دراستنا، نحتاج إلى الحصول على عينة من الأفراد لتضمينهم في تجربتنا. تتضمن دراستنا مشاركين بشريين لذلك نحتاج إلى تحديد الأشخاص الذين يجب تضمينهم. المشاركون هم موضوعات البحث النفسي، وكما يوحي الاسم، يشارك الأفراد الذين يشاركون في البحث النفسي بنشاط في هذه العملية. في كثير من الأحيان، تعتمد مشاريع البحث النفسي على طلاب الجامعات للعمل كمشاركين. في الواقع، فإن الغالبية العظمى من الأبحاث في مجالات علم النفس الفرعية شملت الطلاب تاريخيًا كمشاركين في البحث (Sears، 1986؛ Arnett، 2008). لكن هل طلاب الجامعات يمثلون حقًا عامة السكان؟ يميل طلاب الجامعات إلى أن يكونوا أصغر سنًا وأكثر تعليمًا وأكثر ليبرالية وأقل تنوعًا من عامة السكان. على الرغم من أن استخدام الطلاب كمواضيع اختبار هو ممارسة مقبولة، إلا أن الاعتماد على مثل هذه المجموعة المحدودة من المشاركين في البحث يمكن أن يمثل مشكلة لأنه من الصعب تعميم النتائج على عدد أكبر من السكان.
تشمل تجربتنا الافتراضية طلاب المدارس الثانوية، ويجب علينا أولاً إنشاء عينة من الطلاب. يتم استخدام العينات لأن عدد السكان عادة ما يكون كبيرًا جدًا بحيث لا يمكن إشراك كل عضو بشكل معقول في تجربتنا الخاصة (الشكل 2.18). إذا كان ذلك ممكنًا، يجب أن نستخدم عينة عشوائية (هناك أنواع أخرى من العينات، ولكن لأغراض هذا الفصل، سنركز على العينات العشوائية). العينة العشوائية هي مجموعة فرعية من عدد أكبر من السكان حيث يتمتع كل فرد من السكان بفرصة متساوية للاختيار. تُفضل العينات العشوائية لأنه إذا كانت العينة كبيرة بما يكفي يمكننا التأكد بشكل معقول من أن الأفراد المشاركين يمثلون العدد الأكبر من السكان. هذا يعني أن النسب المئوية للخصائص في العينة - الجنس والعرق والمستوى الاجتماعي والاقتصادي وأي خصائص أخرى قد تؤثر على النتائج - قريبة من تلك النسب المئوية في عدد أكبر من السكان.
في مثالنا، لنفترض أننا قررنا أن السكان الذين يهمهم الأمر هم طلاب الجبر. لكن جميع طلاب الجبر هم عدد كبير جدًا من السكان، لذلك نحن بحاجة إلى أن نكون أكثر تحديدًا؛ بدلاً من ذلك، قد نقول أن السكان المهتمين لدينا هم جميع طلاب الجبر في مدينة معينة. يجب أن ندرج الطلاب من مختلف فئات الدخل، والحالات العائلية، والأعراق، والأعراق، والأديان، والمناطق الجغرافية للمدينة. مع هذه المجموعة السكانية الأكثر قابلية للإدارة، يمكننا العمل مع المدارس المحلية في اختيار عينة عشوائية من حوالي 200 طالب في علم الجبر الذين نريد المشاركة في تجربتنا.
باختصار، لأننا لا نستطيع اختبار جميع طلاب الجبر في المدينة، نريد أن نجد مجموعة من حوالي 200 طالب تعكس تكوين تلك المدينة. مع مجموعة تمثيلية، يمكننا تعميم النتائج التي توصلنا إليها على عدد أكبر من السكان دون خوف من تحيز عينتنا بطريقة ما.
الآن بعد أن أصبح لدينا عينة، فإن الخطوة التالية من العملية التجريبية هي تقسيم المشاركين إلى مجموعات تجريبية وضوابط من خلال التعيين العشوائي. مع التعيين العشوائي، يتمتع جميع المشاركين بفرصة متساوية في التعيين في أي من المجموعتين. هناك برنامج إحصائي يقوم بشكل عشوائي بتعيين كل طالب من طلاب الجبر في العينة إما للمجموعة التجريبية أو المجموعة الضابطة.
يعد التعيين العشوائي أمرًا بالغ الأهمية للتصميم التجريبي الصوتي. مع وجود عينات كبيرة بما فيه الكفاية، فإن التخصيص العشوائي يجعل من غير المحتمل وجود اختلافات منهجية بين المجموعات. لذلك، على سبيل المثال، سيكون من غير المحتمل جدًا أن نحصل على مجموعة واحدة تتكون بالكامل من الذكور، أو هوية عرقية معينة، أو أيديولوجية دينية معينة. هذا مهم لأنه إذا كانت المجموعات مختلفة بشكل منهجي قبل بدء التجربة، فلن نعرف أصل أي اختلافات نجدها بين المجموعات: هل كانت الاختلافات موجودة مسبقًا، أم كانت ناتجة عن التلاعب بالمتغير المستقل؟ يتيح لنا التعيين العشوائي افتراض أن أي اختلافات تمت ملاحظتها بين المجموعات التجريبية ومجموعات التحكم ناتجة عن معالجة المتغير المستقل.
قضايا للنظر فيها
في حين أن التجارب تسمح للعلماء بتقديم ادعاءات السبب والنتيجة، إلا أنها لا تخلو من المشاكل. تتطلب التجارب الحقيقية من المجرب التلاعب بمتغير مستقل، ويمكن أن يؤدي ذلك إلى تعقيد العديد من الأسئلة التي قد يرغب علماء النفس في معالجتها. على سبيل المثال، تخيل أنك تريد معرفة تأثير الجنس (المتغير المستقل) على الذاكرة المكانية (المتغير التابع). على الرغم من أنه يمكنك بالتأكيد البحث عن الاختلافات بين الذكور والإناث في مهمة تستغل الذاكرة المكانية، إلا أنه لا يمكنك التحكم مباشرة في جنس الشخص. نحن نصنف هذا النوع من نهج البحث على أنه شبه تجريبي وندرك أنه لا يمكننا تقديم ادعاءات السبب والنتيجة في هذه الظروف.
المجربون مقيدون أيضًا بالقيود الأخلاقية. على سبيل المثال، لن تتمكن من إجراء تجربة مصممة لتحديد ما إذا كان التعرض للإساءة عندما كنت طفلاً يؤدي إلى انخفاض مستويات احترام الذات بين البالغين. لإجراء مثل هذه التجربة، ستحتاج إلى تعيين بعض المشاركين التجريبيين بشكل عشوائي لمجموعة تتلقى إساءة الاستخدام، وستكون هذه التجربة غير أخلاقية.
تفسير النتائج التجريبية
بمجرد جمع البيانات من كل من المجموعة التجريبية والمجموعة الضابطة، يتم إجراء تحليل إحصائي لمعرفة ما إذا كانت هناك اختلافات ذات مغزى بين المجموعتين. يحدد التحليل الإحصائي مدى احتمالية وجود أي اختلاف بسبب الصدفة (وبالتالي ليس له معنى). على سبيل المثال، إذا أجريت تجربة على فعالية المكملات الغذائية، وكان لدى أولئك الذين يتناولون حبوب الدواء الوهمي (وليس المكمل) نفس النتيجة مثل أولئك الذين يتناولون المكمل، فقد أظهرت التجربة أن المكمل الغذائي غير فعال. بشكل عام، يعتبر علماء النفس الاختلافات ذات أهمية إحصائية إذا كانت هناك فرصة أقل من خمسة بالمائة لملاحظتها إذا لم تختلف المجموعات فعليًا عن بعضها البعض. وبعبارة أخرى، يريد علماء النفس الحد من فرص تقديم ادعاءات «إيجابية كاذبة» إلى خمسة بالمائة أو أقل.
أكبر قوة للتجارب هي القدرة على التأكيد على أن أي اختلافات كبيرة في النتائج ناتجة عن المتغير المستقل. يحدث هذا لأن الاختيار العشوائي والتعيين العشوائي والتصميم الذي يحد من تأثيرات كل من تحيز المجرب وتوقع المشاركين يجب أن ينشئوا مجموعات متشابهة في التكوين والعلاج. لذلك، يُعزى أي فرق بين المجموعات إلى المتغير المستقل، والآن يمكننا أخيرًا تقديم بيان سببي. إذا وجدنا أن مشاهدة برنامج تلفزيوني عنيف يؤدي إلى سلوك أكثر عنفًا من مشاهدة برنامج غير عنيف، يمكننا القول بأمان أن مشاهدة البرامج التلفزيونية العنيفة تسبب زيادة في عرض السلوك العنيف.
البحث في التقارير
عندما يكمل علماء النفس مشروعًا بحثيًا، فإنهم يرغبون عمومًا في مشاركة نتائجهم مع علماء آخرين. تنشر جمعية علم النفس الأمريكية (APA) دليلًا يوضح بالتفصيل كيفية كتابة ورقة لتقديمها إلى المجلات العلمية. على عكس المقالة التي قد تُنشر في مجلة مثل Psychology Today، والتي تستهدف جمهورًا عامًا مهتمًا بعلم النفس، تنشر المجلات العلمية عمومًا مقالات صحفية خاضعة لمراجعة الأقران تستهدف جمهورًا من المحترفين والعلماء الذين ينشطون بنشاط. يشاركون في البحث بأنفسهم.
تتم قراءة مقالة دورية تمت مراجعتها من قبل الأقران من قبل العديد من العلماء الآخرين (بشكل عام بشكل مجهول) من ذوي الخبرة في هذا الموضوع. يقدم هؤلاء المراجعون الأقران ملاحظات - لكل من المؤلف ومحرر المجلة - فيما يتعلق بجودة المسودة. يبحث المراجعون الأقران عن أساس منطقي قوي للبحث الذي يتم وصفه، ووصف واضح لكيفية إجراء البحث، والأدلة على أن البحث تم بطريقة أخلاقية. كما أنهم يبحثون عن العيوب في تصميم الدراسة والأساليب والتحليلات الإحصائية. يتحققون من أن الاستنتاجات التي توصل إليها المؤلفون تبدو معقولة بالنظر إلى الملاحظات التي تم الإدلاء بها أثناء البحث. يعلق المراجعون الأقران أيضًا على مدى قيمة البحث في تطوير معرفة التخصص. هذا يساعد على منع الازدواجية غير الضرورية لنتائج البحوث في الأدبيات العلمية، ويضمن، إلى حد ما، أن كل مقال بحثي يوفر معلومات جديدة. في النهاية، سيقوم محرر المجلة بتجميع جميع ملاحظات المراجعين الأقران وتحديد ما إذا كان سيتم نشر المقالة في حالتها الحالية (حدث نادر)، أو نشرها مع مراجعات، أو عدم قبولها للنشر.
توفر مراجعة الأقران درجة معينة من مراقبة الجودة للبحث النفسي. يمكن التخلص من الدراسات التي تم تصميمها أو تنفيذها بشكل سيئ، وحتى الأبحاث المصممة جيدًا يمكن تحسينها من خلال المراجعات المقترحة. تضمن مراجعة الأقران أيضًا وصف البحث بوضوح كافٍ للسماح للعلماء الآخرين بتكراره، مما يعني أنه يمكنهم تكرار التجربة باستخدام عينات مختلفة لتحديد الموثوقية. في بعض الأحيان تتضمن التكرارات تدابير إضافية تتوسع في النتيجة الأصلية. على أي حال، يعمل كل تكرار على توفير المزيد من الأدلة لدعم نتائج البحث الأصلية. النسخ الناجحة للأبحاث المنشورة تجعل العلماء أكثر استعدادًا لتبني تلك النتائج، بينما تميل الإخفاقات المتكررة إلى التشكيك في شرعية المقالة الأصلية ودفع العلماء إلى البحث في مكان آخر. على سبيل المثال، سيكون تقدمًا كبيرًا في المجال الطبي إذا أشارت دراسة منشورة إلى أن تناول دواء جديد يساعد الأفراد على تحقيق وزن صحي دون تغيير نظامهم الغذائي. ولكن إذا لم يتمكن علماء آخرون من تكرار النتائج، فسيتم التشكيك في ادعاءات الدراسة الأصلية.
في السنوات الأخيرة، كان هناك قلق متزايد بشأن «أزمة التكرار» التي أثرت على عدد من المجالات العلمية، بما في ذلك علم النفس. أنتجت بعض الدراسات والعلماء الأكثر شهرة أبحاثًا فشلت في تكرارها من قبل الآخرين (كما تمت مناقشته في Shrout & Rodgers، 2018). في الواقع، حتى العالمة الشهيرة الحائزة على جائزة نوبل قد سحبت مؤخرًا ورقة بحثية منشورة لأنها واجهت صعوبة في تكرار نتائجها (العالمة الحائزة على جائزة نوبل فرانسيس أرنولد تتراجع عن الورقة، 2020 3 يناير). دفعت هذه الأنواع من النتائج بعض العلماء إلى البدء في العمل معًا وبشكل أكثر انفتاحًا، وقد يجادل البعض بأن «الأزمة» الحالية تعمل بالفعل على تحسين الطرق التي يتم بها إجراء العلوم وكيفية مشاركة نتائجها مع الآخرين (Aschwanden، 2018).
ادعى بعض العلماء أن لقاحات الطفولة الروتينية تتسبب في إصابة بعض الأطفال بالتوحد، وفي الواقع، نشرت العديد من المنشورات التي تمت مراجعتها من قبل الأقران أبحاثًا تقدم هذه الادعاءات. منذ التقارير الأولية، أشارت الأبحاث الوبائية واسعة النطاق إلى أن اللقاحات ليست مسؤولة عن التسبب في مرض التوحد وأن تطعيم طفلك أكثر أمانًا من عدمه. علاوة على ذلك، تم سحب العديد من الدراسات الأصلية التي قدمت هذا الادعاء منذ ذلك الحين.
يمكن إلغاء جزء من العمل المنشور عندما تكون البيانات موضع تساؤل بسبب التزوير أو التلفيق أو مشاكل تصميم البحث الخطيرة. بمجرد الإلغاء، يتم إبلاغ المجتمع العلمي بوجود مشاكل خطيرة في المنشور الأصلي. يمكن بدء عمليات السحب من قبل الباحث الذي قاد الدراسة، أو من قبل المتعاونين في البحث، أو من قبل المؤسسة التي وظفت الباحث، أو من قبل هيئة تحرير المجلة التي نُشرت فيها المقالة في الأصل. في حالة لقاح التوحد، تم التراجع بسبب تضارب كبير في المصالح حيث كان للباحث الرائد مصلحة مالية في إنشاء رابط بين لقاحات الطفولة والتوحد (Offit، 2008). لسوء الحظ، تلقت الدراسات الأولية الكثير من الاهتمام الإعلامي لدرجة أن العديد من الآباء حول العالم أصبحوا مترددين في تطعيم أطفالهم (الشكل 2.19). الاعتماد المستمر على مثل هذه الدراسات المفحوصة له عواقب وخيمة. على سبيل المثال، بين يناير وأكتوبر من عام 2019، كان هناك 22 حالة تفشي للحصبة في جميع أنحاء الولايات المتحدة وأكثر من ألف حالة إصابة الأفراد بالحصبة (Patel et al.، 2019). من المحتمل أن يكون هذا بسبب الحركات المضادة للتطعيم التي نشأت من البحث المفكك. لمزيد من المعلومات حول كيفية تطور قصة لقاح/التوحد، بالإضافة إلى تداعيات هذه القصة، ألقِ نظرة على كتاب بول أوفيت، الأنبياء الكذابون للتوحد: العلوم السيئة والطب المحفوف بالمخاطر والبحث عن علاج.
الموثوقية والصلاحية
الموثوقية والصلاحية هما اعتباران مهمان يجب وضعهما مع أي نوع من جمع البيانات. تشير الموثوقية إلى القدرة على إنتاج نتيجة معينة باستمرار. في سياق البحث النفسي، قد يعني هذا أن أي أدوات أو أدوات تستخدم لجمع البيانات تفعل ذلك بطرق متسقة وقابلة للتكرار. هناك عدد من أنواع الموثوقية المختلفة. يتضمن بعضها الموثوقية بين التقديرات (الدرجة التي يتفق بها اثنان أو أكثر من المراقبين المختلفين على ما تمت ملاحظته) والاتساق الداخلي (درجة ارتباط العناصر المختلفة في المسح التي تقيس نفس الشيء ببعضها البعض) وموثوقية الاختبار وإعادة الاختبار (الدرجة التي تصل إليها تظل نتائج إجراء معين متسقة على الإدارات المتعددة).
لسوء الحظ، لا يعني الاتساق في القياس بالضرورة أنك قمت بقياس شيء ما بشكل صحيح. لتوضيح هذا المفهوم، ضع في اعتبارك ميزان المطبخ الذي يمكن استخدامه لقياس وزن الحبوب التي تتناولها في الصباح. إذا لم تتم معايرة الميزان بشكل صحيح، فقد يؤدي ذلك باستمرار إلى تقليل كمية الحبوب التي يتم قياسها أو المبالغة في تقديرها. في حين أن المقياس موثوق للغاية في تحقيق نتائج متسقة (على سبيل المثال، نفس كمية الحبوب التي يتم سكبها على الميزان تنتج نفس القراءة في كل مرة)، فإن هذه النتائج غير صحيحة. هذا هو المكان الذي تدخل فيه الصلاحية. تشير الصلاحية إلى المدى الذي تقيس فيه أداة أو أداة معينة بدقة ما يفترض أن تقيسه، ومرة أخرى، هناك عدد من الطرق التي يمكن من خلالها التعبير عن الصلاحية. الصلاحية البيئية (الدرجة التي يتم بها تعميم نتائج البحث على تطبيقات العالم الحقيقي)، وبناء الصلاحية (الدرجة التي يلتقط بها متغير معين أو يقيس فعليًا ما يهدف إلى قياسه)، وصلاحية الوجه (الدرجة التي يبدو بها متغير معين صالحًا على السطح) هي مجرد بعض الأنواع التي يعتبرها الباحثون. في حين أن أي تدبير صحيح يمكن الاعتماد عليه بالضرورة، فإن العكس ليس صحيحًا بالضرورة. يسعى الباحثون إلى استخدام أدوات موثوقة للغاية وصحيحة.
من المفترض أن تقيس الاختبارات الموحدة مثل SAT و ACT قدرة الفرد على التعليم الجامعي، ولكن ما مدى موثوقية وصلاحية هذه الاختبارات؟ تشير الأبحاث التي أجراها مجلس الكلية إلى أن الدرجات في اختبار SAT تتمتع بصلاحية تنبؤية عالية لمعدل GPA لطلاب السنة الأولى من الكلية (Kobrin و Patterson و Shaw و Mattern و Barbuti، 2008). في هذا السياق، تشير الصلاحية التنبؤية إلى قدرة الاختبار على التنبؤ بفعالية بمعدل GPA للطلاب الجدد في الكلية. نظرًا لأن العديد من مؤسسات التعليم العالي تتطلب SAT أو ACT للقبول، فقد تكون هذه الدرجة العالية من الصلاحية التنبؤية مريحة.
ومع ذلك، فإن التركيز على درجات SAT أو ACT في القبول الجامعي قد أثار بعض الجدل على عدد من الجبهات. أولاً، يؤكد بعض الباحثين أن هذه الاختبارات متحيزة وتضع طلاب الأقليات في وضع غير مؤات وتقلل بشكل غير عادل من احتمالية قبولهم في الكلية (Santelices & Wilson، 2010). بالإضافة إلى ذلك، أشارت بعض الأبحاث إلى أن الصلاحية التنبؤية لهذه الاختبارات مبالغ فيها بشكل كبير في مدى قدرتها على التنبؤ بمعدل GPA لطلاب السنة الأولى من الكلية. في الواقع، تم اقتراح أن الصلاحية التنبؤية لـ SAT قد يتم المبالغة فيها بنسبة تصل إلى 150٪ (Rothstein، 2004). بدأت العديد من مؤسسات التعليم العالي في التفكير في عدم التأكيد على أهمية درجات SAT في اتخاذ قرارات القبول (Rimer، 2008).
أدت الأمثلة الحديثة على فضائح الغش البارزة محليًا وخارجيًا إلى زيادة التدقيق الذي يتم وضعه على هذه الأنواع من الاختبارات، واعتبارًا من مارس 2019، قامت أكثر من 1000 مؤسسة للتعليم العالي إما بتخفيف أو إلغاء متطلبات اختبار SAT أو ACT للقبول ( شتراوس، 2019، 19 مارس).