Skip to main content
Global

2.4 : Analyse des résultats

  • Page ID
    192906
    • Rose M. Spielman, William J. Jenkins, Marilyn D. Lovett, et al.
    • OpenStax
    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objectifs d'apprentissage
    • Expliquer ce que nous apprend un coefficient de corrélation sur la relation entre les variables
    • Reconnaître que la corrélation n'indique pas une relation de cause à effet entre les variables
    • Discutez de notre tendance à rechercher des relations entre des variables qui n'existent pas réellement
    • Expliquer l'échantillonnage aléatoire et l'affectation des participants dans des groupes expérimentaux et témoins
    • Expliquez comment les biais de l'expérimentateur ou du participant peuvent affecter les résultats d'une expérience
    • Identifier les variables indépendantes et dépendantes

    Saviez-vous qu'à mesure que les ventes de crème glacée augmentent, le taux global de criminalité augmente également ? Est-il possible que le fait de déguster votre saveur préférée de crème glacée puisse vous lancer dans une série de crimes ? Ou, après avoir commis un crime, pensez-vous que vous pourriez décider de vous offrir un cornet ? Il ne fait aucun doute qu'il existe un lien entre la crème glacée et la criminalité (par exemple, Harper, 2013), mais il serait assez stupide de décider qu'une chose est réellement à l'origine de l'autre.

    Il est beaucoup plus probable que les ventes de glaces et les taux de criminalité soient liés à la température extérieure. Lorsque la température est chaude, de nombreuses personnes sortent de chez elles, interagissent les unes avec les autres, s'énervent les unes envers les autres et commettent parfois des crimes. De plus, lorsqu'il fait chaud dehors, nous sommes plus enclins à chercher une friandise fraîche comme une glace. Comment déterminer s'il existe effectivement un lien entre deux choses ? Et lorsqu'il existe une relation, comment savoir si elle est attribuable à une coïncidence ou à un lien de causalité ?

    Recherche corrélationnelle

    La corrélation signifie qu'il existe une relation entre deux variables ou plus (comme la consommation de crème glacée et la criminalité), mais que cette relation n'implique pas nécessairement une relation de cause à effet. Lorsque deux variables sont corrélées, cela signifie simplement qu'au fur et à mesure que l'une des variables change, l'autre change également. Nous pouvons mesurer la corrélation en calculant une statistique appelée coefficient de corrélation. Un coefficient de corrélation est un nombre compris entre -1 et +1 qui indique la force et la direction de la relation entre les variables. Le coefficient de corrélation est généralement représenté par la lettre r.

    La partie numérique du coefficient de corrélation indique la force de la relation. Plus le nombre est proche de 1 (négatif ou positif), plus les variables sont étroitement liées et plus les variations d'une variable seront prévisibles au fur et à mesure que l'autre variable changera. Plus le nombre est proche de zéro, plus la relation est faible et moins les relations entre les variables deviennent prévisibles. Par exemple, un coefficient de corrélation de 0,9 indique une relation beaucoup plus forte qu'un coefficient de corrélation de 0,3. Si les variables ne sont pas du tout liées les unes aux autres, le coefficient de corrélation est de 0. L'exemple ci-dessus concernant la crème glacée et la criminalité est un exemple de deux variables dont on peut s'attendre à ce qu'elles n'aient aucun lien entre elles.

    Le signe, positif ou négatif, du coefficient de corrélation indique la direction de la relation (Figure 2.12). Une corrélation positive signifie que les variables évoluent dans la même direction. En d'autres termes, cela signifie qu'à mesure qu'une variable augmente, l'autre augmente, et inversement, lorsqu'une variable diminue, l'autre augmente également. Une corrélation négative signifie que les variables évoluent dans des directions opposées. Si deux variables sont corrélées négativement, une diminution de l'une est associée à une augmentation de l'autre et vice versa.

    L'exemple de la crème glacée et des taux de criminalité est une corrélation positive, car les deux variables augmentent lorsque les températures se réchauffent. D'autres exemples de corrélations positives sont la relation entre la taille et le poids d'une personne ou la relation entre l'âge d'une personne et le nombre de rides. On peut s'attendre à ce qu'il existe une corrélation négative entre la fatigue d'une personne pendant la journée et le nombre d'heures pendant lesquelles elle a dormi la nuit précédente : la quantité de sommeil diminue à mesure que la sensation de fatigue augmente. Dans un exemple concret de corrélation négative, des étudiants chercheurs de l'Université du Minnesota ont découvert une faible corrélation négative (r = -0,29) entre le nombre moyen de jours par semaine pendant lesquels les étudiants dorment moins de 5 heures et leur moyenne cumulative (Lowry, Dean et Manders, 2010). Gardez à l'esprit qu'une corrélation négative n'est pas synonyme d'absence de corrélation. Par exemple, nous ne trouverions probablement aucune corrélation entre les heures de sommeil et la pointure des chaussures.

    Comme indiqué précédemment, les corrélations ont une valeur prédictive. Imaginez que vous faites partie du comité d'admission d'une grande université. Vous êtes confronté à un très grand nombre de candidatures, mais vous ne pouvez accueillir qu'un faible pourcentage du bassin de candidats. Comment pourriez-vous décider qui doit être admis ? Vous pourriez essayer de corréler la moyenne cumulative universitaire de vos étudiants actuels avec leurs résultats à des tests standardisés tels que le SAT ou l'ACT. En observant les corrélations les plus fortes pour vos étudiants actuels, vous pourriez utiliser ces informations pour prédire le succès relatif des étudiants qui ont fait une demande d'admission à l'université.

    Trois nuages de points sont présentés. Le nuage de points (a) est étiqueté « corrélation positive » et montre des points épars formant une ligne approximative du coin inférieur gauche vers le haut à droite ; l'axe des X est étiqueté « poids » et l'axe des y est étiqueté « hauteur ». Le nuage de points (b) est étiqueté « corrélation négative » et montre des points épars formant une ligne approximative du coin supérieur gauche vers le bas à droite ; l'axe des abscisses est intitulé « fatigue » et l'axe des y est intitulé « heures de sommeil ». Le nuage de points (c) est étiqueté « aucune corrélation » et montre des points épars sans motif ; l'axe X est étiqueté « pointure de chaussure » et l'axe y est étiqueté « heures de sommeil ».
    Figure 2.12 Les nuages de points sont une vue graphique de la force et de la direction des corrélations. Plus la corrélation est forte, plus les points de données sont proches d'une ligne droite. Dans ces exemples, nous voyons qu'il existe (a) une corrélation positive entre le poids et la taille, (b) une corrélation négative entre la fatigue et les heures de sommeil, et (c) aucune corrélation entre la pointure des chaussures et les heures de sommeil.
    Lien vers l'apprentissage

    Manipulez ce nuage de points interactif pour vous entraîner à comprendre les corrélations positives et négatives.

    La corrélation n'indique pas de causalité

    La recherche corrélationnelle est utile car elle nous permet de découvrir la force et l'orientation des relations qui existent entre deux variables. Cependant, la corrélation est limitée parce que l'établissement de l'existence d'une relation nous en dit peu sur les causes et les effets. Bien que les variables soient parfois corrélées parce que l'une cause l'autre, il se peut également qu'un autre facteur, une variable confusionnelle, soit à l'origine du mouvement systématique de nos variables d'intérêt. Dans l'exemple du taux de criminalité et de crème glacée mentionné précédemment, la température est une variable confusionnelle qui pourrait expliquer la relation entre les deux variables.

    Même lorsque nous ne pouvons pas identifier de variables confusionnelles claires, nous ne devons pas supposer qu'une corrélation entre deux variables implique qu'une variable entraîne des changements dans une autre. Cela peut être frustrant lorsqu'une relation de cause à effet semble claire et intuitive. Réfléchissez à notre discussion sur les recherches menées par l'American Cancer Society et sur la façon dont ses projets de recherche ont été parmi les premières démonstrations du lien entre le tabagisme et le cancer. Il semble raisonnable de supposer que le tabagisme cause le cancer, mais si nous nous limitions à la recherche corrélationnelle, nous dépasserions nos limites en faisant cette hypothèse.

    Malheureusement, les gens prétendent à tort qu'il y a un lien de causalité en fonction de corrélations tout le temps. De telles allégations sont particulièrement courantes dans les publicités et les reportages. Par exemple, des recherches récentes ont révélé que les personnes qui mangent régulièrement des céréales atteignent un poids plus sain que celles qui mangent rarement des céréales (Frantzen, Treviño, Echon, Garcia-Dominic et DiMarco, 2013 ; Barton et al., 2005). Devinez comment les entreprises céréalières rapportent ce résultat. La consommation de céréales permet-elle réellement à une personne de maintenir un poids santé ou existe-t-il d'autres explications possibles, par exemple, une personne ayant un poids santé est plus susceptible de prendre régulièrement un petit déjeuner sain qu'une personne obèse ou une personne qui évite de manger pour essayer de suivre un régime (Figure 2). 13) ? Bien que la recherche corrélationnelle soit inestimable pour identifier les relations entre les variables, l'une des principales limites est l'incapacité d'établir la causalité. Les psychologues veulent faire des déclarations sur les causes et les effets, mais la seule façon d'y parvenir est de mener une expérience pour répondre à une question de recherche. La section suivante décrit comment les expériences scientifiques intègrent des méthodes qui éliminent ou contrôlent d'autres explications, ce qui permet aux chercheurs d'explorer comment les modifications d'une variable entraînent des modifications d'une autre variable.

    Une photographie montre un bol de céréales.
    Figure 2.13 La consommation de céréales permet-elle réellement à une personne d'atteindre un poids santé ? (crédit : Tim Skillern)

    Corrélations illusoires

    La tentation de faire des déclarations erronées de cause à effet sur la base de recherches corrélationnelles n'est pas la seule façon dont nous avons tendance à mal interpréter les données. Nous avons également tendance à faire l'erreur de corrélations illusoires, en particulier avec des observations non systématiques. Des corrélations illusoires, ou de fausses corrélations, se produisent lorsque les gens croient qu'il existe des relations entre deux choses alors qu'aucune relation de ce type n'existe. Une corrélation illusoire bien connue est l'effet supposé des phases de la lune sur le comportement humain. De nombreuses personnes affirment avec passion que le comportement humain est influencé par la phase de la lune et, en particulier, que les gens agissent bizarrement lorsque la lune est pleine (Figure 2.14).

    Une photographie montre la lune.
    Figure 2.14 Beaucoup de gens pensent qu'une pleine lune incite les gens à se comporter bizarrement. (crédit : Cory Zanker)

    Il est indéniable que la lune exerce une puissante influence sur notre planète. Le flux et le reflux des marées de l'océan sont étroitement liés aux forces gravitationnelles de la lune. Beaucoup de gens pensent donc qu'il est logique que nous soyons également affectés par la lune. Après tout, notre corps est en grande partie composé d'eau. Une méta-analyse de près de 40 études a toutefois constamment démontré que la relation entre la lune et notre comportement n'existe pas (Rotton & Kelly, 1985). Bien que nous puissions accorder plus d'attention aux comportements étranges pendant toute la phase de la lune, les taux de comportements étranges restent constants tout au long du cycle lunaire.

    Pourquoi sommes-nous si enclins à croire à de telles corrélations illusoires ? Souvent, nous les lisons ou en entendons parler et nous acceptons simplement les informations comme étant valides. Ou bien, nous avons une idée de la façon dont quelque chose fonctionne, puis nous cherchons des preuves à l'appui de cette intuition, en ignorant les preuves qui nous indiqueraient que notre intuition est fausse ; c'est ce que l'on appelle le biais de confirmation. D'autres fois, nous trouvons des corrélations illusoires basées sur les informations qui nous viennent le plus facilement à l'esprit, même si ces informations sont très limitées. Bien que nous puissions être certains de pouvoir utiliser ces relations pour mieux comprendre et prévoir le monde qui nous entoure, les corrélations illusoires peuvent présenter des inconvénients importants. Par exemple, des recherches suggèrent que des corrélations illusoires, dans lesquelles certains comportements sont attribués de manière inexacte à certains groupes, sont impliquées dans la formation d'attitudes préjudiciables qui peuvent finalement mener à un comportement discriminatoire (Fiedler, 2004).

    Causalité : réalisation d'expériences et utilisation des données

    Comme vous l'avez appris, la seule façon d'établir l'existence d'une relation de cause à effet entre deux variables est de mener une expérience scientifique. L'expérience a une signification différente dans le contexte scientifique et dans la vie quotidienne. Dans les conversations de tous les jours, nous l'utilisons souvent pour décrire le fait d'essayer quelque chose pour la première fois, comme expérimenter une nouvelle coiffure ou un nouvel aliment. Cependant, dans le contexte scientifique, une expérience a des exigences précises en matière de conception et de mise en œuvre.

    L'hypothèse expérimentale

    Pour mener une expérience, un chercheur doit avoir une hypothèse précise à tester. Comme vous l'avez appris, les hypothèses peuvent être formulées soit par l'observation directe du monde réel, soit après un examen attentif de recherches antérieures. Par exemple, si vous pensez que l'utilisation de la technologie en classe a des répercussions négatives sur l'apprentissage, vous avez essentiellement formulé une hypothèse, à savoir que l'utilisation de la technologie en classe devrait être limitée car elle réduit l'apprentissage. Comment avez-vous pu arriver à cette hypothèse particulière ? Vous avez peut-être remarqué que vos camarades de classe qui prennent des notes sur leur ordinateur portable obtiennent de moins bons résultats aux examens de classe que ceux qui prennent des notes à la main, ou que ceux qui reçoivent un cours via un programme informatique par rapport à un professeur en personne ont des niveaux de performance différents lorsqu'ils sont testés (Figure 2.15) ).

    De nombreuses rangées d'élèves se trouvent dans une classe. Un étudiant a un ordinateur portable ouvert sur son bureau.
    Figure 2.15 Quel est l'impact de l'utilisation de la technologie en classe sur l'apprentissage ? (crédit : modification de l'œuvre de Nikolay Georgiev/Pixabay)

    Ce type d'observations personnelles nous amène souvent à formuler une hypothèse précise, mais nous ne pouvons pas utiliser des observations personnelles limitées et des preuves anecdotiques pour tester rigoureusement notre hypothèse. Au lieu de cela, pour savoir si les données du monde réel soutiennent notre hypothèse, nous devons mener une expérience.

    Conception d'une expérience

    Le plan expérimental le plus élémentaire fait intervenir deux groupes : le groupe expérimental et le groupe témoin. Les deux groupes sont conçus pour être identiques, à une différence près : la manipulation expérimentale. Le groupe expérimental reçoit la manipulation expérimentale, c'est-à-dire le traitement ou la variable testée (dans ce cas, l'utilisation de la technologie), mais pas le groupe témoin. La manipulation expérimentale étant la seule différence entre le groupe expérimental et le groupe témoin, nous pouvons être sûrs que toute différence entre les deux est due à une manipulation expérimentale plutôt qu'au hasard.

    Dans notre exemple de la façon dont l'utilisation de la technologie devrait être limitée en classe, nous demandons au groupe expérimental d'apprendre l'algèbre à l'aide d'un programme informatique, puis de tester son apprentissage. Nous mesurons l'apprentissage au sein de notre groupe témoin après qu'un professeur leur ait enseigné l'algèbre dans une classe traditionnelle. Il est important que le groupe témoin soit traité de la même manière que le groupe expérimental, sauf que le groupe témoin ne reçoit pas la manipulation expérimentale.

    Nous devons également définir précisément, ou opérationnaliser, la manière dont nous mesurons l'apprentissage de l'algèbre. Une définition opérationnelle est une description précise de nos variables, et elle est importante pour permettre aux autres de comprendre exactement comment et ce qu'un chercheur mesure dans une expérience donnée. Dans le cadre de l'opérationnalisation de l'apprentissage, nous pouvons choisir d'examiner les résultats d'un test portant sur la matière sur laquelle les individus ont été enseignés par l'enseignant ou le programme informatique. Nous pourrions également demander à nos participants de résumer les informations qui viennent d'être présentées d'une manière ou d'une autre. Quoi que nous déterminions, il est important que nous opérationnalisions l'apprentissage de telle sorte que quiconque entend parler de notre étude pour la première fois sache exactement ce que nous entendons par apprentissage. Cela améliore la capacité des personnes à interpréter nos données ainsi que leur capacité à répéter notre expérience s'ils le souhaitent.

    Une fois que nous aurons opérationnalisé ce qui est considéré comme une utilisation de la technologie et ce qui est considéré comme un apprentissage chez les participants à l'expérience, nous devons déterminer comment nous allons mener notre expérience. Dans ce cas, nous pouvons demander aux participants de passer 45 minutes à apprendre l'algèbre (soit par le biais d'un programme informatique, soit avec un professeur de mathématiques en présentiel), puis de leur faire passer un test sur la matière traitée pendant les 45 minutes.

    Idéalement, les personnes qui obtiennent les résultats des tests ne savent pas qui a été affecté au groupe expérimental ou au groupe témoin, afin de contrôler le biais de l'expérimentateur. Le biais de l'expérimentateur fait référence à la possibilité que les attentes d'un chercheur faussent les résultats de l'étude. N'oubliez pas que la réalisation d'une expérience nécessite beaucoup de planification et que les personnes impliquées dans le projet de recherche ont tout intérêt à étayer leurs hypothèses. Si les observateurs savaient quel enfant appartient à quel groupe, cela pourrait influencer la façon dont ils interprètent des réponses ambiguës, telles qu'une écriture bâclée ou des erreurs de calcul mineures. En ne sachant pas quel enfant appartient à quel groupe, nous nous protégeons contre ces préjugés. Cette situation est une étude à simple insu, ce qui signifie que l'un des groupes (participants) ne sait pas à quel groupe il appartient (groupe expérimental ou groupe témoin) alors que le chercheur qui a développé l'expérience sait quels participants font partie de chaque groupe.

    Dans une étude à double insu, les chercheurs et les participants ignorent les devoirs de groupe. Pourquoi un chercheur voudrait-il mener une étude où personne ne sait qui appartient à quel groupe ? Parce que ce faisant, nous pouvons contrôler à la fois les attentes des expérimentateurs et des participants. Si vous connaissez l'expression « effet placebo », vous savez déjà pourquoi il s'agit d'une considération importante. L'effet placebo se produit lorsque les attentes ou les croyances d'une personne influencent ou déterminent son expérience dans une situation donnée. En d'autres termes, le simple fait de s'attendre à ce que quelque chose se produise peut réellement y arriver.

    L'effet placebo est généralement décrit en termes de test de l'efficacité d'un nouveau médicament. Imaginez que vous travaillez dans une société pharmaceutique et que vous pensez disposer d'un nouveau médicament efficace pour traiter la dépression. Pour démontrer l'efficacité de votre médicament, vous menez une expérience en deux groupes : le groupe expérimental reçoit le médicament et le groupe témoin n'en reçoit pas. Mais vous ne voulez pas que les participants sachent s'ils ont reçu le médicament ou non.

    Pourquoi ça ? Imaginez que vous participez à cette étude et que vous venez de prendre une pilule qui, selon vous, améliorera votre humeur. Comme vous vous attendez à ce que la pilule ait un effet, vous pourriez vous sentir mieux simplement parce que vous l'avez prise et non pas à cause d'un quelconque médicament contenu dans la pilule : il s'agit de l'effet placebo.

    Pour s'assurer que tout effet sur l'humeur est dû au médicament et non aux attentes, le groupe témoin reçoit un placebo (dans ce cas, une pilule de sucre). Maintenant, tout le monde reçoit une pilule et, encore une fois, ni le chercheur ni les participants à l'expérience ne savent qui a reçu le médicament et qui a reçu la pilule de sucre. Toute différence d'humeur entre le groupe expérimental et le groupe témoin peut désormais être attribuée au médicament lui-même plutôt qu'au biais de l'expérimentateur ou aux attentes des participants (Figure 2.16).

    Une photographie montre trois flacons de pilules en verre étiquetés comme des placebos.
    Figure 2.16 L'administration d'un traitement placebo au groupe témoin protège contre les biais liés à l'espérance. (crédit : Elaine et Arthur Shapiro)

    Variables indépendantes et dépendantes

    Dans le cadre d'une expérience de recherche, nous nous efforçons d'étudier si les changements dans une chose entraînent des changements dans une autre. Pour y parvenir, nous devons prêter attention à deux variables importantes, ou à des éléments qui peuvent être modifiés, dans toute étude expérimentale : la variable indépendante et la variable dépendante. Une variable indépendante est manipulée ou contrôlée par l'expérimentateur. Dans une étude expérimentale bien conçue, la variable indépendante est la seule différence importante entre le groupe expérimental et le groupe témoin. Dans notre exemple de la manière dont l'utilisation de la technologie en classe affecte l'apprentissage, la variable indépendante est le type d'apprentissage des participants à l'étude (Figure 2.17). Une variable dépendante est ce que le chercheur mesure pour déterminer l'effet de la variable indépendante. Dans notre exemple, la variable dépendante est l'apprentissage présenté par nos participants.

    Une boîte intitulée « Variable indépendante : prendre des notes sur un ordinateur portable ou à la main » contient une photographie d'une classe d'étudiants avec un ordinateur portable ouvert sur le bureau d'un étudiant. Une flèche intitulée « influence le changement dans... » mène à une deuxième case. La deuxième case est intitulée « Variable dépendante : performance sur la mesure de l'apprentissage » et contient une photo d'un étudiant assis à un bureau en train de passer un test.
    Figure 2.17 Dans une expérience, les manipulations de la variable indépendante devraient entraîner des modifications de la variable dépendante. (crédit : modification « en classe » d'une œuvre de Nikolay Georgiev/Pixabay ; crédit « prise de notes » : modification de l'œuvre par KF/Wikimedia)

    Nous nous attendons à ce que la variable dépendante change en fonction de la variable indépendante. En d'autres termes, la variable dépendante dépend de la variable indépendante. Une bonne façon de réfléchir à la relation entre les variables indépendantes et dépendantes est de se poser la question suivante : Quel est l'effet de la variable indépendante sur la variable dépendante ? Pour en revenir à notre exemple, quel est l'effet du fait de recevoir une leçon par le biais d'un programme informatique par rapport à l'aide d'un instructeur en personne ?

    Sélection et affectation des participants à l'expérience

    Maintenant que notre étude est terminée, nous devons obtenir un échantillon de personnes à inclure dans notre expérience. Notre étude implique des participants humains, nous devons donc déterminer qui inclure. Les participants font l'objet de recherches psychologiques et, comme leur nom l'indique, les personnes impliquées dans la recherche psychologique participent activement au processus. Souvent, les projets de recherche psychologique font appel à des étudiants pour participer. En fait, la grande majorité des recherches dans les sous-domaines de la psychologie ont toujours impliqué des étudiants en tant que participants à la recherche (Sears, 1986 ; Arnett, 2008). Mais les étudiants sont-ils vraiment représentatifs de la population générale ? Les étudiants ont tendance à être plus jeunes, plus instruits, plus libéraux et moins diversifiés que la population générale. Bien que l'utilisation d'étudiants comme sujets de test soit une pratique acceptée, le fait de compter sur un bassin aussi limité de participants à la recherche peut s'avérer problématique car il est difficile de généraliser les résultats à l'ensemble de la population.

    Notre expérience hypothétique implique des lycéens, et nous devons d'abord générer un échantillon d'élèves. Les échantillons sont utilisés parce que les populations sont généralement trop importantes pour impliquer raisonnablement chaque membre dans notre expérience particulière (Figure 2.18). Dans la mesure du possible, nous devrions utiliser un échantillon aléatoire (il existe d'autres types d'échantillons, mais aux fins du présent chapitre, nous nous concentrerons sur les échantillons aléatoires). Un échantillon aléatoire est un sous-ensemble d'une population plus vaste dans lequel chaque membre de la population a une chance égale d'être sélectionné. Les échantillons aléatoires sont préférables, car si l'échantillon est suffisamment grand, nous pouvons être raisonnablement sûrs que les individus participants sont représentatifs de l'ensemble de la population. Cela signifie que les pourcentages de caractéristiques de l'échantillon (sexe, origine ethnique, niveau socioéconomique et toute autre caractéristique susceptible d'affecter les résultats) sont proches de ceux de l'ensemble de la population.

    Dans notre exemple, supposons que nous décidions que notre population d'intérêt est constituée d'étudiants en algèbre. Mais tous les étudiants en algèbre constituent une population très nombreuse, nous devons donc être plus précis ; nous pourrions plutôt dire que notre population d'intérêt est constituée de tous les étudiants en algèbre d'une ville donnée. Nous devrions inclure des étudiants de différentes tranches de revenus, de situations familiales, de races, d'ethnies, de religions et de zones géographiques de la ville. Avec cette population plus facile à gérer, nous pouvons travailler avec les écoles locales pour sélectionner un échantillon aléatoire d'environ 200 étudiants d'algèbre auxquels nous souhaitons participer à notre expérience.

    En résumé, comme nous ne pouvons pas tester tous les étudiants en algèbre d'une ville, nous voulons trouver un groupe d'environ 200 personnes qui reflète la composition de cette ville. Avec un groupe représentatif, nous pouvons généraliser nos résultats à l'ensemble de la population sans craindre que notre échantillon ne soit biaisé d'une manière ou d'une autre.

    a) Une photographie montre une vue aérienne de la foule dans une rue. b) Une photographie montre un petit groupe d'enfants.
    Figure 2.18 Les chercheurs peuvent travailler avec (a) une grande population ou (b) un groupe d'échantillons qui constitue un sous-ensemble de la plus grande population. (crédit « foule » : modification d'une œuvre de James Cridland ; crédit « étudiants » : modification d'une œuvre de Laurie Sullivan)

    Maintenant que nous avons un échantillon, l'étape suivante du processus expérimental consiste à diviser les participants en groupes expérimentaux et témoins par répartition aléatoire. Avec l'attribution aléatoire, tous les participants ont une chance égale d'être affectés à l'un ou l'autre des groupes. Il existe un logiciel statistique qui assigne aléatoirement chacun des étudiants en algèbre de l'échantillon au groupe expérimental ou au groupe témoin.

    L'assignation aléatoire est essentielle pour une conception expérimentale solide. Avec des échantillons suffisamment grands, l'attribution aléatoire rend peu probable l'existence de différences systématiques entre les groupes. Ainsi, par exemple, il serait très peu probable que nous obtenions un groupe entièrement composé d'hommes, d'une identité ethnique donnée ou d'une idéologie religieuse donnée. Ceci est important car si les groupes étaient systématiquement différents avant le début de l'expérience, nous ne connaîtrions pas l'origine des différences que nous trouverons entre les groupes : les différences existaient-elles ou ont-elles été causées par la manipulation de la variable indépendante ? L'attribution aléatoire nous permet de supposer que toute différence observée entre les groupes expérimentaux et témoins résulte de la manipulation de la variable indépendante.

    Lien vers l'apprentissage

    Utilisez ce générateur de nombres aléatoires en ligne pour en savoir plus sur l'échantillonnage aléatoire et les assignations.

    Questions à prendre en compte

    Bien que les expériences permettent aux scientifiques de faire des allégations de cause à effet, elles ne sont pas sans problème. Les expériences véritables nécessitent que l'expérimentateur manipule une variable indépendante, ce qui peut compliquer de nombreuses questions que les psychologues pourraient vouloir aborder. Par exemple, imaginez que vous souhaitiez connaître l'effet du sexe (la variable indépendante) sur la mémoire spatiale (la variable dépendante). Bien que vous puissiez certainement rechercher les différences entre les hommes et les femmes lors d'une tâche qui fait appel à la mémoire spatiale, vous ne pouvez pas contrôler directement le sexe d'une personne. Nous classons ce type d'approche de recherche comme étant quasi expérimentale et reconnaissons que nous ne pouvons pas faire d'allégations de cause à effet dans de telles circonstances.

    Les expérimentateurs sont également limités par des contraintes éthiques. Par exemple, vous ne seriez pas en mesure de mener une expérience visant à déterminer si le fait d'être victime de violence pendant l'enfance entraîne une baisse de l'estime de soi chez les adultes. Pour mener une telle expérience, il faudrait affecter au hasard certains participants à l'expérience à un groupe victime de maltraitance, et cette expérience serait contraire à l'éthique.

    Interprétation des résultats

    Une fois les données collectées auprès du groupe expérimental et du groupe témoin, une analyse statistique est réalisée pour déterminer s'il existe des différences significatives entre les deux groupes. Une analyse statistique permet de déterminer dans quelle mesure toute différence constatée est probablement due au hasard (et donc non significative). Par exemple, si une expérience est menée sur l'efficacité d'un complément alimentaire et que ceux qui prennent une pilule placebo (et non le supplément) obtiennent le même résultat que ceux qui prennent le supplément, alors l'expérience a montré que le complément nutritionnel n'est pas efficace. En général, les psychologues considèrent que les différences sont statistiquement significatives s'il y a moins de cinq pour cent de chances de les observer si les groupes ne diffèrent pas réellement les uns des autres. Autrement dit, les psychologues veulent limiter à cinq pour cent ou moins les risques de faire des déclarations « faussement positives ».

    La plus grande force des expériences est leur capacité à affirmer que toute différence significative dans les résultats est due à la variable indépendante. Cela est dû au fait que la sélection aléatoire, l'attribution aléatoire et une conception qui limite les effets du biais de l'expérimentateur et de l'espérance des participants devraient créer des groupes dont la composition et le traitement sont similaires. Par conséquent, toute différence entre les groupes est attribuable à la variable indépendante, et nous pouvons maintenant enfin faire une déclaration causale. Si nous constatons que le fait de regarder une émission de télévision violente entraîne un comportement plus violent que de regarder une émission non violente, nous pouvons affirmer sans risque de se tromper que le fait de regarder des émissions de télévision violentes entraîne une augmentation de l'affichage de comportements violents.

    Recherche sur les rapports

    Lorsque les psychologues terminent un projet de recherche, ils souhaitent généralement partager leurs résultats avec d'autres scientifiques. L'American Psychological Association (APA) publie un manuel expliquant comment rédiger un article destiné à des revues scientifiques. Contrairement à un article qui pourrait être publié dans un magazine comme Psychology Today, qui cible un grand public intéressé par la psychologie, les revues scientifiques publient généralement des articles de revues à comité de lecture destinés à un public de professionnels et de chercheurs actifs impliqués eux-mêmes dans la recherche.

    Lien vers l'apprentissage

    Le laboratoire d'écriture en ligne (OWL) de l'université Purdue peut vous expliquer les directives de rédaction de l'APA.

    Un article de revue à comité de lecture est lu par plusieurs autres scientifiques (généralement de manière anonyme) spécialisés dans le sujet. Ces pairs évaluateurs fournissent des commentaires, à la fois à l'auteur et au rédacteur en chef de la revue, concernant la qualité du projet. Les pairs évaluateurs recherchent une justification solide pour la recherche décrite, une description claire de la manière dont la recherche a été menée et des preuves que la recherche a été menée de manière éthique. Ils recherchent également des failles dans la conception, les méthodes et les analyses statistiques de l'étude. Ils vérifient que les conclusions tirées par les auteurs semblent raisonnables compte tenu des observations faites au cours de la recherche. Les pairs évaluateurs soulignent également la valeur de la recherche pour l'avancement des connaissances de la discipline. Cela permet d'éviter la duplication inutile des résultats de recherche dans la littérature scientifique et, dans une certaine mesure, de garantir que chaque article de recherche fournit de nouvelles informations. En fin de compte, le rédacteur en chef compilera tous les commentaires des pairs évaluateurs et déterminera si l'article sera publié dans son état actuel (ce qui est rare), publié avec des révisions ou s'il ne sera pas accepté pour publication.

    L'évaluation par les pairs permet de contrôler dans une certaine mesure la qualité de la recherche psychologique. Les études mal conçues ou mal exécutées peuvent être éliminées, et même les recherches bien conçues peuvent être améliorées par les révisions proposées. L'examen par les pairs garantit également que la recherche est décrite de manière suffisamment claire pour permettre à d'autres scientifiques de la reproduire, ce qui signifie qu'ils peuvent répéter l'expérience en utilisant différents échantillons pour en déterminer la fiabilité. Parfois, les réplications impliquent des mesures supplémentaires qui étendent le résultat initial. Dans tous les cas, chaque réplication sert à fournir davantage de preuves à l'appui des résultats de recherche originaux. La reproduction réussie de recherches publiées rend les scientifiques plus enclins à adopter ces résultats, tandis que les échecs répétés ont tendance à douter de la légitimité de l'article original et à inciter les scientifiques à regarder ailleurs. Par exemple, ce serait une avancée majeure dans le domaine médical si une étude publiée indiquait que la prise d'un nouveau médicament aidait les individus à atteindre un poids santé sans modifier leur alimentation. Mais si d'autres scientifiques ne pouvaient pas reproduire les résultats, les affirmations de l'étude initiale seraient remises en question.

    Ces dernières années, on s'inquiète de plus en plus d'une « crise de réplication » qui touche un certain nombre de domaines scientifiques, dont la psychologie. Certaines des études et des scientifiques les plus connus ont produit des recherches qui n'ont pas été reproduites par d'autres (comme indiqué dans Shrout & Rodgers, 2018). En fait, même une scientifique célèbre lauréate du prix Nobel a récemment retiré un article publié parce qu'elle avait du mal à reproduire ses résultats (Frances Arnold, chercheuse lauréate du prix Nobel, retire son article, 3 janvier 2020). Ce type de résultats a incité certains scientifiques à commencer à travailler ensemble et plus ouvertement, et certains affirment que la « crise » actuelle améliore en fait la manière dont la science est menée et la manière dont ses résultats sont partagés avec les autres (Aschwanden, 2018).

    APPROFONDISSEZ VOS CONNAISSANCES : Le mythe de l'autisme vaccinal et le retrait des études publiées

    Certains scientifiques ont affirmé que les vaccins pédiatriques de routine provoquaient l'autisme chez certains enfants et, en fait, plusieurs publications évaluées par des pairs ont publié des recherches faisant état de ces affirmations. Depuis les premiers rapports, des recherches épidémiologiques à grande échelle ont suggéré que les vaccins ne sont pas responsables de l'autisme et qu'il est beaucoup plus sûr de faire vacciner votre enfant que de ne pas le faire. En outre, plusieurs des études originales faisant état de cette affirmation ont depuis été retirées.

    Un travail publié peut être annulé lorsque des données sont remises en question en raison de falsification, de fabrication ou de graves problèmes de conception de recherche. Une fois l'annulation terminée, la communauté scientifique est informée que la publication initiale pose de sérieux problèmes. Les rétractations peuvent être initiées par le chercheur qui a dirigé l'étude, par des collaborateurs de recherche, par l'institution qui a employé le chercheur ou par le comité de rédaction de la revue dans laquelle l'article a été initialement publié. Dans le cas de l'autisme vaccinal, la rétractation a été faite en raison d'un conflit d'intérêts important dans lequel le chercheur principal avait un intérêt financier à établir un lien entre les vaccins pour enfants et l'autisme (Offit, 2008). Malheureusement, les premières études ont tellement attiré l'attention des médias que de nombreux parents du monde entier ont hésité à faire vacciner leurs enfants (Figure 2.19). Le recours continu à de telles études démystifiées a des conséquences importantes. Par exemple, entre janvier et octobre 2019, il y a eu 22 éclosions de rougeole aux États-Unis et plus d'un millier de cas de personnes ayant contracté la rougeole (Patel et al., 2019). Cela est probablement dû aux mouvements anti-vaccination qui sont apparus à la suite de recherches démystifiées. Pour plus d'informations sur le déroulement de l'histoire des vaccins et de l'autisme, ainsi que sur les répercussions de cette histoire, jetez un œil au livre de Paul Offit, Autism's False Prophets : Bad Science, Risky Medicine, and the Search for a Cure.

    Une photographie montre un enfant recevant un vaccin oral.
    Figure 2.19 Certaines personnes pensent toujours que la vaccination cause l'autisme. (source : modification du travail par UNICEF Sverige)

    Fiabilité et validité

    La fiabilité et la validité sont deux considérations importantes qui doivent être prises en compte pour tout type de collecte de données. La fiabilité fait référence à la capacité de produire de manière constante un résultat donné. Dans le contexte de la recherche psychologique, cela signifierait que tous les instruments ou outils utilisés pour collecter des données le font de manière cohérente et reproductible. Il existe différents types de fiabilité. Certains d'entre eux incluent la fiabilité entre les évaluateurs (la mesure dans laquelle deux observateurs différents ou plus sont d'accord sur ce qui a été observé), la cohérence interne (la mesure dans laquelle les différents éléments d'une enquête qui mesurent la même chose sont en corrélation les uns avec les autres) et la fiabilité des tests-retests (la mesure dans laquelle les résultats d'une mesure donnée restent cohérents sur plusieurs administrations).

    Malheureusement, être constant dans les mesures ne signifie pas nécessairement que vous avez mesuré quelque chose correctement. Pour illustrer ce concept, imaginez une balance de cuisine qui serait utilisée pour mesurer le poids des céréales que vous consommez le matin. Si la balance n'est pas correctement étalonnée, elle peut constamment sous-estimer ou surestimer la quantité de céréales mesurée. Bien que la balance soit très fiable pour ce qui est de produire des résultats cohérents (par exemple, la même quantité de céréales versée sur la balance produit la même lecture à chaque fois), ces résultats sont incorrects. C'est là que la validité entre en jeu. La validité fait référence à la mesure dans laquelle un instrument ou un outil donné mesure avec précision ce qu'il est censé mesurer et, encore une fois, la validité peut être exprimée de différentes manières. La validité écologique (la mesure dans laquelle les résultats de recherche se généralisent à des applications réelles), la validité conceptuelle (la mesure dans laquelle une variable donnée capture ou mesure réellement ce qu'elle est censée mesurer) et la validité faciale (la mesure dans laquelle une variable donnée semble valide à première vue) ne sont que quelques types que les chercheurs considèrent. Toute mesure valide est nécessairement fiable, mais l'inverse n'est pas nécessairement vrai. Les chercheurs s'efforcent d'utiliser des instruments à la fois très fiables et valides.

    CONNEXION QUOTIDIENNE : Quelle est la validité du SAT et de l'ACT ?

    Les tests standardisés tels que le SAT et l'ACT sont censés mesurer l'aptitude d'une personne à poursuivre des études universitaires, mais dans quelle mesure ces tests sont-ils fiables et valides ? Les recherches menées par le College Board suggèrent que les scores du SAT ont une validité prédictive élevée pour la moyenne cumulative des étudiants de première année (Kobrin, Patterson, Shaw, Mattern et Barbuti, 2008). Dans ce contexte, la validité prédictive fait référence à la capacité du test à prédire efficacement la moyenne cumulative des étudiants de première année. Étant donné que de nombreux établissements d'enseignement supérieur exigent le SAT ou l'ACT pour être admis, ce haut degré de validité prédictive peut être rassurant.

    Cependant, l'accent mis sur les scores SAT ou ACT lors des admissions à l'université a suscité une certaine controverse sur plusieurs fronts. D'une part, certains chercheurs affirment que ces tests sont biaisés, désavantagent les étudiants issus de minorités et réduisent injustement la probabilité d'être admis dans un collège (Santelices et Wilson, 2010). En outre, certaines recherches ont suggéré que la validité prédictive de ces tests est largement exagérée quant à leur capacité à prédire la moyenne cumulative des étudiants de première année. En fait, il a été suggéré que la validité prédictive de la SAT pourrait être surestimée de 150 % (Rothstein, 2004). De nombreux établissements d'enseignement supérieur commencent à envisager de sous-estimer l'importance des scores SAT dans la prise de décisions d'admission (Rimer, 2008).

    Des exemples récents de scandales de tricherie très médiatisés, tant au niveau national qu'à l'étranger, n'ont fait qu'accroître l'attention portée à ces types de tests et, en mars 2019, plus de 1 000 établissements d'enseignement supérieur ont assoupli ou éliminé les exigences relatives aux tests SAT ou ACT pour les admissions ( Strauss, 2019, 19 mars).