Skip to main content
Global

13.0 : Introduction à la régression linéaire et à la corrélation

  • Page ID
    191781
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Voici une photo de l'atelier d'un mécanicien automobile. Trois camions des services postaux des États-Unis sont entretenus et un n'est pas entretenu.
    Figure 13.1 La régression et la corrélation linéaires peuvent vous aider à déterminer si le salaire d'un mécanicien automobile est lié à son expérience professionnelle. (crédit : Joshua Rothhaas)

    Les professionnels veulent souvent savoir comment deux variables numériques ou plus sont liées. Par exemple, existe-t-il un lien entre la note du deuxième examen de mathématiques que passe un étudiant et la note de l'examen final ? S'il y a une relation, quelle est la relation et quelle est sa force ?

    Dans un autre exemple, votre revenu peut être déterminé par votre éducation, votre profession, vos années d'expérience et vos capacités, ou votre sexe ou votre couleur. Le montant que vous payez à un réparateur pour la main-d'œuvre est souvent déterminé par un montant initial plus des honoraires horaires.

    Ces exemples peuvent être liés ou non à un modèle, ce qui signifie que certaines théories suggèrent l'existence d'une relation. Ce lien entre une cause et un effet, souvent appelé modèle, est à la base de la méthode scientifique et est au cœur de la façon dont nous déterminons ce que nous pensons du fonctionnement du monde. Commencer par une théorie et développer un modèle de la relation théorique devrait aboutir à une prédiction, ce que nous avons appelé une hypothèse plus tôt. Maintenant, l'hypothèse concerne un ensemble complet de relations. Par exemple, en économie, le modèle du choix du consommateur repose sur des hypothèses concernant le comportement humain : le désir de maximiser ce que l'on appelle l'utilité, la connaissance des avantages d'un produit par rapport à un autre, les goûts et les aversions, ce que l'on appelle généralement les préférences, etc. Ils se sont combinés pour nous donner la courbe de demande. Nous pouvons donc prédire qu'à mesure que les prix augmenteront, la quantité demandée diminuera. L'économie utilise des modèles concernant la relation entre les prix pratiqués pour les biens et la structure du marché dans laquelle l'entreprise exerce ses activités, par exemple le monopole et la concurrence. Des modèles pour déterminer qui serait le plus susceptible d'être choisi pour un poste de formation en cours d'emploi, les impacts des changements de politique de la Réserve fédérale et la croissance de l'économie, etc.

    Les modèles ne sont pas propres à l'économie, même dans le domaine des sciences sociales. En science politique, par exemple, il existe des modèles qui prédisent le comportement des bureaucrates face à divers changements de circonstances sur la base d'hypothèses concernant les objectifs des bureaucrates. Il existe des modèles de comportement politique traitant de la prise de décisions stratégiques tant pour les relations internationales que pour la politique intérieure.

    Les sciences dites dures sont, bien entendu, à l'origine de la méthode scientifique qui a tenté au fil des siècles d'expliquer le monde confus qui nous entoure. Certains des premiers modèles d'aujourd'hui nous font rire ; la génération spontanée de la vie par exemple. Ces premiers modèles ne sont aujourd'hui considérés que comme les mythes fondamentaux que nous avons développés pour nous aider à mettre de l'ordre dans ce qui semblait être le chaos.

    Le fondement de tout modèle de construction est peut-être l'affirmation arrogante selon laquelle nous savons ce qui a causé le résultat que nous voyons. Ceci est incarné dans la simple déclaration mathématique de la forme fonctionnelle qui\(y = f(x)\). La réponse,\(Y\), est provoquée par le stimulus,\(X\). Chaque modèle finira par arriver à cette dernière place et c'est là que la théorie vivra ou mourra. Les données soutiendront-elles cette hypothèse ? Si c'est le cas, très bien, nous croirons cette version du monde jusqu'à ce qu'une meilleure théorie vienne la remplacer. C'est le processus par lequel nous sommes passés de la terre plate à la terre ronde, du système solaire centré sur la Terre au système solaire, et ainsi de suite.

    La méthode scientifique ne confirme pas une théorie pour toujours : elle ne prouve pas la « vérité ». Toutes les théories sont sujettes à révision et peuvent être renversées. Ce sont les leçons que nous avons apprises lorsque nous avons développé pour la première fois le concept du test d'hypothèse plus tôt dans ce livre. Au début de cette section, ces concepts méritent d'être revus car l'outil que nous allons développer ici est la pierre angulaire de la méthode scientifique et les enjeux sont plus importants. Les théories complètes augmenteront ou diminueront grâce à cet outil statistique ; la régression et les versions plus avancées appellent économétrie.

    Dans ce chapitre, nous commencerons par la corrélation, c'est-à-dire l'étude des relations entre les variables qui peuvent ou non être fondées sur un modèle de cause à effet. Les variables se déplacent simplement dans la même direction ou dans la direction opposée. C'est-à-dire qu'ils ne se déplacent pas de façon aléatoire. La corrélation fournit une mesure de la mesure dans laquelle cela est vrai. À partir de là, nous développons un outil pour mesurer les relations de cause à effet ; une analyse de régression. Nous serons en mesure de formuler des modèles et des tests pour déterminer s'ils sont statistiquement solides. Si tel est le cas, nous pouvons les utiliser pour faire des prédictions : si, pour des raisons de politique, nous modifiions la valeur de cette variable, qu'arriverait-il à cette autre variable ? Si nous imposons une taxe sur l'essence de 50 cents le gallon, quel effet cela aurait-il sur les émissions de carbone, les ventes de Hummers/Hybrids, l'utilisation des transports en commun, etc. ? La capacité de fournir des réponses à ce type de questions est la valeur de la régression, à la fois comme outil pour nous aider à comprendre notre monde et pour prendre des décisions politiques réfléchies.