Skip to main content
Global

13.8 : Pratique du chapitre

  • Page ID
    191763
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    13.1 Le coefficient de corrélation r

    1.

    Pour avoir un coefficient de corrélation entre les traits\(A\) et\(B\), il est nécessaire d'avoir :

    1. un groupe de sujets, dont certains possèdent des caractéristiques de caractère\(A\), les autres possèdent celles de trait\(B\)
    2. mesures du trait\(A\) sur un groupe de sujets et du trait\(B\) sur un autre groupe
    3. deux groupes de sujets, l'un pouvant être classé comme\(A\) ou non\(A\), l'autre comme\(B\) ou non\(B\)
    4. deux groupes de sujets, l'un pouvant être classé comme\(A\) ou non\(A\), l'autre comme\(B\) ou non\(B\)
    2.

    Définissez le coefficient de corrélation et donnez un exemple unique de son utilisation.

    3.

    Si la corrélation entre l'âge d'une voiture et l'argent dépensé pour les réparations est de +0,90

    1. 81 % de la variation de l'argent dépensé pour les réparations s'explique par l'âge de l'automobile
    2. 81 % de l'argent dépensé pour les réparations est inexpliqué par l'âge de l'automobile
    3. 90 % de l'argent dépensé pour les réparations s'explique par l'âge de la voiture
    4. rien de ce qui précède
    4.

    Supposons que la moyenne pondérée scolaire et la partie verbale d'un test de QI aient une corrélation de 0,40. Quel pourcentage de variance les deux ont-ils en commun ?

    1. 20
    2. 16
    3. 40
    4. 80
    5.

    Vrai ou faux ? Si faux, expliquez pourquoi : Le coefficient de détermination peut avoir des valeurs comprises entre -1 et +1.

    6.

    Vrai ou faux : chaque fois que r est calculé sur la base d'un échantillon, la valeur que nous obtenons pour r n'est qu'une estimation du coefficient de corrélation réel que nous obtiendrions si nous le calculions pour l'ensemble de la population.

    7.

    Sous un « diagramme de dispersion », il est noté que le coefficient de corrélation est de 0,10. Qu'est-ce que cela signifie ?

    1. plus et moins 10 % de la moyenne comprend environ 68 % des cas
    2. un dixième de la variance d'une variable est partagé avec l'autre variable
    3. un dixième d'une variable est causé par l'autre variable
    4. sur une échelle de -1 à +1, le degré de relation linéaire entre les deux variables est de +0,10
    8.

    Le coefficient de corrélation pour\(X\) et\(Y\) est connu pour être nul. Nous pouvons alors conclure que :

    1. X et\(Y\) ont des distributions standard
    2. les variances de\(X\) et\(Y\) sont égales
    3. il n'existe aucune relation entre\(X\) et Y
    4. il n'existe pas de relation linéaire entre\(X\) et Y
    5. aucun de ceux-ci
    9.

    Quelle serait selon vous la valeur du coefficient de corrélation pour les deux variables : « nombre d'heures-personnes travaillées » et « nombre d'unités de travail achevées » ?

    1. Environ 0,9
    2. Environ 0,4
    3. Environ 0,0
    4. Environ -0,4
    5. Environ -0,9
    10.

    Dans un groupe donné, la corrélation entre la taille mesurée en pieds et le poids mesuré en livres est de +0,68. Lequel des énoncés suivants modifierait la valeur de r ?

    1. la hauteur est exprimée en centimètres.
    2. le poids est exprimé en kilogrammes.
    3. les deux éléments ci-dessus affecteront r.
    4. aucune des modifications ci-dessus n'affectera r.

    13.2 Tester la signification du coefficient de corrélation

    11.

    Définissez un\(t\) test d'un coefficient de régression et donnez un exemple unique de son utilisation.

    12.

    La corrélation entre les résultats d'un test de névrosisme et les scores d'un test d'anxiété est élevée et positive ; par conséquent

    1. anxiété provoque un névrosisme
    2. ceux qui obtiennent de faibles résultats à un test ont tendance à obtenir de bons résultats à l'autre.
    3. ceux qui obtiennent de faibles résultats à un test ont tendance à obtenir de faibles résultats à l'autre.
    4. aucune prédiction valable d'un test à l'autre ne peut être faite.

    13.3 Équations linéaires

    13.

    Vrai ou faux ? Si la valeur est False, corrigez-la : supposons qu'un intervalle de confiance\(\beta\) de 95 % pour la pente de la régression en ligne droite de\(Y\) on\(X\) soit donné par\(-3.5 < \beta < -0.5\). Ensuite, un test bilatéral de l'hypothèse\(H_{0} : \beta=-1\) aboutirait à un rejet\(H_0\) au seuil de signification de 1 %.

    14.

    Vrai ou faux : Il est plus prudent d'interpréter les coefficients de corrélation comme des mesures d'association plutôt que comme des mesures de causalité en raison de la possibilité d'une fausse corrélation.

    15.

    Nous souhaitons trouver la relation linéaire entre le nombre de widgets achetés en même temps et le coût par widget. Les données suivantes ont été obtenues :

    \(X\): Nombre de widgets achetés : 1, 3, 6, 10, 15

    \(Y\): Coût par widget (en dollars) — 55, 52, 46, 32, 25

    Supposons que la droite de régression soit\(\hat{y}=-2.5 x+60\). Nous calculons le prix moyen par widget si 30 sont achetés et observons lequel des éléments suivants ?

    1. \(\hat{y}=15 \text { dollars }\); évidemment, nous nous trompons ; la prédiction\(\hat y\) est en fait de +15 dollars.
    2. \(\hat{y}=15 \text { dollars }\), ce qui semble raisonnable à en juger par les données.
    3. \ (\ hat {y} =-15 \ text {dollars} \, ce qui est évidemment absurde. La droite de régression doit être incorrecte.
    4. \(\hat{y}=-15 \text { dollars }\), ce qui est tout à fait absurde. Cela nous rappelle que la prévision\(Y\) en dehors de la plage de\(X\) valeurs de nos données est une très mauvaise pratique.
    16.

    Discutez brièvement de la distinction entre corrélation et causalité.

    17.

    Vrai ou faux : Si la valeur\(r\) est proche de + ou -1, nous dirons qu'il existe une forte corrélation, avec la compréhension tacite que nous faisons référence à une relation linéaire et à rien d'autre.

    13.4 L'équation de régression

    18.

    Supposons que vous ayez à votre disposition les informations ci-dessous pour chacun des 30 conducteurs. Proposer un modèle (y compris une très brève indication des symboles utilisés pour représenter des variables indépendantes) pour expliquer comment les miles par gallon varient d'un conducteur à l'autre sur la base des facteurs mesurés.

    Informations :

    1. miles parcourus par jour
    2. poids de la voiture
    3. nombre de cylindres dans le véhicule
    4. vitesse moyenne
    5. miles par gallon
    6. nombre de passagers
    19.

    Envisagez une analyse de régression par les moindres carrés d'un échantillon entre une variable dépendante (\(Y\)) et une variable indépendante (\(X\)). Un coefficient de corrélation d'échantillon de −1 (moins un) nous indique que

    1. il n'y a aucune relation entre\(Y\) et\(X\) dans l'échantillon
    2. il n'y a aucune relation entre\(Y\) et\(X\) au sein de la population
    3. il existe une relation négative parfaite entre\(Y\) et\(X\) au sein de la population
    4. il existe une relation négative parfaite entre\(Y\) et\(X\) dans l'échantillon.
    20.

    Dans l'analyse corrélationnelle, lorsque les points sont largement dispersés autour de la droite de régression, cela signifie que la corrélation est

    1. négatif.
    2. faible.
    3. hétérogène.
    4. entre deux mesures peu fiables.

    13.5 Interprétation des coefficients de régression : élasticité et transformation logarithmique

    21.

    Dans une régression linéaire, pourquoi devons-nous nous préoccuper de la plage de la variable indépendante (\(X\)) ?

    22.

    Supposons que l'on ait collecté les informations suivantes où\(X\) sont le diamètre du tronc et\(Y\) la hauteur de l'arbre.

    \ (\ PageIndex {3} \) « >
    X Y
    4 8
    2 4
    8 18
    6 22
    10 30
    6 8
    Tableau\(\PageIndex{3}\)

    Équation de régression :\(\hat{y}_{i}=-3.6+3.1 \cdot X_{i}\)

    Quelle est votre estimation de la hauteur moyenne de tous les arbres dont le tronc a un diamètre de 7 pouces ?

    23.

    Les fabricants d'un produit chimique utilisé dans les colliers anti-puces affirment que, dans des conditions d'essai standard, chaque unité supplémentaire du produit chimique entraînera une réduction de 5 puces (c'est-à-dire où\(X_{j}=\text { amount of chemical }\) et\(Y_{J}=B_{0}+B_{1} \cdot X_{J}+E_{J}\),\(H_0:B_1=−5\)

    Supposons qu'un test ait été effectué et que les résultats provenant d'un ordinateur incluent :

    Interception = 60

    Pente = −4

    Erreur type du coefficient de régression = 1,0

    Degrés de liberté d'erreur = 2000

    Intervalle de confiance à 95 % pour la pente −2,04, −5,96

    Ces preuves sont-elles compatibles avec l'affirmation selon laquelle le nombre de puces est réduit à raison de 5 puces par unité de produit chimique ?

    13.6 Prédiction à l'aide d'une équation de régression

    24.

    Vrai ou faux ? Si la valeur est False, corrigez-la : supposons que vous effectuez une régression linéaire simple de «\(Y\) on »\(X\) et que vous testez l'hypothèse selon laquelle la pente\(\beta\) est nulle par rapport à une alternative bilatérale. Vous avez des\(n=25\) observations et la statistique de votre test calculé (\(t\)) est de 2,6. Ensuite, votre valeur P est donnée par\(.01 < P < .02\), ce qui donne une signification limite (c'est-à-dire que vous rejetteriez\(H_0\) à\(\alpha=.02\) mais que vous ne rejetiez pas\(H_0\) à\(\alpha=.01\)).

    25.

    Un économiste s'intéresse à l'influence possible du « blé miracle » sur le rendement moyen du blé dans un district. Pour ce faire, il effectue une régression linéaire du rendement moyen annuel par rapport à l'année après l'introduction du « blé miracle » sur une période de dix ans.

    La ligne de tendance ajustée est

    \(\hat{y}_{j}=80+1.5 \cdot X_{j}\)

    (\(Y_j\): Rendement moyen dans\(j\) l'année suivant l'introduction)

    (\(X_j\): un\(j\) an après l'introduction).

    1. Quel est le rendement moyen estimé pour la quatrième année suivant l'introduction ?
    2. Souhaitez-vous utiliser cette courbe de tendance pour estimer le rendement, par exemple, 20 ans après son introduction ? Pourquoi ? Quelle serait votre estimation ?
    26.

    Une interprétation de\(r=0.5\) est que la partie suivante de la\(Y\) variation -est associée à quelle variation dans\(X\) :

    1. le plus
    2. moitié
    3. très peu
    4. un quart
    5. aucun de ceux-ci
    27.

    Parmi les valeurs suivantes, laquelle\(r\) indique la prédiction la plus précise d'une variable par rapport à une autre ?

    1. \(r=1.18\)
    2. \(r=−.77\)
    3. \(r=.68\)

    13.7 Comment utiliser Microsoft Excel® pour l'analyse de régression

    28.

    Un programme informatique de régression multiple a été utilisé pour ajuster\(\hat{y}_{j}=b_{0}+b_{1} \cdot X_{1 j}+b_{2} \cdot X_{2 j}+b_{3} \cdot X_{3 j}\).

    Une partie de la sortie de l'ordinateur inclut :

    \ (\ PageIndex {4} \) « >
    i \(b_i\) \(S_{b_i}\)
    0 8 1,6
    1 2.2 2.4
    2 -7,2 3.2
    3 0,005 0,002
    Tableau\(\PageIndex{4}\)
    1. Le calcul de l'intervalle de confiance pour\(b_2\) se compose de _______\(\pm\) (\(t\)valeur d'un étudiant) (_______)
    2. Le niveau de confiance pour cet intervalle se reflète dans la valeur utilisée pour _______.
    3. Les degrés de liberté disponibles pour estimer la variance sont directement liés à la valeur utilisée pour _______
    29.

    Un chercheur a utilisé un programme de régression multiple sur 20 points de données pour obtenir une équation de régression à 3 variables. Une partie de la sortie de l'ordinateur est :

    \ (\ PageIndex {5} \) « >
    Variable Coefficient Erreur standard de\(bf{b_i}\)
    1 0,45 0,21
    2 0,80 0,10
    3 3.10 0,86
    Tableau\(\PageIndex{5}\)
    1. 0,80 est une estimation de ___________.
    2. 0,10 est une estimation de ___________.
    3. En supposant que les réponses répondent à l'hypothèse de normalité, nous pouvons être sûrs à 95 % que la valeur de\(\beta_2\) se situe dans l'intervalle, _______ ± [\(t_{.025} \cdot \)_______], où\(t_{.025}\) est la valeur critique de la distribution t de l'étudiant avec ____ degrés de liberté.