Skip to main content
Global

1.H : Échantillonnage et données (devoirs)

  • Page ID
    191459
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    1.1 Définitions des statistiques, des probabilités et des termes clés

    Pour chacun des huit exercices suivants, identifiez : a. la population, b. l'échantillon, c. le paramètre, d. la statistique, e. la variable et f. les données. Donnez des exemples le cas échéant.

    1.

    Un centre de remise en forme s'intéresse au temps moyen pendant lequel un client fait de l'exercice dans le centre chaque semaine.

    2.

    Les stations de ski s'intéressent à l'âge moyen auquel les enfants prennent leurs premiers cours de ski et de snowboard. Ils ont besoin de ces informations pour planifier leurs cours de ski de manière optimale.

    3.

    Une cardiologue s'intéresse à la période de convalescence moyenne de ses patients ayant subi une crise cardiaque.

    4.

    Les compagnies d'assurance s'intéressent aux dépenses de santé annuelles moyennes de leurs clients, afin de pouvoir déterminer les coûts de l'assurance maladie.

    5.

    Un politicien s'intéresse à la proportion d'électeurs de sa circonscription qui pensent qu'il fait du bon travail.

    6.

    Une conseillère conjugale s'intéresse à la proportion de clients qu'elle conseille qui restent mariés.

    7.

    Les sondeurs politiques peuvent être intéressés par la proportion de personnes qui voteront pour une cause particulière.

    8.

    Une société de marketing s'intéresse à la proportion de personnes qui achèteront un produit particulier.

    Utilisez les informations suivantes pour répondre aux trois exercices suivants : Un instructeur du Lake Tahoe Community College est intéressé par le nombre moyen de jours pendant lesquels les étudiants en mathématiques du Lake Tahoe Community College sont absents des cours pendant un trimestre.

    9.

    Quelle est la population qui l'intéresse ?

    1. tous les étudiants du Lake Tahoe Community College
    2. tous les étudiants d'anglais du Lake Tahoe Community College
    3. tous les étudiants du Lake Tahoe Community College dans ses classes
    4. tous les étudiants en mathématiques du Lake Tahoe Community College
    10.

    Tenez compte des points suivants :

    \(X\)= nombre de jours pendant lesquels un étudiant en mathématiques du Lake Tahoe Community College est absent

    Dans ce cas,\(X\) voici un exemple de :

    1. variable.
    2. population.
    3. statistique.
    4. données.
    11.

    L'échantillon de l'instructeur produit un nombre moyen de jours d'absence de 3,5 jours. Cette valeur est un exemple de :

    1. paramètre.
    2. données.
    3. statistique.
    4. variable.

    1.2 Données, échantillonnage et variation des données et de l'échantillonnage

    Pour les exercices suivants, identifiez le type de données qui seraient utilisées pour décrire une réponse (quantitative discrète, quantitative continue ou qualitative) et donnez un exemple de données.

    12.

    nombre de billets vendus pour un concert

    13.

    pourcentage de graisse corporelle

    14.

    équipe de baseball préférée

    15.

    temps passé à faire la queue pour faire ses courses

    16.

    nombre d'étudiants inscrits à l'Evergreen Valley College

    17.

    émission de télévision la plus regardée

    18.

    marque de dentifrice

    19.

    distance de la salle de cinéma la plus proche

    20.

    âge des dirigeants des entreprises du Fortune 500

    21.

    nombre de progiciels de tableur informatique concurrents

    Utilisez les informations suivantes pour répondre aux deux exercices suivants : Une étude a été réalisée pour déterminer l'âge, le nombre de fois par semaine et la durée (durée) de l'utilisation par les résidents d'un parc local à San Jose. La première maison du quartier autour du parc a été sélectionnée au hasard, puis une maison sur huit du quartier autour du parc a été interviewée.

    22.

    Quel type de données correspond au « nombre de fois par semaine » ?

    1. qualitatif (catégorique)
    2. quantitatif discret
    3. quantitatif continu
    23.

    « Durée (quantité de temps) » correspond à quel type de données ?

    1. qualitatif (catégorique)
    2. quantitatif discret
    3. quantitatif continu
    24.

    Les compagnies aériennes souhaitent que le nombre de bébés soit constant sur chaque vol, afin de disposer d'équipements de sécurité adéquats. Supposons qu'une compagnie aérienne mène une enquête. Pendant le week-end de Thanksgiving, il examine six vols entre Boston et Salt Lake City afin de déterminer le nombre de bébés à bord. Il détermine la quantité d'équipement de sécurité nécessaire en fonction des résultats de cette étude.

    1. À l'aide de phrases complètes, énumérez trois problèmes dans la façon dont l'enquête a été menée.
    2. À l'aide de phrases complètes, énumérez trois façons d'améliorer le sondage s'il devait être répété.
    25.

    Supposons que vous souhaitiez déterminer le nombre moyen d'étudiants par classe de statistiques dans votre État. Décrivez une méthode d'échantillonnage possible en trois à cinq phrases complètes. Rendez la description détaillée.

    26.

    Supposons que vous souhaitiez déterminer le nombre moyen de canettes de soda consommées chaque mois par les élèves de votre école âgés d'une vingtaine d'années. Décrivez une méthode d'échantillonnage possible en trois à cinq phrases complètes. Rendez la description détaillée.

    27.

    Énumérez certaines difficultés pratiques liées à l'obtention de résultats précis à partir d'un sondage téléphonique.

    28.

    Énumérez certaines difficultés pratiques liées à l'obtention de résultats précis à partir d'un sondage envoyé par la poste

    29.

    Avec vos camarades de classe, réfléchissez à des moyens de surmonter ces problèmes si vous deviez mener un sondage par téléphone ou par courrier.

    30.

    L'instructrice prélève son échantillon en collectant des données sur cinq étudiants sélectionnés au hasard dans chaque classe de mathématiques du Lake Tahoe Community College. Le type d'échantillonnage qu'elle a utilisé est

    1. échantillonnage en grappes
    2. échantillonnage stratifié
    3. échantillonnage aléatoire simple
    4. échantillonnage de commodité
    31.

    Une étude a été réalisée pour déterminer l'âge, le nombre de fois par semaine et la durée (durée) des résidents utilisant un parc local à San Jose. La première maison du quartier autour du parc a été sélectionnée au hasard, puis une maison sur huit du quartier autour du parc a été interviewée. La méthode d'échantillonnage était la suivante :

    1. simple et aléatoire
    2. systématique
    3. stratifié
    4. grappe
    32.

    Nommez la méthode d'échantillonnage utilisée dans chacune des situations suivantes :

    1. Une femme de l'aéroport distribue des questionnaires aux voyageurs pour leur demander d'évaluer le service de l'aéroport. Elle ne demande pas aux voyageurs qui se pressent de traverser l'aéroport les mains pleines de bagages, mais à tous les voyageurs assis près des portes d'embarquement et qui ne font pas de siestes pendant qu'ils attendent.
    2. Une enseignante veut savoir si ses élèves font leurs devoirs. Elle choisit donc au hasard les rangées deux et cinq, puis demande à tous les élèves de la rangée deux et à tous les élèves de la rangée cinq de présenter les solutions aux problèmes de devoirs à la classe.
    3. Le responsable marketing d'une chaîne de magasins d'électronique souhaite obtenir des informations sur l'âge de ses clients. Au cours des deux prochaines semaines, dans chaque magasin, 100 clients sélectionnés au hasard reçoivent des questionnaires à remplir pour leur demander des informations sur leur âge, ainsi que sur d'autres variables d'intérêt.
    4. Le bibliothécaire d'une bibliothèque publique souhaite déterminer la proportion des utilisateurs de la bibliothèque qui sont des enfants. La bibliothécaire dispose d'une feuille de comptage sur laquelle elle indique si les livres sont consultés par un adulte ou par un enfant. Elle enregistre ces données pour un client sur quatre qui consulte des livres.
    5. Un parti politique souhaite connaître la réaction des électeurs face à un débat entre les candidats. Le lendemain du débat, le personnel électoral du parti appelle 1 200 numéros de téléphone sélectionnés au hasard. Si un électeur inscrit répond au téléphone ou est disponible pour répondre au téléphone, on lui demande pour qui il a l'intention de voter et si le débat a changé son opinion sur les candidats.
    33.

    Une « enquête aléatoire » a été menée auprès de 3 274 personnes de la « génération des microprocesseurs » (personnes nées depuis 1971, année de l'invention du microprocesseur). Il a été rapporté que 48 % des personnes interrogées ont déclaré que si elles avaient 2 000 dollars à dépenser, elles les utiliseraient pour du matériel informatique. De plus, 66 % des personnes interrogées se considéraient comme des utilisateurs d'ordinateurs relativement avertis.

    1. Considères-tu que la taille de l'échantillon est suffisante pour une étude de ce type ? Pourquoi ou pourquoi pas ?
    2. Sur la base de votre « intuition », pensez-vous que les pourcentages reflètent exactement la population américaine pour les personnes nées depuis 1971 ? Si ce n'est pas le cas, pensez-vous que les pourcentages de la population sont réellement supérieurs ou inférieurs aux statistiques de l'échantillon ? Pourquoi ?
      Informations complémentaires : L'enquête, publiée par Intel Corporation, a été remplie par des personnes qui se sont rendues au Los Angeles Convention Center pour assister au road show du Smithsonian Institute intitulé « America's Smithsonian ».
    3. Avec ces informations supplémentaires, pensez-vous que tous les groupes démographiques et ethniques étaient représentés de manière égale lors de l'événement ? Pourquoi ou pourquoi pas ?
    4. À l'aide des informations supplémentaires, expliquez dans quelle mesure vous pensez que les statistiques de l'échantillon reflètent les paramètres de la population.
    34.

    L'indice de bien-être est une enquête qui suit régulièrement les tendances des résidents américains. Six domaines de la santé et du bien-être sont couverts par l'enquête : évaluation de la vie, santé émotionnelle, santé physique, comportement sain, environnement de travail et accès de base. Certaines des questions utilisées pour mesurer l'indice sont répertoriées ci-dessous.

    Déterminez le type de données obtenues à partir de chaque question utilisée dans cette enquête : qualitatives (catégorielles), quantitatives discrètes ou quantitatives continues.

    1. Avez-vous des problèmes de santé qui vous empêchent de faire ce que les gens de votre âge peuvent faire normalement ?
    2. Au cours des 30 derniers jours, pendant environ combien de jours votre mauvaise santé vous a-t-elle empêchée de faire vos activités habituelles ?
    3. Au cours des sept derniers jours, combien de jours avez-vous fait de l'exercice pendant 30 minutes ou plus ?
    4. Disposez-vous d'une couverture d'assurance maladie ?
    35.

    Avant l'élection présidentielle de 1936, un magazine intitulé Literary Digest a publié les résultats d'un sondage d'opinion prédisant que le candidat républicain Alf Landon l'emporterait largement. Le magazine a envoyé des cartes postales à environ 10 000 000 d'électeurs potentiels. Ces électeurs potentiels ont été sélectionnés à partir de la liste des abonnés du magazine, des listes d'immatriculation des automobiles, des listes téléphoniques et des listes de membres des clubs. Environ 2 300 000 personnes ont retourné les cartes postales.

    1. Pensez à l'état des États-Unis en 1936. Expliquez pourquoi un échantillon choisi parmi les listes d'abonnés à des magazines, les listes d'immatriculation des automobiles, les annuaires téléphoniques et les listes de membres de clubs n'était pas représentatif de la population des États-Unis à cette époque.
    2. Quel est l'effet du faible taux de réponse sur la fiabilité de l'échantillon ?
    3. Ces problèmes sont-ils des exemples d'erreur d'échantillonnage ou d'erreur non liée à l'échantillonnage ?
    4. Au cours de la même année, George Gallup a mené son propre sondage auprès de 30 000 électeurs potentiels. Ces chercheurs ont utilisé une méthode qu'ils ont appelée « échantillonnage par quotas » pour obtenir des réponses à des enquêtes auprès de sous-ensembles spécifiques de la population. L'échantillonnage par quotas est un exemple de la méthode d'échantillonnage décrite dans ce module ?
    36.

    Les statistiques relatives à la criminalité et démographiques pour 47 États américains en 1960 ont été recueillies auprès d'agences gouvernementales, y compris le Uniform Crime Report du FBI. Une analyse de ces données a révélé un lien étroit entre l'éducation et la criminalité, ce qui indique que des niveaux de scolarité plus élevés dans une communauté correspondent à des taux de criminalité plus élevés.

    Lequel des problèmes potentiels liés aux échantillons abordés dans l'exemple\(\PageIndex{4}\) pourrait expliquer cette connexion ?

    37.

    YouPolls est un site Web qui permet à quiconque de créer des sondages et d'y répondre. Une question publiée le 15 avril demande :

    « Êtes-vous heureux de payer vos impôts lorsque les membres de l'administration Obama sont autorisés à ignorer leurs obligations fiscales ? » (dernier aigle à tête blanche. 2013. Le jour de l'impôt, la Chambre demandera le licenciement des travailleurs fédéraux qui doivent des arriérés d'impôts. Sondage d'opinion publié en ligne à l'adresse : http://www.youpolls.com/details.aspx?id=12328 (consulté le 1er mai 2013).)

    Au 25 avril, 11 personnes avaient répondu à cette question. Chaque participant a répondu « NON ! »

    Parmi les problèmes potentiels liés aux exemples abordés dans ce module, lesquels peuvent expliquer cette connexion ?

    38.

    Un article scientifique sur les taux de réponse commence par la citation suivante :

    « La baisse des taux de contact et de coopération dans les enquêtes téléphoniques nationales à numérotation aléatoire (RDD) soulève de graves préoccupations quant à la validité des estimations tirées de ces recherches. » (Scott Keeter et al., « Gauging the Impact of Growing Nonresponse on Estimates from a National RDD Telephone Survey », Public Opinion Quarterly 70 no. 5 (2006), http://poq.oxfordjournals.org/content/70/5/759.full (consulté le 1er mai 2013).)

    Le Pew Research Center for People and the Press admet :

    « Le pourcentage de personnes que nous interrogeons, parmi toutes celles que nous essayons d'interviewer, a diminué au cours de la dernière décennie ou plus. » (Questions fréquemment posées, Pew Research Center for the People & the Press, http://www.people-press.org/methodol...wer-your-polls (consulté le 1er mai 2013).)

    1. Quelles sont les raisons de la baisse du taux de réponse au cours de la dernière décennie ?
    2. Expliquez pourquoi les chercheurs s'inquiètent de l'impact de la baisse du taux de réponse sur les sondages d'opinion publique.

    1.3 Niveaux de mesure

    39.

    On a demandé à 50 étudiants à temps partiel combien de cours ils suivaient cette session. Les résultats (incomplets) sont présentés ci-dessous :

    \ (\ PageIndex {13} \) Charges de cours pour étudiants à temps partiel « >
    Nombre de cours Fréquence Fréquence relative Fréquence relative cumulée
    1 30 0,6
    2 15
    3

    Tableau 1.13 Nombre de cours pour étudiants à temps partiel

    1. Remplissez les champs du tableau\(\PageIndex{13}\).
    2. Quel est le pourcentage d'étudiants qui suivent exactement deux cours ?
    3. Quel est le pourcentage d'étudiants qui suivent un ou deux cours ?
    40.

    Soixante adultes atteints d'une maladie des gencives devaient indiquer le nombre de fois par semaine qu'ils utilisaient de la soie dentaire avant leur diagnostic. Les résultats (incomplets) sont présentés dans le tableau\(\PageIndex{14}\).

    \ (\ PageIndex {14} \) Fréquence d'utilisation de la soie dentaire chez les adultes atteints de maladies des gencives « >
    # utilisation de la soie dentaire par semaine Fréquence Fréquence relative Fréquence relative cumulée
    0 27 0,4500
    1 18
    3 0,9333
    6 3 0,0500
    7 1 0,0167

    Tableau 1.14 Fréquence d'utilisation de la soie dentaire chez les adultes atteints d'une maladie

    1. Remplissez les champs du tableau\(\PageIndex{14}\).
    2. Quel pourcentage d'adultes utilisaient la soie dentaire six fois par semaine ?
    3. Quel pourcentage a utilisé la soie dentaire au plus trois fois par semaine ?
    41.

    Dix-neuf immigrants aux États-Unis ont été invités à indiquer depuis combien d'années, jusqu'à l'année la plus proche, ils vivaient aux États-Unis. Les données sont les suivantes : 2 ; 5 ; 7 ; 7 ; 2 ; 2 ; 10 ; 20 ; 15 ; 0 ; 7 ; 0 ; 20 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5

    La table\(\PageIndex{15}\) a été produite.

    \ (\ PageIndex {15} \) Fréquence des réponses aux enquêtes auprès des immigrants « >
    Données Fréquence Fréquence relative Fréquence relative cumulée
    0 2 219 219 0,1053
    2 3 319 319 0,2632
    4 1 119119 0,3158
    5 3 319 319 0,4737
    7 2 219 219 0,5789
    10 2 219 219 0,6842
    12 2 219 219 0,7895
    15 1 119119 0,8421
    20 1 119119 1 000
    Tableau\(\PageIndex{15}\) Fréquence des réponses aux enquêtes auprès des immigrants
    1. Corrigez les erreurs dans le tableau\(\PageIndex{15}\). Expliquez également comment quelqu'un a pu arriver au (x) numéro (s) incorrect (s).
    2. Expliquez ce qui ne va pas dans cette affirmation : « 47 % des personnes interrogées vivent aux États-Unis depuis 5 ans ».
    3. Corrigez l'instruction dans b pour la corriger.
    4. Quelle fraction des personnes interrogées vivent aux États-Unis depuis cinq ou sept ans ?
    5. Quelle fraction des personnes interrogées a vécu aux États-Unis pendant au plus 12 ans ?
    6. Quelle fraction des personnes interrogées vivent aux États-Unis depuis moins de 12 ans ?
    7. Quelle fraction des personnes interrogées a vécu aux États-Unis entre 5 et 20 ans inclus ?
    42.

    Combien de temps faut-il pour se rendre au travail ? Le tableau\(\PageIndex{16}\) montre le temps de trajet moyen par État pour les travailleurs âgés d'au moins 16 ans qui ne travaillent pas à domicile. Trouvez le temps de trajet moyen et arrondissez correctement la réponse.

    \ (\ PageIndex {16} \) « >
    24,0 24,3 25,9 18,9 27,5 17,9 21,8 20,9 16,7 27,3
    18,2 24,7 20,0 22,6 23,9 18,0 31,4 22,3 24,0 25,5
    24,7 24,6 28,1 24,9 22,6 23,6 23,4 25,7 24,8 25,5
    21,2 25,7 23,1 23,0 23,9 26,0 16,3 23,1 21,4 21,5
    27,0 27,0 18,6 31,7 23,3 30,1 22,9 23,3 21,7 18,6
    Tableau\(\PageIndex{16}\)
    43.

    Le magazine Forbes a publié des données sur les meilleures petites entreprises en 2012. Il s'agissait de sociétés cotées en bourse depuis au moins un an, dont le cours des actions était d'au moins 5 dollars par action et dont le chiffre d'affaires annuel se situait entre 5 et 1 milliard de dollars. Le tableau\(\PageIndex{17}\) indique l'âge des directeurs généraux des 60 premières entreprises classées.

    \ (\ PageIndex {17} \) « >
    Âge Fréquence Fréquence relative Fréquence relative cumulée
    40—44 3
    45-49 11
    50—54 13
    55—59 16
    60—64 10
    65—69 6
    70-74 1
    Tableau\(\PageIndex{17}\)
    1. Quelle est la fréquence des PDG âgés de 54 à 65 ans ?
    2. Quel pourcentage de PDG ont 65 ans ou plus ?
    3. Quelle est la fréquence relative des personnes âgées de moins de 50 ans ?
    4. Quelle est la fréquence relative cumulée pour les PDG âgés de moins de 55 ans ?
    5. Quel graphique montre la fréquence relative et lequel montre la fréquence relative cumulée ?
    Le graphique A est un graphique à barres à 7 barres. L'axe X indique l'âge du PDG par intervalles de 5 ans, en commençant par 40 à 44 ans. L'axe Y montre la fréquence relative par intervalles de 0,2 entre 0 et 1. La fréquence relative la plus élevée indiquée est de 0,27. Le graphique B est un graphique à barres à 7 barres. L'axe X indique l'âge du PDG par intervalles de 5 ans, en commençant par 40 à 44 ans. L'axe Y montre la fréquence relative par intervalles de 0,2 entre 0 et 1. La fréquence relative la plus élevée indiquée est 1.
    Figurine\(\PageIndex{11}\)

    Utilisez les informations suivantes pour répondre aux deux exercices suivants : Le tableau\(\PageIndex{18}\) contient des données sur les ouragans qui ont frappé directement les États-Unis entre 1851 et 2004. Un ouragan se voit attribuer une catégorie de force en fonction de la vitesse minimale du vent générée par la tempête.

    \ (\ PageIndex {18} \) Fréquence des impacts directs des ouragans « >
    Catégorie Nombre de résultats directs Fréquence relative Fréquence cumulée
    Total = 273
    1 109 0,3993 0,3993
    2 72 0,2637 0,6630
    3 71 0,2601
    4 18 0,9890
    5 3 0,0110 1 000

    Tableau 1.18 Fréquence des impacts directs des ouragans

    44.

    Quelle est la fréquence relative des impacts directs des ouragans de catégorie 4 ?

    1. 0,0768
    2. 0,0659
    3. 0,2601
    4. Informations insuffisantes pour effectuer le calcul
    45.

    Quelle est la fréquence relative des impacts directs qui étaient TOUT AU PLUS une tempête de catégorie 3 ?

    1. 0,3480
    2. 0,9231
    3. 0,2601
    4. 0,370