Skip to main content
Global

1.H:采样和数据(家庭作业)

  • Page ID
    204490
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    1.1 统计、概率和关键术语的定义

    对于以下八个练习中的每一个练习,请确定:a. 总体、b. 样本、c. 参数、d. 统计数据、e. 变量和 f. 数据。 酌情举例说明。

    1

    健身中心对客户每周在中心锻炼的平均时间感兴趣。

    2

    滑雪胜地对孩子上第一堂滑雪和单板滑雪课程的平均年龄感兴趣。 他们需要这些信息才能以最佳方式计划滑雪课程。

    3

    心脏病专家对心脏病发作患者的平均康复期感兴趣。

    4

    保险公司对客户每年的平均健康费用感兴趣,以便他们能够确定健康保险的费用。

    5

    政治家对自己所在地区认为自己做得不错的选民比例感兴趣。

    6

    婚姻顾问对她所咨询的未婚客户的比例感兴趣。

    7

    政治民意调查员可能对投票支持特定事业的人的比例感兴趣。

    8

    营销公司对购买特定产品的人口比例感兴趣。

    使用以下信息回答接下来的三个练习:太浩湖社区学院的一位讲师对太浩湖社区学院数学学生在一个季度内缺课的平均天数感兴趣。

    9

    她对哪些人感兴趣?

    1. 太浩湖社区学院的所有学生
    2. 所有太浩湖社区学院英语学生
    3. 太浩湖社区学院所有学生都在她的课上
    4. 所有太浩湖社区学院的数学学生
    10

    请考虑以下几点:

    \(X\)= 太浩湖社区学院数学学生缺勤的天数

    在本例中,\(X\)是一个示例:

    1. 变量。
    2. 人口。
    3. 统计数据。
    4. 数据。
    11

    教师的样本得出的平均缺勤天数为 3.5 天。 此值是 a 的示例:

    1. 参数。
    2. 数据。
    3. 统计数据。
    4. 变量。

    1.2 数据、采样以及数据和抽样中的变异

    在以下练习中,确定用于描述响应的数据类型(定量离散、定量连续或定性),并举例说明数据。

    12

    演唱会售出的门票数量

    13

    体内脂肪的百分比

    14

    最喜欢的棒球队

    15

    是时候排队买杂货了

    16

    在长荣谷学院就读的学生人数

    17

    收视率最高的电视节目

    18

    牙膏品牌

    19

    到最近的电影院的距离

    20

    《财富》500强公司的高管年龄

    21

    竞争计算机电子表格软件包的数量

    使用以下信息回答接下来的两个练习:进行了一项研究,以确定圣何塞当地公园的年龄、每周次数和居民使用当地公园的持续时间(时间)。 公园周围社区的第一所房子是随机选择的,然后对公园周围社区的每8栋房屋进行了采访。

    22

    “每周次数” 是什么类型的数据?

    1. 定性(分类)
    2. 定量离散
    3. 定量连续
    23

    “持续时间(时间量)” 是什么类型的数据?

    1. 定性(分类)
    2. 定量离散
    3. 定量连续
    24

    航空公司对每次航班上婴儿数量的一致性感兴趣,以便他们有足够的安全设备。 假设一家航空公司进行了一项调查。 在感恩节周末,它调查了从波士顿飞往盐湖城的六班航班,以确定航班上的婴儿人数。 它根据该研究的结果确定了所需的安全设备数量。

    1. 使用完整的句子,列出调查进行方式的三点错误。
    2. 使用完整的句子,列出如果要重复调查,可以改进调查的三种方法。
    25

    假设你想确定你所在州每个统计课的平均学生人数。 用三到五个完整的句子描述一种可能的抽样方法。 详细说明内容。

    26

    假设你想确定你所在学校二十多岁的学生每月喝的汽水罐装的平均数量。 用三到五个完整的句子描述一种可能的抽样方法。 详细说明内容。

    27

    列出从电话调查中获得准确结果所涉及的一些实际困难。

    28

    列出从邮寄的调查中获得准确结果所涉及的一些实际困难。

    29

    如果你需要进行电话或邮件调查,可以和同学一起集思广益,找出一些方法来克服这些问题。

    30

    教师通过收集从每个太浩湖社区学院数学课中随机选择的五名学生的数据来抽取样本。 她使用的采样类型是

    1. 集群采样
    2. 分层采样
    3. 简单随机抽样
    4. 便捷采样
    31

    进行了一项研究,以确定居民在圣何塞使用当地公园的年龄、每周的次数和持续时间(时间)。 公园周围社区的第一所房子是随机选择的,然后对公园周围社区的八分之一的房屋进行了采访。 采样方法是:

    1. 简单随机
    2. 系统的
    3. 分层
    4. 聚集
    32

    命名在以下每种情况下使用的采样方法:

    1. 机场的一名女性正在向旅客分发问卷,要求他们评估机场的服务。 她不问那些手里装满行李匆忙通过机场的旅客,而是问所有坐在登机口附近等候时不小睡的旅客。
    2. 一位老师想知道她的学生是否在做作业,因此她随机选择第二行和第五行,然后召集第二行的所有学生和第五行的所有学生,向全班介绍家庭作业问题的解决方案。
    3. 一家电子连锁店的营销经理想要有关其客户年龄的信息。 在接下来的两周内,在每个门店,100名随机选择的顾客将获得问卷,要求他们填写有关年龄以及其他感兴趣的变量的信息。
    4. 公共图书馆的图书管理员想确定图书馆用户中有多少是儿童。 图书管理员有一张计票单,她可以在上面标出书籍是由成人还是儿童签出。 她为每四分之一的看书的顾客记录这些数据。
    5. 一个政党想知道选民对候选人之间辩论的反应。 辩论结束后的第二天,该党的投票人员拨打了1200个随机选择的电话号码。 如果已登记的选民接听电话或可以接听电话,则会询问该登记选民打算投票给谁,以及辩论是否改变了他或她对候选人的看法。
    33

    对 “微处理器一代”(自1971年微处理器发明以来出生的人)的3,274人进行了 “随机调查”。 据报道,48%的受访者表示,如果他们有2,000美元可以花,他们会将其用于计算机设备。 此外,66%的受访者认为自己相对精明的计算机用户。

    1. 你认为样本量足够大,可以进行这种类型的研究吗? 为什么或者为什么不呢?
    2. 根据你的 “直觉”,你认为这些百分比准确地反映了自1971年以来出生的人的美国人口吗? 如果不是,你认为人口百分比实际上高于还是低于样本统计数据? 为什么?
      附加信息:英特尔公司报告的调查由前往洛杉矶会议中心观看史密森尼学会名为 “美国史密森尼” 的路演的个人填写。
    3. 有了这些额外的信息,你觉得所有人口和族裔群体在活动中都有平等的代表性吗? 为什么或者为什么不呢?
    4. 使用其他信息,评论您认为样本统计数据反映总体参数的准确程度。
    34

    幸福指数是一项定期跟踪美国居民趋势的调查。 调查涵盖六个健康和保健领域:生活评估、情绪健康、身体健康、健康行为、工作环境和基本准入。 下面列出了用于衡量指数的一些问题。

    确定从本次调查中使用的每个问题中获得的数据类型:定性(分类)、定量离散或定量连续。

    1. 您是否有任何健康问题使您无法做同龄人平时可以做的事情?
    2. 在过去的30天里,健康状况不佳使你无法进行日常活动有多少天?
    3. 在过去的七天里,你运动了多少天 30 分钟或更长时间?
    4. 你有健康保险吗?
    35

    在1936年总统大选之前,一本名为《文学文摘》的杂志发布了一项民意调查的结果,预测共和党候选人阿尔夫·兰登将以很大的优势获胜。 该杂志向大约一千万名潜在选民发送了明信片。 这些潜在选民是从该杂志的订阅清单、汽车登记名单、电话列表和俱乐部会员名单中选出的。 大约有230万人归还了明信片。

    1. 想想1936年的美国州。 解释为什么从杂志订阅清单、汽车登记清单、电话簿和俱乐部会员名单中选出的样本不能代表当时的美国人口。
    2. 低响应率对样本的可靠性有什么影响?
    3. 这些问题是采样错误还是非采样误差的例子?
    4. 同年,乔治·盖洛普对30,000名潜在选民进行了自己的民意调查。 这些研究人员使用一种他们称之为 “配额抽样” 的方法从特定人群中获得调查答案。 配额抽样是本模块中描述的哪种抽样方法的示例?
    36

    1960年美国47个州的犯罪相关统计数据和人口统计数据是从政府机构收集的,包括联邦调查局的《统一犯罪报告》。 对这些数据进行的一项分析发现,教育与犯罪之间存在紧密的联系,这表明社区中教育水平越高,犯罪率越高。

    示例中讨论的示例中哪些潜在问题\(\PageIndex{4}\)可以解释这种联系?

    37

    YouPolls是一个允许任何人创建和回复民意调查的网站。 4 月 15 日发布的一个问题是:

    “当奥巴马政府成员被允许忽视他们的纳税义务时,你愿意纳税吗?” (last baldeagle。2013。 在纳税日,众议院呼吁解雇拖欠税款的联邦工作人员。 民意调查在线发布于:http://www.youpolls.com/details.aspx?id=12328(2013 年 5 月 1 日访问)。)

    截至4月25日,有11人回答了这个问题。 每个参与者都回答 “不!”

    本模块中讨论的示例中哪些潜在问题可以解释这种联系?

    38

    一篇关于回复率的学术文章以以下引文开头:

    “在随机数字拨号(RDD)全国电话调查中,联系和合作率的下降引起了人们对此类研究得出的估计的有效性的严重担忧。” (Scott Keeter 等人,“衡量越来越多的不回复对全国 RDD 电话调查估计的影响”,《民意季刊》第 70 期第 5 期(2006 年),http://poq.oxfordjournals.org/content/70/5/759.full(2013 年 5 月 1 日访问)。)

    皮尤人民与新闻研究中心承认:

    “在过去的十年或更长时间里,在我们尝试采访的所有人中,我们面试的人的比例一直在下降。” (常见问题,皮尤人民与新闻研究中心,http://www.people-press.org/methodol...wer-your-polls(2013 年 5 月 1 日访问)。)

    1. 过去十年回复率下降的原因有哪些?
    2. 解释为什么研究人员担心回复率下降对民意调查的影响。

    1.3 测量等级

    39。

    五十名兼职学生被问及他们本学期要修多少门课程。 (不完整)结果如下所示:

    \ (\ pageIndex {13}\) 兼职学生课程加载中 “>
    课程数量 频率 相对频率 累积相对频率
    1 30 0.6
    2 15
    3

    1.13 兼职学生课程负荷

    1. 填写表格中的空白\(\PageIndex{13}\)
    2. 究竟有多少百分比的学生选修两门课程?
    3. 参加一两门课程的学生百分比是多少?
    40

    六十名患有牙龈疾病的成年人被问及他们在诊断前每周使用牙线的次数。 (不完整)结果显示在\(\PageIndex{14}\)

    \ (\ pageIndex {14}\) 牙龈疾病成人的使用牙线频率 “>
    # 每周使用牙线 频率 相对频率 累积相对频率
    0 27 0.4500
    1 18
    3 0.9333
    6 3 0.0500
    7 1 0.0167

    1.14 患有牙龈疾病的成年人使用牙线频率

    1. 填写表格中的空白\(\PageIndex{14}\)
    2. 每周使用六次牙线的成年人中有多少百分比?
    3. 每周最多使用三次牙线的百分比是多少?
    41

    十九名移民被问及他们在美国生活了多少年,最接近的一年。数据如下:2;5;7;2;10;20;0;0;20;5;12;4;5;5;15;12;4;5;5;10。

    桌子\(\PageIndex{15}\)已经制作好了。

    \ (\ pageIndex {15}\) 移民调查回复频率 “>
    数据 频率 相对频率 累积相对频率
    0 2 219219 0.1053
    2 3 319319 0.2632
    4 1 119119 0.3158
    5 3 319319 0.4737
    7 2 219219 0.5789
    10 2 219219 0.6842
    12 2 219219 0.7895
    15 1 119119 0.8421
    20 1 119119 1.0000
    表:移民调查回复\(\PageIndex{15}\)频率
    1. 修复表中的错误\(\PageIndex{15}\)。 另外,请解释有人怎么可能得出了错误的号码。
    2. 解释这句话有什么问题:“47%的受访者在美国生活了5年。”
    3. 修复 b 中的语句以使其正确。
    4. 在接受调查的人中,有多少人曾在美国生活过五到七年?
    5. 在接受调查的人中,有多少人最多在美国生活了12年?
    6. 在接受调查的人中,有多少比例在美国生活了不到12年?
    7. 受访者中有多少比例在美国生活了五到二十年(含)?
    42

    出差上班需要多少时间? 该@@ \(\PageIndex{16}\)显示了各州至少16岁不在家工作的工人的平均通勤时间。 找出平均行程时间,然后正确地对答案进行四舍五入。

    \ (\ pageIndex {16}\) “>
    24.0 24.3 25.9 18.9 27.5 17.9 21.8 20.9 16.7 27.3
    18.2 24.7 20.0 22.6 23.9 18.0 31.4 22.3 24.0 25.5
    24.7 24.6 28.1 24.9 22.6 23.6 23.4 25.7 24.8 25.5
    21.2 25.7 23.1 23.0 23.9 26.0 16.3 23.1 21.4 21.5
    27.0 27.0 18.6 31.7 23.3 30.1 22.9 23.3 21.7 18.6
    桌子\(\PageIndex{16}\)
    43

    《福布斯》杂志发布了2012年最佳小企业的数据。 这些公司已经公开上市至少一年,股价至少为每股5美元,并且报告的年收入在500万至10亿美元之间。 该@@ \(\PageIndex{17}\)显示了排名前60位的公司的首席执行官年龄。

    \ (\ pageIndex {17}\) “>
    年龄 频率 相对频率 累积相对频率
    40—44 3
    45—49 11
    50—54 13
    55—59 16
    60—64 10
    65—69 6
    70—74 1
    桌子\(\PageIndex{17}\)
    1. 首席执行官年龄在54至65岁之间的频率是多少?
    2. 65岁或以上的首席执行官的百分比是多少?
    3. 50 岁以下年龄段的相对频率是多少?
    4. 55岁以下首席执行官的累计相对频率是多少?
    5. 哪张图显示相对频率,哪张图显示累积相对频率?
    图 A 是包含 7 个条形的条形图。 x 轴显示首席执行官的年龄,间隔为 5 年,从 40-44 岁开始。 y 轴显示从 0 到 1 之间的相对频率,间隔为 0.2。 显示的最高相对频率为 0.27。 图 B 是包含 7 个条形的条形图。 x 轴显示首席执行官的年龄,间隔为 5 年,从 40-44 岁开始。 y 轴显示从 0 到 1 之间的相对频率,间隔为 0.2。 显示的最高相对频率为 1。
    \(\PageIndex{11}\)

    使用以下信息回答接下来的两个练习:该\(\PageIndex{18}\)包含在 1851 年至 2004 年间直接袭击美国的飓风的数据。 根据风暴产生的最小风速,对飓风进行强度等级评级。

    \ (\ pageIndex {18}\) 飓风直接袭击的频率 “>
    类别 直接命中次数 相对频率 累积频率
    总计 = 273
    1 109 0.3993 0.3993
    2 72 0.2637 0.6630
    3 71 0.2601
    4 18 0.9890
    5 3 0.0110 1.0000

    1.18 飓风直接袭击的频率

    44

    4级飓风直接袭击的相对频率是多少?

    1. 0.0768
    2. 0.0659
    3. 0.2601
    4. 没有足够的信息来计算
    45

    最多是 3 级风暴的直接击中的相对频率是多少?

    1. 0.3480
    2. 0.9231
    3. 0.2601
    4. 0.3370