Skip to main content
Global

1.3: 测量等级

  • Page ID
    204473
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    一旦获得了一组数据,就需要对其进行整理,以便分析每个基准在集中出现的频率。 但是,在计算频率时,您可能需要对答案进行四舍五入,以使其尽可能精确。

    测量级别

    测量一组数据的方式称为其测量级别。 正确的统计程序取决于研究人员对测量水平的熟悉。 并非所有统计操作都可用于每组数据。 数据可以分为四个测量级别。 它们是(从最低到最高):

    • 标称刻度等级
    • 序数比例等级
    • 间隔刻度等级
    • 比率等级

    使用名义尺度测量的数据是定性的(分类数据)。 类别、颜色、名称、标签和最喜欢的食物以及 “是” 或 “否” 的回答都是名义水平数据的示例。 未对标称比例数据进行排序。 例如,试图根据人们最喜欢的食物对他们进行分类没有任何意义。 把披萨放在第一位,把寿司放在第二位是没有意义的。

    智能手机公司是名义规模数据的另一个例子。 这些数据是制造智能手机的公司的名称,但是尽管人们可能有个人喜好,但这些品牌并未商定顺序。 标称比例数据不能用于计算。

    使用序数尺度测量的数据与名义尺度数据类似,但有很大的区别。 可以对序数比例数据进行排序。 顺序比例数据的一个示例是美国排名前五的国家公园列表。 美国排名前五的国家公园可以从一到五排名,但我们无法衡量数据之间的差异。

    使用序数比例的另一个例子是邮轮调查,其中对有关邮轮的问题的回答是 “极好”、“良好”、“满意” 和 “不满意”。 这些响应按从最需要的响应到最不想要的响应顺序排列。 但是两条数据之间的差异是无法衡量的。 与名义比例数据一样,序数尺度数据不能用于计算。

    使用区间标度测量的数据与顺序级别数据类似,因为它具有明确的排序,但数据之间存在差异。 尽管数据没有起点,但可以测量区间尺度数据之间的差异。

    摄氏度 (C) 和华氏度 (F) 等温度标度是使用间隔标度测量的。 在两个温度测量中,40° 等于 100° 减去 60°。 差异是有道理的。 但是 0 度不是,因为在这两个尺度中,0 都不是绝对最低温度。 存在像 -10° F 和 -15°C 这样的温度,并且比 0 低。

    间隔水平数据可用于计算,但无法进行一种比较。80° C 的温度不是 20° C 的四倍(80° F 的热度也不是 20° F 的四倍)。 80与20(或四比一)的比率没有任何意义。

    使用比率标度测量的数据可以解决比率问题,并为您提供最多的信息。 比率尺度数据与区间尺度数据类似,但其点数为 0,可以计算比率。 例如,四个多项选择统计学期末考试分数分别为 80、68、20 和 92(满分可能为 100 分)。 考试是机器分级的。

    数据可以按从低到高的顺序排列:20、68、80、92。

    数据之间的差异是有意义的。 分数 92 比分数 68 高出 24 分。 比率可以计算。 最小分数为 0。 所以 80 等于 20 的四倍。 80 的分数比 20 分好四倍。

    频率

    二十名学生被问及他们每天工作多少小时。 他们以小时为单位的回复如下:5;6;3;3;2;4;7;5;2;3;5;6;5;5;5;2;5;5。

    表按升序\(\PageIndex{5}\)列出了不同的数据值及其频率。

    \ (\ pageIndex {5}\) 学生工作时间频率表 “>
    数据值 频率
    2 3
    3 5
    4 3
    5 6
    6 2
    7 1

    1.5 学生工作时间频率表

    频率是数据值出现的次数。 根据\(\PageIndex{5}\),有三个学生工作两个小时,五个学生工作三个小时,依此类推。 频率列中值的总和 20 表示样本中包含的学生总数。

    相对频率是数据值在所有结果集合中出现的次数与结果总数的比率(分数或比例)。 要找到相对频率,请将每个频率除以样本中的学生总数(在本例中为 20)。 相对频率可以写成分数、百分比或小数。

    \ (\ pageIndex {6}\) 具有相对频率的学生工作时间频率表 “>
    数据值 频率 相对频率
    2 3 \(\frac{3}{20}\)或 0.15
    3 5 \(\frac{5}{20}\)或 0.25
    4 3 \(\frac{3}{20}\)或 0.15
    5 6 \(\frac{6}{20}\)或 0.30
    6 2 \(\frac{2}{20}\)或 0.10
    7 1 \(\frac{1}{20}\)或 0.05

    1.6 按相对频率计算的学生工作时间频率表

    表中相对频率列中的值之和\(\PageIndex{6}\)\(\frac{20}{20}\),或 1。

    累积相对频率是先前相对频率的累积。 要找到累积的相对频率,请将所有先前的相对频率与当前行的相对频率相加,如表所示\(\PageIndex{7}\)

    \ (\ pageIndex {7}\) 具有相对和累积相对频率的学生工作时间频率表 “>
    数据值 频率 相对频率 累积相对频率
    2 3 \(\frac{3}{20}\)或 0.15 0.15
    3 5 \(\frac{5}{20}\)或 0.25 0.15 + 0.25 = 0.40
    4 3 \(\frac{3}{20}\)或 0.15 0.40 + 0.15 = 0.55
    5 6 \(\frac{6}{20}\)或 0.30 0.55 + 0.30 = 0.85
    6 2 \(\frac{2}{20}\)或 0.10 0.85 + 0.10 = 0.95
    7 1 \(\frac{1}{20}\)或 0.05 0.95 + 0.05 = 1.00

    1.7 具有相对和累积相对频率的学生工作时间频率表

    累积相对频率列的最后一个条目是 1,表示百分之百的数据已经累积。

    注意

    由于四舍五入,相对频率列的总和可能并不总是为 1,累积相对频率列中的最后一个条目可能不是 1。 但是,它们各自应该接近一个。

    该表\(\PageIndex{8}\)代表了 100 名男性半职业足球运动员样本的身高(以英寸为单位)。

    \ (\ pageIndex {8}\) 足球运动员身高频率表 “>
    高度(英寸) 频率 相对频率 累积相对频率
    59.95—61.95 5 \(\frac{5}{10}\)= 0.05 0.05
    61.95—63.95 3 \(\frac{3}{100}\)= 0.03 0.05 + 0.03 = 0.08
    63.95—65.95 15 \(\frac{15}{100}\)= 0.15 0.08 + 0.15 = 0.23
    65.95—67.95 40 \(\frac{40}{100}\)= 0.40 0.23 + 0.40 = 0.63
    67.95—69.95 17 \(\frac{17}{100}\)= 0.17 0.63 + 0.17 = 0.80
    69.95—71.95 12 \(\frac{12}{100}\)= 0.12 0.80 + 0.12 = 0.92
    71.95—73.95 7 \(\frac{7}{100}\)= 0.07 0.92 + 0.07 = 0.99
    73.95—75.95 1 \(\frac{1}{100}\)= 0.01 0.99 + 0.01 = 1.00
    总计 = 100 总计 = 1.00

    1.8 足球运动员身高频率表

    此表中的数据已以下间隔分组:

    • 59.95 到 61.95 英寸
    • 61.95 到 63.95 英寸
    • 63.95 到 65.95 英寸
    • 65.95 到 67.95 英寸
    • 67.95 到 69.95 英寸
    • 69.95 到 71.95 英寸
    • 71.95 到 73.95 英寸
    • 73.95 到 75.95 英寸

    在这个样本中,有五名玩家的身高在 59.95—61.95 英寸的区间内,名玩家的身高在 61.95—63.95 英寸的区间内,15 名玩家的身高在 63.95—65.95 英寸的间隔内,40 名玩家身高落在 65.95—67.95 英寸的间隔内,17 名玩家身高在 67.95—69.95 英寸区间内,12 名玩家身高在 69.95—71.95 间隔内,7 名玩家身高在 71.95—73.95 间隔内,还有身高在 73.95—75.95 区间内的玩家。 所有高度都落在区间的端点之间,而不是在端点处。

    示例\(\PageIndex{14}\)

    从表\(\PageIndex{8}\)中找出小于 65.95 英寸的高度的百分比。

    练习\(\PageIndex{14}\)

    该表\(\PageIndex{9}\)显示了城镇样本中年降雨量(以英寸为单位)。

    \ (\ pageIndex {9}\) “>
    降雨量(英寸) 频率 相对频率 累积相对频率
    2.95—4.97 6 \(\frac{6}{50}\)= 0.12 0.12
    4.97—6.99 7 \(\frac{7}{50}\)= 0.14 0.12 + 0.14 = 0.26
    6.99—9.01 15 \(\frac{15}{50}\)= 0.30 0.26 + 0.30 = 0.56
    9.01—11.03 8 \(\frac{8}{50}\)= 0.16 0.56 + 0.16 = 0.72
    11.03—13.05 9 \(\frac{9}{50}\)= 0.18 0.72 + 0.18 = 0.90
    13.05—15.07 5 \(\frac{5}{50}\)= 0.10 0.90 + 0.10 = 1.00
    总计 = 50 总计 = 1.00
    桌子\(\PageIndex{9}\)

    从表\(\PageIndex{9}\)中找出小于 9.01 英寸的降雨百分比。

    示例\(\PageIndex{15}\)

    \(\PageIndex{8}\)中找出介于 61.95 和 65.95 英寸之间的高度百分比。

    回答

    解决方案 1.15

    将第二行和第三行的相对频率相加:\(0.03 + 0.15 = 0.18\)或 18%。

    练习\(\PageIndex{15}\)

    从表\(\PageIndex{9}\)中找出介于 6.99 到 13.05 英寸之间的降雨百分比。

    示例\(\PageIndex{16}\)

    使用表格中 100 名男半职业足球运动员的身高\(\PageIndex{8}\)。 填写空白并检查答案。

    1. 从 67.95 英寸到 71.95 英寸的高度百分比为:____。
    2. 从 67.95 英寸到 73.95 英寸的高度百分比为:____。
    3. 身高超过 65.95 英寸的百分比为:____。
    4. 样本中身高介于 61.95 到 71.95 英寸之间的玩家数量为:____。
    5. 高度是什么样的数据?
    6. 描述如何收集这些数据(身高),以使这些数据成为所有男性半职业足球运动员的特征。

    记住,你计算频率。 要找到相对频率,请将频率除以数据值的总数。 要找到累积相对频率,请将所有先前的相对频率与当前行的相对频率相加。

    回答

    解决方案 1.16

    1. 29%
    2. 36%
    3. 77%
    4. 87
    5. 定量连续
    6. 从每支队伍中获取名册,然后从每支队伍中选择一个简单的随机样本

    示例\(\PageIndex{17}\)

    十九个人被问及他们每天通勤多少英里到最近的英里上班。 数据如下:2;5;7;3;2;10;18;15;20;7;10;18;5;12;13;12;4;5;10。 表格\(\PageIndex{10}\)已制作:

    \ (\ pageIndex {10}\) 通勤距离的频率 “>
    数据 频率 相对频率 累积相对频率
    3 3 \(\frac{3}{19}\) 0.1579
    4 1 \(\frac{1}{19}\) 0.2105
    5 3 \(\frac{3}{19}\) 0.1579
    7 2 \(\frac{2}{19}\) 0.2632
    10 3 \(\frac{4}{19}\) 0.4737
    12 2 \(\frac{2}{19}\) 0.7895
    13 1 \(\frac{1}{19}\) 0.8421
    15 1 \(\frac{1}{19}\) 0.8948
    18 1 \(\frac{1}{19}\) 0.9474
    20 1 \(\frac{1}{19}\) 1.0000
    表通勤距离\(\PageIndex{10}\)频率
    1. 这张表对吗? 如果不正确,那有什么问题?
    2. 对还是错:百分之三的受访者通勤三英里。 如果这个说法不正确,那应该是什么? 如果表格不正确,请进行更正。
    3. 在接受调查的人中,有多少人通勤五到七英里?
    4. 在接受调查的人中,有多少人通勤12英里或更长时间? 少于 12 英里? 介于 5 到 13 英里之间(不包括 5 到 13 英里)?
    回答

    解决方案 1.17

    1. 不是。 频率列的总和为 18,而不是 19。 并非所有累积相对频率都是正确的。
    2. 假的。 三英里的频率应为一;两英里(左)的频率应为二。 累积相对频率列应为:0.1052、0.1579、0.2105、0.3684、0.4737、0.6316、0.7368、0.7895、0.8421、0.9474、1.0000。
    3. \(\frac{5}{19}\)
    4. \(\frac{7}{19}, \frac{12}{19}, \frac{7}{19)\)

    练习\(\PageIndex{17}\)

    该表\(\PageIndex{9}\)显示了城镇样本中年降雨量(以英寸为单位)。 接受调查的城镇中有多少比例每年的降雨量在11.03到13.05英寸之间?

    示例\(\PageIndex{18}\)

    该表\(\PageIndex{11}\)包含了2000年至2012年期间全球因地震而死亡的总人数。

    \ (\ pageIndex {11}\) “>
    死亡总人数
    2000 231
    2001 21,357
    2002 11,685
    2003 33,819
    2004 228,802
    2005 88,003
    2006 6,605
    2007 712
    2008 88,011
    2009 1,790
    2010 320,120
    2011 21,953
    2012 768
    总计 823,856

    1.11

    回答以下问题。

    1. 从 2006 年到 2009 年测得的死亡频率是多少?
    2. 2009 年以后的死亡百分比是多少?
    3. 2003 年或更早发生的相对死亡频率是多少?
    4. 2004 年发生的死亡百分比是多少?
    5. 死亡人数是什么样的数据?
    6. 里氏量表用于量化地震产生的能量。 里氏刻度数的示例有 2.3、4.0、6.1 和 7.0。 这些数字是什么样的数据?
    回答

    解决方案 1.18

    1. 97,118 (11.8%)
    2. 41.6%
    3. 67,092/823356 或 0.081 或 8.1%
    4. 27.8%
    5. 定量离散
    6. 定量连续

    练习\(\PageIndex{18}\)

    该表\(\PageIndex{12}\)包含了1994年至2011年期间美国发生的致命机动车交通事故总数。

    \ (\ pageIndex {12}\) “>
    崩溃总次数 崩溃总次数
    1994 36,254 2004 38,444
    1995 37,241 2005 39,252
    1996 37,494 2006 38,648
    1997 37,324 2007 37,435
    1998 37,107 2008 34,172
    1999 37,140 2009 30,862
    2000 37,526 2010 30,296
    2001 37,862 2011 29,757
    2002 38,491 总计 653,782
    2003 38,477

    1.12

    回答以下问题。

    1. 从 2000 年到 2004 年测得的死亡频率是多少?
    2. 2006 年以后的死亡百分比是多少?
    3. 2000 年或之前发生的相对死亡频率是多少?
    4. 2011 年发生的死亡百分比是多少?
    5. 2006 年的累积相对频率是多少? 解释一下这个数字告诉你关于数据的内容。