1.3: 测量等级
- Page ID
- 204473
一旦获得了一组数据,就需要对其进行整理,以便分析每个基准在集中出现的频率。 但是,在计算频率时,您可能需要对答案进行四舍五入,以使其尽可能精确。
测量级别
测量一组数据的方式称为其测量级别。 正确的统计程序取决于研究人员对测量水平的熟悉。 并非所有统计操作都可用于每组数据。 数据可以分为四个测量级别。 它们是(从最低到最高):
- 标称刻度等级
- 序数比例等级
- 间隔刻度等级
- 比率等级
使用名义尺度测量的数据是定性的(分类数据)。 类别、颜色、名称、标签和最喜欢的食物以及 “是” 或 “否” 的回答都是名义水平数据的示例。 未对标称比例数据进行排序。 例如,试图根据人们最喜欢的食物对他们进行分类没有任何意义。 把披萨放在第一位,把寿司放在第二位是没有意义的。
智能手机公司是名义规模数据的另一个例子。 这些数据是制造智能手机的公司的名称,但是尽管人们可能有个人喜好,但这些品牌并未商定顺序。 标称比例数据不能用于计算。
使用序数尺度测量的数据与名义尺度数据类似,但有很大的区别。 可以对序数比例数据进行排序。 顺序比例数据的一个示例是美国排名前五的国家公园列表。 美国排名前五的国家公园可以从一到五排名,但我们无法衡量数据之间的差异。
使用序数比例的另一个例子是邮轮调查,其中对有关邮轮的问题的回答是 “极好”、“良好”、“满意” 和 “不满意”。 这些响应按从最需要的响应到最不想要的响应顺序排列。 但是两条数据之间的差异是无法衡量的。 与名义比例数据一样,序数尺度数据不能用于计算。
使用区间标度测量的数据与顺序级别数据类似,因为它具有明确的排序,但数据之间存在差异。 尽管数据没有起点,但可以测量区间尺度数据之间的差异。
摄氏度 (C) 和华氏度 (F) 等温度标度是使用间隔标度测量的。 在两个温度测量中,40° 等于 100° 减去 60°。 差异是有道理的。 但是 0 度不是,因为在这两个尺度中,0 都不是绝对最低温度。 存在像 -10° F 和 -15°C 这样的温度,并且比 0 低。
间隔水平数据可用于计算,但无法进行一种比较。80° C 的温度不是 20° C 的四倍(80° F 的热度也不是 20° F 的四倍)。 80与20(或四比一)的比率没有任何意义。
使用比率标度测量的数据可以解决比率问题,并为您提供最多的信息。 比率尺度数据与区间尺度数据类似,但其点数为 0,可以计算比率。 例如,四个多项选择统计学期末考试分数分别为 80、68、20 和 92(满分可能为 100 分)。 考试是机器分级的。
数据可以按从低到高的顺序排列:20、68、80、92。
数据之间的差异是有意义的。 分数 92 比分数 68 高出 24 分。 比率可以计算。 最小分数为 0。 所以 80 等于 20 的四倍。 80 的分数比 20 分好四倍。
频率
二十名学生被问及他们每天工作多少小时。 他们以小时为单位的回复如下:5;6;3;3;2;4;7;5;2;3;5;6;5;5;5;2;5;5。
表按升序\(\PageIndex{5}\)列出了不同的数据值及其频率。
\ (\ pageIndex {5}\) 学生工作时间频率表 “>数据值 | 频率 |
---|---|
2 | 3 |
3 | 5 |
4 | 3 |
5 | 6 |
6 | 2 |
7 | 1 |
频率是数据值出现的次数。 根据表\(\PageIndex{5}\),有三个学生工作两个小时,五个学生工作三个小时,依此类推。 频率列中值的总和 20 表示样本中包含的学生总数。
相对频率是数据值在所有结果集合中出现的次数与结果总数的比率(分数或比例)。 要找到相对频率,请将每个频率除以样本中的学生总数(在本例中为 20)。 相对频率可以写成分数、百分比或小数。
\ (\ pageIndex {6}\) 具有相对频率的学生工作时间频率表 “>数据值 | 频率 | 相对频率 |
---|---|---|
2 | 3 | \(\frac{3}{20}\)或 0.15 |
3 | 5 | \(\frac{5}{20}\)或 0.25 |
4 | 3 | \(\frac{3}{20}\)或 0.15 |
5 | 6 | \(\frac{6}{20}\)或 0.30 |
6 | 2 | \(\frac{2}{20}\)或 0.10 |
7 | 1 | \(\frac{1}{20}\)或 0.05 |
表中相对频率列中的值之和\(\PageIndex{6}\)为\(\frac{20}{20}\),或 1。
累积相对频率是先前相对频率的累积。 要找到累积的相对频率,请将所有先前的相对频率与当前行的相对频率相加,如表所示\(\PageIndex{7}\)。
\ (\ pageIndex {7}\) 具有相对和累积相对频率的学生工作时间频率表 “>数据值 | 频率 | 相对频率 | 累积相对频率 |
---|---|---|---|
2 | 3 | \(\frac{3}{20}\)或 0.15 | 0.15 |
3 | 5 | \(\frac{5}{20}\)或 0.25 | 0.15 + 0.25 = 0.40 |
4 | 3 | \(\frac{3}{20}\)或 0.15 | 0.40 + 0.15 = 0.55 |
5 | 6 | \(\frac{6}{20}\)或 0.30 | 0.55 + 0.30 = 0.85 |
6 | 2 | \(\frac{2}{20}\)或 0.10 | 0.85 + 0.10 = 0.95 |
7 | 1 | \(\frac{1}{20}\)或 0.05 | 0.95 + 0.05 = 1.00 |
累积相对频率列的最后一个条目是 1,表示百分之百的数据已经累积。
注意
由于四舍五入,相对频率列的总和可能并不总是为 1,累积相对频率列中的最后一个条目可能不是 1。 但是,它们各自应该接近一个。
该表\(\PageIndex{8}\)代表了 100 名男性半职业足球运动员样本的身高(以英寸为单位)。
\ (\ pageIndex {8}\) 足球运动员身高频率表 “>高度(英寸) | 频率 | 相对频率 | 累积相对频率 |
---|---|---|---|
59.95—61.95 | 5 | \(\frac{5}{10}\)= 0.05 | 0.05 |
61.95—63.95 | 3 | \(\frac{3}{100}\)= 0.03 | 0.05 + 0.03 = 0.08 |
63.95—65.95 | 15 | \(\frac{15}{100}\)= 0.15 | 0.08 + 0.15 = 0.23 |
65.95—67.95 | 40 | \(\frac{40}{100}\)= 0.40 | 0.23 + 0.40 = 0.63 |
67.95—69.95 | 17 | \(\frac{17}{100}\)= 0.17 | 0.63 + 0.17 = 0.80 |
69.95—71.95 | 12 | \(\frac{12}{100}\)= 0.12 | 0.80 + 0.12 = 0.92 |
71.95—73.95 | 7 | \(\frac{7}{100}\)= 0.07 | 0.92 + 0.07 = 0.99 |
73.95—75.95 | 1 | \(\frac{1}{100}\)= 0.01 | 0.99 + 0.01 = 1.00 |
总计 = 100 | 总计 = 1.00 |
此表中的数据已按以下间隔分组:
- 59.95 到 61.95 英寸
- 61.95 到 63.95 英寸
- 63.95 到 65.95 英寸
- 65.95 到 67.95 英寸
- 67.95 到 69.95 英寸
- 69.95 到 71.95 英寸
- 71.95 到 73.95 英寸
- 73.95 到 75.95 英寸
在这个样本中,有五名玩家的身高在 59.95—61.95 英寸的区间内,三名玩家的身高在 61.95—63.95 英寸的区间内,15 名玩家的身高在 63.95—65.95 英寸的间隔内,40 名玩家身高落在 65.95—67.95 英寸的间隔内,17 名玩家身高在 67.95—69.95 英寸区间内,12 名玩家身高在 69.95—71.95 间隔内,7 名玩家身高在 71.95—73.95 间隔内,还有一名身高在 73.95—75.95 区间内的玩家。 所有高度都落在区间的端点之间,而不是在端点处。
示例\(\PageIndex{14}\)
从表\(\PageIndex{8}\)中找出小于 65.95 英寸的高度的百分比。
练习\(\PageIndex{14}\)
该表\(\PageIndex{9}\)显示了城镇样本中年降雨量(以英寸为单位)。
\ (\ pageIndex {9}\) “>降雨量(英寸) | 频率 | 相对频率 | 累积相对频率 |
---|---|---|---|
2.95—4.97 | 6 | \(\frac{6}{50}\)= 0.12 | 0.12 |
4.97—6.99 | 7 | \(\frac{7}{50}\)= 0.14 | 0.12 + 0.14 = 0.26 |
6.99—9.01 | 15 | \(\frac{15}{50}\)= 0.30 | 0.26 + 0.30 = 0.56 |
9.01—11.03 | 8 | \(\frac{8}{50}\)= 0.16 | 0.56 + 0.16 = 0.72 |
11.03—13.05 | 9 | \(\frac{9}{50}\)= 0.18 | 0.72 + 0.18 = 0.90 |
13.05—15.07 | 5 | \(\frac{5}{50}\)= 0.10 | 0.90 + 0.10 = 1.00 |
总计 = 50 | 总计 = 1.00 |
从表\(\PageIndex{9}\)中找出小于 9.01 英寸的降雨百分比。
示例\(\PageIndex{15}\)
从表\(\PageIndex{8}\)中找出介于 61.95 和 65.95 英寸之间的高度百分比。
- 回答
-
解决方案 1.15
将第二行和第三行的相对频率相加:\(0.03 + 0.15 = 0.18\)或 18%。
练习\(\PageIndex{15}\)
从表\(\PageIndex{9}\)中找出介于 6.99 到 13.05 英寸之间的降雨百分比。
示例\(\PageIndex{16}\)
使用表格中 100 名男半职业足球运动员的身高\(\PageIndex{8}\)。 填写空白并检查答案。
- 从 67.95 英寸到 71.95 英寸的高度百分比为:____。
- 从 67.95 英寸到 73.95 英寸的高度百分比为:____。
- 身高超过 65.95 英寸的百分比为:____。
- 样本中身高介于 61.95 到 71.95 英寸之间的玩家数量为:____。
- 高度是什么样的数据?
- 描述如何收集这些数据(身高),以使这些数据成为所有男性半职业足球运动员的特征。
记住,你计算频率。 要找到相对频率,请将频率除以数据值的总数。 要找到累积相对频率,请将所有先前的相对频率与当前行的相对频率相加。
- 回答
-
解决方案 1.16
- 29%
- 36%
- 77%
- 87
- 定量连续
- 从每支队伍中获取名册,然后从每支队伍中选择一个简单的随机样本
示例\(\PageIndex{17}\)
十九个人被问及他们每天通勤多少英里到最近的英里上班。 数据如下:2;5;7;3;2;10;18;15;20;7;10;18;5;12;13;12;4;5;10。 表格\(\PageIndex{10}\)已制作:
\ (\ pageIndex {10}\) 通勤距离的频率 “>数据 | 频率 | 相对频率 | 累积相对频率 |
---|---|---|---|
3 | 3 | \(\frac{3}{19}\) | 0.1579 |
4 | 1 | \(\frac{1}{19}\) | 0.2105 |
5 | 3 | \(\frac{3}{19}\) | 0.1579 |
7 | 2 | \(\frac{2}{19}\) | 0.2632 |
10 | 3 | \(\frac{4}{19}\) | 0.4737 |
12 | 2 | \(\frac{2}{19}\) | 0.7895 |
13 | 1 | \(\frac{1}{19}\) | 0.8421 |
15 | 1 | \(\frac{1}{19}\) | 0.8948 |
18 | 1 | \(\frac{1}{19}\) | 0.9474 |
20 | 1 | \(\frac{1}{19}\) | 1.0000 |
- 这张表对吗? 如果不正确,那有什么问题?
- 对还是错:百分之三的受访者通勤三英里。 如果这个说法不正确,那应该是什么? 如果表格不正确,请进行更正。
- 在接受调查的人中,有多少人通勤五到七英里?
- 在接受调查的人中,有多少人通勤12英里或更长时间? 少于 12 英里? 介于 5 到 13 英里之间(不包括 5 到 13 英里)?
- 回答
-
解决方案 1.17
- 不是。 频率列的总和为 18,而不是 19。 并非所有累积相对频率都是正确的。
- 假的。 三英里的频率应为一;两英里(左)的频率应为二。 累积相对频率列应为:0.1052、0.1579、0.2105、0.3684、0.4737、0.6316、0.7368、0.7895、0.8421、0.9474、1.0000。
- \(\frac{5}{19}\)
- \(\frac{7}{19}, \frac{12}{19}, \frac{7}{19)\)
练习\(\PageIndex{17}\)
该表\(\PageIndex{9}\)显示了城镇样本中年降雨量(以英寸为单位)。 接受调查的城镇中有多少比例每年的降雨量在11.03到13.05英寸之间?
示例\(\PageIndex{18}\)
该表\(\PageIndex{11}\)包含了2000年至2012年期间全球因地震而死亡的总人数。
\ (\ pageIndex {11}\) “>年 | 死亡总人数 |
---|---|
2000 | 231 |
2001 | 21,357 |
2002 | 11,685 |
2003 | 33,819 |
2004 | 228,802 |
2005 | 88,003 |
2006 | 6,605 |
2007 | 712 |
2008 | 88,011 |
2009 | 1,790 |
2010 | 320,120 |
2011 | 21,953 |
2012 | 768 |
总计 | 823,856 |
回答以下问题。
- 从 2006 年到 2009 年测得的死亡频率是多少?
- 2009 年以后的死亡百分比是多少?
- 2003 年或更早发生的相对死亡频率是多少?
- 2004 年发生的死亡百分比是多少?
- 死亡人数是什么样的数据?
- 里氏量表用于量化地震产生的能量。 里氏刻度数的示例有 2.3、4.0、6.1 和 7.0。 这些数字是什么样的数据?
- 回答
-
解决方案 1.18
- 97,118 (11.8%)
- 41.6%
- 67,092/823356 或 0.081 或 8.1%
- 27.8%
- 定量离散
- 定量连续
练习\(\PageIndex{18}\)
该表\(\PageIndex{12}\)包含了1994年至2011年期间美国发生的致命机动车交通事故总数。
\ (\ pageIndex {12}\) “>年 | 崩溃总次数 | 年 | 崩溃总次数 |
---|---|---|---|
1994 | 36,254 | 2004 | 38,444 |
1995 | 37,241 | 2005 | 39,252 |
1996 | 37,494 | 2006 | 38,648 |
1997 | 37,324 | 2007 | 37,435 |
1998 | 37,107 | 2008 | 34,172 |
1999 | 37,140 | 2009 | 30,862 |
2000 | 37,526 | 2010 | 30,296 |
2001 | 37,862 | 2011 | 29,757 |
2002 | 38,491 | 总计 | 653,782 |
2003 | 38,477 |
回答以下问题。
- 从 2000 年到 2004 年测得的死亡频率是多少?
- 2006 年以后的死亡百分比是多少?
- 2000 年或之前发生的相对死亡频率是多少?
- 2011 年发生的死亡百分比是多少?
- 2006 年的累积相对频率是多少? 解释一下这个数字告诉你关于数据的内容。