3.1:掌握基础知识——基本的数学和统计术语和概念是什么?
- Page ID
- 173330
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)
一般条款:
- 数据-系统记录的信息。
- 值 — 每次测量或观测值
- 变量 — 被控制、操作、测量或观测的物体。 主要有两种类型:
- 独立(解释性)— 你认为会影响正在测量/观测的内容的变量。
- 依赖项(响应)-正在测量的变量。
- 人口 — 待研究的整套物体。
- 参数 — 人口的数值特征。
- 样本 — 从群体中收集物体的子集合。
- 统计数据 — 来自总体的样本的数值特征。
示例
你是一位生物学家,正在研究帝蝴蝶(Danaus plexippus)种群如何受到栖息地破坏的影响。 您开展了一项长期研究,以监测历史上记录/观察过君主的退化、完好无损和恢复的栖息地中的种群。
- 人口:所有君主蝴蝶。
- 参数:无法收集相当数量的君主数据。 因此,无法计算任何参数。
- 样本:在研究的每一年中,在每个野外现场观察到的君主总数。
- 统计数据:来自现场数据的任何计算/操作。
- 描述性统计-用于汇总数据趋势的计算。 最低限度是测量所记录数据的中心(平均值)和点差(标准差)。
- 推理统计 — 推理统计的重点是从样本中提取数据,对总体进行推断。 这里的计算检验假设,并尝试找出/推断因果关系和/或相关性。
重要的是要注意,只有样本中的数据能代表总体,并且对数据的解释没有偏见,统计数据才有用!
数据类型:
- 定性(分类)数据 — 不是用数字表示的数据,而是通过自然语言描述表示的数据。 定性数据主要有两种类型:
- Ordinal — 当类别按特定顺序排列时(例如:大、中、小)
- 标称 — 当类别没有自然顺序时(例如:犬种、颜色)
使用的图表类型:饼图、条形图
- 定量(数字)数据-不是通过自然语言描述来表示的数据,而是用数字表示的数据。 定量数据主要有两种类型:
- 连续 — 可以观测到任何整数或分数的数字(例如:时间、高度或重量)
- 离散 — 可能有固定数量的结果,因此只能有整数(例如:计数)
使用的图表类型:直方图、折线图、散点图