13.0:线性回归和关联简介
专业人士通常想知道两个或多个数值变量之间的关系。 例如,学生参加的第二次数学考试的成绩与期末考试的成绩之间是否有关系? 如果有关系,这种关系是什么,它有多牢固?
再举一个例子,你的收入可能取决于你的教育程度、职业、经验年限和能力,或者你的性别或肤色。 您向维修人员支付的人工费金额通常由初始金额加上每小时的费用决定。
这些例子可能与模型相关联,也可能不与模型相关联,这意味着某种理论表明存在关系。 因果关系之间的这种联系,通常被称为模型,是科学方法的基础,也是我们如何确定我们对世界如何运作的看法的核心。 从理论开始,开发理论关系模型应该会产生预测,我们之前称之为假设。 现在,该假设涉及一整套关系。 举个例子,在经济学中,消费者选择模型基于有关人类行为的假设:希望最大限度地利用所谓的实用性,了解一种产品相对于另一种产品的好处,喜欢和不喜欢,通常称为偏好,等等。 这些因素结合起来为我们提供了需求曲线。 由此我们可以预测,随着价格的上涨,需求量将下降。 经济学有关于商品收取的价格与公司经营的市场结构(例如垄断与竞争)之间关系的模型。 关于谁最有可能被选中担任在职培训职位的模型、美联储政策变化和经济增长的影响等等。
模型并不是经济学所独有的,即使在社会科学领域也是如此。 例如,在政治学中,有一些模型可以根据对官僚目标的假设预测官僚在各种环境变化中的行为。 国际关系和国内政治都有涉及战略决策的政治行为模式。
当然,所谓的硬科学是科学方法的来源,因为他们几个世纪以来一直在努力解释我们周围令人困惑的世界。 如今,一些早期的模型让我们发笑;例如生命的自发产生。 如今,人们认为这些早期的模型只不过是我们开发的基本神话,这些神话旨在帮助我们为看似混乱的局面带来某种秩序感。
所有模型建设的基础可能是一种傲慢的说法,即我们知道是什么原因导致了我们所看到的结果。 这体现在函数形式的简单数学陈述中y = f(x)。 反应是由刺激引起的X。Y 每个模型最终都会来到这个最后的位置,理论将在这里生存或消亡。 数据会支持这个假设吗? 如果是这样,那么我们会相信这个版本的世界,直到有更好的理论取代它。 这是我们从平坦的地球移动到环形地球,从以地球为中心的太阳系移动到以太阳为中心的太阳系,等等的过程。
科学方法并不能永远证实一个理论:它不能证明 “真相”。 所有理论都有待审查,可能会被推翻。 这些是我们在本书前面首次提出假设检验概念时吸取的经验教训。 在这里,在我们开始本节时,这些概念值得回顾,因为我们将在此处开发的工具是科学方法的基石,赌注更高。 由于这种统计工具,完整的理论将上升或下降;回归和更高级的版本称为计量经济学。
在本章中,我们将从相关性开始,即研究可能基于也可能不基于因果模型的变量之间的关系。 变量只是在相同或相反的方向上移动。 也就是说,它们不是随机移动的。 相关性可以衡量这种情况在多大程度上是正确的。 从那以后,我们开发了一种衡量因果关系的工具:回归分析。 我们将能够制定模型和测试,以确定它们在统计学上是否合理。 如果发现它们是这样,那么我们可以用它们来进行预测:如果出于政策考虑,我们改变了这个变量的值,另一个变量会怎样? 如果我们征收每加仑50美分的汽油税,这将如何影响碳排放、悍马/混合动力车的销售、公共交通的使用等? 为这类问题提供答案的能力是回归的价值,它既是帮助我们了解世界的工具,也是做出深思熟虑的政策决策的工具。