Skip to main content
Global

6.3:如何衡量公众意见?

  • Page ID
    204488
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    学习目标

    在本节结束时,您将能够:

    • 解释如何收集有关公众舆论的信息
    • 确定衡量和量化公众意见的常用方法
    • 分析民意调查以确定它们是否准确衡量了民众的观点

    多年来,民意调查发生了变化。 第一次民意调查是在1824年进行的;它询问选民在离开投票站时如何投票。 非正式民意调查被称为稻草民意调查,它们非正式地收集非随机人群或群体的意见。 报纸和社交媒体延续了非官方民意调查的传统,主要是因为感兴趣的读者想知道选举将如何结束。 Facebook和在线报纸经常提供非正式的弹出式测验,问一个关于政治或事件的问题。 民意调查本来不是正式的,但它可以大致了解读者的想法。

    现代民意调查相对较新,只有八十年的历史。 这些民意调查比普通民意调查要复杂得多,并且经过精心设计,旨在探讨我们的想法、想要和价值。 他们收集的信息可能会转发给政治家或报纸,并由统计学家和社会科学家进行分析。 随着媒体和政治家越来越关注民意调查,每周都有越来越多的人参与民意调查。

    进行投票

    大多数民意调查都以准确为目标,但这不是一件容易的事。 政治民意调查是一门科学。 从设计到实施,民意调查都很复杂,需要仔细的规划和谨慎。 米特·罗姆尼的竞选民意调查只是民意调查方法引发问题的最新例子。 我们的历史上充斥着民意调查公司由于调查设计不当或投票方法不当而得出错误预测公众舆论的结果的例子。

    1936年,《文学文摘》延续了其对公民进行投票以确定谁将赢得总统大选的传统。 该杂志向有订阅、电话或汽车登记的人发送了意见卡。 只有部分收件人寄回了卡片。 结果? 预计阿尔夫·兰登将赢得55.4%的民众选票;最终,他只获得了38%的选票。 31 富兰克林·罗斯福又赢了一个任期,但故事表明,在进行民意调查时需要保持科学精神。

    几年后,托马斯·杜威在1948年总统大选中输给了哈里·杜鲁门,尽管民意调查显示杜威遥遥领先,杜鲁门注定要输掉(图6.8)。 最近,Zogby Analytics的约翰·佐格比公开预测约翰·克里将在2004年赢得现任总统乔治 ·W· 布什的总统职位,但在选举之夜却被证明是错误的。 这些只是几个案例,但每个案例都提供了不同的教训。 1948年,民意调查员直到选举当天才进行民意调查,他们所依赖的数字不包括选民意见的较晚变化。 佐格比的民意调查并不代表可能的选民,并且错误地预测了谁会投票以及为谁投票。 这些例子强调了在进行民意调查时使用科学方法的必要性,在报告结果时要谨慎行事。

    图为哈里·杜鲁门展示了一份标题为 “杜威打败杜鲁门” 的报纸。
    6.8 轮询过程错误可能导致错误的预测。 11月3日,也就是1948年总统大选后的第二天,欢腾的哈里·杜鲁门胜利地展示了《芝加哥每日论坛报》宣布托马斯·杜威获胜的不准确标题(来源:David E rickson/Flickr)。

    大多数民意调查公司雇用接受过民意调查和数据分析培训的统计人员和方法学家。 要科学地完成民意测验,就必须满足许多标准。 首先,方法学家确定他们想要采访的理想受访者群体或群体。 例如,如果目标是预测谁将赢得总统职位,则应采访来自美国各地的公民。 如果我们想了解科罗拉多州的选民将如何对提案进行投票,那么受访者群体只能是科罗拉多州的居民。 在调查选举或政策问题时,许多投票机构只会采访在前几次选举中有投票历史的受访者,因为这些选民更有可能在选举日参加投票。 与普通公民相比,政治家更有可能受到久经考验的选民意见的影响。 一旦确定了所需人群,研究人员将开始建立既随机又具有代表性的样本。

    随机样本由总人口中有限数量的人组成,其选择方式是每个人都有相等的被选机会。 在投票的最初几年,潜在受访者的电话号码是从各个地区任意选择的,以避免地区偏见。 虽然座机电话允许民意调查试图确保随机性,但手机的使用越来越多,使这一过程变得困难。 手机及其号码是便携式的,可以随所有者一起移动。 为了防止错误,包含已知手机号码的民意调查可能会筛选邮政编码和其他地理标志,以防止地区偏见。 代表性样本由人口分布与总人口分布相似的群体组成。 例如,将近 51% 的美国人口是女性。 32 为了与女性人口分布相匹配,任何旨在衡量大多数美国人对某个问题的看法的民意调查都应调查女性略多于男性的样本。

    民意调查员试图采访一定数量的公民,以创建合理的人口样本。 该样本量将根据受访人口的规模和民意调查员希望达到的准确程度而有所不同。 如果民意调查试图揭示一个州或团体的看法,例如威斯康星州选民对教育体系变化的看法,则样本量可能在五百到一千名受访者之间,得出的结果误差相对较小。 要通过民意调查来预测美国人在全国范围内的看法,例如对白宫的气候变化政策的看法,样本量应该更大。

    由于数据处理方式的不同,每个组织和机构的样本量各不相同。 盖洛普通常只采访五百名受访者,而《拉斯穆森报告》和《皮尤研究中心》经常采访一千至一千五百名受访者。 33 学术组织,如美国全国选举研究,对超过二千五百名受访者进行了采访。 34 样本越大,民意调查越准确,因为它的异常回应相对较少,更能代表实际人群。 但是,民意调查员采访的受访者不会超过必要的数量。 增加受访者数量将提高民意调查的准确性,但是一旦民意调查有足够的受访者具有代表性,准确性的提高就会变得微不足道,而且不具成本效益。 35

    当样本代表实际人口时,民意调查的准确性将反映在较低的误差幅度上。 误差幅度是一个数字,表明民意调查结果可能与公民总人口的实际看法相去甚远。 误差幅度越低,民意调查的预测性就越强。 大范围的误差是有问题的。 例如,如果一项民意调查声称伊丽莎白·沃伦可能在2020年马萨诸塞州民主党初选中赢得30%的选票,其误差幅度为+/-6,则它告诉我们,沃伦可能获得的选票只有24%(30-6)或高达36%(30 + 6)。 降低误差幅度显然是可取的,因为它可以让我们最准确地了解人们的实际想法或将要做的事情。

    由于有许多民意调查,你怎么知道民意调查是否是一个好的民意调查,并准确地预测一个群体的信念? 首先,寻找数字。 民意调查公司包括误差幅度、投票日期、受访者人数和抽样人群,以显示其科学可靠性。 民意调查是最近进行的吗? 这个问题是否明确且不偏不倚? 受访者的数量是否足以预测人口? 误差幅度小吗? 在解释民意调查结果时,值得寻找这些有价值的信息。 虽然大多数民意调查机构都在努力创建高质量的民意调查,但其他组织希望快速获得结果,并且可能优先考虑即时数字,而不是随机和代表性样本。 例如,新闻网络经常使用即时投票来快速评估候选人在辩论中的表现。

    内幕视角

    民意调查的来龙去脉

    有没有想过民意调查背后会发生什么? 为了找出答案,我们向皮尤研究中心调查研究主任斯科特·基特提出了几个问题。

    问:对民意调查最常见的误解有哪些?

    答:其中有几个经常复发。 首先,调查样本中的一千或一千五百人不可能充分代表2.5亿成年人口。 但是当然有可能。 随机抽样使之成为可能,这在过去几十年中广为人知。 如果你不信任随机少量样本,那么下次你需要诊断测试时,请你的医生抽出你的所有血液。

    第二个误解是,如果我们愿意充分操纵措辞,就有可能从民意调查中得到我们想要的任何结果。 尽管问题的措辞确实会影响回答,但民意调查无法得出原本打算得到的任何结果。 人们并不傻。 他们可以判断一个问题是否有很大的偏见,他们对此反应不佳。 也许更重要的是,公众可以阅读问题,知道问题中是否充斥着旨在将受访者推向特定方向的单词和短语。 这就是为什么在任何民意调查中始终注意问题的措辞和顺序很重要的原因。

    问:您的组织如何选择投票主题?

    答:我们通过多种方式选择主题。 最重要的是,我们紧跟政治和公共政策的发展,并努力使我们的民意调查反映相关问题。 我们的大部分研究是由新闻周期和我们在不久的将来看到的话题推动的。 我们还定期开展许多项目,以了解公众舆论的长期趋势。 例如,自1987年以来,我们一直在问一系列关于政治价值观的问题,这有助于记录公众中政治两极分化的兴起。 另一个是对美国人的宗教信仰、行为和隶属关系的大型(三万五千次访谈)研究。 我们在 2007 年发布了其中的第一个,2015 年发布了第二个。 最后,我们努力抓住机会,在重大问题出现时做出更大贡献。 2006年,当美国即将就移民改革展开激烈辩论时,我们对美国人对移民和移民的态度进行了一次重大调查。 2007 年,我们对美国穆斯林进行了有史以来第一次具有全国代表性的调查。

    问:你一周内监督的平均民意调查次数是多少?

    答:这在很大程度上取决于新闻周期和我们研究小组的需求。 我们几乎总是在进行调查,但有时会同时进行两三项调查。 在其他时候,我们更专注于分析已经收集的数据或为未来的调查做规划。

    问:你有没有在现场进行过民意调查,结果真的让你感到惊讶?

    答:很少有人感到惊讶,因为这些年来,我们已经学到了很多关于人们如何回答问题的知识。 但是,以下是过去我们中的一些人发现的一些发现:

    1. 2012年,我们对那些说自己的宗教 “没什么特别的” 的人进行了一项调查。 我们问他们是否在 “寻找适合他们的宗教”,因为他们期望许多没有隶属关系但没有说自己是无神论者或不可知论者的人可能会努力寻找一种适合他们的宗教。 只有10%的人说他们在寻找正确的宗教。
    2. 我们和其他许多人感到惊讶的是,在9/11恐怖袭击之后,公众对穆斯林的看法变得更加乐观。 布什总统强烈呼吁人们不要将这次袭击归咎于一般的穆斯林,这可能对舆论产生了影响。
    3. 同样令人惊讶的是,在广为人知的大规模枪击事件之后,公众对枪支管制(无论是赞成还是反对)的基本态度几乎没有改变。

    你对斯科特·基特在回答面试官的最后一个问题时报告的结果感到惊讶吗? 为什么或者为什么不呢? 在线进行一些研究,以了解哪些学位计划或工作经历可以帮助学生在投票组织中找到工作。

    技术和投票

    随机走在街道和电话簿冷打电话采访随机市民的日子已经一去不复返了。 科学民意调查使采访变得更加深思熟虑。 从历史上看,许多民意调查都是亲自进行的,但这很昂贵并且得出了有问题的结果。

    在某些情况下和国家,仍然存在面对面访谈。 出口民意调查、焦点小组和一些民意调查是在面试官和受访者亲自沟通的情况下进行的(图 6.9)。 出口民意调查是当面进行的,面试官站在投票站附近,在选民离开投票站时要求提供信息。 焦点小组通常从当地购物场所随机选择受访者,或者从互联网或电话调查中预先选择受访者。 受访者出现观察或讨论话题,然后接受调查。

    四个人站在桌子前的照片。
    6.9 2012 年 11 月 6 日,Connect2Mason.com 团队在乔治梅森大学校园的民意调查中进行了退出调查。 (来源:Mason Votes/Flickr)。

    但是,当像盖洛普或罗珀这样的组织决定进行面对面的民意调查时,这是一个耗时且昂贵的过程。 该组织必须随机选择社区内的家庭或投票地点,确保每个社区都有代表性家庭或地点。 36 然后,它必须调查一个城市内代表性数量的社区。 在投票地点,面试官可能会知道如何随机选择不同人口统计的选民。 如果面试官想在家里面试一个人,如果他们没有回答,则会多次尝试联系被调查者。 盖洛普在某个地区只有不到80%的家庭拥有电话的地区进行面对面访谈,因为它提供的样本更具代表性。 37 新闻网络使用面对面技巧在选举日进行出口民意调查。

    现在,大多数投票都是通过电话或互联网进行的。 一些公司,例如Harris Interactive,维护的目录包括注册选民、消费者或之前接受过采访的受访者。 如果民意调查员需要采访特定人群,例如政党成员或特定养老基金的退休人员,公司可以购买或访问该群体的电话号码清单。 其他组织,例如盖洛普,使用随机数字拨号(RDD),即计算机随机生成带有所需区号的电话号码。 使用RDD允许民意调查员包括可能有未公开号码和手机号码的受访者。 38 民意调查初期可能会提出有关邮政编码或人口统计的问题,以便民意调查员确定哪些面试继续进行,哪些面试提前结束。

    面试过程也部分计算机化。 现在,许多民意调查都是通过计算机辅助电话采访(CATI)或机器人民意调查进行的。 CATI 系统会随机拨打电话号码,直到电话号码到达现场人员手中,然后将潜在受访者与训练有素的面试官联系起来。 当受访者提供答案时,面试官将答案直接输入到计算机程序中。 如果面试官输入了错误的答案,这些民意调查可能会有一些错误。 如果面试官退出剧本或回答受访者的问题,民意调查也可能存在可靠性问题。

    Robo-polls 完全是计算机化的。 计算机拨打随机或预先编程的数字,预先录制的电子语音管理调查。 受访者听取问题和可能的答案,然后按电话上的数字输入答案。 支持者认为,如果没有面试官,受访者会更诚实。 但是,如果受访者没有使用正确的键盘号码来回答问题或误解了问题,这些民意调查可能会出错。 Robo-polls的回复率也可能较低,因为没有活人可以说服受访者回答。 也没有办法阻止孩子回答调查。 最后,《电话消费者保护法》(1991)将自动拨打手机定为非法,这使得大量潜在受访者无法进入机器人民意调查。 39

    电话投票的最新挑战来自电话使用的变化。 越来越多的公民,尤其是年轻公民,只使用手机,他们的电话号码不再基于地理区域。 千禧一代(1981年至1996年之间出生的人)和Z世代(1997年至2012年之间出生的人)发短信的可能性也比接听未知电话的可能性更大,因此采访这个人群比较困难。 现在,民意调查公司必须使用电子邮件和社交媒体与潜在的受访者接触,以确保他们拥有具有代表性的受访者群体。

    然而,转向互联网和手持设备所需的技术带来了更多问题。 网络调查必须设计为在不同数量的浏览器和手持设备上运行。 在线民意调查无法检测拥有多个电子邮件帐户或社交媒体资料的人是否多次回答同一个民意调查,也无法判断受访者何时在民意调查或民意调查中使用的社交媒体个人资料上虚假陈述了受访者的人口统计数据。 这些因素还使得计算回复率或获得代表性样本变得更加困难。 然而,许多公司都在努力应对这些困难,因为为了提供准确的数据,有必要接触年轻的人群。 40

    轮询中出现问题

    出于多种原因,民意调查可能无法产生准确的结果。 民意调查公司面临的两个重要因素是时机和人性。 除非你在选举期间进行退出民意调查,并且面试官在选举日站在投票站询问选民如何投票,否则投票结果总是有可能出错。 最简单的原因是,如果在投票和选举日之间有一段时间,公民可能会改变主意、撒谎或选择根本不投票。 在选举期间,时机非常重要,因为意外事件可能会转移足够的观点,从而改变选举结果。 当然,还有许多其他原因导致民意调查,即使是那些没有受选举或事件限制的民意调查,也可能不准确。

    链接到学习

    Rasmussen Reports创建于2003年,旨在就所有话题对美国公众进行调查,是民意调查行业的新条目。 拉斯穆森还为每次全国大选进行出口民意调查。

    民意调查以精心撰写的问题清单开始。 这些问题必须不受框架限制,这意味着它们的措辞不应引导受访者找到特定的答案。 例如,举两个关于总统批准的问题。 问题1可能会问:“鉴于失业率居高不下,你赞成奥巴马总统正在做的工作吗?” 问题 2 可能会问:“你赞成奥巴马总统正在做的工作吗?” 这两个问题都想知道受访者如何看待总统的成功,但第一个问题为受访者建立了一个框架,让他们在回答之前相信经济表现不佳。 这可能会使受访者的回答更加消极。 同样,我们提及问题或概念的方式可能会影响听众对其的看法。 “遗产税” 一词并没有召集选民抗议遗产税,但是 “死亡税” 一词引发了关于对遗产征税是否会对所得征双重税的争论。 41

    许多民意调查公司尽量避免引导性问题,这会导致受访者选择预先确定的答案,因为他们想知道人们的真实想法。 但是,一些民意调查有不同的目标。 他们的问题是为了保证具体结果而写的,也许是为了帮助候选人获得新闻报道或获得动力。 这些被称为推送民意调查。 在2016年总统初选中,MoveOn试图鼓励参议员伊丽莎白·沃伦(D-MA)参加民主党提名竞选(图6.10)。 它的民意调查在所谓的 “知情投票” 中使用了前导问题,为了表明沃伦会比希拉里·克林顿做得更好,它在询问受访者会投票给克林顿还是沃伦之前包括了十份关于沃伦的正面陈述。 42 民意调查结果因虚假而受到媒体的抨击。

    照片 A 显示了约瑟夫·肯尼迪、伊丽莎白·沃伦和巴尼·弗兰克。 图 B 显示希拉里·克林顿在讲台上。
    6.10 参议员伊丽莎白·沃伦(a)在2012年波士顿骄傲游行中与马萨诸塞州众议员约瑟夫·肯尼迪三世(左)和巴尼·弗兰克(右)合影。 参议员希拉里·克林顿(b)在 2008 年在新罕布什尔州康科德竞选总统期间(来源 a:“ElizabethForma” /Flickr 对作品的修改;来源 b:马克·诺泽尔对作品的修改)

    有时缺乏知识会影响民意调查的结果。 受访者可能对民意调查主题知之甚少,但不愿说 “我不知道”。 因此,调查可能包含一个包含问题的测验,这些问题确定受访者对情况的了解是否足以准确回答调查问题。 一项旨在了解公民是否支持修改《平价医疗法案》或《医疗补助》的民意调查可能会首先询问这些计划的服务对象以及它们是如何获得资金的。 关于伊斯兰国(或ISIS)夺取领土或俄罗斯援助乌克兰叛乱分子的民意调查可能包括一系列问题,以确定受访者是否阅读或听到任何国际新闻。 无法正确回答的受访者可能会被排除在民意调查之外,或者他们的答案可能与其他答案分开。

    人们还可能感受到社交压力,要求他们按照所在地区或同龄人的规范回答问题。 43 如果他们不好意思承认自己将如何投票,他们可能会对面试官撒谎。 在1982年的加利福尼亚州州长竞选中,汤姆·布拉德利在民意调查中遥遥领先,但在选举日他输了。 这个结果被昵称为 “布拉德利效应”,其理论是回答民意调查的选民害怕承认他们不会投票给黑人,因为这在政治上显得不正确和种族主义。 在2016年总统大选中,由于一些受访者不想承认他们投票支持特朗普,民意调查中对共和党候选人唐纳德·特朗普的支持水平可能人为地降低。

    2010年,本应在加利福尼亚州对大麻合法化并征税的第19号提案遇到了布拉德利效应的新版本。 政治博主内特·西尔弗(Nate Silver)注意到,关于大麻提案的民意调查前后矛盾,有时显示该提案将通过,而其他时候则显示它将失败。 西尔弗比较了民意调查及其管理方式,因为一些民意调查公司使用了面试官,有些则使用了机器人通话。 然后,他提议,与现场面试官交谈的选民给出社会上可以接受的答案,即他们将投票反对第19号提案,而接受计算机采访的选民则可以随意说实话(图6.11)。 44 尽管这一理论尚未得到证实,但它与其他发现一致,即面试官的人口统计数据会影响受访者的答案。 例如,非裔美国人对白人面试官的回应可能与对非裔美国人面试官的回应不同。 45

    图表显示了按民意调查类型划分的大麻合法化的支持情况。 使用实时运营商民意调查时,路透社/LPSO的反对意见约为—2,PPIC的反对约为—1,实地民意调查约为—4。 机器人民意调查的结果显示,美国调查(4月)的支持度约为14,美国调查(7月)的支持度约为10,购买力平价的支持度约为16。 图表底部引用了一个消息来源:“Silver,Nate。 “布罗德斯效应? 社会需求偏见和加州第19号提案。” FiveThirtyEight 政治 2010 年 7 月 27 日”。
    6.11 2010 年,有关加利福尼亚州第 19 号提案的民意调查不一致,这取决于其管理方式,与现场面试官交谈的选民宣布将投票反对第 19 号提案,而通过计算机接受采访的选民则宣布支持该立法。 该措施在选举日被否决。

    推送民意调查

    民意调查的新副产品之一是创建推送民意调查,其中包括以民意调查形式提供的政治竞选信息。 受访者接到电话,询问有关其职位或候选人选择的一系列问题。 如果受访者的答案是错误的候选人,则接下来的问题将提供有关候选人的负面信息,以期改变选民的想法。

    2014年,德克萨斯州一个城镇的选票上颁布了水力压裂禁令。 水力压裂法,包括向钻井注入加压水,可帮助能源公司从地球上收集额外的天然气。 这是有争议的,反对者认为它会导致水污染、声音污染和地震。 在竞选期间,许多当地选民接到电话,就他们计划如何对拟议的水力压裂禁令进行投票进行了民意调查。 46 如果受访者不确定或计划对该禁令投赞成票,问题就会转向提供有关提议禁令的组织的负面信息。 有一个问题问道:“如果你知道以下情况,它会改变你的投票吗。。德克萨斯州负责监督石油和天然气的国家机构两名铁路专员对俄罗斯参与美国的反水力压裂工作表示担忧?” 这个问题是出于选民对俄罗斯和国际动荡的担忧,目的是说服他们投票反对水力压裂禁令。

    这些技巧不仅限于发放选票;候选人使用它们来攻击对手。 希望选民会认为民意调查是合法的,并相信 “中立” 消息来源提供的负面信息。