10.3：衡量公众意见

Last updated
Save as PDF

Page ID: 171771

Dino Bozonelos, Julia Wendt, Charlotte Lee, Jessica Scarffe, Masahiro Omae, Josh Franco, Byran Martin, & Stefan Veldhuis
Victor Valley College, Berkeley City College, Allan Hancock College, San Diego City College, Cuyamaca College, Houston Community College, and Long Beach City College via ASCCC Open Educational Resources Initiative (OERI)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

学习目标

在本节结束时，您将能够：

记住如何衡量公众意见
了解个人舆论衡量标准如何影响公众意见的总体衡量标准
将衡量原则应用于民意调查

民意调查

研究人员和顾问在尝试评估公众意见时使用各种技术，但最常用的工具是民意调查。 民意调查是从更广泛的公民群体中随机抽取的受试者，这些受试者的答案被用来对更大的机构进行推断。换句话说，通过采访人口中较小的子样本，我们可以合理地猜测更多人群的信念。

想象一下做一大锅意大利面酱。但是你想先测试一下酱汁，然后再给别人吃。因此，通过品尝样品，您可以合理地猜出整批酱汁的味道。为了做到这一点，你用来测试酱汁的小汤匙必须含有与大锅酱汁相同比例的所有食材和调味料。民意调查也是如此（NBC News Learn 2020）。如果我们想评估公众对一系列问题的看法，那么我们的样本必须包括该更大机构中人口统计和地区影响的所有不同组合。

较小的样本如何真正代表广大公众？样本必须具有代表性，或者具有相同的特征和元素，且与较大体成分的比例相同。为了实现这一目标，研究人员和政治学家在选择受访者时使用随机化。在这种情况下，随机化是指较大人口中的每个人都有同等的机会被选入较小的代表性样本。

想象一下，如果你有一个加权完美的六面骰子。如果你掷了六次，很有可能你不会得到每个数字中的一个。如果你掷骰子六十次，你极不可能得到每个数字的 10 个（骰子两边的分布相等），但每个数字可能至少会得到几次掷骰子。如果你掷骰子六百次，你可能不会得到每个数字的100个，但是你每个数字得到的数字将比你只掷60次时每个数字获得10个更接近。而且，如果你掷骰子六千次，你将比掷出六百次或仅掷六十次骰子更接近相等的分布。换句话说，掷骰子的次数越多，每个数字分布相等的可能性就越大。

即使遵循随机化定律，所有民意调查都有误差幅度，这是对样本准确性的统计估计。回到酱汁的比喻，如果你用更大的勺子来品尝意大利面酱，你得到的所有活性成分可能比使用小汤匙多。因此，在这种情况下，较大的勺子的误差幅度将低于较小的勺子。换句话说，从统计学上讲，较大的随机样本比较小的随机样本更有可能准确。

读取民意调查时，该数字使用 “+/-” 分类表示。因此，如果民意调查声称有45％的公众喜欢某种饮料，而误差幅度为 “+/-5％”，则意味着民意调查实际上是在声称有40-50％的人喜欢这种特定饮料（我们只是从45％中加减了5％）。你怎么知道实际数字是40％而不是42％，还是45％？简短的答案是我们没有。如果我们得到更大的样本，我们也许能够减少误差幅度并获得更精确的快照，但这是唯一的选择。民意调查是一种旨在估计公众观点的工具。只要知道这个工具的局限性，那么民意调查可能是衡量意见的有价值的技术。

衡量公众舆论的另一种方法是使用焦点小组（Morgan 1996）。尽管民意调查让我们很好地了解了广大公众的感受或想法，但它并不能真正揭示如何形成或分享观点的现实生活动态。你有没有参与过与你交谈的人改变主意的对话？或者在哪里，你只是同意周围人的看法，因为你真的不在乎这个问题？或者，也许，你对某个问题有强烈的感觉，然后接触了更多信息（比如在新闻文章、播客或电视广告中）然后改变了主意？

焦点小组是接受某种治疗然后被问及他们对这种治疗的印象的一小部分人。但是，当询问他们的印象时，其他人也可以注入自己的观点，随之而来的是更多的现实生活互动。焦点小组是了解如何形成观点或主导人物如何影响周围人的绝佳工具，但不能将其推广到广大公众。尽管如此，它们还是尝试了解个人对一系列刺激的反应的好工具。

联系方式和民意调查类型

最好的科学调查通常通过电话通过随机数字拨号（RDD）进行。随机数字拨号轮询之所以有好处，原因有很多。您可以使用计算机在短时间内进行大量接触，从而获得更准确的发现。如果完成民意调查需要太长时间，那么在民意调查结束时，那些提前回复的人可能已经改变了主意。如果投票是在有众多候选人的选举中进行的，而一个人决定退出，这也可能成为问题。此外，研究人员和民意调查员可以使用计算机随机拨号，这是尝试获得随机样本的更好方法之一。最大的冲击是民意调查偏向于没有手机，主要是只使用手机的人。 RDD 民意调查也可能很昂贵（想想打电话给成千上万的受访者完成五十到千次面试需要花费多少时间），但仍然比雇人挨家挨户地工作更实惠。尽管随机数字拨号并不完美，但在各种方面，它都比一些便宜的替代品要好。

随着技术的发展，使用在线民意调查的频率越来越高，通过Survey Monkey等在线网站，任何人都可以更轻松地创建民意调查和发送电子邮件。但是，潜在的问题很快就会显现出来。许多人如果不知道消息来源，就会对在线做任何事情持怀疑态度。技术使我们能够筛选出匿名电话和电子邮件（即来电显示和垃圾邮件文件夹）。任何民意调查中的回复率越低（完成调查的联系人百分比）意味着你对目标人群所做的任何假设都变得不那么准确，因为我们无法肯定地说回答调查的人群与回答调查的人群不同。

但是，在非常特殊的情况下，在线民意调查对于收集信息可能非常有用。例如，如果一家企业使用内部在线民意调查来评估该公司内部的态度，但在这些情况下，受访者在完成民意调查之前就已经知道民意调查即将到来。一些民意调查员可能会提供经济激励措施（例如礼品卡或抽奖）以提高他们的回复率，但这样做会再次造成更多的偏见，因为我们可以假设那些因为这种激励而可能完成民意调查的人更有可能需要它。

有各种各样的民意调查，有些使用RDD或在线，而另一些则可能同时使用。跟踪民意调查是研究人员和公司常用的工具。它通常用于衡量公职人员的支持率。跟踪民意调查会在几天内（通常为 3-7 天）收集样本，然后使用滚动样本。每天都会进行接触，新的接触者会不断添加到样本中，同时取出较旧的接触者。因此，对于追踪民意调查来说，它比任何一张快照都更像是观察态度轨迹的有用工具。

出口民意调查在选举日进行。当投票者退出投票地点时，民意调查工作人员会在受访者投票后对其进行采访。这些数据很好，因为我们询问的是实际投票的个人他们投票给谁，而不是询问他们打算投票给谁。缺点是这些民意调查是在当天早些时候进行的（这可能会对受访者产生偏见），并使用一种称为系统随机化的策略（随机选择一个受访者，然后每三分之一、四分之一或其他固定数字面试一次）。这种策略比打冷电话要难得多。

Push Polls 是那些旨在以衡量某人的观点为幌子提供信息的民意调查。广告系列经常使用这些来试图建立虚假的热情。民意调查中嵌入了受访者可能不知道的有关候选人的信息。例如，想象一下这样的一系列问题：问题 1：你知道候选人 A 曾经从燃烧的建筑物里救过一个孩子的生命吗？问题 2：您是否知道候选人 B 因未支付子女抚养费而受到调查？问题3：如果明天举行选举，你会投票给候选人 A 或 B 吗？如你所见，问题排序旨在促使受访者以某种方式回答。

Straw Polls 通常用于活动或会议，以评估参加者的偏好。这些民意调查的问题在于，参与者通常会被吸引到这些活动中去看候选人，因此，除非他们在活动中听到改变主意的消息，否则他们将选择谁吸引了他们参加。想象一下，在洛杉矶湖人队的一场比赛中进行民意调查，询问那些参加比赛的人他们最喜欢的篮球运动员是谁。你在那场比赛中得到的结果将与你在全国篮球迷中问同样的问题完全不同。

最后，在使用来自非科学民意调查的数据时需要谨慎行事。根据1946年总统大选期间不科学的读者文摘民意调查，虚假的 “杜威击败杜鲁门” 标题就是非科学民意调查错误结果的典型例子。我们经常在党派或新闻网站上看到这些民意调查。这些民意调查不是随机的，完成民意调查的人希望完成投票。因此，您可以看到卡通倾斜的结果。例如，假设一个保守的新闻网络进行民意调查，询问观众谁赢得了辩论。结果显示，90％的受访者表示共和党候选人获胜。问题在于，那些访问该网站的人更有可能成为共和党选民。因此，当然，他们会选择共和党候选人。

民意调查有问题

无论研究人员或民意调查员在多大程度上有效地实现了样本的随机化，他们都必须担心民意调查呈现方式中的潜在陷阱。人们必须意识到启动作用。 Priming effects 是让受访者思考他们当时通常不会考虑或考虑的某个主题。最近的研究证实确实会产生启动作用（Lenz 2019）。如果我联系受访者询问他们更喜欢 Whataburger 的汉堡包还是 In-and-Out。然后，在他们给你回复之后，你问他们今晚晚餐打算吃什么。令人震惊的是，他们回答 “汉堡”。他们当然可以告诉你真相，但是如果你不先问他们 WhataBurger/In-and Out 问题让他们考虑汉堡包，他们会打算在晚餐时吃汉堡吗？

另一种可能扭曲结果的效果是取景（Nelson and Oxley 1999）。 框架效果是那些通过问题的呈现方式影响受访者的效果。有同样可以接受的提问方式，但是人们使用的用法这个词可能会以不同的眼光呈现问题。例如，想象一下在报纸上读一篇关于无证移民斗争的文章。然后想象一下读一篇相同的文章，但不是使用 “无证件” 一词，而是使用 “非法”。整篇文章的语气完全改变了。

在向受访者询问政策偏好时，语言的表达方式可能会影响他们的回应。例如，可以用人性化的语言来指代群体或政策成果，或者相反，在描述群体或政策结果时可以使用技术术语或非人化语言。试图最大限度地减少启动和取景效果是研究人员可能面临的一些更大挑战。因此，在使用民意调查数据时，务必以批判的眼光仔细阅读民意调查工具或问卷。如果目标是做出可概括的推论，则批判性分析对于选择数据至关重要。

此外，人们必须谨慎对待社交需求效应（在媒体讨论时通常被称为 “布拉德利效应”）和潮流效应。问问自己：对于社会认为是 “好” 或 “正确” 的问题，是否有答案？如果你的答案是 “是”，那么关于这些话题的问题是否会产生不正确的结果，因为受访者要么不想因为回答 “不正确” 而感到尴尬，要么可能被面试官判断？

任何民意调查背后的假设都是受访者对你说的是实话，而我们知道人们并不总是说实话。例如，如果呼叫中心的大学生与你联系，你对诸如 “学生贷款债务豁免” 之类的政治话题的看法会因为你在和正在上大学的人说话而改变吗？如果你发现来电者很迷人怎么办？即使答案是 “不”，也不是很多人必须受到社会期望效应（Streb 等人，2008）的影响，才能极大地扭曲对现实的看法，尤其是在一个两极分化的社会中。

潮流效果是相似的。在这种情况下，不一定是要与社会背道而驰，而是要受到周围人的热情的影响（Marsh 1985）。我成长为洛杉矶天使棒球迷，在我第一次参加研究生级别的研讨会之前，凭直觉就已经知道了潮流的影响。在世界大赛获胜之前，天使队一直是棒球的笑柄。他们还以窒息艺术家而闻名（总是表现不佳）。他们将是那种粉丝偶尔会把纸袋放在头顶的组织。然后是奇迹般的一年，他们赢得了世界大赛冠军。随着赛季的推移，安吉尔斯的球衣和光环帽的聚宝盆在整个南加州开花。明年或之后球队再次开始挣扎时，这些球迷会回来吗？可能不是。

有时候，对候选人的兴奋（或愤怒）太激动了，它可能会传染性地传播。毕竟，你有没有喜欢过或不喜欢某人却不知道为什么？你只知道周围的每个人（也许还有你深信的人）都有某种感觉，尽管你可能没有足够的时间自己研究候选人或科目，但你在某种程度上也采取了同样的信念？在问卷措辞中，你真的无法避免这些影响，但是在研究公众舆论的短期和长期结果时要注意这些影响。有时（但不是全部），在潮流效应下，公众舆论可以像向另一个方向一样剧烈地转变。

在研究其他国家的数据和进行比较分析时，政治学家研究了围绕国旗效应现象的集会（Baum 2002）。这些影响可以从国家领导人在战争时期或至少在武装冲突开始时的公众支持率急剧上升（通常是暂时的）中看出。峰值的突然发生也可能意味着意见不那么稳定。例如，在 “沙漠风暴行动” 之后，乔治·H·布什总统的公众支持率处于九十年代的最低水平，但不到两年后他在总统大选中输掉了胜利。

乔治·W·布什总统的支持率处于90年代90年代的低点，但他仅以略高于2％（民众投票）的优势赢得连任。一个人作为一个国家公民的认同感被激活，为了应对外部威胁，你可以暂时调整优先事项（Hetherington and Nelson 2003）。同一类型的现象可以在一个群组识别出你可能共享的任何人身上激活。例如，尽管你不是批评的目标，但听到有人抨击你的年龄段，你有没有感到恼火？

民意调查的缺点不应该让别人因为将其用作研究工具而感到沮丧。有许多优秀的研究人员接受了精湛技术的培训，可以最大限度地减少潜在问题。许多学校和公司使用民意调查和咨询公司进行数据收集和营销。如果在民意调查成功方面没有良好的记录，公司和新闻媒体就不会为结果付出代价。但是，随着民意调查的使用频率越来越高，越来越多的公司和公司进入该行业。一些企业在民意调查中采用的传统标准和保障措施与学者不同。因此，在寻找信誉良好的数据获取地点时，查看该公司过去进行的民意调查的准确性总是一个好主意。