Skip to main content
Global

7.5: 情报测量

  • Page ID
    203821
    • Rose M. Spielman, William J. Jenkins, Marilyn D. Lovett, et al.
    • OpenStax
    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    学习目标
    • 解释智力测验是如何开发的
    • 描述使用智商测试的历史
    • 描述智力测试的目的和好处

    虽然你可能熟悉 “智商” 一词并将其与智力的概念联系起来,但智商的真正含义是什么? 智商代表智商,描述在旨在衡量智力的测试中获得的分数。 你已经了解到,心理学家描述智力(或者更恰当地说是智力)的方式有很多。 同样,智商测试——旨在衡量智力的工具——在整个开发和使用过程中一直是争论的话题。

    什么时候可以使用智商测试? 我们从结果中学到了什么,人们会如何使用这些信息? 尽管智力测试肯定有很多好处,但也必须注意围绕这些测试的局限性和争议。 例如,智商测试有时被用作支持阴险目的的论据,例如优生学运动(Severson,2011)。 臭名昭著的最高法院案件,即巴克诉贝尔案,通过这种类型的检测,将一些被视为 “头脑虚弱” 的人强制绝育合法化,导致约65,000例绝育手术(B uck v Bell,274 U.S. 200;Ko,2016)。 如今,只有接受过心理学培训的专业人员才能进行智商测试,购买大多数测试都需要心理学高级学位。 该领域的其他专业人员,例如社会工作者和精神科医生,无法进行智商测试。 在本节中,我们将探讨智力测验的衡量标准、评分方式以及它们是如何开发的。

    衡量情报

    当我们专注于传统或学术型智力时,人类对智力的理解似乎有些有限。 那么,如何衡量智力呢? 当我们衡量智力时,我们如何确保捕捉到我们真正想要测量的东西(换句话说,智商测试可以作为有效的智力衡量标准)? 在以下段落中,我们将探讨智力测验的开发方式及其使用历史。

    一个多世纪以来,智商测试一直是智力的代名词。 1800年代后期,弗朗西斯·高尔顿爵士开发了第一次广泛的智力测验(Flanagan & Kaufman,2004)。 尽管他不是心理学家,但今天仍然可以感受到他对智力测验概念的贡献(Gordon,1995)。 可靠的情报测试(你可能还记得前面的章节中,可靠性是指测试产生一致结果的能力)始于20世纪初,由一位名叫Alfred Binet的研究人员认真开始(图7.13)。 法国政府要求Binet开发一种智力测验,用于确定哪些孩子在学校可能有困难;其中包括许多口头任务。 美国研究人员很快意识到了这种测试的价值。 斯坦福大学教授路易斯·特曼(Louis Terman)修改了比内特的工作,对考试管理进行了标准化,并对成千上万不同年龄的儿童进行了测试,以确定每个年龄段的平均分数。 因此,该测试进行了规范化和标准化,这意味着该测试始终适用于足够大的代表性人群样本,因此分数范围形成了钟形曲线(钟形曲线将在后面讨论)。 标准化意味着管理、评分和结果解释的方式是一致的。 规范涉及对大量人群进行测试,以便收集比较各群体的数据,例如年龄组。 生成的数据提供了规范或参考分数,据以解释未来的分数。 规范不是对特定群体应该知道什么的期望,而是该群体所知道的东西的证明。 规范和标准化考试可确保新分数的可靠性。 这个新版本的测试被称为 Stanford-Binet Intelligence Scale(泰尔曼,1916 年)。 值得注意的是,该测试的更新版本至今仍被广泛使用。

    照片 A 显示的是阿尔弗雷德·比内特的肖像。 照片 B 显示了六幅人脸素描。 这些面孔上方是 “Binet-Simon Scale Guide for Binet-Simon Scale。223” 标签。这些面孔分为三排,每排两排,这些行标有 “1、2 和 3”。 底部写着:“心理诊所感谢费城学校副校长兼落后儿童调查委员会主席奥利弗·康曼博士提供的这些削减贷款和第225页的贷款。 见委员会报告,1910 年 12 月 31 日,附录。”
    7.13 法国心理学家阿尔弗雷德·比内特帮助开发了智力测试。 (b) 此页面来自 1908 年版本的 Binet-Simon Intelligence Scale。 接受测试的孩子被问到每对脸中哪张脸更漂亮。

    1939年,心理学家大卫·韦克斯勒(David Wechsler)在美国开发了一项新的智商测试,他在职业生涯中的一部分时间都与第一次世界大战的退伍军人一起工作。 韦克斯勒结合了1880年至第一次世界大战期间使用的其他智力测验中的几项子测试。这些子测试利用了各种口头和非语言技能,因为韦克斯勒认为智力包含 “一个人有目的地行动、理性思考和应对的全球能力有效地保护了他的环境”(韦克斯勒,1958 年,第 7 页)。 他将该测试命名为 Wechsler-Bellevue Intelligence Scale(韦克斯勒,1981 年)。 这种子测验的组合成为心理学史上使用最广泛的智力测验之一。 尽管其名称后来改为韦克斯勒成人智力量表(WAIS),并经过多次修改,但该测试的目标自启动以来几乎没有变化(Boake,2002)。 如今,有三项智力测验归功于韦克斯勒,即韦克斯勒成人智力量表第四版(WAIS-IV)、韦克斯勒儿童智力量表(WISC-V)和韦克斯勒学前班和小学智力量表——IV(WPPSI-IV)(Wechsler,2012)。 这些测试在美国各地的学校和社区中广泛使用,并定期对其进行规范和标准化,以此作为重新校准的手段。 作为重新校准过程的一部分,向全国成千上万的儿童提供了WISC-V,并将今天参加考试的儿童与同龄儿童进行了比较(图7.13)。

    WISC-V 由 14 个子测试组成,这些子测试由五个指数组成,然后得出智商分数。 五个指数是言语理解、视觉空间、流体推理、工作记忆和处理速度。 测试完成后,个人将获得五个指数的分数和全量智商分数。 评分方法反映了这样一种理解,即智力由多个认知领域的多种能力组成,侧重于孩子在得出每个测试项目答案时所采用的心理过程。

    有趣的是,定期的重新校准导致了一个有趣的观察,称为弗林效应。 弗林效应以詹姆斯·弗林(James Fly nn)的名字命名,他是最早描述这一趋势的人之一,它指的是观察到每一代人的智商都比上一代人高得多。 但是,弗林本人认为,智商分数的提高并不一定意味着年轻一代本身更聪明(Flynn、Shaughnessy和Fulgham,2012年)。

    归根结底,我们仍然面临智力测验有多有效的问题。 当然,这些测试中最现代的版本所涉及的不仅仅是口头能力,但是智商测试中应评估的具体技能、任何测试能在多大程度上真正衡量个人智力以及智商测试结果的使用仍然是有争议的问题(Gresham &Witt,1997 年;Flynn、Shaughnessy 和 Fulgham,2012 年;理查森,2002 年;施林格,2003 年)。

    你怎么看:死刑和智障罪犯

    阿特金斯诉弗吉尼亚案是美国最高法院具有里程碑意义的案件。 1996年8月16日,两名男子达里尔·阿特金斯和威廉·琼斯抢劫、绑架,然后开枪打死了来自美国空军的当地飞行员埃里克·内斯比特。 一位临床心理学家对阿特金斯进行了评估,并在试验中作证说阿特金斯的智商为59。 平均智商分数为 100。 心理学家得出结论,阿特金斯 “有轻度智障”。

    陪审团裁定阿特金斯有罪,他被判处死刑。 阿特金斯和他的律师向最高法院提出上诉。 2002年6月,最高法院推翻了先前的裁决,裁定处决智障罪犯是《第八修正案》所禁止的 “残酷和不寻常的惩罚”。 法院在裁决中写道:

    智力低下的临床定义不仅需要低于平均水平的智力功能,还要求适应技能有明显的限制。 智力迟钝的人往往知道对与错的区别,有能力接受审判。 但是,由于他们的缺陷,顾名思义,他们理解和处理信息、沟通、从错误中抽象出来、从经验中吸取教训、进行逻辑推理、控制冲动和理解他人反应的能力减弱。 他们的缺陷不能成为免除刑事制裁的理由,而是减少了他们的个人罪责(Atkins诉弗吉尼亚案,2002年,第5段)。

    法院还裁定,州议会一致反对处决智障者,这一共识应代表所有州。 最高法院的裁决让各州自己决定自己对智力迟缓(当时广泛使用的术语)和智力障碍的定义。 各州对谁可以被处决的定义各不相同。 在阿特金斯案中,陪审团裁定,由于他与律师有过多次接触,因此受到智力刺激,据报道,他的智商提高了,现在他足够聪明,可以被处决。 据透露,共同被告威廉·琼斯的律师指导琼斯 “出示与证据相符的不利于阿特金斯先生的证词”,他获得了处决日期,然后被暂缓执行死刑(Liptak,2008)。 这种不当行为被揭露后,阿特金斯被重新判处终身监禁。

    阿特金斯诉弗吉尼亚案(2002)强调了与社会对智力的信念有关的几个问题。 在阿特金斯案中,最高法院裁定,智力残疾确实影响决策,因此应影响此类罪犯受到的惩罚的性质。 但是,智力障碍的界限应该划在哪里? 2014年5月,最高法院在一个相关案件(霍尔诉佛罗里达州)中裁定,智商分数不能用作囚犯是否有资格被判处死刑的最终决定(Roberts,2014)。

    钟形曲线

    智力测验的结果遵循钟形曲线,这是一张钟形一般形状的图表。 当在心理测试中使用钟形曲线时,该图显示了人类群体中某种特征(在本例中为智力)的正态分布。 许多人类特征自然会遵循钟形曲线。 例如,如果你根据身高将所有女同学排成一列,那么其中很大一部分可能是美国女性的平均身高:5'4” —5'6”。 该群集将落在钟形曲线的中心,代表美国女性的平均身高(图 7.14)。 站在接近4英尺11英寸的女性人数会减少。 身高高于平均水平的女性也是如此:身高接近5英尺11英寸的女性。 在自然界中找到钟形曲线的诀窍是使用较大的样本量。 如果没有较大的样本量,钟形曲线就不太可能代表更广泛的人群。 代表性样本是精确代表一般人群的总体子集。 例如,如果你只测量教室里女性的身高,那么你实际上可能没有代表性的样本。 也许女子篮球队想一起上这门课程,她们都在你的课上。 因为篮球运动员的身高往往高于平均水平,所以你班中的女性可能不是美国女性群体的良好代表样本。 但是,如果你的样本包括你所在学校的所有女性,那么她们的身高很可能会形成自然的钟形曲线。

    钟形曲线图标有 “美国女性的身高”。 x 轴标记为 “高度”,y 轴标记为 “频率”。 在五英尺高和五英尺零五英寸的高度之间,频率上升到弯曲的峰值,然后开始以同样的速度下降,直到达到五英尺十英寸的高度。
    7.14 你的身高低于平均水平、平均水平还是高于平均水平?

    同样的原则适用于智力测验分数。 个人获得的分数称为智商(IQ)。 多年来,不同类型的智商测试不断发展,但分数的解释方式保持不变。 智商测试的平均智商分数为 100。 标准差描述了数据在总体中的分散方式,并为大型数据集提供了背景信息。 钟形曲线使用标准差来显示所有分数与平均分数的分散情况(图 7.15)。 在现代智商测试中,一个标准差为 15 个点。 因此,85 分将被描述为 “比平均值低一个标准差”。 你会如何描述 115 分和 70 分? 任何处于高于或低于平均值(介于85和115之间)的标准差之内的智商分数均被视为平均值,68%的人口的智商分数在此范围内。 智商分数为 130 或以上被认为是更高的水平。

    钟形曲线图标有 “智商分数”。 x 轴标记为 “IQ”,y 轴标记为 “人口”。 从智商为60开始,人口在智商为100时上升到曲线峰值,然后以同样的速度下降,在智商为140时结束接近零。
    7.15 大多数人的智商分数在 85 到 115 之间。

    只有2.2%的人口的智商分数低于70(美国心理学会 [APA],2013年)。 分数为 70 或以下表示认知迟缓。 当这些缺陷与适应功能的严重缺陷相结合时,一个人被诊断出患有智力障碍(美国智力与发育障碍协会,2013)。 以前称为智力低下,现在公认的术语是智力残疾,它有四种亚型:轻度、中度、重度和重度(表7.5)。 《心理障碍诊断和统计手册》列出了每个亚组的标准(APA,2013)。

    认知障碍的特征
    智力障碍亚型 智力障碍人口的百分比 描述
    温和 85% 3 至 6 年级的阅读、写作和数学技能水平;可以独立工作和生活
    中等 10% 基本的阅读和写作技能;功能性自我保健技能;需要一些监督
    严重 5% 功能性自我保健技能;需要监督日常环境和活动
    深刻 < 1% 可能能够口头或非口头交流;需要密切监督

    表 7.5

    情报范围的另一端是那些智商处于最高范围的人。 与钟形曲线一致,大约2%的人口属于这一类别。 如果人的智商分数达到或高于130,或者在特定领域具有更高的智力,则被视为有天赋的人。 很久以前,人们普遍认为高智商的人适应不当。 一项针对有天赋的孩子的开创性研究驳回了这个想法。 1921年,刘易斯·特曼开始对1500多名智商超过135的儿童进行纵向研究(泰尔曼,1925年)。 他的发现表明,这些孩子成为受过良好教育、成功的成年人,实际上适应得很好(Terman & Oden,1947 年)。 此外,泰尔曼的研究表明,受试者的体型和吸引力都高于平均水平,这消除了早些时候流行的关于高度聪明的人是 “弱者” 的观念。 一些智商很高的人选择加入Mensa,这是一个致力于识别、研究和培养智力的组织。 会员必须在前 2% 的人群中获得智商分数,并且在申请加入小组时可能需要通过其他考试。

    DIG DEEPER:名字里有什么-智力低下

    过去,智商分数低于70且适应性和社交功能严重延迟的人被诊断为智力低下。 当这个诊断首次被命名时,这个标题没有社会污名。 但是,随着时间的推移,有辱人格的 “retard” 一词源于这个诊断术语。 “智障” 经常被用作嘲讽,尤其是在年轻人中,直到 “智力迟缓” 和 “智障” 这两个词变成了侮辱。 因此,DSM-5 现在将这种诊断标记为 “智力残疾”。 许多州曾经设有智力低下部门为被诊断患有此类认知迟缓的人提供服务,但大多数州已将其名称改为发育障碍部或类似语言部门。 社会保障局仍在使用 “智力低下” 一词,但正在考虑将其从计划中删除(Goad,2013)。 在本章的前面,我们讨论了语言如何影响我们的思维方式。 你认为改变这个部门的名称会影响人们如何看待发育障碍者吗? 不同的名字会给人更多的尊严吗?如果是,怎么做? 它会改变对发育或认知障碍者的期望吗? 为什么或者为什么不呢?

    为什么要衡量智力?

    智商测试的价值在教育或临床环境中最为明显。 可以对似乎有学习困难或严重行为问题的孩子进行测试,以确定孩子的困难是否可以部分归因于智商分数与其年龄组的平均值明显不同。 如果没有智商测试或其他智力衡量标准,则可能无法有效识别需要额外支持的儿童和成人。 此外,法庭使用智商测试来确定被告是否有特殊或情有可原的情况,使他无法以某种方式参与审判。 人们还使用智商测试结果向社会保障局寻求残疾补助金。

    以下案例研究证明了智商测试的有用性和益处。 康涅狄格州一名在学校遇到问题的14岁女孩坎迪斯被转介接受法院下令的心理评估。 她九年级上正规教育课,每门科目都不及格。 坎迪斯从来都不是一个优秀的学生,但一直都能升入下一年级。 她经常会诅咒任何在课堂上拜访她的老师。 她还与其他学生打架,偶尔会入店行窃。 当她来参加评估时,坎迪斯立刻说她讨厌学校的一切,包括老师、其他员工、大楼和家庭作业。 她的父母说,他们觉得自己的女儿被选中了,因为她与老师和其他大多数学生属于不同的种族。 当被问及为什么她诅咒老师时,坎迪斯回答说:“他们只有在我不知道答案时才会打电话给我。 我不想一直说 “我不知道”,在朋友面前看起来像个白痴。 老师们让我感到尴尬。” 她接受了一系列测试,包括智商测试。 她在智商测试中的分数是68。 坎迪斯的分数说明了她在没有帮助的情况下在正规教育课程中脱颖而出甚至取得成功的能力? 为什么她的困难从未被注意或解决?