实验心理学-第87章

小说：实验心理学字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

特定学习经验的影响，许多项目已经从现代的智力测验中删除了；但
完全消除学习、语言的运用、动机、文化知识、测验以及其他已知会干
扰智力测量的因素的影响是不可能的。如果智力只被解释为在校成
功的可能性，那么这就不是问题了，因为这些其他的因素无疑会影响
在校的表现。但如果智力被解释为“心理容量”或诸如此类的结构，
那么这些无关变量的影响必须被减少到最小。
12。1　　实验主题与研究范倒
　　主鹰测量信度
　　范例智力与发展的研究设计
　　当心理学家说到信度时，他们是指对某一数量的多次测量的一
致性。你可能会假设你对同一事情的几次测量都将产生同样的数
目，当然这是在不考虑已经存在误差的情况下。事实上，在一组测量
中几乎总是会有变异｝变异量决定了测量仪器和程序的信度。心理
学家提到了“误差”一词，顾名思义，它并非由某个人不小心造成的，
而是某些特定的不可避免因素引起的无法预测的数据变异。这些误
差源常常超出了研究者的控制，以至需要在相继场台中相同条件下
的施测来增加测验信度。
　　如果同样的条件能够被保证，那么测量中的变异将是由所测量
7883097　qzonf　qq　
提供试看期待*询　　　　/　427
　　　　j　…
第十二章个瓢差异s发鼠／
的真正变化引起的。如果你的身高被测量了两次，结果是5'8”和
5'IO“，那么请问这是由误差引起的还是由你身高的真正变化引起
的？答案可能是非此即彼，也可能是两个都有。但条件越相近，就越367
不可能把差异归结为身高的真正变化。你知道身高的变化速度，或
者说知道一个人真正身高的稳定性。
　　　　智力比身高还难于测量，因为其误差源更难以发现。一个人的
智力测验成绩可能受很多即时无关变量的影响，诸如，这个人昨天晚
上的睡眠情况，测验前她或他是否吃得好，等等。若想了解智力的稳
定性情况同样也很难。智力是变化的，还是终其一生都很稳定？如
果它变化得很明显，那么它在一周、一月、一年、或十年之内能变化
吗？这些是心理学家想要回答的问题；回答它们就需要测量智力。
但是警觉的读者会发现，我们现在已经把自己推进了一个逻辑上的
循环之中。让我们再从头开始并试着走出来。
　　　　一般而言，同一数量的几次测量确实不会一致。这个变异可能
是误差或测量量的真正变化引起的。没有一些额外昀假设，我们不
能判定在我们的测量中有多少误差。因此，如果智力变化了，我们怎
样才能发现呢？一个有用的假设——能够打破逻辑循环的假设——
是在一个相对短时期内测量量保持相对稳定。（如果一个研究者早
上测量丁你的智力之后下午又重测了，那么任何的变化都可以被假
定为是由测量误差引起的而不是智力上的真正变化。）使用这个假
设，研究者就能够估算测量误差，并试着去提高和详细说明测量仪器
的信度。那么有关量的稳定性问题，本例中指智力，就能够被回
答了。
　　我们先来回顾一些测验发展者用来评估他们的测量信度的技
术。然后再回顾一个多年来尝试着确定智力稳定性的研究。
　　测验信度
　　起初我们注意到，智力的概念并没有从理论上被很好地定义。
一些理论家假定了许多独立的心理能力，或许已超过了100种
（Guilford；　1967）。另一些人则相信，存在一个基本的心理能力和其
M，
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
臻●
芸荐
芸推
　　　　：㈣：　747883097　TL。　028　8194　2202日址：http：　i1747883097　qzone　qq　
428虞喜翠嚣磊黩享勰霉
　　　　，理学专业20门主干课程DS视频图文并茂，音质圆润，提供试看　　期待咨询
　　　　／实验心理学
r1
u
他被分离出来的许多具体能力，但这些具体能力不及基本能力重要
（Herrnsteiri和Murray，1995）。这个基本能力被描述为“一种抽象
推理和问题解决的能力”（Jensen，1969，p．19）。为了对它进行测
验，我们集合了许多问题或任务并呈现给个体，同时要求他们在一个
给定的时间内解决。把每个个体的分数与其他人的进行比较，在完
全相信这些分数之前，我们还需要知道它们的信度。如果我们在第
二天或一周后再测验他们，还会得到同样的分数吗？由于我们不相
信在如此短的时间内这个根本能力会发生明显的变化，因此，如果出
现了测验分数的大变化，我们就可以归结为测量误差，这也说明我们368
的测验没有信度。在一个短时期内相继给出两次同样的测验以确定
一个测量的被称之为测验一再测信度的东西。它通常以对大样本被
试的第一次和第二次测验分数之间的相关来表示。
　　　　一个略有差别的程序可以避免诸如特殊的练习效应乏类的问
题。这个技术需要在两次施测中提供一个该测验的预备或平行形
式。如果此时两次测验分数的相关仍然很高，那么就证明了测验信
度是存在的。而且，该测验的两种形式是否等值也可以以这种方式
来确定。
　　第三个计算信度的程序是通过呈现一个单独的测验来进行的。
这个技术提供了分半信度，它把同一个测验的项目随意地分成两组
（诸如序号为奇数的一组和序号为偶数的一组）并计算在该测验两个
半组上得分的相关。如果相关高，则说明测验信度确实存在。此外，
测验项目之间的等值也被确立了。
　　　　智力铡■的稳定性
　　　　通常能在现代的智力测验中发现很高的测验一再测信度（大约
0。　95的相关）。如果我们把这些测验看作是有信度的，那么我们就
能进一步问：个体被测量到的智力终其一生的稳定性如何。有许多
纵向研究已经开始探讨这个问题了，并且大约每十年总有一些报告
发表以便于当代人了解。一个研究报告（Kangas和Bradway，
1971）包括了不同时间在同一组被试身上进行的测验结果。其测验
的具体时间是：被试的平均年龄只有4岁多的1931年时首次进行的
斯坦福一比纳测验，以及后来的1941年、1956年和1969年进行的重
测。最初的样本是由旧金山海湾地区的儿童组成，他们是斯坦福一比
纳量表修订时所需要的全国标准化群体中的一部分。研究中运用了
两种形式的测验。在1941年，用同一个量表对138名被试进行了再
测；在1956年，IlI名被试受到了韦克斯勒成人智力量表和斯坦福一
比纳测验的再测。在1969年，只剩下48名被试同意被再谟l。
　　　　在探讨这个研究的结果之前，我们应该知道它们只能代表那些
被收集数据的被试群。当然，它们也将代表与上述被试类似的群体。
它们可能会也可能不会代表在重要方面与上述被试不同的群体。
　　　　坎加斯（Kangas）和布雷德韦（Bradway）提供的数据表明，在
1969年所测的48名被试与1956年施测的111名被试没有什么差
异。他们提供了两个年段的平均数和标准差以及每个年龄的斯坦
福一比纳测验的IQ值，并发现这两个样本之间没有差异。
　　　　作者还对分数之间进行了配对相关的计算，其中1931年取的是
两个平行铡验值的平均数。在每个年龄都使用了斯坦福一比纳（S…B）
智力测验，而在1956年相1　969年还使用了韦克斯勒成人智力量表
（WAIS）。结果列在表12…1中。注意：WAIS包含一个言语部分和
一个作业部分，两部分的分数放在一起才能得到完整的分数。当你
从左往右看这个表时，你能看到，随着测验阃隔时间的增大，系列测369
验之间的相关减小。当计算平均年龄为4。1岁的学前儿童智力与其
他分数（表的最上边）之间的相关时，这种减小尤其明显。当计算成
人的相关时，它们的系数就要大得多。但是，所有表12…1中列出的
相关都具有统计上的显著性；因此可以说儿童4岁时测出的分数能
够在某种程度上（0。　41的相关）预测他们将来，哪怕是41；　6岁时的
情况。（我们应该也注意到，给4岁儿童施测的智力测验在问题的类
型上与年长儿童有很大的不同；这可能有助于解释他们之间的低相
关。）
　　　　当从表的上部看到底部时，你可以看得出随着被试年龄的增长
1969年的测量值与前几年之间相关的增大。当只用S…B分数而
册1
　4　1
＼、广
　　骊
　　嚣瓣
　　箬
　　∥润
　　雕圆
　　n质
　　h芷日
　　黠
　　吧文
　　船圉
　　。频
　　坞视
　　81
　　g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
撬●
芸推
　　　　：㈣：　747883097　TL：　028　8194　2202日址：http：　i1747883097　qzone　qq…
430蓐喜翠曩票磊薯类享惑登霉
　　　　，理学专业20门主干课程DS视频图文并茂，音质圆润，提供试看　　期待咨询
　　　　／实验心理学
表n…i　1931…1~69年期问四个年龄的IQ谢验舟教之间的相关
测　　验
1941｛　N
　…。　138）　　　　　　1956《　N　…。　109…111　'　）　　　　　　　　　　　　　196e（　N…48）
WAIS　　　　WAIS
　　　　r》c舅黼碧警蒋胁碧警
J931　S…B
（L和M形式）　　　　0；　65　　0；59　0。　64　0t　60　0。　54　0；　41　0。　39　0。28　0。29
1941　S…B
（L形式）　　　　0。　85　0…　S0　0。81　0~t　0。　68　0。　53　0。　57　0；　18
1956　S…B
（L形式）　　　　0。　83　0。　89　0＋　46　0。77　0。58　0。　68　0。　14
1956　WAIS
　　总分　　　　0＋　87　0＋　84　n　72　0。　73　0。　69　0＋　41
　　言语分　　　　O＋　59　0＋　73　0＋　63　0。700。　20
　　操作分　　　　n　36　0＋　67　0。　47　0。　57
1969　S…H
（L…M形式）　　　　0。77　0。　86　0。　36
1969　WAIS
　　总分　　　　0。　87　0。　74
　　言语分　　　　0。　38
洼：S…B是斯坦福一出纳测验，它在所有的年龄段上都旖测丁；WAIS是韦克
　　斯勒成人智为量表，它只在1956和1969年杖施测了＋所有的相关都
　　在0。　OI水平上显著。（取自坎加斯和布雷德韦，1971，表2。此表的
　　1931…1956部分是从布雷德韦和汤普森1962年发表于教育心理学杂
　　志上的一篇文章中摘取重印的。版权归美国心理学会。重印时得到了
　　许可。）
*由于两个被试的数据不完整，因此计算任何一个相关时所需要舶总被试
数就从109变成丁111。
不是WAIS分数之间求相关时，其相关系数还更高l并且反之亦然。
由于斯坦福一比纳测验是言语的，所以它不可能与WAIS作业部分
有相当高的相关。表12…1中列出的结果表明，对于这个而言，37年
间智力相当稳定。
　　坎加斯和布雷德韦研究的另一个有趣的发现是＋从4。　1…41。6
岁每个测试年龄上测验分数都增多了。这个增多对男性和女性（各
　　　　B～
·蕤
芸芸视频水久联系方式㈣：747883097　TL：028　8104　2202网址：http：i174
推荐：北京师范大学心理学专业20门主干课程DS视频图文并茂，音质圆润，
　　●
24人）进行了分别的探讨，并且又把这两个组进一步分成高得分组、
中等得分组和低得分组，组员分别是每个性别中最高分数的八人、中

返回目录上一页下一页回到顶部赞（1）踩（0）

第87章

实验心理学-第87章

你可能喜欢的