实验心理学-第87章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
特定学习经验的影响,许多项目已经从现代的智力测验中删除了;但
完全消除学习、语言的运用、动机、文化知识、测验以及其他已知会干
扰智力测量的因素的影响是不可能的。如果智力只被解释为在校成
功的可能性,那么这就不是问题了,因为这些其他的因素无疑会影响
在校的表现。但如果智力被解释为“心理容量”或诸如此类的结构,
那么这些无关变量的影响必须被减少到最小。
12。1 实验主题与研究范倒
主鹰测量信度
范例智力与发展的研究设计
当心理学家说到信度时,他们是指对某一数量的多次测量的一
致性。你可能会假设你对同一事情的几次测量都将产生同样的数
目,当然这是在不考虑已经存在误差的情况下。事实上,在一组测量
中几乎总是会有变异}变异量决定了测量仪器和程序的信度。心理
学家提到了“误差”一词,顾名思义,它并非由某个人不小心造成的,
而是某些特定的不可避免因素引起的无法预测的数据变异。这些误
差源常常超出了研究者的控制,以至需要在相继场台中相同条件下
的施测来增加测验信度。
如果同样的条件能够被保证,那么测量中的变异将是由所测量
7883097 qzonf qq
提供试看期待*询 / 427
j …
第十二章个瓢差异s发鼠/
的真正变化引起的。如果你的身高被测量了两次,结果是5'8”和
5'IO“,那么请问这是由误差引起的还是由你身高的真正变化引起
的?答案可能是非此即彼,也可能是两个都有。但条件越相近,就越367
不可能把差异归结为身高的真正变化。你知道身高的变化速度,或
者说知道一个人真正身高的稳定性。
智力比身高还难于测量,因为其误差源更难以发现。一个人的
智力测验成绩可能受很多即时无关变量的影响,诸如,这个人昨天晚
上的睡眠情况,测验前她或他是否吃得好,等等。若想了解智力的稳
定性情况同样也很难。智力是变化的,还是终其一生都很稳定?如
果它变化得很明显,那么它在一周、一月、一年、或十年之内能变化
吗?这些是心理学家想要回答的问题;回答它们就需要测量智力。
但是警觉的读者会发现,我们现在已经把自己推进了一个逻辑上的
循环之中。让我们再从头开始并试着走出来。
一般而言,同一数量的几次测量确实不会一致。这个变异可能
是误差或测量量的真正变化引起的。没有一些额外昀假设,我们不
能判定在我们的测量中有多少误差。因此,如果智力变化了,我们怎
样才能发现呢?一个有用的假设——能够打破逻辑循环的假设——
是在一个相对短时期内测量量保持相对稳定。(如果一个研究者早
上测量丁你的智力之后下午又重测了,那么任何的变化都可以被假
定为是由测量误差引起的而不是智力上的真正变化。)使用这个假
设,研究者就能够估算测量误差,并试着去提高和详细说明测量仪器
的信度。那么有关量的稳定性问题,本例中指智力,就能够被回
答了。
我们先来回顾一些测验发展者用来评估他们的测量信度的技
术。然后再回顾一个多年来尝试着确定智力稳定性的研究。
测验信度
起初我们注意到,智力的概念并没有从理论上被很好地定义。
一些理论家假定了许多独立的心理能力,或许已超过了100种
(Guilford; 1967)。另一些人则相信,存在一个基本的心理能力和其
M,
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
臻●
芸荐
芸推
:㈣: 747883097 TL。 028 8194 2202日址:http: i1747883097 qzone qq
428虞喜翠嚣磊黩享勰霉
,理学专业20门主干课程DS视频图文并茂,音质圆润,提供试看 期待咨询
/实验心理学
r1
u
他被分离出来的许多具体能力,但这些具体能力不及基本能力重要
(Herrnsteiri和Murray,1995)。这个基本能力被描述为“一种抽象
推理和问题解决的能力”(Jensen,1969,p.19)。为了对它进行测
验,我们集合了许多问题或任务并呈现给个体,同时要求他们在一个
给定的时间内解决。把每个个体的分数与其他人的进行比较,在完
全相信这些分数之前,我们还需要知道它们的信度。如果我们在第
二天或一周后再测验他们,还会得到同样的分数吗?由于我们不相
信在如此短的时间内这个根本能力会发生明显的变化,因此,如果出
现了测验分数的大变化,我们就可以归结为测量误差,这也说明我们368
的测验没有信度。在一个短时期内相继给出两次同样的测验以确定
一个测量的被称之为测验一再测信度的东西。它通常以对大样本被
试的第一次和第二次测验分数之间的相关来表示。
一个略有差别的程序可以避免诸如特殊的练习效应乏类的问
题。这个技术需要在两次施测中提供一个该测验的预备或平行形
式。如果此时两次测验分数的相关仍然很高,那么就证明了测验信
度是存在的。而且,该测验的两种形式是否等值也可以以这种方式
来确定。
第三个计算信度的程序是通过呈现一个单独的测验来进行的。
这个技术提供了分半信度,它把同一个测验的项目随意地分成两组
(诸如序号为奇数的一组和序号为偶数的一组)并计算在该测验两个
半组上得分的相关。如果相关高,则说明测验信度确实存在。此外,
测验项目之间的等值也被确立了。
智力铡■的稳定性
通常能在现代的智力测验中发现很高的测验一再测信度(大约
0。 95的相关)。如果我们把这些测验看作是有信度的,那么我们就
能进一步问:个体被测量到的智力终其一生的稳定性如何。有许多
纵向研究已经开始探讨这个问题了,并且大约每十年总有一些报告
发表以便于当代人了解。一个研究报告(Kangas和Bradway,
1971)包括了不同时间在同一组被试身上进行的测验结果。其测验
的具体时间是:被试的平均年龄只有4岁多的1931年时首次进行的
斯坦福一比纳测验,以及后来的1941年、1956年和1969年进行的重
测。最初的样本是由旧金山海湾地区的儿童组成,他们是斯坦福一比
纳量表修订时所需要的全国标准化群体中的一部分。研究中运用了
两种形式的测验。在1941年,用同一个量表对138名被试进行了再
测;在1956年,IlI名被试受到了韦克斯勒成人智力量表和斯坦福一
比纳测验的再测。在1969年,只剩下48名被试同意被再谟l。
在探讨这个研究的结果之前,我们应该知道它们只能代表那些
被收集数据的被试群。当然,它们也将代表与上述被试类似的群体。
它们可能会也可能不会代表在重要方面与上述被试不同的群体。
坎加斯(Kangas)和布雷德韦(Bradway)提供的数据表明,在
1969年所测的48名被试与1956年施测的111名被试没有什么差
异。他们提供了两个年段的平均数和标准差以及每个年龄的斯坦
福一比纳测验的IQ值,并发现这两个样本之间没有差异。
作者还对分数之间进行了配对相关的计算,其中1931年取的是
两个平行铡验值的平均数。在每个年龄都使用了斯坦福一比纳(S…B)
智力测验,而在1956年相1 969年还使用了韦克斯勒成人智力量表
(WAIS)。结果列在表12…1中。注意:WAIS包含一个言语部分和
一个作业部分,两部分的分数放在一起才能得到完整的分数。当你
从左往右看这个表时,你能看到,随着测验阃隔时间的增大,系列测369
验之间的相关减小。当计算平均年龄为4。1岁的学前儿童智力与其
他分数(表的最上边)之间的相关时,这种减小尤其明显。当计算成
人的相关时,它们的系数就要大得多。但是,所有表12…1中列出的
相关都具有统计上的显著性;因此可以说儿童4岁时测出的分数能
够在某种程度上(0。 41的相关)预测他们将来,哪怕是41; 6岁时的
情况。(我们应该也注意到,给4岁儿童施测的智力测验在问题的类
型上与年长儿童有很大的不同;这可能有助于解释他们之间的低相
关。)
当从表的上部看到底部时,你可以看得出随着被试年龄的增长
1969年的测量值与前几年之间相关的增大。当只用S…B分数而
册1
4 1
\、广
骊
嚣瓣
箬
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
撬●
芸推
:㈣: 747883097 TL: 028 8194 2202日址:http: i1747883097 qzone qq…
430蓐喜翠曩票磊薯类享惑登霉
,理学专业20门主干课程DS视频图文并茂,音质圆润,提供试看 期待咨询
/实验心理学
表n…i 1931…1~69年期问四个年龄的IQ谢验舟教之间的相关
测 验
1941{ N
…。 138) 1956《 N …。 109…111 ' ) 196e( N…48)
WAIS WAIS
r》c舅黼碧警蒋胁碧警
J931 S…B
(L和M形式) 0; 65 0;59 0。 64 0t 60 0。 54 0; 41 0。 39 0。28 0。29
1941 S…B
(L形式) 0。 85 0… S0 0。81 0~t 0。 68 0。 53 0。 57 0; 18
1956 S…B
(L形式) 0。 83 0。 89 0+ 46 0。77 0。58 0。 68 0。 14
1956 WAIS
总分 0+ 87 0+ 84 n 72 0。 73 0。 69 0+ 41
言语分 O+ 59 0+ 73 0+ 63 0。700。 20
操作分 n 36 0+ 67 0。 47 0。 57
1969 S…H
(L…M形式) 0。77 0。 86 0。 36
1969 WAIS
总分 0。 87 0。 74
言语分 0。 38
洼:S…B是斯坦福一出纳测验,它在所有的年龄段上都旖测丁;WAIS是韦克
斯勒成人智为量表,它只在1956和1969年杖施测了+所有的相关都
在0。 OI水平上显著。(取自坎加斯和布雷德韦,1971,表2。此表的
1931…1956部分是从布雷德韦和汤普森1962年发表于教育心理学杂
志上的一篇文章中摘取重印的。版权归美国心理学会。重印时得到了
许可。)
*由于两个被试的数据不完整,因此计算任何一个相关时所需要舶总被试
数就从109变成丁111。
不是WAIS分数之间求相关时,其相关系数还更高l并且反之亦然。
由于斯坦福一比纳测验是言语的,所以它不可能与WAIS作业部分
有相当高的相关。表12…1中列出的结果表明,对于这个而言,37年
间智力相当稳定。
坎加斯和布雷德韦研究的另一个有趣的发现是+从4。 1…41。6
岁每个测试年龄上测验分数都增多了。这个增多对男性和女性(各
B~
·蕤
芸芸视频水久联系方式㈣:747883097 TL:028 8104 2202网址:http:i174
推荐:北京师范大学心理学专业20门主干课程DS视频图文并茂,音质圆润,
●
24人)进行了分别的探讨,并且又把这两个组进一步分成高得分组、
中等得分组和低得分组,组员分别是每个性别中最高分数的八人、中