郑日昌心理测量学-第9章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
2.在指导语中要讲清匹配依据,告诉被试每个反应可用几次。
3。配对项目不可过多或过少,如在十对以下,最好应用不完全配合,使反应项目比刺激项目多出一两个,以增加其可靠性。
4.每个刺激项目应有一个而且只有一个反应项目相匹。
5.按一定逻辑次序(例如按字母顺序,数字大小,时间先后等)安排反应项目;同时要避免答案的固定格式。
6.同一组项目应印在同一页上,以免造成作答时的困难。其它原则与编多选题相同。
(四)填空题和简答题
上边几种形式均可归类为选择题,要求的是对正确答案的辨认。填空题与简答题要求的是对正确答案的回忆,即由被试自己写出答案。填空题是提出一个不完整的陈述,要求被试把缺少的字词填上,可以空一处,也可以空几处。
例题:第一个智力测验是由_____与_____编造的。
简答题是提出简单的问题,让被试回答,通常只要几个字或一两句话即可答完。
例题:一年有哪几个季节?
填空题、简答题与选择题适于同样类型的材料,但填空题和简答题比多选题容易编写写,而且被试无法猜,但评分不如选择题方便和客观。
填空题和简答题的编写原则如下,
1.填空题目所空出的应该是关键字句,并且要和上下文有密切联系,不要空出无关紧要的字词。
2.一句内不要有太多的空白,空白太多,不容易明了题意。
3.空白最好放在句子的尾部,免得空格数量为答案提供线索。
4.测题句子避免直接引用教科书的措词。
5.问题要具体,范围要确定,要使受测者知道答案的类型、长度和确切程度。
6.准备一个正确答案和可接受的变式的标准,如果部分正确也适当给分,则要做出更具体的规定。
(五)论文题.
简答题若流于空泛或对其范围不加限定就变为论文题。这两种题目的区别不仅在于长度,还在于它们所起的作用,简答题最适合于测验实际知识的记忆和理解,而论文题最适合测验组织能力、综合能力和文字表达能力,有时还可测量评价能力和创造能力。论文题目编写容易,不允许猜测和简单背诵,可以反映理解的深度。但题目少,取样缺乏代表性,特别是评分困难,即费时又易受无关因素(如文字风格、卷面整洁、个人成见等)的影响,从而使测验的可靠性和有效性降低。
编拟论文题目要注意以下几点,
1.要让被试知道答案的范围和方向,例如长度、举例的详细程度等,但不可规定得太具体,以免变成一系列简答题。
2。最好要求被试在新的情境下,应用知识去解决新伪问题。
3.题目不要过少或过大,数量要适当多些,内容要适当具体些。
4.要选用具有可接受的正确答案的题目 (并不是只有一个正确答案),不用那些仅测量意见和态度的问题。
5.在测验前,对每一个题目编制几个“理想”的答案。对部分正确的回答如何评分做出尽可能具体的规定。
6.一般不要有任选题,因为两个论文题目很难做到等值。
(六)应用题
在数学和自然科学中,常常以应用题作为测验题目。这种题目是叙述一个具体的情境并提出一些有关的数据,让被试解决所提出的问题。
应用题适合测验计算技能、数学和科学推理,以及运用知识到新情境中的能力。如果只要求正确答案,评分可以很客观。但如果对最后结果错误而方法正确或部分操作程序正确的题目给予一定分数的话,评分就不容易做到客观。
编写应用题要遵循以下原则:
1.题目的陈述要使被试明白让他干什么,答案应以什么形式出现,以及对单位和精确度的要求等。
2.题目中应包括对解题所需要的一切数据和信息,也可包含一些无关数据和信息。
3.采用新的情境和例子,不要重复过去己用过的。
4.应向被试指明是否要求写出解答步骤,以及对各个步骤详细到什么程度等。
5.对一个问题的答案不论正确与否,都不要影响另一个问题的解答。
6.文字要通俗易懂,不要变成阅读理解测验。
(七)操作题
在测验中有些项目是让被试实际操作,如画图,走迷津、拼配物体等。
制定操作项目的主要原则是,使被试明确知道要他们干什么和在什么条件下干,如使用什么工具以及时间限制等。
有些操作项目可以根据完成的数量和错误次数客观记分,有些项目的评分则较为困难。在后一种情况下,事先要向被试说明评分标准,最好把整个操作分解成许多部分技能,并分别定出给分标准。
(八)联想题
联想题是让被试把与某个事物有关的事物写出来,例如,“说出所有圆形的东西”,“举出砖头所有可能的用途”等。此种题召能够考察发散思维能力,其缺点是评分不易有客观标准。
(九)排列题
依据时间,大小或其他原则,把测题中所列的项目重新排列一下顺序。此种题目评分较为客观,但应用范围有限。
(十)改错题
改正错误的字词,内容或逻辑错误等。
上述几种题目形式不是彼此对立,而是相互补充的,不同的内容可以采用同一种题目形式。同一个内容,根据需要也可以用不同形式的题目来表达。譬如对美国的首都这一内容就可以用下边几种形式来测量:
美国的首都在哪? (简答题)
美国的首都是 。(填空题)
美国的首都是纽约。是口非口(是非题)
美国的首都是: (A)纽约 (华盛顿 (C)伦敦 (D)巴黎 (多选题)。
还可以编成匹配题:
( 1、美国 A、巴黎
( 2、英国 B、纽约
( 3、法国 C、柏林
( 4、德国 D、伦敦
E、华盛顿
题目的种类远不止这些,根据测量的目的和内容还可以设计出各种形式的题目。
不同形式的题目各有利弊。迄今为止,还没有一种题目能全面考察能力,学绩和人格的所有方面,这就要设计者根据不同情况,将各种形式互相配合,灵活掌握。运用之妙,存乎一心。如果墨守成规,就要事倍功半。题目形式是人创造出来的,只有敢于创新,才能使科学不断发展。
第四章 心理测量的误差
前面我们已经讨论了什么是测验,以及如何编制测验,现在转入研究什么是一个好的测验。
无论何种测量工具,我们对它起码的要求是稳定,准确。用心理测量学的术语来说,就是要可信和有效。所谓可信是指多次测量的结果是一致的,所谓有效是指正确地测量了所要测的东西。信度是测量一致性程度的估计,效度是测量准确性程度的估计。
关于测量的信度和效度问题,下边有专章分别讨论。为了考察测量的信度和效度,首先要了解测量的误差。
第一节 什么是误差
一、误差的定义和种类
误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。
这个定义包含两层意思,1)误差是由与测量目的无关的变因引起的,2)误差是不准确或不一致的测量结果。
定义的后一部分又从准确性和一致性两方面对误差做了区分。准确性与一致性的关系可以用射击靶环来说明。假设有A、B、C三支枪,对准靶面中心固定位置后各放9枪,所得结果如图4—1。
A枪弹着点十分分散,说明准确性和一致性都不好,B枪弹着点虽然比较集中,但偏离靶心,说明一致性好,准确性差:枪弹着点全部集中在靶心,说明一致性和准确性都好。
图4—1的A和B显示了两种主要的误差形式。 一种是随机误差,又叫可变误差,这是由与测量目的无关的偶然因素引起而又不易控制的误差,它使多次测量产生了不一致的结果。此种误差的方向和大小的变化完全是随机的,无规律可循。例如几个人用同杆秤称同一件东西,由于秤杆高低掌握的不同,所产生的不一致即属随机误差。另一种是系统误差,又叫常定误差,这是由与测量目的无关的变因引起的一种恒定而有规律的效应,稳定地存在于每一次测量中,此时测值虽然一致,但不正确。如有的奸商在秤盘或秤砣上搞鬼,一斤多(或少)一两,二斤多(或少)二两,这就是系统误差。可见,系统误差只影响测值的准确性,而随机误差既影响准确性又影响一致性。这就是说,系统误差只与效度有关,而随机误差与效度、信度都有关。
二、真分数
在测量理论中,真分数是个重要概念。所谓真分数就是一个测量工具在测量没有误差时, 所得到的纯正值。这实际上是个循环定义,因为一个量具若测得真值,便没有误差。真分数的操作定义是,经过无数次测量所得的平均值。可见,真分数是一个在理论上构想出来的概念,在实际测量中是得不到的,因为一个测量工具无论多么精确,也会有误差,我们只能通过改进量具来接近真值,而不能完全得到它。
真分数的定义表明,一个人在一个测验上所得的分数,既是他的真分数的函数,也是测量误差的函数,用公式表示如下:X=T+E (4。1)
这里X为实得分数或观测分数,T是假设的真分数,E是测量误差。
需要说明的是,这里的测量误差(E)指的是引起测量不一致性的变因产生的效应,即指随机误差,不包括系统误差,后者不引起分数的改变,因而包含在真值中。
在公式4。1中,E可能是正的,也可能是负的。这就是说,一个人的实得分数可能大于真实量,也可能小于真实量,总是围绕着真值上下波动。
关于测量误差(E)有以下假设:
1)如果对一个人测量无数次,其平均误差为0,即 =0
2)真分数和测量误差是相互独立的,即rTE=0
3)误差分数和实得分数的相关为0,即rEX=0
公式4。1只表明了在一个特定人身上实得分数、真分数和测量误差之间的关系。在一个团体中,由于每个人的误差都是随机的,方向不同,只要团体足够大,其误差便会互相抵消。因此,一个团体的平均真分数T等于该团体中所有被试实得分数的平均值X。证明如下:
(T=X—E) (ΣE=)0
对于一个团体来说,实得分数,真分数和测量误差之间有如下关系:
即实得分数的变异数:真分数的变异数加上误差变异数。
公式4。2并不难证明:
以上推导过程。可参看统计学中求和方差的公式。当X=Xl+X 2时,如果Xl 和X 2均为正态分布,则 和数的方差为 公式。
公式4。2只涉及到随机误差的变异,系统误差的变异包含在真分数的变异中。这就是说,真变异数还可以分成两个部分,与测量目的有关的变异和与测量目的无关的变异,即
(4。3)
式中的 是与测量目的有关的(亦即有效的)变异数, 是与测量目的无关但却是稳定的变异数。 是由所要测量的变因引起的, 是由其它变因引起的。将公式(4.3)代入公式?(4.2)得到如下公式:
(4。4)
这就是说,一组测验分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和潞盛误鏊盛异数所决定的。
第二节 误差的来源
一个测验要准确可靠,必须控制各种误差,为此首先要了解误差的来源。
根据误差定义,任何变因只要与测量目的无关,并使得结果不准确、不一致,便可认为是一种误差因素。在心理测量中,
常见的误差来源于三个