心理测量学复习要点 下载本文

(二)样本团体平均能力水平的影响

因为每个题目具有不同的难度,对幼年者和能力水平较低者,其信度值相对较低。 二、测验长度

(一)测验越长,测题取样或内容取样越有代表性 (二)测验越长,被试的猜测因素影响就越小。

(三)测验太长,有时反而会引起被试者疲劳和反感而降低可靠性。

通过斯皮尔曼--布朗公式的导出公式可计算出最少应增加的题数:(公式5--18)。 例:一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,问至少需要增加多少题目?

根据斯皮尔曼布朗公式:K=0.90(1—0.80)/ 0.80(1—0.90)=2.25

即要取得0.90的信度,测验长度就为原来的2.25,即需要增加40×2.25=50个题目。

三、测验难度 (地板效应与天花板效应)

洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,0.70;四择一测题,0.74;三择一测题,0.77;是非题,0.85。 只有平均难度水平为50%时,才能使测验分数分布范围最大。 四、时间间隔: 两次测验相隔时间越短,其信度系数越大 注意事项

斯皮尔曼-布朗公式为校正分半信度的经验公式,它的假设是两半测验分数的变异数相等。当假设不成立时,可以采用弗朗那根(Flanagan)公式或卢伦(kulon)公式之一,直接求得测验的信度系数。

对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干个相对异质的分测验。 第四节 测验的效度

[美国心理学会在1974年发行的《教育与心理测量之标准》一书中将效度分为:(1)内容效度;(2)构想效度;(3)效标效度。]

第一单元 效度的概念(有效性或者说准确性)一、效度的定义 :

在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。(是科学测量工具重要的必备条件)。

因为测验分数的总方差等于真实方差与误差方差之和(公式5-8),而真实方差又分成两部分,即有关方差与无关的但稳定的方差:(公式5-19) 以公式5-19代入公式5-8得:(公式5-20)

在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率,即:(公式5--21) 二、效度的性质 1.效度具有相对性

任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。

[效度具有相对性,在评鉴测验的效度时,必须考虑测验的(目的)与(功能)。] 2.效度具有连续性

测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。效度是针对测验结果的。

测验效度是“测验结果”的有效性程度。 第二单元 效度评估的方法

一、内容效度(content-related validity)

㈠什么是内容效度: 内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。 ㈡内容效度的评估方法:(确定) 1.专家判断法 (描述性语言)

请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。由这种估计效度的方法,是一个逻辑分析的过程,所以内容效度又称“逻辑效度”。

为了使内容效度内容确定过程更为客观,弥补专家的不足,可采用如下几个步骤: (1)定义好测验内容的总体范围,描述有关的知识与技能及所用材料的来源;

(2)编制双向细目,确定内容和技能各自所占比例,并由测验编制者确定各题所测是何种内容与技能;

(3)制定评定量表来测量测验的整个效度。

2.统计分析法 :包括(1)对评分者一致性的评定;(2)两个测验复本的相关性和课程内容的学习等分析;(3)再测法。 3.经验推测法 :通过实践来检验效度。

㈢内容效度的特性: 内容效度经常与表面效度(face validity)混淆。表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西;内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价而建立的。

[最高行为测验注重表面效度,测典型行为时则应该把表面效度降低,尽量不让你知道在测试的内容。这就是内容效度与表面效度的区别。] 二、构想效度(construct-related validity)

㈠构想效度指(1)测验能够测量到理论上的构想或特质的程度,(2)即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。(3)涉及的是心理学的理论概念问题。(4)构思效度。 ㈡构想效度的估计方法:

1.对测验本身的分析:[可以作为构想效度的证据有:①测验的内容有效;②测验内部一致性;③被试者对题目的反应特点]

2.测验间的相互比较:[(1)相容效度:与其他测量同一构思的测验有相关;(2)区分效度:与测量不同构思的测验无相关:(3)因素分析法:种因素与原先的理论构思一致,则说明构思效度很高。) 3.效标效度的研究证明 4.实验法和观察法证实

三、效标效度(criterion-related validity) ㈠什么是效标效度

效标效度又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类。 一个好的效标必须具备以下条件:

①效标必须能最有效地反映测验的目标,即效标测量本身必须有效; ②效标必须具有较高的信度,稳定可靠,不随时间等因素而变化; ③效标可以客观地加以测量,可用数据或等级来表示; ④效标测量的方法简单,省时省力,经济实用。 ㈡效标效度的评估方法

1.相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。

[效度系数的计算:①积差相关法;②点二列公式;③二列公式; ④贾思朋多系列公式。]

2.区分法:区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。

3.命中率法 : 命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。四种情况:预测成功而且实际也成功;预测成功但实际上失败;预测失败而事实成功;预测失败且实际上也失败。称正确的预测为命中,不正确的预测为失误。

命中率高低常随划分测验分数成功与失败的临界分数的高低面变化。临界分数越高,正命中率也越高;反之,临界分数越低,则正命中率也越低。 第三单元 效度的功能

一、预测误差 : 效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。

二、预测效标分数 :如果X与Y两变量呈直线相关,只要确定出二者间的回归方程,就可以从一个变量推估出另一个变量。 三、预测效率指数 E=100(1-K)

预测效率指数E值的大小表明使用测验比盲目猜测能减少误差,如一个测验的效度系数为0、80,E=40,这表明由于该测验的使用,使得我们在估计被试的效标分数时减少了(40)的误差。

第四单元 影响效度的因素