第5章 信度
1、 信度是指:测量结果的可靠性和一致性。因为心理测验通常测量人的行为,行为会由于各种各样的原因,因时、因事、因地而产生变动,这些因素有些是偶然的,有些是固有的,人在完成心理测验时的行为也会受上述因素的影响,从而使测验结果与真实结果不完全一致,所以我们要用信度来衡量测验的可靠性和一致性。
2、 信度的操作化定义:
(1) 误差理论认为:一个人的测验分数X是由真实分数(T)和误差(E)两部分构成的,公式是X = T + E。
(2) 因此信度就被定义为:一组测量分数的真实方差与实得方差的比,或者是指真实方差占总方差的百分比。公式为:rxx = 1-SE 2/SX 2
(3) 根据统计学理论,真实方差与实得方差的比是一个相关系数的平方,所以我们把这种相关系数的平方叫做信度系数。
(4)计算公式为:rxx = ST2/SX2
3、 由于误差的来源信度的可分为:这种分类是基于信度的传统定义-真分数理论。
(1) 重测信度:考虑的误差来源是时间取样。
(2) 复本信度:考虑的误差来源是内容取样。
(3) 分半信度:它考虑的误差来源也是内容取样,它与复本信度的差别是:分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。
(4) 同质性信度(内部一致性系数):考虑的是测验内容是否异质。
(5)评分者信度:考虑的误差来源是评分者间的差别。
4、 信度的表示方法:
(1) 信度系数和信度指数:
1 信度系数:rxx = rx2T = S2T/S2
2 信度指数:rXT = ST/SX
(2) 测量标准误:SE = SX 1-rxx
5、 信度的意义:
(1) 信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。它直接告诉我们测量的误差有多大。
(2) 测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内,并且可以预测实得分数再测时可能的变化情况。
6、 信度的作用:
(1) 解释预测个人分数的意义。
(2) 解释真实分数与实得分数间的关系,明确告诉我们测验误差大小。
(3) 新编的测验信度应高于原有的同类测验或相似测验。
(4)下结论说某测验比较可靠,必须是依据情境的,经多次证实的。
(5) 它是确定测验好坏的一个指标。一般的原则是:
1 当rxx< 0.70时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。
2 当0.70≤rxx<0.85时,可用于团体比较。
3 当rxx ≥0.85时,才可以用来鉴别或预测个人成绩或作用
7、 重测信度:有时也叫稳定性,主要针对时间变量。
(1) 重测信度采集数据得方法是:对同一组被试间隔一定的时间重复测试一次。
(4) 重测信度的计算方法是积差相关法,因而rxx就是皮尔逊的积差相关系数。
(7) 重测信度的时间间隔选择依测验性质和目的而定,如果测验是用于长期预测,则测量间隔长一些。对儿童的智力测验一般是两周到四周为宜。对成年人,间隔可到半年,很少超过6个月。
(13)使用重测信度应注意:不是所有测验都可以计算重测信度。并且重测信度只是反映了随机误差的影响,而不是反映被试心理特点的长期变化。
8、 复本信度:又叫等值性系数。
(1) 数据采集方法是:给被试施测两个内容等值但题目不同的测验,求两组数值的相关。计算方法常见的也是积差相关法。
(2) 复本信度的高低反映了两个互为复本的测验等价的程度,而不是反映一个测验本身受随机误差影响的大小。复本信度的高低关键取决于复本测验的选择,因而施题目取样问题,或者说是测验的内容取样问题。
(3)复本信度优于重测信度的地方是:避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。
(4)复本信度的缺点:有些测验的复本很难找到;有些测验因正迁移效应使测验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。
(5)重测复本信度,即再不同的时间里施测两个等值的测验(复本),得到的相关就是重测复本信度,也叫稳定等值系数。它比单一的重测信度或复本信度都要严格、全面一些。
9、 斯皮尔曼-布朗公式:rnn = nrtt/1 +(n-13、 1)rtt,14、 rnn是校正以后的相关系数,15、 rtt是实得的相关系数,16、 n为rnn对应的测验长度与rtt 对应的测验长度之比。分半时,17、 n = N/(N/2)= 2(N为测验全长),18、 所以分半法信度的校正公式是:rxx = 2 rnn/1 + rhh 其中rhh为两半测验的相关系数。
(1) 卢伦公式:rxx = 1-Sd2/Sx2 其中Sd2是两半测验分数之差的方差,Sx2为总方差。
(2) 从理论上分析,分半信度反映的实际上是两半测验能够测量相同内容或心理特点的程度。
10、 内部一致性信度(同质性信度):同质性是指测验的所有题目间性质的一致性,即测的是同一种心理特质或行为。同质性是测量单一特质的必要条件。这里讲的同质性是指测验题目得分反映的心理特质一致,同质性的判别标准是:题目间呈高正相关,如果相关很低或是呈负相关,则题目为异质。
(1) 库德和里查德森提出的K-R20公式只适合预测题目是二分法计分的。克伦巴赫α系数适合于非二分法计分的测验的内部一致性信度估计法。
(2) 从同质性信度的含义我们不难看出,分半信度是求测验两半之间的一致性或同质性,而同质性是求所有题目间的一致性。因此分半信度实际上是同质性信度的一种,可以作为测验同质性评价的粗略估计指标。因为可以根据测验得分来推论或验证某种概念或理论构思,因此同质性信度也是一种构思效度,或叫结构效度,它实际上介于信度与效度之间。
11、 评分者信度:有些心理测验的得分不是根据客观的计分系统计分的,是由评分者来给被试打分,因此,这样的测验的可靠性如何取决于评分者评分的一致性和稳定性如何。
评分者信度因评分者人数不同而估计方法不一样。如果是两个评分者,独立对被试的反应评分,则可以用积差相关来计算,或用斯皮尔曼等级相关法计算。如果评分者在三人以上,而且是等级评分,则可以用“肯德尔和谐系数”(W)来求评分者信度。
12、 以测量标准误表示信度的好处是:
(1) 信度的单位与测验分数的单位相同,因此解释个人分数时非常直接,能直接指出允许测验分数变化的范围。
(2) 测验同质与否并不影响测量标准误的大小。测量标准误的不足之处时:无法比较不同测验间的信度高低。比较不同测验的信度用信度系数(rxx)解释个人分数时用测量标准误(SE)。
13、 常见的影响信度的因素有:样本特征、测验的长度、测验的难度、测量的时间间隔等。
14、 我们做信度考验时,常常选取一个与常模样本性质相同的样本施测,根据被试得分求出信度系数。
(1) 样本团体得分分布的影响:求信度的样本团体得分分布如果比较窄小的话信度就低。
(2) 样本团体异质性的影响:样本团体异质的话,测验分数的分布就比同质样本的要广,分数的离差就大,样本的方差就大,信度就高。实际上,高信度可能是假性高信度,是由样本团体的异质造成的。但如果常模总体要求各种各样的人,则异质的信度样本求得的信度就是真信度。这时,相反的情况就需要校正信度。
(3)样本团体平均能力水平的影响。由于信度也会因样本间团体平均能力水平的不同而不同,因此在求信度时,一定要注意信度样本与常模总体间是否一致。
15、 测验的长度:在其他条件均等的情况下,测验越长,信度越高。原因在于:
(1) 测验越长,即题目越多,测验的内容取样就越有可能有代表性。
(2) 测验越长,被试的猜测因素影响就越小。
16、 测验的难度:难度对信度的影响之存在于某些测验中,如智力测验、成就测验、能力倾向测验、教育测验等。测验的难度对信度有间接影响,因为如果测验过难,被试的得分会集中在低分区。过于容易,分数则集中在高分区。两种情况都使信度样本的得分范围变窄,变异量降低,从而低估测验信度。
17、 测验的时间间隔:这一因素之对重测信度和不同时测量时的复本信度有影响,对其余的信度来说不存在时间间隔问题。