一、填空及选择
⒈编题时要注意的要点:在能力和成就测验中所使用的时限,以大约90%的被试能在规定时间内完成测验为标准。
⒉标准化测量要求对测验结果进行客观计分。检验客观与否,可以以两个或两个以上受过训练的合格评分者所评结果之间的一致性作为指标。一般情况下,受过训练的评分者之间的平均一致性达到90%以上,我们就认为计分是客观的。
二、名词解释
指示语是在测量实施时说明测量进行方式以及如何回答问题的指导性语言。指示语通常有两种:一种是对被试的,另一种是给主试的。
三、简答及论述
⒈主试的职责。
主试,也称考官或主考人,是控制测试进程的主要人员。主试的经验如何往往会对测验的结果产生影响。对于个体测验、投射类测验、操作性测试和面试,主试的作用就更为重要。主试应做以下工作:
⑴测验前的准备工作。
预告测验。事先通知被试;
熟悉测验指示语。
准备测验材料。
熟悉测验的具体程序。
确保满意合适的测验环境。调整光线、通风、噪音水平等物理条件。另外,为防止作弊,还要妥善安排座位等。
⑵测验中主试的职责。
在测验中,主试的主要职责是按照指示语的要求实施测验,在被试询问指示语意义时,作进一步澄清,但注意不要作任何暗示。主试还要注意不要讲与测验无关的话。
⑶建立协调关系。
协调关系指的是主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。
⒉主试对测量结果的影响。
⑴主试的人格特点。
主试的不同特点对测验的实施及测验的评分等各环节都有影响。有些主试可能自己就不大善于建立和处理人际关系,对他来说在测验实施过程中与被试建立协调关系较为困难,因而由他施测的被试的测验结果可能就会受到影响。
⑵主试的期望。
在有些情况下,实验者所获得的资料及实验结果会受其本身期望的影响,这种现象称为罗森塔尔效应,也称实验者期望误差。
主试对测验结果的影响仍是有限的,是可以通过一定方法有效克服的。要力求做到测验实施过程的标准化,将主试的个人因素对测验结果的影响尽可能降到最低。
⒊被试特点对测量结果的影响。
⑴测验的技巧与练习因素。
测验的技巧。必要时,可以增加练习测验,使所有应试者同等程度地熟悉测验形式。
练习效应。练习因素所产生的影响可归纳为以下几点:
教育背景较差和经验较少者,其受练习因素的影响较为显著;
着重速度的测验,练习效果较为明显;
重复实施相同的测验,受练习影响的程度要大于施测复本测验;
练习的影响仅限于第一次及第二次重测,第二次以后的影响微不足道;
平均而言,练习因素影响的幅度约在0.2个标准差以下。
⑵焦虑和动机因素。
应试动机。被试参加测验的动机不同,会影响其回答问题的态度、注意力、持久性以及反应速度等,从而影响最后测量结果。
测验焦虑。焦虑是一种不愉快的、表现为焦急、恐惧和紧张的情绪体验,它主要是由于对可能出现的测验结果的担心或对应付测验结果的能力的担心而造成。大多数人在测验前和测验中感到焦虑,故又称测验焦虑或考试焦虑。
⑶反应定势。
也称反应的方式或反应风格,简单地说,就是每个人回答问题的习惯方式。由于每个人回答问题的习惯不同,可能会使有相同能力的被试获得不同的分数。影响测量结果的反应定势主要有以下几种:
求“快”与求“精确”的反应定势。有些被试反应特别谨慎,体现为求“精确”的反应定势;另外有些人则特别快而且粗心大意,这就是求“快”的反应定势。
反应时间应以90%的被试可以答完所有试题为准。
偏好正面叙述的反应定势。被试在无法确定“是非题”的正确答案时,选“是”的人多于选“非”的人。这种定势又称肯定反应定势。
偏好特殊位置的反应定势。被试如果完全不知道选择题的正确答案,则不会以完全随机的方式来决定该选择哪一个选项,而有偏好某一个位置的选项的倾向,也称位置定势。
偏好较长选项的反应定势。有人发现被试在无法确定正确答案时,有偏好选择较长选项的反应定势。
猜测的反应定势。
⒋猜测的校正。
⑴猜测修正的方法。
S=R-W/(n-1)
其中,S是正确分数,R为被试答对的题目数,W为被试答错的题目数,n选项数目。
计算:一份试卷由100个客观题组成,每题1分,每个客观题都有5个备选项,甲应试者完成了整份试卷,答对了70题,请问猜测修正后,甲得62.5分。另有乙完成了90题,也答对了70题,乙得65分。S甲=70-30/(5-1)=62.5;S乙=70-20/(5-1)=65。
⑵猜测修正的优缺点。
赞成使用猜测修正公式的人认为:
修正公式可避免减低测验的信度。
修正公式可以反映被试真正的能力水平。
使用修正公式对那些不能答完全部试题的被试来说比较公平。
反对使用猜测修正公式的人则认为:
公式假设不成立,答错试题,是因为观念模糊、记忆不清或粗心大意,并非乱猜。
只要所有被试能答完全部题目,或者是略去未答的题目数相同,则猜测修正无实质作用。
未采用猜测修正对信度并无重大影响。
实际生活中,常常需要仅凭部分知识来作判断,因此完全不许猜测也与实际生活不符。
⑶在编制测题时要注意:
选项数目要多,4-5项较合适;
题目数量加多;
时间要充裕;
经常以项目分析评鉴试题,并淘汰不好的试题。
⒌计分的一般程序。
⑴计分的基本步骤主要有三步:
①记录反应。②检索标准答案。③反应和标准答案的比较。
⑵问答题计分。
问答题的主要缺点是评分不够客观,也就是说问答题的计分经常受到评分者的情感、态度的影响。问答题中常见的误差有:宽容定势和晕轮效应。宽容定势指主试的计分过于宽松,即使没有回答出题目所要求的答案,评分者也给予较高的分数;晕轮效应指给予被试某道题较高分数仅仅是由于被试在另外一些试题上获得了高分,也就是说对被试的一般印象影响到具体某个问题的评价。
为了使问答题的计分更加客观和可信,主试应该首先考虑采用何种计分程序:整体计分还是分析计分。整体计分就是评分者根据总体印象给答案评一个总分。整体计分在实际中应用较为普遍。分析计分是给问答题的不同部分分派不同的权数,按照各部分的要求对答案中所包括的信息和技能评分,最后将各部分的权数和得分组合起来得到该问答题的分数。分析计分往往有答题的详细标准。
⑶客观题计分。
客观题的一个主要优点就是计分简单、客观。
信心权数:多大程度上在给出的答案是正确的。伊贝尔是非题加权方法是信心权数应用。