戴版《心理与教育测量》课后习题及解答11 下载本文

合起来,可使被试与最接近的群体进行比较。因为各个具体群体在某些方面是独特的,它的成员将与测验手册所列的常模团体成员不符。所以,依据一般常模解释所得的结论可能不够恰当,如果将两者结合使用,解释分数便会更加准确。但特殊常模只提供有关特殊信息,适用范围较窄。所得结论不能在广泛的背景作解释。 第八章 心理与教育测验的编制与实施>>练习与思考

1.结合实例简述编制一个心理测验的基本程序。2.阐述实施心理测验应注意的问题。 3.如何正确解释测验分数的意义。4.论述向当事人报告测验分数的基本原则。 解答要点:

1.编制一个可供使用的标准化的心理与教育测验,一般要经过以下几个步骤:①确定测验目的。②制定编题计划。③编辑测验项目。④预测与分析。⑤合成测验。 ⑥测验标准化。 ⑦鉴定测验。 ⑧编写测验说明书。

2.①施测前应做好准备工作;②指导语应不要暗示受测者应该选什么;③进行测验时不能受到外界和施测者的干扰; ④评分时要客观公正。

3.①主试应充分了解测验的性质与功能。②对导致测验结果的原因的解释应慎重,谨防片面极端。③必须充分估计测验的常模和效度的局限性。④解释分数应参考其他有关资料。⑤对测验分数应以\一段分数\来解释,而不应以\特定的数值\来解释。⑥对来自不同测验的分数不能直接加以比较。

4.①使用当事人所理解的语言。 ②要保证当事人知道这个测验测量或预测什么,这里并不需要作详细的技术性解释。 ③如果分数是以常模为参考的,就要使当事人知道他是和什么团体在进行比较。④要使当事人认识到分数只是一个估计。⑤要使当事人知道如何运用他的分数。⑥要考虑测验分数将给受测者带来什么影响。⑦测验结果应向无关的人员保密。 ⑧对低分者的解释应谨慎小心。⑨报告测验分数时应设法了解当事人的心理感受,并采取适当的措施加以引导。 第十章 目标参照测验>>练习与思考

1.请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目的取舍。 2.目标参照测验的题目区分度可以通过哪些方法来确定?

3.目标参照测验的信度与效度为何不适宜以相关系数作为评价指标? 4.试比较目标参照测验与常模参照测验的异同。

5.试分析内容范围的界定在目标参照测验的标准化过程中的重要性。 6.试分析分数分界点在目标参照测验的质量评估中的作用。 7.试分析题目内容效度与目标参照测验的内容效度间的联系。 解答要点:

1.首先进行专家的取舍。由于第二位专家在所有题目上所评等级与各等级平均数之间的差异之和较大,因此可以不考虑该专家的意见,只保留另外八位专家的评定结果,并重新计算这八位专家评定结果的等级平均数。

其次根据八位专家评定结果的等级平均数对每道题目进行评定,并决定题目的取舍。等级平均数越高,说明题目内容与其欲测量的目标内容之间的匹配程度越高,即内容效度越高。题目2、7、14、4、12、5、11的内容效度很高(等级平均值均在4以上),可以得到完整的保留;题目1、3、6、9的内容效度较高(等级平均值均在3-4之间),适当修改后即可;题目8、13、10的内容效度较差(等级平均值均在3以下),一般需做较大修改或直接删除。

2.目标参照测验的题目区分度可以通过计算题目的难度差值和题目得分与测验总分之间的相关系数来表示。难度差值包括掌握组-未掌握组鉴别指数和个人获得指数两种。

3.相关系数受到受测者团体异质性的影响,团体的异质性越高,测验分数的分布就越广,所计算出来的相关系数就接近真实值。由于目标参照测验的目的在于了解个体在所测内容上的掌握水平,因此大多数情况下,被试团体在目标参照测验上的分数分布比较集中,并且绝大多数被试都能够达到所要求的水平。如果用相关系数作为信效度指标,由于受到分数分布的影响,即使该测验本身具有较高的稳定性和一致性,所得的信度系数也会和低,所以目标参照测验的信度与效度不适宜以相关系数作为评价指标。

4.常模参照测验的目的在于度量和比较个体之间的差异,并以被试在团体中的相对位置来评价和解释测量结果。目标参照测验的主要目的则在于了解个体在所规定的测量内容上的行为水平,其出发点是个体本身的绝对水平,而不再是个体间的水平差异。由于测验性质的不同和受测人群可能存在的差异,两种测验的项目分析和信效度评估需采用不同的方法和评价指标。另外,目标参照测验通常要根据切割分数线对被试进行分类,所以在目标参照测验中对分数分界点的确定具有十分重要的意义。

5.从目标参照测验的定义来看,构成测验的各个项目是否合适,测验是否有效,测验的分数是否能够得到有意义而准确的解释,这一切的前提都在于测验有没有明确的目的以及与之相应的严格界定的内容范围。因此对于目标参照测验而言,测验编制的前期过程,尤其是内容范围的确定十分重要。

6.在目标参照测验的实际应用中,常常要根据分数分界点来判断某考生是否达到了升一个年级或毕业所要求掌握的最低知识技能水平,或者是否达到了从事特定专业工作所需的最低水平。这个分数分界点的确定科学与否,直接决定了我们最终决策的正确与否。因此分数分界点在目标参照测验的质量评估中具有十分重要的作用。

7.题目内容效度与目标参照测验的内容效度之间有着重要的联系。要确定目标参照测验是否有效,必须首先要对构成测验的每一个题目是否合适以及有效性进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性。目标参照测验注重被试在其所测内容范围内的掌握程度,测验本身的题目组成对其欲测的内容范围的覆盖程度或代表性程度--即测验的内容效度-- 显得尤其重要。

第十一章 学绩测验>>练习与思考

1.结合实际的测验例子试述学绩测验的性质和作用。

2.就《心理与教育测量》前10章内容,设计一份测验编制计划。(此题为思考题) 3.标准化学绩测验的标准化要求有哪些?如何才能做到? 4.举例说明诊断测验如何实现它的诊断功能? (此题为思考题) 5.题库的基本要求是哪些?你认为建设题库有些什么好处? 6.就你的经验谈谈教师自编测验存在哪些不是?改进的途径是什么? 解答要点:

1.学绩测验是对个体在一个阶段的学习或训练之后知识、技能的发展水平的测定,学绩测验与能力测验一样在测量学中属于最佳行为测验,其所测对象为个体的认知性心理品质,主要包括知识能力两个方面。学绩测验有时也用来预测被试在今后的学习或工作中的成就,但是它与一般的性向测验有所不同。

学校使用学绩测验鉴定学生的学绩成绩以及辅助本学校的教学管理;现代社会的人事管理中的人员取录、晋职提级常以学绩测验成绩作为重要的评价标准;教育科学研究工作者利用学绩测验信息评价教育决策、优选教育方案。 3.标准化学绩测验的标准化要求包括:

(一)命题组卷标准化。标准化试卷的试题测量目标明确,语词意义清晰、试题难度、区分度达到规定标准。全卷的结构与测量的目标一致,题型比例恰当,题量适度,试题难度分布符合规定要求,试卷的信、效度都达到规定标准。 (二)施测标准化。标准化测验必须在统一标准的环境下施测,统一标准环境包括测验场所的标准统一、测验时间统一、测验的指导语统一、提供给考生的测验材料统一、材料出示的顺序统一。

(三)评分标准化。标准化测验的答案要正确、规范、唯一,评分规则应尽量细致、客观、最好是没有伸缩性。 (四)测验分数解释标准化。对于常模参照测验,必须编制好测验常模;对于目标参照测验必须认真研究教材和教学大纲,分析合格标准的确切含义,通过调整试卷难度结构准确划定合格分数线。

5.题库的基本要求包括:(1)植基于一种科学的测量理论;(2)储备有一定数量的试题,所有试题品质优良,技术参数完备; (3)题库内容结构层次清楚、分类严谨,试题检索方便;(4)题库管理方便、可控性强、易于维护更新; (5)保密性强,应用题库组拼标准化学绩测验的试卷,具有经济、高效、保密性强等优点。

6.(一)教师要深入研究教材,深入调查学生。仅凭经验命题容易形成所测内容往往只涉及自己熟悉的或自己注重的内容,考试对象只以自己熟悉的或亲近学生为代表,这样会造成命题试卷内容部全面,或脱离学生实际。 (二)要维护准确稳定的合格标准。所谓准确就是要保证凡被评为合格的学生

确实都是达到教学基本要求的人,凡被评为部合格的学生确实是未达到学科基本要求的人,要尽量减少误判之处;所谓稳定,就是在各次测验中都维持同一个合格标准,不能忽高忽低。

(三)要客观评价自己的命题技术,合理使用各种题型。定向反应型试题命题技术要求比较高,没有一定的命题经验和技术,编写定向反应型试题,有时反而会达不到预期的要求。

(四)要注意总结命题经验,提高命题技术。教师要通过不断总结成功、反思失败,逐渐掌握命题的各种技巧。总结命题经验还具体包括不断积聚优秀试题,不断充实个人的题库。

(五)要尽量控制评分误差,防止简单粗糙。教师自编测验应防止评分简单粗糙、草率从事,要防止简单地以对错判分,特别是对于自由反应型试题评分应详细分析学生的作答过程,评价他的思维方式和思维水平。

(六)要做一些定量分析研究。教师在自编测验施测后对试卷做一些定量的分析研究,比如计算试题难度、区分度、信度、效度等,可以逐步总结命题经验,提高命题技术。 第十二章 能力测验(上)>>练习与思考

1.试谈智力测验的效度问题。2.智力测验的功能是什么?3.为什么说\智力测验前并非人人平等\? 4.试析智力测验存在的合理性。5.试析智力的形式与发展过程中的遗传与环境的关系。(此题为思考题)

解答要点:1.结构效度方面,传统的智力测验是在智力G因素论的基础上编制的,但G因素论仍存在很多问题。关于智力测验的结构效度,目前只能做狭义的解释,即以不同智力理论模型为基础的智力测验,其结构效度应具备不同的含义,并且最终对测验结果的解释也相应不同。

预测效度方面,智力测验对个体的未来成就进行预测时,首先假定所测的智力是个体相当稳定的特质。但事实上智力会因为某些因素而发生变化。由于智力的可变性,利用智力测验来预测个体今后的可能成功程度的效能有被夸大的可能。 2.传统智力测验的功能是对智力的个体差异的测量,在实际应用中常常行使将人群分类的功能。传统智力测验也常被用做预测源测验行使预测的功能。

3.智力测验存在着性别差异、职业差异文化和教育差异。

有研究表明男性和女性在不同的能力因素上存在着差异。而一般的智力测验都包括多种性质的题目,有些可能更适于男性,有些则更适于女性,因此智力测验本身的内容和结构对男女两性未必公平。

关于智力的职业差异的异类研究表明不同职业的人在智商上具有明显的差异,这可能是由于传统的智力测验并不能全面反映人的各方面能力的原因。而仅以智商高低来判断人的智愚也是不充分的。

智力测验结果反映出来的城乡差异和种族差异,并不能完全归因于城乡或种族本身由遗传引起的差异,事实上文化和教育因素可能在此起了主导作用。

4.智力具有稳定性,这种稳定性表现在个体智力在其相应团体中的相对位置长时期内保持稳定,个体智力的相对稳定性为智力测验具有一定预测效度提供了可能性;智力测验被实践证明对学生和职业等效标的预测具有较好的效度,可以有效地帮助决策者提高决策正确率;尽管智力测验对不同团体可能存在不公平,但我们更应该看重其预测效度;至尽仍无更有效的智力评估工具。

第十三章 能力测验(下)>>练习与思考

1.能力倾向测验与智力才而言、成就测验之间有何不同? 2.能力倾向测验与特殊能力测验在应用上有何区别? 3.现在流行的创造力测验依据的理论基础是什么?

4.试分析社会发展与需要在能力测验的产生和发展中的影响。(此题为思考题) 5.试分析创造力的实质与表现。(此题为思考题) 解答要点:

1.成就测验是对个体过去学习经验的总结;智力测验的主要目的是预测,但它所做出的预测比较笼统,针对性较弱。能力倾向测验则是对个体在不同能力因素上潜在的优劣倾向的测量,它的预测的目的性更强,试图说明个体在多种能力上的潜在优势。

2.能力倾向测验可以从不同能力因素上来评估个体,但如果只用于测量某一种特殊的能力,成套的能力倾向测验就显得有些累赘,而且不够充分。特殊能力测验是针对一种特殊能力所包含的各个方面因素进行测量,其性质介于成就测验和能力测验之间,测量的目的既想了解个体在此专业领域的既有水平,又想预测个体今后在此专业领域成功的可能性。

3.现在流行的创造力测验依据的理论基础是吉尔福特的关于智力结构的理论。吉尔福特认为在智力操作维度上存在着聚合与发散两种不同类型的思维,而创造力的核心正是发散思维能力。 第十四章 人格测量>>练习与思考

1.试综合比较自陈量表和投射测验的异同。

2.查阅有关人格心理学著作,讨论人格的理论研究对发展人格测量技术的作用。(此题为思考题)

3.查阅有关文献,分析中国人格测量研究的现状和特点,并论述你对开展人格测量与研究工作的看法。(此题为思考题) 解答要点:1.自陈量表采用客观测验和纸笔测验的形式,事先根据操作性定义编制好许多有关某些人格特质的问题,要求受测者根据自己的实际情况逐一回答这些问题,并用此来衡量受测者在这些人格特质上的表现的一种人格测量工具。它的项目形式一般采用是非式,记分比较客观,施测较简单,测量分数容易解释。投射测验是向受测者提供一些未经组织的、意义模

糊的标准化刺激情景,让受测者在不受任何限制的情况下,自由地对刺激情景做出反应,然后分析这些反应,推断受测者的人格特征的一种人格测量手段。

投射测验的测验材料没有明确的结构和确切的意义,受测者对测验材料的反应不受限制,可以根据自己对测验材料的理解做任何想象式的解释。其测验的目的具有隐蔽性,测验结果的解释重在对受测者的人格特征获得整体性的了解,可广泛用于人格的跨文化研究。投射测验的最大局限在于记分上的困难,并难以进行定量分析。 第十五章 其他心理与教育测验>>练习与思考 1.如何理解焦虑?常用的焦虑测量工具有哪些?

2.职业兴趣测验的量表发展趋势是什么?如何评价职业兴趣测验在职业选择中的作用? 3.态度和品德测量的常用方法有哪些?优缺点何在? 解答要点:

1.焦虑是一种正常的、具有适应意义的负性情绪体验,它可以是一时的情绪状,也可以内化为稳定的个体情绪特质。严重的、持续的焦虑可能形成病态人格。常用的焦虑测量工具有《显性焦虑量表(MAS)》、《状态--特质焦虑量表(STAI)》、《测验焦虑量表(TAI)》、《贝克焦虑量表(BAI)》、《汉密顿焦虑量表(HAMA)》等。

2.职业兴趣量表后期主要是对先前的量表进行完善和修订,比如增加一些职业量表、增加问卷的有效性指标,寻求提高测验效度的办法等等。职业兴趣测验在职业选择中具有一定的指导和参考作用,其测验结果表示个体可能更适合于某类职业,而不适合于另一类职业。但注意兴趣是可以培养和改变的,所以职业兴趣测验的结果不能作为选择职业的唯一标准。 3.态度测量的常用方法有《等距量表》法、《利克特量表》法、《哥特曼量表》法等。

《瑟斯顿量表》在主题比较清楚、调查范围不广的态度问题调查上效果较好,其不足在于:制作过程复杂;用中位数代表态度等级不一定适合;专家的意见不一定能代表一般人;等距量表是否真正等距也不一定。《利克特量表》的优点是制作简单,而且能广泛接受与态度有关的项目;另外可通过增加项目提高效度,并允许受测者充分表达态度的强烈程度。不足在于相同的态度分数者可能持有不同的态度模式,从总分只能看出一个人的赞成程度,而无法对态度差异做进一步的解释。《哥特曼量表》法的优点是由单向性带来的态度分数与态度结构的一致性。缺点是编制困难。 品德测量的常用方法有情景测验法和问卷测量法等。

情景测验法的优点在于受测者参与测验的兴趣较高,主动性强,能够较具体、较真实地反映品德的某个方面的特征。缺点是涉及面窄,难以反应品德的多方面内容。问卷测量法的优点在于施测简单,标准化程度高,能够测量品德的多方面内容。缺点是由于品德问题过于复杂,难以测量以及这方面研究不够深入给问卷的编制带来了很大困难。 第十六章 测量的综合应用>>练习与思考

1. 心理与教育测量在心理咨询中的应用有哪些主要的应用领域?有哪些测验可以利用? 2.心理与教育测量在人事测评中有哪些主要应用领域?有哪些测验可以利用? 3.心理与教育测量在教育评价中有哪些主要应用领域?有哪些测验可以利用?

4.我国心理与教育测量在三种应用领域还有哪些要完善或填补空白的地方?(此题为思考题) 解答要点:

1. 心理与教育测量在心理咨询中主要应用于个人的自我认识、人生规划咨询以及心理障碍(神经症、人格障碍等)咨询等

领域。常用于个人的自我认识、人生规划咨询的测验主要有《卡特尔16种人格因素测验》、《YG性格测验》、《艾森克人格问卷》、智力测验、一般能力倾向成套测验和一些单项特殊能力测验。常用于心理障碍(神经症、人格障碍等)咨询方面的测验主要有《明尼苏达多项人格问卷》、《艾森克人格问卷》、《症状自评量表》等。

2.心理与教育测量在人事测评中主要应用于个人的心理特点的评估、人员培训后的心理特点评估和工作人员的效绩评估等领域。常用于个人的心理特点的评估的测验主要有《韦克斯勒智力测验》、《瑞文标准推理测验》、《斯特朗-坎贝尔兴趣问卷》、《库德兴趣调查表》、《卡特尔16种人格因素测验》、《YG性格测验》、《艾森克人格问卷》、以及一些专业知识技能测验和特殊能力测验。工作人员的效绩评估方面有PM量表。

3.心理与教育测量在教育评价中主要应用于测量学生的学习与发展状况、对教师与管理者的评价领域中。常用于测量学生的学习与发展状况的量表主要有哈特松的诚实测验、柯尔伯格的道德发展水平测验、成就动机量表、学习适应性量表、《韦克斯勒智力测验》、《瑞文标准推理测验》、《一般能力倾向成套测验》、《托伦特斯创造思维测验》、《学习能力测验》、《自我职业指导问卷》、《卡特尔16种人格因素测验》、《YG性格测验》、《艾森克人格问卷》等等。