測验的效度
―个測验最重要的问题是它的效度。如一个測验真正能准确地测量到它所欲测量的东西,这个测验就谓之有效,或说这个测验效度高。要编制一个有效的测验,必须根据测量目标审慎地选择测验材料。譬如编制智力测验时,不可选用专门知识的材料,即使所选用的材料是知识性的,也要是一般人都知晓的。
效度可以归纳为三:内容效度、结构效度和准则关联效度。内容效度所探讨的是测题取样的代表性问题,而结构效度在智力测验上所研究的是智力的结构与测验的测值对应的程度问题。訾如人们往往把新编好的测验实施于一组被试所得的分数与该组被试在举世公认的智力测验一斯坦福一比纳智力量表上的得分计与相关,如果相关高,就取得结构效度的证据。原因是既然新编的测验与斯坦福一比纳智力量表所测的智力相关高,那就说明该测验与它有共同因素,此共同因素就是智力。
准则关联效度又可称为经验效度或统计效度,它是以测验分数和效度准则之间的相关系数来表示测验的效度的高低。效度化中有关的准则,就是用足以显示测验所飲測量的特质的变量或足以显示测验所欲预測的变量作为检验效度的参照尺度。例如智力测验的效度检定,可选用学生学业成绩或教师评定的等第作为准则,计与测验分数与这些准则变量之间的相关。这些资料是现在就存在的,所以此种效度称为同时效度。同时效度通常与心理特质的评估与诊断有关,大多视理测验手册上所提供的效度资料都属于此类。
然而,人们往往最感兴趣的是对被试在效度化中的有关准则作业的预测,测验分数之所以重要只是因为它能预测到该项准则。在这样的情况下,测验作为预测变量(自变量)对于准则变量(即应变量)能预测得多高的准确性,称为预测效度。譬如,一项能力测验的成绩的效度准则是实际工作的成果,为此运用追踪的方法对被试将来的行为作长期的观察、考核记录,以积累的资料与当初的能力测验的成绩分数计与相关,以评价该能力測验成绩对将来成就的预测有效性。
测验的信度和效度是评价一个编制好的测验的可靠性与有效性的指标,因此,人们在使用测验时就要了解它的信度和效度。信度高则测量误差小,否则误差就大;效度高则预测误差小,反之预测误差就大。一般说来,信度系数不宜低于9,但效度系数就很难讲出多大的数值才与有效,这是因为效度的情况特定性更为显著,一般情况下,其数值在0.4至~0.7之间。