标准分数常称为Z分数,它是以标准差为单位表示一个分数在团体中所处位置的相对位置量数.标准分数在学生教育评价中常有以下五种应用:纵横比较、成绩等级化、标准转化、等级比例确定、品质评定数量化.
基础教育新课程改革注重对全体学生全面发展的教育,我们如何科学、合理地评价学生关系到学生的终身发展,也关系到新课程改革的成败,利用学生的各项标准分数对学生进行教育评价不失为一种科学有效的办法之一.标准分数常称为Z分数,它是以标准差为单位表示一个分数在团体中所处位置的相对位置量数.学生考试后教师按照评分标准对其作答反应直接评出来的分数,叫原始分.原始分反映了考生答对题目的个数,或作答正确的程度.但是,原始分一般不能直接反映出考生间差异状况,不能刻划出考生相互比较后所处的地位,而标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的分数.
标准分数有如下四条性质:一是任何一批原始分数转化为Z分数后,这批Z分数的平均值为0,标准差为1,二是标准分数Z量表的单位是相等的,其零点是相对的,分数之间等距,不同科目的Z分数具有较好的可比性和可加性;三是原始分转换为标准分是线性转换,不会改变原始分的分布形状,也不改变原来分数的位置次序;四是在一般的情况下,标准分数Z的取值范围在-3到+3之间,Z分数的意义可用正态分布曲线下的面积比例(本质上是概率值)做出最好的解释.标准分数有正有负,若标准分数为正,则原始分大于平均分数,若标准分数为负,则原始分小于平均分数,若标准分数为零,则原始分数等于平均分数.标准分数的绝对值越大,则说明原始分数离开平均分数越远.标准分数在学生教育评价中常有以下五种应用:纵横比较、成绩等级化、标准转化、等级比例确定、品质评定数量化.
1 纵横比较
纵横比较是利用标准分数在学生教育评价中最常见的一种应用,它主要应用于对同一学生的不同学科成绩,或对不同学生的同一学科成绩或各科总成绩作横向比较与评价;也可用于对同一学生同一学科不同阶段,或对不同年级的学生的某一科成绩或总成绩作纵向比较与评价.例如:某学校高一的张三与高二的李四在学年期末考试中语文、数学、英语三科成绩如下,张三:语文95分、数学90分、英语85分;李四:语文90分、数学85分、英语80分.问张三与李四谁考得好?李四哪一科最好?如果按照原始分累加,明显张三比李四考得好,李四的语文科最好.但是我们知道不同考试科目试题的难易程度不同,各门学科的成绩分数是不等价的,数据不同质,正如甲乙两人都有300元钞票,而甲拥有的是300元人民币,乙拥有的是300美元,两人的财富明显不等.因此用原始分说不清楚张三李四谁好谁弱.但如果根据年级各科的平均分和标准差计算出两人的各科标准分数,我们就能很容易判断两人谁更优,如表1.
表1:(注:表中平均分、标准差均代表年级,且假设高一、高二年级总人数大致相等)
由表1可知,因为李四各科标准分总和3.6大于张三各科标准分总和2.5,说明李四在高二年级的排位要比张三在高一年级的排位更靠前,因此李四比张三考得更好.又因为李四的数学标准分大于其语文和英语的标准分,所以李四的数学科考得最好.从而利用标准分数实现了不同年级、不同学科之间的纵横比较.
2 成绩等级化
根据统计学的正态分布理论,任一个标准分数都与之对应一个百分数,这个百分数还能说明比其差的人有占总体的这个百分数这么多,由此可估计该学生在其群体中的大致位置,弥补了由学生原始分无法知道该生在团体中的地位的缺陷,从而根据学生的标准分数实现了学生成绩等级化.例如:学生甲在一次数学考试中考出90分的成绩,我们无法知道学生甲到底考得怎样,因为这与试题的难度有关,与总体考生的分数有关.但如果我们知道学生甲在这次考试中的标准分数为Z=1,则我们就知道学生甲在这次考试中在其班上的大致位置,因为我们知道在正常的情况下,一个班的学生的考试成绩一般都服从正态分布,并且我们还能通过转化将其化为标准正态分布.由标准正态分布的图1所示.
由图1所示,学生甲在这次考试中的标准分数Z=1,说明他班上有84.134%的学生在这次考试中比他差,比他分数高的只占15.866%,由此我们可以判定学生甲在这次考试中成绩属中偏上水平.
3 标准转化
通过标准转化可将小数形式或负数形式的标准分数扩大化,并大致转化为我们熟知的百分制分数的形式,易于被大多数人接受和理解.标准分数是以一批分数的平均数作为参照物,以标准差作为单位表示距离的.虽然标准分数能准确地刻划一个分数在一批分数中的相对位置,但是,由于标准分数常为比较小的小数,且可能有负值,不易被人理解和应用.因此人们在标准Z分数的基础上进一步转换,从而发展起了一系列其他形式的标准分,常称为T分数.转换通式为:T=kZ+b,式中,T为其他形式的标准分,k是转换方程的斜率,b是转换方程的截距.常见的有如下几种:教育与心理测验中的T分数:T=10Z+50;韦氏智力量表中各分测验的量表分:T=3Z+10;韦氏智力量表智商(离差智商):IQ=15Z+100;美国大学入学考试报告分数:CEEB=100Z+500;为出国人员举行的英语水平考试:EPT=20Z+90;美国教育测验中心举办的托福考试:TOEFL=70Z+500.
我国部分省市普通高校全国招生统一考试所使用的标准分,常取k=100,b=500,即:T=500+100Z,公式中取500为平均分,100为标准差.广东省普通高考从上个世纪90年代初开始实行标准分.2007年因高中实行新课程改革,考生高考时可以选择不同科目,选考X科的考生人数也不一样,就改为使用原始分.广州市07年中考受高考影响也改为使用原始分,但2007年广州市中考原始总分为435分的考生达300人之多,区分度较差,很不利于高中学校的录取,因此广州市2008年将继续使用标准分数进行高中招生选拔.因为当每个考生的考试科目相同时,实行标准分就能够准确清晰地反映考生之间的水平差异,录取考生更为合理、科学,更有利于高一级学校的招生选拔.
4 等级比例确定
标准分数可以对学生教育评价中的等级划分进行科学合理的确定.素质教育的今天,我们经常要对学生的各项指标进行等级评定,比如常将学生的某些考查学科的成绩评定为优、良、中、差四个等级,但事实上这种等级分法是很不科学的,原因在于标准Z分数原则上是可以取(-∞,+∞)上的所有实数,但落在区间(-3,3)上的Z分数占了99.7%,也就是只有大约3‰的Z分数落在区间(-3,3)外,属于小概率事件,一般可以忽略不计.所以在区间(-3,3)上我们把它分成四个等级的间距大约为1.5,如图2所示.
图2由图2可知“中”等级落在区间(-1.5,0)上,然而很明显区间(-1.5,0)并不是整个实数轴的中部,这与我们传统意义上的“中”大相径庭.因此我们应将其分成五个维度优、良、中、较差、极差更合理些,根据正态分布的理论,先求各等级在正态分布中的位置,即6σ/5=1.2σ(σ是标准差),五个等级分别是-3σ~-1.8σ,-1.8σ~-0.6σ,-0.6σ~0.6σ,0.6σ~1.8σ,1.8σ~3σ,如图3所示.
图3根据中等级应居中原理,科学的维度分法应分为奇数个维度,而不应分为偶数个维度.因此在我们生活实践中经常使用的“是、否”二维判断法事实上也不够科学,而应再加上一个“说不清楚”或“弃权”选项会更科学合理些.
5 品质评定数量化
在学生品质评价中,常采用等级评定法,如用“优、良、中、及格、不及格”五级制或“甲等、乙等、丙等”三级制评定学生品德行为的差异,然而等级评定的结果不能进行四则运算,不便于区分学生之间的优劣,利用标准分数即可将等级评定的结果转化为计量数据,便于学校的各项推优保送工作.例如:某校高三年级有一个保送清华大学的名额,王五,马六两同学都是年级尖子生,文化成绩不相上下,学校决定由年级组长和班主任分别就两同学高中三年来平时的一贯表现打出等级,等级评定按年级人数甲等占5%、乙等占90%、丙等占5%三个等级确定,从而决定该保送谁.年级组长和班主任为两同学打出的等级如表2.
王五马六年级组长甲乙班主任丙乙
由表2所知,王五有甲等级,但同时也有丙等级,而马六两个都是乙等级,虽然没有甲等级,但也没有最差的丙等级,因此只从等级看保送甲或保送乙都有理由.但如果用标准分数将其数量化就很容易看出应该保送甲还是保送乙.虽然甲等级只占5%,即班上有95%的学生评不上甲等级,但根据模糊数学理论,等级概率评定取组中值,所以查甲等级的标准分数的概率值应取P=0.975-0.5=0.475,通过查正态分布表得甲等级对应的标准分数为1.96,同理得到其他等级的标准分数如表3.
由表3可知:马六的标准分数总和大于王五的标准分数总和,说明马六在整个年级的一贯表现要优于王五,因此当然应该保送乙更合理.从而可利用标准分数对学生的思想品质进行量化评价,便于学校开展对学生的各项选拔工作.
参考文献
1 朱德全、宋乃庆主编.教育统计与测评技术.西南大学出版社,2007
2 黄光扬主编.教育测量与评价.华东师范大学出版社,2007
3 周建设,朱黎勇.标准分在教育评价中的应用.玉溪师范高等专科学校学报,2000(03)
4 徐子仪.标准分在数学教育评价和管理中的应用.黄冈师范学院学报,2001(05)
5 鲁庆云、刘其铎.成绩评价模式的改进及其实证.现代中小学教育,2008(01)
“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”