当前位置: 首页 > 论文论著 > 刍议考试评价的百分制与等第制

刍议考试评价的百分制与等第制

2016年12月14日 18:16:42 来源:中国教育新闻网—中国教育报 访问量:96 作者:王斌华
怎样“打分”更科学
——刍议考试评价的百分制与等第制

据媒体报道,本学期上海将全面推行小学“等第制”评价。近期,不少家长的朋友圈被“等第制”刷屏。某微博还发起了一场有关“你支持小学推行‘等第制’吗?”的讨论,众多网民各抒己见,有人支持,有人反对。笔者认为,在百分制评价转变为等第制评价的过程中,出现某些担忧或疑惑,是一种正常现象。当务之急是,应该普及这方面的知识,让教师、学生和家长理性地看待这个问题。

等第制与百分制的“前世今生”

在表示学生考试、测验和作业水平时,通常采用等第制或百分制两种计分法。等第制,亦称等级制,是指用等第作为学生成绩的计分方法,包括文字等第和数字等第两种类型。文字等第采用优秀、良好、中、及格、不及格,甲、乙、丙、丁,上、中、下,或及格、不及格等来表示;数字等第采用5分、4分、3分、2分、1分来表示,其中5分表示“优秀”,4分表示“良好”,3分表示“及格”,2分表示“不及格”,1分表示“极差”。

百分制是指,用0—100分作为成绩的计分方法。通常以100分为满分,60分为及格,60分以下为不及格。澳大利亚ACCESS考试、英国IELTS考试、美国TOEFL考试、GRE考试、GMAT考试以及我国中考、高考、大学英语四级和六级考试,常常以120分、150分甚至更高的分数为满分。

我国自汉代开始,采用等第计分法。汉代的太学(当时全国最高的教育机构)采用及格和不及格两个等第,唐朝和宋朝采用上、中、下三个等第,以后采用甲、乙、丙、丁四个等第,或优、良、中、可、劣五个等第。1902年(清光绪二十八年),清政府颁布的《钦定学堂章程》明确规定:“评定分数以百分为满格,通各科平均计算,每科得60分者为及格,不及60分者为不及格。”此后,中国开始采用百分制计分法。中华人民共和国成立后,在上世纪50年代广泛采用五级计分法,上世纪60年代后一般采用百分计分法,同时采用五级计分法,或“优、良、及格、不及格”四级计分法。

不同国家对学习成绩的数量表达往往采用不同的计分法。譬如,意大利采用十一级计分法,荷兰采用十级计分法,波兰采用五级计分法。有些国家采用六级计分法或三级计分法,如:特优(superior)、优(excellent)、良(very good)、中(good)、及格(passing)和不及格(failure/below);优秀(outstanding)、满意(satisfactory)和不满意(unsatisfactory);超标(check plus)、达标(check)和未达标(check minus)。

    等第制与百分制有什么弊端

无论采用等第制还是采用百分制,其反馈结果将包括四个指向:向学生反馈,使学生充分了解自己的学业水平;向家长反馈,让家长了解子女的学业状况;向教师反馈,帮助教师判断教学成效,总结经验和教训,提高教学质量;向教研组、年级组和学校领导反馈,为进一步加强教学管理与教学决策提供依据。因此,等第制和百分制都应该力争做到:其一,客观、公正和透明;其二,反映考生掌握所学内容的广度和深度;其三,表明考生在学业方面的优点、不足和努力方向;其四,确定每位考生的相对位置。

严格地说,等第制和百分制都不是一种完满的计分方法。以百分制为例,它至少存在两个严重弊端。

第一,互补性。在学生评价过程中,教师大多只向考生提供一个总分。给出总分的最简单方法就是将各部分的得分相加,确定一个及格分数线。不管在哪个部分获得分数,只要总分超过60%就算及格。比如,一张试卷由五个部分组成,每个部分的分数为20分,总分为100分。甲乙两位考生各得80分。其中,甲考生在四个部分获得满分,一个部分获得0分,总分是80分;乙考生在全部五个部分中都获得了16分,总分也是80分。从分数上看,甲、乙两位考生水平相当,但其实他们之间存在着质的差别。他们之所以给人水平相当的感觉,是因为这种计分法利用了分数之间“互补性”,用强项获得的高分去“弥补”弱项获得的低分。

第二,模糊性。由于重大测试的试卷需要存档,考生拿到的只是测试的总分成绩。仅仅一个孤零零的总分成绩无法向考生提供详细的明确信息,其含义也是模糊不清的,因为考生不可能确切知道哪个部分及格了,哪个部分没有及格,哪个部分是强项,哪个部分是弱项,当然也无法知道自己在考生群体中的相对位置以及在学业方面的优点、不足和努力方向。

百分制计分法的两个弊端如此严重,等第制计分法的缺陷就更突出。

等第制与百分制的技术修正

由于等第制和百分制存在着“互补性”和“模糊性”两个弊端,它们已经受到学界的批评。为了提高计分法的“透明度”和“合理性”,我们可以在等第制和百分制的基础上,作一些技术性的修正。

第一,提供两种分数。在重大测试中,应向考生提供两种分数,即各部分的得分和相加后的总分。澳大利亚ACCESS考试、英国IELTS考试、美国TOEFL考试、GRE考试和GMAT考试以及我国大学英语四级和六级考试,都向考生提供两种分数。这样便向考生提供了更加明确的信息。也许有人认为,这将增加教师的阅卷负担。其实不然。在试卷评阅过程中,教师通常都把试卷分解成若干部分,首先给出各个部分的得分,然后给出相加后的考试总分。现在是利用计算机统计分数,提供两种分数是非常容易做到的。况且,重大测试举办的频率低,而且提供两种分数可以提高计分法的透明度和合理性,何乐而不为呢?

第二,设置附加条件。在确定考生的最后考试等第时,须考虑两个因素:各部分得分相加后的总分和各个等第的附加条件。仍以上述试卷为例。该试卷由五个部分组成,每个部分的分数为20分,总分为100分。其中,90分以上为“优”,80分以上为“良”,70分以上为“中”,60分以上为“及格”,60分以下为“不及格”,但各个等第都必须符合相应的附加条件。比如,获得“良”的考生,任何部分的得分不得低于10分。这样,上述甲、乙考生获得的最后等第就出现了高低。甲考生在四个部分获得满分,一个部分获得0分,尽管其总分为80分,达到了“良”的最低分数线,但是他在一个部分的得分为0分,低于10分,因此他最后获得的等第只能降格为“中”;乙考生在所有五个部分中都获得了16分,其总分为80分,不仅达到了“良”的最低分数线,而且每部分的得分超过了10分,符合“良”的相应附加条件,因此他最后获得的等第为“良”。设置附加条件的好处在于鼓励学生全面掌握重要的知识点和技能。

第三,依据曲线评定成绩,即依据学生成绩的分布曲线给出分数。数理统计中的“常态曲线”原理认为,在任何一个学生群体中,都有上、中、下三个层次,而且这三个层次所占的比例是一个恒定的常数。以智商为例,处于“常态曲线”两端的人数,即智商高于130的超常人数和智商低于70的弱智人数,各占全民人口的2%左右;处于“常态曲线”中部的人数,即智商在85至100之间以及100到115之间的人数,各占全民人口的34%左右。因此,教师给某一学生群体评定成绩时,应根据“常态曲线”的原理,适当注意一定的比例分布。

必须注意的是,按照“常态曲线”原理决定各层次所占的比例,有时可能会脱离实际,缺乏科学性和合理性。比如,某班全体学生都非常优秀,考试成绩很高,如果依据常态曲线评定成绩,必然有一部分学生不及格,这会挫伤这部分学生的学习积极性,甚至滋生不满或敌对情绪。又如,某班全体学生学习困难,考试成绩很差,如果依据常态曲线评定成绩,必然有一部分学生获得优秀,这会导致那部分学生产生“学习优秀”的错觉,甚至滋生自满、骄傲的情绪。再如,某班全体学生原先学习困难,考试成绩很差,但是最近一个时期,他们经过努力拼搏,考试成绩提高了,如果依据常态曲线评定成绩,可能无法如实反映学生已经取得的进步。(作者王斌华,系华东师范大学教师教育学院教授、博士生导师)

《中国教育报》2016年12月14日第9版 

编辑:王应平
评论区
发表评论

评论仅供会员表达个人看法,并不表明网校同意其观点或证实其描述
搜索框
教育部 中国现代教育网 不良信息 垃圾信息 网警110
郑重声明:本站全部内容均由本单位发布,本单位拥有全部运营和管理权,任何非本单位用户禁止注册。本站为教育公益服务站点,禁止将本站内容用于一切商业用途;如有任何内容侵权问题请务必联系本站站长,我们基于国家相关法律规定严格履行【通知—删除】义务。本单位一级域名因备案流程等原因,当前临时借用网校二级域名访问,使用此二级域名与本单位官网权属关系及运营管理权无关。静乐县杜家村学区 特此声明。