成绩“正态分布”，究竟谁说了算

中国科学报 | 2021-01-26 14:02:39 阅读：814

“我是老师，不是行政考核的工具。”

不久前，一张中南大学软件学院吴姓教师在朋友圈“吐槽”教务办强制要求学生成绩符合“正态分布”的图片在网络流传。

对于此事，中南大学的回应是“分数无误，沟通有误”。
然而，这一回答并没有止住人们对成绩正态分布的激烈讨论。
究竟正态分布“惹”到了谁？教师评分时该不该参考正态分布？学业评价到底又该由谁说了算？

事情的起因是这样的。
在不久前结束的中南大学期末考试中，吴姓教师的课程参考人数为153人，最终成绩90~100分占比70%以上，几乎没有低分。
其中，平时成绩全都在95分及以上。
“教务办要求我将50名学生的成绩从90分改成80分，以符合‘正态分布’。”
吴姓教师在朋友圈吐槽，“抱歉，我只在意学生……给多少人90分以上是试卷的结果，不是教务办定的指标……”
这件事被传上网络，一时间引发热议。
何为成绩正态分布？
所谓“正态分布”是一种概率分布的特殊表现形式，在统计某次考试成绩分布规律的时候，将成绩按分数段制成统计图，靠近平均成绩的得分占多数，其余成绩以平均成绩为中轴，向两侧逐次降低。
为何正态分布会引起如此强烈的抗议？
最大的不满来自学生群体。
早在2011年，浙江大学学生就曾因通识核心课的成绩执行正态分布，引发了激烈的讨论。
河南某高校建筑专业本科生张韬告诉《中国科学报》，如果每门考试成绩都要求正态分布的话，事实上加剧的是学生竞争的内卷化。
比如，在做设计课作业时，为了区分高下，张韬和同学们“被迫过度竞争”，死命地抠细节，“表面上看是作业质量更高了，但却是熬了整整三个通宵换来的。有同样的时间，不如用在做更有意义的事情上”。
而正态分布的思路又让冲绩点的学生感到“岌岌可危”。
“冲绩点意味着几乎毎门课程都不能失败，而正态分布却设置了较低的优秀率。”张韬说。
当然，一些高校设置正态分布的初衷，是为了防止学生盲目冲绩点。
然而学生对此并不理解，为了保研、出国，到了期末找任课教师要分者大有人在，让任课教师“挠头不已”。
安徽某高校教师周京也认为，一味执行正态分布并无必要。
“正态分布的前提是样本足够多。如果学生人数不够多，正态分布的前提假设就不成立。人为执行正态分布，迫使教师不得不调低学生的卷面分数，这对学生来说也是不公平的操作。”

然而在现实中，执行成绩正态分布的高校远不止一两家。
据记者了解，包括上海交通大学在内的不少高校中，都有“成绩应呈正态分布”的相关规定。
“拉开档次，中间居多，优秀、落后占少数，更符合人们一般的认知习惯。”华东师范大学上海终身教育研究院副教授侯定凯说。
但实际上，一门课的分数是否集中在某一区间，是否呈现正态分布，这是受到很多因素影响的。
分数集中在某一区间不外乎三种原因。
“一是学生能力集中在一个范围，二是试卷难度太大或太小，三是评判尺度前后不一致或有其他因素考量，这些都会导致分数区分度不高。”侯定凯说。
如果只是因为一门课的成绩不符合正态分布，便机械地套用统计学上大数据所呈现的规律，未免过于“生搬硬套”。
但对于高校行政部门而言，要求学生成绩体现某种区分度也有自己的道理。
侯定凯告诉《中国科学报》，成绩评价方式大致可分为相对评价和绝对评价两类。
相对评价是指在某个特定的群体中分出高下，它出于管理的需要，并不完全代表实际的学生能力，适用于排名、评优、选拔等。
绝对评价考查的是学生实际达到的既定学业水平，某个学生的成绩不会受他人或整体成绩的影响，适合达标性考试。
那么，高校里哪些课程应采用相对评价或绝对评价？
记者查阅了相关规定。
有的高校表示：“对于全校公选课及大类课程，严格执行分数段比率人数限制，如90分不大于20%，80分不少于30%。专业课程无给分限制。”
周京认为，相比较一刀切的正态分布，类似的规定稍显合理。

此次事件中，有人认为，行政人员的做法是基于从前的经验导致操作不当。
但中国教育科学研究院研究员储朝晖指出，对于这一事件的讨论不能止步于具体做法的评价，而是应该厘清学业评价权的界限。
应采用何种评分方式？这一权力究竟当属任课教师还是行政部门？对此，受访者均表示，应当属于教师，而非教务部门。
记者了解到，美国高校的教务部门通常不会对教师的评分决定进行干预。
由于评分标准事先已明确写入教学大纲，教师拥有评分的自主权和最终的决定权，而教务部门主要的职责是服务和支持科研、教学等教师日常工作。
“国内高校的行政部门应更多地承担起服务者的角色。”
侯定凯说，在处理方式上，教务部门首先应在事前而非事后与任课教师讲明评分要求，提醒教师在出题时注意鉴别学生能力的差异。
其次，事后如出现明显的成绩分布异常，教务部门应与任课教师共同讨论原因，查清究竟是学生能力、命题难度还是评价尺度中的哪个环节出现了“异常”，再决定下一步的处理办法。
侯定凯建议，教务部门掌握了历年课程成绩的大数据，可以据此形成某门课程的参考标准。
“我们经常讨论分数贬值、分数膨胀等问题，这方面最常用的讨论依据是找到近几年某位教师或某个专业的打分情况，与前10年甚至前20年的打分作比较。这一思路同样可用于教学服务上，也就是说，我们可以在掌握分数总体变化趋势的同时，深入分析背后各种可能的影响因素，并就如何不断提升命题的科学性向教师提出建议。”
当然，我们还要直面这样一个问题——命题难度，尤其是在评教压力下，一些教师可能会出难度较低的考题，让学生通过。
而这恰恰是行政人员监管成绩评价的初衷之一。
如果把评价权交给教师个人，是否会存在这样的疏漏，将学生“放水”通过？
侯定凯建议，试卷命题可以尝试建立教学领域的同行评议机制，把相关领域的专家、评估专家集合在一起，分析某份卷子的命题质量到底如何。

对此储朝晖表示认同，但他同时也提醒道，这样的方式需要“多”而非“唯”，非专业的行政管理方式过于集中，是无法实现“多”的。

同行评卷涉及更多的是深层的大学管理和评价体制改革，而这并不是一个部门能够解决的。

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。