柯政:高考改革需要更加重视科学学科
2014年开始在浙江、上海试点的新高考改革,有很多突破和亮点。总体来看,试点工作进展比较平稳;但存在着对物理化学等科学学科地位重视不够、高中生科学素养受到影响等问题。在中国这样一个面临着巨大发展任务的国家,在“新一轮科技革命和产业变革正在孕育兴起”的时代,高考改革的制度设计没有充分地重视科学学科,这不仅是细节问题、技术问题,而且是方向性、战略性问题。对此如果没有清晰的认识,很可能会犯颠覆性错误。
一、科学学科的地位在改革之前是如何被精致地维护着的 在2014年开始试点的新一轮高考改革之前,大部分省市采取的都是3+文/理科综合的方式。这种高考模式,或者之前更经典的3+2模式,有一个突出的特征,就是物理、化学等科学学科的相对地位非常高。这其中的作用机制和原理,有些是很简单很直白,而有些则相当精妙和隐蔽。 大家相对比较熟悉的是,之前的高考方案通过文理分科制度保证了绝大部分学生都要选考物理、化学等科学科目。从表面上看,每个学生可以有同样的机会去读文科,国家也从来不限定谁必须要读理科。但国家事实上又通过将大学的录取专业分文科、理科,以及对文理科招生名额的调配,来精致地引导、调节和控制理科生比例。从实际报考情况来看也是如此,各地报考理科的学生大约都在三分之二左右,甚至更高。因为对所有理科的学生而言,物理、化学等科学科目是必考科目,这就在制度上保证了这些科学科目对绝大部分高中毕业生来说都是必考必学科目。 但很多人不知道的是,之前的高考方案,通过精心设计高考成绩的标准差,使得广大学生和教师认为物理、化学等科目比语文、政治、历史等科目更重要,从而会投入更大的时间去学习。这是一个相当精致的控制机制,很多业内人士也不一定弄明白。我们这里略作拓展说明。 以经典的3+2高考方案为例,从表面上看,语数外三科和属于理科的物理化学两科以及属于文科的历史政治两科,它们总分都是150分,重要性是一样的。但实际上,所有经历过高考的考生和教师都知道,虽然同样都是150分,但这些科目对学习时间和学习强度的要求是完全不一样的。一般来说,数学、外语、物理、化学这几科的时间占有量和学习强度明显要比语文、政治、历史等科目大。也就是说,虽然同为150分,但从时间分配的角度来看,物理、化学等科目事实上要比政治、历史等科目更重要。这里的关键原因就是标准差的问题。 为什么这么说呢?直到今天,我们的录取是以总分高低为标准的,而这里的总分是直接用各科的原始分进行加总的,是没有考虑各科的难度和区分度的。也就是说,在计算总分的时候,语文的1分跟数学的1分是等值的。这样一来,一门学科的重要性就取决于一个指标,那就是这门学科是否容易拉分或者说制造差异。如果某门学科拉分容易,那它就重要,因为选择这门学科要么容易被别人拉分,要么容易拉别人的分。而如果一门学科不容易拉分,那这门学科就相对不重要,因为无论你投入多大的时间去学习这门科目,你得到的回报或遭受的损失都是相对较小的。而标准差刻画的是一组数据的离散程度,标准差越高,表示这组数据越离散,也就是说内部差异越大,内部差异越大也就意味着拉分越容易。简而言之,在现有按照原始分计分以及进行总分合成的机制下,标准差大的学科就是相对重要的学科,标准差小的学科就相对不重要。 那什么样的学科标准差大呢?笔者没有在公开渠道找到全国性或者全省性的相关高考指标数据,也无法拿到高考的原始数据。但笔者曾有机会对个别地级市的全部中考数据进行过分析。以其中一个市为例,该市有近1万名中考学生,他们的中考成绩数据库有所有学生语文(总分130分)、数学(总分130分)、英语(总分130分)、物理化学(总分120分)、历史政治(总分120分)、生物地理(总分120分)的成绩。我们对这6门科目(物理化学合起来作为一门科目,历史政治和生物地理也是如此)的标准差进行计算,发现它们的标准差是这样的:语文(9.44分);数学(22.42分);英语(22.85分);理化(20.15);政史(12.49);生物地理(16.15分)。 笔者把这个分析结果与其他几个市的结果做了一些比较分析,排除一些不可比较的因素(比如这些地区都没有把化学、生物等科目纳入中考),发现总体情况是类似的。比如数学、英语科目的标准差基本上是语文的2倍多,物理或者化学的标准差也是语文的2倍左右,政治或历史的标准差则明显小于物理、化学等。笔者也据此咨询了某省市考试部门的有关专业人员,得到了“高考的情况也与此差不多”的结论。 从这些数据可以看到,物理、化学的标准差明显要比文科科目(外语除外)高,这种制度性安排就决定了如果考生不在这些科目上花更多的时间精力,那么他就很容易被别人拉开分数,从而在竞争中处于极为不利的地位。这也是为什么语文虽然总分是150分,但大家都感觉语文学科不是很重要的关键原因。部分改革者想提高语文学科的地位,他们开出的处方是要增加语文学科的分值,这其实是弄错了方向。语文学科之所以在实践中不受考生重视,关键的原因是标准分太小,拉分(无论是拉别人的分,还是被别人拉分)太难,导致学生觉得投入大量时间学习语文不合算。所以,真要提高语文学科的地位,一个有效的办法就是提高它的标准分。 无论当初的制度设计者是否有意这么设计,但从客观效果来看,这确实是一套非常精致的控制机制。一方面,它没有明确说物理、化学等科学科目就比政治、历史等科目更重要,学生应该花更多的时间去学习。因为, 这会引来大量无端的争议和政治风险。但另外一方面,通过充分利用科目成绩标准差的问题,至少在客观结果上,突出强化了科学学科的地位,成功地动员了亿万学生花更多的时间精力去学习科学知识。这与当时的中国(现在也是如此)大力推进对外开放、追赶世界科技发展趋势的国家优先战略是相符合的。反过来说,中国改革开放和科技进步能有今日的成就,我认为,离不开如此精致的高考制度设计。 二、新高考之后科学学科地位下降的事实 相比之前的高考改革方案,在2014年开始试点的新高考方案中,物理、化学、生物等科学学科的地位相对是下降的。之所以得出这个结论,主要是基于如下几方面的事实。 首先,这些科学学科的考试性质发生了变化。改革之前,虽然形式不尽一致,但物理、化学等科目在性质上都是与语数外这三科一样的,都是属于统一高考科目。而改革之后,物理、化学等科目不再作为统一高考科目,而是作为学业水平考试科目。更重要的是,其分值也遭遇断崖式下降。以上海方案为例,虽然这些科学科目总分是70分,但因为其真正起步分数就有40分,所以其实质变化分数就只有30分。甚至更简单地说,物理、化学等学业水平考试科目真正有区分意义的分值其实只有10个(从最差的D到最好的A+)。从高校招生的角度来看,一门物理科所携带的信号可能还比不过数学英语卷中一道题目来得重要。 其次,选考科学学科的考生少了。改革之前,由于实施文理分科制度,基本上有三分之二的学生是要选考物理、化学等科学科目的。而改革后,科学选考比例大幅下降。以上海市为例,代表最高水平的市示范高中,往年报考物理的比例一般都在45%左右,而2017年只有23%。浙江的情况则更明显。物理选考人数大幅减少导致大量物理老师无课可教的情况时有发生。关于这方面的问题,媒体已经反映得比较多了。浙江省和上海市目前都在做新高考方案的完善,其主要的动因就是因为物理科报考人数大幅下降。浙江的完善方案已经公布了,相关讨论也比较充分了,本文就不再赘述了。 第三,学生的科学学习投入时间大幅下降。真实的学习时间,即在相对有限的时间里,愿意花多少时间学习某门课程,是学生、教师心目中对这门学科重要性的真实反映。从这个指标来看,新高考之后,科学学科的重要性也是在大幅下降的。 虽然在改革初期,很多学校反映仍然按照以往的教学难度和课时量在准备物理等科学科目,并没有立刻就大幅降低教学难度和减少教学时间。但这主要是因为学校不知道真正到了考试时候题目会怎么出,担心这么做会导致不利。但很快,考试部门就公布了学业水平考试等级考(或选考)的难度系数,从以往高考科目的0.65降低为0.75。特别是当第一次学业水平考试结束后,大家普遍发现试卷的确比想象的简单得多,于是科学学科的教学时间和教学强度就迅速下降。据上海市某一中心城区的调查数据,改革后全区学生每周课后学习物理的平均时间,高一年级从92分钟减为50分钟;高二年级从103分钟减为50分钟;高三年级从242分钟减为73分钟。 这是面上普遍的情况。我们再来看两个极端群体——学科拔尖学生和学科困难学生的科学学习时间需求。对那些学科拔尖学生来说,改革后最大的影响就是,物理、化学等科学学科的分值和难度下降了,没有了发挥的空间。按他们的说法就是“随便学,至少也能考60多分;再怎么学,最多也就是70分”。也就是说,分值的减少和难度的降低,使得那些尖子生觉得“没必要”把物理学得很深。2017年高考结束后,我们接受上海市的委托,对三年上海高考改革试点进行第三方评估调查。为此,我们抽样调查了1889位高三任课教师,其中有433位教师是这届学生的科学学科的任教老师。在这433位老师中,有298位认为“改革后,学科特长生再难以脱颖而出”,占比68.8%。而不赞同这个观点的是57位,占比13.2%。 而对那些科学学习困难学生来说,他们一旦不选择科学学科作为等级考科目,那根据现有的计分规则,如果从功利的角度来看,他们高中三年甚至都可以不学物理、化学等科目。这是因为,虽然从制度上来说,他们依然需要通过合格考,但由于全市范围合格考不通过的比例明确为2%左右,因此在事实上,对很多学生(特别是那些在初中的时候基础较好、升入市区重点学校就读的学生)来说,他们是没有可能会掉到最后的2%群体中去的。 第四,存在着加速恶化之趋势。调研中发现,几乎所有学校都存在物理学考人数不断下降的趋势,而且很多都是大幅度下降。具体情况根据高中层次水平不一样大致可以分为三种。第一种情况是在一开始就出现大幅下降,后来愈演愈烈。这主要出现在那些升学率相对较低的普通高中。 第二种情况是一开始物理学科避考现象不是特别明显,但第一次考试结果出来之后,这一现象就表现得非常明显。这种情况在那些属于重点中学但又不是顶尖的高中学校表现得非常突出。这些学校普遍反映,在最开始的时候,还是有很多学生依然选考了物理、化学等科学科目。但考试结果出来后,他们发现在这些学科中拿到一个满意的分数要比其他学科难得多。于是,家长、学生和教师普遍开始有了“选考物理不合算”的想法,并开始大规模地放弃物理科。以上海一所区级示范中学为例,该校2014级学生(即2017年参加高考)有129人报考了物理,2015级就变成了90多人,2016级有这个意向的才40多人。甚至在一些地方,当地教研员、校长在分析成绩下滑的时候就明确指出,选考物理科目人数多是导致区域或学校成绩下降的最主要原因,并要求大家把情况分析给各位学生和家长,暗示他们若非最优秀就不要报考物理。避考科学科目已经成为集体的、官方的行动!也因此,北京大学教务长办公室主任、浙江招生组组长李祎在2016年12月的一个研讨会上说:“从我们长期观察的学生和这一次选考科目的情形来看,我担心以后物理选考人数会雪崩一样的崩塌。如果连物理上顶尖的学生也会陷入一个70分80分的境地,肯定对物理生态是一个巨大的破坏。”(搜狐教育,2016) 第三种情况是开始的时候很淡定,但现在也开始恐慌。这主要表现在当地顶级高中身上。在开始的一两年,各地的一流重点中学在谈到这个问题的时候,基本上都说自己学校基本不存在大批学生避考物理的现象。但随着物理等学科的“分母”越来越小,这些原本铁定属于“分子”的学生也开始担心自己会沦落为“分母”了,于是,避考物理的学生开始明显增多。根据上海市的一个调查数据,2014级学生在高一时有47.7%的人会选考物理,而2015级学生在高一时有选考物理意愿的比例只有38.9%,同期相比下降了约10个百分点。在2017年下半年,上海一所顶尖级的重点高中校长透露,该校2017级高一学生报考物理的意愿开始下降到20%左右。 三、我国还没有“奢侈”到可以不重视科学学科 通过诸多事实性数据,我们揭示了在新高考之后确实存在科学学科地位相对下降这个现象。但现象并不等于就是“问题”(事实上大部分现象就不是问题)。从政策理论上说,当我们在说什么现象是一个“问题”的时候,这背后其实是有着一系列的假设的。政策问题不是一种自明(self-defined)的事实(fact)或者说客观存在的自然现象,而是由人构建出来的特定社会现象,这背后就肯定涉及理论假设(或者偏见)(Fischer, 2003, p.69;Dunn, 2004, pp.71-73)。 事实上,对于新高考之后科学学科地位下降的事实本身,很少人会提出质疑。但对于怎么看待这个现象或事实,就可能存在着很不相同的意见。包括浙江省和上海市部分教育行政领导在内,不少人就认为这并一定是个坏现象,他们认为这反而说明之前那种过于重视理科的模式开始打破,文理科开始均衡起来,而这些恰恰是这次高考改革取消文理分科、实行多元录取所希望达到的政策效果。比如,对于大家反映比较强烈的物理科报考人数下降的问题,有不少人就认为,这并不是一个很严重的问题,物理科并不是一定就比其他学科重要,也不需要那么多人都去学物理(彭德倩,2017)。 但在笔者看来,对于我国这样一个发展任务还非常繁重的国家,在“新一轮科技革命和产业变革正在孕育兴起”的时代,出现高考改革导致科学学科地位下降和高中生科学素养下滑的现象,这是一个需要引起我们高度关注的大问题。这主要基于以下几方面的理由。 (一) 当前中国比以往任何时候都更需要科学技术 在今天这样一个智能化水平越来越高、成才机会越来越多的时代,就某个个体来说,没有一定的科学素养似乎也可以生活得不错。但对于一个国家来说,科学技术比历史上任何时候都来得重要。对于正处于民族复兴关键时期的中国来说,更是如此。 首先,从历史上看,是否重视科学,是否主动抓住科学技术进步带来的机会,会直接决定着中华民族的兴衰,“我们比以往任何时候都更加需要强大的科技创新力量”。科学技术发展从来都是以一种不可逆转、不可抗拒的力量在推动和调节人类社会的发展进程。16、17世纪的科学革命标志着人类知识增长的重大转折。18世纪出现了蒸汽机等重大发明,成就了第一次工业革命,开启了人类社会的现代化历程。19世纪,科学技术突飞猛进,催生了由机械化转向电气化的第二次工业革命。20世纪前期,量子论、相对论的诞生引发了第二次科学革命,继而导致了信息科学、生命科学的变革,基于新科学知识的重大技术突破层出不穷,这极其显著地影响着全球经济形态和综合国力的竞争规则。科学技术决定着世界政治经济力量对比的变化,也成为了各国各民族的前途命运的关键影响变量。回顾历史,我们可以发现,每次重大的科学技术进步,总有国家抓住机会,把它转化为综合国力,迅速成为强国大国。而我国从传统的强国沦为任人欺凌的半殖民地半封建国家,最直接的原因就是我们屡屡错失了科学技术革命。 改革开放以后,我国国力迅速上升,其中一个基础性的原因就在于认识到“科技是第一生产力”,紧紧抓住上一轮科技革命的尾巴,在一些重要领域跻身世界先进行列。科技整体能力持续提升,为我国社会经济发展提供了扎实的基础。当前又处于一个关键的历史发展节点上,新一轮科技革命和产业变革正在孕育兴起,全球科技创新呈现出新的发展态势和特征。若干基础科学领域正在取得重大突破性进展,并带动几乎所有领域发生了以绿色、智能、泛在为特征的群体性技术革命。面对呼之欲出的新一轮大规模科学技术革命以及随之而来的新型产业革命,世界上各主要国家无一不是磨拳擦掌,希望找到科技创新的突破口,抢占未来经济科技发展的先机。 其次,从当前经济社会发展的角度来看,科学技术创新对经济发展的贡献已经超过其他所有因素,且还在不断增长中。上世纪中叶,经济学家在解释经济发展的原因时,逐渐注意到了科技进步的重要作用。经济学家索洛(R. M. Solow)提出了加速技术决定作用的增长模型,技术进步第一次被视为一个单独的因素纳入到经济增长理论中(索洛,1988)。此后,经济学家在经济增长的实证分析中,进一步证实了索洛模型的结论。丹尼森(E.F.Denison)等发现,在经济增长计量中,总的经济增长远远大于资本和劳动等要素投入的增长率,即出现了一个增长的“余值”,他明确地把这个无法用要素投入来解释的“余值”归结到技术进步上,并由此得出技术进步是经济增长的主要源泉的结论(周绍森,胡德龙,2010)。 据吴建宁、王选华(2013)的测算,1978—2011年间,科技进步对我国经济增长的年均贡献率约为25.10%,人力资本贡献率约为25.63%,而物质资本投资的贡献率高达49.27%,约占一半。而近些年,科技进步的贡献率已经超过50%,成为经济发展的绝对第一要素。我国科技进步贡献率从2010年开始已经超过50%,成为了经济增长的最大因素,到了2015年,科技进步贡献率已经达到55.3%(央广新闻,2016)。2017年“两会”,李克强总理在报告中提到,2016年科技进步贡献率上升到56.2%,创新对发展的支撑作用明显增强。《“十三五”国家科技创新规划》则更明确地提出:科技创新作为经济工作的重要方面,在促进经济平衡性、包容性和可持续性发展中的作用更加突出,科技进步贡献率达到60%。 对于科学技术对国家的战略性作用,国家有非常清晰的认识。党的十九大报告用了一大段来强调科技创新的重要性,提出“要瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究、引领性原创成果重大突破,……加强国家创新体系建设,强化战略科技力量,……培养造就一大批具有国际水平的战略科技人才、科技领军人才、青年科技人才和高水平创新团队”。 高考改革同样需要具备这样的战略眼光,要充分理解习近平总书记所说的“我们比以往任何时候都更加需要强大的科技创新力量”的战略判断以及它对高考改革的意义和价值。弱化科学学科地位,与国家的科技创新战略,无论如何都是不相匹配的。 (二) 大学各专业普遍认可科学学科具有相对重要性 一些人认为,每个学生选择3门等级考科目,物理等科学学科选考人数少了,就意味着其他学科选考人数多了,这并不是一件什么大不了的事情。这背后有一个假设就是,物理也并不就比其他学科更重要,不能说选考物理的人少了就是问题,选考地理的人少了就不是问题。 这确实是一个很有力的质疑。因为从“政治正确”的角度上来说,纳入学业水平考试的物理、化学、生物、政治、历史、地理以及技术等各学科都很重要,确实很难证明物理就一定比其他学科更重要。但如果我们暂时抛开抽象的理论思辨,回归现实问题,我们就可以发现,这个问题也没有想象的这么复杂。 对特定专业所需学生的背景来说,具备哪一门或几门学科知识是最理想的,或者说,对某一个专业来说,哪些学科对未来发展是相对更为重要的,最有发言权的其实是大学。这次高考改革试点,要求大学各专业在6-7门学业水平考试科目中指定0-3门必考科目,这一方面是对大学的专业判断权的尊重,另外一方面也是要求大学对哪些科目相对更有价值做出判断。所以,各大学各专业最终对选考学科提出的要求,事实上就可以看做是他们对什么样的科目更有价值这一问题的一种真实回答。 从结果看,绝大部分大学尤其是高水平大学,几乎都一致认为科学学科特别是物理学科最重要。如上海37所本科高校2017年共设置专业(类)1096个,提出1门选考科目要求的有75个专业,100%要求物理,提出2门科目要求的有85个专业,全部都是要求物理、化学。所有专业(类)中,提出最多的选考科目是物理,有415个,占专业(类)总数的37.9%;其次是化学,有337个,占30.7%;再次是生物,有222个,占20.3%(董少校,2015)。这种情况在高水平大学中更是如此,如复旦大学的法学、哲学专业也要求学生选考物理科。科学学科的相对重要性一目了然。 (三) 有意压低科学学习的强度和范围是一种严重的人力资源浪费 可能有读者会说:我承认物理等科学学科非常重要,但这并不意味着所有人都一定要去学物理,做科学家吧?的确如此!在笔者看来,允许学生有更大的选择空间去选择自己喜欢的考试科目,是这次新高考改革最大的亮点和进步。允许有些人不学习科学学科,这不是问题,甚至应该是鼓励的。这次高考改革在这方面最大的问题是把科学学科的广度、深度进行了大幅度压缩,致使学生在高中阶段的科学学习机会和空间大幅缩窄。这让那些喜欢科学学习或者在科学学习上有能力的学生,在现有的高考体系中无从发挥优势,进而丧失科学学习的兴趣和动力。这是一种严重的人力资源浪费。 首先是对科学学科的总分值进行限制。以上海方案为例,每科的总分其实只有30分。一个学生哪怕把物理学习得再好(进入了前1%的名次),他最多也只比一个中等水平的学生(第50个百分位)多15分!比一个刚上一本线的学生多3-6分!再通俗地说,一个考上了北京大学的学生,跟一个考上了上海大学的学生,三门科学学科加起来的差距可能也不会超过10分。 其次是对难度进行限制。明确规定学业水平考试等级考的难度系数是0.75,明显低于语数外等高考科目的0.65。难度系数一旦降下来,就意味着标准差和区分度也跟着降下来。这一方面直接导致该科目变得不再那么重要,另外一方面,也使考生的成绩越来越多地取决于他是否足够细心,而不是他的学术水平有多高,能解决多高智力难度的题目。 最后,因为多种原因大幅减少各种竞赛加分,科学学习拔尖学生通过各种竞赛获得加分、面试的机会也大幅减少,甚至接近于零。 无论这些制度出发点如何,但至少在客观后果上,它们明确地向学生传递出了这样的信号,即在物理、化学等科学科目上花很多精力去学习是不合算的,甚至是没有必要的。而一流大学的入学机会竞争却不会因为科学学科学习难度的降低而下降。这样一来,学生之间的竞争就必然转移到语数外三科上来。而由于这三科总分也只有450分,且难度也相对固定,“一分之差差千名”的现象就会增多,这就必然导致学生把大量的时间精力用于重复操练,以最大限度地减少“意外失分”。 这对我国这样一个家长重视教育、学生学习刻苦的国家来说,是一种严重的资源浪费。本来,学生可以投入更多的时间精力去学习更深、更广的科学知识,这是我们的一大优势,也是在我们的科学教育资源和方法有相对劣势的情况下,能够保证我国高中生具有相当科学素养的一个重要原因。事实上,一直以来,我们也就是这么做的。但现在,我们把这条机制基本截断了。人为降低科学学科的学习难度和要求,并不会明显降低学生的课业负担,但它确确实实减少了学生大量的科学知识学习机会,致使我们的高中学生体量大、学习刻苦的优势完全无法发挥。试想,如果我们给那些热爱科学学习的学生足够的学习机会和激励空间,那么,哪怕每届只有20%的学生喜欢钻研物理等科学课程,其所发挥出来的人力资源会有多大!而现在这些资源基本上就被浪费了。 (四) 我们不具备通过科技人才引进来弥补科技人才储备不足的条件 纵观世界各国,大致存在着这样一条规律,那就是无论是个体层面还是国家层面,随着生活条件的改善,人们学习物理、化学等“硬科学”的动力会逐渐降低,学习人文艺术学科的兴趣则会增高。但从某种意义上说,这条规律与日益激烈的科技竞争是相矛盾的。美国等强国也遇到这样的矛盾。但他们有一个得天独厚的资源可以利用,而且事实上这些年也不断在利用这个资源来弥补这方面的不足,那就是源源不断地从第三世界国家(比如,中国和印度)引入科技人才。在总统竞选中,候选人希拉里·克林顿提出一项重磅参选政纲就是,直接给理工科专业的博士毕业生绿卡。虽然由于竞选失利,这条政策未能出台,但美国决策层对本土理工科人才缺乏的担心以及对国际理工科人才的渴望由此可见一斑。 美国可以容忍本土学生不学科学学科,然后吸引全世界的科技人才为它服务,那我国呢?人力资源是我国最大的优势。一直以来,每年能够培养出大批具有相当科学素养的高中毕业生,都是我们的一大优势。未来我们可以在高端科技人才的培养与回引上做更多的工作,我们也可以进一步完善科学教育课程与方法,以减少死记硬背,但保证科学学科在高中阶段的地位,保障高中生的科学素养,依然是一项基础性工作。北欧一些国家就是没有正确地处理这个问题,一味鼓励学生自主选择科目,且没有做适当的引导,才导致它们的高中生普遍不愿意去修习难度高的学术性课程,甚至“美发美容”反倒成为了高中生最爱的专业或科目。其教训不可不察。 随着社会的进步,个人的选择开始多样化,不要强迫谁一定要学习什么样的科目或专业,这是对的。事实上,从前面所描述的这条规律来看,社会也已经自动在调整了。我们需要注意的是,在这个过程中,作为国家基础性的制度设计,高考改革就不应该再推波助澜以加速学生避考避学物理了。比如,压低科学学科的分值空间,让选考科学学科的考生在计分上吃亏。不看到这点,“跟着富人后面吃稀饭”,肯定会吃苦头。 四、学生避考科学学科主要不是怕难,而是担心不公平 很多人都在直觉上认为,物理、化学等科目学习难度相对文科来说要高,所以一旦允许学生选考,大家都会逃避科学学科,而会选择更容易的地理等科目。也就是说,选考制度是造成当前物理等科学科目选考人数大幅下降的主要因素。但我们认为,事实并非如此。选考制度毫无疑问为部分学生避考避学物理等科学科目提供了通道和机会,但它本身并不是主要原因。新高考之后出现学生纷纷避考物理等科目的现象,主要不是学生怕难,而是他们怕不公平。 (一) 选考制度不是科学学科报考人数大幅减少的主要原因 我们可以从江苏的正反两方面历史证据中得出这一结论。江苏在1999年采取的是3+2模式,当时理科生的比例是79.3%。2000-2001年实施的是小综合模式,理科生的比例分别是80.1%和80.2%。2003年实行3+1+1,即允许学生从理化生政史地6科中选择其中2科。几年下来,常见的几种组合(物理化学组合,物理生物组合,历史政治组合,历史地理组合;这几种占比超过9成)的比例数据见表 1。 从表 1中我们可以看到,实施选考后选考理科的人数比例直接从80%降到了60%左右,甚至在2006、2007年降到了50%左右。这很容易给人一种印象,那就是实施选考制度之后科学学科报考人数大幅下降。但事实上,江苏当时的理科人数下降,更多地应该是客观趋势使然,即前面说的,随着人们生活水平提高,学习物理、化学等“硬科学”学科的人数会降低。之所以得出这个结论,是因为2008年江苏开始有限度地恢复文理分科制度之后,理科报考人数也并没有显著提升。采取了这个制度之后的文理科报考人数的数据见表 2。 从表 2中我们看到,恢复了文理分科之后,选择理科的人数比例依然停留在53%-63%之间,个别年份如2010年,只有不到一半的人选考了物理,比原来还低。如果计算平均分的话,2003-2007年选考理科的年均比例是58.8%,而2008年之后选考理科的年均比例是57.6%。这个比例事实上跟浙江、上海等社会经济发展水平类似的地区是差不多的。如2013年上海学生报考理科的比例是53.40%,2014年理科是57.7%,2015年是62.7%。而浙江2016年理科报名人数是62.9%,2015年是63.3%。 由此可知,虽然这次高考改革同样出现了实施选考制度之后科学学科报考人数下降的现象,但从江苏的历史数据来看,选考制度并不是科学学科报考人数下降的最主要原因。 (二) 计分制度的不公平才是主要原因 这次高考改革除了实施选考之外,还有一项重大改革就是实施等级分。这不仅仅是细微的技术性调整,而是整套游戏规则的改变。原始分计分从某种意义上说也是一种标准参照的计分方式,即学生的成绩是取决于他与题目难度的匹配水平的。如果他答对了所有题目,则满分,一道都没有答对,则是零分。在这种情况下,如果能保证某科(如物理)每年度的题目难度是一样的,那么考生的成绩基本上是可比的,也就不会让人觉得今年考物理或者明年考物理不合算。而如果几科之间的难度大体相当,也就是说考取90分的难度大体是相当的,那么考生基本上也会觉得公平。 虽然事实上,要让某一科或几科的难度都稳定在某一个水平是有些难度的,但原始分计分的好处就是,在拿到考题之前,大家其实是不知道选考这次是“亏”了还是“赚”了的。也就是说,从某种意义上说,命题者还是具有某种操控空间的,比如为了吸引更多的学生选考物理,那么就适当降低一下物理考卷的题目难度,或者提升一下其他科目考卷的难度。 即使有部分学生认为物理、化学的试题难度总是比其他学科高,觉得报考这些科目不容易得高分,从而转考其他科目,但在原始分的计分制度下,这不会造成后续的连锁反应。只要大学招生的导向性在那里,总还是有一批水平非常高的学生不会在意这点难度差异,即便有一些学生的理科成绩不是最顶尖,只要他们的理科成绩明显好于文科成绩,他们也依然会选考物理等科目。这也是标准参照计分带来的好处,即他的考试成绩不会受到其他学生选择的影响,而只取决于他自身的水平与标准(题目)两者。 但这次高考改革采用等级分计分却直接凸显了这方面的风险。以上海市方案为例,只要原始分数达到本次参考人数的前5%,都计A+等级,无论参考人数是5000人还是20000人。而且由于最终要把等级考成绩与高考成绩进行直接相加,又对各等级分进行了赋值:把每科的总分设为70分(即A+等级的为70分),然后每个等级相差3分,即A等级67分,B+等级64分,B等级61分,以此类推。这里同样不考虑学科区别,一视同仁,即无论哪个科目,只要等级分一致(如B),都折算成同一个分数。 这样一来,就给考生传递了一个清晰的信号,那就是他的最终成绩除了取决于他自身的能力,还取决于跟他同时报考这门科目的学生的能力。这就在事实上激励了学生去琢磨其他学生都报考了哪些科目,从而去选择同科“考伴”相对较弱的科目。大家所讨论的“田忌赛马”、趋利避害就是这么来的。 更麻烦的是,当相对较弱的大批考生因为不愿意去做分母而避考物理之后,留下来的尖子生,同样面临要分出ABCD等级的问题,仍然会有一大批尖子生只能拿C等级甚至更低的分数。于是,尖子生中相对较弱的又会离开,最终形成雪崩式效应。也就是说,这个制度的设计从一开始就让考生们知道,除非你是最优秀的前5%考生,否则选考物理就是不合算的。 另外一个不公平就是计分制度大幅压缩了学科冒尖的机会和空间,让学科特长生的优势无从发挥。根据现有计分规则,哪怕是物理学得再好,他也最多只有70分(上海方案),最多领先别人30分。如果以大家关注度最多的“一本线”以上的竞争来说的话,这个优势最多就是6分。因为计分规则明确规定,最好的5%是70分,而进入前15%(大部分省市的一本线)是67分,进入前25%是64分。 所以说,学生避考避学物理等科学科目,主要不是因为这些科目难,而是他们认为选择这些科目会给自己造成不公平,即同样的水平,我选择了物理等科目,总分就很低,而如果我选择了其他科目,我就会有一个很好的成绩。同样的时间精力,我投入物理等科目学习不给我总分增加多少,而我去学习语数外则可能大幅增加我的总分。这才是问题的关键。 五、对几种常见解决思路的利弊分析 实际上,科学学科地位下降,特别是新高考之后物理科选考人数下降的问题,一直是大家对新高考方案关注和评论比较集中的地方之一。浙江于2017年年末出台了修正版的高考方案,其直接动因或压力就是物理科问题。上海市也在做类似的方案完善,物理科问题依然是最主要的原因。也因此,大家基于不同的知识基础和角度立场,就如何解决这个问题提出了不少方案。这里笔者就其中几种影响相对较大的备择方案的利弊做一简单的分析。 (一) 把物理、历史纳入限选科目的备择方案 具体做法就是要求考生在物理、历史中必须选择一门报考,另外2门可以在其他的5门科目中选择(也就是说物理、历史这两门科目也不是互相排斥的,可以两门同时入选)。这种改革方案的呼声很高。如北京大学的浙江招生组组长李祎在2016年的一个会议上就明确说:“有可能北大最后确定下来,物理和历史是必选。”(搜狐教育,2016)在同一个会议上,时任复旦大学招生办主任丁光宏也说:“理科的根源在物理,文科的根源在历史,这个是规律。”(搜狐教育,2016) 这个方案的优势非常明显。首先,它确实能迅速解决目前大家非常关心的物理科报考人数下降的问题。其次,这套方案有一个重大的政策优势就是,它不需要大幅度调整现有政策架构,具有很高的可行性。最后,这种做法已有现成的江苏改革经验可以参照。江苏省直到今天依然是把物理、历史列为“选测科目”,要求学生二选一,然后再在另外的化学、生物、政治、地理4门科目中选择1门。但它的缺点也很明显。 首先,它容易给人恢复到文理分科状态的印象。虽然它事实上也不是之前严格的文理分科,因为它可以允许文科专业要求物理必考。前面说到有江苏经验可以参照,而江苏的做法就是有限度地恢复了文理分科,比如选文科的学生必选历史。 其次,它缩小了学生的选择范围。这在舆论上也很容易遭受质疑,毕竟从以前的两种选择(文理科)扩大到20种甚至35种选择是这次高考改革的一个亮点,要求学生限选物理、历史就等于直接削减了学生的选择空间。虽然事实上削减的也非常有限。以6选3为例,现在是有20种组合可选,如果要求学生在物理、历史中限选一门,学生总的选项就变成了16种。 最后,它可以解决物理科的问题,却很可能造成化学等学科报考人数的下滑。从江苏的历史经验来看,如果将物理、化学、生物三科作为整体来看的话,限选不一定能大幅提高选考科学学科的总人数。 (二) 实施标准参照计分方式的备择方案 实际上,采用等级分本身不是问题,国际上很多知名的考试(如雅思)都是采用等级分。关键是我们依据什么标准去制定等级分。划分学生成绩的等级,简单说有两种方法。一种是我们现在所采取的按人群比例来划分,如前15%就评为A等。这种方法一般称作常模参照。前面说的很多风险就跟这种计分方式直接相关。另外一种方法叫标准参考或者水平参照计分方式,是根据一套外在客观的能力标准,独立地来评判每个考生达到这个标准的程度。因此,每个学生的等级与其他学生无关。这种方法的好处是只要这个能力标准(如我们的课程标准)不变,不同批次考试的成绩都是可比、等值的。如果采用标准参照的等级计分方式,前面所说的风险基本上就可以消除。国际上几个知名考试的等级计分方式,采用的就是这样的方式。 所以,很多人就提出把现有的按比例划等的常模参照计分方法,改为标准参照的计分方式。这个方案的优势很明显。首先,科学性非常强,国际上主要的考试(如雅思)也都是采用这种方法来进行等级划分的。其次,它与学业水平考试的性质非常匹配。标准参照考试考生的成绩只跟他的水平有关,跟其他考生水平无关。从学业水平考试的性质和功能定位上来说,学业水平考试本来就应该是标准参照的。也只有这样,我们才可以真正通过学业水平考试来监测出一个学校或者一个地区的教育发展状况。最后,但也可能更重要的是,这个方法可以从根本上解决不同科目的考分等值问题,不会出现选考物理的学生吃亏的现象,而且也不会造成其他科目的问题。 但它的最大劣势就是,实施难度太高。这不仅仅是考评技术问题,还跟社会诚信制度、公众的科学理解程度和宽容程度等外在环境密切相关。以这个方法所必需的一个环节——建立题库为例,看上去技术问题不难,雅思、托福等考试都在做,但如果放到中国高考的制度背景下,笔者认为,即使是ETS等被认为拥有最高技术水平的考试机构也是完全招架不住的。做题库,需要找学生试测,保密性是否做得到?所有的题目,一次考试之后,培训机构就会来疯狂采集和解密,再多的题目很快都会无济于事。再就是,建基于各种看上去非常科学的统计方法之上的复杂参数估计和分数计算,是否经得起全民猜测与质疑?等等。所以,虽然在很多人看来这是一个非常理想的改革方向,但这个改革思路和方向其实在中国并不可行。 (三) 实施分数校正的备择方案 这次高考改革之所以物理科问题表现得比较突出,除了报考人数下降的问题之外,还在于很多人认为,报考物理科的考生总体水平相对较高,是由于按照固定比例进行划等,导致了物理科考生吃亏。鉴于这种情况,有些人提出要对各学科的等级分进行适当校正。具体的技术方案各不相同,但主要的思路是一样的,那就是根据不同考试科目学生的语数外三科(或者只考虑语数两科)的成绩,对各科的等级分的赋分进行校正(即不是所有科目的B都会被赋予同样的分值),或者对各科等级分的人数比例进行校正(即不是所有科目的B等级都有同样比例的考生),这样就可以把不同科目考生群体的质量也纳入考虑范畴。 我们可以举一个可能的例子来说明问题。假设,某年物理科考生中有8%的考生的语文成绩进入了A+,有12%的人数学进入了A+,那我们取均值,即可以认为物理科10%的考生语文数学成绩是A+。那么,就允许当年物理科有10%的学生记为A+等级,而不是之前的5%。当然,这里可以把物理科成绩与语数总分的相关系数考虑进去(比如0.8),允许专家根据不同情况在8%-10%的A+比例中最终确定一个数值。同理,我们可以计算出各科各等级的考生的比例范围。 在现有的各种制约条件下,这种方法不仅仅考虑群体内的次序,还考虑到了群体之间的水平差异,可以较好地做到科目成绩比较的公平性问题。我国香港地区就是用类似的方法来校正不同选考科目或试题的分值的,各方反响不错,取得了比较好的效果,可借鉴性强。 它的缺点就是:一,技术方案比较复杂,公众解释会遇到一定的困难;二,需要对现有考试架构做一些调整,比如要把语文数学考试时间与等级考的时间尽量接近。但综合起来考虑,笔者依然认为这是一个值得努力的方向(具体技术方案可以再调整讨论)。上海在这方面有一定的基础,我们乐见上海市能够在这方面做出一些示范性探索,为全国高考制度的完善提供独特的经验。 (四) 调整考生基数的备择方案 这就是浙江省于最近颁发的高考修正方案中所采取的思路。官方的说法叫建立选考科目保障机制,其中的关键就是确定物理学科报考人数。浙江省根据2013-2017年授理学、工学学位专业在浙江省的高考录取考生人数,来确定物理科目保障数量为6.5万。他们认为这是满足省内外高校在全省选拔培养理工科类专业人才最基本的生源保障,并在此基础上提出了实行选考科目保障机制后的赋分办法。具体说就是,如果物理选考科目某次考试赋分人数多于6.5万,将继续以实际人数为基数,按规定比例、规定办法赋分。当物理选考科目某次考试赋分人数少于6.5万,将以6.5万为基数,按规定比例计算各等级人数,从高到低进行等级赋分。 这个方案的优点是非常容易操作,而且也确实能解决一部分问题,特别是能给考生一定的信心,不会出现之前很多人担心的物理科报考人数崩盘的现象。但缺点就是,一,解决问题的思路带有很强的计划经济的味道。力学、工学专业需要物理学考生,难道其他专业就不需要必考物理学了?二,它解决了考生崩盘的风险,但目前所反映出来的科学学科地位下降的问题,如拔尖学生无法脱颖而出(总的来看,浙江的方案在这点上要比上海的方案好)、物理考生在计分上吃亏等问题并没有解决。 六、在新高考架构中增强科学学科地位需要“三板斧” 总结前面几部分的分析,笔者认为,要解决新高考改革之后科学学科地位下降的问题,关键是解决三个问题,也需要相应的“三板斧”。 首先是不要让物理、化学等科学学科报考学生感觉自己吃亏。这方面的问题、原因前面都分析了。最好的解决方案前文也提到了,那就是建立基于语数学科成绩的分数校正方案,把不同科目考生的整体学术水平也考虑进去。这是第一板斧。 其次是要大幅扩大科学学科的分值范围,让对科学学习有兴趣的学生有足够的空间来施展自己的兴趣和才华,让科学学科拔尖学生有脱颖而出的机会。具体的办法有很多,一个重要指标就是这些学科的标准分要高。一个模糊的标准就是,物理、化学等科目的标准差要达到数学的一半左右。关于这个问题的现象、原因及背后的原理,前文也已有较为详细的描述,此处也不再赘述了。这是第二板斧。 最后一板斧是要在高校的招生自主权与招生能力上做足功夫,即在“招”这一端多用力。解决科学学科地位问题,关键还是要抓住高校招生这一环节,在增强高校的招生自主权的同时,引导高校提升招生能力来解决这个问题。这一方面是因为,招生制度本来就是高考改革的有机组成部分,甚至是最重要的部分,而目前这轮高考改革试点工作在这方面做出的突破相对还不足。另外一方面,考生应该考什么学科,考到什么程度,高校最有发言权。换言之,科学学科是否重要,以及重要到什么程度,还是要由各高校来判断,而不应该是由省级考试机构或者行政部门来决定。 具体地说,有两条举措是重要的。首先,取消“学生满足其中任何1门,即符合报考条件”的规定,由大学各专业自主决定必考科目,甚至允许他们规定各科的考试权重。这次高考改革试点,上海和浙江都有一条非常关键的政策规定,那就是在高校所指定的必考科目中“学生满足其中任何1门,即符合报考条件”。这条政策造成的直接后果就是,理论上的高校科目指定权事实上大幅缩水。如果某个高校指定了3门选考科目,那它就基本上等于什么都没有指定,因为在20种任意组合中,有19种可以满足要求。 其次,要支持高校把综合素质评价权用起来。实施“两依据一参考”是本次高考制度改革的“纲”。但试点到现在,“一参考”依然是“羞羞答答”。分数至上的理念还是根深蒂固:即使在总分相同的条件下,还是不允许高校根据学生的综合素质表现来进行自主录取,而是非得根据不同学科的得分一一把学生名次排出来才安心。所以,应该允许高校把科目要求纳入到综合素质评价方案中(比如提出“物理成绩达到X分以上优先录取”),允许高校在总分同分甚至相差3分(一个等级分)之内根据学生的综合素质进行录取。当然,与此同时,要切实加强对高校招生能力和责任心的培养和督查。比如要求高校各专业的招生方案至少提前2年公布,并能够对自己的招生方案进行解释。