,
從教育測量學(xué)的角度反思新高考的科目設(shè)置
胡中鋒,董標
自1952年8月首次實行全國統(tǒng)一高考制度以來,65年間,數(shù)不清考試科目變換了多少次。前25年,以“文革”起落為界,在時間段上,有若干不可比之處。后40年與前25年,也有一些不可比的時間段。所以,今天論高考科目改革,往往只是討論近40年來的情況。
也是在這40年間,學(xué)界和社會各界,對高考科目設(shè)置等方面的認識,顯著提高了。一些深層次的沉珂積弊逐漸暴露,引發(fā)關(guān)注。到了把問題明確化、尖銳化,剪除榛莽,兼治標本的時候了。長此以往,持之以恒,勢必推進高考制度愈發(fā)合理。需要說明的是,本文只是從教育測量學(xué)角度出發(fā),論列現(xiàn)行中國大陸高考科目設(shè)置的突出問題,不涉及高考實際存在的其他問題,也與港澳臺的高考模式無涉。
40年來,高考科目組合模式歷經(jīng)多種變化。比如,“文六理七”模式(理科考七門、文科考六門的模式,1981年起實行);“3+2”模式(理科不考生物、政治,文科不考地理,1993年開始實施);“3+X”模式(又有多種組合, “3+綜合”模式,綜合又分文綜、理綜和大綜合等,1999年最先在廣東實行)。
2017年,浙江省高考采用的是“3+3”模式,不分文理科,第一個“3”指語文、數(shù)學(xué)、英語三科(全國統(tǒng)一高考),后面的“3”是從其他七科(包括物理、化學(xué)、生物、政治、歷史、地理、技術(shù)等)中任選三科(由省組織高中學(xué)業(yè)水平考試),英語可考兩次,取其中成績最好的一次作為最終成績。同年,上海市的高考也實行了“3+3”(語、數(shù)、英,加上從物理、化學(xué)、生物、歷史、地理和政治六科中任選三科)模式。
這兩種新的高考模式(以下簡稱“新高考”),剛一實行就引起很大的爭議?!叭嗣癫粷M意”,我們就必須探究并嘗試循序漸進地解決問題——新高考科目設(shè)置到底存在什么問題?原因何在?有無有效解決之良策?
新高考采取的是“3+3”模式,前面的“3” 是指語文、數(shù)學(xué)和英語三科,是所有考生的必考科目,也稱核心科目。高考科目設(shè)置合理性的第一個問題,就是所謂核心科目設(shè)置是否合理。若核心科目設(shè)置存在嚴重偏差,就無法保證國家考試的公正性和科學(xué)性。把核心科目數(shù)設(shè)置為“3”,即語、數(shù)、英三科,這一設(shè)置的善良意愿值得稱道:突出重點,引導(dǎo)教學(xué)。但再善良的意愿,一旦與認識合理性斷緣,就難免為主觀愿望左右,脫離實際,違背科學(xué)。
首先,核心科目數(shù)的設(shè)置為奇數(shù),存在課程倚重問題。奇數(shù)科目,意味著必然存在某兩科的相關(guān)程度高于它們各自與第三科的相關(guān)程度,除非增設(shè)一個與另外兩科相關(guān)程度相同的課程,即中性課程,比如體育。但目前的主考機關(guān)不是這樣做的,也料不定其是否考慮起而行之。
同類的萬事萬物,普遍存在多層次的復(fù)雜聯(lián)系。多科考試的科目之間,一定存在高度相關(guān),只是我們目前對它們的相關(guān)方式和相關(guān)程度的認識,比較膚淺。比如,我們能說語文、數(shù)學(xué)和英語這三科之間存在不同的相關(guān),但說不出它們的相關(guān)程度到底是一個什么指數(shù)。假設(shè)語文與英語的相關(guān)度高于語文與數(shù)學(xué)的相關(guān)度,也高于英語與數(shù)學(xué)的相關(guān)度,那么考生中的數(shù)學(xué)英才在考試尚未開始舉行前就已經(jīng)被劃歸到“處境不利者”之列。這有悖于選拔性考試的公平原則和擇優(yōu)原則。
其次,目前的核心科目明顯地偏重語言能力。因為三科中語言能力占了兩科(語文和英語),導(dǎo)致語言能力在高考中出現(xiàn)重復(fù)累加。
因為女生的語言能力往往比男生更具優(yōu)勢,所以語言能力測評在高考中重復(fù)累加會導(dǎo)致語言能力相對劣勢者(男生)處境不利。 同時,城鄉(xiāng)考生在英語成績上也存在極為顯著的差異。(根據(jù)筆者對華南師范大學(xué)2015級學(xué)生高考各科成績數(shù)據(jù)分析得出以上結(jié)論,限于篇幅,在此省略有關(guān)統(tǒng)計表)。
城市學(xué)生的英語成績顯著高于農(nóng)村學(xué)生。如果考慮到農(nóng)村人數(shù)的比例遠遠大于城市人口,這種不公就更加明顯、更加難忍。這會不會是當前高校(特別是重點高校)農(nóng)村學(xué)生偏少的原因之一呢?
最后,三核心學(xué)科模式不能真實反映語文、數(shù)學(xué)和英語(外語)的實際學(xué)習(xí)難度(以yn表示)和多變的重要程度(以xn表示)。語文是母語,教學(xué)時間應(yīng)遠遠多于其他科目;數(shù)學(xué)蘊含一般思維能力、運算技巧和審美趣味,教學(xué)時間也與語文相當;而英語則是到一定年級才開設(shè)的,教學(xué)時間普遍且正當?shù)乇日Z文和數(shù)學(xué)少。
現(xiàn)行三核心學(xué)科模式合理化的前置條件是:就yn和xn而言,語文(L)=數(shù)學(xué)(M)=英語(E),即L=M=E。
L=M=E成立的前置條件是:所有三個學(xué)科各自的xn和yn,是一個恒定的等量。
而無論是在常識里,在事實中,還是在理論上,“所有3個學(xué)科各自的xn和yn,是一個恒定的等量”這一前置條件為假。
所以,在邏輯上,三核心學(xué)科模式是不合理的,甚至是荒謬的。
高考科目設(shè)置合理性的第二個問題是,選考制度合理嗎?在新高考科目設(shè)置的“3+3”中,后面的“3”科是選考科目。設(shè)置選考科目的初衷是,給學(xué)生提供充分的選擇權(quán),讓學(xué)生根據(jù)自己的興趣和特長選擇考試科目,有利于抹平現(xiàn)存差異在總分上的直接再現(xiàn),有利于學(xué)生的知識健全,有利于學(xué)生的終身發(fā)展。上海市采用的是六選三,有20種不同組合;浙江省的是七選三,有35種不同組合。
千慮恐一失,一失廢前功。
第一,選考科目基本還是傳統(tǒng)的科目。雖然浙江省增加了技術(shù)科目(包括信息技術(shù)和通用技術(shù)),但其余六科還是傳統(tǒng)科目,包括物理、化學(xué)、生物和歷史、地理、政治。即新高考只是在傳統(tǒng)的科目數(shù)上做文章,與傳統(tǒng)的“3+X”模式無本質(zhì)不同,只是這里的X等于3而已。
為何是“3”科而不是其他的數(shù)目?選一科為何不行?選兩科呢?選四科呢?諸如此類的問題,不能得到令人滿意的回答。
第二,選考科目設(shè)置違背測量學(xué)原理。在測量學(xué)中,若諸考生的選考科目不同,則考試分數(shù)無法直接比較。比如,張三選考了物理、化學(xué)、生物,李四選考了物理、化學(xué)、政治??荚嚨目颇坎灰粯樱}目的難度也不一樣,分數(shù)單位明顯不等值,因此原始分數(shù)無法比較。60分的物理,與60分的生物或政治,沒有任何可比性。因此,求和所得的任何總分,都是不合理的。
采用標準分數(shù),也無法比較。標準分數(shù)是一種相對位置量數(shù),只有考生總體相同,才能比較相對位置的高低。比如,A考生在選考物理的考生中處于10%的位置,B考生在選考政治的考生中也處于10%的位置,但由于考生總體不同,就不能認為考生A和B的相對位置等值。
新高考目前采用的是將原始分數(shù)換算成等級,再按等級換算成分數(shù),這種思路也是計算考生在所屬總體中的相對位置。每門課程的難度不一樣,很可能出現(xiàn)能力高的考生選考了難度大的科目(比如物理),結(jié)果處于較低的位置。能力低的考生由于選考了難度低的科目(比如政治),可能處于較高的位置。這明顯是不公平的。
目前,浙江省的做法是按比例換算成等級,但這非但不能改變不同組合不可比的根本屬性,而且還滋生了新的弊端。比如,導(dǎo)致考生個人、學(xué)校教師和監(jiān)護人產(chǎn)生投機取巧心理。2017年,浙江省考生選考物理的最少,選考政治的人數(shù)竟然排在第三位。這是因為很多考生采用“錯科競爭”的策略,即避開能力強的考生所選考的科目。還有的考生,有意擠壓能力低的考生。比如,有些英語能力強的考生,即使第一次英語考試分數(shù)很高,仍然參加第二次英語考試(英語有兩次選考機會,取成績高的一次),為的就是不讓能力差一些的考生獲取較高的等級。這都是明證。(劉希偉:《新試點高考招生制度:價值、問題及對策建議》,載《教育發(fā)展研究》2016年第10期;劉盾:《新高考改革之現(xiàn)實審思與理論分析》,載《復(fù)旦教育論壇》2017年第3期。)
第三,選考科目的組合既沒有與高校的專業(yè)對接,也不符合高等教育改革和發(fā)展的方向。上海市的20種選擇和浙江省的35種選擇實際上已經(jīng)表明,主考機關(guān)并未掌握學(xué)科組合的合理性。試想,這么多的組合如何與高校的相應(yīng)專業(yè)對接?以后,高校錄取將主要按專業(yè)錄取。這樣會不會出現(xiàn)能力低的學(xué)生選考了冷門專業(yè)所要求的課程,從而比能力高的學(xué)生錄取到更好的學(xué)校?現(xiàn)在的高校普遍實行大類招生,進校后轉(zhuǎn)專業(yè)已成為常態(tài)。這樣,會不會出現(xiàn)一些考生“曲線進好學(xué)校,再進好專業(yè)”的現(xiàn)象?
關(guān)鍵問題是:高考科目究竟能否選考?選考科目的設(shè)置會對學(xué)生個人、學(xué)校教師和監(jiān)護人的情感、思想和態(tài)度產(chǎn)生什么后果?會對高等教育質(zhì)量帶來什么影響?
以前,通過文理分科解決了這個問題。但自從“3+X”模式出現(xiàn)之后,特別是目前的新高考采用“七選三”或“六選三”模式,問題變得更加突出了。從測量學(xué)的角度看,選考不同科目的考生,無法直接比較考分。因為考生群體不一樣,即使轉(zhuǎn)換成標準分也無法比較?!捌哌x三”模式有35種組合,如此多的組合,分數(shù)又無法比較,實在是難以體現(xiàn)高考的公平性。
從2017年浙江省的高考情況看,選考制度確實衍生出很多與人才選拔的目的背道而馳的不良做法。其實,有些做法的直接受害者是考生個人。比如,考前大家預(yù)測,選考物理的最多、選考政治的最少,但實際上最終選考物理的最少、選考政治的卻高居第三。這“預(yù)測”實際是在造勢,極容易形成一種輿論操縱,等于是在若干不確定的高考變量之外,陡增一個十分消極且十分有力的自變量。
學(xué)科與專業(yè)關(guān)聯(lián),必然會影響選考的人數(shù),進而影響高校的人才培養(yǎng)。 “熱門”專業(yè)人才扎堆,“冷門”專業(yè)無人問津,造成專業(yè)發(fā)展不平衡。某些領(lǐng)域人才短缺,并不利于社會和諧發(fā)展。2017年浙江省的高考結(jié)果就出現(xiàn)了一種很奇怪的現(xiàn)象。有些分數(shù)很高的考生,被錄到獨立學(xué)院,這恐怕就是按專業(yè)錄取考生出現(xiàn)的明顯弊端。因為沒有設(shè)置學(xué)校的錄取線,學(xué)生所填的專業(yè)全是熱門專業(yè),而名校的熱門專業(yè)容納不了那么多的考生,很多高分考生自然得另尋歸處。
高考科目設(shè)置的合理性的第三個問題是,各科目的權(quán)重設(shè)定是不是合理的。所謂權(quán)重,是指部分在總體中所占的比例。多科考試必須對各科的考試結(jié)果進行合成,目前采用的是直接相加求和的方法。這種計算方法存在多個問題,其中之一就是把各科的權(quán)重都設(shè)為“1”,實際上是等權(quán)求和方法。因為任何數(shù)與“1”相乘就是這個數(shù)本身,所以雖然從形式上看似乎沒有權(quán)重,但實質(zhì)上是等權(quán)相加。
要把幾個數(shù)量直接相加,必須滿足以下三個條件。
一是單位相同。單位不同,無論如何是不能直接相加的。比如,1米加1公斤等于多少呢?它們完全是不同的單位。但有時看似單位相同,而實質(zhì)上并不同,就有可能犯錯了。比如,“1個(蘋果)+1個(雞蛋)”“1元(人民幣)+1元(日元)”“1分(鐘)+1分(田)”等,單位都是比較模糊的,往往我們就直接相加了。把原始分數(shù)直接相加就是犯了這類錯誤。
二是權(quán)重(重要性程度)要相等。殊不知,權(quán)重不同,即使各科的分數(shù)相同,其合成的結(jié)果也是不一樣的。比如,語文和數(shù)學(xué)都是100分,如果各自的權(quán)重都為1,其和為200分;但如果語文的權(quán)重為1.2,數(shù)學(xué)為1,求和就是220分了。過去,曾經(jīng)通過設(shè)定高考各科總分不同的辦法突出各科的權(quán)重問題。比如,英語從高考不考(權(quán)重為0),到高考占10%(1979年),再到占30%(1980年),再到占100分(此時數(shù)學(xué)和語文各占120分,1986年),后來,到盛行“3+X”模式的時候,英語一躍和語文、數(shù)學(xué)平起平坐了。生物在高考中也曾只占70分。很顯然,目前中學(xué)各科的重要程度是不一樣的。我們不應(yīng)該完全忽視這個問題。
三是各個加數(shù)要相互獨立,否則也不能直接相加。這個問題略為復(fù)雜,不在此贅述,可參閱有關(guān)的教育測量著作,如《教育測量與評價》(胡中鋒著,廣東高等教育出版社2006年版)。
新高考各科的權(quán)重存在兩個突出問題。
一是把核心科目視為等權(quán)。比如,浙江和上海都把語、數(shù)、英三科的滿分定為150分,求和時直接相加,即語、數(shù)、英三科等權(quán)相加。那么,語、數(shù)、英三科是否等權(quán)呢?無論從哪個方面看,這三科都不等權(quán)。
二是把所有的選考科目也作為等權(quán)科目對待。浙江省三門選考科目各占100分,上海市的則各占70分。也就是說,在浙江省,選考科目占核心科目2/3的權(quán)重,而上海市的選考科目只占核心科目的7/15的權(quán)重(不到1/2)。另外,上海市的選考科目相當于占浙江省選考科目70%的權(quán)重。二者設(shè)定選考科目權(quán)重的依據(jù)何在?事實是,它們一同向世人昭示,科目權(quán)重的設(shè)定,是任意的。
筆者未見到任何有關(guān)的研究成果支持它們二者任一的權(quán)重設(shè)定方式。
權(quán)重設(shè)置不公帶來的危害是嚴重的。由于英語和母語權(quán)重相同,讓人們誤以為英語與母語同等重要,過度的英語學(xué)習(xí)成為常態(tài),浪費了很多的教學(xué)時間。但實際上,英語并非對所有人都有同等重要作用。
對各科權(quán)重的問題,可以通過很多的研究方法來解決。關(guān)鍵是我們完全忽視了這個問題。
任意設(shè)定權(quán)重的做法產(chǎn)生了嚴重的誤導(dǎo)作用:讓人們誤以為核心科目比選考科目重要,讓人們誤以為所有的選考科目同等重要。既然科目可以選考,必然出現(xiàn)選擇易得分科目的人數(shù)過多的現(xiàn)象,這恐怕辜負了考試設(shè)計者和施行者的良苦用心。
高考最應(yīng)該體現(xiàn)的就是公平、公正原則。按照《正義論》的作者羅爾斯的一種觀點,當公平遇到挑戰(zhàn)的時候,應(yīng)該更加傾向于弱勢群體??筛呖嫉目颇吭O(shè)置恰恰違背了公平、公正原則,且?guī)в袊乐卣n程歧視傾向。
長期以來,我們對這類問題缺乏充分的科學(xué)研究。因此,高考科目組合變化無常,缺乏科學(xué)性和穩(wěn)定性。當事人疲于應(yīng)對,輿論界戲謔成趣。國家考試有失公信力,教育過程缺失凝聚力。
高考存在很多不同類型、不同層次的問題,這些問題又縱橫交錯、相互影響。但與人民群眾切身利益關(guān)系最為密切的,是科目設(shè)置隱匿的不公問題。我們必須認真研究怎樣提高高考科目設(shè)置的合理性問題,斷不可倉促、貿(mào)然地將未經(jīng)充分、合理檢驗的某種(一些)模式推向全國。
胡中鋒,湖北荊州人,心理學(xué)博士,華南師范大學(xué)公共管理學(xué)院教授;董標,江蘇徐州人,教育學(xué)博士,華南師范大學(xué)教育科學(xué)學(xué)院教授。)
華南師范大學(xué)學(xué)報(社會科學(xué)版)2017年5期