譚小莉 彭文波 李祚山
(重慶師范大學,重慶 400047)
2014年9月,國務院發(fā)布的《關于深化考試招生制度改革的實施意見》指出,探索基于統(tǒng)一高考和高中學業(yè)水平考試成績、參考綜合素質評價的多元錄取機制,并指出普通高中學業(yè)水平考試主要檢驗學生的學習程度,是學生畢業(yè)和升學的重要依據[1]。2014年12月,教育部發(fā)布的《關于普通高中學業(yè)水平考試的實施意見》提出了學業(yè)水平考試成績的呈現(xiàn)和使用原則,即計入高校招生錄取總成績的學業(yè)水平考試3個科目成績以等級呈現(xiàn),其他科目一般以“合格、不合格”呈現(xiàn)[2]。因此,學業(yè)水平考試成績的分數轉換與總分合成是此次新一輪高考綜合改革的一個關鍵問題,直接涉及考試的公平性、高校招生的選拔性、基礎教育的導向性以及高考自身的科學性。
本文運用2類分數轉換方法:一是等級賦分方法,以浙江、上海、山東3省市的高考改革方案、百分位等級分段成績轉換方案為例;二是正態(tài)化轉換方法,以必考科目為錨的等值標準分方案、標準正態(tài)轉換后的T分數方案以及斯坦福成就測驗中的正態(tài)曲線當量呈現(xiàn)方案。運用這7種方案對某市高考模擬成績作簡要的處理和分析,研究7種方案考生成績的變動情況。
新一輪高考綜合改革選定浙江、上海從2014年秋季入學的高一年級學生開始試點,要求為其他省份的高考改革提供依據。2018年3月下旬,山東省人民政府發(fā)布高考改革方案。在上述3個省份發(fā)布的招生考試實施方案中,選考科目的計分基本上按照從卷面分到等級再到等級分的轉換過程。
1.1.1 浙江方案
浙江高考方案的必考科目為語文、數學、外語,各科滿分成績?yōu)?50分,選考科目為從歷史、地理、政治、物理、化學、生物、技術7門中任選3門,將選考科目通過等級賦分后與必考3門科目的分數相加,所得總分即為高考最終成績。在浙江方案中,以高中學業(yè)水平考試成績的合格成績?yōu)橘x分前提,起點分為40分,滿分100分,共分21個等級,每3分為一個等級分差[3],見表1。浙江方案的優(yōu)點在于對選考科目成績進行等級轉換后各科成績可以進行比較,缺點在于經過等級賦值后選考科目的分數區(qū)間從0~100分減小到40~100分,縮小了考生之間的差異,使得分數較為集中。
1.1.2 上海方案
上海高考方案選考科目、必考科目以及總分合成與浙江方案大體相同。2個方案的差異在于:上海方案將高中學業(yè)水平考試成績劃分為11個等級,等級A+賦值后為滿分70分,等級E賦值后最低分40分,每個等級之間的分差為3分[4],見表2。由于浙江方案與上海方案的轉換路徑基本一致,因此2個方案的優(yōu)缺點相差無幾。此外,上海方案將原始成績分為11個等級,大大減小了原考生成績之間的區(qū)分度,導致考生成績排名錯位的概率較大。
1.1.3 山東方案
山東高考改革方案將高中學業(yè)水平考試成績劃分為8個等級,參照正態(tài)分布原則劃分每個等級所占人數比例。等級考試科目成績計入考生總成績時,依照等比例轉換法則,得到考生的等級成績[5],等級與賦分區(qū)間見表3。山東方案的優(yōu)勢在于,按等級賦分后影響分數位次變化的概率較小,缺點同樣是經過等級轉換后的分數區(qū)間減小,考生成績在30~100分浮動,降低了原始成績的區(qū)分度。
1.1.4 百分位等級分段成績轉換方案
綜合浙江、上海高考方案的優(yōu)勢和缺陷,北京市教育學會在2018年1月提出了基于“百分位等級”的分段成績轉換方案[6]。百分位等級是指在考生群體中低于該分數的考生人數的百分比,即考生在群體中所處的位置。例如,某原始分對應的百分位等級為80,表示在該群體中有80%的考生成績低于該原始分。百分位等級越低,個體所處的位置越靠后。此方案在很大程度上汲取了浙江和上海方案的優(yōu)點,比如可以以等級的方式呈現(xiàn);同時也在很大程度上規(guī)避了這些方案的不足。
表1 浙江方案選考科目賦分比例與賦分值
表2 上海方案選考科目賦分比例與賦分值
表3 山東方案選考科目賦分比例與賦分值
百分位等級的分段成績轉換方案是先將各個科目成績進行百分位等級排序,然后將每個等級進行1~100分賦值,并確定拐點分。拐點分是指原始分和百分位等級分相同的分數。以2016年某地高考歷史科成績(由文科綜合試卷分解)為例,對考生成績進行百分位等級轉換,結果如圖1所示。在拐點分之上,百分位等級分高于原始分;在拐點分之下,原始分高于百分位等級分。在等級賦分過程中,如果按照浙江、上海方案,40分為計分起點,就會產出3個分數段位,處理方式有所差別:1)拐點分以上,等級分即為賦值分;2)原始成績位于40分與拐點分之間,取原始成績;3)原始成績低于40分,統(tǒng)一賦值為40分。對于第3)步分數段位的處理,與上海、浙江方案的最低賦值分相同。采用分段賦分可以避免考生成績縮水而造成心理上的不平衡,而且轉換選考科目成績后,可以比較合理地調整和改善各學科的成績分布形態(tài),使各學科的成績分布形態(tài)趨于相同,因此可以進行各學科成績的比較和分數加總。百分位等級的分段成績轉換方案的缺點在于:分段賦分后,選考科目成績一部分是原始分,一部分是等級分,這些分數能否加總值得商榷。
圖1 2016年某地高考歷史學科原始分與百分位等級對比[6]
正態(tài)化方法的基本思路是,當考生群體足夠大或者卷面分接近正態(tài)分布時,將該選考科目考生的卷面成績的平均值作為整體水平的參照點,并將標準差作為單位轉換卷面分[7]。在線性轉換之前,需要將每個科目成績正態(tài)化,找出其正態(tài)化Z分,如圖2和圖3所示,然后再轉換。在正常情況下,簡單轉換公式為:
其中,Z=(X-M)/S,X是某個考生的卷面分數,M是全體考生卷面分均值,S是全體考生卷面分的標準差,A是轉換系數,B是轉換常數,SS是轉換后的分數。
圖2 原始分或等級分分布
圖3 正態(tài)化分數分布
1.2.1 以必考科目為錨的等值標準分方案
不同選考科目的考生群體不同,每個科目測驗的難度和區(qū)分度也不盡相同,單純用總分相加顯然是錯誤的,因此需要對分數進行轉換。有專家提出假設選考某一科目的考生群體在各科的能力分布相同,就可以通過某一考生群體如政治科目在語文、數學、外語科目上的表現(xiàn),調整該群體在政治科目群體上的分布[8]。
由于考生都要參加語文、數學、外語科目的考試,因此在語文、數學、外語成績的基礎上進行分數轉換后,每個考生的總成績是可以進行比較的。大致步驟為:先以百分位等級排序,再求出所有科目正態(tài)化Z分和基礎分,并求出語文、數學、外語的正態(tài)化標準分,記為T語文、T外語、T數學,然后求出基礎分的正態(tài)化標準分,記為T基礎:
用每個選考相同科目群體的基礎分為錨,以此求出相應選考科目的成績。此方案符合測量學理論,將選考科目與必考科目實現(xiàn)等值,分數分布的基本形態(tài)沒有發(fā)生改變,等值前后與基礎分的相關系數完全相同,提高了分數的科學性,分數更加合理。分數等值后,各選考科目與必考科目建立了關聯(lián),最大限度地簡化了錄取分數線的設定;但是此方案轉換較為煩瑣,需要經過4次轉換,對社會進行分數解釋時難度較大,同時會出現(xiàn)極端分數。
1.2.2 標準正態(tài)轉換后的T分數方案
在正態(tài)分布下,標準差與概率(面積)存在一定的關系,如圖3所示。在正態(tài)分布中,±1、±1.96、±2.58個標準差之間分別包含了68.27%、95%、99%的考生。利用正態(tài)曲線的這一規(guī)律,可以明確每個分數在總體中的具體位置,即考生的排名情況。
此方案在分數合成之前,首先要將各選考科目成績標準化。在正態(tài)轉換之前,需查看各學科成績的分布形狀及其描述參數(偏度和峰度),根據變量的分布形狀,決定是否轉換。如果偏度值為0,則完全對稱,這種現(xiàn)象比較少見;如果偏度值為正值,則說明該變量的分布為正偏態(tài);如果偏度值為負值,則說明該變量的分布為負偏態(tài)。直觀檢查無法判斷偏態(tài)的分布是否與對稱的正態(tài)分布有顯著的差別,因此需要做顯著性檢驗。與其他統(tǒng)計顯著性檢驗一樣,偏度的絕對值如大于其標準誤差的1.96倍,則被認為是與正態(tài)分布有顯著差別[9]。如果檢驗結果顯著,則可以通過轉換實現(xiàn)或接近對稱。
此方案選取必考科目標準差為15,平均數為100,必考科目分數=100+15Z;選考科目標準差為7,平均數為70,選考科目分數=70+7Z。此方案優(yōu)點在于,經過標準正態(tài)轉換后,各科目之間能夠進行對比分析,區(qū)分度較大;缺點在于,正態(tài)轉換較為復雜,理解起來有難度,容易出現(xiàn)極端成績等現(xiàn)象。
1.2.3 斯坦福成就測驗中正態(tài)曲線當量方案
根據斯坦福成就測驗,對學生的能力要從多個方面進行評估,正如高考的各科測試。分數的呈現(xiàn)方式也分為4種:百分位等級、標準9、年級當量、正態(tài)曲線當量。百分位等級前文已述及;標準9是按1~9分記分,可以與自己以前的得分進行比較,如果一個學生每年的得分都一樣或者更高,說明學生表現(xiàn)正?;蛘弑憩F(xiàn)進步;年級當量是指該考生的成績相當于幾年級的水平,得5.2分是指達到了5年級第2個月的水平,而不一定是5年級;正態(tài)曲線當量是指考生在正態(tài)曲線上的得分,50%是平均值,相當于9分制的5分,中值以上的一個標準偏差為84%(9分制7分),中值以下的一個標準偏差為16%(9分制3分)[10]。
此方案選取標準差為21.06,平均數為50,因此選考科目正態(tài)曲線當量得分=21.06Z+50。此方案優(yōu)點在于,經過標準正態(tài)轉換后,各科目之間能夠進行對比分析,而且區(qū)分度較大;缺點在于,對于必考科目沒有進行轉換等值,正態(tài)轉換不易理解,也容易出現(xiàn)極端成績等現(xiàn)象。
本研究的數據來源于某市2017年高考分數的虛擬轉換。將語文、數學、英語3門必考科目轉換為標準分數,再以100分為基準加減3倍標準差,將其轉換為滿分為150分的虛擬轉換分數;然后,在轉換分數的基礎上,虛擬出政治、地理、生物、歷史、化學、物理6門選考科目分數,滿分為100分。在此基礎上,隨機確定考生可能出現(xiàn)的20種選考科目組合,確保每名考生參考科目為3門必考科目和3門選考科目。本研究假定高考模擬成績滿足各個方案的前提要求,以此作進一步分析。數據的基本特征見表4。
采用SPSS 21.0軟件,根據前述7種分數轉換方案分別運算,對研究數據進行描述統(tǒng)計、數據分割與轉換,得到在各個方案下選考科目的轉換分數值與選考科目分數的合成,比較分數變動的趨勢。
按照每個方案對模擬數據進行處理,如表5所示。假定將模擬數據中的考生視為在合格考試中合格,因此浙江方案、上海方案、百分位等級分段方案中最低分為120分,考生總成績分布區(qū)間要比原始成績區(qū)間小,意味著相應的區(qū)分度就小。前述后3種方案由于運用Z分數進行線性轉換,容易產生極端分數。
表4 各科分數描述性統(tǒng)計
表5 7種方案總分比較
使用偏度和峰度可以描述成績分布情況。偏度體現(xiàn)成績的高低情況,如果偏度為正,則表示低分人數多于高分人數;如果偏度為負,則表示高分人數多于低分人數。峰度體現(xiàn)成績的集中程度,如果峰度大于0,表明分數分布較為集中;如果峰度小于0,則表明分數分布較為分散。表6是對數據進行轉換、統(tǒng)計后得出的描述性統(tǒng)計量,分別給出了7種方案下的偏度和峰度。
由表6可知,原始總分的偏度為-0.355,峰度-0.192;浙江方案的總分偏度-0.229,峰度 -0.469;上海方案的偏度-0.218,峰度-0.594;山東方案的偏度-0.202,峰度-0.339;百分位等級分段方案的偏度0.103,峰度-0.717。除百分位等級分段方案外,浙江、上海、山東方案偏度均小于0,說明這3種方案下的高分人數多于低分人數。以必考科目為錨的等值標準分方案,偏度和峰度都為0,說明轉換后合成的總分分布與正態(tài)分布完全相同,這是因為在轉換過程中此方案將數據進行了4次轉換,逐步趨近正態(tài)分布。正態(tài)轉換后的T分數方案偏度為-0.023,峰度為0.029,此方案是先對所有科目進行的正態(tài)化,再將線性轉換后的分數相加,因此,要比以必考科目為錨的標準分轉換方案的偏度和峰度要大。同理,正態(tài)曲線當量的總分是由標準化后的選考科目成績與原始的必考科目成績相加,因此偏度和峰度相對更大,偏度為-0.185,峰度為-0.164。
表6 7種方案總成績的描述性統(tǒng)計
相較幾種方案,百分位等級分段方案的偏度大于0,說明該方案低分人數比高分人數多;以必考科目為錨的等值標準分方案偏度為0,說明低分人數與高分人數相當;其他幾種方案的偏度都小于0,說明高分人數比低分人數多,而且原始分算法的高分人數更多。前4種方案的峰度都小于0,分數分布較分散,而且百分位等級分段方案分數的分散程度最大,后3種方案分數分布較集中。
圖4 按浙江方案轉換各選考科目賦分值變化情況
圖5 按上海方案轉換各選考科目賦分值變化情況
選考科目的計分方式改變,考生分數就會隨之發(fā)生變化,接下來討論轉換后的單科成績相對于原始分的變化情況。
3.2.1 浙江方案單科成績分數變化
圖4反映的是按照浙江方案對各科選考科目成績進行轉換后,與原始分相比分數增加或減少的情況。綜合各科目賦值變化可以得出,經過等級賦值后,99%的考生每科分數都會提升,這是因為成績最高的考生,等級最高;最高的等級賦值分是100,而原始分算法很少考生能夠滿分,因此分數增加。
3.2.2 上海方案單科成績分數變化
圖5反映的是按照上海方案對各科選考成績進行轉換后,與原始成績相比賦分值增加或減少的情況。從圖5可以看出,賦分值減少的人數較多,這是因為上海方案選考科目的分數區(qū)間在40~70分,區(qū)分度較小,分數較為密集;相對于原始分的0~100分區(qū)間,分數較高的考生成績等級賦分后分數降低,大部分考生分數減少。原始成績在40分以下的考生分數會被等級賦值為40分,因此成績增加的人數也會占據小部分比例。6門科目成績相比較,歷史科目和化學科目在進行等級賦分值后分數會增加的更多,分別占總人數的35.4%和27.7%。這意味著使用上海方案進行分數轉換后,選考歷史或者化學的考生占優(yōu)勢。相比之下,選考政治科目賦分值減少的可能性最大,占84.8%。
3.2.3 山東方案單科成績分數變化
圖6反映的是按照山東方案對各科選考成績進行轉換后,與原始成績相比賦分值增加或減少的情況。從圖6可以看出,除地理科目外,其他科目的賦分值增加的比例較大。分數增加的主要原因是山東方案的賦值分為20~100分,低分段的考生分數會因此提高??赡艿乩砜颇侩y度較低,考生分數分布主要在高分段,因此轉換后分數降低比例大。比較6科成績,歷史科目和物理科目在進行等級賦分值后分數增加比例更大,分別占總人數的89.6%和85.3%。這意味著當用山東方案進行分數轉換時,選考歷史科目和物理科目的考生占優(yōu)勢。
圖6 按山東方案轉換各選考科目賦分值變化情況
3.2.4 百分位等級分段成績轉換方案單科成績分數變化
圖7反映的是按照百分位等級分段成績轉換方案對各科選考成績進行賦值轉換后,與原始成績相比賦分值增加或減少的情況。經過百分位等級轉換后,考生之間的分數差異變成了排名上的差異,從圖7中可以看出,在6科成績中,賦分值增加的比例遠大于賦分值不變和賦分值減少的比例。這是因為與浙江方案一樣,最高等級賦值分為100分,而且6科成績增加和減少所占的比例差異不明顯,相較之下,政治科目和物理科目的考生成績增加的比例分別為68.1%、66.6%,要比其他科目稍大。
圖7 按百分位等級分段方案轉換各選考科目賦分值變化情況
3.2.5 以必考科目為錨的等值標準分方案單科成績分數變化
在以必考科目為錨的等值標準分方案中,選考科目的轉換分數是相應的考生群體必考科目基礎分的標準差和平均值進行的線性轉換,基礎分是由其基礎總分的Z分數乘以100分加上500分轉換而來,因此基礎分的平均分在500分左右,這就使得必考科目的等值轉換分也會在500分上下波動,因此導致選考科目分數遠遠大于原始分數。
3.2.6 正態(tài)轉換后的T分數方案單科成績分數變化
圖8 按正態(tài)轉換后T分數方案轉換各選考科目賦分值變化情況
圖8反映的是按照正態(tài)轉換后的T分數方案對各選考成績進行賦值轉換后,與原始成績相比賦分值增加或減少的情況。顯然各科成績均有所增加,其原因主要與該方法中在對選考成績的分數進行轉換時,選取的是以7分為標準差和70分為平均數,而在正態(tài)分數中正負3個標準差就已經包括了所有個案的99.7%,因此99.7%的考生成績都應該在49分以上,93%的考生成績會增加。從圖8可以發(fā)現(xiàn),歷史科目和物理科目的分數相比于其他4個科目成績,轉換分增加比例稍少,分別為95.5%和93.3%。
3.2.7 斯坦福成就測驗正態(tài)曲線當量方案單科成績分數變化
圖9反映的是按照正態(tài)曲線當量方案對各選考成績進行賦值轉換后,與原始成績相比賦分值增加或減少的情況。從圖9可以看出,經過轉換后的分數增加比例較少,分數減少的原因主要在于正態(tài)曲線當量分數=選考科目的正態(tài)化Z分數×標準差(21.06)+平均數(50),由表4可以得知,選考科目原始成績的平均分大約在58分,因此,歷史科目、地理科目、物理科目轉換分減少的比例較多,分別為88.5%、84.7%、86.2%。
圖9 按正態(tài)曲線當量方案轉換各選考科目賦分值變化情況
表7 各種方案排名變化的描述統(tǒng)計量比較
計分規(guī)則的變化勢必引起考生分數的提高或降低,分數的變化則引起考生排名的調整,排名的變化直接與考生的錄取結果有關。因此,選擇某一種高考計分方案對考生來說是至關重要的,以下從研究排名的變化情況研究7種方案對考生造成的影響。
3.3.1 總體排名變化情況
將原始算法的順序作為被減數,每種方案排序后的名次作為減數,差為排名變化值。從表7可以看出,每一種算法都會使考生分數排名產生巨大的變化,相較之下,浙江方案、山東方案的算法產生的變化全距值相對較小,上海方案、百分位等級方案、正態(tài)曲線當量方案名次最大變化在1萬~2萬位,在以必考科目為錨的等值標準分方案與正態(tài)化T分數方案下,考生名次最大可能變化3萬位以上,波動最大。
3.3.2 方案排名變化比較
為了便于統(tǒng)計,排名變化以100為單位取整。圖10、圖11、圖12分別為浙江、上海、山東方案考生排名變化情況??傮w上看,按浙江、上海、山東方案轉換后考生的整體排名變化基本上呈中間高、兩頭低的變化趨勢。浙江方案排名的變化主要集中在1 000名左右,排名上升的比例為50.6%,排名下降的比例為49.4%,排名變化在100名以內的人數為12 498人,占考生總人數的6.7%。上海方案的排名變化主要分布在3 500名以內,排名上升的比例占50.9%,排名變化在100名以內的人數為8 980人,占考生總人數的4.8%。山東方案的排名變化折線相對平滑,排名的變化主要在2 400名左右,排名上升比例為51.4%,排名變化在100名以內的人數與浙江方案相差不大,占考生總人數的7%。
圖10 按浙江方案考生排名變化情況
圖11 按上海方案考生排名變化情況
圖12 按山東方案考生排名變化情況
圖13 百分位等級分段轉換方案排名變化情況
圖14 正態(tài)曲線當量方案排名變化情況
圖13、圖14分別是百分位等級分段轉換、正態(tài)曲線當量方案的排名變化情況。按這2種方案轉換后,考生的整體排名變化都呈中間高、兩頭低的變化趨勢。百分位等級轉換方案排名的變化主要集中在2 000名以內,排名上升的比例為69.3%,排名下降的比例為30.7%,排名變化在100名以內的人數為41 567人,占考生總人數的22.3%。正態(tài)曲線當量方案的排名變化分布相對分散,大部分的排名變化在4 000名以內,排名上升的比例占50.3%,和上海方案相差無幾,排名變化在100名以內的人數為9 508人,占考生總人數的5.1%。二者相比,顯然分數變化最小且最為集中的是百分位等級分段成績轉換方案。
圖15、圖16以必考科目為錨的標準分等值轉換、正態(tài)化后T分數方案的排名變化情況。按這2種方案轉換后考生的整體排名變化基本上都呈中間高、兩頭低的變化趨勢,相較于前述的5種方案,這2種方案的排名變化范圍更大。分別來看,以必考科目為錨的標準分等值轉換方案的排名的變化主要集中在8 500名左右,排名上升的比例為52.3%,排名下降的比例為47.7%,排名變化在100名以內的人數為6 277人,占考生總人數的3.4%。正態(tài)化后T分數方案的排名變化大部分也在9 000名左右,排名上升的比例占52.4%,排名變化在100名以內的人數為6 244人,占考生總人數的3.4%。
圖15 以必考科目為錨的等值標準分方案排名變化情況
圖16 正態(tài)化T分數方案排名變化情況
本文模擬某市的高考成績,依照7種方案對考生成績進行轉換,分析考生的總分和排名情況,得出以下結論:1)對于選考科目而言,在上海方案、正態(tài)曲線當量方案下,大部分考生的單科成績會提高。在上海方案下,選考歷史、化學科目在分數轉換后占優(yōu)勢,賦分值增加的人數比例提高;在正態(tài)曲線當量方案中,選考政治、化學、生物科目占優(yōu)勢。在其他方案下,大部分考生分數會降低,在山東方案中,地理科目賦分值減小的可能性較大。2)從對排名的影響上看,百分位等級分段方案最不容易改變考生的排名,排名變化比其他6種方案要小得多。
與新時期人才選拔與培養(yǎng)需求相一致,新一輪高考改革勢在必行。高考分數的構成與意義關系到考生的核心利益,因而選考科目與必考科目分數轉換與合成方案的制定更需要平衡公正、科學、效益和導向。本文所討論的選考科目與必考科目分數轉換與合成方法的7種方案,涉及分數的導出、分數的等值轉換、分數的合成等,各有獨特的優(yōu)勢和較為明顯的缺陷。本研究的目的在于拋磚引玉,觸發(fā)學術界和教育行政管理部門以及教育機構的思考,為探索更具科學和合理的分數轉換與合成方案提供參考。需要著重說明的是,由于新高考試點剛剛展開,選考科目的組合無論在人數分布還是變動趨勢上均缺乏推導規(guī)律的充分信息;加之高考分數的特殊性與敏感性,難以從實驗省市獲得考生總體的真實分數,本文只能采用模擬數據加以擬合,帶來偏差不可避免。
高考改革是一項艱巨的任務,在分數轉換與合成上不可避免會遇到新的困難與挑戰(zhàn)。因此,需要不斷總結和思考,借鑒國內外測量學、統(tǒng)計學等學科的前沿理論以及有益實踐經驗,構建具有中國特色的高考分數體系。