郭 鑒 劉淑紅
成績考查即人們所理解的考試,在近代“中華民國”成立之后,學校的成績考查仍然受傳統(tǒng)的科舉論文式考試方法的影響,考試試卷題目較少,取樣范圍較窄,答案長而無客觀的評判標準,考試的可靠性較低,學生所得分數(shù)往往不足以表現(xiàn)出其對某個科目知識體系的掌握程度,“查小學成績考查法,現(xiàn)尚無一定標準,已成為目前辦教育者一重要問題?!盵1]至南京國民政府時期,中國的社會轉(zhuǎn)型步伐加快,新式教育興盛,剛剛出現(xiàn)在西方的教育測驗、教育測量與統(tǒng)計等理論很快被引入中國,并呈現(xiàn)出多元化格局[2]。受教育測驗理論與方法的影響,應用測驗法的考試被稱為新法考試,并很快應用到小學的各科考試中去。
“五四”運動前后,新式教育興起,1922年新學制公布的小學課程分為國語、算術、衛(wèi)生、公民、歷史、地理、自然、園藝、工用園藝、形象園藝、音樂、體育十二門科目[3]。課程設置更加貼近學生生活,符合學生興趣,豐富、完善了課程結(jié)構(gòu)。但當時的教學理論和教學方法受舊教育影響甚深,以紙筆考試和策論式題型為主的傳統(tǒng)考試方法深刻影響著學校教育。學校里考試密集,方式呆板,頻繁的考試給學生帶來了沉重的心理壓力[4]。舊時以論文為主要方式的成績考查方法已不能適應時代發(fā)展的需要,新的課程需要新的方法來考查。
南京國民政府時期,小學的成績考查從內(nèi)容到方法都煥然一新,小學考試的變革離不開以杜威為主要代表的美國實用主義教育思潮在中國的傳播。杜威的教育思想和著作中都含有心理學思想,為教育測驗在中國的傳播與推廣奠定了理論基礎[5]。教育測驗的出現(xiàn)與近代自然科學的勃興息息相關,一些學者開始以自然科學的模式去從事教育研究,推進了教育學科科學化進程,用實驗材料、統(tǒng)計數(shù)據(jù)向人們展示教育學科的客觀性[6]。陳翊林在《近代中國教育總評》一文中概括了民國時期新教育的改造要求教育科學化:“一方面要求在教育中增高科學的地位,注重科學的研究;又一方面要求將教育的本身也構(gòu)成一種科學,最近幾年的科學教育和教育的科學研究——教育調(diào)查、教育測驗、教育試驗和教育研究的發(fā)達,便足證明這種趨勢。”[7]
這一時期新文化運動的開展使學生思想獲得很大解放,對于考試問題很多學生的觀點是直接廢止[8]。因為學校教育的目的原在謀學生心身方面的發(fā)展,能應用于實際生活,現(xiàn)在的考試達不到學校教育的目的,因此,“學??荚囍贫葢攺U止,就是但從他本身而論,已經(jīng)同教育的目的根本違反,萬無存在的余地了?!盵9]“考試并不能達到吾人所希望的目的,既不能測驗學生的成績,復不能督促學生用功,結(jié)果只有犧牲學生的身心健康,阻礙社會的進步?!盵10]“廢考運動”的發(fā)生與五四時期學生的思想動態(tài)、社會風潮有很大的關系[11]。自從杜威博士來華講演之后,學界里就有很多人——自然是被考的學生占大多數(shù)——發(fā)生了“廢考”的狂熱癥,竭力從事于“廢考運動”;也有一部分人認為學校的考試方法應當進行改良[12],因為“成績是兒童學習的記載,兒童學習不留成績,這學習便毫無意義”[13]。
教育測驗作為一種新的科學理論被引入中國,由此引發(fā)的測驗運動幾乎與“廢考運動”同步達到高潮,改革學??荚囎匀怀蔀槌珜y驗運動學者們關注的對象[14]。時人認為西方教育科學的進步大都是應用測驗的結(jié)果,現(xiàn)在各學校及各教育團體幾乎無不利用測驗來解決教育上的問題[15]?!耙郧皩W校里所用的考試制度是度量方法之一種,而其中方法的不精密,不科學,早已經(jīng)暴露無遺。多少學者想種種方法來改造,測驗法就是改造的考試法最適用的一種?!盵16]民國時期有關測驗法的研究顯示出心理與教育測驗能有并將有很大的進步,較之以前更為科學更為標準,更容易用數(shù)量化來處理,更足以表達兒童學習能力中的主要特征,更易于考查施行與成績計分,因此測驗是一種進步的考試,比舊法考要好得多[17]。
南京國民政府時期有關小學成績考查試題編制的變革主要體現(xiàn)在以下幾個方面:
編造考試題材之前需要搜集材料,確定考試范圍。相關學者需要分析各種學科的教科書的共同教材、參考已有的相關測驗、搜集與兒童實際生活有關的材料等,同時還需兼顧教育部頒發(fā)的課程標準[18]。在此過程中需要遵循的原則有:試題具有普遍代表性,合乎學生已有的學習程度,在日常生活中能夠應用,能夠為專家所公認,注重隨機性等幾個方面[19]。俞子夷在《考題的取材和代表性一文中》對試題的取樣方法做了一定的說明。從需要考查兒童的三百個字里隨機抽取三十個字作為考試題材有兩種方法:一是把他們打亂順序后隨機抽拿三十個字;一是按照生字表每隔十個字抽取一個字。除了生字外,常識等材料也可以按照這個方法隨機抽取作為考題。常識的抽取可以用課本的頁數(shù)和行數(shù),例如學期終的成績考查規(guī)定要考課本全冊,共有四十課,八十四頁,預計出考題六十道,第一課第二行里抽取出一題,以此類推。也可以將每課要點整理出來編成序號,隨機抽取序號,抽到后按照抽取數(shù)字所代表的學科要點出題[20]。
試題編制完成之后還需要注意題目的排列要先易后難,“測驗之首題應易,測驗之末應有數(shù)難題,排列方法是問題由易而漸難”[21];要依據(jù)問題的數(shù)量、內(nèi)容、酌情規(guī)定一個答題時間;試卷的格式用橫行,便于學生答題;考查時的手續(xù)應有說明和指導;學生的座位要適宜;同時也討論了分發(fā)試卷的流程、注意事項,以及考試結(jié)束后試卷的校閱[22]。
小學里學業(yè)成績的考查共分為平時考查、臨時考查和定期考查三種。第一,平時考查,注重兒童平時的成績,可在課內(nèi)或課外用視察、問答、檢查筆記、實地演習等方法隨時評估兒童的成績;第二,定期考查,是在一學期結(jié)束時舉行的考試;第三,臨時考查,每月末舉行,一般是每學期至少舉行三次,教師有審察利弊、自行決定的余地,臨時考查較為靈活,教師擁有一定的主動權(quán)。
關于這三種成績考查的時期,學者們對“臨時考查”討論頗多。有學者認為,臨時試驗最好在每一次教材單元學習完畢以后舉行一次,各科教材的編排,最好都以五星期為一單元起訖,因為根據(jù)相關心理實驗的報告,每隔五星期左右舉行一次復習總結(jié),時間距離很平均,可以把許多割裂的學習總匯起來,對知識作一次有系統(tǒng)有條理的整理,進而維持兒童努力學習的興趣[23]。也有學者認為,臨時考查以采用各學科巡回輪流舉行的辦法為最宜:教師在每學期開始的時候,把一切要舉行臨時考查的科目及其次數(shù),統(tǒng)盤籌算,排定順序,譬如每學期開學第三周起考查讀書,第四周考查算術,第五周考查社會,第六周考查自然,第七周考查衛(wèi)生,然后至第八周再考查讀書,以后照此類推,周而復始。這種臨時考查排列順序的原則,凡每周教學課時較多的科目,應排在前面,每學期可有四次以上的考查;每周教學課時較少的科目,應排列在后面,每學期至少有兩三次的考查[24]。
教師在實際考查學生成績過程中要采其長處,依照各科教材的單元,配置適宜的巡回考試時期(間),進而收到考試的實效。
測驗法,系別于舊式論文式考試方法而言,一般是指教育測驗或新法考試的方法,包括通常應用的真?zhèn)畏ā⑻钭址?、選答法、類推法、訂誤法、指認法等。小學成績考查能夠應用的考試題型主要有以下幾種[25]:
1.填充法示例:
魚在……生活。下雪的……很冷。運動可以……身體。
2.是非法或正誤測驗示例:
牛是吃草的。對錯
蝴蝶是鳥類的一種。對錯
太陽出自南方。對錯
讀書要比游戲好。對錯
船比飛機快。對錯
3.選擇法示例:
政權(quán)屬于(1)政府(2)人民(3)黨員
做史記的是(1)班固(2)劉向(3)楊雄(4)司馬遷
為什么牛奶是很好的食品?因為
□它可以充饑?!跛呛茏甜B(yǎng)的東西。
4.認識測驗的示例:
夏天的天氣是:(1)熱(2)溫和(3)冷(4)涼快………………()
中國最長的河流是:(1)珠江(2)黃河(3)閩江(4)揚子江…………()
5.對比測驗的示例:
a. 中 國 ……………… 東 京() b. 美 國………………倫敦()
c. 日 本 ……………… 紐 約() d. 英 國………………北平()
根據(jù)以上的示例可以看出各種測驗的做法很簡便,效率頗高,在短時間內(nèi)能考查學生更多的知識內(nèi)容。例如正誤測驗,兒童回答各項問題,若認為對,則在“對”字下畫一畫,若認為錯,則在“錯”字下畫一畫。填字測驗則將各題的空白逐一填寫;認識測驗,則將認為正確答案所代表的數(shù)字填在括號內(nèi);選擇測驗則是在認為正確答案前的方格內(nèi)畫一個十字;對比測驗則將有關系的選項所代表的字母填寫到括號內(nèi)[26]。據(jù)南京國民政府時期相關的研究成果,在六十分鐘的實驗內(nèi),新式測驗的內(nèi)容的范圍可以三倍于舊式考試[27]。
浙江省立中學附屬小學整理小學成績考查法報告要目中提到關于學業(yè)方面的成績考查,往往是根據(jù)學科選擇不同的考查方法與考試題型[28]:
整體上看,民國時期小學考查學生成績方法依照科目性質(zhì)分為三大類,并對每一類的科目所用的考題形式和成績等級做出了相應的規(guī)定:第一類:國語,算術,社會,自然四科注重筆試、命題及測驗法參酌行之。第二類:勞作,體育,美術三科,注重習作,以主試所指定之題材,使學生習作,由考試原二人以上評分平均結(jié)算。評分標準:勞作——使用工具合法占30%,習作順序及方法占30%,結(jié)果精良占40%;體育——技能占50%,姿勢占30%,精神占20%;美術——整潔占30%,順序及方法占30%,結(jié)果占40%。第三類:衛(wèi)生,公民訓練,音樂三科,在考試過程中要知識與實踐并重,關于這三科知識的考查,以測驗法行之;而關于實踐的考查,由二人以上考查員指定題材進行考試,其所得評分之平均數(shù),與知識評分平均計算,其中知識與實踐各占50%[29]。
表1 學科考查方法與考試題型
兒童的學業(yè)成績與其升學、畢業(yè)、留級、退學息息相關,《教育部公布學生學業(yè)成績考查規(guī)程令》中將學生成績分為甲、乙、丙、丁四類:甲,八十分以上;乙,七十分以上;丙,六十分以上;丁,不滿六十分。丙等及其以上為及格,丁為不及格;及格的學生畢業(yè)或升級,不及格的學生留級,留級兩次仍不及格者,令其退學[30]??茖W客觀地記錄學生的成績就顯得非常重要了,而記分法是用數(shù)字符號或簡單的評語,顯示成績考查的結(jié)果和兒童真正成績的一種方法,與成績考查的關系至為密切。教育研究者應當根據(jù)客觀的標準,運用科學的方法,訂定一種足以代表兒童成績?nèi)恳饬x的記分方法,使能表示考查的正確結(jié)果和兒童的真實成績,以達到成績考查的真正目的[31]。記分法的選擇標準最主要的不外乎兩點:精確地表示學生于一班中的比較地位和精確地表示學生已獲得的真實成績。除此之外,計算手續(xù)簡單易行、易于表示及格的界限、便于報告家長也是選擇記分方法的次要標準[32]。
普通學校的記分法主要有百分記分法、等第記分法、比較記分法、S 記分法四種[33]。應用標準較高的為麥柯爾設計的適用于標準測驗的TBCF記分法:
“在未有標準測驗以前,一般學校測量兒童成績,種類多而漫無標準,主要應用主觀色彩很濃的估量的記分法,均屬教師臆斷,甚或有以好惡而給分。自麥柯爾博士到華后,和國內(nèi)專家的努力,對于彌補以往一切記分法缺憾的客觀的精密的科學的各項測驗,由各地很多數(shù)的十二歲兒童的測驗統(tǒng)計,而制成TBCF 記分法的標準測驗,便利我們?nèi)ゲ捎盟麃碜隹疾槌煽兊囊罁?jù)?!盵34]
錢希乃的《麥柯測驗編造的TBCF 制》[35]和薛鴻志翻譯的《TBCF 制之量尺制作法》[36]對TBCF 制的編制原理和使用方法做了詳細介紹,其編制的手續(xù)較為復雜,需要對百名以上十二歲的兒童進行測驗,不適用于平時的成績考查[37]。但其應用的統(tǒng)計學原理以及客觀、科學的態(tài)度體現(xiàn)在小學成績考查常用的其他四種記分方法——百分記分法,均分記分法,常態(tài)記分法和S記分法[38]。
(1)百分記分法。以一百分為滿分,六十分為及格線,零分為最低分,兒童答對一題就得到一題的分數(shù)。這種記分方法手續(xù)簡單,使用便利,直到現(xiàn)今仍在沿用。但是,其中的缺點也是顯而易見,百分記分法把學生的成績規(guī)定在0-100分之間,這個0分是人為假定的起點,即使學生得了0 分,我們也不能說該生在本學期沒有學到任何知識,或者說該生的知識水平為“零”。
(2)常態(tài)記分法,也稱其為科學計分法或等數(shù)計分法,這種方法所依據(jù)的基本原則是“常態(tài)分布”的定律,凡是世界上一切事物,在統(tǒng)計方面所呈現(xiàn)的狀態(tài)都是一種常態(tài)分布的情形[39]。即估定一個學生的某項成績在某一團體中所占的地位,可以不記分數(shù),兒童最終的成績代表在一個團體里分配的地位[40]。把學生的成績分成六等,即“超、上、中、下、末(及格)、不列”。這六等的評給有著一定的比例,一班一百個學生中,“中”當然最多,上和下次之,超、末、不列最少,各占百分之五。這種方法考查不出成績好的學生好到什么程度和成績差的學生差到什么程度,評價學生的成績只是一個相對的標準,因此,無論它對一般學生有多大激勵的作用,對根底差而一時還難以趕上的學生,總是個打擊,無論他如何用功,總歸是個“劣”,終究被淘汰[41]。
這種記分方法可以顯示出兒童在全班中比較的地位,避免在成績考查過程中受到試題難易、評分寬嚴等因素的影響。但其缺點也較為明顯:兒童學業(yè)成績的表示未免含混而不夠精確,如果全班同學整體程度較好,也需要委屈幾個人列入下等和劣等。這種百分比是由常態(tài)曲線求出來,是一個概算,任何班次中全班的學業(yè)成績都會發(fā)現(xiàn)與常態(tài)分配不合。這是因為常態(tài)分配是從很大的數(shù)目中求來的,數(shù)目越大,則常態(tài)分配越顯著。學校中每班學生多在四十人左右,常態(tài)分配狀況是不顯著的[42]。
(3)均分記分法。記分方法為:百分比=(100÷測驗題數(shù))×答對題數(shù)。均分記分法由徐則敏創(chuàng)制,簡單易學,各單位間距離相等,可以表示出學生學業(yè)成績的真正優(yōu)劣。例如某測驗共40 題,某生答對30題,則其均分為:(100÷40)×30=75%,查百分比與均分對照表(如圖1 所示)得56.8。這種記分方法所依據(jù)的統(tǒng)計原理是根據(jù)一群隨機選擇的學生作業(yè)成績制成常態(tài)曲線分配而得,例如小學四年級第一次國語月試為40 個測驗題,倘使教師的出題全是根據(jù)客觀考試法的原理,那么用這四十個測驗題去考查兩千多個各種性質(zhì)的小學四年級學生第一個月的國語成績,這兩千多個任意選擇來的兒童的國語成績應當接近于常態(tài)曲線分配[45]。
圖1 常態(tài)分布圖[43]
(4)S 記分法,也稱為應用標準差記分法。是應用統(tǒng)計學上測量差異的數(shù)量,以人數(shù)分配的差異為計算分數(shù)的標準。先求出學生所得的學業(yè)成績在全年級中所占的百分數(shù),再由此百分數(shù)所對應的標準差的數(shù)值,作為該生的成績分數(shù)。S記分法應用統(tǒng)計原理,各兒童名次間的距離相等,顯示出各個學生在全班中的比較地位,教師對于學生在全班的學習成績可以有一個明確的觀念[45]。
S記分法計算手續(xù)繁雜;只能表示出學生的比較地位,不能看出學生對知識掌握的真正優(yōu)劣;不能求平均分;作文、美術、音樂等不能分成若干題目數(shù)的學科,不能用S 記分法?,F(xiàn)在普通學校班級的人數(shù)不多而又未經(jīng)過隨機分配,在應用S 記分法時不合乎常態(tài)分布。S 記分法只能表示一級或一組學生成績的比較地位,不能表示出兩組或兩班以上成績比較的優(yōu)劣和兒童學業(yè)成績的真正水平。因此,S記分法所得到的成績看不出來學生前后的差異,也就無法判斷教師的教學效率,不能決定教學方法的取舍[46]。
這四種記分方法各有利弊,民國學者沈有乾曾
指出:“現(xiàn)在并沒有一種完善的計分法,絕對制與相對制,各有利弊,應用記分法的,應斟酌實際情形而參用兩制?!盵49]應當依據(jù)所記分數(shù)是否真測量學生的學識、能力及技能或其他進步的情形來選擇合適的記分法[50]。浙江省各級小學各科成績考查暫行辦法大綱中規(guī)定了不同的測驗選用不同的記分方法:標準測驗,用測驗單位T,B,C,F(xiàn) 記分;自編測驗,用S記分或均分法;普通的學業(yè)成績考查,用常態(tài)分配記分法。同時也對學生升級畢業(yè)的成績標準做出了如下規(guī)定:
表2 百分比與均分對照表[47]
表3 由百分比求S分對照表[48]
1.黨義,體育,讀書,作文,算學五科及格
2.社會,自然,工作三科僅一科不及格
3.音樂,寫字,說話,美術四科僅一科不及格
學生修業(yè)期滿,成績不合上列條件的,須補習及格后,方準畢業(yè)。而及格的標準因記分方法的不同而另有規(guī)定:常態(tài)分配記分法以3 為及格;S 記分法以40分為及格[51]。
20 世紀20 年代的中國教育思潮此起彼伏,以杜威為代表的實用主義教育思潮反對僵化的傳統(tǒng)教育及其形而上學,尊重兒童本性、本能與興趣,強調(diào)以兒童為中心等新教育主張,以客觀、科學、量化為主要特征的教育測驗等,這些教育觀念與當時中國蓬勃興起的“新文化運動”和“五四運動”相契合,進而開展了形式多樣的新教育學校的變革與探索[52]。南京國民政府時期小學考試受到教育測驗的影響,“革除以往成績考查的謬誤,而開一適應兒童個性的需求的課程與教法的新途徑,也可謂是近年中國在教育上的一個大變動?!盵53]中國傳統(tǒng)的舊式考試源于科舉主觀式論文考試,太過主觀而逐漸被當時教育界所摒棄,客觀科學的新法測驗便被應用到大多數(shù)的小學中去[54]。時人指出,自教育測驗發(fā)達以來,平時學校各學科成績的考查法得到了相當?shù)倪M步,漸漸由主觀的考試法進至于客觀的考試法[55],“自教育測驗發(fā)明以后,對于一般普通考試是一種很大的改進,許多考試都已拋棄往日文章式的舊法考試,而采用測驗式的新方法?!盵56]許多教育界人士為完善小學成績考查做出了不懈努力,有研究者主張教學過程中的考查應和教學后結(jié)果的考查、行為的考查和知識的考查、口頭工作的考查與筆頭工作的考查等同樣重視[57];成績考查之后的分數(shù)記錄務求簡單,并且宜守秘密,因為公布學生成績?nèi)菀尊B(yǎng)成兒童為分數(shù)而求學,并非真正為學問而求學的精神[58]。廣大教育家的努力使小學成績考查趨向于科學與規(guī)范。雖然成績考查的內(nèi)容和方法有所革新,但也存在一定的弊端,如考試的方法流于機械,在對測驗結(jié)果的解釋上忽略了學生學習行為的完整性、有機性和綜合性,測驗試題只限于對知識與技能的測量,膽識、理想、態(tài)度、興趣等方面則得不到圓滿地測量。變革后的小學考試不能完全測量學生的思想和理解能力,主觀式的考查方法也就保留下來,所以舊式的考試倒也不可盡廢,最好新舊兩種考試方法能相互為用[59]。
總之,南京國民政府時期小學成績考查的變革為學校教師提供了一種較為客觀、公正、可靠的考試方法來測量學生的學業(yè)成績,有利于促進教育者對教育目標進行定量分析,對兒童的知識技能和教材結(jié)構(gòu)進行定量考查,有利于教師對學習過程的詳細了解和對具體學業(yè)困難的診斷,樹立教師客觀評價學生學業(yè)成績的態(tài)度[60]。