談 娟
多年來,對于現(xiàn)代文閱讀測試一直研究、探索得不夠深入。本文試圖汲取教育測量學、思維科學等學科的理論,系統(tǒng)剖析與批評中、高考現(xiàn)代文閱讀試題中的相關問題,以期利于未來的命題建設。
上世紀80年代以來,中、高考語文試卷中現(xiàn)代文小閱讀題總是以社科文、自科文的內容理解為測試重心,實際上完全淡化了語文學科的本味,偏離了語文學科的本體與實質。比較明顯的是自科文閱讀題,混淆了普通閱讀和專業(yè)閱讀的界線。這種只有相關專業(yè)人員才能閱讀和只有他們才可能讀到的文本,拿來給我們這些可能一輩子都在進行普通閱讀的考生進行閱讀,有什么閱讀價值?讓考生到完全缺乏經(jīng)驗支撐的構不成對話關系的閱讀沙漠中去找尋答案,除了發(fā)揮他們那種本能的“求生意識”,還有什么意義?此題背后的支撐性知識應該首先是讀懂文本的經(jīng)驗性知識,然后是有關閱讀的知識和技巧。但歷年此題所選的文字幾乎都是深奧的專業(yè)研究。閱讀這樣的文章,只有識字量這一種語文知識在支撐著,而由這些漢字所組合的話語系統(tǒng)對考生來說卻完全是陌生的,學生們固有的語文知識和語文經(jīng)驗并不能為閱讀這樣的自然科學論文進行支撐,所以說這不是語文試題,倒是自然科學試題。考生完成這樣的題目,不是在調動著他十幾年中滲透在他們腦中的語文知識和語文經(jīng)驗,而是在扮演著兒時捉迷藏時那個“捉人”的角色,在一個非常低的甚至是本能的層次上進行信息的搜尋。因此,答對了題目并不見得這個考生的語文水平就高,答錯了也不見得他的語文水平就低。
再說試卷中的文學作品閱讀,不少考題赤裸裸指向于文章的主題。這樣的試題也是只注重選文的內容而忽略其言語形式。語文學科區(qū)別于其他學科一個顯著的特征是言語形式的重要性。其他學科通過言語形式掌握了內容之后,就可以得魚忘筌,把言語形式拋在一邊;語文學科正好相反,它是通過理解文章內容來掌握表達特定內容的特定的言語形式。文本的言語形式是閱讀測試的重心,可是上述考題對言語形式的考查幾乎是一片空白。
不僅考試如此,平時的語文課堂教學也不乏這樣的設問:“這篇課文表達了一個什么樣的意思?”“這篇文章的主旨是什么?”一些新編的語文教材,更是設計了大量的主題活動,圍繞自然、社會、科學、藝術等話題,要求學生走入社會,走進大自然,了解社會,感悟人生,體驗自然,貼近藝術。雖然這些活動,也要求學生查閱文字資料,有的也要求寫出調查報告或進行口頭演講,但活動設計的重心,并不在母語教育本身,而在了解社會、感悟人生、體驗自然、貼近藝術這些主題。有人批評這種貌似語文但其指向卻在語文之外的語文教學為“泛語文”、“反語文”。這種不良現(xiàn)象在平時的語文教學與語文閱讀測試之間相互影響,惡性循環(huán),且愈演愈烈!
教育測量學告訴我們,考試需要講究測試信度,中、高考更需如此。測試信度也叫測試的可靠性,即測試結果是否穩(wěn)定可靠,測試成績是不是反映了受試者的實際語文水平。測試信度取決于試題本身的可靠性和評分的可靠性。試題本身是否可靠主要取決于試題的范圍、數(shù)量、區(qū)分度等因素,評分是否可靠則要看評分標準是否客觀和準確。中、高考現(xiàn)代文閱讀題在這兩個方面,又做得如何呢?
2009年福建卷選用《中國青年報》《寂靜錢鐘書》一文作為實用類文本閱讀測試材料。該文作者周南試做了一遍題,在總分15分中只拿了1分。尤為荒謬的是,一個被作者認為“說出了我內心最真實意圖”的選項,答案居然是錯的。誠然,閱讀是一種二次創(chuàng)作,讀者可以對作者的原意進行超越和拓展;命題者需要結合很多客觀因素的實際進行擬題,最終形成的考題可能超出作者最初的創(chuàng)作思想或意圖。但是文本作者與命題者之間的認知差距怎么這么大呢?退一步說,既然出題者可以完全超出作者最初的思想或意圖作自己的“另行理解”,那么,考生同樣有充足的理由完全否定閱讀題的標準答案。因為考生同樣首先是作為讀者出現(xiàn)的,他們有權以自己的思想觀念對作為閱讀考題的文章進行二次創(chuàng)作,也有權做出自己“另行理解”的答案。但是,閱卷老師偏偏把命題者提供的答案奉為圭臬,其考查信度到底有多高呢?2009年湖南卷散文閱讀最后一題:“緊扣《云南看云》一文中的‘看’字,賞析該文主題的表達,300字左右?!边B閱卷教師也非常無奈地說:“這道14分的賞析題是湖南卷的雞肋,閱卷時已經(jīng)難見區(qū)分度?!?/p>
一些語文行家做不好中小學生的語文作業(yè)題,早已不是什么新聞了。主要原因在哪?不是試題的范圍、數(shù)量、試題的區(qū)分度等因素出了差錯,就是評分標準不準確。2007年,四川一所重點中學20多位中學語文教師做高考語文試題,居然許多答案與命題者提供的答案不相符合。重點中學的語文教師都是大學本科畢業(yè)生,不少還是資深教師,怎能如此出錯呢?很簡單,其答案并不準確。這一年四川卷散文(趙麗宏《煙火的變奏》)閱讀15題中問:為什么說“戰(zhàn)爭的‘噩夢’與眼下的美妙火焰沒有關系”?這話在文中并無深意,“煙火”是眼前景象,“戰(zhàn)火”是聯(lián)想情景,一實一虛,兩者“沒有關系”。但其命題者的答案卻說:“炮火是戰(zhàn)爭、災難和死亡的象征,焰火是和平、歡樂、繁華的象征;它們分別指向人類生活中完全不同的兩個極端?!边@樣的回答真是答非所問。人類生活的兩個極端就必然沒有關系嗎?“焰火”的和平環(huán)境可以是“炮火”的戰(zhàn)爭代價換來的。測試信度如此之低,那些語文教師怎么能夠“考正確”呢?
再說測試效度,即測試的有效性,是指一套測試對應該測試的內容所測的程度。也就是說,一套測試是否達到了它預定的目的以及是否測量了它所要測量的內容。一個測試即使對某個目的具有一定的信度,但它不一定是有效的;而一個測驗對于某個目的是有效的,那么它一定是可信的?,F(xiàn)代文閱讀測試更要保證較高的測試效度,其內容的分布更要體現(xiàn)全面考查語文素養(yǎng)的要求。然而,不少現(xiàn)代文閱讀題卻不能做到這一點。如2010年四川瀘州中考閱讀題《雪地里的迎春花》,10分考查對內容的理解,4分考查理解句子的含義,一道14分之多的小說閱讀題,考查重點局限在兩個方面,而典型化的環(huán)境、個性化的語言及相關詞語、句子都沒有考到。與之相反,2010年四川眉山中考試卷《父子應是忘年交》四道閱讀題基本都是考查詞語、句子。其中,第25題解釋題目中“忘年交”這個名詞,第28題中有三小題考查語句作用,而27題、30題都在圍繞“忘年交”設題,要么回答“父子之間成為‘忘年交’后,‘我’與兒子是怎樣相處的”,要么“探究你與你的父母是忘年交嗎”?中考卷其測試效度如此之低,它們會給今后中學生閱讀產生什么影響?
隨著新課程的改革,語文新課標對探究性、創(chuàng)造性的重視,中、高考更加注重考查閱讀過程的積累,注重學生的閱讀體驗,重視學生知識的遷移拓展,其中,現(xiàn)代文閱讀能力層級的考查即確定了“理解”、“分析綜合”、“鑒賞評價”、“探究”四項?;诖?,一些中、高考現(xiàn)代文閱讀題便常常在題干中直接使用“理解”、“賞析”、“分析”等詞語,以示緊扣《考試說明》的能力層級。其實這些所謂層級是“胡子連著辮子”的,不能清楚地分開,以致陷入模糊狀態(tài)。比如2008年天津卷散文(《敦煌》)閱讀三道題:
19.綜觀全文,如何理解“這是歷史的另一種寫法”?
20.賞析本文第五自然段畫線的文字。
21.下列對文章的理解和分析,正確的兩項是( )
如果把三道題中的能力層級動詞互換一下,好像也不會影響命題意圖與答題內容。命題中的能力層次含糊不清,主要源于《考試說明》界定不清;《考試說明》界定不清,主要源于它照搬與沿襲了上世紀50年代布盧姆認知目標分類系統(tǒng)中的一個維度分類——“知識、領會、應用、分析、綜合和評價”。到了本世紀初,布盧姆認知目標分類系統(tǒng)已經(jīng)發(fā)展到“知識”和“認知過程”二維框架。其知識是指學習時涉及的相關內容,包括從具體到抽象四個類別——事實、概念、程序和元認知;其認知過程則包括六個類別——記憶、理解、應用、分析、評價和創(chuàng)造,總計有30個具體類別。運用洋人的東西本不是壞事,但要注意人家揚棄的過程,應當吸收人家更新后的成果。
再說“探究”,雖不是布盧姆等人的東西,但還是名不副實。2009年揚州語文中考試卷第23題,2010年江蘇、安徽、福建三家試卷第14題,題干中都標明“探究”一詞。但是,若把三道題中的“探究”字眼換掉,改為“寫出”、“理解”等動詞,好像也沒有什么異樣。題干中寫有“探究”,不代表考生會去“探究”,因為探究的價值在于發(fā)現(xiàn)問題、提出問題、解決問題的途徑、方略與過程,而不在于簡單地呈現(xiàn)結果。所以,探究題一旦放到考試卷中,就不是探究題了。如果一定要說這也是“探究”,那么考生每一道題目的回答都是在進行一種探究,都是在和文本、試卷命制者、閱卷者進行對話。
還有,有些所謂探究題難度也太小,如2007年寧夏/海南卷要求“探究”林沖的身份、性格和心理就比較淺,只要寫出人物身份、性格和心理就可得滿分。這種非常容易的考題不僅失去了探究的價值,還會造成考生在未來真正探究中的浮躁心理。
“批判性”這個詞源于希臘文“kritikos”,意思是辨別力、洞察力、判斷力,引申義有敏銳、精明的意思。批判性思維的核心是“理智的懷疑和反思的態(tài)度”。綜觀多來的中、高考現(xiàn)代文閱讀題,似乎只有兩題有一點檢測考生批判思維的味道。其一為2009年揚州中考試卷23題:有人認為這篇小說的主人公是“少年”,有人認為是“老人”,你的看法是什么?請結合內容說說理由。其二為2009年寧夏/海南卷11題第(4)題:孕婦并不認識石碑上的字,也不會寫字,卻十分努力地描畫著它們,后來還感嘆:“字是一種多么好的東西??!”小說這樣來寫孕婦,有人認為讓人感動,也有人認為有些做作。你的看法呢?請結合全文,談談你的觀點和理由。
其實,無論中考還是高考現(xiàn)代文閱讀的文本中有不少可供我們測試考生批判性思維的資源,只是命題者還不善于從中挖掘。如2009年試卷,其中屬于主旨值得反思的,有全國卷《孕婦和牛》一文中的虛假牧歌;屬于思維單向缺陷的,有四川卷中《抗生素濫用》;屬于論證邏輯欠嚴密的,有福建卷中《尺度》的隨意發(fā)揮;屬于言過其實的,如江西卷中《木車的激情》關于對木車的贊美、對現(xiàn)代交通的貶斥……如果我們有這方面的意識,考查批判思維的題目是不難命制的。
本著培養(yǎng)學生創(chuàng)新思維的目的,新課程標準要求“注重個性化的閱讀,充分調動自己的生活經(jīng)驗和知識積累,在主動積極的思維和情感活動中,獲得獨特的感受和體驗”。無論中考還是高考《考試說明》根據(jù)文學作品多元解讀空間較大的特點,明確提出“對作品進行個性化閱讀和有創(chuàng)意的解讀”。然而,在控制誤差、彌補主觀題目比重增加對高考選拔性損害的觀點影響下,文學作品閱讀題中多元解讀基本消彌殆盡。教育部考試中心對主觀題提出“在開放性的前提下盡量客觀化”的要求,即“主觀題目客觀化”。這類試題的評分標準美其名曰“意思對即可”或“根據(jù)答案酌情給分”;然而,實際閱卷過程中仍是“采點”不“采意”。這類考題,其答案排斥多元解讀,不能真正考查學生的個性體驗與切身感受,不能鼓勵考生的創(chuàng)造性解讀。另外,多年來“閱讀題答案在文中”一說被奉為經(jīng)典的答題絕招,考生更不會大膽想象與向文外拓展。所以,考生在答題上沒有什么發(fā)揮的余地,倒有點像做變相的填空題,根本談不上多元解讀。
雖然中、高考試卷現(xiàn)代文閱讀題中的文體是豐富多彩的,但是,一些考題忽略了文體的測試要點。
社會科學類文章的主要特點是有客觀的研究對象、嚴謹?shù)乃季S、獨到的觀點以及嚴密的論證過程;因此,其測試要點不應在詞句意義的辨析與理解上,而應該專重于核心概念的界定及其表述上,對主要觀點的把握以及對論據(jù)、材料的判斷上,對邏輯思路的明晰上。如2009年全國卷Ⅰ中《釋“王”》一文,要讀懂這篇文章,這樣幾個問題是必須回答的:(1)甲骨文的“王”字本意是什么?作者是如何表述的?(2)甲骨文“王”的釋義經(jīng)過哪些階段?(3)說甲骨文“王即斧鉞”的理由有哪些?其中最充分的理由是什么?如果能回答這幾個問題,這篇文章便全部讀懂了??墒?,這份試卷的題目,對上述問題很少涉及,相反,只考了一些段落和詞句的理解,顯然是抓小放大,測點不明。再如2009年上海卷《專家與通人》,首選測點應該是“文章認為專家與通人的區(qū)別在哪里”,或“現(xiàn)在不能成為通人的原因是什么”;但是,五道測試題總是在句子解意、語句填空、“太?!痹?、“通人”重要性等方面做文章。
不僅是社會科學類文章有著非常重要的測試要點,其實,人類創(chuàng)造和使用的每一種文體都有其各自的測試要點。對有的文體來說,形式上的特征甚至更具有本質性,更值得考查。例如,新聞報道文體著眼于最快、最簡潔地把新近發(fā)生的重要的信息傳遞給受眾,它的“倒金字塔”式結構就滿足了這一需求。因此,若是考查學生閱讀新聞報道的能力,不僅僅要考查學生是否讀到該新聞報道里的事件等信息,更需要檢測學生抓住新聞報道的文體特征、恰當運用相應的技能快速、高效地閱讀新聞報道的能力,否則,選擇新聞報道的價值就不大了。
我們知道,讓學生具有流暢自如的閱讀能力是中學閱讀教學的基本任務之一,要完成這個任務就要讓學生養(yǎng)成良好的閱讀習慣。然而,如今在上述測試影響下的初中生現(xiàn)代文閱讀已異化為類似數(shù)理化一樣的習題訓練,尤其初三、高三第二學期都在做各種各樣的“模擬題”。這樣的訓練既不能喚起學生學習的熱情,又不能提高語文成績,反而增加學生的厭學情緒。有個性的初、高中生會因為某種訓練低效或無效而“自衛(wèi)性地減少學習時間”,但是大部分學生是不敢違反老師規(guī)定的。因此,盡管無效他們還得做一套套試題。他們學習的那種答題的形式僅僅是為了應付考試,因為真實的閱讀,誰也不會像做現(xiàn)代文閱讀題那樣去讀書?!八鶎W非所用,所用非所學”,已經(jīng)成為語文現(xiàn)代文閱讀教學的頑癥。學生是為了答題才去那樣思考和記憶的,等考試結束,他們就會把所學內容忘得一干二凈。更為嚴重的是,容易使學生形成貽害終身的停頓、指讀、逐字閱讀、糾纏字詞、回視返讀、假閱讀等閱讀習慣。