池朱興 施茂枝
【摘要】教育部首輪義務教育質量監(jiān)測于2015年到2017年在各省市以抽測方式進行,省市級監(jiān)測迅速跟進并延續(xù)成常態(tài),其中小學語文監(jiān)測閱讀題命制“交流并接軌”以九歲學生為對象的國際閱讀素養(yǎng)測評項目PIRLS。監(jiān)測結果哀鴻遍野,未問所以然而盲目“接軌”是原因之一,還體現(xiàn)在:未根據(jù)質量監(jiān)測所覆蓋的內容調整文長、題量,未根據(jù)課程標準學段目標要求確定評價指標并控制高階思維含量的試題數(shù)量。
【關鍵詞】小學語文,質量監(jiān)測,閱讀題命制,對比國際項目
教育部首輪義務教育質量監(jiān)測于2015年到2017年在各省市以抽測方式進行,省市級監(jiān)測迅速跟進并延續(xù)成常態(tài)。小學語文以四年級學生為對象,監(jiān)測結果,哀鴻遍野!試題命制,“依據(jù)課程標準研發(fā)指標和工具,吸收了國際上較先進的測量學技術,與國際項目實現(xiàn)了交流并接軌”。具體到小學語文,“交流并接軌”是以九歲學生為對象的國際閱讀素養(yǎng)測評項目PIRLS。教育部和各省市監(jiān)測試卷均不對外公開,但借助個別省份嚴格仿制教育部質量監(jiān)測試卷內容、結構、題量、題型的公開樣卷可間接窺其全貌。對比某省小學語文四年級質量監(jiān)測樣卷的命題文本《一碗水》及試題與PIRLS若干文本及試題,便可發(fā)現(xiàn),此“交流并接軌”其實是知其然而未問所以然的不成功嫁接?!墩Z文建設》2019年8月下半月刊發(fā)表的施茂枝的《小學語文質量監(jiān)測閱讀題命制初探》,涉及監(jiān)測結果的原因,從與PIRLS的對比中又可進一步加深認識。
一、文長、題量未作調整
學生閱讀命題文本和答完題都有速度極限,故命題文本難度和題量必須與測試時長相適應,這本是常識,也是命題科學性的重要組成部分。若多數(shù)學生讀題、答題時長恰好,說明文本難度和題量適當;若多數(shù)學生時長不足或有剩余,則說明文本難度和題量過大或過小。有經驗的命題者,總是謹慎地根據(jù)測試時長調控文本的難度和題量。
文本難度決定于深度和長度。所謂深度指文本表層意思與深層意蘊的距離。表層意思與深層意蘊距離越大,越有深度,含蓄蘊藉,意味悠長,耐人咀嚼。表層意思與深層意蘊距離越小,越無深度,直白平易,通俗淺近,一目了然。單從表層意思與深層意蘊的距離考察《一碗水》與《小海鸚鵡之夜》《裁縫》《倒立的老鼠》《錢學森》等PIRLS命題文本,應該說深度基本接近?!兑煌胨肥且黄獢⑹律⑽?,情節(jié)比較簡單,但有些語句,如“看著她善意真誠的笑容,我感到心虛”“我仿佛被洞悉了內心的秘密,窘迫不安”等,對于四年級學生而言,理解起來有一定的難度?!缎『{W鵡之夜》是兒童故事,文字比較淺顯,無過多含義深刻的語句,但文本較長?!恫每p》應是微型小說,深度與《一碗水》相當?!兜沽⒌睦鲜蟆肥穷愃朴谕挼脑⒀?,故事部分文字淺近,揭示寓意的句子是:“這個故事教訓我們,當看見這個世界似乎是極度倒亂時,記得確定自己是腳踏實地。”含義深刻,理解難度超過《一碗水》中的任何一個句子?!跺X學森》總體上略淺于《一碗水》。除低級別質量監(jiān)測或各地模擬試卷無底線地選擇深度過大的文本外,在小學就直接使用高考命題文本,省級以上的小學語文質量監(jiān)測命題文本深度與國際項目總體接近,從這個角度看,貌似接軌。
文本長度與測試難度也密切相關。從某種意義上說,閱讀過程是消弭文本表層意思與深層意蘊距離的過程,而這一過程需要時間,所謂書讀百遍其義自見可證。若測試時長相同,較長的文本,用來消弭相同單位字數(shù)表層意思與深層意蘊距離的時間則較短,難度便加大。表1是《一碗水》與PIRLS相對應的文學文本長度。
就平均字數(shù)而言,我國質量監(jiān)測閱讀文本與PIRLS相對應的文學文本長度大體相當,也貌似接軌。
PIRLS試卷只有兩個板塊:文學文本閱讀和信息文本閱讀。我國小學語文質量監(jiān)測“交流并接軌”國際項目,其實并非全盤復制PIRLS,試卷有積累與運用、閱讀、寫作三個板塊,“接軌”的只是閱讀板塊。這是因為我國小學語文質量監(jiān)測與PIRLS測評目的不同。我國小學語文質量監(jiān)測意在全面考查各地學生實現(xiàn)義務教育語文課程目標的程度,并對問題作出診斷,以完善課程實施,故測評內容涵蓋本課程全領域,尤其是識字寫字、閱讀、寫作,試卷相應地有了三個板塊。而PIRLS測評目的單純是為了解各國九歲孩子閱讀水平進展情況,以供各國制定教育政策和規(guī)劃參考,只考查文學文本和信息文本閱讀。
PIRLS考查兩個文本閱讀,測試時間為80分鐘;我國小學語文質量監(jiān)測總時長和閱讀板塊的文本數(shù)量、題量都與之相近。表2是《一碗水》題量與PIRLS相對應的文學文本題量對比情況。
有些省市質量監(jiān)測,外加一個非連續(xù)性文本閱讀文體,題量則超過了PIRLS。那么,學生有多長時間可以用來答完“接軌”的閱讀題呢?近三年,筆者利用負責或參與各級各類教師培訓等機會,以及到各小學講座交流,對來自福建省各市區(qū)累計不少于1000名的小學語文教師進行調查,結果發(fā)現(xiàn),對于答完積累與運用、寫作兩個板塊試題的時長,絕大多數(shù)教師選擇50分鐘左右;對于答完閱讀題的時長,大約2%的教師選擇20或40分鐘左右,大約98%的教師選擇30分鐘左右,無人選擇超過40分鐘的選項。換言之,真正與國際項目接軌的閱讀板塊,文長和題量大致相當,但學生讀題、答題時間還不到PIRLS時長的38%。所有接受監(jiān)測的學校無一例外地反映,學生根本就答不完題。
嚴重忽視二者測評內容范圍和容量的差異,未依據(jù)閱讀文本和答題所需時長調整文長和題量,是質量監(jiān)測結果不太樂觀的最直接原因。
二、高難度試題不加控制
國際閱讀素養(yǎng)測評,所考查學生的是閱讀素養(yǎng),核心是閱讀能力,我國小學語文質量監(jiān)測閱讀板塊也在此與國際項目接軌。PIRLS以提取信息、直接推論、解釋并整合觀點為考查指標;細察那些公開的樣卷,我國質量監(jiān)測在此不全與PIRLS相同,似欲將所有閱讀能力要素都作為評價指標。
閱讀能力要素為何?其實并無公認或一致的看法,《小學語文質量監(jiān)測閱讀題命制初探》從可作為評價的角度將閱讀能力要素分為:檢索與復述、了解與轉述、解釋與推論、概括與整合、欣賞與評價、反思與審辨,六個層次十二個要點。對比《一碗水》和PIRLS諸文本考查六個層次能力的試題權重,可從另一角度具體還原“接軌”的真實情形(見表3)。
“選擇、簡答比”是指選擇題和簡答題所占百分比,《一碗水》各占70%和30%。PIRLS諸文本簡答題占30%~50%,平均占比38.5%。若將平時所見質量監(jiān)測閱讀題納進來考查,我國質量監(jiān)測閱讀題題型及其比例,與PIRLS也基本接軌。但從考查各層級能力要素的權重看,則顯示出較大差異。
檢索與復述為第一層級能力要素,考查學生直接找到時間、地點等故事情境要素及其他特定信息的能力?!啊隽思裁词?,把‘我給鎮(zhèn)住了?”(《一碗水》)“海鸚鵡在哪兒度過寒冬?”(《小海鸚鵡之夜》)“這個故事發(fā)生在哪里?”(《裁縫》)“羅伯把老鼠夾放在哪里?”(《倒立的老鼠》)“新中國誕生后的中秋夜,錢學森和中國留學生們談論了什么?”(《錢學森》)等,屬檢索與復述?!兑煌胨反祟愵}目占比20%,此文本有一道題:“‘這陣勢指什么?”考查第二層級能力要素了解與轉述,一、二兩級相加占30%;而PIRLS各文本未考查了解與轉述,考查一級能力題目占比38%~50%,平均為43%,顯著高于《一碗水》一、二兩級相加的30%占比。
解釋與推論為第三級能力要素,包括解讀人物外在動作行為和情緒所表現(xiàn)的內在心理或緣由、人物話語的弦外之音,詮釋事件的前因后果,用事例證明結論等?!啊蚁乱庾R地從自己原來待的地方往后站了站表現(xiàn)出‘我怎樣的情緒?”(《一碗水》)“為什么要選在白天,孩子們才能將海鸚鵡載到海邊去放它們飛翔?請利用文章的資料解釋。”(《小海鸚鵡之夜》)“Totio為Sofia做的最有幫助的事情是什么?解釋它為什么是最有幫助的?!保ā恫每p》)“你認為那些老鼠容易受騙嗎?試想出一個理由解釋容易或不容易受騙。”(《倒立的老鼠》)“課文第一小節(jié)中,錢學森希望腳下的是火箭艙壁說明了什么?”(《錢學森》)等,均屬此類。此級題目,在PIRLS各文本試題中占比為43%~50%,平均為48%,顯著高于《一碗水》同級題目的30%占比。
概括與整合為第四級能力要素,包括聚合分散信息、形成完整形象或整體,歸納內容要點、人物性格,提煉文章主旨等。例如,《一碗水》中“文章第二自然段寫‘我打量她的衣著外貌,其實她也在打量‘我。請你展開想象,寫一寫她眼中‘我的衣著外貌。要用到文本中有關‘我的信息”。PIRLS文本《錢學森》有道題:“為表現(xiàn)錢學森的品質,課文中寫了他哪些事例?請概括地寫下來?!边@也是比較典型的概括與整合題目,其他題目其實兩屬于解釋與推論和概括與整合,如“試用流暢而準確的語言解釋荷拉如何利用手電筒和紙箱拯救了幼小的海鸚鵡?!保ā缎『{W鵡之夜》)“通過羅伯的行為,你明白他的性格,試描述他的性格,并從他的行為舉兩個例子,顯示他有哪種性格。”(《倒立的老鼠》)此外,PIRLS雖未將欣賞與評價單獨作為評價指標,但“為什么‘生活的改變與繼續(xù)是本文的另一個好名字?”(《裁縫》)歸于欣賞與評價更合適,因其涉及對全文內容的整體把握,這里算在概括與整合內。我國質量監(jiān)測此級題目占比略高于PIRLS。
欣賞與評價為第五層級能力要素?!兑煌胨吩O計了兩道題。其一,“是啊,我在都市的地鐵看到乞討的人,兒時的惻隱之心都已經麻木了……也有著自己的人格和尊嚴”。作者發(fā)這一通議論在表達情意上有什么作用?其二,作者寫到“秋刀割過的麥地”在表達情意上有什么作用?處于閱讀能力最高級的反思與審辨,《一碗水》也設計了一道題:“有讀者認為,‘她不可能做出‘先洗碗后盛水喝的舉動。你同不同意這種觀點?請根據(jù)文本內容說明理由?!薄兑煌胨房疾檫@兩個層級能力要素題目占比為30%,而PIRLS除《裁縫》那道類似欣賞與評價的試題外,其他文本均未涉及。
一般來說,當簡答和選擇題型比例相近時,高層級能力要素或高級思維試題越多,試卷難度越大。我國質量監(jiān)測考查高層級能力要素或高階思維能力的試題明顯偏多,這是不容樂觀的又一重要原因。
三、評價指標非依標而定
綜上,我國質量監(jiān)測閱讀板塊的文量、文長、題量、題型都參照PIRLS,形式上的確與國際項目“接軌”,但閱讀板塊讀題和答題時長卻不及它的一半,且試題本身難度更大。與其說這是“接軌”,不如說是粗疏簡單甚至盲目的嫁接。
國際閱讀素養(yǎng)測評取向閱讀能力,PIRLS考查提取信息、直接推論、解釋與整合觀點三項能力;而另一國際項目PISA(國際學生評估項目)以獲取與檢索、整合與解釋、反思與評價為考查指標,增加了屬于高級思維能力的反思與評價。所以有此區(qū)別,這是因為測評對象年齡不同,前者九歲,后者十五歲,故筆者更愿意認為,其評價指標是依學生身心發(fā)展包括閱讀能力發(fā)展階段而有所取舍的,而非視之為閱讀能力的全部,特別是PIRLS。
那么,我國小學語文質量監(jiān)測閱讀板塊應如何確定評價指標?是全盤照搬PIRLS,還是將閱讀能力所有要素全部作為評價指標?
我國小學語文質量監(jiān)測以全面考查各地學生實現(xiàn)義務教育語文課程目標的程度為目的,課程標準中各學段閱讀目標才是直接、可靠的依據(jù)。
“欣賞文學作品”是課程標準第四學段的目標,“對作品中感人的情境和形象,能說出自己的體驗;品味作品中富于表現(xiàn)力的語言”。當然,這并不表示小學階段完全不能涉及欣賞與評價層級能力的考查。課程標準第二學段目標有“體會課文中關鍵詞句表達情意的作用”,第三學段有“辨別詞語的感情色彩,體會其表達效果”。這些要求就屬于欣賞與評價的范疇,故第二、第三學段質量監(jiān)測或其他測評可以進行局部和粗淺的語言品味等,但不可要求過多、過難,同時應盡可能選擇難度較小的題型,盡量少采用或不采用簡答題,尤其是在第二學段?!兑煌胨沸蕾p與評價類題目占比為20%,題量過大,其中一道題涉及議論表達方式的作用,這在課程標準的目標或教學建議中都找不到依據(jù),從教學實踐層面看,也極少有教師將其作為教學內容,況且采用了簡答題型,難度顯然偏大。
課程標準第二學段要求“能初步把握文章的主要內容”,第三學段要求“了解事件梗概”,屬于概括與整合的范疇,但“初步”和“了解”都意味著不可要求過高,命題難度必須嚴格控制。
關于閱讀命題文本選擇、試題難度控制等,《小學語文質量監(jiān)測閱讀題命制初探》已有比較全面和深入的探討,這里補充兩點。
其一,不效顰文量、題量。PIRLS考查兩個文本閱讀,PISA考查三個文本閱讀及其文長和題量,都不足以作為選擇文本個數(shù)、長度和確定題量的依據(jù),必須根據(jù)我國質量監(jiān)測學生閱讀文本和答題只有30分鐘時長的實際進行周密調適。同時,還必須正視被嚴重忽略的一點,即在文本選擇上,小學質量監(jiān)測與中考、高考和中學質量等監(jiān)測相比,有一特殊的難題:難以找到文長適當?shù)默F(xiàn)成文章,所以更不必在文本數(shù)量上向PIRLS看齊,考查單個文本更具有可行性。課程標準第二學段未提閱讀說明文的要求,即說明文不屬于此學段必考文體,命題文本應以文學文本為主。因本學段教材有說明文,平時進行低級別監(jiān)測或訓練,適當兼顧此類文體閱讀未嘗不可,但必須嚴格控制文本總長。
其二,不求全能力要素。關于閱讀,語文課程標準總體目標要求“具有獨立閱讀的能力”。我國質量監(jiān)測閱讀命題取向閱讀能力,確定評價指標就絕不能忽視其要素,但這并不意味著無論哪個學段都要全面考查所有能力要素,面面俱到,不偏不倚。PIRLS根據(jù)學生實際不考查高級思維能力,我國質量監(jiān)測也必須根據(jù)學段目標有所側重,第一學段以前二級為主,第二學段側重考查前三級能力,第三學段可適當涉及后三級,但一定要借助題型等措施控制難度。
(施茂枝為通訊作者)