楊帆
(湖北大學文學院,湖北 武漢 430000)
HSK五級短文閱讀類試題內容效度研究
楊帆
(湖北大學文學院,湖北 武漢 430000)
HSK閱讀類試題相較于對話式的選詞填空類和內容理解類試題有質的飛躍,著重考察漢語的綜合能力。本文以HSK五級中的20篇短文閱讀類試題為樣本,從文本輸入和技能輸出兩個方面研究其內容效度。研究結果表明,這5套HSK試卷的短文閱讀部分的內容效度較高,有利于考察學生的漢語綜合能力,但也需要進一步的改善。
HSK五級短文閱讀;內容效度;文本輸入;技能輸出
(一)新HSK簡介。
2009年11月,國家漢辦正式推出了新漢語水平考試(HSK),以適應“漢語熱”的國際形勢及考生需求。新HSK相對于舊HSK主要有以下幾點優(yōu)勢:第一,遵循“考教結合的原則”??荚嚺c教學相結合,考什么、教什么,使考試不為難倒學生,只為檢測學習內容。不僅有利于學生掌握漢語綜合能力,而且能提高學生學漢語的興趣和信心。第二,確定具體詞匯量,增加考試等級。舊HSK在實施過程中收到最集中的反饋意見就是“太難”,致使很多學生放棄了漢語學習。漢語本身的確很難,但“千里之行,始于足下”,我們可以一步一步來,將漢語教得簡單,新HSK的6個等級和相對應的詞匯量對于考生而言,是由易至難的“跳板”,引導學生分階段、分層次提高漢語綜合能力。第三,關注漢語應用能力,提高考試效度?!靶翲SK在題型設計上避免考查語言知識、應試能力,使考試成績反映漢語教學水平,反映考生實際漢語交際能力?!保?]
(二)考試大綱與考試內容一致。
效度(validity) 就是指實證證據(jù)或理論依據(jù)對測驗分數(shù)解釋或基于分數(shù)所做決策的充分性、恰當性支持程度的綜合性評判。[2]就語言測試而言,效度主要回答了兩個問題:考的是學生的什么能力以及是否考了應當考的能力。[3]而追求高效度的第一步就是保證內容效度。原則上,考試內容應根據(jù)考試大綱制定,特別對于新HSK這種“考教結合”的考試而言。內容效度,就HSK而言,指一套HSK測試題的測試內容是否反映了它的測試要求,即考試大綱與考試內容是否達到了內在一致性。新HSK五級考試大綱規(guī)定“通過HSK(五級)的考生可以閱讀漢語報刊雜志,欣賞漢語影視節(jié)目,用漢語進行較為完整的演講”。[4]由此可見,相對前四級重對話的目標,從五級開始拔高至閱讀,這也是本文著重考察HSK五級短文閱讀類試題內容效度的原因。
本文主要研究HSK五級短文閱讀類試題的內容效度,所以選取了H51001,H51002,H51004,H51005四套樣卷中的20篇閱讀理解作為研究對象,主要從文本輸入和技能輸出兩方面研究其內容效度。文本輸入包括生詞量、難易度、長度、題材和語料真實度五個部分;技能輸出包括理解主旨大意、查找事實細節(jié)、根據(jù)材料進行推斷、理解作者的觀點態(tài)度和信息提取歸納五個部分。前者主要分析語篇本身是否符合考試大綱的要求,后者側重分析試卷本身是否達到它所宣稱要測試的內容。
(一)文本輸入。
1.生詞量、難易度、長度。
新HSK根據(jù)考試等級規(guī)定了相應的詞匯量,如表1所示??忌莆?50個規(guī)定生詞就可通過HSK(一級),300個生詞就可通過HSK(二級)等等,適合學生分階段、分任務、分目標完成漢語學習要求。據(jù)統(tǒng)計顯示,HSK( 一級)合格率約 93%,HSK(二級)約92%, HSK(三級)約 86%, HSK(四級)約 68%, HSK(五級)約 66%, HSK(六級)約 63%。[5]至少從合格率這一角度考量,新HSK的出題難度還是比較合理的,反映了漢語國際推廣的要求。
表1 HSK等級詞匯量
本文統(tǒng)計的四套樣卷中,閱讀篇章長度如表2所示。篇章長度的跨度基本在250到550之間,每套試卷基本做到長短結合,除H51004樣卷中篇章3、4、5皆超過500字,會給考生帶來非正常難度,影響內容效度。所以,HSK五級短文閱讀每篇應控制在350至550之間,有長有短。我們可以推斷,除H51004外的其他3套試卷,能更好地考察學生的漢語應用能力。
表2 閱讀篇章字數(shù)統(tǒng)計
2.題材。
閱讀篇章的選材應該盡量多樣化、廣泛化,不要專業(yè)化,特別是不要選擇考生利用背景知識就能大致了解內容的文章,要著重于考察語言能力——即考生通過閱讀文本能明白的知識。因此,在選擇 HSK 的閱讀理解材料時,要最大限度地選擇那些考生普遍感覺熟悉的一般性文章作為閱讀材料。[6]在條件范圍內做到相對公平,以達到最大效度。
表3 題材類型
HSK五級短文閱讀篇章部分題材如表3所示,包括人生哲理、社會生活、個人經(jīng)歷、科學知識、文化教育等,題材較為廣泛。其中人生哲理類篇章居首,占35%。通過對部分HSK五級短文閱讀篇章的題材分析,兩個問題值得考慮。第一,哲理類文章過多。不管是社會生活、個人經(jīng)歷還是文化教育類文章,最后的落腳點都在人生哲理上,客觀描述類或商業(yè)經(jīng)濟類文章幾乎沒有。過分集中于某類題材會影響考試效度,而且也會讓考生有猜題、押題的行為,不能真正反映考生的語言水平。第二,反映社會熱點、現(xiàn)狀的文章較少。在分析的20篇文章中,有3篇關于社會熱點、現(xiàn)狀的文章:“80后”,“網(wǎng)絡閱讀”,“女主外,男主內”。我們可以發(fā)現(xiàn),這三篇也不是當下的社會熱點,而是舊的社會熱點。此類文章多出現(xiàn),才能真正反映社會生活,讓考生學到鮮活的、熱騰騰的漢語,也才能符合大綱“通過HSK(五級)的考生可以閱讀漢語報刊雜志,欣賞漢語影視節(jié)目,用漢語進行較為完整的演講”的要求,提高考試效度。
(二)技能輸出。
輸出主要指考生獲得的閱讀技能或者說是這份測試想要測試考生是否獲得了所考的閱讀技能。根據(jù)HSK五級短文閱讀類試題的分析,將所考察的技能分為以下五個部分:理解主旨大意,查找事實細節(jié),根據(jù)材料進行推斷,理解作者的觀點態(tài)度,信息提取歸納。所考查的技能分布如表4所示。
表4 HSK五級短文閱讀類試題技能分布
如表4所示,HSK五級短文閱讀注重對事實細節(jié)、推斷預測和信息提取歸納的考察,分別占29%,25%和29%。這與HSK五級考試大綱“通過HSK(五級)的考生可以閱讀漢語報刊雜志,欣賞漢語影視節(jié)目,用漢語進行較為完整的演講”的要求基本一致??傮w而言,除了作者的觀點態(tài)度題偏少,試題類型的整體分布比較均勻,有利于考察考生多方面能力。但就單篇文本而言,部分技能考察過于集中,例如H51001篇章三考察了三個信息提取歸納題(78,79,80),篇章五考察了三個推斷預測題(88,89,90),H51002篇章四考察了三個推斷預測題(83,84,85),H51005篇章二的四道題全部考察的是事實細節(jié)題(75,76,77,78)。單篇閱讀材料的考察技能過于集中,覆蓋面小,不利于考察考生對文章各方面的理解,從而降低考試效度。不僅要從總體上達到試題類型的均衡,也要在單篇閱讀文本上盡量多地考察各方面閱讀技能。
本文通過對H51001,H51002,H51004,H51005四套五級HSK樣卷的短文閱讀試題研究發(fā)現(xiàn),在文本輸入方面,生詞量和難度適中,但某些篇章長度過長,且有一套試卷中幾篇閱讀文本都過長的現(xiàn)象,變相提高了考試難度;題材涉及領域較多,但過于集中于人生哲理類;語料真實,無生造語料的情況。在技能輸出方面,試題類型的總體分布比較均勻,單篇文本對某種技能的考察過于集中??傮w來說,這5套HSK試卷的短文閱讀部分的內容效度比較高,有利于考察學生的漢語綜合能力。
[1] 張晉軍,解妮妮,王世華,李亞男,張鐵英.新漢語水平考試(HSK)研制報告[J].中國考試.2010(09)
[2]Messick,S.(1989) Validity.In R.L.Linn (ed.) ,Educational Measurement,13-103.New York: American Council on Education and Macmillan.
[3]劉潤清,韓寶成.語言測試和它的方法[M].北京: 外語教學與研究出版社,2000:208
[4]孔子學院總部.新漢語水平考試大綱[M].北京:商務印書館,2009
[5]柴省三.關于HSK閱讀理解測驗構想效度的實證研究[J].世界漢語教學.2012(02)
H31
A
1671-864X(2016)07-0269-02
楊帆(1992-),女,漢,湖北武漢,全日制在讀碩士,湖北大學文學院,研究方向:漢語國際教育。