彭恒利
(北京語言大學語言科學院,北京 100083)
華文水平測試研發(fā)的路線圖及相關(guān)問題探討①
彭恒利
(北京語言大學語言科學院,北京 100083)
華文水平測試;研發(fā);路線圖
華文水平測試的研發(fā)要基于華文教學的實際,可選擇“猜測-反駁”的開發(fā)路線圖。在進行體系設計時,起點要高,應博采眾長,整體設計,分步實施,突出特色和服務意識,借外力為我所用。對于研究中涉及到的題庫建設、考試方式等問題,要確立優(yōu)先原則,突出重點,先考起來,以應亟需為要。
縱觀語言測試的發(fā)展歷史,測試的內(nèi)容和形式一般會隨著理論、技術(shù)、市場和需求的變化作出相應的調(diào)整和改變。就漢語測試而言,隨著中國綜合實力的不斷提升,漢語學習在世界范圍內(nèi)不斷升溫,學習漢語的人日益增多。伴隨著語言學、第二語言教學理論、心理和教育測量理論以及測試技術(shù)的發(fā)展,漢語測試的發(fā)展呈現(xiàn)出以下的特點:一是數(shù)量由少到多,在漢語水平考試(HSK)之后,許多國家和地區(qū)相繼推出了自己的漢語測試,如華語能力測驗等;二是測試對象的分類由粗放到精細,如作為第二語言的測試,原HSK的測試對象包括了國內(nèi)少數(shù)民族,2001年教育部又專門研發(fā)了針對國內(nèi)少數(shù)民族的中國少數(shù)民族漢語水平等級考試(MHK);三是考試的功能從重視選拔轉(zhuǎn)變?yōu)橹匾曉u價,不僅測試的結(jié)構(gòu)更加完善,而且在報告分數(shù)的同時注重反饋,注重提供診斷信息。
順應這一潮流,研發(fā)專門針對海外華人的華文水平測試(以下簡稱“華測”)提上日程。王漢衛(wèi)(2009)在《論“華語測試”的三個基石》一文中從海外華人人口、華語狀況、漢字及漢文化基石三個方面論述了研發(fā)華文測試的重要意義。2010年,暨南大學華文學院啟動了華測的研制工作,在機構(gòu)、人員、場地等相關(guān)基礎(chǔ)建設穩(wěn)步推進的同時,研發(fā)者也做了大量細致的研究工作,進行了相關(guān)問題的研討和思考。王漢衛(wèi)等(2013)在《華文水平測試的總體設計》一文中勾勒出了華測的研發(fā)藍圖,在《華文水平測試總體設計再認識——基于印尼、菲律賓、新加坡的調(diào)查分析》(2014)中通過基于華測海外需求調(diào)查的結(jié)果,對華測的總體設計思路以及華測的基本性質(zhì)、華語標準、華測能力標準、華測擬突出的內(nèi)容與特色等做了進一步的研究探討。應該說這些工作都是卓有成效的,作為測試工作者僅關(guān)注或稱許是不夠的,理應建言獻策,奉綿薄之力。就華測開發(fā)的相關(guān)問題進行探討,一來可向方家討教,或會有更多的有識之士關(guān)注華測;二來或許能為華測的研發(fā)者提供一些有益的參考和啟示。
①在本文的寫作過程中,邵明明、凡細珍幫助搜集了相關(guān)資料,《華文教學與研究》編輯部及匿名審稿專家提出了寶貴意見,宗世海教授惠寄了參考文獻,在此一并致謝。
談到測試研發(fā),自然會面臨“為什么要測”“測什么”“怎么測”的問題,清楚地解
答了這些問題,實際上也就將測試研發(fā)的路線圖描繪出來了。
謝小慶(2010)認為,語言能力測試的開發(fā)有兩條路線可選擇,一是“觀察—歸納”的路線,二是“猜測—反駁”的路線?!霸谡Z言能力測驗的開發(fā)中,在許多涉及復雜心理特征的能力測驗和職業(yè)測驗中,理論上似乎合理的‘觀察—歸納’路線圖在實踐中是行不通的。在這些測驗的開發(fā)中,我們往往需要采用‘猜測—反駁’的路線圖”。他還用漢字應用水平測試開發(fā)的實踐為自己的觀點進行了佐證。
測試是妥協(xié)的結(jié)果,常常需要在科學性和現(xiàn)實性上作出選擇。采用哪種路線圖不僅是方法論的問題,也體現(xiàn)著工作的效率問題,需要決策者權(quán)衡利弊,作出選擇。我們欣喜地看到,華測的研發(fā)者對此已有深入的思考,在談到華語標準制定時已涉及到此問題(王漢衛(wèi)等,2013)。從現(xiàn)有的文獻來看,研發(fā)者似乎在沿循“觀察—歸納”路線,并希望研發(fā)《華語語音標準及語音大綱》《華語聽力能力等級標準》等“至少有10個屬于華測自己的標準性基礎(chǔ)文件”來“構(gòu)建它的標準系統(tǒng),來支撐其最基本的運作”(王漢衛(wèi)等,2013)。無疑,這是一個浩大的工程。以作者的經(jīng)驗,這一工程耗費巨大,需要多人協(xié)同攻關(guān),特別是功能、意念、文化大綱的編寫非短期可以完成。
說“觀察—歸納”路線圖難,主要是基于測試對象所處的復雜環(huán)境。目前,關(guān)于海外華僑華人的總數(shù)說法不一,所查到的最新數(shù)據(jù)顯示,我國海外華僑華人的總數(shù)約為5000萬(王輝耀,2014)。這些海外華人分布在世界各地,由于所處的語言環(huán)境的不同,各地華文教育的歷史和基礎(chǔ)不同,不同地區(qū)海外華人的華語水平有較大的差異,加上受居住國語言和文化的影響,華語在海外也有了很多的域外變體。面對如此復雜的現(xiàn)狀,要想對華語進行全面完整的描述,短期內(nèi)幾乎是不可能實現(xiàn)的任務。
如此,從測試研發(fā)的可行性和效率來看,華測不妨采用“猜測—反駁”的路線。首先從海外華文教育的教學經(jīng)驗出發(fā),以海外華人比較集中的東南亞華人為典型樣本,編制測試,并假設這是一個有效的工具;之后對編制的測量工具進行檢驗,比較不同國家、不同地區(qū)、不同學歷、不同職業(yè)、不同年齡被試的成績,并通過多種渠道,從不同的方面收集效度資料;然后根據(jù)收集到的效度資料對試題進行修改,刪除效度不好的題目,對不太適合的題目和內(nèi)容進行調(diào)整。通過對不同背景的應試者的多次試測,對測試內(nèi)容進行不斷地調(diào)整,使測量工具日臻完善,然后再根據(jù)這一測試的分數(shù)來建立等級標準。從考生的需求和市場的觀念來看,重要的是做起來,以應亟需,然后再系統(tǒng)化、再修訂、再完善。
在測試研發(fā)中,體系設計是一項非常重要的工作。如果我們用市場化的觀念把測試當成一種產(chǎn)品來看,那么體系設計實際上是在建構(gòu)一項測試的框架結(jié)構(gòu),其中包括產(chǎn)品序列、等級設置和測試形式等。在建構(gòu)測試的體系時,有兩個因素需要重點考慮,一是考試的對象,這一問題實際上是要回答為誰設計產(chǎn)品的問題;二是等級結(jié)構(gòu)和等級標準,它要回答的是產(chǎn)品的序列種類和各自應達到的技術(shù)標準。從測試研發(fā)的理論和實踐來看,這兩個問題在測試研發(fā)時是繞不開的,需要深思熟慮、全盤統(tǒng)籌。因為從實質(zhì)上講它們都與測試的目的和用途密切相關(guān),必須在測試研發(fā)的伊始即制定測試設計方案時就明確下來,否則后續(xù)工作就無法展開。
王漢衛(wèi)等(2013)在《華文水平測試的總體設計》一文談到了華測的縱向結(jié)構(gòu)和能力分級,其中重點談了華測的等級構(gòu)成和標準制定的設想。從現(xiàn)有的描述來看,因要考慮與母語能力的關(guān)聯(lián),現(xiàn)有的等級設置向母語能力形成的關(guān)鍵期——小學階段傾斜,六個等級中小學階段就包括了四級,并與國內(nèi)義務制教育學段的概念相對應:1級(入門級)作為小學的入學標準,2級(基礎(chǔ)級)作為小學第一學段結(jié)束應達到的標準,3級(提高級)作為小學第二學段結(jié)束應達到標準,4級(初通級)作為小學畢業(yè)的標準。如果是一個主要面向教學的測試,這樣前細后寬等級設置是自有道理,無可厚非的。
但問題是,海外的華人漢語學習者不僅是在校學生,成人的學習需求也很大,許多成人想通過測試檢驗自己的學習效果,為求職、旅游服務和貿(mào)易往來提供證明和檢測。華測包不
包括成人?如果包括成人學習者,現(xiàn)有等級設置的描述就略顯粗糙,不夠精致全面?;蛟S研發(fā)者對此已有考慮,只是我們沒有從該文中清晰看到,特提出管見且視為善意提醒。
關(guān)于測試的對象,上文只是籠統(tǒng)的界定,沒有細致的說明,測試的用途也沒有明確的表述,因此,對于華測將來的用途我們只能靠推測。我們認為,一項測試要想生存發(fā)展,必須要考慮市場,考慮運營。華測要想在漢語測試之林立足,不僅要重視測試的科學性,重視測試的質(zhì)量,而且要考慮它所處的環(huán)境和面臨的市場。在現(xiàn)有的體制下,華測要生存發(fā)展僅靠撥款輸血是遠遠不夠的,它自身必須要有強大的造血功能,這就需要有較強的市場意識。我們以為,在建構(gòu)華測等級結(jié)構(gòu)時設計應寬泛,可將華測設計成面向教學和面向社會的兩個序列,在優(yōu)先研發(fā)教學序列時為開發(fā)社會序列留下空間,以使產(chǎn)品具備較強的適用性、競爭力和生命力。
隨著現(xiàn)代測驗理論、心理與教育測量學、計算機技術(shù)的迅速發(fā)展,語言測試的內(nèi)容與形式都有了很大的變化,測試的個性化、計算機化成為重要的發(fā)展趨勢?,F(xiàn)代測驗理論與技術(shù)的更新為華測的研制提供了便利,也為華測的創(chuàng)新奠定了良好的基礎(chǔ),但這絕不意味著華測的研發(fā)是輕而易舉,水到渠成的事。像其他測試的研發(fā)一樣,華測也面臨著人力、物力和經(jīng)費的困擾,面臨著理論和技術(shù)選擇的糾結(jié),面臨著許多技術(shù)難題等待突破,面臨著市場等待開發(fā)……這一切都需要華測開發(fā)的決策者高屋建瓴,集賢納士、博采眾長,以務實、高效的策略先重后次、先急后緩、先易后難,以先考起來,以應亟需為要。以下幾點建議供研發(fā)者參考。
3.1 高起點
作為新世紀推出的新測試,華測要想立足并贏得認可一定要有高起點。這絕不是憑空要求,而是激烈競爭的市場使然。華測要想占領(lǐng)漢語測試的制高點,至少應做到以下幾點:
首先,要充分借鑒和吸納其他漢語測試的經(jīng)驗和教訓。先于華測推出的新HSK、MHK、北京語言大學的漢語應用能力測試(C.TEST)、臺灣地區(qū)的華語文能力測驗、日本的中國語能力檢定、美國的AP中文考試①HSK、MHK、C.TEST、臺灣地區(qū)的華語文能力測驗是依據(jù)第二語言教學理論研發(fā)的考試,日本的中國語能力檢定、美國的AP中文考試從嚴格意義上講屬于漢語作為外語的測試。等漢語類的測試一方面是華測的競爭對手,另一方面盡管它們在測試對象等方面和華測有所差異,依然有許多方面值得華測借鑒和學習,如它們在體系設計、大綱制定、題型設計、試題命制、市場開拓等方面積累了豐富的經(jīng)驗,華測應以此為基礎(chǔ),廣納良言,取精用宏,使自己少走彎路,快捷地走向高的平臺。
其次,要充分吸收應用心理與教育測量學的新理論、新技術(shù)。隨著心理與教育測量學自身的不斷發(fā)展,以及與其他學科的碰撞交融,測量領(lǐng)域的新理論、新技術(shù)不斷涌現(xiàn),如概化理論、心理測量學與認知心理學的結(jié)合、認知診斷技術(shù)、主觀性試題計算機的自動評閱技術(shù),等等。這些都為華測提供了很好的理論和技術(shù)支撐,也使得華測研發(fā)可依據(jù)的理論更加充實,可選擇使用的測量技術(shù)更為寬綽。
再次,要充分利用計算機科學和網(wǎng)絡技術(shù)的最新成果。目前,隨著計算機技術(shù)的不斷發(fā)展,測試的計算機化已成為標準化測試發(fā)展的一個顯著趨勢,越來越多的測試開始由紙筆測試(Paper-based Test,PBT)向計算機化測試Computer-based Test,CBT)②計算機化測試(Computer-based Test,CBT)泛指在測試過程中使用計算機的測試,其中包括計算機輔助測試(Computer-assisted Test)和計算機適應性測試(Computerized adaptive Test)。前者主要是利用計算機管理測試或把傳統(tǒng)的紙筆化測試試題用計算機呈現(xiàn),測試任務與構(gòu)念都與傳統(tǒng)的紙筆測試并無本質(zhì)區(qū)別(李清華等,2009);后者主要是利用計算機對試題進行在線調(diào)整,以保證挑選出能最大限度測量出受試能力的試題(張寶鈞,2003)。轉(zhuǎn)變,美國的托??荚囈呀?jīng)完全放棄紙筆測試,國內(nèi)的大學英語四六級考試以及新HSK也都推出了計算機化測試,這些都為華測提供了很好的借鑒。
網(wǎng)絡的日益普及,平板電腦的流行為華測實現(xiàn)計算機化測試提供了快捷途徑。通過平板電腦,可以將聲音、圖片、視頻等多媒體引入試題,使得測試的內(nèi)容更加接近考生的實際生活,測試的形式更加靈活,更容易也更準確地考查出考生的實際水平。而且,平板電腦重量
輕、攜帶方便,可重復使用,不僅能降低測試成本,減少測試環(huán)節(jié),增強測試的安全性,還可以提高測試的效率,快捷地反饋信息,更好地為考生服務。我們認為,在華測開發(fā)中,不妨做些大膽的嘗試和創(chuàng)新。
3.2 整體設計,分步實施
受人力、財力等因素的制約,華測的研發(fā)不可能一蹴而就。這就需要決策者做好頂層設計,制定詳細的規(guī)劃,把握好研發(fā)的工作節(jié)奏。目前,研發(fā)者對目標群體的具體語言能力狀況尚在調(diào)查分析中,加上人力有限,測試研發(fā)不可能面面俱到,同時推出所有級別的測試。所以在研發(fā)初期,研發(fā)者應選好突破口,集中精力開發(fā)最急需或影響力最大的級別的試卷,并盡快將測試推出。通過對測試實測數(shù)據(jù)的統(tǒng)計分析,細化和完善考試的總體規(guī)劃,爭取在較短時間內(nèi)使測試得到考生及使用機構(gòu)的認可,然后再順序推出其他等級的測試,使測試逐步序列化,日臻完善。
3.3 突出特色
同為第二語言的教學、測試對象,外國人、海外華人、少數(shù)民族有共性,也有明顯的差異。學習漢語,外國人更注重語言的工具性,而海外華人和少數(shù)民族則是工具性和人文性兼顧。而“華文”對于海外華僑華人不僅是交際工具,更是文化認同和民族認同的工具(王漢衛(wèi)等,2013)。郭熙(2012)認為,華僑華人學習華語是文化尋根,他們不希望下一代失去自己的文化,自己的精神家園。但問題是,文化的測試歷來都是個難題,是單獨測還是融入到試題中測更好,學界尚無定論。王漢衛(wèi)(2009)認為,目前我國在漢語作為第二語言的測試上淡化文化的做法對華裔來說有欠考慮。更好地把語言和文化融合起來,使語言測試在內(nèi)容上有更多的文化性是華測的目標是對海外華人母文化情結(jié)應有的回應,也是主張研發(fā)華語測試的重要原因。這一問題在華測的研發(fā)時是需要著重考慮的,希望華測在此方面能有所突破,有所創(chuàng)新。
華裔和非華裔學生學習漢語時有諸多差異,如:開始學習時的漢語水平不同、漢語各種語言技能和語言要素的發(fā)展不平衡、語言學習的結(jié)果不同等(曹賢文,2014)。王漢衛(wèi)等(2013)特別指出,海外華僑華人華語習得方式的差異、聽說讀寫能力的失衡是一種普遍的客觀情況。
鑒于此,華測在體系、模塊設計以及施測上就要有一定的針對性和靈活性,可以把聽說測試和讀寫測試分開,設計成“組合式測試”,即考生在測試時可以根據(jù)自己的實際水平進行選擇,將聽說測試和讀寫測試進行自由組合。例如,考生如果聽說能力較強而讀寫能力稍弱,那么他就可以選擇參加高級別的聽說測試,同時參加低級別的讀寫測試。在報告成績時,根據(jù)其在測試中的表現(xiàn),分別對其聽說能力和讀寫能力給出評價。這樣有利于考生或測試的使用者根據(jù)不同的需要靈活使用測試的結(jié)果。
3.4 突出服務意識
作為專門針對海外華人的華測,主要的服務對象以東南亞為中心遍及五大洲,無法像國內(nèi)的一些大型測試一樣,通過行政手段強令推廣。它要想立足,贏得市場,就得像托福等考試一樣靠的還是質(zhì)量和服務。因此,華測無論是在研發(fā)階段和還是在推廣階段都要突出服務意識,針對用戶的需求開發(fā)產(chǎn)品,以用戶為中心,提供優(yōu)質(zhì)特色的服務,并要把它當成自己生存發(fā)展的核心競爭力。
3.5 以開放的姿態(tài),走合作開發(fā)的路線
測試的開發(fā)和推廣不僅需要心理與教育測量、計算機以及專業(yè)領(lǐng)域的人才,還需要配備必要的設備,有進行研發(fā)工作的場地和一定的經(jīng)費支撐。一般在開發(fā)初期,人力有限,硬件和資金并不會足額匹配,人力資源和經(jīng)費都會面臨不小的缺口,特別是在一些耗費較大的項目如試題命制、系統(tǒng)開發(fā)等方面捉襟見肘的狀況時常會出現(xiàn),僅以一己之力大包大攬顯然是無法如期完成任務的。即使前期的研發(fā)任務可以完成,測試走向良性的循環(huán)也需要一定的周期,隨著測試的推廣,客觀條件的先天不足以及有限的人力、財力也會制約著測試的規(guī)模化發(fā)展。在市場化日益成熟的今天,專業(yè)分工越來越細,許多工作并不需要親力親為。因此,對華測的研發(fā)來說,以開放的姿態(tài),積極尋求與相關(guān)部門、機構(gòu)以及有關(guān)的科研院所合作是一條比較務實高效的路子。華測在研發(fā)過程中要善于“借力”和“借腦”,除核心部分以外,其他非核心的工作都可以尋求合作,有些可以合作開發(fā),有些可以委托研發(fā),有些可以“借
雞生蛋”,有些可以外包服務,總之,可以調(diào)動一切積極因素為我所用。
目前,華測的開發(fā)處于研發(fā)初期,千頭萬緒,有許多問題需要研討,有許多困難等待克服。對于研究中面臨的問題,有些必須理清頭緒,闡明觀點;有些需要量力而行,確立優(yōu)先原則;有些需要擱置爭議,尋求共識;有些則可暫存設想,從長計議。
4.1 考教分離還是考教結(jié)合
在如何處理教學與測試的關(guān)系問題上,新舊漢語水平考試(HSK)采取了截然不同的兩種態(tài)度。舊HSK一直堅持“考教分離”的原則,強調(diào)命題“不以任何特定教材為依據(jù)”;而新HSK則相反,強調(diào)“考教結(jié)合”,在考試之外還開發(fā)了配套的教材以及相關(guān)學習、輔導材料,變“單一的考試系統(tǒng)”為“以學習、培訓為主,以考試為輔的漢語學習系統(tǒng)”。MHK作為與HSK類似的以測試應考者漢語實際運用能力的水平考試,強調(diào)教學應遵循自身的規(guī)律,為避免應試對教學的干擾,與舊HSK一樣采用了“考教分離”的原則。
那么,華測在考教關(guān)系問題上應該怎樣做呢?王漢衛(wèi)(2013)認為,華測的推出,是對海外華人這個巨大的語言文化群體的關(guān)注,是對考教關(guān)系的關(guān)注。顯然這一問題已引起研發(fā)者的重視,但傾向性意見如何,并沒有清晰的論述。
明確地回答這一問題并不是一件輕松的事,需要結(jié)合測試的目的作出審慎的選擇。華測的研發(fā)以促進和服務于海外華語教學為出發(fā)點,那么它扮演的不應僅是評價的角色,而應更大地發(fā)揮測試對教學的反撥作用。因此,簡單地歸為“考教分離”或“考教結(jié)合”對華測并不合適。一方面,華測要對海外的華語教學給予具體指導,它必然要對各地的華語教學進行深入的了解;另一方面,海外的華語教學千差萬別,它又不可能面面俱到。由此,華測對海外華語教學的指導應是宏觀性的,華測應通過華語能力標準這個“綱”的制定,引領(lǐng)華語教學的大方向,不局限在世界各華語區(qū)“教什么”“怎樣教”之中,各華語區(qū)在教學目標上應逐漸向華語能力標準靠攏,在教材編寫和教法上完全可以“八仙過海,各顯神通”,并把教學的自主權(quán)更多地留給教師,最大程度地激發(fā)他們在教學上的主動性與創(chuàng)造性,推動華語教學的蓬勃發(fā)展。
綜上,在考教關(guān)系問題上,研發(fā)者不妨采用實用主義的策略,可暫且擱置“考教分離”與“考教結(jié)合”之分,以引領(lǐng)教學,服務教學為先。
4.2 題庫建設
所謂題庫就是以一定的教育測量理論為依據(jù),按照一定的規(guī)范編制、收集的有相當數(shù)量和較高質(zhì)量、附有試題性能參數(shù),并經(jīng)過分類編碼的大量題目的科學集合(黃光揚,2002)。由此可以看出,題庫建設是一項系統(tǒng)工程。華測要不要建設題庫,回答是肯定的。但在華測研發(fā)的伊始,是否需要把題庫建設列入日程是可以商討的問題。
縱然,題庫建設是測試科學化、標準化的需要,是測試規(guī)?;l(fā)展的需要,歐美等經(jīng)濟發(fā)達國家的許多測試專業(yè)機構(gòu)都根據(jù)測試的科學化的需要和市場的要求,建立起了大型題庫。同時,為了實現(xiàn)計算機化的適應性測試,必須具備一個較大規(guī)模的題庫(謝小慶,1998)。但毋庸諱言,題庫建設是一項投資巨大,費時費力的工程,非少數(shù)人短時間可完成。從實用的角度考慮,華測可將題庫建設列入長期規(guī)劃而非短期計劃。這絕非是說題庫建設對于華測不重要,而是說不迫切。也就是說,華測在研發(fā)伊始就應該樹立“題庫意識”,有題庫的構(gòu)念和框架,在題目和技術(shù)等方面有意識地積累,一旦時機成熟,資金和人力得到保證,題庫建設即可順勢而為。
4.3 計算機適應性測試
適應性測試(Adaptive Test,CAT)是指在測試施測過程中根據(jù)考生特點調(diào)節(jié)試題數(shù)量和難度的測試,因其“量體裁衣”的特點而又被稱為“裁縫測驗”(Tailored Test)(謝小慶,1998)。適應性測試作為一種測驗形式,與傳統(tǒng)的紙筆化測試相比,具有省時、高效等諸多優(yōu)越性(張青華等,2006)。借助計算機實現(xiàn)的適應性測試不僅可以使測試的次數(shù)幾何數(shù)地增加,成績報告的時間也大為縮短,由考后兩個月變?yōu)榭己蠹磿r報告。更重要的意義在于:
它可以使測試更具針對性,更加個性化,從而可以達到更高的信度;可以使測試的情境與現(xiàn)實生活更接近,從而達到更高的效度。作為21世紀新研發(fā)的標準化測試,華測理應把實現(xiàn)適應性作為自己的努力目標。由于適應性測試是以題庫為基礎(chǔ)的,因而實現(xiàn)計算機適應性考試(Computer-Adapted Test,CAT)目前只能作為華測的遠期目標,比較現(xiàn)實的策略是紙筆化測試和計算機化測試雙管齊下。
4.4 認知診斷
隨著教育的發(fā)展,一個單純的測驗分數(shù)已經(jīng)不能滿足實際教與學的需要,家長、學生及教師都希望測試能夠提供具體的、個性化的診斷信息,考生掌握了哪些知識,哪方面的能力還需要加強,怎樣加強等等,這些有針對性的建議對教師的教和學生的學更具建設性。這實際談論的就是心理與教育測量中的認知診斷。認知診斷測驗可以對個體知識結(jié)構(gòu)、加工技能或認知過程進行細致評估(Leighton&Gierl,2007)。認知診斷是認知心理學與現(xiàn)代測量學相結(jié)合的產(chǎn)物,現(xiàn)已成為心理和教育測量學研究的一個熱點和趨勢,具有較大的應用價值,一些大型考試的研究機構(gòu)如美國的教育考試服務中心(Educational Testing Service,簡稱ETS)等都在進行應用研究。如前所述,認知診斷可以為教育教學提供更豐富的診斷信息,可以給教學活動提供更具針對性的建議,可以為教育教學評價工作提供更加科學、合理的信息依據(jù),鑒于此,華測在研發(fā)伊始就應將認知診斷的理論引入測試,以使對海外華語教學的引導和促進更具實效。
曹賢文2014“繼承語”理論視角下的海外華文教學再考察[J].華文教學與研究(4).
郭熙2012論海外華文教學的性質(zhì)和地位[A].載郭熙(著),華語研究錄[C].北京:商務印書館:233-248.
黃光揚2002教育測量與評價[M].上海:華東師范大學出版社:337-342.
李清華,孔文2009基于計算機的語言測試及其效度驗證[J].外語界(3).
王漢衛(wèi)2009論“華語測試”的三個基石[J].華文教學與研究(1).
王漢衛(wèi),凡細珍,邵明明,王延苓,吳笑瑩2014華文水平測試總體設計再認識——基于印尼、菲律賓、新加坡的調(diào)查分析[J].華文教學與研究(3).
王漢衛(wèi),黃海峰,楊萬兵2013華文水平測試的總體設計[J].華文教學與研究(4).
王輝耀2014中國海外國際移民新特點與大趨勢[A].載中國國際移民報告(2014)[C].北京:社會科學文獻出版社:1-48.
謝小慶1998考試發(fā)展的新方向:計算機化自適應性考試[J].百科知識(5).
———2010談語言能力測驗開發(fā)的路線圖[J].考試研究(1).
張寶鈞2003簡論計算機自適應語言測試的工作機制[J].語言教學與研究(3).
張青華,袁一萍,張厚粲2006適應性測驗的發(fā)展:歷史與現(xiàn)狀[J].心理學探新(2).
Leighton,J.P.&M.Gierl2007Verbal reports as data for cognitive diagnostic assessment[A].In J.P.Leighton&M.Gierl(eds.),Cognitive Diagnostic Assessment for Education:Theory and Applications[C].Cambridge,UK:Cambridge University Press:146-172.
The Discussion on Issues and Approaches of HSC's Development
Peng Hengli
(The Faculty of Linguistic Sciences,Beijing Language and Culture University,Beijing 100083,China)
HSC;development;approach
HSC's development should be based on the practical situation of Chinese language teaching to the overseas Chinese,and the“conjecture-refutation”approach can be applied.When design the testing systems,the following aspects should be taken into consideration:High starting point,making full use of advantages,overall designing and gradual implementation,highlighting specific features and being aware of the external forces.Setting the priority principles and stressing key points are necessary in order to solve the problems of item bank construction and examination methods in the research.To meet the urgent needs,implementing the examination first may be the best choice.
H195;H08;G749
A
1674-8174(2015)01-0041-06
【責任編輯劉文輝】
2014-11-18
彭恒利(1964-),男,陜西渭南人,北京語言大學語言科學院副研究員,碩士,主要從事語言測試研究。