劉玉俠
(國家開放大學(xué),北京 100039)
題庫建設(shè)是計算機網(wǎng)絡(luò)高速發(fā)展在教育測量中應(yīng)用的一次變革,是現(xiàn)代高科技直接應(yīng)用的結(jié)果,更是對心理和教育測量技術(shù)的一種革新。遠程開放教育學(xué)習(xí)測評是教育測量中旨在指導(dǎo)、督促、檢測學(xué)生學(xué)習(xí)成績的一種學(xué)業(yè)能力水平測試,其考生需求量大、頻率高,很顯然,傳統(tǒng)的人工命題方式已經(jīng)越來越不適應(yīng)遠程教育學(xué)習(xí)測評的發(fā)展需要,探索一種適合于遠程開放教育學(xué)習(xí)測評的題庫建設(shè)模式是當(dāng)下亟需解決的重要課題。
縱觀中外各種各類題庫建設(shè),無外乎兩大類,一種是社會中介服務(wù)機構(gòu)承擔(dān)的題庫建設(shè),如英國的劍橋測評(Cambridge Assessment)、美國的ACT考試服務(wù)機構(gòu);一種是教育機構(gòu)(包括部委、高校)自建的題庫,如中國教育部考試中心負責(zé)高考及自考的題庫建設(shè)、各高校也涌現(xiàn)出開發(fā)課程題庫建設(shè)。根據(jù)考試的性質(zhì),也無非就是兩大系統(tǒng)的題庫建設(shè),一種是社會性考試題庫,如適用于職業(yè)能力測試的駕駛員執(zhí)照考試、計算機職業(yè)能力水平考試等;一種是學(xué)校教育類考試題庫,如四六級英語考試、各門課程考試。為了深入了解國內(nèi)外研究現(xiàn)狀,我們通過文件檢索在CNKI知識網(wǎng)絡(luò)平臺上檢索“題庫”兩個關(guān)鍵字, 選擇2000至2012年度,得到849篇文章;輸入關(guān)鍵字為“題庫建設(shè)”,檢索出99篇文章,有效文章為95篇,其中關(guān)于“題庫建設(shè)意義和作用”的文章有50篇,關(guān)于“題庫設(shè)計”的文章有18篇,關(guān)于“題庫技術(shù)”的文章有16篇,關(guān)于題庫建設(shè)實證分析的文章有6篇。為了深入了解目前的題庫組卷技術(shù),我們輸入關(guān)鍵字“組卷策略”,得到77篇文章。由此可見,題庫建設(shè)于近十年內(nèi)已經(jīng)進入高需求狀態(tài)。
在題庫建設(shè)理論方面,目前主要存在兩大理論,即經(jīng)典測量理論和項目反應(yīng)理論。大部分試題庫建設(shè)主要依據(jù)是經(jīng)典測量理論,而項目反應(yīng)理論由于其數(shù)學(xué)模型的復(fù)雜導(dǎo)致其在題庫建設(shè)應(yīng)用中存在諸多困難。在題庫設(shè)計方面,設(shè)計雙向細目表、題庫命題方案、命題表等基本建設(shè)程序上已達成共識,唯一不同的是設(shè)計標準,需要綜合考慮的因素目前主要有考核知識點、教學(xué)要求、考核目標、題型、題量、分數(shù)、答題時間、難度、區(qū)分度等。在組卷策略方面,目前主要存在有隨機組卷、遺傳法組卷等,有基于Moodle平臺的、IRT模型、OLE技術(shù)、NET技術(shù)的組卷模式。在題庫類型方面,有題庫和卷庫之分,大部分題庫仍然是題庫,而不是真正意義上的題庫,他是由計算機在測評之前組卷,在測評過程中抽取的是預(yù)先組好的試卷。由此可見,目前題庫建設(shè)行業(yè)唯一缺乏的就是統(tǒng)一的建設(shè)標準,當(dāng)我們在CNKI平臺上輸入關(guān)鍵字“題庫標準”“題庫建設(shè)標準”時,沒有檢索到一篇文章。
開放大學(xué)提出數(shù)字化題庫概念,不同于一般意義上的題庫概念。江西師范大學(xué)漆書青教授提出“題庫是大量性能業(yè)已查明的合格試題的有序存儲”[1],在這里,我們提出數(shù)字化題庫,不僅在于題庫內(nèi)部試題的有序存儲,還包括數(shù)字化的題庫管理和使用。一般意義上的題庫多數(shù)是為某一特定性質(zhì)的考試而建設(shè),而我們的數(shù)字化題庫是為具有多種特定性質(zhì)的考試而建設(shè),不僅為主要檢測學(xué)習(xí)成果的終結(jié)性測評服務(wù),同時還要服務(wù)于旨在督促、指導(dǎo)、激勵學(xué)生學(xué)習(xí)的自測和形成性測評服務(wù)。具體而言,主要表現(xiàn)為以下幾個方面。
1.開放性
國家開放大學(xué)試題庫建設(shè)的一個主要目的就是為了實現(xiàn)隨學(xué)隨考,我們建立的自測題庫是面向所有學(xué)生可以隨時隨地進行自我檢測的試題庫,他要求具有足夠量大的客觀性試題,同時要求計算機能夠自動組卷和評閱,具有全面的開放性。
2.有效性
隨學(xué)隨考的試題庫使用頻率極高,這就要求試題庫內(nèi)容必須保證足夠的新穎性,才能預(yù)防和控制學(xué)生抽取試卷的重合率。這種及時更新和填充試題的功能是國家開放大學(xué)試題庫的重要性能,也是嚴防測評舞弊的重要舉措,更是適應(yīng)學(xué)科知識發(fā)展的必然措施,特別是一些發(fā)展速度快、內(nèi)容更新快的法律類等時事性課程,更是要求試題庫具有極強的內(nèi)容新穎性。
3.關(guān)聯(lián)性
未來國家開放大學(xué)學(xué)習(xí)測評的一個最主要的目的是推動教學(xué)任務(wù)的完成,保障教學(xué)質(zhì)量。國家開放大學(xué)試題庫的所有試題之間具有很強的智能連鎖反應(yīng),如果某一學(xué)員在某一章節(jié)知識點上出現(xiàn)了答題錯誤的現(xiàn)象,試題庫將根據(jù)答題錯誤性質(zhì)智能地尋找該生發(fā)生答題錯誤的原因,并自動搜尋相關(guān)知識點,以指導(dǎo)學(xué)生進一步學(xué)習(xí)的方向,指出學(xué)生需要補充學(xué)習(xí)的內(nèi)容和知識點,做到有針對性地通過遠程網(wǎng)絡(luò)指導(dǎo)和引導(dǎo)學(xué)生學(xué)習(xí)。
4.高密性
國家開放大學(xué)試題庫建設(shè)從命題、審題、錄入、組卷、測試、評閱等整個過程都具有高度的保密性,他不僅僅體現(xiàn)在保密意識和保密素質(zhì)上,更多體現(xiàn)在網(wǎng)絡(luò)環(huán)境下的高端保密技術(shù)上面。對于中央考務(wù)中心而言,其職責(zé)是命題和組建試題庫,必須通過遠端地方考務(wù)中心實施測試和評閱,這種網(wǎng)絡(luò)環(huán)境下的保密技術(shù)對是否能夠正常測試起著關(guān)鍵的作用,一旦試題泄密,就不能正常啟動試題庫。
開放大學(xué)的題庫建設(shè)堅持一體化設(shè)計的總體宗旨,根據(jù)不同測評方式的性質(zhì)和特點選擇和配置不同的題型、題量、答題方式和評閱方式。首先,任何一門課程的所有題庫設(shè)計內(nèi)容必須依據(jù)教學(xué)大綱規(guī)定的教學(xué)要求和教學(xué)目標,再根據(jù)不同的課程性質(zhì)和特點,選擇合適的題型和題量,在保證課程教學(xué)目標檢測的基礎(chǔ)上,保證隨學(xué)隨考使用的最低題量。第二,根據(jù)不同的教學(xué)內(nèi)容和目標創(chuàng)建不同類型的試題庫,一般而言,對于學(xué)生自己檢測對某一章節(jié)知識點的掌握情況,我們提供自測題庫,其覆蓋該章節(jié)所有知識點,題型全部為客觀性試題,主要是幫助學(xué)生記憶基本知識點;對于學(xué)生在完成某幾部分章節(jié)教學(xué)任務(wù)后,教師需要了解學(xué)生整體知識的掌握情況,我們提供有形成性題庫,在隨機抽取自測題型的基礎(chǔ)上,增加一些旨在考核學(xué)生實踐能力的主觀性題型;對于學(xué)生學(xué)習(xí)完所有教學(xué)任務(wù)后,為教學(xué)管理部門和社會提供具有一定公信力的課程成績,我們提供有學(xué)期結(jié)束時的終結(jié)性測評題庫,學(xué)生可以有組織地參加,也可以個體預(yù)約參加。第三,試題類型與評閱方式的一體化組合,在整個大型題庫建設(shè)中,主張計算機自動評閱的題型與非自動評閱題型進行歸類,自動評閱的題型直接將標準答案和錯誤解析錄入題庫系統(tǒng)中,在學(xué)生答題過程中由計算機自動評閱,正確的給予獎勵,錯誤的給予詳細解析和學(xué)習(xí)指導(dǎo);對于非自動評閱題型原則上需要教師進行網(wǎng)上評閱,由教師給予評閱。
測評不僅具有檢測功能,還具有督導(dǎo)和激勵功能,我們在設(shè)計時始終堅持以測促學(xué)的理念,將自測客觀題與網(wǎng)上學(xué)習(xí)資源的知識點進行鏈接,主觀題配有解析和指導(dǎo)。無論是客觀性試題,還是主觀性試題,測試內(nèi)容與教學(xué)相關(guān)內(nèi)容建立鏈接,引導(dǎo)學(xué)生學(xué)習(xí),以最有效地引導(dǎo)學(xué)生學(xué)習(xí),促進教學(xué)。
自測題型表現(xiàn)形式主要為客觀性試題,用于檢測學(xué)生對基本知識點的掌握程度,同時也是促進和激發(fā)學(xué)生進一步學(xué)習(xí)和復(fù)習(xí)鞏固的重要手段。階段性自測要求用小型題庫的形式進行建設(shè),其自測總體內(nèi)容對教學(xué)內(nèi)容的覆蓋率應(yīng)達到100%。形考作為階段性測試,分幾次進行,形成性測評主要是學(xué)生完成幾部分章節(jié)教學(xué)任務(wù)后的綜合檢查,考核的內(nèi)容可以是一個章節(jié)的知識點,也可以是幾個章節(jié)的知識點的綜合,可以是記憶方面的考查,也可以是能力方面的考查。所以,其表現(xiàn)形式可以為全部客觀性試題、全部主觀性試題、客觀性和主觀性相結(jié)合等多種形式,其測評形式的選擇更多地依附于教學(xué)知識點的呈現(xiàn)形式,其主觀性試題的抽取范圍為題庫中三分之二的主觀性。終考考核的目標和形考相近,選用的題型可以同形考。如果考慮減輕考試壓力,方便學(xué)生隨學(xué)隨考,可以考慮和自測一樣,純粹為客觀題,也可以包括客觀題和主觀題。
題庫的命題量主要有三種確定方法:第一,每學(xué)分命題200道左右的試題,按照課程總學(xué)分來計算總的命題量;第二,每課時10道左右的試題,按照課程總學(xué)時來計算總的命題量;第三,在確定一套標準試卷題量的基礎(chǔ)上,客觀性試題按照標準試卷的20-25倍,主觀性試題按照標準試卷的15-20倍,合計即為題庫總的命題量。
試題休眠有三種含義:第一,就整個題庫而言,每個年度啟用一定比例的試題,其他試題處于休眠狀態(tài),更在休眠一定期限后才予以啟動。第二,對于隨機的試卷而言,要求試卷之間具有一定比例的非重復(fù)率,一般而言,要求試卷之間試題的重復(fù)率在20%左右。第三,對于每道試題而言,規(guī)定有一定的曝光率,一般而言,每道試題的曝光率控制在5-10次左右。
開放大學(xué)試題庫實行中央庫集中管理、子系統(tǒng)小庫單獨運行的模式進行建設(shè)。對于新開設(shè)的課程,要求在課程啟動前一學(xué)期必須完成相關(guān)題庫的建設(shè)和命題,由中央考務(wù)管理部門提出建庫需求,并按照有關(guān)命題標準由各學(xué)部組織命題,同時也可面向全國分院教師進行征集試題。所有試題需經(jīng)過各學(xué)部審核認定后才可統(tǒng)一交到中央考務(wù)管理部門,并由有關(guān)技術(shù)人員進行登錄入庫。對于中央教師而言,教師也可以采用單機版命題進行邊命題邊錄入方式進行,由專家進行網(wǎng)上集中審核。所有試題按照技術(shù)標準錄入系統(tǒng)組織一個中央庫,在整個教學(xué)過程中根據(jù)不同的需求進行提取和運行。
圖1 統(tǒng)籌規(guī)劃功能設(shè)計圖
開放大學(xué)試題庫建設(shè)的一種重要功能就是知識庫之間是一個知識鏈,當(dāng)學(xué)生作知識點A時,如果回答正確,就允許學(xué)生順利進入知識點B的作答,如果回答錯誤,將根據(jù)學(xué)生回答錯誤的原因,尋找需要補充學(xué)習(xí)的知識點1、2、3等。
圖2 統(tǒng)籌規(guī)劃功能設(shè)計圖
每個知識點都與其他知識點相關(guān)聯(lián),學(xué)生可以根據(jù)自己的實際不足尋找到需要補充學(xué)習(xí)的內(nèi)容,進而促進學(xué)生學(xué)習(xí),在測評的過程中也是學(xué)習(xí),實現(xiàn)了教、學(xué)、測、評的一體化設(shè)計,以測評促進學(xué)生學(xué)習(xí),幫助學(xué)生發(fā)現(xiàn)自己的不足。
任何一門課程都只有一個主觀性試題庫,在形成性測評過程中,只能限制使用題庫中三分之二的試題,剩余約三分之一的試題是專門用于終結(jié)性測評的。而這三分之一的試題并非每學(xué)期都面向全體學(xué)生開放,而是根據(jù)每學(xué)期只隨機抽取5%左右的試題規(guī)則進行抽取,剩余約25%的試題全部進行休眠,并且只有在緊急情況下才予以啟動。試題根據(jù)曝光次數(shù)進行累加,超過一定數(shù)量則給予刪除,同時并要求增添新型試題,以保證三分之一總題量的控制。
圖3 休眠技術(shù)功能設(shè)計圖
開放大學(xué)試題庫的動態(tài)更新功能包含兩個方面的內(nèi)涵:一方面是指內(nèi)容上的更新,另一方面是指試題屬性上更新。由中央庫抽取的任何一種測評方式完成測評活動后都配有測評行為過程及測評結(jié)果的行為記錄,這一行為記錄通過一定的數(shù)理統(tǒng)計可以得到對某一道小題的試題函數(shù)值、錯誤試題及其相應(yīng)的使用頻數(shù)或頻率,通過結(jié)果分析設(shè)定使用頻數(shù)超過一定值的試題必須進行淘汰,對于在答題過程中發(fā)現(xiàn)命題錯誤的試題則需要進行修改才能重新入庫,對于某一課程提示試題量小于某一設(shè)定值的情況下,則需要補充試題,這一過程便形成了內(nèi)容更新機制。任何一道試題在入庫之初都有一定假定的預(yù)估參數(shù),如難度、區(qū)分度、分數(shù)、答題時限等,在正式測評活動結(jié)束后,題庫系統(tǒng)將根據(jù)學(xué)生實際答題情況計算出實際的難度系統(tǒng)、區(qū)分度、平均得分、平均答題時限,在理想狀態(tài)下,通過計算機自動、人工參與等形式,反過來調(diào)整和修正試題入庫時的試題參數(shù),有利于下一次抽取試題更加科學(xué)合理、真實可靠,有利于提高整體測評的質(zhì)量和效果。
圖4 休眠技術(shù)功能設(shè)計圖
開放大學(xué)數(shù)字化試題庫建設(shè)不是一個獨立的個體,他需要諸多方面的配合和支撐,其中團隊建設(shè)是試題庫建設(shè)的人脈,制度體系的完善是試題庫建設(shè)的保障,技術(shù)支撐是數(shù)字化試題庫實現(xiàn)的關(guān)鍵,經(jīng)費保障是試題庫建設(shè)的基礎(chǔ)。
開放大學(xué)數(shù)字化試題庫建設(shè)不是某個部門或者某幾個人就可以完成的,他需要由各方面人員和專家組成一個工作團隊或者每門課程都需要一個課程團隊才能順利完成。從整個建設(shè)過程來看,首先,試題命制的過程需要由中央課程教師、分院課程教師、學(xué)習(xí)測評專家、遠程教育專家、技術(shù)專家組成一個團隊,在試題設(shè)計的基礎(chǔ)上還必須保障技術(shù)能夠?qū)崿F(xiàn)。第二,在建庫組織實施過程中,需要根據(jù)所有課程的題庫建設(shè)計劃進行總體布局,做到有計劃、有組織、有目的地建設(shè)題庫。
遠程開放教育建立在已有開放教育研究的基礎(chǔ)上,須引進更為先進的網(wǎng)絡(luò)技術(shù)和教育網(wǎng)絡(luò),在管理制度、職責(zé)分工、工作流程諸方面區(qū)別于已有的開放教育,為此,在對原有廣播電視大學(xué)各項管理制度進行調(diào)整和修改的同時,重點要建立基于信息化技術(shù)的國家開放大學(xué)學(xué)習(xí)測評相關(guān)規(guī)章制度及工作流程,以保障遠程開放教育信息化學(xué)習(xí)測評的實現(xiàn)。開放大學(xué)試題庫建設(shè)的基本制度應(yīng)該包括題庫建設(shè)規(guī)劃、題庫建設(shè)原則、建設(shè)標準、管理辦法、試題標準規(guī)范、酬金標準等諸方面的管理制度的出臺。
所有課程的題庫設(shè)計藍圖能否實現(xiàn)的關(guān)鍵點就是技術(shù)支撐,任何一個好的方案,都必須借助于網(wǎng)絡(luò)技術(shù)實現(xiàn)才能真正實現(xiàn),因為開放大學(xué)的主要教學(xué)媒介就是網(wǎng)絡(luò)。其技術(shù)支撐主要包括試題錄入技術(shù)、組卷技術(shù)、在線施測技術(shù)、評閱技術(shù)、保密技術(shù)等等。
對于這個偌大的系統(tǒng)工程,不僅需要有過硬的軟件環(huán)境建設(shè),更重要的是硬件環(huán)境建設(shè)。工欲善其事,必先利其器,硬件環(huán)境建設(shè)需要大批經(jīng)費的支撐和保障,否則一切都是無米之炊。其中硬件設(shè)施和設(shè)備主要包括計算機、服務(wù)器、掃描儀、打印機、復(fù)印機、作弊克等,軟件環(huán)境主要是題庫建設(shè)過程中工作量勞務(wù)酬金,特別是題庫建設(shè)的題量遠遠大于原來的試題量,其工作量劇增,這種工作的難度也有很大提高,如何調(diào)動教師的工作積極性也是我們必須面臨的一大工作難題。
開放大學(xué)建設(shè)數(shù)字化試題庫以個性化服務(wù)為宗旨,以優(yōu)化組合的等值性試卷組成為中心,須堅持系統(tǒng)論、控制論、信息論等老三論,還要堅持耗散結(jié)構(gòu)論、協(xié)同論、突變論等新三論,僅僅圍繞服務(wù)教學(xué)進程而展開,激勵、引導(dǎo)、督促學(xué)生順利完成學(xué)習(xí)任務(wù),保證教學(xué)活動的順利開展,為遠程教育教學(xué)質(zhì)量的穩(wěn)步提高打下堅實的結(jié)果。通過試題庫的一體化設(shè)計,構(gòu)建數(shù)字化環(huán)境下的試題庫,實現(xiàn)形成性測評、自測、終結(jié)性測評的多種功用性,利用高端計算機科學(xué)技術(shù)實現(xiàn)互斥型題型、包容性題型、順序性題型等諸多具有復(fù)雜關(guān)系試題庫鏈的設(shè)計和組合,引進模擬技術(shù)實現(xiàn)網(wǎng)絡(luò)情景模擬測評,利用視頻技術(shù)實現(xiàn)遠程視頻測評功能,利用高密技術(shù)和管理實現(xiàn)高端技術(shù)環(huán)境下的安全保密,力爭構(gòu)建一個智能多樣、試卷等值、操作簡便、技術(shù)高端、動態(tài)管理的試題系統(tǒng)。