• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)字化轉(zhuǎn)型背景下大規(guī)模考試機考體系的構(gòu)建

      2024-01-01 00:00:00吳曼王松嶺
      考試研究 2024年5期
      關(guān)鍵詞:機考體系構(gòu)建數(shù)字化轉(zhuǎn)型

      [摘 要] 數(shù)字化轉(zhuǎn)型是教育考試順應(yīng)時代發(fā)展的必由之路,機考以其獨特的優(yōu)勢成為大規(guī)模考試數(shù)字化轉(zhuǎn)型的有效途徑。專業(yè)考試機構(gòu)應(yīng)該結(jié)合人工智能、大數(shù)據(jù)等先進技術(shù),深入探索大規(guī)??荚嚈C考的實施策略,利用現(xiàn)代信息技術(shù)搭建大規(guī)??荚嚈C考體系,改進命題工作方式,提高組考工作效率,優(yōu)化考試智能評分系統(tǒng),提升考試評價價值。同時,積極破解數(shù)字化轉(zhuǎn)型中機考的數(shù)據(jù)安全、技術(shù)保障、試卷等值等難題,提升大規(guī)??荚嚲C合管理的質(zhì)效,以滿足現(xiàn)代考試的需要。

      [關(guān)鍵詞] 數(shù)字化轉(zhuǎn)型;大規(guī)??荚嚕粰C考;體系構(gòu)建

      [中圖分類號] G424.74 [文獻標(biāo)識碼] A

      [文章編號] 1673—1654(2024)05—040—010

      現(xiàn)代社會已邁入數(shù)字經(jīng)濟時代,數(shù)字化轉(zhuǎn)型正在沖擊和顛覆著已有的技術(shù)路徑、組織模式乃至發(fā)展戰(zhàn)略。2022年,黨的二十大報告首次將“推進教育數(shù)字化”寫入其中,教育部也正式提出實施國家教育數(shù)字化戰(zhàn)略行動,加速教育適應(yīng)數(shù)字中國發(fā)展的步伐[1]。中共中央、國務(wù)院印發(fā)的《深化新時代教育評價改革總體方案》明確提出,要充分利用信息技術(shù),提高教育評價的科學(xué)性、專業(yè)性、客觀性,要求創(chuàng)新評價工具,利用人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù),探索開展學(xué)生學(xué)習(xí)情況全過程縱向評價和德智體美勞全要素橫向評價[2] ??荚囀墙逃ぷ鞯闹匾h(huán)節(jié),推進考試的數(shù)字化轉(zhuǎn)型,不僅是推進教育數(shù)字化的真實體現(xiàn),也是落實教育評價改革的有力舉措。

      數(shù)字化轉(zhuǎn)型是指順應(yīng)新一代科技革命和產(chǎn)業(yè)革命的趨勢,不斷深化應(yīng)用云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能、區(qū)塊鏈等新一代信息技術(shù),激發(fā)數(shù)據(jù)要素創(chuàng)新驅(qū)動潛能,打造提升信息時代生存和發(fā)展能力,加速業(yè)務(wù)優(yōu)化升級和創(chuàng)新轉(zhuǎn)型,改造提升傳統(tǒng)功能,培育發(fā)展新功能,創(chuàng)造、傳遞并獲取新價值,實現(xiàn)轉(zhuǎn)型升級和創(chuàng)新發(fā)展的過程[3] 。教育考試的數(shù)字化轉(zhuǎn)型就是要以數(shù)字化技術(shù)、數(shù)字化產(chǎn)品和數(shù)字化平臺為支撐起點,重新思考組考策略,著力創(chuàng)建新的組考模式,形成數(shù)字化考試生態(tài)系統(tǒng),以適應(yīng)數(shù)字時代對考試的需求。

      計算機化考試(Computer-Based Testing,CBT,以下簡稱“機考”)由來已久,但隨著教育數(shù)字化轉(zhuǎn)型的推進,數(shù)字技術(shù)為機考賦能,“云”+“端”架構(gòu)模式也以其便捷、靈活的特點,在大規(guī)??荚囍腥遮厪V泛應(yīng)用,并逐漸向全學(xué)科、全題型、全流程延展,這不僅豐富了各學(xué)科核心素養(yǎng)的考查需求,提升了考試組織管理的效能,也更好地維護了考試的公平與公正。

      一、教育考試數(shù)字化轉(zhuǎn)型的研究現(xiàn)狀及發(fā)展現(xiàn)狀

      (一)教育考試數(shù)字化轉(zhuǎn)型的研究現(xiàn)狀

      隨著數(shù)字技術(shù)的發(fā)展及各行各業(yè)數(shù)字化轉(zhuǎn)型進程的加快,越來越多考試工作者開始逐步探索教育考試數(shù)字化轉(zhuǎn)型之路。徐光木等人積極探索了ChatGPT在助推教育考試數(shù)字化轉(zhuǎn)型中的機遇、應(yīng)用及挑戰(zhàn),指出當(dāng)前教育考試數(shù)字化轉(zhuǎn)型面臨資源不均衡、對學(xué)生評價不全面、數(shù)字化成本高昂等問題,而ChatGPT為教育考試數(shù)字化轉(zhuǎn)型注入內(nèi)生動力,可以用于自動生成海量題庫,建立虛擬考場,服務(wù)學(xué)校多元化選才和學(xué)生個性化成長[4]。趙劍楠結(jié)合測試使用論證框架(Assessment Use Argument)介紹了北京高考英語聽說機考的設(shè)計、開發(fā)、特點及效果[5],并以新托福、培生學(xué)術(shù)英語考試聽說測試為例,對計算機輔助英語聽說測試任務(wù)進行研究[6]。魯欣正[7]對數(shù)字化和數(shù)字化轉(zhuǎn)型的時代背景和現(xiàn)實意義進行剖析,對數(shù)字化轉(zhuǎn)型的關(guān)鍵要素進行梳理,并對教育考試數(shù)字化轉(zhuǎn)型的未來發(fā)展方向提出若干建議。應(yīng)朝帥等[1]結(jié)合浙江省實踐,積極探索實踐試卷流轉(zhuǎn)出入庫數(shù)字化管理模式,構(gòu)建基于“數(shù)據(jù)流”的考試試卷數(shù)字化管理體系雛形,從理念、方法、手段、技術(shù)路線上實現(xiàn)“試卷流”向“試卷數(shù)據(jù)流”的轉(zhuǎn)變。馬彪等[8]以江蘇省實踐為例,探索教育考試數(shù)字化轉(zhuǎn)型的問題、要素與目標(biāo)。孫利君對教育考試業(yè)務(wù)數(shù)字化重構(gòu)進行深入思考,總結(jié)數(shù)字化呈現(xiàn)的特點,結(jié)合考試業(yè)務(wù)提出建議[9],還積極探索教育數(shù)字化戰(zhàn)略背景下的考試評測創(chuàng)新與實踐[10]。吳斌[11]等對命題管理工作數(shù)字化轉(zhuǎn)型的建設(shè)框架和實施路徑提出相關(guān)思考。汪張龍梳理了認知智能大模型的發(fā)展進程,分析了認知智能大模型在教育考試數(shù)字化轉(zhuǎn)型中的應(yīng)用場景,并指出認知智能大模型在加速教育考試數(shù)字化轉(zhuǎn)型中的必然性與價值體現(xiàn)[12];他還與李俊杰探討了新基建背景下,教育考試數(shù)字化轉(zhuǎn)型的路徑、應(yīng)用場景及發(fā)展趨勢[13]。李鴻江等[14]從組考流程、平臺設(shè)計和實踐應(yīng)用等方面,詳細闡釋了北京中考英語聽說機考的創(chuàng)新與實踐。

      綜合上述研究成果可以看出,隨著數(shù)字技術(shù)的發(fā)展及人工智能的應(yīng)用,數(shù)字化轉(zhuǎn)型是教育考試發(fā)展的必由之路,機考已經(jīng)成為考試組織管理和教育測量評價領(lǐng)域的主要取向。機考將信息技術(shù)與考試融合為一體,發(fā)展模塊化組合,互通數(shù)據(jù)庫系統(tǒng),實施多元化評價,推進考評一體化,具有靈活性強、嚴密性好、節(jié)約考試資源等優(yōu)勢,是無紙化考試的延伸和擴展,能夠滿足教育考試的考查需求,實現(xiàn)了對數(shù)據(jù)信息的高效使用和深度挖掘[15]。

      (二)教育考試數(shù)字化轉(zhuǎn)型的發(fā)展現(xiàn)狀

      隨著感知智能、認知智能等技術(shù)的發(fā)展,機器學(xué)習(xí)推理技術(shù)、自動評閱技術(shù)、語義評測技術(shù)、圖文識別技術(shù)、行為識別分析技術(shù)等在教育考試領(lǐng)域創(chuàng)新集成應(yīng)用,為教育考試數(shù)字化轉(zhuǎn)型提供了堅強的技術(shù)支持。例如:考試內(nèi)容方面,語音識別、自然語言處理技術(shù)的突破,為英語聽說能力的自動評估提供了可能。語音識別技術(shù)使機器能夠聽懂考生的語音內(nèi)容;語音增強技術(shù)讓機器能在嘈雜的考場環(huán)境中聽清考生的聲音;語音交互技術(shù)可以讓機器聽懂指令并實現(xiàn)人機交互;語音評測技術(shù)又能讓機器評判考生的口語水平。這些技術(shù)可以準(zhǔn)確地評估學(xué)生的發(fā)音、流利度、語言表達等關(guān)鍵指標(biāo)。在考試組織方面,人工智能、動作捕捉識別分析等技術(shù)的發(fā)展,使智能安檢門、考場智能巡查系統(tǒng)、保密室智能巡檢系統(tǒng)在考試組考中逐漸得到應(yīng)用,數(shù)字化技術(shù)對考試組織管理的賦能,保障了考試的安全,維護了考試的公平與公正。

      全國計算機等級考試、全國大學(xué)英語四六級口語考試(CET-SET)、全國英語等級考試(PETS)口語考試、全國普通話等級考試,北京、上海、廣東、天津等多省市的高考、中考英語聽力、口語測試,乃至一些音樂考試,都已經(jīng)在使用機考技術(shù)開展多模態(tài)評測?,F(xiàn)在的機考,通過數(shù)字化賦能,已經(jīng)提升了組考過程的質(zhì)效,彰顯出如下優(yōu)勢:

      一是提高了考試管理工作的高效性。機考通過自動化的方式部署實施考試環(huán)節(jié),考務(wù)組織高效便捷,節(jié)省了考務(wù)人力的投入。同時,考試系統(tǒng)實時監(jiān)控考試進展情況,考務(wù)工作人員可以動態(tài)獲取考生考試完成情況,無需再通過逐級上報等方式掌握考試情況,使考務(wù)的組織與管理更加便捷。

      二是增強了考試組考的安全性。相較傳統(tǒng)紙筆考試,機考免去了試卷印刷環(huán)節(jié),減少了紙張的使用,降低了試卷流轉(zhuǎn)的風(fēng)險及管理風(fēng)險。同時,增加了多重安全措施,確保了考試的公平與公正??荚囘^程中的數(shù)據(jù)也通過實時回傳監(jiān)考機,或者在考試機上生成日志記錄,實現(xiàn)數(shù)據(jù)的可追溯,避免了人為錯誤造成難以追溯的情況。

      三是實現(xiàn)了對考生考查的全面性。傳統(tǒng)紙筆考試具有一定的局限性,試題內(nèi)容設(shè)計及考試方式無法實現(xiàn)對學(xué)生學(xué)科素養(yǎng)的全面考查。數(shù)字化的考試平臺,不僅可以實現(xiàn)傳統(tǒng)紙筆考試的功能,同時以前未能考查到的學(xué)科素養(yǎng)及能力也得以全面考查。

      四是確保了試卷評分的一致性。機考輔助評分,可以將多視角評分數(shù)據(jù)與多維度診斷相結(jié)合,實現(xiàn)高解釋性、高區(qū)分性的全面評價,在提高閱卷效率的同時,確保測評標(biāo)準(zhǔn)的一致。

      總之,教育考試數(shù)字化轉(zhuǎn)型是新時代教育發(fā)展的必然選擇。數(shù)字技術(shù)為大規(guī)??荚嚨臋C考提供了技術(shù)基礎(chǔ)和實施保障,也給考試的組織管理及教育教學(xué)帶來了新突破。隨著信息技術(shù)的不斷進步和政策的逐步完善,機考有望在大規(guī)??荚嚁?shù)字化轉(zhuǎn)型中發(fā)揮越來越重要的作用。

      現(xiàn)有的機考大多運用于英語學(xué)科的考查,而大規(guī)模考試包含的科類較多,還需要引入新的技術(shù),實現(xiàn)機考在其他科類考試中的全面應(yīng)用。另外,大規(guī)??荚嚨慕M織管理是一項系統(tǒng)工程,包含試題命制、考試組織、試題評閱、考試評價等多個環(huán)節(jié)。目前的機考只是在考試中替代紙筆考試,在考試后智能輔助評分,數(shù)字信息技術(shù)對整個考試業(yè)務(wù)鏈條的賦能還不夠,對各管理系統(tǒng)及資源的整合還不全,對考試數(shù)據(jù)的挖掘還不深,未能充分發(fā)揮數(shù)字化轉(zhuǎn)型的優(yōu)勢。作為專業(yè)的考試機構(gòu),應(yīng)該用數(shù)字思維重塑教育考試業(yè)務(wù)流程,將信息技術(shù)與考試業(yè)務(wù)深度融合,搭建教育考試綜合管理體系,以提升大規(guī)??荚嚱M織管理的質(zhì)效,滿足現(xiàn)代考試的需要。

      二、搭建大規(guī)??荚嚈C考體系

      如表1所示,大規(guī)??荚嚨慕M織管理從試題命題開始,歷經(jīng)考務(wù)準(zhǔn)備、考試組織、試卷評閱、考試評價等多環(huán)節(jié),同時考試安全作為考試工作的“生命線”,又貫穿考試的全鏈條、各環(huán)節(jié)。在大規(guī)??荚囍袑嵤C考,需要利用現(xiàn)代信息技術(shù)、大數(shù)據(jù)處理技術(shù)、人工智能技術(shù)等先進手段賦能考試的各環(huán)節(jié),需要高效的數(shù)據(jù)處理能力和穩(wěn)定的安全系統(tǒng)做保障,以實現(xiàn)考試工作整體的數(shù)字化轉(zhuǎn)型。并且,數(shù)字化轉(zhuǎn)型不是簡單地將考試管理過程電子化,而是要借助數(shù)字技術(shù),對考試全流程、全環(huán)節(jié)、全要素進行業(yè)務(wù)模式創(chuàng)新重構(gòu)、業(yè)務(wù)流程優(yōu)化再造[7],促進考試管理協(xié)同體系的構(gòu)建,實現(xiàn)大規(guī)??荚囌嬲淖兏?。

      (一)機考命題系統(tǒng)

      試題是測試評價的載體,命題也是整個考試鏈條的首要環(huán)節(jié)。命題工作一般包括命題藍圖設(shè)計、試題征題、審校篩題、試題研磨、試卷組卷、形成清樣等環(huán)節(jié);命題過程中,需要綜合考慮知識點分布、試題形式、難度系數(shù)、試題查重等事項。在試題命制過程中,做好數(shù)字化轉(zhuǎn)型,加強信息技術(shù)、大數(shù)據(jù)處理、人工智能等技術(shù)的運用,可以實現(xiàn)命題全流程、全題型的智能化處理,進一步提升命題工作的質(zhì)量及效率。

      一是命題管理可以更有序高效。通過搭建數(shù)字化的命題系統(tǒng),命題工作者可以更好地把控項目進展?fàn)顩r,科學(xué)地分布試卷結(jié)構(gòu),還可以合理調(diào)配試題庫及命題教師資源等,以確保命題工作如期保質(zhì)完成。

      二是命制試題可以更科學(xué)規(guī)范。隨著OCR識別、圖像識別、圖文轉(zhuǎn)寫、語義理解、相似檢測、機器學(xué)習(xí)等人工智能技術(shù)的發(fā)展,將會對所命制試題的文本、語義、公式、圖片、視頻及音頻等內(nèi)容的科學(xué)性、規(guī)范性進行校驗[13],如對單詞拼寫、語句語法、特殊符號等進行檢測,以進一步提高命制試題試卷的質(zhì)量。另外,機考命題系統(tǒng)可以集成更豐富的數(shù)字化資料,如電子工具書、電子期刊、電子資料及軟件等,為命題過程中檢索相關(guān)內(nèi)容、確保試題的科學(xué)性提供便捷。

      三是試題形式可以更豐富多樣。計算機可以兼容多種考查形式,除了傳統(tǒng)紙筆測試的選擇題、填空題、簡答題以外,語言類測試可以增加視聽題、口語表達題等;自然學(xué)科測試可以增加繪圖題、連線題、實驗操作題等;藝術(shù)類學(xué)科可以增加音樂唱奏題、節(jié)奏敲擊題、美術(shù)配色題、圖片拖拽題等;信息技術(shù)類學(xué)科,可以增加軟件操作、編程等試題。多樣化的考查形式,可以更全面檢驗考生所具備的學(xué)科素養(yǎng)。例如:在英語聽說測試中,朗讀題、情景問答題、口頭復(fù)述題、看圖說話或口頭作文題等,對考生的發(fā)音進行測評,又對考生的理解能力、語言組織能力、口語表達能力等從發(fā)音清晰度、表達流暢度、語法準(zhǔn)確度、信息完整度等方面進行全面測評,而這是以往紙筆測試難以實現(xiàn)的。還有藝術(shù)學(xué)科的文化理解、審美感知、藝術(shù)表現(xiàn)、創(chuàng)意實踐等素養(yǎng),信息技術(shù)學(xué)科的實踐操作、技術(shù)素養(yǎng)等,都可以在數(shù)字化轉(zhuǎn)型的推動下得以實現(xiàn)。

      四是試題難度可以更精準(zhǔn)把控。試題難度是命題時需要關(guān)注的重點指標(biāo)。傳統(tǒng)命題過程中,試題難度的把控主要憑借命題教師的預(yù)估,受命題教師經(jīng)驗的影響較大,存在一定的誤差。數(shù)字化賦能的考試命題,可以基于歷年考試試題及考生成績等數(shù)據(jù),通過機器學(xué)習(xí)的方式,標(biāo)定試題難度,再反過來預(yù)估、標(biāo)定新命制試題的難度。憑借以往試題及考生的真實數(shù)據(jù),加上大數(shù)據(jù)的精準(zhǔn)算法,可以使試題的預(yù)估難度更精確、標(biāo)準(zhǔn)更統(tǒng)一??荚囃瓿珊螅€可以將新的考試數(shù)據(jù)補充進數(shù)據(jù)庫,通過建立訓(xùn)練集,用機器學(xué)習(xí)算法構(gòu)建AI難度預(yù)估模型,并不斷地拓展訓(xùn)練和訓(xùn)練迭代,持續(xù)提升模型的準(zhǔn)確度[14];同時,可以與預(yù)估難度進行比對、校準(zhǔn),在豐富數(shù)據(jù)庫數(shù)據(jù)的同時,為下一次命題提供數(shù)據(jù)支撐(圖1)。

      五是試題查重可以更簡捷高效。為維護考試的公平與公正,避免出現(xiàn)“泄題”“重題”等不必要的輿情,在命題審校過程中,需要對試題進行查重,排查試題是否與歷年試題、考前模擬題等重復(fù)。傳統(tǒng)的人工查重方式資源有限、時間緊迫、效率低下。通過信息技術(shù)建立試題庫,可以海量存儲試題,以更便捷地查重。隨著AIGC(生成式人工智能)在命題領(lǐng)域的應(yīng)用,可以探索應(yīng)用試題表征和融合技術(shù),采集題干、公式、示意圖表、知識點的多模態(tài)特征,融合不同模態(tài)向量,得到查重檢索的輸入信息[16]。

      六是試題管理可以更安全嚴密。根據(jù)試題數(shù)據(jù)下載方式不同,機考分為在線機考及非在線機考。在線機考的試卷包,采用國密算法進行切片加密存儲,考試時從考試系統(tǒng)直接通過線上專網(wǎng)下載;非在線機考通過試題U盤將試卷數(shù)據(jù)導(dǎo)入監(jiān)考機,再使用加密鎖進行試卷包傳輸,由監(jiān)考機通過局域網(wǎng)發(fā)給本考場考試機。無論哪種形式,都免去了試卷印刷、運輸分發(fā)等環(huán)節(jié),降低了試題泄題的風(fēng)險;智能機考系統(tǒng)也支持考中不解壓試卷包,使試題管理更加科學(xué)、安全。

      (二)機考考務(wù)系統(tǒng)

      考務(wù)工作是考試組織實施的主體,是考試工作鏈條中的關(guān)鍵環(huán)節(jié)??紕?wù)工作一般包括考前報名及考場編排、考中組織管理及考試行為監(jiān)控、考后數(shù)據(jù)匯總及成績發(fā)布等??紕?wù)工作的數(shù)字化賦能,可提高考試管理工作的效率,提升組考工作的規(guī)范化水平。

      考前的考務(wù)工作主要是考場編排、考務(wù)表件的制作、考生數(shù)據(jù)的管理等。數(shù)字化賦能的考務(wù)系統(tǒng),可以在考生報名信息數(shù)據(jù)庫的基礎(chǔ)上,結(jié)合考點實際(如考場數(shù)、機位數(shù))及考生特殊情況(如殘疾考生合理便利需求等),采取多校混編或指定編排等方式編排考場,并便捷地生成相應(yīng)的考務(wù)表件(如考場信息表、條形碼數(shù)據(jù)、考場記錄表單等),及時統(tǒng)計考務(wù)相關(guān)數(shù)據(jù),提高考務(wù)工作的組織工作效率。也可通過機考考務(wù)系統(tǒng)對考試環(huán)境進行檢測及排查,收集各考點考場的硬件檢測結(jié)果,協(xié)助考試組織機構(gòu)判斷各考場備考狀況,督促各考點完成系統(tǒng)更新、設(shè)備調(diào)試及考試環(huán)境的準(zhǔn)備。

      考中的考務(wù)工作主要是考試試卷管理、考試流程的管理(在規(guī)定時間按考試程序完成相應(yīng)考務(wù)事項)、突發(fā)情況的處置、考生答卷的回收及匯總等(傳統(tǒng)考試是回收試卷,機考為答題數(shù)據(jù)回收)??荚囋嚲砉芾碇校瑪?shù)字化的管理可以降低試卷流轉(zhuǎn)的安全風(fēng)險,緊急情況時調(diào)動試卷應(yīng)急能力不足的風(fēng)險,以及試卷流轉(zhuǎn)、交接、回收中的人工復(fù)核風(fēng)險[1]。在考試流程管理中,機考考務(wù)系統(tǒng)可以嚴格按照設(shè)計的既定時間,依次執(zhí)行考務(wù)程序中的相關(guān)事項,準(zhǔn)時發(fā)放或回收試題數(shù)據(jù),避免出現(xiàn)考生提前答題或結(jié)束鈴響后答題等違紀現(xiàn)象,也減少了工作人員任務(wù)執(zhí)行中的人為錯誤(如打錯鈴、發(fā)錯試卷),提高了考試監(jiān)考工作的質(zhì)效。通過機考考務(wù)系統(tǒng)也可實時掌控各考點、考場的考試進展?fàn)顩r,及時掌握考生答題情況,對網(wǎng)絡(luò)掉線、耳機脫落等突發(fā)情況及時報警,為合理處置爭取了時間,降低了考試的組考風(fēng)險。在考試過程中,還要借助信息技術(shù),提升考試指揮中心的功能,匯集考生、考場等考試信息,實時掌握考情動態(tài),全面指揮調(diào)度,及時應(yīng)急處置。在需要語音測試的科目中,綜合運用聲音降噪技術(shù)、語音識別技術(shù)、語義表征技術(shù)、音質(zhì)檢測技術(shù)、音頻增強技術(shù)、考生端異常檢測與數(shù)據(jù)加密傳輸?shù)仁侄?,確??忌拇痤}數(shù)據(jù)清晰、有效。

      數(shù)字化賦能的機考考務(wù)系統(tǒng),也可以助力防范考試作弊??忌M入考場或登錄考試系統(tǒng)時,可通過刷臉、指紋驗證、虹膜技術(shù)等進行身份驗證,避免出現(xiàn)考生替考等現(xiàn)象??荚囬_始后,對于局域網(wǎng)下的機考,可以通過無干擾抓拍技術(shù)等,隨機抓拍考生考試情況,震懾考生作弊等行為,也進一步比對驗證考生身份;對于互聯(lián)網(wǎng)下的機考,可以通過行為分析技術(shù)等,實時監(jiān)控考場考試情況,對考生偷窺、攜帶可疑物品等異常行為及時報警,方便監(jiān)考員及時監(jiān)管,有效維持考試紀律。同時,行為分析技術(shù)也可以實時巡查監(jiān)考員的狀態(tài),對不履責(zé),或者有不當(dāng)行為(如脫崗、長期久坐不巡場、監(jiān)考中聊天等)的監(jiān)考員,及時報警提示,促進考試考場秩序的建立。智能機考系統(tǒng)對試題及選項亂序的處理、隨機抽取套卷、實施相鄰考位試題不同等措施,也能為防范考試作弊行為提供有效途徑。

      考后的考務(wù)工作主要是答卷回收、考試數(shù)據(jù)的安全管理和考后服務(wù)等?;厥沾鹁頂?shù)據(jù)首先需要進行完整性校驗,同時及時查驗考場、考生實際狀況,減少答題數(shù)據(jù)不可評測的風(fēng)險??荚嚁?shù)據(jù)的安全是考務(wù)工作的重中之重。傳統(tǒng)的組考方式是回收答題卡等紙質(zhì)介質(zhì),而機考的組考是回收考生答題的電子數(shù)據(jù)。根據(jù)高考考務(wù)工作規(guī)定,考生答卷在成績公布前按國家秘密級事項管理。為此,要制定嚴格的數(shù)據(jù)管理規(guī)范,采用信息技術(shù)對數(shù)據(jù)加密存儲、傳輸,嚴格控制數(shù)據(jù)回收的路徑及流程,做好數(shù)據(jù)校驗、行為日志記錄等工作。至于考后服務(wù),主要是應(yīng)對一些咨詢信訪訴求。數(shù)字化的考務(wù)管理系統(tǒng),可更多記載考試有關(guān)信息,為追溯考試當(dāng)時的具體情況提供客觀依據(jù),保證了信訪咨詢的性能與效果。通過多模態(tài)分析技術(shù)、行為分析技術(shù)、機器學(xué)習(xí)技術(shù)等,還可以進行考后考場視頻錄像智能分析,智能捕捉考場中的考生異常行為,為考后信訪、投訴等提供評判依據(jù)及支撐,維護考試的公平與公正。

      (三)機考評卷系統(tǒng)

      目前,大規(guī)模紙筆考試的評卷方式主要是網(wǎng)上閱卷,一般以“雙評+仲裁”的方式進行。但是,由于評卷主體不同,也存在一定的誤差,尤其是主觀題。而機考的智能輔助評分,一般先由閱卷專家抽樣一定數(shù)量的試卷進行定標(biāo),機器自動學(xué)習(xí)評分標(biāo)準(zhǔn),再以統(tǒng)一的標(biāo)準(zhǔn)對試卷進行機評。在提高評分效率、降低評分成本的同時,也確保了評卷標(biāo)準(zhǔn)的一致性、判分的準(zhǔn)確性和考試的公平性。北京市中高考的英語聽說機考[14]、天津市高考口語機考等考試,均采取“人工評分+智能評分+人工仲裁”的方式。

      計算機智能輔助評卷的核心在于計算機能夠從定標(biāo)集合的人工評卷結(jié)果中學(xué)習(xí)并掌握評卷標(biāo)準(zhǔn)。計算機通過對相關(guān)特征的聚類分析,并考慮考生地域覆蓋、水平覆蓋情況等選出最具有代表性的樣本組成定標(biāo)數(shù)據(jù)集合(簡稱為“定標(biāo)集”),提供給專家老師進行評卷定標(biāo)評分,通過學(xué)習(xí)專家老師在這些定標(biāo)試卷上的評分結(jié)果,機器逐步形成與專家老師定標(biāo)標(biāo)準(zhǔn)相一致的評分標(biāo)準(zhǔn),也就是通過專家老師的定標(biāo)結(jié)果來充分理解和掌握評分標(biāo)準(zhǔn)。

      計算機智能輔助評卷一般要經(jīng)過計算機預(yù)評卷、人工定標(biāo)評卷、計算機智能評卷、人機協(xié)作評卷等流程(圖2)[14]。計算機預(yù)評卷,是基于“通用識別評分模型”對考生作答數(shù)據(jù)進行初步的粗粒度的分檔評分和排序,用于標(biāo)桿卷及定標(biāo)集合的抽取。根據(jù)預(yù)評卷的結(jié)果,按試卷、試題篩選標(biāo)桿卷和定標(biāo)集合,由閱卷組通過“雙評”,對定標(biāo)集合進行評卷。計算機獲取人工評卷結(jié)果的定標(biāo)集合后,通過對定標(biāo)集樣本的分析、學(xué)習(xí)和記憶學(xué)習(xí)過程,建立符合本次考試人工評分標(biāo)準(zhǔn)的專用評分模型,對全體考生答卷進行自動評卷,并篩選異常答卷再進行人工評卷。最后,基于計算機評卷和人工評卷結(jié)果,確定考生最終成績。

      智能輔助評分技術(shù)已日趨成熟、穩(wěn)定,可以支持對填空、作文、證明題、簡答題等題型進行評分。北京市高考英語聽說考試從2017年開始實施機評,經(jīng)過多年實踐,現(xiàn)實智能評分結(jié)果與人工評分在平均分、標(biāo)準(zhǔn)差、相關(guān)度及評分一致率等方面結(jié)果相當(dāng)[10]。隨著語音識別、人工智能等技術(shù)的發(fā)展,智能輔助評分也逐漸嘗試在素養(yǎng)類學(xué)科測試中應(yīng)用。例如,可對音樂唱奏題實施機器智能輔助評分,可對音準(zhǔn)、節(jié)奏、完整性、表現(xiàn)力等多維度智能評分。通過測評數(shù)據(jù)分析,智能評測較人工評測的總分相關(guān)度高,總分平均誤差較低,可以達到預(yù)期效果??梢灶A(yù)計,隨著語音識別、圖像識別、智能評測等人工智能技術(shù)的發(fā)展,未來可實現(xiàn)對大規(guī)??荚嚾珜W(xué)科、全題型的智能評分。

      但在使用智能輔助評分系統(tǒng)進行機評時,也需要注意:

      一是加強對成績的復(fù)核和人評抽審,或者從技術(shù)上綜合分析考生成績做線性回歸,確保機評結(jié)果的信度及效度。例如:當(dāng)英語聽說成績與筆試成績存在較大差異時(可能由于錄音設(shè)備考試進行中出現(xiàn)故障,造成考生的筆試成績分高口語分極低),要增加人工復(fù)審復(fù)核,必要時還需進行微調(diào)或追加評分,以確保考試的公平公正。

      二是不同類型試題對定標(biāo)集的數(shù)量要求不同。試題根據(jù)開放程度,一般分為封閉型試題(如口語測試中的朗讀題)、半開放型試題(如口語測試中的情景對話、看圖說話、復(fù)述題等),以及全開放型試題(如話題作文、藝術(shù)創(chuàng)作題等)。試題越開放,需要獲取的關(guān)鍵信息量越多,需要足夠的樣本供機器學(xué)習(xí),以得到更精準(zhǔn)的測評標(biāo)準(zhǔn)。

      (四)機考評價系統(tǒng)

      考試評價是考試組織實施的最后環(huán)節(jié),充分發(fā)揮、提升數(shù)據(jù)的作用和價值也是數(shù)字化轉(zhuǎn)型的目標(biāo)和方向。傳統(tǒng)的考試評價主要是通過分析考生的測評數(shù)據(jù)進行評價,而機考可以采集更多的有效信息,將這些信息與評價技術(shù)、測量模型等相結(jié)合,實現(xiàn)對學(xué)生的多元評價、實時評價及自適應(yīng)測試等,助力考試評價的深入發(fā)展。對考試數(shù)據(jù)進行深入挖掘、分析及應(yīng)用,向考生、學(xué)?;蚪逃姓块T提供多維度的評價分析報告,可促進學(xué)生發(fā)展,促進教師教學(xué)質(zhì)量提升,為政策制定者提供有效的借鑒,達到“以評促學(xué)、以評促教”的目的。

      機考體系應(yīng)該是一個集成系統(tǒng),涵蓋考生報名信息、考場行為、作答情況、考試成績等考生考試信息,涵蓋試題試卷內(nèi)容、系數(shù)參數(shù)等試題信息,以及考試組考中的相關(guān)信息。信息數(shù)據(jù)量大,數(shù)據(jù)類型齊全,數(shù)據(jù)資源豐富,不能僅對考試作答進行分數(shù)評判,還要借助大數(shù)據(jù)技術(shù)、人工智能技術(shù)等,增加考試評價的深入性,提高考試評估的全面性,豐富評估維度并提供可視化的考試評價分析報告。例如:通過對試題區(qū)分度、難度、信度、效度的分析,從知識點、能力等多維度,對命題質(zhì)量進行評價;通過對評卷平均分、標(biāo)準(zhǔn)差、綜合指數(shù)、評卷量及誤差分析等,進行試卷質(zhì)量分析;通過對考務(wù)預(yù)警情況、考試作弊數(shù)等信息分析,對各考點組考工作進行評價;利用智能行為分析技術(shù),無感捕捉、采集考生作答時的具體行為及過程性表現(xiàn)(如嘴唇動作、頭部姿態(tài)、眼睛注視點、面部微表情、作答速度等),并與語音識別信息融合,形成多模態(tài)數(shù)據(jù),再通過數(shù)字化分析,一方面檢測考生考試的異常行為,及時警示考生考試系統(tǒng)狀態(tài)[10],輔助提高機考語音識別的準(zhǔn)確率、提升異常語音的檢測效果[17],另一方面對學(xué)生考試過程進行評價、診斷、分析,深入了解學(xué)生對所考查內(nèi)容的掌握程度和疑難點,為考生提供個性化的學(xué)習(xí)方案,為學(xué)生自主學(xué)習(xí)及有針對性地提升成績提供參考。同時,反撥教學(xué)工作,為教師教學(xué)提供積極引導(dǎo)及有效借鑒。

      另外,考試評價系統(tǒng)可以充分利用信息技術(shù),將數(shù)據(jù)進行橫向和縱向的貫通評價分析。例如,將考生在不同考試中的測評結(jié)果進行有效關(guān)聯(lián)、縱向?qū)Ρ确治觯瑸榭忌掷m(xù)學(xué)習(xí)發(fā)展提供指導(dǎo);也可將不同考區(qū)或者地區(qū)的測評結(jié)果進行橫向?qū)Ρ确治觯瑸榻逃虒W(xué)及教育行政部門決策提供參考,進一步優(yōu)化教育資源配置。

      隨著認知智能大模型技術(shù)等新一代人工智能技術(shù)的發(fā)展,機器對人的語言理解、邏輯推理、多模態(tài)交互等方面的能力也將大幅提升。不遠的將來,也許會有機器人考官通過與考生進行問答的方式,直接對考生進行自適性評價,在更多的學(xué)科、更多的題型中對考生進行實時、多維度、更深入的評價[12]。

      三、大規(guī)模機考面臨的挑戰(zhàn)與對策

      (一)機考數(shù)據(jù)安全問題

      安全是考試工作的“生命線”。在大規(guī)??荚囍校瑪?shù)據(jù)安全更是考試組織實施的重中之重。隨著數(shù)字化轉(zhuǎn)型的深入,在大規(guī)??荚囍胁捎脵C考組考方式的趨勢不可逆轉(zhuǎn)。目前,大多數(shù)機考還是采取局域網(wǎng)的模式組織考試,主要利用硬件設(shè)備(如加密鎖)對試卷進行加密管理。隨著網(wǎng)絡(luò)技術(shù)的進一步發(fā)展,為使考試組織更加便捷,也為學(xué)生提供更多考試機會、降低試題泄漏和考試作弊風(fēng)險,可推行基于考試專網(wǎng)的線上機考,進一步減少數(shù)據(jù)的周轉(zhuǎn)傳輸,實現(xiàn)由集中性考試邁向可分散性的考試。同時,可以多科目混排、混考,通過“同場不同卷”的方式,進一步優(yōu)化考場資源,減少人力物力。數(shù)據(jù)加密技術(shù)也需要不斷升級,構(gòu)建全方位的安全保障體系,以全面確保考試設(shè)施及系統(tǒng)安全、考試試題安全、答題數(shù)據(jù)安全、考生信息安全等。

      (二)機考技術(shù)保障問題

      大規(guī)??荚囈话闵婕懊鎻V,社會關(guān)注度高,考試中若出現(xiàn)系統(tǒng)閃退、計算機宕機、網(wǎng)絡(luò)故障、考場斷電等偶發(fā)事故,不僅直接阻斷考試的進行,也會帶來一定的輿情風(fēng)險,甚至?xí)绊懮鐣€(wěn)定。在大規(guī)??荚囍袑嵤C考,技術(shù)保障是關(guān)鍵。機考標(biāo)準(zhǔn)化考場是機考組織實施的主要場所,需要配置計算機、服務(wù)器、交換機、專用耳機、考試系統(tǒng)等軟硬件設(shè)施,設(shè)備的穩(wěn)定使用情況直接影響著考試的組織與實施。要持續(xù)改進機考系統(tǒng),開發(fā)、優(yōu)化“斷點續(xù)考”等功能,建立、健全應(yīng)急響應(yīng)措施,減少、減緩事故對考試的影響。同時,積極培養(yǎng)、培訓(xùn)具備數(shù)字化思維和技能的人才參與考試的組織和實施,以便能夠及時、妥善處置考試中的偶發(fā)事故。

      (三)試卷平行等值問題

      大規(guī)模考試參與的考生人數(shù)較多,但囿于考場建設(shè)成本和考點場地的限制,同一考試項目需要安排多場次先后進行。為確??荚嚨墓焦?,防止出現(xiàn)泄題漏題,無法各場次使用同一套試題,需要命制多套試題,以供不同場次考生使用。但與此同時,這又對各場次試卷試題難度的等值等問題提出了更高要求。如何確保多套試卷的平行,既保持題型的統(tǒng)一,又保持難度的一致,是考試工作者,尤其是命題工作人員需要研究、破解的難題。建立科學(xué)、規(guī)范、題量充足的數(shù)字化題庫,為化解試卷平行等值問題提供可能。題庫可以按照考查內(nèi)容、難度系數(shù)、題型結(jié)構(gòu)等多項參數(shù)建立,在需要組卷時,按照既定的參數(shù)自動從題庫抽取試題,組成等值試卷。

      四、結(jié)語

      隨著機考在大規(guī)??荚囍械耐茝V應(yīng)用,以及教育考試數(shù)字化轉(zhuǎn)型的深入,未來大規(guī)??荚囘€可探索個性化的在線機考,組考也可以逐步向“隨報隨考”模式發(fā)展。通過數(shù)字化的機考系統(tǒng),對考生動態(tài)實施自適應(yīng)測試(Adaptive Testing),以更準(zhǔn)確地評估考生的真實水平;通過數(shù)字化題庫的建設(shè),實現(xiàn)實時智能組卷,在規(guī)定的考試周期內(nèi)靈活安排組織考試,以有效分解大規(guī)??荚嚨慕M考壓力;將考試、教育、資源集中整合起來,通過數(shù)字化平臺提供的考試評價分析報告,有針對性地調(diào)動教學(xué)數(shù)據(jù)庫資源,為學(xué)生提供個性化的學(xué)習(xí)資源,加強對學(xué)生有針對性地訓(xùn)練……大規(guī)??荚嚁?shù)字化轉(zhuǎn)型中,機考還有很大的發(fā)展空間。

      與此同時,也需要注意:一是數(shù)字化轉(zhuǎn)型的過程中需要不斷地變革,但并不意味著要完全摒棄之前的資源與方式,而是應(yīng)該在保留原有優(yōu)勢的基礎(chǔ)上加強與新環(huán)境的適應(yīng),從而找到平衡點進行變革。二是為了更好地在大規(guī)??荚囍袑嵤┖蛢?yōu)化機考,制定大規(guī)??荚嚈C考實施策略時,應(yīng)考慮不同地區(qū)、不同學(xué)校的技術(shù)接入能力,制定差異化的實施計劃,加大基礎(chǔ)設(shè)施建設(shè)投入,縮小技術(shù)差距。三是機考不僅改變了原有的考試組考業(yè)態(tài),也將改變教育教學(xué)的模式。在機考模式下,教師的角色從傳統(tǒng)的知識傳授者轉(zhuǎn)變?yōu)閷W(xué)習(xí)引導(dǎo)者和數(shù)據(jù)分析師,不僅需要提升對數(shù)字化工具及系統(tǒng)的使用能力,還需要掌握如何利用機考數(shù)據(jù)來指導(dǎo)教學(xué)、提升學(xué)生。四是在大規(guī)??荚囍袑嵤C考,還要注意關(guān)注特殊考生的需求問題。例如一些佩戴人工耳蝸或者助聽器的聽力殘障考生,其參加聽說考試時,進行安檢和佩戴耳麥均存在一定的困難;一些肢體殘疾的考生,考試中需要使用鼠標(biāo)、鍵盤等介質(zhì),也會給他們帶來一定的不便;而一些視力殘障考生,通過顯示屏呈現(xiàn)試題,也給他們帶來一定的困擾。為了保證考試的公平實施,需要充分考慮特殊考生的需求,繼續(xù)探索更便利的考試介質(zhì)。

      參考文獻:

      [1] 應(yīng)朝帥,丁文,樓策英,等.教育考試試卷流轉(zhuǎn)出入庫數(shù)字化的實踐與思考[J].教考研究,2023,(10):9-13.

      [2] 中共中央 國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》[EB/OL].(2020-10-13)[2023-04-12].http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/t20201013_494381.html.

      [3] 中關(guān)村信息技術(shù)和實體經(jīng)濟融合發(fā)展聯(lián)盟.數(shù)字化轉(zhuǎn)型參考架構(gòu):T/AIITRE 10001—2020[EB/OL].(2020-09-18)[2022-06-01].http://www.ttbz.org.cn/Pdfs/Index/?ftype=stamp;pms=40662.

      [4] 徐光木,熊旭輝,張屹,等. ChatGPT助推教育考試數(shù)字化轉(zhuǎn)型:機遇、應(yīng)用及挑戰(zhàn)[J]. 中國考試,2023,(5):19-28.

      [5] 趙劍楠.北京高考英語聽說機考的設(shè)計與開發(fā)[J].中小學(xué)外語教學(xué)(中學(xué)篇),2021,(12):49-54.

      [6] 趙劍楠.計算機輔助英語聽說測試任務(wù)研究——以新托福、培生學(xué)術(shù)英語考試聽說測試為例[J].考試研究,2022,(4):33-40.

      [7] 魯欣正.關(guān)于教育考試數(shù)字化轉(zhuǎn)型的若干思考[J].中國考試,2022,(9):1-8.

      [8] 馬彪,劉明巖,王仕豪,等.教育考試數(shù)字化轉(zhuǎn)型:問題、要素與目標(biāo)——以江蘇省實踐為例[J].現(xiàn)代教育技術(shù),2023,33(4):24-31.

      [9] 孫利君.教育考試業(yè)務(wù)數(shù)字化重構(gòu)及呈現(xiàn)的思考[J].招生考試研究,2023,(3):77-85.

      [10] 孫利君.教育數(shù)字化戰(zhàn)略背景下的考試評測創(chuàng)新與實踐[J].今日教育,2023,(5):48-51.

      [11] 吳斌,施國良.命題管理數(shù)字化轉(zhuǎn)型的現(xiàn)狀及提升路徑[J].浙江考試,2023,(9):9-12.

      [12] 汪張龍.認知智能大模型加速教育考試數(shù)字化轉(zhuǎn)型[J].中國考試,2023,(8):11-18.

      [13] 汪張龍,李俊杰.新基建背景下教育考試數(shù)字化轉(zhuǎn)型的路徑與前景[J].中國考試,2022,(7):69-94.

      [14] 李鴻江,孫利君,覃華.數(shù)字化轉(zhuǎn)型視域下英語聽說機考的創(chuàng)新與實踐[J].中國考試,2023,(5):11-36.

      [15] 劉玉俠,王迎.數(shù)字化考試現(xiàn)狀分析與關(guān)鍵技術(shù)設(shè)計[J].現(xiàn)代遠程教育研究,2013,(5):84-90.

      [16] 盧致杰.人工智能背景下考試招生制度與評價改革——第七屆教育考試與評價研討會綜述[J].中國考試,2024,(1):103-108.

      [17] 孫利君.數(shù)字化賦能英語聽說機考的創(chuàng)新實踐[J].浙江考試,2022,(8):3-8.

      Building a Large-Scale Computer-Based Testing System in the Context of Digital Transformation

      Wu Man" Wang Songling

      Tianjin Municipal Educational Admission and Examinations Authority,Tianjin,300387

      Abstract:Digital transformation is the inevitable path for educational exams to adapt to the development of the times. Computer-based testing(CBT),with its unique advantages,has become an effective means for the digital transformation of large-scale exams. Professional examination organizations should integrate advanced technologies such as artificial intelligence and big data to deeply explore the implementation strategies of large-scale CBT. Utilizing modern information technology to build a large-scale CBT system can improve the way exams are created,enhance the efficiency of exam organization,optimize intelligent grading,and increase the value of exam evaluations. Additionally,it is crucial to actively address challenges related to data security,technical support,and test paper equivalency in the process of digital transformation,thereby improving the quality and efficiency of comprehensive management for large-scale exams to meet modern testing needs.

      Key words:Digital Transformation,Large-Scale Exams,Computer-Based Testing,System Building

      (責(zé)任編輯:陳暢)

      猜你喜歡
      機考體系構(gòu)建數(shù)字化轉(zhuǎn)型
      中國注冊會計師協(xié)會關(guān)于更新注冊會計師考試機考練習(xí)網(wǎng)站的公告
      雅思機考落地中國大陸半年這些問題你應(yīng)該心中有數(shù)
      留學(xué)(2019年5期)2019-06-11 10:38:19
      試論融合創(chuàng)新思想對新時期圖書策劃和營銷的指導(dǎo)作用
      出版廣角(2016年22期)2017-01-17 17:35:58
      多元化農(nóng)業(yè)技術(shù)推廣體系的構(gòu)建探索
      農(nóng)村職業(yè)學(xué)校學(xué)生成績考核體系的研究
      如何構(gòu)建旅游管理專業(yè)實踐教學(xué)體系
      《華盛頓郵報》轉(zhuǎn)型的實踐與借鑒
      出版廣角(2016年15期)2016-10-18 00:12:27
      ACT將于2017年在所有國際考試中心推行機考
      留學(xué)生(2016年8期)2016-10-15 03:06:08
      我國出版上市公司數(shù)字化轉(zhuǎn)型的困境與對策
      出版廣角(2016年11期)2016-09-29 16:19:53
      傳統(tǒng)雜志的數(shù)字化轉(zhuǎn)型與融合發(fā)展
      新聞世界(2016年2期)2016-05-18 08:58:21
      麻城市| 无棣县| 红河县| 宝丰县| 台安县| 磐石市| 邵武市| 阿坝| 彩票| 荆州市| 都兰县| 普兰县| 定兴县| 安庆市| 濉溪县| 综艺| 利川市| 黔西县| 吉隆县| 葵青区| 苏州市| 隆尧县| 巩留县| 临夏县| 平武县| 祁阳县| 黔西县| 太康县| 叶城县| 嘉善县| 旬阳县| 潼关县| 印江| 合水县| 改则县| 体育| 太湖县| 常熟市| 西华县| 聂拉木县| 娄烦县|