[關(guān)鍵詞]完形填空;小樣本;縱向認(rèn)知診斷;神經(jīng)網(wǎng)絡(luò);潛在轉(zhuǎn)換分析;增長(zhǎng)曲線模型
[中圖分類號(hào)]G424.74[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)] 1673—1654(2025)03—085—009
一、引言
認(rèn)知診斷模型(Cognitive Diagnostic Model,CDM)當(dāng)下備受教學(xué)改革關(guān)注,是推進(jìn)教學(xué)改革的有力工具。借助認(rèn)知診斷理論,教師可以宏觀把握學(xué)校和班級(jí)整體認(rèn)知結(jié)構(gòu),微觀把握學(xué)生個(gè)體認(rèn)知狀態(tài),對(duì)學(xué)生的認(rèn)知屬性進(jìn)行對(duì)比分析,據(jù)此因材施教,提供個(gè)性化教學(xué)[1]。
早期的認(rèn)知診斷應(yīng)用多以截面數(shù)據(jù)(Cross-sectionalData)的橫斷研究為主。假定被試知識(shí)狀態(tài)在一段時(shí)間內(nèi)相對(duì)固定,對(duì)被試認(rèn)知屬性在該時(shí)段內(nèi)答題記錄的掌握情況進(jìn)行評(píng)估與分類,并以此進(jìn)行補(bǔ)救教學(xué)2]。一般利用DINA模型(DeterministicInputs,Noise“And”Gate Model,Junker,Sijtsma,2001)、融合模型(Fusion Model,Hartz,2002)、G-DINA模型(theGeneralizedDINA,dela Torre,2011)等實(shí)現(xiàn)認(rèn)知診斷。但這些模型需要估計(jì)題目參數(shù)(區(qū)分度、難度、失誤及猜測(cè)度)和被試能力參數(shù),需利用極大后驗(yàn)估計(jì)算法(MaximumAPosteriori,MAP)、期望后驗(yàn)估計(jì)算法(Expected APosteriori,EAP)EM算法(ExpectationMaximization)馬爾科夫蒙特卡洛算法(MarkovChainMonteCarlo,MCMC)等完成參數(shù)估計(jì),需要依托校級(jí)以上大樣本才能達(dá)到可靠的估計(jì)結(jié)果[3]。
認(rèn)知診斷和教學(xué)補(bǔ)救不能通過一次教學(xué)就達(dá)到教學(xué)目標(biāo),通常需要多次教學(xué)訓(xùn)練才能取得理想的教學(xué)效果。因而,靜態(tài)的橫向認(rèn)知診斷模型的應(yīng)用局限性逐漸顯現(xiàn)。為此,學(xué)者們提出了縱向認(rèn)知診斷(Longitudinal CognitiveDiagnostic)方法。該方法通過收集被試的跨時(shí)間段的測(cè)評(píng)數(shù)據(jù),即利用面板數(shù)據(jù)(PanelData)充分考慮時(shí)間因素,動(dòng)態(tài)評(píng)估學(xué)生的認(rèn)知屬性掌握程度和潛在能力的變化情況,并展現(xiàn)個(gè)體間差異??v向認(rèn)知診斷方法包括基于認(rèn)知屬性的潛在轉(zhuǎn)換分析(Latent Transition Analysis)模型、基于認(rèn)知掌握模式(認(rèn)知屬性的組合)的潛在轉(zhuǎn)換分析模型、基于高階潛在結(jié)構(gòu)(抽象認(rèn)知屬性)的認(rèn)知診斷模型等4。這些模型不僅深化了認(rèn)知診斷研究的理論厚度,還拓寬了認(rèn)知診斷的實(shí)踐范圍,但同樣需要大樣本的參數(shù)估計(jì)模型。
在實(shí)際教學(xué)中,許多教改執(zhí)行者的研究對(duì)象僅為一至兩個(gè)班級(jí),利用大樣本進(jìn)行參數(shù)估計(jì)和復(fù)雜計(jì)算模型反而限制了認(rèn)知診斷模型的應(yīng)用。值得慶幸的是,近來學(xué)者對(duì)小樣本的縱向非參數(shù)估計(jì)也有研究。如 LHDD(Longitudinal Hamming DistanceDiscrimination)[5]、LWGNPC(Longitudinal WeightedGeneralizedNon-ParametricClassification)等方法。然而,這些模式仍存在著應(yīng)用不便。實(shí)踐中,不同教學(xué)單元的認(rèn)知屬性和知識(shí)結(jié)構(gòu)是變化的,還不能通過屬性粒度(Fine-grained)的調(diào)整融入相同的模型中。理論上,該類研究采用正則化(Regularization)統(tǒng)計(jì)方法,將前期分類結(jié)果作為當(dāng)前分類約束條件(RestraintCondition),其方法的自洽性有待商權(quán)。更重要的是,該類的分類計(jì)算采用漢明距離及其變型,通過相同位置上不同對(duì)象的數(shù)量來計(jì)算認(rèn)知掌握模式的差異,其不如采用交叉熵(CrossEntropy)作為差異的計(jì)算方法。此外,這些方法忽視了認(rèn)知屬性之間的層級(jí)關(guān)系,忽視了處于底層的認(rèn)知屬性的權(quán)重遠(yuǎn)大于頂層認(rèn)知屬性這一重要理論假定。
鑒于減少參數(shù)估計(jì)量和滿足縱向教改實(shí)際的需求,本次研究在具體的顯性認(rèn)知屬性上抽象出高級(jí)能力,再利用高級(jí)能力完成多次認(rèn)知診斷。吸取前期研究成果,探索非參數(shù)估計(jì)的神經(jīng)網(wǎng)絡(luò)分類方法在小樣本容量下的認(rèn)知診斷教學(xué)實(shí)施途徑,為解決縱向認(rèn)知診斷問題提供有益嘗試。
二、認(rèn)知診斷評(píng)價(jià)基本概念
在認(rèn)知診斷模型中,認(rèn)知屬性(Attributes)是指完成測(cè)驗(yàn)所需的知識(shí)結(jié)構(gòu)或認(rèn)知加工技能。認(rèn)知屬性掌握模式是認(rèn)知屬性 的邏輯組合,其中k為屬性個(gè)數(shù)。認(rèn)知屬性不能任意組合,受屬性之間關(guān)系約束,形成理想掌握模式(IdealMasterPattern,IMP),即
,其中組合數(shù)
。試題
矩陣是所有試題
包括認(rèn)知屬性的列表。理想反應(yīng)模式(IdealResponsePattern,IRP)是各種認(rèn)知屬性掌握模式在不猜測(cè)也不失誤情況下對(duì)試題Q矩陣的正確反應(yīng)。其計(jì)算過程如下:
觀察反應(yīng)模式(ObservedResponsePattern,ORP)是所有測(cè)試(N)作答情況,即 。認(rèn)知診斷評(píng)價(jià)(CognitiveDiagnosticAssess)就是根據(jù)測(cè)試作答情況,將被試劃分到相應(yīng)認(rèn)知屬性掌握模式中,即對(duì)ORP與IRP進(jìn)行比較,最終將與ORP最相似的IRP判別給該被試,完成屬性掌握模式分類。IRP與IMP對(duì)應(yīng)機(jī)器學(xué)習(xí)數(shù)據(jù)訓(xùn)練集的特征值(X)與目標(biāo)值(Y),并以此完成規(guī)則學(xué)習(xí)。
三、研究過程
(一)研究對(duì)象
在遼寧省沈陽市選取一所教育質(zhì)量處于中等水平的高中作為測(cè)試學(xué)校。利用高考復(fù)習(xí)階段,每周進(jìn)行兩次英語完形填空認(rèn)知診斷教學(xué)。每次教學(xué)后,師生根據(jù)認(rèn)知診斷結(jié)果實(shí)施教學(xué)補(bǔ)救,共執(zhí)行了10個(gè)教學(xué)周期,收集了完全參與教學(xué)過程的48人測(cè)試成績(jī)。
(二)研究目標(biāo)的認(rèn)知屬性
英語知識(shí)可分為語音、詞匯、語法、語篇和語用五個(gè)方面知識(shí)。其中,語音、詞匯和語法屬于語言結(jié)構(gòu)性知識(shí),語篇和語用屬于語言運(yùn)用性知識(shí)。近年來,高考英語考試大綱相對(duì)穩(wěn)定,閱讀部分有6個(gè)方面要求:(1)理解主旨要義;(2)理解文中具體信息;(3)根據(jù)上下文推斷單詞和短語的含義;(4)做出判斷和推理;(5)理解文章基本結(jié)構(gòu);(6)理解作者的意圖、觀點(diǎn)和態(tài)度。完形填空作為閱讀要求的一部分,主要在詞匯、語法、語篇層次上進(jìn)行。它要求學(xué)生在正確理解語篇主旨大意的基礎(chǔ)上,重點(diǎn)關(guān)注具體語境中不同詞語、句子與整個(gè)篇章結(jié)構(gòu)之間的聯(lián)系,尤其強(qiáng)調(diào)對(duì)文章整體結(jié)構(gòu)和關(guān)鍵信息的理解[8]。概括來說,完形填空要求被試通過已知信息推斷未知信息,這與格式塔(Gestalt)心理學(xué)要求考慮事物的結(jié)構(gòu)化和整體性相一致。由于完形填空失分率較高,一直是教學(xué)難點(diǎn),因而提升完形填空題型的正確率是本次教學(xué)改革的重點(diǎn)研究目標(biāo)。根據(jù)高考大綱要求,一線學(xué)科教師利用自己多年的解題經(jīng)驗(yàn),先擬定了針對(duì)完形填空的認(rèn)知屬性;再邀請(qǐng)學(xué)科專家審核,并結(jié)合學(xué)生有聲思維實(shí)證,最終確定英語完形填空認(rèn)知屬性(表1)。
(三)探究涉及數(shù)據(jù)
認(rèn)知診斷所需的數(shù)據(jù)共有4種,包括理想掌握模式(IMP)、試題Q矩陣、理想反應(yīng)模式(IRP)、觀察反應(yīng)模式(ORP,即實(shí)際作答數(shù)據(jù))??紤]到高考的權(quán)威性,其試題有較好的難度、區(qū)分度和信效度。本次認(rèn)知診斷教學(xué)的完形填空試題選自近5年高考英語全國(guó)試卷甲、乙的第三部分第一節(jié)20題(41-60),共計(jì)10個(gè)教學(xué)單元。
首先,由學(xué)科專家對(duì)試題涉及的認(rèn)知屬性進(jìn)行分析,確定了三個(gè)屬性 及其形成的層級(jí)結(jié)構(gòu),如圖1(a)所示。根據(jù)其中指向關(guān)系拓?fù)涑?種理想掌握模式或知識(shí)狀態(tài)(KnowledgeState,KS)見表2(IMP)列。其次,學(xué)科教師對(duì)10套試題涉及的屬性逐個(gè)甄別,并確定試題Q矩陣,以2023年甲卷試題Q矩陣為例,見圖1(b)(深色塊表示試題包含對(duì)應(yīng)屬性)。然后,根據(jù)式(1)利用理想掌握模式(IMP)和Q矩陣,計(jì)算出理想反應(yīng)模式見表2(IRP)列。最后,由學(xué)生實(shí)際的作答形成觀察反應(yīng)模式(ORP)。觀察反應(yīng)模式是學(xué)生實(shí)際答題情況的直接反映,與理想反應(yīng)模式相對(duì)比,可以揭示學(xué)生在認(rèn)知屬性掌握上的差異和問題。由于數(shù)據(jù)量較大,具體觀察反應(yīng)模式的數(shù)據(jù)在此略去。
在數(shù)學(xué)或物理學(xué)科中,知識(shí)點(diǎn)一般有基本原理和計(jì)算公式,認(rèn)知屬性可相對(duì)精準(zhǔn)界定,但英語完形填空認(rèn)知屬性抽象程度較高,且受研究者主觀選擇的影響較大,這會(huì)造成試題關(guān)聯(lián)屬性的適配不一致。這也預(yù)示著:要確定學(xué)生的屬性掌握程度或模式,需要進(jìn)行反復(fù)多次的教學(xué)診斷過程,以提高其科學(xué)性和有效性。
(四)認(rèn)知診斷分類方法的選擇
機(jī)器學(xué)習(xí)方法是不受樣本特征限制的非參數(shù)方法。目前,學(xué)者們驗(yàn)證了八種機(jī)器學(xué)習(xí)的認(rèn)知診斷分類和聚類方法: k- means聚類、KNN(k-NearestNeighbors)、決策樹(DecisionTree,DT)、隨機(jī)森林(RandomForest,RF)、支持向量機(jī)(SupportVectorMachine,SVM)、樸素貝葉斯分類(NaiveBayesianClassification,NBC)、自組織映射(Self-OrganizingMap,SOM)聚類、人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)。
利用機(jī)器學(xué)習(xí)方法進(jìn)行的小樣本認(rèn)知診斷只能將個(gè)體劃分到屬性組合的理想掌握模式中,簡(jiǎn)單判斷掌握與否,不如大樣本認(rèn)知評(píng)價(jià)還可以判斷出個(gè)體各屬性掌握程度的概率。盡管機(jī)器學(xué)習(xí)的確診率會(huì)有所下降,但相關(guān)研究已經(jīng)實(shí)證了機(jī)器學(xué)習(xí)算法有利于屬性層級(jí)表征方面的優(yōu)勢(shì),且屬性層級(jí)、屬性個(gè)數(shù)和樣本容量對(duì)于診斷結(jié)果的影響不大,應(yīng)用結(jié)果基本一致,差別不明顯。然而,這些方法的理論內(nèi)涵上仍存在差別,需要實(shí)踐再檢驗(yàn)。
通過計(jì)算IRP和ORP的距離(歐式或漢明)實(shí)現(xiàn)分類,理論上都會(huì)存在將一個(gè)ORP歸屬多個(gè)IMP的問題。即除了決策樹、隨機(jī)森林與樸素貝葉斯分類,其余5類算法利用距離或相似進(jìn)行判別都會(huì)面對(duì)這一問題。
無監(jiān)督學(xué)習(xí)SOM和K-means聚類算法檢驗(yàn)力通常小于有監(jiān)督的分類。理論上,這兩個(gè)方法都有概率分布和統(tǒng)計(jì)數(shù)量的要求。SOM盡管可以利用minisom包實(shí)現(xiàn),但需要自定義目標(biāo)函數(shù)和空間結(jié)構(gòu),實(shí)踐中有時(shí)不一定會(huì)收斂。K-means聚類使用最簡(jiǎn)單,但有概率分布和統(tǒng)計(jì)數(shù)量的要求,需要自編函數(shù)實(shí)現(xiàn),且不能進(jìn)行參數(shù)調(diào)節(jié)。因此,這兩種方法應(yīng)用上存在不便,不建議使用。
KNN分類添加了使用靈活性,需要自編函數(shù)實(shí)現(xiàn),主要利用擴(kuò)充K倍數(shù)據(jù)與誤差的調(diào)節(jié)實(shí)現(xiàn),但K值的人為設(shè)定會(huì)造成過擬合或欠擬合。余下5種監(jiān)督學(xué)習(xí)算法對(duì)已有信息的利用更充分,都可直接調(diào)用已有庫(kù)包實(shí)現(xiàn)。決策樹在樣本量小、特征維度高時(shí)更具優(yōu)勢(shì)。隨機(jī)森林算法作為決策樹的改進(jìn)算法,對(duì)噪聲具有很好的抵抗能力。兩種方法利用信息熵代替K-means和KNN使用距離作為分類判斷,算法上有很大進(jìn)步,且不需要滿足數(shù)據(jù)的概率分布要求。但是,二者都是以試題作為節(jié)點(diǎn)的樹型分類,對(duì)試題樣本敏感,很容易過擬合,即使剪枝也無法避免。兩種方法應(yīng)用不便,因而不建議使用。
SVM基于統(tǒng)計(jì)學(xué)習(xí)理論和最優(yōu)化方法,能夠在小樣本獲得全局最優(yōu)解,但需經(jīng)過實(shí)驗(yàn)選擇合適的參數(shù)以及核函數(shù),才能獲得較好的試驗(yàn)效果,且容易欠擬合。這不利于一線教學(xué)人員實(shí)踐運(yùn)用。
NBC能對(duì)小樣本實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè),但理論上要求特征(測(cè)試題)之間是獨(dú)立的樸素(簡(jiǎn)單)假設(shè)。這在多數(shù)認(rèn)知診斷實(shí)踐中并不滿足。
ANN既可實(shí)現(xiàn)有監(jiān)督學(xué)習(xí)的分類和回歸,也可實(shí)現(xiàn)無監(jiān)督學(xué)習(xí)的分類等。雖然其采用貪心學(xué)習(xí)的策略來搜索假設(shè)空間,容易過擬合,一般僅能實(shí)現(xiàn)局部最優(yōu)解。但其理論約束少,使用最為方便,相關(guān)研究成果最多,因而本次研究?jī)?yōu)先采用ANN。
綜上所述,在8種機(jī)器學(xué)習(xí)方法的認(rèn)知診斷評(píng)價(jià)應(yīng)用中,SOM、K-means與KNN有數(shù)據(jù)概率分布要求,SOM聚類存在解釋力隨機(jī)問題。樸素貝葉斯分類有數(shù)據(jù)獨(dú)立要求,決策樹、隨機(jī)森林和支持向量機(jī)在應(yīng)用上會(huì)有過擬合和欠擬合問題。相比之下,神經(jīng)網(wǎng)絡(luò)能夠盡可能減少樣本特征要求,是小樣本情況下認(rèn)知診斷評(píng)價(jià)最佳的應(yīng)用方法[0]。
盡管神經(jīng)網(wǎng)絡(luò)模型發(fā)展快、類型眾多,但本次研究沒有選擇深度學(xué)習(xí),只用最簡(jiǎn)單的多層感知機(jī)(Multi-LayerPerceptron,MLP,Hinton,1986)就可完成相應(yīng)功能。其核心思想是通過反復(fù)迭代“前向傳播、計(jì)算損失、反向傳播”,完成參數(shù)更新,直到網(wǎng)絡(luò)輸出達(dá)到預(yù)定目標(biāo)范圍。利用PyTorch定義和訓(xùn)練神經(jīng)網(wǎng)絡(luò),其算法的步驟為:
1.模型訓(xùn)練時(shí),IRP作為輸人,IMP作為輸出。
2.設(shè)置網(wǎng)絡(luò)參數(shù):隱藏層個(gè)數(shù),參考Kolmogorov定理設(shè)置隱層結(jié)點(diǎn)數(shù) ( 2 m+ 1 ) , m 為輸入層結(jié)點(diǎn)數(shù),即IRP的個(gè)數(shù)。由于實(shí)驗(yàn)數(shù)據(jù)都為0或1,所以神經(jīng)元傳遞函數(shù)選擇ReLU、tanh或sigmoid函數(shù)。考慮本次研究實(shí)質(zhì)是多類別劃分,故采用了交叉熵作為損失函數(shù),選用Adam(AdaptiveMomentEstimationOptimizer)優(yōu)化器。
3.模型預(yù)測(cè)時(shí),ORP作為輸入,通過訓(xùn)練好的模型進(jìn)行預(yù)測(cè)。
四、教學(xué)診斷過程
(一)認(rèn)知診斷結(jié)果
共進(jìn)行了10次認(rèn)知診斷教學(xué),以第一次(2019年甲卷)的學(xué)生測(cè)試認(rèn)知診斷結(jié)果為例,見圖2。模式“111”(即三個(gè)屬性全掌握)分類人數(shù)最多,說明學(xué)生對(duì)該試卷知識(shí)掌握較好。模式\"110\"分類人數(shù)為15,說明仍有部分學(xué)生未能完全掌握第三個(gè)屬性 ,加強(qiáng)
屬性講解與練習(xí)是課堂補(bǔ)救教學(xué)重點(diǎn)。此外,模式\"010\"的3人僅掌握“
”基礎(chǔ)語法,屬于異常分類結(jié)果,是重點(diǎn)關(guān)注對(duì)象,需要在課外加強(qiáng)英語基礎(chǔ)知識(shí)學(xué)習(xí)。另外,有10名得12分的學(xué)生在三個(gè)模式中均有分布。
診斷結(jié)果體現(xiàn)了認(rèn)知診斷的意義,即分?jǐn)?shù)相同的學(xué)生認(rèn)知屬性結(jié)構(gòu)不一定相同,認(rèn)知屬性結(jié)構(gòu)相同的學(xué)生分?jǐn)?shù)也有差別。傳統(tǒng)/經(jīng)典測(cè)量理論(ClassicalTestTheory)僅利用分?jǐn)?shù)劃分學(xué)生類型存在明顯的局限性。相比之下,認(rèn)知診斷模型對(duì)學(xué)生知識(shí)結(jié)構(gòu)缺陷的判斷更科學(xué),有利于開展因材施教的個(gè)性化教學(xué)。
然而,以上僅為一次認(rèn)知診斷的粗略判斷,更為精準(zhǔn)的屬性模式劃分需經(jīng)后續(xù)研究。如模式\"111”中分?jǐn)?shù)分散程度較大,這說明分類準(zhǔn)確度存疑。主要是抽象的認(rèn)知屬性及其組成的掌握模式產(chǎn)生了分類方法缺陷,為此,必須采用多次測(cè)量才能彌補(bǔ)實(shí)驗(yàn)設(shè)計(jì)層面的測(cè)量誤差。
(二)教學(xué)補(bǔ)救策略
判斷學(xué)生的認(rèn)知屬性掌握模式僅是教學(xué)的第一步,而通過反復(fù)教學(xué)補(bǔ)救實(shí)現(xiàn)成績(jī)提高才是教學(xué)的目標(biāo)。試題補(bǔ)救講解中,考試中需要的信息匹配、判斷和推理屬于應(yīng)用策略,這些能力通過教學(xué)訓(xùn)練可以較快達(dá)到掌握要求。但影響英語成績(jī)的主要因素依然是日積月累的基礎(chǔ)知識(shí),這就需要教師在聯(lián)系教材的基礎(chǔ)上,結(jié)合表1的考查內(nèi)涵和認(rèn)知診斷結(jié)果,時(shí)刻關(guān)注學(xué)生的認(rèn)知模式,紓困解難,精益求精,錘煉示范以下學(xué)習(xí)策略。
1.詞匯層次:屬于認(rèn)知知識(shí)范疇,需要時(shí)刻利用比較、匯總法豐富詞匯知識(shí)結(jié)構(gòu)。例如,通過對(duì)比近義詞、反義詞以及詞根詞綴的規(guī)律,幫助學(xué)生系統(tǒng)化地掌握詞匯。
2.語法層次:屬于知識(shí)技能范疇,包括主謂搭配、動(dòng)賓一致、定語從句、同位語從句、倒裝句、比較句與平行結(jié)構(gòu)。教師應(yīng)通過例句分析和語法規(guī)則歸納,幫助學(xué)生理解并掌握這些語法知識(shí)點(diǎn)。同時(shí),結(jié)合實(shí)際語境進(jìn)行練習(xí),強(qiáng)化學(xué)生的語法應(yīng)用能力。
3.語篇層次:屬于認(rèn)知策略范疇,要把握句不離段、段不離篇的文章結(jié)構(gòu),要理解漢語重意和,而英語重形和的差別。要掌握句子連接手段、謀篇的構(gòu)架方式與長(zhǎng)難句的解析。句子連接手段包括詞匯銜接、照應(yīng)、替代、省略、連接詞五種。語篇銜接包括詞匯的復(fù)現(xiàn)和對(duì)比。語法銜接包括照應(yīng)、替代。照應(yīng)包括人稱照應(yīng)、指示照應(yīng)、對(duì)比照應(yīng)。省略包括名詞性省略、動(dòng)詞性省略、分句性省略。連接詞有并列、遞進(jìn)、因果、轉(zhuǎn)折、讓步等。
在教學(xué)過程中,要求學(xué)生在每次測(cè)試后、教師講解前,自己參照試題Q矩陣和參考答案,逐題核實(shí)屬性掌握程度,排除猜測(cè)和失誤,研究推送學(xué)習(xí)策略,統(tǒng)計(jì)自己掌握的試題屬性,并作為教學(xué)反饋材料。例如,表3展示了10次測(cè)試中各屬性整體分配情況和學(xué)生個(gè)體(以18號(hào)為例)的屬性掌握情況。
五、教學(xué)效果分析
(一)認(rèn)知屬性掌握模式變化表征
10次成績(jī)(答題正確數(shù))分布及整體認(rèn)知屬性掌握模式(簡(jiǎn)稱認(rèn)知模式)見圖3。除去異常的21年甲(1)卷成績(jī),時(shí)間盒狀圖3(a)序列反映了成績(jī)平均分提高趨勢(shì)。圖3(b)?;鶊D中共6種認(rèn)知模式,下面的低階\"010\"和\"001”模式向上逐漸變換為“001”、“101\"和\"111\"高階模式。流量從分散逐漸到集中也表征了最終高階認(rèn)知模式的穩(wěn)定性。但也存在少量的模式逆流向。這說明:多數(shù)學(xué)生的屬性認(rèn)知掌握程度和成績(jī)都得到了提高,少數(shù)學(xué)生的屬性掌握程度有波動(dòng),即存在個(gè)別學(xué)生教學(xué)效果改善不明顯。此間,不能排除試卷難度變化和補(bǔ)救教學(xué)差異等因素產(chǎn)生的影響。
(二)認(rèn)知模式掌握概率分析
潛在轉(zhuǎn)換分析(Latent Transition Analysis,LTA),也稱隱馬爾可夫模型。其使用縱向數(shù)據(jù)估計(jì)潛在類之間的轉(zhuǎn)變,能計(jì)算出轉(zhuǎn)變概率(LatentTransitionProbabilities矩陣,從概率的角度描述不同類別子群體隨時(shí)間變化的情況。本次研究計(jì)算的是48人的6個(gè)認(rèn)知屬性模式10次隨時(shí)間轉(zhuǎn)換的過程,最終確定48個(gè)狀態(tài)(人)在6個(gè)出現(xiàn)目標(biāo)(認(rèn)知模式)的轉(zhuǎn)換概率。這一方法也是文獻(xiàn)[2]、[4]提及的縱向認(rèn)知診斷方法。本次研究利用圖3的數(shù)據(jù)實(shí)現(xiàn)認(rèn)知模式掌握概率的潛在轉(zhuǎn)換分析,并假定被試的能力不斷增長(zhǎng)、不會(huì)遺忘。利用python語言hmmlearn包實(shí)現(xiàn)相關(guān)計(jì)算。盡管10次轉(zhuǎn)換數(shù)據(jù)偏小,但仍可表征認(rèn)知模式概率化的意義。從圖4可知每個(gè)學(xué)生在不同認(rèn)知模式上的掌握概率,如35號(hào)學(xué)生的屬性認(rèn)知模式基本確定為“010”(縱向顏色最淺行,概率 ≈ 1.0);48號(hào)學(xué)生屬性認(rèn)知模式不確定(縱向各行概率lt; 0 . 6 ) 。潛在轉(zhuǎn)換分析補(bǔ)充了單獨(dú)進(jìn)行神經(jīng)網(wǎng)絡(luò)對(duì)認(rèn)知模式分類的不足。
(三)成績(jī)總體發(fā)展趨勢(shì)與個(gè)體間發(fā)展差異分析
利用增長(zhǎng)曲線模型(GrowthCurveModel)分析縱向數(shù)據(jù)的基本思想是:通過模型固定效應(yīng)(截距i和斜率s的均值)來描述平均成績(jī)?cè)鲩L(zhǎng)趨勢(shì);通過模型隨機(jī)效應(yīng)(截距i和斜率s的方差)描述成績(jī)?cè)鲩L(zhǎng)趨勢(shì)的差異。本次研究先對(duì)48名學(xué)生三個(gè)屬性掌握程度反饋數(shù)據(jù)(例如表3個(gè)體學(xué)生掌握情況)進(jìn)行匯總,然后利用潛類別分析(LatentClassAnalysis,LCA)對(duì)其分類。LCA是一種實(shí)現(xiàn)潛變量聚類分析的技術(shù),目的是用最少的潛類別數(shù)解釋顯變量之間的關(guān)聯(lián),并使各潛類別的外顯變量之間滿足局部獨(dú)立的要求。本次研究使用R語言poLCA包實(shí)現(xiàn)分析過程,當(dāng)劃分為三類時(shí),信息評(píng)價(jià)指標(biāo)(BIC)最小,表明分類結(jié)果最優(yōu),這與上文認(rèn)知屬性模式掌握變化結(jié)果吻合。最后將分類結(jié)果作為協(xié)變量納入增長(zhǎng)曲線分析。此外,還舍去了平均分異動(dòng)的初次(19年甲卷)和最高(21年甲卷)兩次測(cè)試成績(jī)(圖3所示),利用R語言lavaan包實(shí)現(xiàn)相關(guān)計(jì)算如表4。其模型卡方統(tǒng)計(jì)量(47.377, d f= 3 7 , P =0 . 1 1 8 )表明模型擬合較好。
從表4可知,在固定效應(yīng)中,截距與斜率的均值均統(tǒng)計(jì)意義顯著( ,說明成績(jī)的變化率和初始測(cè)量水平在測(cè)量個(gè)體間顯著不同。具體包括:平均截距的估計(jì)值是2.313;平均斜率的估計(jì)值是0.502,說明整體學(xué)生成績(jī)有微增長(zhǎng)趨勢(shì)。截距的方差統(tǒng)計(jì)不顯著(
),說明閱讀成績(jī)的個(gè)體間發(fā)展起始點(diǎn)沒有區(qū)別;斜率的方差統(tǒng)計(jì)顯著(
0.05),說明成績(jī)?cè)鲩L(zhǎng)趨勢(shì)的差異顯著。平均截距與平均斜率的協(xié)方差統(tǒng)計(jì)不顯著( pgt;0 . 0 5 ,說明成績(jī)初值與增長(zhǎng)速度沒有關(guān)系。教學(xué)反饋(fk)的認(rèn)可程度作為協(xié)變量,對(duì)截距和斜率的統(tǒng)計(jì)顯著(
0.05),說明教學(xué)補(bǔ)救反饋效果對(duì)成績(jī)發(fā)展的截距與斜率都有影響。
在許多教改實(shí)驗(yàn)中,很難區(qū)分是教師因素還是教學(xué)方法因素甚至是它們的交互因素對(duì)教學(xué)效果產(chǎn)生影響。本次研究通過固定教師因素,使用學(xué)生對(duì)教學(xué)補(bǔ)救反饋評(píng)價(jià)教學(xué)改革效果。相對(duì)常規(guī)教改采用的實(shí)驗(yàn)組與對(duì)照組進(jìn)行t檢驗(yàn)、F檢驗(yàn)和卡方檢驗(yàn),本研究方法更加準(zhǔn)確地反映教學(xué)干預(yù)的實(shí)際效果。
六、總結(jié)
前述分析表明,經(jīng)過連續(xù)的認(rèn)知診斷和教學(xué)補(bǔ)救,學(xué)生成績(jī)提高效果明顯,個(gè)體發(fā)展水平之間差異增加。教學(xué)補(bǔ)救反饋認(rèn)可程度對(duì)成績(jī)提高有正向影響,善于實(shí)踐補(bǔ)救方法的學(xué)生得到更大的進(jìn)步,而不關(guān)注學(xué)習(xí)過程的學(xué)生則未能從教學(xué)補(bǔ)救中獲益。
認(rèn)知診斷有三個(gè)操作環(huán)節(jié):首先是厘清認(rèn)知屬性內(nèi)涵與層級(jí)關(guān)系,需要的是學(xué)科專家的頂層智慧。然后是Q矩陣的建立、理想模式類別劃分和試題作答的整理,需要的是教學(xué)研究人員創(chuàng)新科技的賦能。最后是教學(xué)補(bǔ)救材料和方案的精準(zhǔn)推送,需要的是學(xué)科教師的匠心工程。在三個(gè)環(huán)節(jié)中,前兩個(gè)環(huán)節(jié)在應(yīng)用條件成熟時(shí)較易落實(shí),而最后一個(gè)環(huán)節(jié),涉及學(xué)生個(gè)體多且差別大,實(shí)踐效果往往不盡如人意。英語教學(xué)效果的提升困難重重,應(yīng)試技巧培訓(xùn)效果僅體現(xiàn)在最初接受階段。根本性提高英語應(yīng)用能力,需要教育者“馳而不息,久久為功\"的高效教學(xué)方法;更需要學(xué)習(xí)者“歷久彌新,念念不忘\"的刻苦學(xué)習(xí)。本次研究中,學(xué)生成績(jī)得到提高是研究者、任課教師和參與同學(xué)“同心協(xié)力,步步為實(shí)\"努力的結(jié)果。
參考文獻(xiàn):
[1]鐘志強(qiáng).基于縱向認(rèn)知診斷模型的形成性評(píng)價(jià)研究——以中學(xué)物理歐姆定律教學(xué)為例[J].鞍山師范學(xué)院學(xué)報(bào),2023,(6):26-31.
[2]詹沛達(dá),潘艷方,李菲茗.面向\"為學(xué)習(xí)而測(cè)評(píng)\"的縱向認(rèn)知診斷模型[J].心理科學(xué),2021,(1):214-222.
[3]涂冬波,蔡艷,戴海琦,等.HO-DINA模型的MCMC參數(shù)估計(jì)及模型性能研究[J].心理科學(xué),2011,(6):1476-1481.
[4]宋麗紅,袁思玉,汪文義.面向?qū)W習(xí)測(cè)評(píng)的縱向認(rèn)知診斷模型的泛化性能比較研究[J].江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,(4):384-392.
[5]劉耀輝,陳琦鵬,徐慧穎,等.縱向漢明距離判別法:對(duì)潛在屬性的發(fā)展追蹤[J].心理科學(xué),2023,(3):742-751.
[6]鄭天鵬,郭磊,邊玉芳.縱向非參數(shù)認(rèn)知診斷評(píng)估[J].應(yīng)用心理學(xué),2024,30(02):172-183.
[7]中國(guó)教育考試網(wǎng).普通高等學(xué)校招生全國(guó)統(tǒng)一考試大綱[EB/OL].[2022-4-26].http://gaokao.neea.edu.cn/html1/report/19012/5951-1.htm.
[8]教育部教育考試院.強(qiáng)化關(guān)鍵能力考查引導(dǎo)學(xué)生全面發(fā)展——2023年高考英語全國(guó)卷試題評(píng)析[J].中國(guó)考試,2023,(7):22-26.
[9]蔡艷,涂冬波,丁樹良.五大認(rèn)知診斷模型的診斷正確率比較及其影響因素:基于分布形態(tài)、屬性數(shù)及樣本容量的比較[J]心理學(xué)報(bào),2013,(11):1295-1304.
[10]趙秀宏,鐘志強(qiáng).小樣本認(rèn)知診斷中的機(jī)器學(xué)習(xí)方法[J].福建電腦,2025,41(02):67-71.
Exploration of Longitudinal Cognitive Diagnosis Teaching in English Cloze Test for College Entrance Examination
Zhong Zhiqiang Gao Hong School of Physical,Anshan Normal University,Anshan,Liaoning,114007
Abstract: A small sample teaching exploration was conducted by using longitudinal cognitive diagnostic methods.The research object is the scores of ten College Entrance Examination English cloze tests taken by a class.The research results show that the cognitive atribute mastery mode and grades of most students have been improved,while thecognitive atribute mastery mode and grades of a few students have fluctuated.The average scoreof studentshasincreasedand isnotrelated to their initial grades,with significant differences inindividual development levels.Students who actively practice remedial methods show significant improvement in their grades.The conclusion of the study is that there are measurement errors in theabstractcognitive atribute mastery mode,whichrequires multiple diagnostic teaching.Cognitive diagnosis isa teaching reform method worth exploring continuously.
KeyWords: Cloze Test,Small Sample,Longitudinal Cognitive Diagnosis,Neural Network,Latent Transition Analysis,GrowthCurve Model
(責(zé)任編輯:吳茫)