張雪松
(郴州廣播電視大學 湖南省郴州市 423000)
我國互聯(lián)網(wǎng)+發(fā)展愈發(fā)迅速,在大數(shù)據(jù)時代,網(wǎng)絡(luò)技術(shù)在方方面面的應用也逐漸增加。對于教育考試來說,不僅有計算機考試形式,還有通過網(wǎng)站進行報名的網(wǎng)絡(luò)系統(tǒng),突破了傳統(tǒng)直至考試的時間和空間界限。大數(shù)據(jù)時代的考試豐富了選拔人才的標準,拓寬了選拔人才的手段,增加了考試答題形式,也同樣帶了考試過程當中不可控的因素,不可知的事項增加,給考試帶來了更大風險。因此應當適應互聯(lián)網(wǎng)時代的發(fā)展模式,采取積極的手段推進考試數(shù)字化、現(xiàn)代化,同時分析高校考試過程當中可能出現(xiàn)的風險問題,建立健全考試風險的監(jiān)督與預警機制。
通過協(xié)同過濾的手段,可以通過聚類分析方法來有效分析網(wǎng)絡(luò)學習平臺上不同學習者的興趣偏好和學習特征,從而評估和預測在考試過程中可能出現(xiàn)的風險問題。Pytorch 聚類分析方法的主要策略是相同或相似學習行為、學習偏好和興趣特征的學習者在復習的情況、考試的選擇、考試的過程有著一致性,因此通過協(xié)同過濾的范式來體現(xiàn)網(wǎng)絡(luò)學習平臺學習用戶的潛在考試心理,并且將考試當中客觀存在的風險問題加以分析。通過Pytorch 聚類分析方法,我們可以得到協(xié)同過濾的考試風險評估系統(tǒng)框架:通過網(wǎng)絡(luò)學習平臺當中目標用戶的學習,來收集學習用戶的行為數(shù)據(jù)資源,然后進行相同特征的行為提取及特征轉(zhuǎn)換,最終得出一個特征向量,通過向量夾角、向量余弦等相關(guān)的系數(shù)來進行相似度計算,并最終將相思用戶集合起來,分析相思用戶的心理特征,并依據(jù)考試風險加以集合分析。Pytorch 聚類分析方法的有效應用可以通過比較綜合性的數(shù)據(jù)和計算來分析網(wǎng)絡(luò)平臺學習用戶的學習興趣,將不同用戶的學習風格、潛在問題等進行特征概括形成標簽,這種標簽一方面描述了網(wǎng)絡(luò)平臺學習者的學習興趣,另一方面也表達了風險的語義,對于考試風險的評估有著重要的意義,充分滿足短時間內(nèi)復雜的計算,適配網(wǎng)絡(luò)平臺上用戶的龐大數(shù)量,并且通過相似度計算來有效地分析和挖掘不同學習者的行為數(shù)據(jù),分析數(shù)據(jù)之后的學習者隱形學習心理和潛在學習問題,并且在考試風險評估系統(tǒng)的建立當中有效應對這些問題。
半監(jiān)督聚類主要是為了挖掘和分析網(wǎng)絡(luò)學習平臺上的用戶數(shù)據(jù)結(jié)構(gòu),然后使用監(jiān)督或者是約束信息的方法來促使得到的聚類結(jié)構(gòu)能夠更加貼合實際情況。一般而言,半監(jiān)督的聚類方法可以利用監(jiān)督的信息來初始化參數(shù),并且在聚類算法的目標韓束當中增加監(jiān)督的因子,使其滿足約束的條件。通過Pytorch 聚類,使用特定的度量學習來定義網(wǎng)絡(luò)學習平臺上學習者之間的相似性,并更加準確地在度量空間中予以聚類,將被約束的實例聚為一類,利用監(jiān)督信息實現(xiàn)半監(jiān)督聚類的考試風險預測算法,在分析過程中構(gòu)建權(quán)重矩陣,并將這個結(jié)果加入模型與函數(shù)當中,且實現(xiàn)最優(yōu)求解。
SPSS22.0 算法主要分為三個步驟,首先利用預測估計模型和有標簽的網(wǎng)絡(luò)平臺用戶數(shù)據(jù)來進行置信度計算,利用平臺數(shù)據(jù)來選擇SPSS22.0 算法篩選置信度分析出來分數(shù)比較高,并且具有分布特點的無標簽數(shù)據(jù),接著運用分類算法來作為基礎(chǔ)分類器進行計算,并針對于新型的有標簽的用戶數(shù)據(jù)來構(gòu)建一個合理的分類器模型。通過SPSS22.0 算法,我們可以看出風險估計模型和用戶標簽特征數(shù)據(jù)的選擇算法使整個考試風險分析預測機制的關(guān)鍵所在。通過置信度所估計的考試風險預測模型主要根據(jù)一些無標簽數(shù)據(jù)進行置信度的計算,然后通過計算來篩選出具有相同特征的預測標簽,為了訓練出更好的模型,通過可靠性計算選擇更接近正確樣本的類別預測標簽。數(shù)據(jù)選擇算法是為了消除與實際分布不同的高置信度數(shù)據(jù),并盡量消除所選擇的未標記數(shù)據(jù)對模型性能的負面影響。SPSS22.0算法的數(shù)據(jù)選擇是關(guān)鍵步驟,也是本文的一個重要創(chuàng)新點。選擇具有高置信度和高斯對稱分布的未標記數(shù)據(jù)構(gòu)建新的訓練模型,采用SPSS22.0算法對高置信度數(shù)據(jù)進行濾波,從而得出有效的數(shù)據(jù)分析。
針對傳統(tǒng)推薦方法在挖掘內(nèi)容信息和用戶標簽信息方面的不足,提出了一種半監(jiān)督學習方法來實現(xiàn)考試風險研究軟件研究。在傳統(tǒng)的過濾算法中,主要是將協(xié)同用戶進行過濾,然后依據(jù)不同用戶特征的學習興趣和學習愛好來實現(xiàn)考試風險的評估,但是這種方法構(gòu)成的模型比較單一,計算出來的數(shù)據(jù)也不夠準確,無法在算法當中體現(xiàn)多個因素。本研究通過聚類分析的方法來代替?zhèn)鹘y(tǒng)的計算方法,綜合分析和預測網(wǎng)絡(luò)學習平臺用戶的不同行為喜好和相應的考試風險事項,然后利用數(shù)據(jù)的幾何特征來進行數(shù)據(jù)的正態(tài)分布。傳統(tǒng)的基于用戶的協(xié)同過濾算法利用用戶興趣和偏好的相似性來生成推薦。常用的相似度計算方法有:向量角法、皮爾遜相關(guān)系數(shù)法等。這些方法都使用單一的方法來計算用戶興趣的相似度。常用的方法是將少量的預測因素組合成一個單一的模型,以便在模型預測中考慮多個因素。因此,本文提出用聚類分析方法代替用戶興趣相似度計算,綜合考慮用戶行為偏好和項目內(nèi)容信息。具體來說,在聚類分析中,該算法不僅考慮了數(shù)據(jù)的幾何特征,而且考慮了數(shù)據(jù)的正態(tài)分布信息。[1]
考試風險點主要指的是在高??荚囘^程當中可能會影響考試過程的潛在危險,在互聯(lián)網(wǎng)信息時代,考試風險可能出現(xiàn)的地方大大增加,考試形式也發(fā)生了變革,因此應當注重考試風險的方方面面。首先,是高??荚囘^程當中的責任風險,考務(wù)人員是責任風險的主體,主要的造成原因是考務(wù)人員業(yè)務(wù)掌握不熟練,從而可能在準備考生信息資料,安排考試的過程當中出現(xiàn)考生信息錯誤的現(xiàn)象,或者出現(xiàn)不同考生的考場安排沖突。在試卷安排方面,可能會出現(xiàn)試卷印刷錯誤、試卷發(fā)放錯誤、試卷裝訂錯誤等情況。在考試監(jiān)控方面,可能會出現(xiàn)保密室盜竊問題、監(jiān)控設(shè)備陳舊問題、安保人員工作疏漏問題還有考場巡查人員脫崗離崗情況。在考試過程中,還有可能出現(xiàn)考試鈴聲不準確的情況、監(jiān)考人員拆封試卷不符合標準的情況、試卷處無人監(jiān)控的情況、考生信息核對錯誤情況、考試試卷丟失情況、涉及英語聽力播放錯誤情況、考生到場情況上報錯誤情況、備用試卷和草稿紙缺失情況等。其次,在事故風險方面,主要包括試卷印刷錯誤情況、試卷印刷泄密情況,在考試的過程當中,還有可能出現(xiàn)突然停電停水的情況,考生生病情況,還有無關(guān)人員或者動物誤闖考場情況、考場外喧嘩吵鬧情況等。由于當前的考試形式比較多樣,除了傳統(tǒng)的考試形式,還有計算機網(wǎng)絡(luò)考試形式,這就有可能出現(xiàn)考試題庫入侵泄漏情況、網(wǎng)絡(luò)系統(tǒng)故障情況、計算機卡頓黑屏情況,由于網(wǎng)絡(luò)監(jiān)考仍然處于傳統(tǒng)的人工監(jiān)考方式,因此當出現(xiàn)考生作弊的問題時,監(jiān)考人員可能無法做到及時地跟蹤和監(jiān)管。最后,在違紀舞弊風險方面,試卷涉及到了多個環(huán)節(jié)和多處工作人員經(jīng)手的地方都有可能出現(xiàn)違紀舞弊的問題。例如,在試卷運輸過程當中可能出現(xiàn)無關(guān)人員突然違規(guī)接觸試卷的情況,或者試卷命題人責任人自主泄密,命題的過程中出現(xiàn)大量錯誤的情況,或者是試卷語言文字圖片不符合規(guī)范的情況。由于高校的考試大多重視通過率,所以可能會出現(xiàn)考前任課教師泄密串講、買賣答案的情況。除此之外,高校的考試試卷一般要求保密,但是相關(guān)的監(jiān)考人員和考生保密意識比較淡薄,可能會出現(xiàn)私自拍照并在網(wǎng)絡(luò)渠道傳播的情況。[2]
在信息化時代,傳統(tǒng)的考試模式、監(jiān)考模式已經(jīng)無法適應現(xiàn)代社會的發(fā)展,新型的考試模式也帶來了越來越多的考試風險問題,具有突發(fā)性、擴散性、難控性、危害性。考試的突發(fā)性風險主要是來自于考試的社會價值過高,考試成績涉及學生學習的關(guān)鍵評估,評估結(jié)果不僅影響著學生的獎助學金、保送、畢業(yè)、求職等方面,而且會對于學生心理存在重大的影響,利益方既包括學生本人,還包括學生家長、教師、校方等,都存在著或直接或間接的利益關(guān)系。因此,考試本身就具有一定的風險性,突發(fā)事故出現(xiàn)的可能性很大。由于考試突發(fā)事故常常處于不可控范圍內(nèi),因此上述考試風險都有可能隨時出現(xiàn),嚴重地影響考試的進行。在擴散性方面,主要是源于突發(fā)事件的傳播和擴大,具有可能在考試班級內(nèi)部擴散,也可能在整個院系整個學校當中擴散,甚至在社會范圍內(nèi)廣泛擴散,給社會帶來危害影響。范圍越大的擴散越有可能造成集體舞弊的現(xiàn)象,出現(xiàn)受眾廣泛的泄題時間,這不僅會給考試的舉辦單位帶來很大的壓力,而且還可能對社會造成負面影響。在難控性方面,一旦相關(guān)考試部門的考試風險評估不準確,考試風險應急預案準備不充分,就有可能造成當考試風險出現(xiàn)的時候無法有效地協(xié)調(diào)各個部門,無法快速采取預案,還無法第一時間對于風險出現(xiàn)的地方進行有效地監(jiān)測。例如考場停電、網(wǎng)絡(luò)服務(wù)器崩潰、考生生病等情況,如果考場沒有準備備用電源和備用網(wǎng)絡(luò)服務(wù)器,沒有聘請專業(yè)的醫(yī)務(wù)人員組成應急醫(yī)務(wù)小組,就無法在風險出現(xiàn)的時候第一之間內(nèi)控制風險,組織風險擴大,導致考試風險出現(xiàn)的點越擴越大,并最終釀成難以挽回的結(jié)果。在危害性方面,由于考試涉及學生的重大利益,因此考試風險就必然伴隨著巨大的危害性,例如上述的考試泄密問題、買賣交易答案問題、監(jiān)考印刷人員監(jiān)守自盜問題,都會由于利益的夾雜而有損考試的公平性和公正性,導致考試機構(gòu)直接面臨聲譽問題,甚至導致學生的權(quán)重排名,影響學生的新生招生,從而影響學校的生存和發(fā)展情況。[3]
本研究以當前國內(nèi)關(guān)于半監(jiān)督學習算法及風險評估模型的研究為參考依據(jù),分析了考試風險研究的可行性和必要性,并且通過調(diào)查分析了廣播電視大學學習者基本學情和網(wǎng)絡(luò)平臺學習行為,利用有效的數(shù)據(jù)進行聚類分析,并具體挖掘數(shù)據(jù)背后的風險因子,量化這些考試風險因素,然后按照不同的出現(xiàn)可能性和危害程度進行劃分,依據(jù)數(shù)據(jù)建立考試風險預警指標體系,并構(gòu)建考試風險評估模型。當前,移動電子設(shè)備的普及使得高??荚嚨娘L險增加,輿情傳播速度加快,一旦無法及時處理考試危機,就有可能釀成重大的公共危機。
依照半監(jiān)督學習算法和風險評估模型研究現(xiàn)狀作為借鑒,利用學習者基本情況和學習行為的數(shù)據(jù)進行聚類分析,從而分析考試風險因素,構(gòu)建考試風險預警指標體系,為考試管理工作提供現(xiàn)代化的技術(shù)支持,并且能夠規(guī)避考試的風險。通過深度挖掘?qū)W習者的情況,可以提高考試管理人員控制風險的管理水平,并通過系統(tǒng)的數(shù)據(jù)導入和分析預測來掌握考試的潛在心理,為國內(nèi)考試風險研究領(lǐng)域補充了新的研究資料,拓展了半監(jiān)督學習理論,對于半監(jiān)督學習算法分析考試風險性因素提供了風險預警指標體系參考,為當前具有社會風險的開放教育考試提供了指導依據(jù),提高考試安全管理水平。
隨著互聯(lián)網(wǎng)+的深入推進,我國的數(shù)字化、信息化程度不斷加深,當前的高??荚嚠斨胁豢煽匾蛩刂饾u增加,可能會出現(xiàn)各種各樣的風險問題。為了適應新形勢的發(fā)展態(tài)勢,提高高校考試在選拔優(yōu)質(zhì)人才方面的優(yōu)勢,相關(guān)高校及部門應當科學規(guī)范地運用考試風險研究軟件來有效應對高校考試風險,通過半監(jiān)督學習的理論關(guān)照考試檢測手段與考試預警方式,從而幫助高??荚囘M行有效地風險預警與管理。