摘要:結(jié)合高校學(xué)生管理以及大學(xué)生思政教育的實(shí)際情況,通過(guò)數(shù)據(jù)采集、清洗和規(guī)范化處理,構(gòu)建詳細(xì)可量化的學(xué)生信息模型,針對(duì)模型之間各階層信息的數(shù)據(jù)特點(diǎn),提出信息模型之間相似度比較的具體方法。以學(xué)生信息模型之間的相似度為目標(biāo)函數(shù),基于K-means算法進(jìn)行聚類(lèi)分析,得到不同的學(xué)生簇,對(duì)不同簇的質(zhì)心進(jìn)行分析,得到不同學(xué)生簇的特點(diǎn),有針對(duì)性地匹配不同的教學(xué)資源,實(shí)現(xiàn)精準(zhǔn)思政的教學(xué)目的。
關(guān)鍵詞:精準(zhǔn)思政;聚類(lèi)分析;大學(xué)生
中圖分類(lèi)號(hào):G641文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-6916(2025)08-0095-05
On Precise Ideological and Political Education Based on Student Information Model and Clustering Algorithm
Gao YawenLu Ting
(Jiangsu University of Science and Technology, Zhenjiang 212100)
Abstract: In light of the practical realities of management of college and university students and their ideological and political education, this paper constructs a detailed and quantifiable student information model through data collection, cleaning, and standardization. Based on the data characteristics of each level of information between the models, a specific method for comparing the similarity between information models is proposed. Using the similarity between student information models as the objective function, this paper conducts a clustering analysis based on the K-means algorithm to obtain different student clusters. By analyzing the centroids of different clusters, this paper obtains the characteristics of different student clusters and matches different teaching resources in a targeted manner to achieve the teaching goal of precise ideological and political education.
Keywords: precise ideological and political education; clustering analysis; college and university student
思政教育是高校育人的核心和根本。在新時(shí)代,如何做好思政教育,如何提升思政教育質(zhì)量和時(shí)效,成為高等教育的一個(gè)重大時(shí)代課題。黨的十八大以來(lái),習(xí)近平總書(shū)記多次強(qiáng)調(diào)樹(shù)立精準(zhǔn)思維的重要意義,特別是要從細(xì)節(jié)處著手,精準(zhǔn)施策,解決突出矛盾和緊迫問(wèn)題,這為高校思政教育指明了方向[1]。在《教育部2019年工作要點(diǎn)》中提到,“著力推進(jìn)精準(zhǔn)思政,創(chuàng)新思想政治工作方式方法”[2],使精準(zhǔn)思想政治教育正式成為一種重要的制度倡導(dǎo)。在新時(shí)代的背景下,傳統(tǒng)思政教育工作的方式方法,越來(lái)越難以企及精準(zhǔn)思政的新要求。
近年來(lái),在學(xué)術(shù)領(lǐng)域,諸多學(xué)者運(yùn)用新技術(shù)、新理念在精準(zhǔn)思政乃至學(xué)生管理方面做出了很多的研究和探索。中國(guó)人民大學(xué)的黃文林[3]依托教育大數(shù)據(jù)構(gòu)建服務(wù)于高校精準(zhǔn)思政教育工作的學(xué)生畫(huà)像方法,提出基于學(xué)生畫(huà)像的精準(zhǔn)思政工作路徑;山東師范大學(xué)的焦立濤[4],以人工智能技術(shù)為抓手,論證了人工智能賦能大學(xué)生思想政治教育的可能性、必要性、邏輯結(jié)果和價(jià)值目標(biāo),以及理論創(chuàng)新、方法優(yōu)化和路徑選擇;華東師范大學(xué)的李子輝[5]運(yùn)用文獻(xiàn)研究法、案例研究法和交叉學(xué)科研究法,分析了虛擬現(xiàn)實(shí)技術(shù)在高校思想政治教育中運(yùn)用的價(jià)值、挑戰(zhàn)和優(yōu)化路徑;江西財(cái)經(jīng)大學(xué)的熊琴[6]在高校思想政治教育中引入?yún)^(qū)塊鏈技術(shù),研究探討其融合的路徑,以此滿(mǎn)足學(xué)生個(gè)性化和多樣性學(xué)習(xí)需求;鄧晗[7]基于Spark大數(shù)據(jù)處理平臺(tái)搭建了學(xué)生行為分析系統(tǒng),使用機(jī)器學(xué)習(xí)K-means算法和NMF算法對(duì)高校學(xué)生群體的行為模式進(jìn)行分類(lèi),對(duì)學(xué)生異常行為進(jìn)行判定和引導(dǎo);湖北師范大學(xué)的王世純[8]等人利用K-means聚類(lèi)算法進(jìn)行深層次數(shù)據(jù)挖掘,幫助教師采取分層教學(xué)、個(gè)性化指導(dǎo)策略,實(shí)現(xiàn)精準(zhǔn)教學(xué)。
本文依據(jù)教育實(shí)踐,篩選一些學(xué)生思政教育方面的關(guān)鍵信息,通過(guò)數(shù)據(jù)收集、清洗和規(guī)范化處理,梳理得到真實(shí)準(zhǔn)確的學(xué)生信息。依據(jù)相應(yīng)規(guī)則,將學(xué)生思政信息數(shù)據(jù)化,構(gòu)建結(jié)構(gòu)化的學(xué)生信息模型,并圍繞該模型,從模型中各類(lèi)數(shù)據(jù)的特點(diǎn)出發(fā),構(gòu)建一套可操作的數(shù)據(jù)比較方法,實(shí)現(xiàn)學(xué)生信息在思政方面的量化和比較,為后續(xù)學(xué)生信息的聚類(lèi)分析以及教師資源的匹配提供基礎(chǔ)。
本文基于一定優(yōu)化的K-means算法,對(duì)量化的學(xué)生信息模型進(jìn)行聚類(lèi)分析,通過(guò)迭代得到一定數(shù)量的學(xué)生簇。重點(diǎn)分析簇質(zhì)心的信息特點(diǎn),結(jié)合實(shí)際情況,給出評(píng)價(jià)。根據(jù)評(píng)價(jià)結(jié)果,匹配相應(yīng)的教育資源,實(shí)現(xiàn)思政教育的精準(zhǔn)化。對(duì)于一些明顯的離群點(diǎn),重點(diǎn)分析,給予特別關(guān)注,如果出現(xiàn)學(xué)業(yè)預(yù)警,及時(shí)糾偏,補(bǔ)齊木桶效應(yīng)的關(guān)鍵短板,提升思政教育的整體質(zhì)量。詳細(xì)過(guò)程如圖1所示:
一、信息模型的建立
(一)數(shù)據(jù)的收集和清洗
在實(shí)際的運(yùn)用場(chǎng)景中,學(xué)生的信息數(shù)據(jù)往往散落于不同的信息系統(tǒng)及數(shù)據(jù)庫(kù)中,在建立模型之前,需要對(duì)所用到的信息進(jìn)行梳理、匯總和清洗,數(shù)據(jù)信息流如圖2所示:
結(jié)合教學(xué)實(shí)踐,本文將所需學(xué)生信息的具體內(nèi)容統(tǒng)計(jì)為如表1所示:
信息就醫(yī)數(shù)據(jù)、體測(cè)數(shù)據(jù)、心理測(cè)評(píng)數(shù)據(jù)校醫(yī)院、心理中心、二級(jí)學(xué)院其他其他其他在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)來(lái)源多樣且復(fù)雜,數(shù)據(jù)質(zhì)量參差不齊。數(shù)據(jù)清洗是數(shù)據(jù)預(yù)處理的關(guān)鍵環(huán)節(jié),通過(guò)刪除、修改或填充缺失值、處理異常值和重復(fù)值、調(diào)整數(shù)據(jù)格式等操作,使數(shù)據(jù)更加準(zhǔn)確、完整、可用、一致和規(guī)范化,提高數(shù)據(jù)分析和挖掘的準(zhǔn)確性和可靠性。
在學(xué)生信息的數(shù)據(jù)采集后,需要對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的清洗處理,具體有以下清洗內(nèi)容。
1.過(guò)濾非學(xué)生數(shù)據(jù)
在圖書(shū)借閱、校園卡消費(fèi)過(guò)程中,使用的人群中不只有學(xué)生,還有教師、行政人員等,需要過(guò)濾非學(xué)生數(shù)據(jù),防止除學(xué)生以外人員的數(shù)據(jù)對(duì)數(shù)據(jù)處理和分析進(jìn)行干擾,也減輕數(shù)據(jù)的處理和分析工作壓力。在實(shí)際操作中,可采用SQL查詢(xún)或數(shù)據(jù)處理軟件的功能,僅提取學(xué)生數(shù)據(jù),在數(shù)據(jù)采集后,也可根據(jù)學(xué)生的其他字段數(shù)據(jù)進(jìn)行相互印證,以確保所采集對(duì)象的學(xué)生身份。
2.邏輯一致性檢查
檢查數(shù)據(jù)字段之間的邏輯關(guān)系是否合理。例如,學(xué)生的入學(xué)年份不應(yīng)晚于畢業(yè)年份,學(xué)生的年齡應(yīng)該與年級(jí)相匹配等。
3.?dāng)?shù)據(jù)去重
在研究中,學(xué)生數(shù)據(jù)來(lái)源于學(xué)校多個(gè)管理系統(tǒng)的數(shù)據(jù)源,重復(fù)記錄很可能會(huì)出現(xiàn)。因此,檢查并去除數(shù)據(jù)集中的重復(fù)記錄很有必要。去重可以避免分析結(jié)果的偏差,提高數(shù)據(jù)分析的效率和精度。
4.缺失值處理
學(xué)生信息中的缺失值是指在數(shù)據(jù)集中某些字段或記錄中缺少數(shù)據(jù)的現(xiàn)象,缺失值的存在會(huì)影響數(shù)據(jù)分析的準(zhǔn)確性和有效性。本文所采用的缺失值處理步驟如下。
(1)初步審查。判斷缺失值的數(shù)量以及缺失值的模式。一般而言,缺失值的模式有:完全隨機(jī)缺失(MCAR)(數(shù)據(jù)的缺失與任何觀測(cè)變量無(wú)關(guān),即數(shù)據(jù)的缺失是隨機(jī)的)、隨機(jī)缺失(MAR)(數(shù)據(jù)缺失現(xiàn)象的發(fā)生與數(shù)據(jù)集中其他無(wú)缺失變量的取值有關(guān))、非隨機(jī)缺失(MNAR)(數(shù)據(jù)缺失的現(xiàn)象不僅和其他變量的取值有關(guān),也和自身的取值有關(guān))[9]。
(2)對(duì)于完全隨機(jī)的,且缺失比例不高的記錄,可以直接刪除,對(duì)于缺失比例較大的,數(shù)值型的數(shù)據(jù)采用中位數(shù)插補(bǔ)方式填充,如某一班級(jí)某個(gè)學(xué)生的成績(jī)項(xiàng)有缺失,將采用這一班級(jí)的平均成績(jī)進(jìn)行插補(bǔ)。而字符型缺失值直接采用空值填充。
(3)對(duì)于隨機(jī)和非隨機(jī)的缺失值,可以使用回歸模型填充方式。
5.?dāng)?shù)據(jù)的及時(shí)性
學(xué)生的數(shù)據(jù)信息是動(dòng)態(tài)的,需要根據(jù)實(shí)際情況進(jìn)行階段性的更新調(diào)整。如學(xué)生的畢業(yè)、考試成績(jī)的更新等,考慮到生活信息的更新頻率,可將數(shù)據(jù)更新頻率設(shè)置為一季度更新一次。
(二)學(xué)生思政信息模型的建立
學(xué)生思政信息可以通過(guò)一個(gè)統(tǒng)一的多層信息模型[10]進(jìn)行表達(dá),模型由多個(gè)層次構(gòu)成,各個(gè)層次依據(jù)信息增益(Information Gain,IG)大小進(jìn)行劃分。信息增益是信息熵的差[11],某個(gè)特征項(xiàng)的信息增益值越大,表示其重要程度越高。在學(xué)生思政信息模型中,每個(gè)層次的信息增益在一定范圍內(nèi)相等。一個(gè)層次又劃分為多個(gè)要素,信息要素在多個(gè)方面對(duì)該層信息進(jìn)行描述。
學(xué)生信息模型由關(guān)鍵層、次關(guān)鍵層以及基礎(chǔ)信息索引層構(gòu)成,如圖3所示:
1.關(guān)鍵層
對(duì)學(xué)生的思想政治素質(zhì)進(jìn)行基礎(chǔ)性的評(píng)價(jià),該層信息的信息增益最大,包括性別、政治面貌、心理測(cè)評(píng)結(jié)果、體測(cè)結(jié)果、學(xué)習(xí)成績(jī)等信息要素。
2.次關(guān)鍵層
對(duì)學(xué)生的思想政治素質(zhì)進(jìn)行側(cè)面的綜合評(píng)價(jià),包括首餐時(shí)間、校內(nèi)消費(fèi)情況、上網(wǎng)時(shí)間等信息要素。該層的信息具有一定的數(shù)據(jù)挖掘價(jià)值。例如,首餐時(shí)間可以由學(xué)生在食堂首次消費(fèi)時(shí)間獲得,可以判斷學(xué)生是否早起、三餐是否規(guī)律,進(jìn)而推斷學(xué)生的生活和心理狀態(tài);上網(wǎng)時(shí)間可以判斷學(xué)生是否過(guò)于沉溺于網(wǎng)絡(luò)娛樂(lè),可以對(duì)網(wǎng)絡(luò)在線(xiàn)時(shí)長(zhǎng)超過(guò)一定閾值的學(xué)生進(jìn)行談話(huà)提醒,通過(guò)分階次收取網(wǎng)費(fèi)等方式限制學(xué)生的上網(wǎng)時(shí)間。
3.基礎(chǔ)信息索引層
本質(zhì)上是為了標(biāo)識(shí)學(xué)生,包括學(xué)生學(xué)號(hào)、身份證號(hào)碼等基本識(shí)別信息,不參與后續(xù)的處理,僅為了能夠快速對(duì)所需要的學(xué)生進(jìn)行檢索。
對(duì)于不同層次的信息要素,根據(jù)信息增益的大小設(shè)置不同的權(quán)值,對(duì)于關(guān)鍵層信息,設(shè)置權(quán)值為0.7,次關(guān)鍵層為0.3。權(quán)值在后續(xù)的相似度比較中將得到運(yùn)用。
(三)學(xué)生信息模型的相似性比較
為了便于學(xué)生之間的相似性比較,便于后期做聚類(lèi)和離散點(diǎn)的分析,上述各信息必須量化為可以度量的數(shù)值,從信息要素的屬性角度,可以將分為分類(lèi)(定性)的以及數(shù)值(定量)的[12]。
分類(lèi)的屬性是事物的符號(hào)或是名稱(chēng),不具備數(shù)的性質(zhì),對(duì)于分類(lèi)屬性,為方便用算法發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián),可以將一個(gè)分類(lèi)屬性轉(zhuǎn)化為多個(gè)二元屬性,即進(jìn)行二元化,編碼的具體過(guò)程如下:
首先,窮舉該屬性的所有可能的值,為每一個(gè)分類(lèi)屬性的值引入一個(gè)二元屬性;
其次,將屬性值所在位置的二元屬性賦值為1,其他二元屬性賦值為0,以某學(xué)生的政治面貌為例,該屬性的值可能有{共產(chǎn)黨員,共青團(tuán)員,其他民主黨派,群眾},若某學(xué)生的政治面貌為共青團(tuán)員,則該分類(lèi)屬性可以二元化為:
1.分類(lèi)屬性的相似性比較
對(duì)于二元化的分類(lèi)屬性之間的相似度,可使用Jaccard系數(shù)J進(jìn)行度量:
sim(F1,F(xiàn)2)=J=f11f01+f10+f11(1)
式中,F(xiàn)1、F2為擬比較的兩個(gè)二元屬性的值,f11、f01、f10、f11的定義如表2所示:
2.?dāng)?shù)值屬性的相似性比較
對(duì)于數(shù)值屬性,將屬性值依序轉(zhuǎn)化為向量,并采用余弦相似度度量?jī)蓚€(gè)向量α及β之間的差異:
sim(F1,f2)=1d(α,β)=‖α‖‖β‖α·β(2)
式中,F(xiàn)1、F2為擬比較的兩個(gè)數(shù)值屬性的值,“·”表示向量點(diǎn)積,α·β=∑nk=1αkβk,‖α‖是向量的長(zhǎng)度,‖α‖=∑nk=1α3k。
結(jié)合多信息元素的學(xué)生信息模型,兩個(gè)學(xué)生的信息模型Mi以及Mj之間的相似度為:
sim(Mi,Mj)=∑k∈Eωksim(Mik,Mjk)(3)
其中,E是所有信息元素的集合,k是單個(gè)信息元素,ωk為單個(gè)信息元素在相似性比較時(shí)的權(quán)值。
對(duì)于比較結(jié)果,可設(shè)定一組閾值構(gòu)成區(qū)間(ωm,ωn),根據(jù)相似度比較結(jié)果分為以下幾類(lèi)情況:
(1)sim(Mi,Mj)≥ωn,可以認(rèn)為兩個(gè)學(xué)生相似度較高,在學(xué)生思政教育工作中可以歸為一類(lèi),實(shí)行統(tǒng)一管理;
(2)ωnlt;sim(Mi,Mj)lt;ωn,可以認(rèn)為兩個(gè)學(xué)生有一定的相似度,結(jié)合具體情況進(jìn)行分析;
(3)sim(Mi,Mj)≤ωn,可以認(rèn)為兩個(gè)學(xué)生之間相似度較低,在學(xué)生管理時(shí)應(yīng)采用不同的教學(xué)和管理辦法。
二、基于K-means的學(xué)生聚類(lèi)分析
(一)學(xué)生聚類(lèi)算法
K-means聚類(lèi)分析算法是一種迭代型的空間聚類(lèi)算法,該算法采用迭代的方式實(shí)現(xiàn)收斂,其核心思想是通過(guò)距離度量無(wú)標(biāo)記的數(shù)據(jù)對(duì)象之間的相似性,并將數(shù)據(jù)對(duì)象自動(dòng)劃分成k個(gè)聚類(lèi)類(lèi)別,使得同一個(gè)聚類(lèi)類(lèi)別中的每個(gè)數(shù)據(jù)對(duì)象到聚類(lèi)中心的距離最小。
聚類(lèi)的目標(biāo)常用一個(gè)目標(biāo)函數(shù)表示,在具體操作中,我們將目標(biāo)函數(shù)選擇為學(xué)生信息之間的相似度,將相似度的最大化作為聚類(lèi)的質(zhì)量評(píng)估標(biāo)準(zhǔn)。
在使用K-means聚類(lèi)算法時(shí),為優(yōu)化計(jì)算過(guò)程,通過(guò)肘部法則[13]確定數(shù)據(jù)集的最佳聚類(lèi)個(gè)數(shù)k,以達(dá)到最佳聚類(lèi)效果。若k值小于3,則可以根據(jù)實(shí)際直接將k值定義為3,即分為3個(gè)簇(好的、一般以及較差的),為避免聚類(lèi)陷入局部最優(yōu),在選取初始質(zhì)心時(shí),也盡可能避免隨機(jī)選擇,可以根據(jù)學(xué)生的實(shí)際情況,初步選擇若干典型代表作為初始質(zhì)心,具體的操作步驟如表3所示:
其中,重新計(jì)算每個(gè)簇的質(zhì)心時(shí),對(duì)于分類(lèi)屬性,可以直接選擇出現(xiàn)次數(shù)最多的值作為新的質(zhì)心的值,對(duì)于數(shù)值屬性,計(jì)算各點(diǎn)的均值作為新的質(zhì)心的值。
隨著學(xué)生數(shù)據(jù)的階段性更新,聚類(lèi)過(guò)程也是動(dòng)態(tài)的,在季度化的學(xué)生信息更新之后,聚類(lèi)也緊跟著重新進(jìn)行,以保證思政教育管理的及時(shí)性。
(二)教育資源匹配
根據(jù)聚類(lèi)算法的計(jì)算結(jié)果,可以將所有學(xué)生按照思想政治的維度分為不同的簇。對(duì)每個(gè)簇,挑選出質(zhì)心(或者是距離質(zhì)心最近的點(diǎn)),分析各項(xiàng)數(shù)據(jù)指標(biāo),進(jìn)行相互之間一些指標(biāo)的簡(jiǎn)單比較,對(duì)簇進(jìn)行排序評(píng)價(jià)。如此可以方便地、有側(cè)重地對(duì)所有學(xué)生進(jìn)行思政教育管理,以達(dá)到精準(zhǔn)思政的目的。對(duì)于較差簇中的學(xué)生,需要重點(diǎn)關(guān)注,加強(qiáng)約束引導(dǎo),及時(shí)糾偏。
在學(xué)生聚類(lèi)分析中,離群點(diǎn)指的是那些在數(shù)值上顯著偏離數(shù)據(jù)集中大多數(shù)觀測(cè)值的數(shù)據(jù)點(diǎn),可能代表那些具有極端特征的學(xué)生。對(duì)于一些明顯的離群點(diǎn)(距離各個(gè)簇的質(zhì)心都比較遠(yuǎn)),可以進(jìn)行個(gè)別分析,在排除數(shù)據(jù)處理錯(cuò)誤的情況后,可以加強(qiáng)關(guān)注,分析日常的學(xué)習(xí)生活行為,及時(shí)采取相應(yīng)措施,在各項(xiàng)數(shù)據(jù)指標(biāo)接近于某一個(gè)簇時(shí),可以及時(shí)調(diào)整到相應(yīng)的簇中,減輕管理壓力。
在對(duì)學(xué)生進(jìn)行簇的分組后,可以通過(guò)學(xué)生打分的方式,得到特定簇的學(xué)生對(duì)于不同思政教師的評(píng)價(jià),在已有的教師資源中,選取得分最高的、最適宜相應(yīng)學(xué)生簇的思政教師。同時(shí),可以將該教師與學(xué)生簇的質(zhì)點(diǎn)進(jìn)行鏈接。對(duì)一個(gè)教師所鏈接的所有質(zhì)點(diǎn),再次進(jìn)行聚類(lèi)分析,找出質(zhì)心,作為該教師的信息模型(此時(shí),該模型的信息并不具有真實(shí)的物理意義,僅僅是后續(xù)做相似度比較時(shí)的數(shù)據(jù)化需要)。在后續(xù)的對(duì)于不同學(xué)生的聚類(lèi)分析后,可遍歷現(xiàn)有的教師,以匹配與學(xué)生簇質(zhì)心最為相似的教師,作為該簇的思政教師,以進(jìn)一步實(shí)現(xiàn)思政教育的精準(zhǔn)化。具體過(guò)程如圖4所示:
三、總結(jié)與展望
本文通過(guò)建立學(xué)生思政信息模型,實(shí)現(xiàn)學(xué)生思政信息的量化。通過(guò)建立信息模型之間的相似度比較方法,并基于K-means算法,對(duì)學(xué)生在思政方面進(jìn)行聚類(lèi)分析,將學(xué)生進(jìn)行分組管理,從而有針對(duì)性地開(kāi)展高校思政教育。同時(shí),通過(guò)對(duì)學(xué)生信息模型的遷移,建立教師信息模型,通過(guò)教師與學(xué)生簇之間的比較,匹配合適的教師,進(jìn)一步提高思政教育的精準(zhǔn)度。本文所提出的信息量化以及比較方法,在高校學(xué)生其他方面的管理工作中,有較強(qiáng)的遷移性和借鑒意義。
參考文獻(xiàn):
[1]韓慶祥,張艷濤.深刻理解精準(zhǔn)思維的時(shí)代意蘊(yùn)[N].中國(guó)紀(jì)檢監(jiān)察報(bào),2022-09-22(5).
[2]教育部2019年工作要點(diǎn)[J].人民教育,2019(5):19-26.
[3]黃文林.基于學(xué)生畫(huà)像分析的高校精準(zhǔn)思政探索[J].東北大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2021(3):104-111.
[4]焦立濤.人工智能賦能大學(xué)生思想政治教育研究[D].濟(jì)南:山東師范大學(xué),2023.
[5]李子輝.虛擬現(xiàn)實(shí)技術(shù)在高校思想政治教育中的運(yùn)用研究[D].上海:華東師范大學(xué),2023.
[6]熊琴.區(qū)塊鏈技術(shù)在高校思想政治教育中的運(yùn)用研究[D].南昌:江西財(cái)經(jīng)大學(xué),2022.
[7]鄧晗.基于機(jī)器學(xué)習(xí)和大數(shù)據(jù)技術(shù)的高校學(xué)生行為分析[D].北京:北京郵電大學(xué),2017.
[8]王世純,許新華,黃嘉成,等.K-means聚類(lèi)算法在高校學(xué)生成績(jī)分析中的應(yīng)用研究[J].湖北師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2019(3):113-118.
[9]Lazar N A.Statistical analysis with missing data[J].Technometrics,2003(4):364-365.
[10]李磊磊.面向設(shè)計(jì)制造集成的船用柴油機(jī)關(guān)鍵件CAM系統(tǒng)研究[D].鎮(zhèn)江:江蘇科技大學(xué),2018.
[11]劉慶和,梁正友.一種基于信息增益的特征優(yōu)化選擇方法[J].計(jì)算機(jī)工程與應(yīng)用,2011(12):130-132,136.
[12]P N TAN,M STEINBACH,V KUMAR,et al.Introduction to data mining[M].Beijing:Posts amp; Telecom Press,2010:17.
[13]周玉,朱文豪,孫紅玉.一種基于目標(biāo)函數(shù)的局部離群點(diǎn)檢測(cè)方法[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2022(10):1405-1412.
作者簡(jiǎn)介:高亞文(1992—),女,漢族,江蘇邳州人,江蘇科技大學(xué)講師,研究方向?yàn)楦咝K枷胝谓逃?/p>
鹿婷(1979—),女,漢族,江蘇鎮(zhèn)江人,江蘇科技大學(xué)講師,研究方向?yàn)楦叩冉逃芾怼?/p>
(責(zé)任編輯:楊超)