摘" 要:智慧校園建設(shè)采集了完備的校園學(xué)生數(shù)據(jù),為客觀分析大學(xué)生黨員特性,建立科學(xué)化的大學(xué)生黨員監(jiān)督評價(jià)和培養(yǎng)教育體系提供了重要機(jī)遇。文章開展了大學(xué)生黨員特點(diǎn)數(shù)據(jù)分析,以及基于特點(diǎn)數(shù)據(jù)的大學(xué)生預(yù)測。首先,根據(jù)以往的研究結(jié)果和大學(xué)生黨員培養(yǎng)要求,對重點(diǎn)大學(xué)生數(shù)據(jù)進(jìn)行搜集和預(yù)處理;其次,采用卡方檢驗(yàn)對大學(xué)生數(shù)據(jù)進(jìn)行分析,找出主要特征;再次,以主要特征為輸入,通過樸素貝葉斯模型建立了黨員及優(yōu)秀黨員分類預(yù)測模型。此外,文章還發(fā)現(xiàn)了大學(xué)生黨員的新特點(diǎn),有助于學(xué)生輔導(dǎo)員和黨務(wù)工作者采取有針對性的措施。
關(guān)鍵詞:高校黨建;大學(xué)生黨員;數(shù)據(jù)挖掘
中圖分類號(hào):G641" " 文獻(xiàn)標(biāo)識(shí)碼:A" " 文章編號(hào):1673-7164(2025)04-0071-04
大學(xué)生黨員是大學(xué)生中的優(yōu)秀群體和中國共產(chǎn)黨隊(duì)伍中重要組成部分,提高大學(xué)生黨員培養(yǎng)和發(fā)展質(zhì)量是我國新時(shí)代黨建的重要工作之一。全面高效地獲取大學(xué)生黨員數(shù)據(jù),科學(xué)客觀地分析大學(xué)生黨員特性,對建立科學(xué)化標(biāo)準(zhǔn)化的大學(xué)生黨員監(jiān)督評價(jià)體系,制訂針對性、個(gè)性化的大學(xué)生黨員培養(yǎng)教育方案,提高大學(xué)生黨員發(fā)展質(zhì)量具有非常重要的意義。
傳統(tǒng)的大學(xué)生黨員特性數(shù)據(jù)主要是通過組織動(dòng)員、民主生活會(huì)、紙質(zhì)問卷調(diào)查等方式采集得到,[1-4]以上方式潛在的偏差和誤差會(huì)降低數(shù)據(jù)可信度。[5]
得益于高?!半p一流”建設(shè)和“教育信息化2.0”等文件的指導(dǎo)和校園互聯(lián)網(wǎng)的完善,智慧校園建設(shè)得到全國各高校的廣泛重視。各級黨組織可獲取的大學(xué)生黨員數(shù)據(jù)有了質(zhì)的提升,從線下黨員數(shù)據(jù)、線上黨員數(shù)據(jù)直到校園大數(shù)據(jù),大量學(xué)生數(shù)據(jù)為科學(xué)客觀分析大學(xué)生黨員特性,全面準(zhǔn)確構(gòu)建大學(xué)生黨員畫像提供了新思路。[6-7]智慧校園提供了便于計(jì)算機(jī)快速處理的數(shù)據(jù),解決了新時(shí)期黨建下數(shù)據(jù)分析和評估的效率提升需求。[8-9]借助互聯(lián)網(wǎng)黨建擴(kuò)展的大學(xué)生黨員數(shù)據(jù),部分高校和黨務(wù)工作者開展了大學(xué)生黨員屬性分析和評估,取得了良好實(shí)踐效果和有益結(jié)論。[10-13]
本研究以西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院大學(xué)生學(xué)業(yè)測評數(shù)據(jù)為實(shí)踐案例,從具體數(shù)據(jù)的采集目標(biāo)和統(tǒng)計(jì)結(jié)果角度,得出利用校園大數(shù)據(jù)分析大學(xué)生黨員特性的可行性論證,并給出簡單數(shù)值分析結(jié)論。
一、數(shù)據(jù)收集及預(yù)處理
(一)數(shù)據(jù)收集
大學(xué)生學(xué)業(yè)測評數(shù)據(jù)是某大學(xué)智慧校園數(shù)據(jù)中代表性數(shù)據(jù)之一,借助校園互聯(lián)網(wǎng),大學(xué)生對學(xué)年表現(xiàn)進(jìn)行申報(bào)、匯總、計(jì)算和公示,形成大學(xué)生學(xué)業(yè)測評數(shù)據(jù)。
本研究提取了計(jì)算機(jī)學(xué)院2019 — 2020學(xué)年2017級本科生學(xué)業(yè)測評數(shù)據(jù)、宿舍數(shù)據(jù)、黨員名單和民主評議黨員數(shù)據(jù),以及2020 — 2021學(xué)年2018級本科生的同類型數(shù)據(jù)。數(shù)據(jù)清洗后,共取得2017級本科生數(shù)據(jù)232條,其中非黨員168人,黨員64人,普通黨員48人,優(yōu)秀黨員16人,2018級本科生數(shù)據(jù)254條,其中非黨員198人,黨員56人,普通黨員43人,優(yōu)秀黨員13人。分為非黨員、黨員、普通黨員和優(yōu)秀黨員四類群體進(jìn)行對比分析,由于全體大學(xué)生G6項(xiàng)均0分,文章分析排除該測評項(xiàng),下文對比將占優(yōu)數(shù)值加粗顯示。
(二)數(shù)據(jù)清洗及預(yù)處理
大學(xué)生黨員素質(zhì)能力數(shù)據(jù)歸一化。年級間大學(xué)生黨員素質(zhì)能力一致性反映了高校對大學(xué)生黨員發(fā)展和培養(yǎng)標(biāo)準(zhǔn)一致性。文章分別統(tǒng)計(jì)2017級和2018級本科生數(shù)據(jù)黨員和非黨員各指標(biāo)項(xiàng)數(shù)值均值,結(jié)果如表1所示。這里采用兩個(gè)年級數(shù)據(jù)間相關(guān)系數(shù)討論指標(biāo)項(xiàng)數(shù)值分布上的一致性,計(jì)算可知,全體學(xué)生指標(biāo)項(xiàng)均值的相關(guān)系數(shù)為0.9943,P值為4.51×10-11;非黨員指標(biāo)項(xiàng)均值的相關(guān)系數(shù)為0.9936,P值為6.17×10-5;黨員指標(biāo)項(xiàng)均值的相關(guān)系數(shù)為0.9983,P值為4.16×10-6??梢妰蓚€(gè)年級指標(biāo)項(xiàng)數(shù)據(jù)分布高度一致,尤其黨員各素質(zhì)能力數(shù)據(jù)比例具有高度一致性。
考慮兩個(gè)年級數(shù)據(jù)分布高度一致,文章將兩個(gè)年級數(shù)據(jù)合并分析,將2018級指標(biāo)項(xiàng)G數(shù)據(jù)按照2017級指標(biāo)項(xiàng)G數(shù)據(jù)的均值和方差進(jìn)行數(shù)據(jù)規(guī)范化,其他指標(biāo)項(xiàng)數(shù)據(jù)同比例調(diào)整。
二、大數(shù)據(jù)分析預(yù)測模型
(一)樸素貝葉斯分類器模型
文章使用機(jī)器學(xué)習(xí)模型建立大學(xué)生學(xué)業(yè)測評數(shù)據(jù)與黨員身份之間的映射關(guān)系,探索利用大學(xué)校園學(xué)生大數(shù)據(jù)分析學(xué)生黨員特性的可行性。目前,流行的機(jī)器學(xué)習(xí)分類技術(shù)主要有邏輯回歸(LOG)模型、支持向量機(jī)(SVC)模型、隨機(jī)森林(RFC)模型和樸素貝葉斯分類器(NBC)模型等。相較于其他算法,樸素貝葉斯模型具有方法簡單、分類精度高、計(jì)算速度快等優(yōu)點(diǎn)。其核心思想是利用貝葉斯公式根據(jù)數(shù)據(jù)特征的先驗(yàn)概率計(jì)算得到后驗(yàn)概率,并選擇具有最大后驗(yàn)概率的類作為該特征所屬的類:
(二)模型評估標(biāo)準(zhǔn)
本研究屬于二分類問題。分類模型常用的評價(jià)標(biāo)準(zhǔn)是基于混淆矩陣,主要由準(zhǔn)確率和查準(zhǔn)率組成。準(zhǔn)確率定義為對于給定的測試數(shù)據(jù)集,分類器正確分類的樣本數(shù)與總樣本數(shù)之比。查準(zhǔn)率定義為預(yù)測為正的樣本中真實(shí)的正樣本的占比。
三、數(shù)據(jù)分析及預(yù)測結(jié)果
(一)大學(xué)生黨員特點(diǎn)分析結(jié)果
大學(xué)生黨員素質(zhì)能力先鋒性分析。分別統(tǒng)計(jì)合并后本科生學(xué)業(yè)測評數(shù)據(jù)中非黨員、黨員、普通黨員和優(yōu)秀黨員在學(xué)業(yè)測評成績各項(xiàng)平均值,如表2所示。從表中可以看出,所有學(xué)業(yè)測評指標(biāo)項(xiàng)的均值上,黨員均優(yōu)于非黨員,優(yōu)秀黨員均優(yōu)于普通黨員。充分表明在學(xué)業(yè)測評成績上,黨員能代表大學(xué)生中的先鋒群體,優(yōu)秀黨員也能代表黨員中的先鋒群體。
大學(xué)生黨員優(yōu)勢素質(zhì)能力項(xiàng)目分析。本科生學(xué)業(yè)測評數(shù)據(jù)綜合測評成績G由G1~G5加權(quán)得到,因此可以對各類型學(xué)生群體分別計(jì)算G1~G5與G的相關(guān)系數(shù),通過不同類型學(xué)生群體間相關(guān)系數(shù)結(jié)果的橫向?qū)Ρ?,可分析各類型學(xué)生群體中顯著影響綜合測評成績影的指標(biāo)項(xiàng),結(jié)果如表3所示。結(jié)合表2和表3分析可知,相比于非黨員,黨員在科技創(chuàng)新、表彰獎(jiǎng)勵(lì)和社會(huì)工作上表現(xiàn)更加突出;相比于普通黨員,優(yōu)秀黨員在功課學(xué)習(xí)、科技創(chuàng)新和表彰獎(jiǎng)勵(lì)上表現(xiàn)更加突出。
大學(xué)生黨員團(tuán)體戰(zhàn)斗堡壘作用分析。文章以宿舍為大學(xué)生團(tuán)隊(duì)單位,分析大學(xué)生團(tuán)隊(duì)中黨員構(gòu)成與團(tuán)隊(duì)整體戰(zhàn)斗堡壘作用關(guān)系。西北工業(yè)大學(xué)各學(xué)院按年級集中分配本科生宿舍,宿舍人數(shù)通常為4人,使以宿舍為團(tuán)隊(duì)單位分析在數(shù)據(jù)完整性和數(shù)據(jù)規(guī)范性上具備可行性。2017級和2018級兩批數(shù)據(jù)中分別包含本科生宿舍65間和73間,考慮存在多學(xué)院或多年級混住情況,本文將學(xué)生宿舍按照[0,0.25)、[0.25,0.5)、[0.5,0.75)和[0.75,1]四個(gè)區(qū)間的黨員占比進(jìn)行劃分對比。表3展示了不同黨員構(gòu)成宿舍中各指標(biāo)項(xiàng)平均值,有黨員的宿舍各項(xiàng)測評成績明顯優(yōu)于無黨員的宿舍,且宿舍學(xué)業(yè)測評成績均值隨著黨員在宿舍中占比提升而提高;有趣的是,當(dāng)考慮優(yōu)秀黨員因素時(shí),優(yōu)秀黨員所在宿舍團(tuán)隊(duì)在功課學(xué)習(xí)、表彰獎(jiǎng)勵(lì)和社會(huì)工作上具備顯著的戰(zhàn)斗堡壘作用。
大學(xué)生黨員模范帶頭作用分析。黨員模范帶頭作用可通過其對周邊人員的正向影響進(jìn)行反映。文章以宿舍為單位,統(tǒng)計(jì)不同黨員占比情況下非黨員大學(xué)生的學(xué)業(yè)測評均值。結(jié)果如表4所示,這里排除了黨員占比100%的宿舍。通過數(shù)據(jù)對比可知,有黨員的宿舍中非黨員大學(xué)生測評成績相比于無黨員的宿舍更優(yōu),且非黨員大學(xué)生測評成績均值基本隨著黨員在宿舍中占比的提升而提高,一定程度上反映出黨員對非黨員具有模范帶頭作用??梢钥闯觯瑑?yōu)秀黨員宿舍和黨員占比大于或等于75%的宿舍中非黨員大學(xué)生成績存在“燈下黑”的現(xiàn)象。
文章分析其可能原因:1. 數(shù)據(jù)量有限導(dǎo)致統(tǒng)計(jì)偏差(黨員占比大于等于75%宿舍中非黨員大學(xué)生僅6人,優(yōu)秀黨員宿舍中非黨員大學(xué)生27人);2. 該類宿舍學(xué)生入黨意向更高實(shí)現(xiàn)了“可發(fā)展盡發(fā)展”;3. 團(tuán)隊(duì)中黨員過于優(yōu)秀時(shí)會(huì)限制非黨員大學(xué)生的積極性,需要更多數(shù)據(jù)以進(jìn)一步分析和研究。值得注意的是,本研究分析大學(xué)生黨員模范帶頭作用的數(shù)據(jù)和方法不具有完備性,一是該方法僅能考查團(tuán)隊(duì)中非黨員大學(xué)生成績與黨員構(gòu)成的相關(guān)性而非因果性,無法排除非黨員大學(xué)生表現(xiàn)較好的環(huán)境對黨員發(fā)展的正向作用;二是黨員對周圍成員的影響是動(dòng)態(tài)的,基于單次學(xué)業(yè)測評數(shù)據(jù)的統(tǒng)計(jì)分析無法反映該變化過程。
在學(xué)業(yè)測評數(shù)據(jù)角度,黨員相比于非黨員,優(yōu)秀黨員相比于普通黨員均具備更加優(yōu)秀的綜合表現(xiàn),且優(yōu)秀黨員和普通黨員具備不同的優(yōu)勢項(xiàng)目,可進(jìn)一步基于該數(shù)據(jù)開展大學(xué)生黨員的畫像構(gòu)建及智能推薦系統(tǒng)研究;數(shù)據(jù)分析發(fā)現(xiàn)優(yōu)秀黨員和黨員占比高于75%的宿舍中非黨員學(xué)生測評成績存在“燈下黑”等問題,為下一步研究提供了方向。
(二)大學(xué)生黨員預(yù)測結(jié)果
將2018—2019年度西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院2016級本科生、2017級碩士研究生和2018級碩士研究生學(xué)業(yè)測評數(shù)據(jù)輸入樸素貝葉斯模型,對該模型進(jìn)行訓(xùn)練,訓(xùn)練模型采用兩種形式進(jìn)行測試。
方式一:以2018—2019年度西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院2016級本科生、2017級碩士研究生和2018級碩士研究生學(xué)業(yè)測評數(shù)據(jù)進(jìn)行測試;方式二:以2017—2018年度西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院2017級碩士研究生學(xué)業(yè)測評數(shù)據(jù)進(jìn)行測試(結(jié)果見表6)。
由此可見,無論對訓(xùn)練集自身,還是對測試集,均達(dá)到了較高的識(shí)別率,考慮訓(xùn)練數(shù)據(jù)量相對較少,且無法排除訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)中的個(gè)別虛假數(shù)據(jù),該結(jié)果已取得較好效果。
四、結(jié)語
新時(shí)期智慧校園的建設(shè),為大學(xué)生黨員特性分析提供了海量校園數(shù)據(jù),為建立科學(xué)化的大學(xué)生黨員監(jiān)督評價(jià)和培養(yǎng)教育體系,提高高校黨建質(zhì)量提供了新的機(jī)遇和挑戰(zhàn)。本研究基于校園大數(shù)據(jù)進(jìn)行的分析大學(xué)生單元特性的可行性探索,既為后續(xù)黨建研究挖掘了新的課題方向,也為基于校園大數(shù)據(jù)構(gòu)建智慧黨建平臺(tái)提供了理論支撐和相關(guān)建議。
參考文獻(xiàn):
[1] 周菲,孫瑩,胡玥. 高校黨員考核評價(jià)體系研究[J]. 長白學(xué)刊,2011(06):41-45.
[2] 王本成. 構(gòu)建高校學(xué)生黨員先進(jìn)性建設(shè)量化考核體系研究[J]. 學(xué)校黨建與思想教育,2018(12):39-40+48.
[3] 關(guān)磊,鄧平宇,祁緣,等. 大學(xué)生黨建新媒體平臺(tái)建設(shè)機(jī)制研究:基于廣東省十所高校的調(diào)研[J]. 教育教學(xué)論壇,2016(37):55-56.
[4] 丁勇,陳詩,楊紹輝,等. 高校學(xué)生黨員黨性及其影響力的研究[J]. 學(xué)理論,2011(05):34-36.
[5] 林竹. 調(diào)查中的誤差與偏差[J]. 中國統(tǒng)計(jì),2012(07):30-32.
[6] 孫夢瑤,王如全. 高校黨建工作信息化建設(shè)探究[J]. 學(xué)校黨建與思想教育,2020(02):34-35.
[7] 白春樂,袁武振. 互聯(lián)網(wǎng)時(shí)代高校智慧黨建面臨的困境及其出路[J]. 學(xué)校黨建與思想教育,2022(04):42-44.
[8] 高云,嚴(yán)笑凱,葛鑫. 初議教育現(xiàn)代化建設(shè)中的大學(xué)生黨員評價(jià)體系建設(shè)[J]. 吉林教育,2021(11):23-25.
[9] 張小平,錢婷,任懷藝. 打造智慧黨建平臺(tái)創(chuàng)新黨建工作模式:研究生黨員網(wǎng)上民主評議制度的探索與實(shí)踐[J]. 學(xué)位與研究生教育,2015(11):23-28.
[10] 張永波,胡小杰. 高校智慧校園評價(jià)指標(biāo)的設(shè)計(jì)與組成框架[J]. 現(xiàn)代教育技術(shù),2020,30(09):71-78.
[11] 胡欽太,鄭凱,林南暉. 教育信息化的發(fā)展轉(zhuǎn)型:從“數(shù)字校園”到“智慧校園”[J]. 中國電化教育,2014(01):35-39.
[12] 束赟. 大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)與基層黨建:新技術(shù)時(shí)代基層黨建理論與實(shí)踐新探索[M]. 上海:上海社會(huì)科學(xué)院出版社,2018.
[13] 米華全,姚婷婷,孫健. 大數(shù)據(jù)推進(jìn)高校黨建工作的困境和出路探析[J]. 思想政治教育研究,2019,35(04):135-139.
(薦稿人:袁源,西北工業(yè)大學(xué)副教授)
(責(zé)任編輯:楊毅恒)
基金項(xiàng)目:西北工業(yè)大學(xué)2019年度理論政策類項(xiàng)目“基于概率圖模型黨員畫像研究——以西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院學(xué)生為例”(項(xiàng)目編號(hào):D5000200086)。
作者簡介:高云(1991—),女,碩士,西北工業(yè)大學(xué)校團(tuán)委,計(jì)算機(jī)學(xué)院講師,研究方向?yàn)樗枷胝谓逃?;?yán)笑凱(1999—),男,博士在讀,西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,研究方向?yàn)槠者m計(jì)算;葛鑫(1991—),男,博士在讀,西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,研究方向?yàn)槿斯ぶ悄堋?/p>