郭學茹 陳 平 呂光明 劉芳南 孫留萍
(北京師范大學統(tǒng)計學院, 北京 100875)
2022年黨的二十大對教育、科技、人才進行了“三位一體”統(tǒng)籌部署,首次將“推進教育數(shù)字化”寫入報告中[1],指明了教育數(shù)字化在促進未來教育高質(zhì)量發(fā)展的重要使命。2023年1月,全國教育工作會議也進一步指出“縱深推進教育數(shù)字化戰(zhàn)略行動,重點做好大數(shù)據(jù)中心建設、數(shù)據(jù)充分賦能”[2]??梢姶髷?shù)據(jù)已逐漸成為驅(qū)動教育創(chuàng)新發(fā)展的新引擎,也為思想政治教育工作提供了一種認識學生特點的全新思維與夯實思想引領的全新手段。本文將基于高校學生校園社交行為大數(shù)據(jù),通過引入共現(xiàn)概念并建立模型,計算挖掘?qū)W生的人際關系和社交特點,探索大學生校園社交行為的特征,助力高校在精準掌握學生動態(tài)的基礎上,設計全方位、多層次和精細化的社交能力提升路徑方案,為高校學生社交能力的全面提升精準施策,助力高校精準育人與科學管理。
共現(xiàn)一詞最初是在普林斯頓大學開發(fā)的WordNet語義詞典中提及,作為普通名詞表示同時發(fā)生或有關聯(lián)的事物。相互關聯(lián)是共現(xiàn)發(fā)生的內(nèi)因,而共現(xiàn)是兩個事物相互關聯(lián)的體現(xiàn)[3]。共現(xiàn)理論起初被用于信息檢索、知識網(wǎng)絡構建等文本挖掘方向,隨后逐漸被引入社交關系研究中。特別是隨著大數(shù)據(jù)與統(tǒng)計分析技術的發(fā)展,對高校學生一卡通數(shù)據(jù)的挖掘分析逐漸成為研究熱點[4]。采用共現(xiàn)思想挖掘校園一卡通數(shù)據(jù)特征,即兩個同學在同一時間同一個pos機上刷校園卡為共現(xiàn)一次。對于不在同一時間刷卡的情況,兩者刷卡時間越近,說明兩者共現(xiàn)的概率越大,其相似度越高。通過對生活場景分析,發(fā)現(xiàn)對于食堂就餐、超市購物、體育館或操場的刷卡場景,相鄰兩人的刷卡時間差通常均為1-3分鐘,故將共現(xiàn)的刷卡時間差設置為3分鐘,若兩人在同一地點刷卡時間差在3分鐘之內(nèi),則視其發(fā)生共現(xiàn),據(jù)此建立共現(xiàn)模型,并計算學生間的相似度,利用學生間相似度水平的高低來推斷兩者的親疏關系。
而相似度又可轉(zhuǎn)換為兩者之間的距離,這樣通過對距離使用譜聚類算法,可將距離相近的學生歸為一類,進而識別學生社交圈層的個數(shù)及分類特征。譜聚類算法是一種以圖論為基礎的算法,利用特征值和特征向量的方法對數(shù)據(jù)進行聚類,其本質(zhì)是將聚類問題轉(zhuǎn)化為圖的最優(yōu)劃分問題[5]。譜聚類的主要優(yōu)點是對數(shù)據(jù)結構要求不高,對校園一卡通這類時空節(jié)點數(shù)據(jù)的聚類更具優(yōu)勢。但該法需要提前給出聚類個數(shù),以減少計算量,提高計算處理速度。本研究使用Calinski-Harabasz Index(簡稱CH得分)選取聚類數(shù)目,當CH得分越大,說明聚類效果越好。
當代高校學生是互聯(lián)網(wǎng)社交的“原住民”,但徜徉網(wǎng)絡與現(xiàn)實社交截然不同,社交現(xiàn)場感的長期缺失會嚴重影響大學生的表達、理解、應變與交流等社交能力。而大數(shù)據(jù)的迅猛發(fā)展為挖掘校園社交行為提供了技術支撐,可使校園社交行為數(shù)據(jù)分析從定性的描述性統(tǒng)計、升級為定量的精準數(shù)據(jù)挖掘,從而助力高校夯實精準舉措實效,全面提升大學生的線下社交能力。
高校學生的線下社交行為因?qū)W業(yè)和生活影響,多為本班同學間的人際關系。因此為了客觀準確的描述其社交關系,并考慮班級為主體的影響,本文實證分析的數(shù)據(jù)來源于北京師范大學某班級學生2018年9月至2019年6月校園一卡通數(shù)據(jù)平臺中的6.5萬余條消費數(shù)據(jù)和1.3萬余條運動數(shù)據(jù)。其中消費數(shù)據(jù)指學生各種消費行為的流水記錄,包括食堂就餐、浴室洗澡和超市購物的刷卡時空數(shù)據(jù),運動數(shù)據(jù)指體育館和操場運動行為的門禁刷卡記錄。數(shù)據(jù)預處理方面,先從初始數(shù)據(jù)信息中提取學生學號、刷卡日期、刷卡時間和刷卡地點等字段,對刷卡時間的格式進行轉(zhuǎn)換;為了保護學生隱私,再將每位學生的學號隨機轉(zhuǎn)換為學生代表編號進行表示。再對刷卡地點編碼,將文字形式的刷卡地點轉(zhuǎn)換成碼值;最后為了提高數(shù)據(jù)的準確性和計算效率,將同一位學生同一日期刷卡時間差內(nèi)的記錄匯總合并為一條,建立開始時間和結束時間的數(shù)據(jù)集。據(jù)此建立共現(xiàn)模型,基于Python中numpy模塊的矩陣運算相關函數(shù),后依托其networkx包和Graph_Matrix包對譜聚類結果進行可視化,揭示高校班級學生群體的社交親密關系、社交網(wǎng)絡特征和社交圈層分布規(guī)律,從而精準指導高校學生社交能力培養(yǎng)和提升工作。
通過挖掘繪制班級整體的社交網(wǎng)絡圖可甄別班級活躍度較低的學生。如圖1所示,其中每個節(jié)點代表一名同學,兩個節(jié)點之間的邊線代表兩者間的社交關系,邊線越粗說明兩者關系越親密,且越親密的兩個節(jié)點在圖上相距越近。從圖1中可以看出該班級同學間邊線連接緊密,形成了交織密集的社交關系網(wǎng),說明班級同學之間共同活動的頻次較高,整體凝聚力較強。其中同學1、同學2及同學13明顯處于距離中心最遠半徑的邊緣狀態(tài),未在密集交織區(qū)域,且與班級同學連線較細,說明與班級的社交聯(lián)系相對疏遠。距離中心位置半徑次遠的同學27、53、4、19、16等,處于班級社交網(wǎng)絡的次邊緣,其班級社交關系未在中部核心“交織區(qū)”。因此以上社交網(wǎng)絡特征為“分散式”的同學可能存在社交離群的傾向,在日常管理中應予以關注了解和精準甄別。
圖1 班級學生社交網(wǎng)絡圖
圖2 代表性學生社交網(wǎng)絡圖
在班級學生社交網(wǎng)絡分析的基礎上,通過構建相似度矩陣可精準判別班級活躍度較高的學生社交網(wǎng)絡特征。圖2以圖1中距離班級社交網(wǎng)絡中心距離不同的3位學生作為代表,繪制其個人社交網(wǎng)絡圖。同學55的社交網(wǎng)絡圖相較同學6和同學53呈現(xiàn)較為緊密的狀態(tài),多數(shù)邊線很粗,凝聚力很強,是班級內(nèi)活躍度較高學生的典型“凝聚式”社交網(wǎng)絡特征,說明同學55和班級大部分同學關系都較為親密,與眾多好朋友經(jīng)常一起學習或參加活動。此類班級活躍度較高學生,是發(fā)揮班級朋輩幫扶的“核心”力量。
采用譜聚類方法可識別班級活躍度中等學生群體的社交圈層特點。本文通過迭代計算得到聚類數(shù)分別為3、4、5、6、7時的得分值,其中當聚類數(shù)為5時得分最大,確定最優(yōu)聚類數(shù)為5(圖3a)。即可將班級同學的相似度聚為5類,也說明班級存在5個社交圈,并繪制5類學生與全班學生的相似度水平分布情況展示(圖3b至圖3f),每幅圖的橫坐標為全班學生轉(zhuǎn)換后的代表數(shù)字編號(1-60),縱坐標為學生之間的相似度水平。
從中可以看出,五類同學與全班每個學生的相似度水平都分布于5個明顯不同的區(qū)間,說明聚類區(qū)分度良好,代表性較強。從圖3b至圖3f五類相似度的具體分布可以發(fā)現(xiàn)其平均水平逐漸降低,每個圖中的學生主體與全班學生的相似度水平大體分布于20~80、0~80、0~60、0~40和0~20之間。其中相似度分布中等的圖3c、3d和3e是包含班級學生人數(shù)最多的三個社交圈,依次為22人、15人和11人。這些同學與全班同學的相似度較高,在各自相似度區(qū)間內(nèi)點位分布密集、重合度較高,且大部分學生之間仍存在多個相似度水平大于100的好友,表明這三個為班級活躍度中等的“主體”社交圈層,其內(nèi)同學活躍度良好。另外,相似度水平分布于“頭尾”的圖3b和圖3f也可進一步佐證前文活躍度較高和較低學生群體的精準判別。整體而言,該班級主體同學線下社交活躍,社交聯(lián)系緊密、氛圍良好,班級凝聚力較強,且班內(nèi)同學多互為好友,朋輩支持較為穩(wěn)定。
圖3 準則得分和五類學生相似度分布圖
圖4 基于數(shù)據(jù)挖掘的點線面三位一體
通過數(shù)據(jù)挖掘為判別高校學生社交動態(tài)提供了有效途徑,并依托三種代表性社交特征結果,結合思想政治教育工作的實際需求,構建點線面三位一體的高校學生社交能力提升路徑(圖4),以期助力大學生全面成長成才,推動高校精準思政工作的創(chuàng)新發(fā)展。
首先,識別社交網(wǎng)絡離群點。依托數(shù)據(jù)挖掘可精準掌握大學生的社交網(wǎng)絡特點,根據(jù)量化的學生間親密關系程度或社交圈的相似度高低初步判別可能的社交離群點。而后再依靠學生干部、宿舍長、班級好友等,通過走訪宿舍與課堂等多種方式深入了解具體情況,確保社交離群點的精準識別。其次,找準深入輔導切入點。針對這類學生應將找準影響學生社交行為的關鍵因素作為切入點。輔導員需透過多重信息精準判別本質(zhì)問題,并積極采取科學的、持續(xù)的多維干預措施,如談心談話的循循善誘、具體課程的學業(yè)輔導、宿舍關系的調(diào)解指導及家庭關系的家校聯(lián)動等多個維度來深入展開,最大程度的發(fā)揮輔導實效。最后,把握心理幫扶時間點。上述問題若持續(xù)作用將嚴重影響學生的身心健康發(fā)展。因此需要具體分析不同時段學生社交行為的數(shù)據(jù)挖掘結果,針對性開展心理幫扶[6]。如新生在入學之初,其性格和情緒若明顯不穩(wěn)定,則需在此“黃金塑造期”予以重點關注和心理疏導。高年級同學若在期末或畢業(yè)時活躍度突然變低,可能由于學業(yè)、就業(yè)或戀愛等問題所致,視具體情況家校聯(lián)動采取專業(yè)的心理幫扶措施。
第一,建立學業(yè)輔導與生活指導的朋輩幫扶線。依托學業(yè)輔導室和生活指導室,充分發(fā)揮活躍度較高學生的社交優(yōu)勢和朋輩教育引領作用。學習方面,組織課程和技能方面成績突出的活躍學生,定期以團體形式開展課程答疑和技能提升培訓;再動員鼓勵團體內(nèi)同學輪流進行知識講解或心得分享,不斷提升社交能力。生活方面,鼓勵活躍度較高學生擔任生活指導室助理或雪絨花使者(班級心理委員),組織開展貼近學生生活的心理培訓活動。如通過箱庭或沙盤等趣味手段有效輔導,依托瑜伽或舞蹈等放松運動療愈心理,借助彩繪或手工等文化活動促進交流,全面引導同學們彼此理解溝通,相互汲取學習,共同成長進步。第二,形成社會實踐和志愿服務的朋輩引領線。調(diào)動發(fā)揮活躍度較高學生良好的實踐活動參與度和人際交往能力,組織帶動和積極影響更多的學生加入其中,充分發(fā)揮朋輩引領的作用。首先強化愛國情懷,積極組織“凝聚式”學生參與如北京2022年冬奧會等重大活動的志愿服務,并引導其凝練總結重大志愿服務活動的寶貴思想財富,讓學生們成為“思政課”的宣講員,用朋輩的力量帶動的更多的青年學子感受家國脈動,肩負青年擔當。第二,鼓勵其踐行學校重大戰(zhàn)略,進而引導更多同學到西部基層開展志愿服務工作,在基層調(diào)研與鄉(xiāng)村支教等實踐中,提升社會交往能力和個人綜合素質(zhì),助力鄉(xiāng)村基礎教育高質(zhì)量發(fā)展,到祖國需要的地方建功立業(yè)。第三,立足專業(yè)特色,激發(fā)同學們成立實踐小組及學以致用的熱情,帶頭引領同學們參與專業(yè)課程、科研項目和實踐學習,不斷把專業(yè)知識運用到社會實踐中,形成“理論學習—社會實踐—提升能力—解決問題—理論升華”的良性循環(huán)。最終形成社會實踐和志愿服務的朋輩引領線,帶領更多青年學子在社會實踐中深刻了解國情、樹立遠大理想、練就過硬本領、錘煉品德修為。
依托數(shù)據(jù)挖掘分析結果,在抓好活躍度高低“頭尾”群體的同時,立足活躍度處于中間水平的主體學生,著力搭建人際交往平臺,組織開展全方位、多層次的心理發(fā)展類和個人成長類集體活動,不斷擴展人際交往環(huán)境面。在心理發(fā)展方面,以日常生活的宿舍“小單元”為對象,開展宿舍文化團體建設活動,并舉行宿舍人際交往技巧培訓,引導學生認識人際溝通的重要性,初步掌握溝通的核心原則,學會解決人際關系沖突等問題的實用技巧,感受在宿舍中與他人互動的聯(lián)接感、歸屬感和幸福感。再以黨團班級建設活動為載體,加強學生個人與團體間的交流,不斷強化推己及人、將心比心等提高人際交往的意識,助力大學生自覺摒棄自我中心主義,建立和諧友愛、合作競爭的良好人際關系。在個人成長方面,圍繞“文、體、美、勞”等開展以增進交往為目標的主題活動;依托優(yōu)秀傳統(tǒng)文化學習、非物質(zhì)文化遺產(chǎn)參觀、名家畫作或名曲劇目賞析等陶冶學生情操,加強鑒賞交流;組織球類比賽或健身鍛煉等集體運動,增進同學友誼,引導溝通合作,強化集體歸屬;帶領學生參與到花草種植或衛(wèi)生執(zhí)勤等校園勞動中來,在相互交流與幫助中了解勞動教育的實際意義。最終,通過擴展上述多維、多元和多層的長效人際交往環(huán)境面,全面提高高校學生的社會交往能力,助力大學生成長為立大志、明大德、成大才、擔大任的新時代青年。