宛楠 張義 楊利
摘要:隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)在各個(gè)學(xué)科領(lǐng)域都有了普遍的應(yīng)用。在大數(shù)據(jù)視角下對(duì)大學(xué)生社會(huì)性行為進(jìn)行研究,再以數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)分析層、特征發(fā)現(xiàn)層、應(yīng)用層五個(gè)層次構(gòu)建大學(xué)社會(huì)性發(fā)展的促進(jìn)模式,可以有效促進(jìn)大學(xué)生社會(huì)性發(fā)展,培養(yǎng)能適應(yīng)社會(huì)發(fā)展需要的人才。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);大學(xué)生;社會(huì)性發(fā)展;促進(jìn)模式
1 概述
大學(xué)生社會(huì)性發(fā)展是指大學(xué)生通過(guò)自身努力和外界環(huán)境的輔助,在人際交往和社會(huì)互動(dòng)過(guò)程中形成社會(huì)規(guī)范、掌握社會(huì)技能、學(xué)習(xí)社會(huì)角色、控制自身行為、協(xié)調(diào)人際關(guān)系、適應(yīng)社會(huì)現(xiàn)實(shí)和發(fā)展要求、形成符合社會(huì)發(fā)展方向的價(jià)值觀(guān)、傳承主流文化的復(fù)雜過(guò)程[1]。隨著大數(shù)據(jù)時(shí)代的到來(lái),相關(guān)大數(shù)據(jù)技術(shù)已融合到科技、醫(yī)療、教育、商業(yè)以及每個(gè)人生活的各個(gè)方面,并發(fā)揮著積極作用[2]。本文在大數(shù)據(jù)視角下對(duì)大學(xué)生社會(huì)性行為進(jìn)行研究,再以數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)分析層、特征發(fā)現(xiàn)層、應(yīng)用層五個(gè)層次構(gòu)建大學(xué)生社會(huì)性發(fā)展的促進(jìn)模式,旨在運(yùn)用大數(shù)據(jù)技術(shù),實(shí)時(shí)掌握并動(dòng)態(tài)跟蹤大學(xué)生的心理和日常社交行為,促進(jìn)大學(xué)生的社會(huì)性發(fā)展,培養(yǎng)能適應(yīng)社會(huì)發(fā)展需要的人才。
2 大學(xué)生社會(huì)性行為的數(shù)據(jù)處理與分析
大學(xué)生的社會(huì)性行為,指的是大學(xué)生在社會(huì)交往過(guò)程中所表現(xiàn)出的對(duì)某一事件或人物的觀(guān)點(diǎn)、語(yǔ)言和行為反應(yīng)。社會(huì)性發(fā)展存在欠缺的大學(xué)生往往表現(xiàn)出較差的獨(dú)立性,生活自理能力有限,對(duì)社會(huì)事務(wù)不關(guān)心,自控能力不強(qiáng),人際交往存在障礙等特點(diǎn)[3]。大學(xué)生的日常學(xué)習(xí)和生活中大量接觸互聯(lián)網(wǎng)絡(luò)、移動(dòng)終端,在網(wǎng)絡(luò)上留下的痕跡會(huì)產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)是動(dòng)態(tài)、多樣化和離散的,將這些數(shù)據(jù)記錄保存下來(lái)可以用于探究學(xué)生在網(wǎng)絡(luò)上的社會(huì)性行為背后的相關(guān)心理因素。本文運(yùn)用大數(shù)據(jù)技術(shù)去對(duì)學(xué)生在互聯(lián)網(wǎng)絡(luò)和移動(dòng)終端設(shè)備上的各種社會(huì)性行為進(jìn)行數(shù)據(jù)采集、數(shù)據(jù)分析、數(shù)據(jù)挖掘,從以下四個(gè)方面去進(jìn)行研究。
2.1大學(xué)生社會(huì)性行為的數(shù)據(jù)采集
1)數(shù)據(jù)采集技術(shù)支持
網(wǎng)絡(luò)爬蟲(chóng)是目前進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)采集的有效手段之一,其主要目的是采集互聯(lián)網(wǎng)上的網(wǎng)頁(yè)數(shù)據(jù),并將其下載到本地存儲(chǔ)單元以備數(shù)據(jù)分析使用。
高校學(xué)生在校內(nèi)上網(wǎng)多數(shù)是通過(guò)校內(nèi)VPN接入,網(wǎng)頁(yè)瀏覽和操作過(guò)程中會(huì)留下大量的網(wǎng)頁(yè)數(shù)據(jù),運(yùn)用爬蟲(chóng)技術(shù)及時(shí)采集這些數(shù)據(jù)可以實(shí)時(shí)掌握學(xué)生的心理和行為動(dòng)態(tài),了解學(xué)生社會(huì)性發(fā)展的狀況。
2)日志收集
各個(gè)校園網(wǎng)絡(luò)教學(xué)平臺(tái)和信息管理系統(tǒng)在運(yùn)行過(guò)程中都會(huì)產(chǎn)生大量的日志,日志往往包含有很多有價(jià)值的信息。在可靠的分析方法出現(xiàn)之前,日志通常會(huì)在存儲(chǔ)一定時(shí)間后被自動(dòng)清除。隨著數(shù)據(jù)分析技術(shù)和能力的提高,日志的價(jià)值得到越來(lái)越多的重視。在分析日志之前,需要將分散在各個(gè)系統(tǒng)中的日志集中起來(lái)。本研究采用目前廣泛應(yīng)用的Flume日志收集系統(tǒng),收集學(xué)生在各個(gè)網(wǎng)絡(luò)平臺(tái)和信息管理系統(tǒng)中產(chǎn)生的日志,從中挖掘能表現(xiàn)社會(huì)性行為的數(shù)據(jù)。
2.2 大學(xué)生社會(huì)性行為的數(shù)據(jù)分析
大學(xué)生社會(huì)性行為是其社會(huì)性發(fā)展?fàn)顩r的一種外在體現(xiàn),往往受其心理狀況所支配。通過(guò)相關(guān)的數(shù)據(jù)采集技術(shù)可以獲取大量的個(gè)人或群體的行為原始數(shù)據(jù),但這些原始數(shù)據(jù)在未經(jīng)過(guò)處理前無(wú)法直接表現(xiàn)出大學(xué)生的行為特征,因此需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理。大數(shù)據(jù)的處理按時(shí)間的跨度分為以下幾類(lèi):
1)基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理
流處理是數(shù)據(jù)傳遞的方式之一,它將獲取的數(shù)據(jù)轉(zhuǎn)成一個(gè)穩(wěn)定而連續(xù)的流,持續(xù)的送至目的地。
2)基于歷史數(shù)據(jù)的交互式查詢(xún)
用戶(hù)在使用查詢(xún)系統(tǒng)時(shí),按需定義自己的查詢(xún)條件,交互式查詢(xún)往往用于在線(xiàn)查詢(xún)、實(shí)時(shí)數(shù)據(jù)分析以及信息反饋處理等。
3)復(fù)雜的批量數(shù)據(jù)處理
對(duì)收集的數(shù)據(jù)進(jìn)行大規(guī)模并行處理,多進(jìn)程、多線(xiàn)程開(kāi)展處理工作。
本研究結(jié)合這三種數(shù)據(jù)處理方式,對(duì)從網(wǎng)絡(luò)和系統(tǒng)收集的數(shù)據(jù)進(jìn)行分析處理,根據(jù)時(shí)間跨度的不同和技術(shù)的特點(diǎn)對(duì)不同的數(shù)據(jù)選擇相應(yīng)的處理方法,使各種數(shù)據(jù)都能得到有效的處理,從中提取出能體現(xiàn)學(xué)生社會(huì)性行為的特征,可以為研究社會(huì)性發(fā)展遲滯的因素和促進(jìn)社會(huì)性發(fā)展的途徑提供有價(jià)值的信息。
2.3 大學(xué)生社會(huì)性行為的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是指通過(guò)有效的算法自動(dòng)在數(shù)據(jù)庫(kù)中對(duì)有價(jià)值信息的發(fā)掘和尋找。此技術(shù)主要通過(guò)對(duì)大型數(shù)據(jù)庫(kù)的處理和分析,挖掘出未知的有價(jià)值的信息[4]。數(shù)據(jù)挖掘的源數(shù)據(jù)可以存放在諸如DB(Data Base)、DW(Data Warehouse)等信息庫(kù)中[5]。運(yùn)用數(shù)據(jù)挖掘研究大學(xué)生社會(huì)行為的思路是:利用數(shù)據(jù)采集大學(xué)生的客觀(guān)行為數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)的方法建立基于大數(shù)據(jù)的大學(xué)生社會(huì)性行為數(shù)據(jù)模型,深度挖掘能夠真實(shí)反映大學(xué)生社會(huì)性發(fā)展水平和影響因素的社會(huì)性行為特征。
3 構(gòu)建基于大數(shù)據(jù)技術(shù)的大學(xué)生社會(huì)性發(fā)展促進(jìn)模式
根據(jù)上文所述的相關(guān)技術(shù),本研究構(gòu)建的基于大數(shù)據(jù)結(jié)束的大學(xué)生社會(huì)性發(fā)展促進(jìn)模式,如圖2所示,總共分為五層,層層遞進(jìn),從網(wǎng)絡(luò)平臺(tái)對(duì)學(xué)生的基本信息、學(xué)習(xí)和社會(huì)交往等數(shù)據(jù)完成數(shù)據(jù)采集、數(shù)據(jù)處理,再通過(guò)數(shù)據(jù)挖掘和數(shù)據(jù)分析去挖掘和發(fā)現(xiàn)大學(xué)生社會(huì)性行為特征和心理特征,在此基礎(chǔ)上精準(zhǔn)分析大學(xué)生社會(huì)性發(fā)展的需求,制定大學(xué)生社會(huì)性發(fā)展的策略,干預(yù)大學(xué)生社會(huì)性發(fā)展遲滯,有效地促進(jìn)大學(xué)生人格、心理健康和社會(huì)關(guān)系的全面發(fā)展。
本模式的分層具體說(shuō)明如下。
1)數(shù)據(jù)采集層
數(shù)據(jù)采集層用于采集網(wǎng)絡(luò)平臺(tái)上大學(xué)生社會(huì)性發(fā)展相關(guān)的數(shù)據(jù),包括學(xué)生基本信息數(shù)據(jù)(比如性別、年齡、家庭結(jié)構(gòu)等)、學(xué)生在網(wǎng)絡(luò)平臺(tái)上學(xué)習(xí)產(chǎn)生的行為數(shù)據(jù)、學(xué)生在網(wǎng)絡(luò)上進(jìn)行社交互動(dòng)產(chǎn)生的數(shù)據(jù)。數(shù)據(jù)采集技術(shù)包括ETL離線(xiàn)采集、實(shí)時(shí)采集、互聯(lián)網(wǎng)采集等。
2)數(shù)據(jù)處理層
數(shù)據(jù)處理層包括數(shù)據(jù)清洗、數(shù)據(jù)整合、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)提取和數(shù)據(jù)維護(hù)等功能[6]。大學(xué)生存在于網(wǎng)絡(luò)平臺(tái)和信息系統(tǒng)內(nèi)的各種學(xué)習(xí)社交行為產(chǎn)生數(shù)據(jù)的類(lèi)型復(fù)雜多樣。在完成了數(shù)據(jù)采集之后,需要根據(jù)不同的數(shù)據(jù)處理場(chǎng)景要求選擇相應(yīng)的計(jì)算框架對(duì)數(shù)據(jù)進(jìn)行處理,主要目的是將原始數(shù)據(jù)加工轉(zhuǎn)化為有用和高質(zhì)量的信息。
3)數(shù)據(jù)分析層
數(shù)據(jù)分析層是整個(gè)模式架構(gòu)中的一個(gè)核心關(guān)鍵層。該層的重點(diǎn)在于建模與分析,采用的技術(shù)手段有數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等,利用探索性數(shù)據(jù)分析的方式得到更多大學(xué)生社會(huì)性發(fā)展的規(guī)律、知識(shí),對(duì)未來(lái)的大學(xué)生社會(huì)性發(fā)展趨勢(shì)和程度進(jìn)行預(yù)測(cè)和預(yù)判。
4)特征發(fā)現(xiàn)層
特征發(fā)現(xiàn)層是該體系架構(gòu)的另外一個(gè)核心層,分為行為特征發(fā)現(xiàn)以及心理特征發(fā)現(xiàn)。行為特征發(fā)現(xiàn)是指分析和理解大學(xué)生社會(huì)性行為中蘊(yùn)含的特征,包括社會(huì)性行為預(yù)測(cè)、社會(huì)性行為分析和社會(huì)性性行為監(jiān)控,實(shí)時(shí)掌握大學(xué)生社會(huì)性行為特征。心理特征發(fā)現(xiàn)是指了解和掌握學(xué)生社會(huì)性行為背后的心理特征,分析產(chǎn)生行為的成因,包括心理發(fā)展預(yù)測(cè)、心理特征分析、心理特征分類(lèi)聚集。
5)應(yīng)用層
應(yīng)用層是該模式結(jié)構(gòu)價(jià)值的直接體現(xiàn),旨在促進(jìn)大學(xué)生的社會(huì)性發(fā)展水平,它即包括促進(jìn)大學(xué)生社會(huì)性發(fā)展也包括大學(xué)生社會(huì)性發(fā)展的策略制定。
4 結(jié)論
大數(shù)據(jù)時(shí)代的變革已經(jīng)滲透到高等教育的各個(gè)研究領(lǐng)域。本文通過(guò)借鑒其他學(xué)科領(lǐng)域的大數(shù)據(jù)研究,將大數(shù)據(jù)技術(shù)緊密地與大學(xué)生社會(huì)性行為的數(shù)據(jù)采集、數(shù)據(jù)處理分析、特征發(fā)現(xiàn)和數(shù)據(jù)應(yīng)用緊密聯(lián)系,構(gòu)建基于大數(shù)據(jù)技術(shù)的大學(xué)生社會(huì)性發(fā)展促進(jìn)模式,推動(dòng)大學(xué)生的自我認(rèn)知發(fā)展和社會(huì)認(rèn)知發(fā)展,幫助構(gòu)建良好的社會(huì)性發(fā)展環(huán)境,從而達(dá)到促進(jìn)大學(xué)生社會(huì)性發(fā)展的研究目的。
參考文獻(xiàn):
[1] 巴雪冰. 思想政治教育視閾下大學(xué)生社會(huì)性發(fā)展研究[D]. 大連理工大學(xué),2019.
[2] 陳雷. 大數(shù)據(jù)對(duì)大學(xué)生心理健康教育工作提升作用研究[J]. 江蘇第二師范學(xué)院學(xué)報(bào),2018,34(6):112-115.
[3] 向松柏. 大學(xué)生社會(huì)性發(fā)展遲滯的成因及干預(yù)[J]. 綏化學(xué)院學(xué)報(bào),2015,35(4):154-160.
[4] 宗威, 吳鋒. 大數(shù)據(jù)時(shí)代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J]. 西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013,33(5):38-43.
[5] Jiawei Han, MIcheline Kamber, Jian Pei.數(shù)據(jù)挖掘:概念與技術(shù)[M]. 北京:機(jī)械工業(yè)出版社,2012.
[6] 顧云鋒,吳鐘鳴,管兆昶,等.基于教育大數(shù)據(jù)的學(xué)習(xí)分析研究綜述[J]. 中國(guó)教育信息化,2018(7):1-6.
【通聯(lián)編輯:王力】