朱 珠 李萌欣 代秀云 陳 娟 梁皓東 楊 禎 劉守印
(1 華中師范大學(xué)物理科學(xué)與技術(shù)學(xué)院,武漢 430079)
(2 華中師范大學(xué)招生與就業(yè)工作處,武漢 430079)
(3 華中師范大學(xué)本科生院,武漢 430079)
(4 華中師范大學(xué)經(jīng)濟與工商管理學(xué)院,武漢 430079)
(5 中南財經(jīng)政法大學(xué)金融學(xué)院,武漢 430073)
自我控制是個體克服自身的欲望或需求,用一種符合自身發(fā)展目標(biāo)或社會標(biāo)準(zhǔn)的行為方式替代另一種固有的或者習(xí)慣的行為方式的過程(譚樹華,郭永玉,2008a)。研究表明,自我控制能力(以下簡稱自控力)是人類最強有力的、讓自身獲益最大的能力之一(于國慶,2004),是個體適應(yīng)社會、達(dá)成人生目標(biāo)的一項重要能力(Cheung et al., 2014)。自控力強的人,往往擁有良好的學(xué)習(xí)適應(yīng)能力、滿意的人際關(guān)系和健康的身體與心理,在學(xué)習(xí)和工作中也更容易取得好的成績(Glassman et al., 2007)。而較差的自控力更容易引起各類個人問題和社會問題的發(fā)生(尚夕瓊,2019),輕則導(dǎo)致學(xué)業(yè)無法順利完成,重則可能出現(xiàn)酒駕、賭博等惡性事件。因此,保持良好的自控力十分重要。
相比于成年人,學(xué)生特別是即將踏入社會的大學(xué)生,正處于成長的關(guān)鍵時期,自控力對其更為重要(張慧妍,2019)。大學(xué)生可自由支配的時間較多,具有更大的自主性(余友情,2016)。正確的教育指導(dǎo)能夠幫助他們提升自控力,養(yǎng)成良好的行為習(xí)慣(李琳等,2015),而合理的教育指導(dǎo)需要自控力評價的支撐。評價結(jié)果不僅能夠幫助教育工作者更加全面地了解學(xué)生,也能夠幫助學(xué)生加強自我認(rèn)知,更有針對性地提升自控力,促進自身全面發(fā)展。
目前,心理學(xué)領(lǐng)域?qū)ψ钥亓Φ臏y量主要有任務(wù)實驗方法和量表方法(梁獻丹,2018)。任務(wù)實驗方法要求被試者在特定的環(huán)境中執(zhí)行某項任務(wù),由專業(yè)人員全程觀察,并根據(jù)執(zhí)行任務(wù)的過程和結(jié)果對被試者的自控力做出評價。該方法測量結(jié)果可靠,但執(zhí)行過程費時費力,也不能大面積展開調(diào)查,只能局限于少量人員(管健,2014)。量表方法是由測試對象自己填寫公認(rèn)的標(biāo)準(zhǔn)化問卷,根據(jù)問卷的回答結(jié)果得出自控力的評分。據(jù)統(tǒng)計,用于自控力測量的量表多達(dá)一百多份,最早可追溯到1975年Fagen等人發(fā)表的自控行為記錄表。但大多研究不夠全面,1994年Baumeister等(1996)提出有限自控力理論,2004年Tangney等(2004)結(jié)合了近十年自我控制領(lǐng)域的研究成果,發(fā)表了新的自我控制量表,這是目前國際上使用最廣泛的自控力量表。2008年譚樹華(譚樹華,郭永玉,2008b)將Tangney版的自我控制量表針對中國大學(xué)生的特點進行了修訂,可作為測量我國大學(xué)生自我控制能力的工具。量表方法可同時測評大量被試者,但測量結(jié)果的置信度會受到測試對象的記憶和主觀意識的影響(蘇悅等,2021),也不能在時間粒度上細(xì)致分析測試對象的自控力。
針對心理學(xué)傳統(tǒng)測量方法的不足,心理信息學(xué)為自控力的評價提供了新思路、新方法。心理信息學(xué)是Yarkoni在2012年正式提出的一門新興交叉學(xué)科,核心思想是使用計算機和信息科學(xué)的工具和技術(shù)來改進心理數(shù)據(jù)的獲取、組織和合成。Markowetz(2014)強調(diào)在大數(shù)據(jù)時代,心理信息學(xué)是一個獨立的研究方向,它將計算機科學(xué)的技術(shù)應(yīng)用到心理學(xué)中,可以克服傳統(tǒng)測量方法收集的數(shù)據(jù)量小、數(shù)據(jù)質(zhì)量不高、耗費人力物力、時間粒度粗等弊端,適應(yīng)進行大規(guī)模的人類行為研究。
近年來,隨著校園信息化的建設(shè),學(xué)生在校園內(nèi)的各種行為被記錄下來,形成了自然環(huán)境下豐富的行為數(shù)據(jù),如一卡通系統(tǒng)中記錄了學(xué)生的食堂消費、超市購物、圖書借閱等行為數(shù)據(jù),校園網(wǎng)系統(tǒng)中記錄了學(xué)生的網(wǎng)絡(luò)使用行為數(shù)據(jù)。這些數(shù)據(jù)完整記錄了行為事件發(fā)生的時間、位置和過程等信息,為大學(xué)生的心理測量提供了新的數(shù)據(jù)資源和研究途徑(蘇悅等,2021)。許多研究已證明,學(xué)生在校園內(nèi)的行為數(shù)據(jù)蘊含了大量的心理學(xué)含義,是了解學(xué)生人格、認(rèn)知、心理健康狀況等的新途徑。
吳一帆(2018)使用學(xué)生一卡通刷卡數(shù)據(jù),量化評價大學(xué)生的成就性和嚴(yán)謹(jǐn)性,其中成就性和嚴(yán)謹(jǐn)性是大五人格理論中盡責(zé)性的細(xì)分特質(zhì),量化結(jié)果與學(xué)分績的斯皮爾曼等級相關(guān)系數(shù)在0.2左右。Mengyu Zhou等人(2016)提出了教育測量系統(tǒng)(EDUM),通過從校園無線網(wǎng)絡(luò)收集的數(shù)據(jù)來描述大學(xué)生的準(zhǔn)時性,發(fā)現(xiàn)在準(zhǔn)時性上表現(xiàn)良好的學(xué)生往往學(xué)習(xí)成績也比較好。羅煒敏(2019)利用學(xué)生在校園內(nèi)的一卡通刷卡數(shù)據(jù)提取了學(xué)生的飲食規(guī)律性、圖書館學(xué)習(xí)規(guī)律性、朋友數(shù)量等動態(tài)特征,并以此構(gòu)建了大學(xué)生抑郁程度預(yù)測模型,抑郁二分類模型的F1值可以達(dá)到0.9左右。以上研究表明,利用學(xué)生在校園內(nèi)的行為數(shù)據(jù)建立心理特質(zhì)的評價模型具有可行性,并且已有學(xué)者通過Facebook上發(fā)布的帖子構(gòu)建模型量化評價用戶的自控力(He et al., 2014),說明自控力可以在行為數(shù)據(jù)中得到體現(xiàn)。
深度學(xué)習(xí)是機器學(xué)習(xí)的一種形式,也被稱為深度神經(jīng)網(wǎng)絡(luò)或深度神經(jīng)學(xué)習(xí),它能夠?qū)?shù)據(jù)中深層次的、抽象的特征提取出來,使得網(wǎng)絡(luò)模型的預(yù)測性更準(zhǔn)確。長短時記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)是Hochreater和Schmidhuber在1997年提出的一種深度學(xué)習(xí)模型,專門用來處理序列數(shù)據(jù)的特征提取,已在自然語言處理、股票指數(shù)預(yù)測等方面取得良好的效果。近來,LSTM已被應(yīng)用到一卡通行為數(shù)據(jù)的研究中,如韓澤峰(2020)基于LSTM提出了Consume2Vec模型,以此提取學(xué)生行為數(shù)據(jù)中蘊含的時序特征,在消費金額和消費時間的預(yù)測任務(wù)上準(zhǔn)確率分別為64.41%和55.74%,明顯優(yōu)于隨機森林、決策樹等,說明LSTM在處理一卡通行為數(shù)據(jù)方面有獨特的優(yōu)勢。
綜上所述,本文以大學(xué)生在校園內(nèi)的一卡通刷卡數(shù)據(jù)作為數(shù)據(jù)源,通過深度學(xué)習(xí)提取特征,構(gòu)建一種自控力測量模型,量化評價大學(xué)生的自控力。該測量方法與任務(wù)實驗和量表方法相比,主要有以下優(yōu)勢:第一,相比任務(wù)實驗測量方法,該方法可以擺脫對實驗室的依賴,進行大規(guī)模的調(diào)查與研究;第二,相比量表的測量方法,該方法可以避免與學(xué)生之間的互動,消除測試對象的主觀意識影響,測量結(jié)果置信度更高;第三,該方法能夠跟蹤分析測試對象在某一時間段內(nèi)的行為,從而研究大學(xué)生自控力的動態(tài)變化。
本文采集的數(shù)據(jù)包括學(xué)生行為數(shù)據(jù)和大學(xué)生自我控制量表測試數(shù)據(jù)兩類,其中學(xué)生行為數(shù)據(jù)作為數(shù)據(jù)源,量表數(shù)據(jù)作為訓(xùn)練模型的標(biāo)簽。
本文采集的學(xué)生行為數(shù)據(jù)為我國某“211”工程重點師范大學(xué)兩個學(xué)院大一和大二學(xué)生的一卡通消費數(shù)據(jù)和圖書館門禁數(shù)據(jù),數(shù)據(jù)時間段為2020~2021學(xué)年第一學(xué)期,即2020年9月1日至2021年1月17日。獲取數(shù)據(jù)過程嚴(yán)格遵守保護學(xué)生隱私的規(guī)章制度,通過專人和專用設(shè)備獲取數(shù)據(jù),不泄露給研究無關(guān)人員。具體數(shù)據(jù)情況如表1所示。
一卡通消費數(shù)據(jù)主要包括學(xué)號、消費金額、消費時間、消費地點等字段,其中消費地點除了包括學(xué)校內(nèi)的各個食堂、超市、便利店等,還包括校醫(yī)院、藥店、校車、乒羽中心。乒羽中心是校內(nèi)建設(shè)的室內(nèi)羽毛球和乒乓球場地。圖書館門禁數(shù)據(jù)主要包括學(xué)號和進入圖書館的時刻兩個字段。
選取某高校1218名大一和大二學(xué)生,以宿舍為單位進行問卷調(diào)查,問卷發(fā)放形式為紙質(zhì)問卷。在填寫量表之前,調(diào)查人員和被試者詳細(xì)說明了量表的使用方法和調(diào)查目的,盡可能保證量表結(jié)果的可靠性。共回收有效問卷880份,其中大一學(xué)生445份,占50.57%;大二學(xué)生435份,占49.43%。
采用譚樹華2008年修訂的大學(xué)生自我控制量表進行測量。該量表包括五個維度:沖動控制、健康習(xí)慣、抵制誘惑、專注工作和節(jié)制娛樂,共19個條目,其中1、5、11、14正向計分,其余反向計分。采用5點計分,從“完全符合”到“完全不符合”分別為5分、4分、3分、2分和1分,得分越高代表自控力越強。在本研究中,該量表的信度為0.85。
880份有效問卷對應(yīng)的學(xué)生中有864名學(xué)生的刷卡次數(shù)達(dá)到統(tǒng)計要求,因此共有864個有效樣本可作為標(biāo)簽使用。864個有效樣本的自控量表總得分和各個維度得分的統(tǒng)計描述如表2所示,自控總得分的均值為60,方差為106.58。
表2 自控量表得分統(tǒng)計描述
人工特征選取和特征提取容易遺漏和忽略數(shù)據(jù)的部分重要信息。同時學(xué)生行為活動之間具有時序特征,因為學(xué)生的刷卡行為是在時間軸上依次發(fā)生的,行為與行為之間必然存在著前后時序關(guān)系(韓澤峰等,2020)。因此,使用深度學(xué)習(xí)中處理序列數(shù)據(jù)的LSTM模型對學(xué)生行為數(shù)據(jù)進行特征提取。
學(xué)生行為原始數(shù)據(jù)無法直接作為LSTM模型的輸入,需要進行編碼表示,其中最常用的編碼方式是獨熱編碼(OneHot)(李文杰,2019)。OneHot編碼是將類別變量轉(zhuǎn)化為算法模型易于利用的形式的過程,具體方式是將某種變量的M種狀態(tài)映射為M位二進制向量,每種狀態(tài)對應(yīng)二進制向量的其中一位為“1”,并且在任意狀態(tài)有且只有一位為“1”。
消費數(shù)據(jù)中的有效信息有消費時間、消費地點和消費金額,圖書館門禁數(shù)據(jù)與消費數(shù)據(jù)相比省略了地點和消費金額。首先對消費數(shù)據(jù)進行編碼。假設(shè)學(xué)生i在一段時間內(nèi)的所有消費記錄集合為ci:
(1)
(2)
消費時間。學(xué)校課程是按周安排的,學(xué)生上課休息是以天為單位循環(huán)的,因此學(xué)生行為將以周或者天為周期,具有一定的規(guī)律性。為了模型能夠挖掘出這種規(guī)律,本文將時間分別映射成星期和小時的OneHot向量,星期為7維向量,小時為24維向量。
消費地點。經(jīng)地點整合之后,共統(tǒng)計出25個刷卡地點,包括餐廳、超市、飲料店、藥房、乒羽中心、校車和校醫(yī)院,因此將地點映射為25維的OneHot向量。
消費金額。經(jīng)統(tǒng)計,學(xué)生消費金額分布在0.2~128元之間,消費在1~14元的記錄占90.86%,因此將[1,14]按每1元劃分不同區(qū)間,(14,20]劃分一個區(qū)間,(20,40]按每10元劃分不同區(qū)間,小于1元和大于40元各劃分一個區(qū)間,最后將消費金額映射為一個18維的OneHot向量。
然后對圖書館門禁數(shù)據(jù)進行編碼。門禁數(shù)據(jù)的關(guān)鍵信息只有進入圖書館的時間,因此只需要對時間進行OneHot編碼。假設(shè)學(xué)生i在一段時間內(nèi)的所有進入圖書館的刷卡記錄集合為li:
(3)
(4)
綜上,將每個學(xué)生的每條刷卡記錄以O(shè)neHot編碼形式映射到了一個高維空間,得到了每個學(xué)生的刷卡記錄集合,作為后續(xù)深度學(xué)習(xí)模型的輸入。
首先將原始刷卡數(shù)據(jù)按照OneHot編碼,得到集合ci和li。但學(xué)生刷卡次數(shù)不一致,因此還需要對數(shù)據(jù)進行對齊處理。本文采用的對齊方式是以刷卡次數(shù)最多的學(xué)生為標(biāo)準(zhǔn),在刷卡次數(shù)不足的學(xué)生數(shù)據(jù)后填充“-1”。假設(shè)消費數(shù)據(jù)和門禁數(shù)據(jù)最長記錄數(shù)分別為n和m,ci和li經(jīng)數(shù)據(jù)對齊后得到矩陣表示Ci和Li,Ci如公式(5)所示,每一行長度為74。Li與之類似,每一行均代表一條刷卡記錄,長度為31。
(5)
自控力評價模型結(jié)構(gòu)如圖1所示,包括Masking層、LSTM、隱藏層、回歸模塊等,以學(xué)生的每條刷卡記錄作為輸入。
圖1 基于LSTM的自控力評價模型
輸入層為Masking層,其作用是屏蔽對齊數(shù)據(jù)而添加的“-1”。用LSTM模型從消費數(shù)據(jù)和圖書館門禁數(shù)據(jù)中提取與自控力相關(guān)的時序特征,同時還采用dropout策略,防止模型過擬合,提高模型泛化能力。Ci和Li經(jīng)過LSTM模型之后得到隱層表示向量,記為Hci和Hli:
(6)
(7)
Hci和Hli經(jīng)過隱藏層后分別得到消費數(shù)據(jù)特征向量hci和圖書館門禁數(shù)據(jù)特征向量hli,再將兩者拼接在一起,得到hi:
hi=Concatenate(hci,hli)
(8)
該模型為有監(jiān)督學(xué)習(xí)模型,將大學(xué)生自我控制量表的自控總得分和各個維度的得分作為訓(xùn)練模型的標(biāo)簽,hi即學(xué)生的自控力特征向量,將hi分別輸入不同的全連接層,可生成對學(xué)生自控總得分和各個維度得分的預(yù)測值。其中,模型的優(yōu)化方法選用Adam(Adaptive Moments),全連接層的損失函數(shù)選用均方誤差(Mean-Square Error,MSE):
(9)
其中N為觀測樣本的個數(shù),yi為因變量y的第i個觀測值,f(xi)為回歸模型的預(yù)測值。
模型訓(xùn)練期間,批處理大小設(shè)為64,最大迭代次數(shù)設(shè)為200,使用正則化方法防止過擬合,并采用前終止策略,既可以節(jié)省訓(xùn)練時間,防止模型后期在訓(xùn)練集上出現(xiàn)過擬合的問題,也能夠?qū)⒃隍炞C集上泛化性能最好的模型保存下來。
將864個有效樣本按照7∶2∶1的比例劃分為訓(xùn)練集、測試集和驗證集。在模型訓(xùn)練中,本文嘗試過兩層或三層LSTM堆疊,但是發(fā)現(xiàn)一層LSTM即可達(dá)到較好的效果;關(guān)于內(nèi)部隱藏節(jié)點大小,本文嘗試過32、64、128和256,發(fā)現(xiàn)設(shè)為64效果最好;因此最終選用一層LSTM,內(nèi)部隱藏節(jié)點設(shè)為64。模型預(yù)測結(jié)果與多項式回歸、SVR回歸和RNN模型進行對比分析,自控總得分預(yù)測的分析結(jié)果如表3所示。
表3 模型預(yù)測自控總得分結(jié)果對比分析
r是皮爾遜相關(guān)系數(shù),表示模型的預(yù)測結(jié)果與量表結(jié)果之間的相關(guān)程度,該值越大表示建模效果越好;決定系數(shù)R2表示模型解釋因變量變化的程度,值越大表示模型擬合的效果越好;均方誤差MSE表示模型的計算結(jié)果和量表結(jié)果之差平方的期望值,該值越小說明預(yù)測模型描述實驗數(shù)據(jù)具有更好的精確度。從表4可以看出RNN模型和本文提出的模型在自控總得分預(yù)測任務(wù)上效果明顯優(yōu)于多項式回歸和SVR回歸;本文的模型在三個評價指標(biāo)上的預(yù)測效果都是最好的,說明LSTM模型在處理時序數(shù)據(jù)上有明顯的優(yōu)勢;基于LSTM模型的預(yù)測結(jié)果與量表結(jié)果的相關(guān)系數(shù)r為0.66,呈中高度相關(guān),決定系數(shù)R2為0.41,均方誤差MSE為54.16,說明該模型對自控力總得分的預(yù)測較為有效。
使用本文的模型對量表五個維度上的得分進行預(yù)測,結(jié)果如表4所示,預(yù)測得分與真實得分的相關(guān)系數(shù)均高于0.5,最小為0.58;決定系數(shù)R2均高于0.3,最小為0.33,說明該模型對每個維度得分的擬合效果也比較好。其中健康習(xí)慣維度的擬合效果最好,預(yù)測值與真實值的相關(guān)程度可以達(dá)到0.71,說明學(xué)生的“健康習(xí)慣”更能從平時在校的行為中反映出來。
表4 模型預(yù)測結(jié)果
大學(xué)生正處于成長階段的關(guān)鍵時期,自控力對其更為重要。因為大學(xué)的學(xué)習(xí)氛圍和生活環(huán)境都比較輕松,大學(xué)生可以獨自支配自己的大多數(shù)時間,具有更大的自主性。如果能夠合理地教育、引導(dǎo)、培養(yǎng)學(xué)生具有良好的自控力,則能夠很大程度上幫助學(xué)生養(yǎng)成良好的行為習(xí)慣,使其在面對互聯(lián)網(wǎng)等各種誘惑時始終保持清醒頭腦,意識上克服自身的惰性,行動上合理支配個人時間,對新興的信息技術(shù)加以利用,不斷提升自己的知識理論水平和實踐操作能力,促進自身向好發(fā)展。因此可以使用本文提出的基于LSTM的自控力評價模型幫助高校教育管理者及時發(fā)現(xiàn)自控力薄弱的學(xué)生,有針對性地對其加以引導(dǎo)和督促。
使用本文提出的模型在某學(xué)院2020級學(xué)生中進行自控力評價,該年級共370人,行為數(shù)據(jù)采集時間段為2020年9月1日至2021年1月17日,即大一上學(xué)期。自控力總得分整體分布情況如圖2所示。自控力總得分滿分為95分,其中60~69分?jǐn)?shù)段的人最多,占全年級的48.9%;大于70分的學(xué)生人數(shù)為23,僅占全年級的6.2%。說明該學(xué)院2020級學(xué)生的整體自控力呈中等水平,自控力良好的學(xué)生占比較小,大多數(shù)學(xué)生自控力一般。值得注意的是,還有15人的自控總得分低于50分,說明這15人的自控力較差,是輔導(dǎo)員應(yīng)該重點關(guān)注的對象。
圖2 自控總得分分布柱狀圖
自控總得分低于50分的15名學(xué)生具體行為表現(xiàn)如表5所示,其中消費水平是學(xué)生在校內(nèi)每次刷卡消費的均值;活動熵描述的是學(xué)生在?;顒訒r空規(guī)律性的程度,取值范圍為[0,1],活動熵值越低,代表學(xué)生的在校行為時空規(guī)律性越強(任晉華,2018)。從表中可以看出,這15名學(xué)生的早餐次數(shù)均小于均值,且有9名學(xué)生的早餐次數(shù)不足10次,最少的僅為1次;消費水平明顯高于平均消費水平;圖書館次數(shù)均小于平均值,且有4人圖書館次數(shù)為0;有5人的活動熵高于平均水平。說明自控力差的學(xué)生在行為上會表現(xiàn)出不愛吃早餐和去圖書館、消費水平偏高、行為時空規(guī)律性不強的特點。本文提出的自控力評價模型能夠發(fā)現(xiàn)這些學(xué)生,提醒高校教育管理者對其給予關(guān)注和督促。
表5 低于50分學(xué)生具體行為表現(xiàn)
同時,根據(jù)模型給出的每個學(xué)生在沖動控制、健康習(xí)慣、抵制誘惑、專注工作和節(jié)制娛樂五個維度的得分,可以畫出五維雷達(dá)圖,由于每個維度滿分不一致,這里先將得分標(biāo)準(zhǔn)化,滿分都設(shè)置為5分。如圖3所示,是表5中學(xué)生14的五維雷達(dá)圖,實線是該年級學(xué)生的平均水平,帶點虛線是學(xué)生14在各個維度的表現(xiàn),可以看出該學(xué)生在健康習(xí)慣和沖動控制維度表現(xiàn)趨于中等水平,但專注工作和節(jié)制娛樂維度表現(xiàn)較差。根據(jù)此雷達(dá)圖,可以幫助教育管理者發(fā)現(xiàn)學(xué)生出現(xiàn)問題的具體表現(xiàn),有針對性地對其加以引導(dǎo),從而促進學(xué)生全面發(fā)展。
圖3 個體五維雷達(dá)圖
本文旨在利用大學(xué)生在校園內(nèi)的行為數(shù)據(jù),構(gòu)建一種無感知的自控力評價模型,從而能夠?qū)W(xué)生群體進行大規(guī)模的研究與調(diào)查。通過研究發(fā)現(xiàn),以學(xué)生在校園內(nèi)的行為數(shù)據(jù)為數(shù)據(jù)源建立的自控力評價模型,不僅能夠較為有效地測量學(xué)生的自控力總得分和各個維度的得分,而且可以克服傳統(tǒng)的任務(wù)實驗法和量表法的弊端,避免了與學(xué)生之間的互動,還能夠?qū)崟r跟蹤學(xué)生的行為,動態(tài)分析學(xué)生的自控力變化。
本文提出的自控力評價方法是將數(shù)據(jù)科學(xué)與心理學(xué)結(jié)合的一次嘗試,為研究者細(xì)致分析個體的自控力提供了一種新的工具。在未來,大數(shù)據(jù)與心理特質(zhì)研究的結(jié)合可能會成為一種重要方法。研究者可利用行為數(shù)據(jù)與深度學(xué)習(xí)模型對其他心理特質(zhì)展開研究。