摘" 要:在多樣的社會(huì)環(huán)境下,由于心理、生理、環(huán)境、學(xué)業(yè)、社會(huì)等多方面因素,導(dǎo)致學(xué)生壓力劇增。為了找到影響學(xué)生壓力的主要原因并解決學(xué)生壓力過大問題,文章選用了多方面因素影響學(xué)生壓力的數(shù)據(jù)集,利用Apriori算法研究了與學(xué)生壓力相關(guān)的多方面因素的影響情況,分析了不同因素與壓力的頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則,發(fā)現(xiàn)了焦慮問題、睡眠問題、環(huán)境安全、霸凌等問題對(duì)學(xué)生壓力影響較大。研究結(jié)果顯示,減輕學(xué)業(yè)壓力、抵制霸凌和改善學(xué)生生活環(huán)境有助于降低學(xué)生的壓力。
關(guān)鍵詞:學(xué)生壓力;Apriori算法;多元因素;關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP391" 文獻(xiàn)標(biāo)識(shí)碼:A" 文章編號(hào):2096-4706(2024)23-0048-06
Mining and Analysis of Multiple Factors of Student Stress Based on Apriori Algorithm
SHEN Yue1, ZHANG Yihan1, WANG Wanwan2
(1.School of Artificial Intelligence and Big Data, Henan University of Technology, Zhengzhou" 450001, China;
2.iFLYTEK Co., Ltd., Hefei" 230088, China)
Abstract: In a variety of social environments, due to psychological, physiological, environmental, academic, social and other factors, the student stress has increased dramatically. In order to find the main causes of student stress and solve the problem of excessive student stress, this paper selects the dataset of multiple factors affecting student stress, uses the Apriori algorithm to research the influence situation of multiple factors related to student stress, and analyzes the frequent item sets and association rules of different factors and stress, then finds that anxiety problems, sleep problems, environmental safety, bullying and other problems have a great impact on student stress. Research results show that reducing academic stress, resisting bullying and improving the living environment of students can help reduce student stress.
Keywords: student stress; Apriori algorithm; multiple factors; association rule
0" 引" 言
在當(dāng)今復(fù)雜多變的社會(huì)環(huán)境中,學(xué)生面臨著日益增長(zhǎng)的壓力,這些壓力不僅來源于學(xué)業(yè)上的高要求和激烈的教育競(jìng)爭(zhēng),還包括來自家庭、同伴以及社會(huì)環(huán)境等多方面的挑戰(zhàn)。研究顯示,長(zhǎng)期的心理壓力會(huì)影響睡眠、飲食等,極大降低學(xué)生對(duì)生活的積極性;同時(shí),在高壓力狀態(tài)下,學(xué)生容易感到疲憊和焦慮,注意力和專注力會(huì)下降,影響學(xué)習(xí)效果[1]。因此,如何有效緩解學(xué)生群體中普遍存在的壓力問題,已經(jīng)成為當(dāng)前教育科學(xué)研究及心理健康領(lǐng)域亟待解決的關(guān)鍵議題之一,探討影響學(xué)生壓力的多元因素已成為教育科學(xué)與心理健康領(lǐng)域的重要課題。
近年來,數(shù)據(jù)挖掘技術(shù)的發(fā)展為我們提供了強(qiáng)有力的工具,可用于深入分析和理解學(xué)生壓力的原因。Apriori算法作為一種廣泛應(yīng)用于關(guān)聯(lián)規(guī)則學(xué)習(xí)領(lǐng)域的經(jīng)典方法,在探索不同變量間潛在聯(lián)系方面展現(xiàn)出了巨大優(yōu)勢(shì)。吳萌[2]利用Apriori算法進(jìn)行監(jiān)獄警察心理健康調(diào)查得出:受工作內(nèi)容和工作環(huán)境影響,監(jiān)獄警察普遍存在“內(nèi)向、抑郁、焦慮、堅(jiān)強(qiáng)”的心理特征;劉統(tǒng)青等人[3]利用Apriori算法挖掘出中小學(xué)生心理健康中隱藏的信息,對(duì)引導(dǎo)中小學(xué)生心理健康有著重要的警示與教育意義。實(shí)驗(yàn)分析睡眠質(zhì)量、欺凌行為、社會(huì)環(huán)境等關(guān)鍵變量,能夠揭示這些因素如何相互作用,便于全面理解影響學(xué)生壓力的內(nèi)在機(jī)制。實(shí)驗(yàn)的研究成果將為教育工作者、心理健康專家和政策制定者提供有價(jià)值的參考,幫助他們采取更加有效的措施,為學(xué)生的心理健康和學(xué)業(yè)發(fā)展提供支持。
1" Apriori算法
關(guān)聯(lián)規(guī)則挖掘旨在發(fā)現(xiàn)海量數(shù)據(jù)集中項(xiàng)目之間的強(qiáng)有趣模式[4-5]。Apriori算法是一種迭代的逐層搜索方法,用于在數(shù)據(jù)庫(kù)中識(shí)別頻繁項(xiàng)集并生成關(guān)聯(lián)規(guī)則。首先,對(duì)數(shù)據(jù)庫(kù)進(jìn)行一次掃描,通過設(shè)定的支持度閾值,篩選出支持度超過該閾值的單個(gè)項(xiàng),形成頻繁1-項(xiàng)集L1。在第k次掃描(k>1)中,利用上一次得到的頻繁項(xiàng)集Lk-1生成候選k-項(xiàng)集Ck。然后,再次掃描數(shù)據(jù)庫(kù)計(jì)算候選項(xiàng)集Ck中每個(gè)項(xiàng)集的支持度,并篩選出滿足最低支持度閾值的項(xiàng)集,從而得到頻繁k-項(xiàng)集Lk。這個(gè)過程會(huì)重復(fù)進(jìn)行,直到生成的候選項(xiàng)集Ck為空。最后,對(duì)于每一個(gè)頻繁項(xiàng)集,生成可能的規(guī)則形式,計(jì)算每個(gè)規(guī)則的置信度,并過濾出置信度大于或等于設(shè)定閾值的規(guī)則,最終得出強(qiáng)關(guān)聯(lián)規(guī)則。算法流程如圖1所示。
相關(guān)參數(shù)的支持度計(jì)算公式為:
(1)
其中,count(x)表示包含項(xiàng)集x的交易數(shù)量,n表示總交易數(shù)量。
置信度是指在包含項(xiàng)集A的交易中,同時(shí)也包含項(xiàng)集B的交易比例,計(jì)算公式為:
(2)
2" Apriori算法在學(xué)生壓力多元因素中的應(yīng)用
2.1" 數(shù)據(jù)來源
本研究采用了1 000名學(xué)生的心理壓力數(shù)據(jù),數(shù)據(jù)主要分為五大類:心理因素、生理因素、環(huán)境因素、學(xué)術(shù)因素、社會(huì)因素。心理因素包括焦慮水平(AL)、自尊水平(SE)、心理健康病史(MH)、抑郁情況(DP);生理因素包括:頭痛問題(HA)、血壓?jiǎn)栴}(XY)、睡眠質(zhì)量(SM)、呼吸問題(HX);環(huán)境因素包括:環(huán)境噪音情況(ZY)、居住條件(LC)、環(huán)境安全情況(SF)、基本需求滿足情況(BN);學(xué)術(shù)因素:學(xué)業(yè)表現(xiàn)(AP)、學(xué)業(yè)負(fù)擔(dān)(SL)、師生關(guān)系(TSR)、未來職業(yè)擔(dān)憂(FC);社會(huì)因素:社會(huì)支持(SS)、同輩壓力(PP)、課外活動(dòng)(EA)、霸凌問題(BL),以及壓力水平(ST)屬性在內(nèi)的共21個(gè)屬性。圖2中展示了五種不同因素所包含的屬性及壓力水平的分布情況。
箱線圖是對(duì)數(shù)據(jù)進(jìn)行“壓縮”以后得到的,可以看到數(shù)據(jù)分布的大致形狀,也可以收集一組數(shù)據(jù)的四分位數(shù)、范圍和異常值等信息。箱線圖除了可以看到數(shù)據(jù)分布的大致形狀,還可以收集一組數(shù)據(jù)的四分位數(shù)、范圍和異常值等信息。從圖2不同因素所含屬性的箱線圖中可以看出,各屬性的數(shù)據(jù)大致集中在中間區(qū)域,極少出現(xiàn)極端數(shù)據(jù),這體現(xiàn)了數(shù)據(jù)的合理性和可靠性。此外,通過對(duì)1 000名學(xué)生的壓力水平分布地剖析,可以發(fā)現(xiàn)這些數(shù)據(jù)呈現(xiàn)均勻分布的特征,表明了數(shù)據(jù)調(diào)查的廣泛性和普及性,反映了研究樣本的多樣性和全面性。抽取原始數(shù)據(jù)主要指標(biāo)如表1所示。
2.2" 數(shù)據(jù)清洗與預(yù)處理
首先進(jìn)行數(shù)據(jù)規(guī)范化處理依據(jù)癥狀自評(píng)量表SCL9[6]對(duì)心理測(cè)試的標(biāo)準(zhǔn),本研究將部分屬性值按照區(qū)間劃分成五個(gè)類別,包括睡眠質(zhì)量(SM)、呼吸問題(HX)、環(huán)境噪音情況(ZY)、居住條件(LC)、環(huán)境安全情況(SF)、基本需求滿足情況(BN)、學(xué)業(yè)表現(xiàn)(AP)、學(xué)業(yè)負(fù)擔(dān)(SL)、師生關(guān)系(TSR)、未來職業(yè)擔(dān)憂(FC)、社會(huì)支持(SS)、同輩壓力(PP)、課外活動(dòng)(EA)、霸凌問題(BL)這14個(gè)屬性依照“0=從無”“1=很輕”“2=中等”“3和4=偏重”“5=嚴(yán)重”進(jìn)行分類;焦慮水平(AL)依照“0~4=輕度”“5~10=中輕度”“11~15=中度”“16~20=中高度”“21=嚴(yán)重”進(jìn)行分類;自尊水平(SE)依照“0~6=較低”“7~12=中低”“13~18=中等”“19~24=中高”“25~30=較高”進(jìn)行劃分;心理健康病史(MH)依照“0=無”“1=有”進(jìn)行劃分;抑郁情況(DP)依照“0~6=輕度”“7~12=中度”“13~18=中重度”“19~24=重度”“25~27=極重度”進(jìn)行劃分;頭痛問題(HA)依照“0=從無”“1=輕微”“2和3=中度”“4=較頻繁”“5=嚴(yán)重”進(jìn)行劃分;血壓?jiǎn)栴}(XY)依照“1=正常血壓”“2=輕度高血壓”“3=嚴(yán)重高血壓”進(jìn)行劃分;壓力水平(ST)依照“0=低壓力”“1=中度壓力”“2=嚴(yán)重壓力”進(jìn)行劃分。學(xué)生心理健康壓力調(diào)查表主要因素的描述如表2所示。
2.3" 數(shù)據(jù)的相關(guān)性
熱力圖是一種非常直觀且高效的可視化工具,用于展示相關(guān)系數(shù)矩陣中各變量之間的相關(guān)性強(qiáng)弱,它通過顏色的深淺變化來形象地表示相關(guān)性。具體來說,當(dāng)相關(guān)系數(shù)大于0時(shí),意味著兩個(gè)變量之間存在正相關(guān)關(guān)系,即一個(gè)變量的增加往往伴隨著另一個(gè)變量的增加;相反,如果相關(guān)系數(shù)小于0,則表明兩者之間存在負(fù)相關(guān)關(guān)系,即一個(gè)變量的增加通常會(huì)導(dǎo)致另一個(gè)變量的減少;而當(dāng)相關(guān)系數(shù)等于0時(shí),則說明這兩個(gè)變量之間沒有明顯的線性關(guān)系或者這種關(guān)系非常微弱。通過利用圖3相關(guān)性熱力分布圖,可以幫助我們理解和解釋復(fù)雜數(shù)據(jù)集中的多變量關(guān)系,而不局限于某些特定的變量組合。
從圖3中可以看出,壓力水平與焦慮水平、心理健康病史、抑郁情況、頭痛問題、環(huán)境噪音情況、未來職業(yè)擔(dān)憂、同輩壓力、課外活動(dòng)、霸凌問題之間呈現(xiàn)正相關(guān),且兩者之間的相關(guān)性高達(dá)0.65以上;壓力水平與自尊水平、睡眠質(zhì)量、環(huán)境安全情況、基本需求滿足情況、居住條件、學(xué)業(yè)表現(xiàn)、師生關(guān)系呈現(xiàn)負(fù)相關(guān),且負(fù)相關(guān)達(dá)到0.67以上。
通過對(duì)數(shù)據(jù)的分析,可以更好地理解心理健康問題的復(fù)雜性和多因素性質(zhì),有助于識(shí)別出那些可能面臨較高壓力水平的學(xué)生,而且還可以為制定針對(duì)性的干預(yù)措施提供依據(jù)。例如,通過改善居住條件、減輕學(xué)習(xí)負(fù)擔(dān)、提供社交支持等方式,可能有助于降低個(gè)體的壓力水平,進(jìn)而改善其整體心理健康狀況[8]。
2.4" 挖掘頻繁項(xiàng)集
在測(cè)試的學(xué)生中,約34%為低壓力狀態(tài),32.5%為中度壓力狀態(tài),33.5%為嚴(yán)重壓力狀態(tài)。頻繁項(xiàng)集是指支持度大于等于最小支持度(min_sup)的集合。其中支持度是指某個(gè)集合在所有事務(wù)中出現(xiàn)的頻率。為更好地反映影響學(xué)生壓力的因素,利用Apriori算法找出和學(xué)生壓力水平有關(guān)的頻繁項(xiàng)集。利用Apriori算法找出頻繁項(xiàng)集,如表4所示。
從表4的頻繁項(xiàng)集中可以看出:
在心理因素方面,嚴(yán)重焦慮、有過心理健康病史和嚴(yán)重壓力同時(shí)出現(xiàn)的概率高達(dá)19.2%,有極高自尊水平、沒有過心理健康病史和低壓力水平往往同時(shí)出現(xiàn);在生理因素方面,輕微睡眠問題、輕度高血壓以及輕度高血壓、中度的呼吸問題和嚴(yán)重壓力往往同時(shí)出現(xiàn);在環(huán)境因素方面,中度的環(huán)境安全問題、較差的居住條件以及較低的基本需求滿足情況往往會(huì)出現(xiàn)嚴(yán)重壓力,良好的居住條件和低壓力往往同時(shí)出現(xiàn);在學(xué)業(yè)因素方面,學(xué)業(yè)負(fù)擔(dān)較重往往與嚴(yán)重壓力同時(shí)出現(xiàn)的概率高達(dá)28.5%,對(duì)未來不存在擔(dān)憂與無壓力往往同時(shí)出現(xiàn);在社會(huì)因素方面,社會(huì)支持較低、適度的課外活動(dòng)與嚴(yán)重的壓力常常同時(shí)出現(xiàn),經(jīng)歷過偏重霸凌、社會(huì)支持度低與嚴(yán)重壓力往往同時(shí)出現(xiàn),輕度的霸凌問題與低心理壓力同時(shí)出現(xiàn)的概率較大。
通過頻繁項(xiàng)集,可以看出學(xué)生的心理壓力往往與心理焦慮、有過心理健康病史、睡眠問題、環(huán)境安全問題、基本需求滿足情況、對(duì)未來的擔(dān)憂、社會(huì)支持、霸凌問題等因素息息相關(guān)。
2.5" 挖掘關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則用來描述兩個(gè)或多個(gè)事物之間的關(guān)聯(lián)性,通過一件或多件事物來預(yù)測(cè)其他事物,可以從大量數(shù)據(jù)中獲取有價(jià)值的信息。一般地,給定一個(gè)數(shù)據(jù)庫(kù),挖掘關(guān)聯(lián)規(guī)則的問題可以轉(zhuǎn)換為尋找滿足最小支持度和最小置信度閾值的強(qiáng)關(guān)聯(lián)規(guī)則過程[9]。利用頻繁項(xiàng)集得出主要關(guān)聯(lián)規(guī)則如表5所示。
表5中列舉了心理、生理、社會(huì)、環(huán)境和學(xué)術(shù)五個(gè)不同方面與學(xué)生壓力之間的關(guān)聯(lián)規(guī)則,通過上表分析可知,MH1(有心理健康病史)和AL3(重度焦慮)、XY2(嚴(yán)重高血壓)和 SM1(差的睡眠)、AP1(學(xué)業(yè)表現(xiàn)低)、BL3(較大霸凌)和SS1(社會(huì)支持輕微),以上各情形均會(huì)有90%以上的可能導(dǎo)致嚴(yán)重壓力,是造成學(xué)生壓力主要影響因素;XY2(嚴(yán)重高血壓)和HX3(嚴(yán)重呼吸問題)、BN1(基本需求滿足低)、LC1(差的居住條件)、SF1(不安全)、 EA3(課外活動(dòng)較大)和SS1(社會(huì)支持輕微)等都有85%以上的可能導(dǎo)致ST2(嚴(yán)重壓力)。同時(shí),XY0(正常血壓)和HA2(中度頭痛)、FC2(未來職業(yè)適度擔(dān)憂)分別有100%和約84%可能會(huì)引起ST1(中等壓力);此外,SE4(較高自尊水平)和MH0(無心理健康病史)、BL1(輕度的霸凌問題)與ST0(輕微壓力)具有強(qiáng)關(guān)聯(lián)性,且置信度高達(dá)90%以上。
3" 結(jié)果分析
通過上述研究結(jié)果可以得出:
1)有心理健康病史的學(xué)生往往存在較高的焦慮水平,這種焦慮反過來可能導(dǎo)致更大的壓力;具有較高自尊水平的人往往會(huì)在面對(duì)壓力時(shí)表現(xiàn)出更好的應(yīng)對(duì)能力,而且這些個(gè)體通常沒有心理健康病史。為此,自尊心的提升可能是降低壓力和心理問題的重要方式;針對(duì)有心理健康病史和高焦慮水平的學(xué)生,可以設(shè)計(jì)心理干預(yù)治療方案,例如表?yè)P(yáng)、保證、鼓勵(lì)、合理化和重構(gòu)[10],降低焦慮和壓力水平。
2)嚴(yán)重高血壓往往伴隨嚴(yán)重的健康問題,如呼吸困難和睡眠質(zhì)量差,這種生理上的不適可能加劇個(gè)體的壓力感,形成惡性循環(huán),高血壓本身就可能導(dǎo)致身體機(jī)能的下降,進(jìn)而影響心理狀態(tài)。建議提供心理健康教育和干預(yù),以幫助學(xué)生應(yīng)對(duì)壓力,尤其是在經(jīng)歷生理健康問題時(shí)。
3)居住環(huán)境的惡劣直接影響個(gè)體的心理狀態(tài):狹小、衛(wèi)生條件差或缺乏必要設(shè)施的居住環(huán)境,容易導(dǎo)致學(xué)生感到壓抑和不安,這會(huì)增加學(xué)生心理負(fù)擔(dān);學(xué)生生活在高犯罪率或不安全的環(huán)境中,會(huì)造成持續(xù)的恐懼感和焦慮,這種不安全感會(huì)導(dǎo)致學(xué)生處于高壓狀態(tài)。相反,在良好的居住條件下,個(gè)體更容易感受到滿足和幸福,心理上更為穩(wěn)定,良好的環(huán)境能夠促進(jìn)個(gè)體的健康心理狀態(tài),表現(xiàn)為無壓力的狀態(tài)。
4)當(dāng)學(xué)生的成績(jī)低于預(yù)期時(shí),可能會(huì)面臨來自家庭、學(xué)校和自身的巨大壓力;對(duì)未來職業(yè)的擔(dān)憂往往會(huì)使學(xué)生感受到壓力。相反,學(xué)生在學(xué)業(yè)上相對(duì)穩(wěn)定,并且對(duì)未來有一定的信心,極大地緩解了學(xué)生壓力,從而促進(jìn)學(xué)習(xí)和發(fā)展。
5)課外活動(dòng)雖然可以提升技能和自信,但過多的課外負(fù)擔(dān)或者缺少足夠的支持,反而會(huì)導(dǎo)致焦慮和壓力增加;霸凌使學(xué)生感到孤立無援,加上缺乏社會(huì)支持使得他們?cè)诿鎸?duì)這些困擾時(shí)更加無力,加重心理負(fù)擔(dān)。當(dāng)在無霸凌和經(jīng)歷霸凌較輕的情況下,學(xué)生處于無壓力狀態(tài)。這表明在某些情況下,學(xué)生能夠較好地應(yīng)對(duì)相對(duì)輕度的霸凌行為。由此,學(xué)校和家庭應(yīng)該加強(qiáng)對(duì)學(xué)生的支持,提供情感上的關(guān)懷和實(shí)際的幫助,以應(yīng)對(duì)課外活動(dòng)和霸凌問題帶來的壓力。
4" 結(jié)" 論
降低學(xué)生壓力有利于維護(hù)學(xué)生的心理健康,提高學(xué)生對(duì)生活和學(xué)習(xí)的熱情,促進(jìn)學(xué)生個(gè)性發(fā)展、全面發(fā)展。本文基于Apriori算法探究了包括學(xué)生壓力在內(nèi)的與學(xué)生壓力相關(guān)的多方面因素之間的關(guān)聯(lián)性,通過研究結(jié)果可以挖掘出導(dǎo)致學(xué)生沉重壓力的重要原因,對(duì)研究學(xué)生壓力的心理健康教育部門提供了有效的參考。
參考文獻(xiàn):
[1] 徐晨欣.創(chuàng)造性應(yīng)對(duì)方式對(duì)學(xué)業(yè)情緒和學(xué)業(yè)壓力的影響:機(jī)制探討與干預(yù)研究 [D].上海:華東師范大學(xué),2023.
[2] 吳萌.一種Apriori算法在監(jiān)獄警察心理健康調(diào)查中的應(yīng)用 [J].兵工自動(dòng)化,2024,43(9):24-27.
[3] 劉統(tǒng)青.基于Apriori算法的中小學(xué)生心理問題數(shù)據(jù)挖掘研究 [D].濟(jì)南:齊魯工業(yè)大學(xué),2023.
[4] WANG Z C ,XUE L X. A Fast Algorithm for Mining Association Rules in Image [C]//2014 IEEE 5th International Conference on Software Engineering and Service Science.Beijing:IEEE,2014:513-516.
[5] 付春璐.職高生負(fù)性生活事件與自我效能感的關(guān)系研究:數(shù)據(jù)挖掘技術(shù)的應(yīng)用 [D].貴陽(yáng):貴州師范大學(xué),2024.
[6] 孫洪濤,張明元.癥狀自評(píng)量表(SCL—90)測(cè)評(píng)結(jié)果的研究報(bào)告——黑河市第一人民醫(yī)院部分在職職工心理測(cè)評(píng)結(jié)果研究 [J].黑河學(xué)刊,2014(6):141-144.
[7] 孫偉平.決策樹技術(shù)在大學(xué)生心理健康測(cè)評(píng)中的應(yīng)用研究 [D].鄭州:鄭州大學(xué),2020.
[8] 榮利,劉彬,高發(fā)亮.新時(shí)代高校學(xué)生心理健康教育的難點(diǎn)與對(duì)策 [J].科教導(dǎo)刊,2024(10):140-142.
[9] 崔妍,包志強(qiáng).關(guān)聯(lián)規(guī)則挖掘綜述 [J].計(jì)算機(jī)應(yīng)用研究,2016,33(2):330-334.
[10] 張波,季鑫.基于支持性心理治療理論的學(xué)生疫情心理干預(yù) [J].中學(xué)政治教學(xué)參考,2020(12):29-30.
作者簡(jiǎn)介:申悅(2004—),女,漢族,河南南陽(yáng)人,本科在讀,研究方向:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù);張一涵(2004—),女,漢族,河南周口人,本科在讀,研究方向:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù);王彎彎(1992—),女,漢族,河南鄭州人,高級(jí)工程師,講師,碩士,研究方向:數(shù)據(jù)挖掘、計(jì)算機(jī)視覺。