王冬燕,張秀琴,周甦
摘要:在疫情的大環(huán)境下,大學生的心理健康狀況需要更多的關(guān)注。本文通過文本采集及分析工具和技術(shù),對大學生較為關(guān)注的幾個心理健康方面進行了文本收集、預處理與文本挖掘分析。從語義網(wǎng)絡模型,可以看出大學生目前最關(guān)心的是情緒問題,其次是與他人的交往。高校教育者需要更多地關(guān)注大學生的情緒,在疫情期間,盡可能幫助他們創(chuàng)造更多的機會與他人交往。
關(guān)鍵詞:文本挖掘;語義網(wǎng)絡模型;心理健康
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)32-0020-02
1 問題提出
疫情背景下,大學生心理健康問題尤為受到關(guān)注。國家也多次出臺《高等學校學生心理健康教育指導綱要》等文件,旨在強調(diào)心理健康教育在高校中的重要地位?,F(xiàn)在心理健康課程和心理咨詢都在高校中發(fā)揮重要作用,可是隨著疫情的發(fā)生,很多課程改為線上形式,這樣就不能讓學生體驗面對面的情感交流,因此在課程形式上也是不斷改進,希望能給予學生盡可能多的幫助。有研究表明,社會環(huán)境的變化會對人的心理產(chǎn)生巨大而深刻的影響[1]。因此為了彌補不能當面交流的情況,也為了能在疫情環(huán)境下更好地掌握學生當下的心態(tài),同時順應“互聯(lián)網(wǎng) + ”時代的課改要求,教師可以利用課余時間,讓學生以文字的方式寫下困惑或煩惱,以便在課程中有針對性地討論。而這些文本一方面可以作為課上討論的參考,另一方面,可以進行整體的分析,從而了解學生目前集中的心理問題點。
在心理現(xiàn)象的研究中,大多采用數(shù)據(jù)的形式,以及有關(guān)數(shù)據(jù)的統(tǒng)計分析方法,較少采用純文本的分析方法,除了質(zhì)性研究。因此,想了解學生關(guān)注的問題有什么特點,如果用傳統(tǒng)的統(tǒng)計方法,很難對這種文本的描述方式進行分析,需要借助數(shù)據(jù)挖掘方法中的文本挖掘方法。文本挖掘(Text Mining)是從非結(jié)構(gòu)化文本中獲取有用信息的[2]。文本挖掘也是機器學習的一種方法,可以幫助我們找到隱藏的相互關(guān)系。文本挖掘不強調(diào)文本的計算和定量分析,而是通過理論揭露隱藏的觀點和真相。文本挖掘的應用非常廣泛,尤其在輿情[3-4]、用戶評價等方面應用較多[5-6],在心理學的研究中應用較少。一般會與網(wǎng)絡爬蟲技術(shù)結(jié)合使用,爬取文本信息后,再進行相關(guān)語義分析。文本挖掘過程需要從海量的文本信息中提取重要可用的信息,因此要經(jīng)過文本整理、文本的分詞、提取高頻詞等一系列預處理過程,才能最終建立語義模型。而對文本進行預處理,詞的分割、單詞去除和特征提取等過程都十分重要[7]。本研究則利用ROSTCM6 軟件,對采集的學生問題文本進行分詞處理、高頻詞匯統(tǒng)計以及語義網(wǎng)絡模型的分析,使繁雜的文本內(nèi)容得到提煉與簡化,從而了解學生較為關(guān)注的問題焦點在哪里。
2 研究方法
(1)研究對象
南京中醫(yī)藥大學大一新生349名,在整學期課程中圍繞:自我意識、人際關(guān)系、戀愛與性、壓力與情緒四個主題,讓學生分別寫出自己的困惑,共收集有效問題490條。
(2)分詞與詞頻整理
首先,需要進行數(shù)據(jù)的預處理。對于文本而言,就是將文本格式同一,并對內(nèi)容進行過濾,例如將一些無意義詞或者出現(xiàn)次數(shù)較多的單字詞刪除。利用ROSTCM6 軟件的“分詞”功能對文本進行分詞[6]。分詞后,將與研究內(nèi)容關(guān)聯(lián)程度較弱的詞,例如“怎么辦” “什么”等無意義詞刪除,并另存為新的分詞文件。
其次,對過濾過的分詞文件進行詞頻統(tǒng)計,得到一個較長的詞頻統(tǒng)計表,由于篇幅太大,詞頻頻數(shù)也逐漸遞減,因此只列舉前12個關(guān)鍵詞頻表,見表1。從表中可以看出,用于分析大學生關(guān)注的心理健康問題的高頻詞匯中,名詞主要有情緒、戀愛、自我、關(guān)系、朋友、他人和異性;而動詞則有認知、影響、交往、相處和控制??梢姶髮W生比較關(guān)注情緒、自我,以及交往中的各種問題。
(3)建立語義網(wǎng)絡模型
從語義網(wǎng)絡模型看,有點類似神經(jīng)網(wǎng)絡的樣子,都是由一個個節(jié)點組成。而詞語就是這網(wǎng)絡中的一個個節(jié)點,詞語之間的聯(lián)系(也就是節(jié)點之間的聯(lián)系)則表明了它們之間的相互關(guān)系。由于詞語是否共現(xiàn),以及共現(xiàn)頻次的高低,也預示著節(jié)點不同的地位和角色。一般情況下,關(guān)鍵詞都反映了話題的討論熱點。有些詞與詞聯(lián)系緊密,有些則相對比較疏遠。因此通過語義網(wǎng)絡分析,可以發(fā)現(xiàn)隱藏的很多關(guān)系,對分析學生討論的話題熱點有一定的幫助。
利用分詞后刪除整理過的語句表建立語義網(wǎng)絡模型,經(jīng)過分析,得到核心詞語義網(wǎng)絡分析圖,從網(wǎng)絡圖中可以看出數(shù)據(jù)內(nèi)容的核心是圍繞“情緒”“自我”“戀愛”和“朋友”等關(guān)鍵詞展開,說明了大學生很關(guān)心的核心問題大概集中在這些方面。從語義模型分析圖中的箭頭指向,可以看出“情緒”和“自我”是學生困惑的主要來源,見圖1。
3 討論
從各個大學不斷完善心理健康課程與咨詢服務,可見大學生的心理健康狀況是很受重視的。在疫情背景下,大學生的心理健康更是需要更多關(guān)注。從語義模型中可以看出,首先,大學生最關(guān)心的就是情緒問題。包括從情緒節(jié)點出發(fā)的情緒認識、調(diào)節(jié)和控制等,以及回到情緒節(jié)點的他人的情緒、時常的情緒,負面的情緒怎樣去面對。其次,大學生很迫切地想要了解自己,從而能更好地投入友誼與愛情的關(guān)系中去。全面、完善、影響、偏差等詞都與自我緊密相關(guān),而朋友與戀愛也都是從自我的發(fā)展中引出的。朋友和戀愛之間的關(guān)系也是十分微妙,較多的學生會糾結(jié)在是友誼還是愛情的困惑里。最后,本研究是在課程上,圍繞情緒、人際關(guān)系、自我和戀愛幾個主題來討論的,可是我們通常認為的最主要的人際問題,在語義網(wǎng)絡中都被分散到了其他主題中,比如他人的情緒的認識,自我與交友的關(guān)系,朋友和戀愛中的表達與聯(lián)系等,無不隱藏著人際關(guān)系的問題。再看學生的具體問題,比如“在別人面前表現(xiàn)負面情緒是不是不好”“很害怕拒絕他人,該怎么調(diào)整”“戀愛中能不能表現(xiàn)真實的自己”……大多數(shù)的問題都不僅僅是一個維度,里面都包含著自我的認知與成長,以及怎樣處理現(xiàn)在的關(guān)系,如何讓關(guān)系變得更好。因此,從語義模型中,會發(fā)現(xiàn)自我是學生關(guān)注的一個焦點,而在表1的詞頻中,大多高頻詞匯與交往有關(guān),可見學生對良好的人際關(guān)系的重視與渴望。情緒與交往也是疫情環(huán)境下,比較容易出現(xiàn)困惑的方面,需要高校的管理者以及心理健康老師格外要關(guān)心,主動幫助學生去面對和解決的問題。
在大數(shù)據(jù)時代,每時每刻都會產(chǎn)生大量的數(shù)據(jù)。用人工或者傳統(tǒng)的心理統(tǒng)計方法,往往已經(jīng)滿足不了研究者的需要,也會在處理復雜數(shù)據(jù)中產(chǎn)生更多的困難。心理學的研究也是會涉及更多跨學科的內(nèi)容,比如說人工智能,如果還用傳統(tǒng)的實驗和測量也是不夠的,而且不能全面地反映問題。文本提取,為心理學研究提供了新的思路,在條件允許的情況下,我們可以做更多的主觀研究來代替客觀數(shù)據(jù)。對被試來說,有更大的發(fā)揮空間和自由,不必拘泥于固定的實驗范式或問卷描述。而研究者要做的,就是如何從主觀文本中獲得更多的相關(guān)信息與結(jié)論。雖然沒有了統(tǒng)計學的p值,準確性略有下降,但可以有效地提取大量信息,仍然可以給研究者帶來啟發(fā)和思考。總之,文本挖掘技術(shù)易于理解且具有良好的可操作性,可重復性,便于心理學領(lǐng)域廣泛使用。
4 建議與結(jié)論
(1)大學生關(guān)注的心理健康問題主要集中在情緒的管理和與他人的交往方面。另外,學生對這種能給予解答的課堂充滿興趣,而且可以得到同輩人的建議,對學生來說參與性十分高。大多數(shù)學生認為通過這種討論的方式,可以讓他們發(fā)現(xiàn)很多問題都是這個年齡共有的問題,因此更容易自我開導,反而使一些困惑很輕松地被解決,至少能被自己接受。
(2)文本挖掘的方法可以很好地用于分析心理問題。文本挖掘和大多數(shù)據(jù)挖掘方法一樣,對數(shù)據(jù)的形式不是很嚴格,且能挖掘出一些意想不到的信息,這對在繁雜的心理現(xiàn)象中發(fā)現(xiàn)更多的關(guān)系,是十分有幫助的。
參考文獻:
[1] 俞國良,王浩.文化潮流與社會轉(zhuǎn)型:影響我國青少年心理健康狀況的重要因素及現(xiàn)實策略[J].西南民族大學學報(人文社會科學版),2020,41(9):213-219.
[2] 薛為民,陸玉昌.文本挖掘技術(shù)研究[J].北京聯(lián)合大學學報(自然科學版),2005,19(4):59-63.
[3] 姚麗梅,楊秋娜,繆林.基于新媒體文本挖掘的高校在線教學輿情事件分析[J].呼倫貝爾學院學報,2020,28(5):114-119.
[4] 楊單,程鍵,姚怡琦,等.基于文本挖掘的高校網(wǎng)絡輿情用戶情感分析研究[J].武漢紡織大學學報,2020,33(5):74-80.
[5] 孟令爽.基于文本挖掘技術(shù)的用戶產(chǎn)品評論研究[D].石家莊:河北經(jīng)貿(mào)大學,2022.
[6] 劉音.基于文本挖掘的網(wǎng)購產(chǎn)品評論穩(wěn)健情感分類研究[D].南昌:江西財經(jīng)大學,2021.
[7] 張幸芝,雷潤玲,楊超.文本挖掘——基于ROSTCM和NetDraw的內(nèi)容分析[J].科技文獻信息管理,2017,31(1):17-21,33.
【通聯(lián)編輯:李雅琪】