劉愛樓
摘 ?要:伴隨信息時代的到來與快速發(fā)展,信息技術正在以迅猛態(tài)勢滲透于社會的方方面面。大數據作為隨信息時代運用而生的概念,近年來得到心理學領域的廣泛關注。本文以網絡大數據概念及技術視角下對高校自殺干預應用為切入點,在介紹大數據技術在危機干預中實際應用的基礎上,總結其對高校危機干預理論研究和實踐運用產生的影響。高校危機干預作為以個體外部表現數據為主要分析對象的工作,大數據技術能夠直接提高其主動識別的精準度、增強個性化干預的效果。
關鍵詞:大數據;自殺風險;主動識別;及時干預;大學生
中圖分類號:D669.9;G643 文獻標識碼:A 文章編號:2095-9052(2021)07-00-03
自殺(Suicide)是世界性的公共衛(wèi)生問題。世界衛(wèi)生組織(簡稱WHO)發(fā)布的首份全球預防自殺報告指出,在全球范圍內,自殺是全年齡段的主要死亡原因。在中國,自殺已成為15~34歲人群中第一位的死亡原因。在整個生命周期中,與其他年齡組相比,青少年自殺率更高,自殺死亡人數增長最快。同時,許多曾考慮或企圖自殺的人在青春期就開始出現自殺意念或企圖嘗試自殺。作為未來社會建設主力軍的大學生,身心發(fā)展處于一個迅速走向成熟而又未真正成熟的特殊發(fā)展時期,是抑郁、焦慮等負面情緒的高發(fā)人群。很多調查表明,大學生的自殺率是同齡人的2~4倍。近年來,大學生自殺事件時有發(fā)生,不僅為其家庭造成重大損失與痛苦,也給周圍的同學、朋友帶來強烈的心理沖擊,給學校和社會造成不良影響[1]。
隨著社會和高校對自殺問題的關注,相關研究也越來越受到心理和教育工作者的重視,及時識別與干預自殺已經成為全社會的關注焦點。如何有效開展自殺風險預測預警工作是一個迫切需要解決的課題。但自殺作為一個復雜的社會問題,到目前為止,針對其發(fā)生機制和自殺模型的研究尚未十分清晰。同時,低主動求治率和求助率阻礙了專業(yè)救助的進一步展開。在中國自殺的主動求助率低于7%,很多人在自殺之前,其實并沒有真正地主動求助。但主動求助率低并不代表個體沒有求助的意愿,這其中大概有20%的個體確實不想求助,但還有接近80%的個體是由于各種原因而未去主動求助。而面對這80%的人群,目前傳統(tǒng)危機干預的做法是開通危機干預熱線,但其具有被動性和滯后性,很多個體可能是在實施自殺的同時撥打危機干預熱線。同時,以往研究顯示,曾經嘗試過自殺行為的個體,其再次實施自殺并且自殺成功的可能性會增高。因此,自殺風險的主動識別與干預的前移,以及自殺風險識別與篩查的精準性,在危機干預中顯得尤為重要。
一、大數據對自殺風險主動識別與干預的優(yōu)勢
大數據(Big Data或Mega Data)又稱巨量資料,是指涉及數據規(guī)模巨大且需要新處理模式才能具有更強決策力、洞察力和流程優(yōu)化能力的信息資產。具有數據體量巨大(Volume)、數據類型繁多(Variety)、數據處理高速(Velocity)、價值密度低(Value)和真實性(Veracity)的5V特征。除此之外,大數據還具有實時性的特征。也正因為具有以上特征,大數據才得以挑戰(zhàn)與突破傳統(tǒng)信息時代,對各行各業(yè)產生顛覆性的影響,同時也得到各領域的共同關注。
大數據技術不僅在自然科學領域得到廣泛應用,也為社會科學領域帶來了新的研究課題。更重要的是,大數據時代的到來為自殺干預研究打開了新的大門。隨著大數據技術的發(fā)展,虛擬環(huán)境與真實生活不斷融合,個體在現實社會中的各種心理與行為現象被電子化記錄成大數據存儲下來,如情緒、態(tài)度、網絡行為、應激事件等[2]。通過對個體網絡數據的收集與分析,可以對其行為進行預測,并運用大數據對壓力應對問題進行研究。分析來自Anxiety Online的全樣本數據得出結論,激動或逃避是最無效的壓力應對方法[3]。采用數據挖掘方法對智能手機中的數據進行人格研究,進而將手機使用者劃歸為五種人格類型。有國內學者利用被試所在高校的網絡日志數據分析被試的網絡行為特征,建立基于網絡行為特征的抑郁情緒狀態(tài)計算模型,從而實現心理健康問題的在線識別。在研究基于深度學習的微博用戶的自殺宣言進行主動識別時發(fā)現,青年人不僅偏好使用互聯網進行與自殺有關的話題討論,也將社交平臺視為他們尋求幫助和為他人提供幫助的有效工具。
相較于傳統(tǒng)量表測量方式,利用大數據實現的生態(tài)化自動識別具有明顯優(yōu)勢。大數據在危機干預領域的應用,使我們可以利用生態(tài)化的外顯行為指標數據,結合大數據和數據挖掘技術,實現對個體潛在心理危機的自動識別[2],從而實現危機識別與預警的前置,并在一定程度上改善心理健康問題低主動求助和求治率的現象。
(一)提高結果的科學性
心理學研究假設的檢驗邏輯是先驗性的,即研究推斷與假設是在研究結果之前提出。心理學傳統(tǒng)研究方法的假設檢驗是對數據獲取局限性的一種現實妥協,缺點在于降低了研究結果的正確性和可靠性。且對于自殺風險的識別與預警,傳統(tǒng)研究方法的先驗假設很難滿足主動識別與前置預警的需求。不同于心理學傳統(tǒng)經典研究方法,大數據技術是根據數據分析與挖掘得出結論,研究邏輯是后驗的。通過大數據分析歸納得出的結果不僅完成研究假設與推斷,并且對得出的研究推斷進行再次驗證,進而提高了獲取正確推斷與假設的效率和可能性,最終提高了研究結果的科學性。
(二)提高樣本的代表性
有關自殺問題的傳統(tǒng)研究中,樣本數量、規(guī)模和代表性都十分有限。研究多采用整群抽樣的方式對自殺問題進行預測與分析,再將抽樣分析的結果推廣到總體,這就使得研究結論的生態(tài)效度不可避免地受到樣本代表性的影響。大數據技術在自殺領域研究的應用可以改變通過抽樣樣本間接推論研究總體的劣勢,而直接對總體全部數據進行分析與處理,從根本上提高了研究樣本的代表性。
(三)提高數據的客觀性
常規(guī)的自殺意念或自殺行為的測量大多采用自評式問卷的方式,即通過個體對過去一段時間狀態(tài)的自我評價。這就使樣本數據不可避免地受到個體主觀動機或者刻意作假的影響,造成數據的客觀性和可信度低。而大數據打破了傳統(tǒng)量表測量或者“面對面”人際交互訪談方式依賴受試者主動報告或者研究者主觀觀察的劣勢,提高了數據的客觀性和結果的生態(tài)效度。
(四)提高識別的主動性
通過對個人以往大量數據的學習,找出個體行為表現與心理指標之間的相互關系。這種映射學習之后,對用戶的自動行為分析就可以識別出其心理狀況。人的心理活動是動態(tài)變化的過程,傳統(tǒng)的對自殺的識別與評估中所收集的信息基本是回溯性的(即回憶過去的狀態(tài)),并且對樣本數據的評估多為單個時間點或者有限的幾個時間點,很難做到對自殺易感因素的動態(tài)實時追蹤研究。而大數據技術的信息存儲與實時更新,能夠幫助研究者獲取更具時效性的信息與數據,從而提高自殺識別的主動性和準確性。
(五)提高干預的多樣性
常規(guī)的自殺干預主要依賴于心理咨詢師和心理服務人員,而心理工作者的專業(yè)素質與能力水平不盡相同,自殺干預的效果與心理服務質量會因此受到很大影響。同時,傳統(tǒng)危機干預方案主要是依據個體自評量表的結果而制定,很難做到針對不同的個體量身定制個性化的干預方案。借助大數據技術,大規(guī)模用戶留下的網絡使用痕跡被實時記錄下來,這就為分析個體的心理特征提供了內容豐富以及規(guī)模巨大的行為數據。根據網絡數據分析得出的個體的心理特征對于個性化、多樣性干預措施與方案的制定提供了基礎數據支撐。
二、建立心理健康指標計算模型——以高校自殺風險預測為例
自殺作為一個復雜的社會問題,一直以來備受心理學家的關注,逐漸形成了諸多關于自殺發(fā)生機制的模型與理論。目前備受學術界關注并最被接受的為應激——易感模型理論。該模型理論認為,自殺的易感因素或者特質決定了個體在一些應激事件的影響下會不會出現自殺意念并采取自殺行為。自殺是風險應激因素、保護性因素和個體因素三者之間相互影響和作用的過程。當具有某種易感特質的個體處于應激狀態(tài)時,其易感性就容易被激活,從而表現出比常人更高的自殺風險。有關自殺影響因素的研究從不同方面驗證了自殺的應激——易感模型理論。基于已有研究的整理,本研究選取了6項自殺相關風險因素進行分析:應激生活事件、易感性人格特質、抑郁情緒、自殺企圖、精神障礙、軀體化癥狀(如睡眠、飲食問題)。預防大學生自殺風險預測模型的建立極為重要,主要包括三個步驟。
(一)建立初始數據倉庫
大學生自殺風險預警的數據來源不僅包括心理普查、危機排查和門診問詢等常規(guī)方式,而且包括學生在校期間學習、生活、網絡行為等相關信息。根據自殺的6個相關風險因素,建立基于大數據支撐的自殺風險預警初始數據庫,數據庫盡量全面包含自殺的6個風險因素,無選擇地記錄、收集個體自然、真實和多樣化的生態(tài)化數據。
數據倉庫由心理測評數據庫、生活行為數據庫、學業(yè)數據庫、網絡行為數據,以及其他高危因素數據庫構成。每個數據庫模塊又由不同的因子構成,每個因子又包含不同的預測變量。以生活行為數據庫中的人際關系為例,預測變量可能包括困難生情況、學習成績、參加活動次數、出入宿舍次數以及內務檢查情況[3]。
(二)數據采集與建模
本研究利用自主研發(fā)的在線學生信息管理平臺采集在校學生的數據。自2018年10月開始,本研究選取H省某大學2018級全體新生,進行為期4年的縱向追蹤測試,剔除樣本的流失,最后完整參加測試的學生預計為三千人左右??v向追蹤測試的時間點1為大學新生入學后10月份,時間點2為大學二年級10月份,依此類推。所有被試均為自愿參加。
第一,數據分類。采用保持法,用測試數據集中的每一個樣本,按照分類模型分析得出預測類與已知類的標號進行比較。如果一樣,說明分類成功,反之則說明分類失敗。模型在測試數據集上的準確率是指模型正確分類的測試樣本數占測試數據集中總樣本數的百分比。如果得出的準確率可以接受,就利用該模型對未知類標號的數據元組進行分類[4]。
第二,關聯數據挖掘。根據自殺的應激——易感模型建立學生自殺風險因子數據庫。定制專屬模塊,記錄、收集學生在校期間發(fā)生的異常行為表現、遭遇的應激生活事件等。其中,異常行為包括軀體問題、情緒表現、行為表現、精神狀態(tài)4類。應激生活事件則包括學業(yè)、軀體、人際、家庭、其他5類。將學生的人口統(tǒng)計學信息(包括家庭情況、課程情況、是否困難生、各階段成績等)錄入云存儲數據庫中[3],通過全面比較高自殺風險學生和普通學生的自殺風險因素,歸納高自殺風險學生的可識別模式。且利用數據挖掘技術與數據庫平臺其他模塊獲取得數據相關聯并形成數據樣本,最后建立自殺風險識別模型。關聯規(guī)則的目的是發(fā)現哪些事情將關聯發(fā)生,它的一般形式是:如果A發(fā)生則B有百分之C的可能發(fā)生(C稱為關聯規(guī)則的支持度)。
(三)自殺風險的自動識別與主動干預
自殺風險包括一系列不同的心理和行為維度,不同維度彼此之間存在一定程度的關聯。如果在建立某個面向具體自殺風險的計算模型時,能夠將不同心理維度和行為維度之間的關聯信息考慮在內,那么建模效果將得到相應提升。因此,可采用多任務回歸方法,結合被試的人口統(tǒng)計學信息建立基于綜合數據分析的自殺風險狀態(tài)計算模型。同時利用線性回歸方法建立同樣的心理狀態(tài)計算模型,以此作為基準模型來評價多任務回歸方法的建模效果。
基于各因子數據庫,預警平臺階段性采集學生的心理行為信息,并代入自殺風險的目標心理特征計算模型進行預測。自殺風險的自動識別是由特定時間點之前一段時間的數據預測之后某一特定時間點的數據,從而完成自殺風險的生態(tài)化識別過程。同時,自動甄別、篩查并鎖定該時間點可能出現負性情緒與消極行為的重點關注學生群體,及時發(fā)出預警提醒,并推送給學生管理部門與管理者進行預警。同時,向高風險學生提供及時有效的干預,通過平臺私信的方式及時推動所在高?;虻貐^(qū)的自殺干預熱線,提供相關的心理健康常識及其消極情緒緩解策略[2]。
這種基于大數據的自殺風險自動識別與主動干預的方法,是對識別高自殺風險人群并提供危機管理的全新嘗試,是對現有自殺預防與干預措施的有效補充,需要在更大范圍內進行驗證與推廣。
三、基于大數據自殺風險預警面臨的挑戰(zhàn)與未來發(fā)展方向
大數據技術對提高自殺風險識別與預警的主動性、時效性和準確性具有重要意義,但同時也可能帶來一定風險。一是學生隱私權和安全感風險。大數據的應用可以對學生日常生活與行為數據進行全方位抓取,這必然涉及學生隱私權的邊界。二是導致“數據萬能論”。大數據雖然帶來了危機篩查方法的巨大革新,但挖掘到的變量之間的關系模式通常只具備相關而非因果關系,仍需要相關理論知識及實驗研究的指導或驗證,否則會導致對數據分析結果的過度依賴與過度使用。
學術界在享受信息技術發(fā)展帶來的便利的同時,需要重點關注技術應用中的倫理和隱私邊界,遵循一定的倫理規(guī)范,合理保護個人的隱私。大數據技術應用于危機識別與干預等相關課題的研究中,應該遵循一般的倫理共識:在獲取個體心理與行為數據前,首先應征得個人的知情同意,明確告知數據采集目的與數據用途;在數據處理與成果發(fā)表過程中,采用匿名處理方式[2],杜絕使用可以識別出個人身份信息的內容去公開發(fā)表;同時,做好數據的保存與管理,防止數據信息外泄,侵害個人隱私。
四、結語
綜上所述,人們在看到大數據在危機識別與干預中的潛在促進作用的同時,也應該警惕其帶來的潛在危害。在合理合規(guī)使用大數據技術的同時,還應考慮從培養(yǎng)具備信息技術的心理健康教育人才隊伍、建立“數據倫理”規(guī)范、針對數據挖掘與分析的弱點進行補強等方面進行延伸研究,最終實現信息技術在高校心理健康工作服務中的積極應用。
參考文獻:
[1]辛素飛,時蒙,張夫偉.中國大學生自殺態(tài)度變遷的橫斷歷史研究[J].中國臨床心理學雜志,2019(2):401-405.
[2]劉興云,等.人工智能大數據之于心理學[J].科技導報,2019(21):105-109.
[3]陶毅涵.基于大數據的大學生危機預警模型研究與應用[J].教育現代化,2016(40):133-134.
[4]何廣東.數據挖掘技術在大學生心理問題分析中的應用研究[D].河北大學碩士論文,2013.
(責任編輯:董維)