黃 申,方 鵬,岳 敏,苗丹民,曹 爽
(火箭軍工程大學(xué): 1政治系, 3作戰(zhàn)保障學(xué)院,陜西 西安 710025; 2空軍軍醫(yī)大學(xué)軍事醫(yī)學(xué)心理學(xué)系教學(xué)實(shí)驗(yàn)中心,陜西 西安 710032; 4解放軍中部戰(zhàn)區(qū)空軍醫(yī)院心理科,山西 大同 037000)
抑郁障礙高危人群是指具有高抑郁易感人格特質(zhì)的人群[1]。既往研究指出,抑郁障礙高危人群在外界不良因素刺激下,更可能出現(xiàn)亞臨床的抑郁狀態(tài)甚至發(fā)展成抑郁障礙[2]。部隊(duì)作業(yè)環(huán)境具有高應(yīng)激、高壓力等特殊性[3-5],因而早期準(zhǔn)確地篩查出應(yīng)征青年中的抑郁障礙高危人群,從源頭減少部隊(duì)抑郁障礙的發(fā)生率,對促進(jìn)官兵心理健康具有重要的現(xiàn)實(shí)意義。
自陳式量表是目前精神障礙及高危人群的主流篩查工具[6-7]。但在自陳式量表廣為使用的同時(shí),也因答題的主觀性而備受質(zhì)疑[8-10]。研究指出,在應(yīng)聘等高風(fēng)險(xiǎn)情景下,被試在作答量表時(shí)普遍存在社會(huì)贊許性加工[11],這使得自陳式量表在實(shí)際應(yīng)用場景下出現(xiàn)測量偏差。探索量表答題過程中更為客觀化的識別方法有望彌補(bǔ)這一缺陷,提高檢出效能。
視線追蹤技術(shù)(又稱眼動(dòng)技術(shù))可以精確、無干擾地記錄人眼視覺過程。眼動(dòng)技術(shù)作為一項(xiàng)成熟的認(rèn)知神經(jīng)檢測技術(shù),反映了個(gè)體視覺追蹤、工作記憶、邏輯推理與計(jì)劃能力等多個(gè)方面[12-15]。本研究擬在抑郁障礙高危人群和正常人群作答自陳式量表的過程中,使用眼動(dòng)技術(shù)探索抑郁障礙高危人群客觀化識別的可能性。
采用整群抽樣的方法,用“抑郁障礙高危人群特質(zhì)篩查量表”[7]對某軍校798名大一新生進(jìn)行普測,選取量表得分高于均數(shù)兩個(gè)標(biāo)準(zhǔn)差以上且“抑郁自評量表”評分未達(dá)到抑郁障礙標(biāo)準(zhǔn),經(jīng)精神科臨床醫(yī)生鑒定屬于抑郁障礙高危人群的37人組成抑郁障礙高危組,均為男性。剔除眼動(dòng)采集實(shí)驗(yàn)中注視點(diǎn)采集率低于75%的被試(4人),高危組實(shí)際人數(shù)為33人。
以未達(dá)到“抑郁障礙高危人群特質(zhì)篩查量表”均數(shù)兩個(gè)標(biāo)準(zhǔn)差以上的37人為健康對照組,均為男性。剔除眼動(dòng)采集實(shí)驗(yàn)中注視點(diǎn)采集率低于75%的被試(1人),健康對照組實(shí)際人數(shù)為36人。
所有被試年齡在18~25歲之間,均無其他類藥物的使用,且視力均經(jīng)過篩查,符合眼動(dòng)實(shí)驗(yàn)要求。本研究已通過空軍軍醫(yī)大學(xué)西京醫(yī)院臨床試驗(yàn)倫理委員會(huì)審核(許可證號:KY20182047-F-1),所有被試均簽署了知情同意書,并被告知有隨時(shí)選擇退出的權(quán)利。
本研究使用“抑郁障礙高危人群特質(zhì)篩查量表”測試。該量表共計(jì)62題,分為悲觀消極、敏感退讓、興趣缺乏、缺乏自信、急躁憂慮以及心態(tài)脆弱6個(gè)維度。該量表的克朗巴哈系數(shù)為0.95,重測信度為0.82[7]。量表中所有題目均為“是”或“否”的迫選題,完成全部題目大約需要10 min。
1.2.1 試驗(yàn)流程 在實(shí)驗(yàn)開始前,將“抑郁障礙高危人群特質(zhì)篩查量表”的所有題目制作成統(tǒng)一的圖片格式,使用Tobii Pro Lab軟件完成實(shí)驗(yàn)程序的編寫。為了保證研究過程中眼動(dòng)測量的準(zhǔn)確性,在實(shí)驗(yàn)前調(diào)整被試與屏幕之間的相對位置,使被試在實(shí)驗(yàn)中與監(jiān)視器保持65 cm的距離。使用托架固定頭部,使被試瞳孔位于屏幕的中央。
進(jìn)入正式實(shí)驗(yàn)后,被試首先在電腦屏幕前完成眼動(dòng)儀的9點(diǎn)校準(zhǔn),在校準(zhǔn)時(shí),被試的視線要求追隨屏幕上的紅點(diǎn),校準(zhǔn)成功后開始呈現(xiàn)測試材料。被試的任務(wù)是根據(jù)量表的題目進(jìn)行“是”或“否”的按鍵選擇,選擇完成后自動(dòng)跳入下一題,直至完成全部量表。每道題目之間均會(huì)呈現(xiàn)500 ms的“+”號,以確保被試視線回歸屏幕中央。實(shí)驗(yàn)流程見圖1。
圖1 “抑郁障礙高危人群特質(zhì)篩查量表”結(jié)合眼動(dòng)研究的流程
被試在作答量表的過程中,使用Tobii Pro X30-120眼動(dòng)儀記錄眼動(dòng)數(shù)據(jù)。該眼動(dòng)儀是Tobii公司最新研發(fā)的一款屏幕式眼動(dòng)條,采樣頻率為120 Hz,即每8.3 ms采集一次視線坐標(biāo)。
1.2.2 眼動(dòng)特征提取 眼動(dòng)數(shù)據(jù)分析的一個(gè)重要工作是對刺激材料劃分興趣區(qū)(area of interest,AOI)。本研究針對實(shí)驗(yàn)材料的特點(diǎn),將量表的每道題目劃分為3個(gè)興趣區(qū)。其中題干部分為興趣區(qū)a(AOI a),選項(xiàng)“是”部分為興趣區(qū)b(AOI b),選項(xiàng)“否”部分為興趣區(qū)c(AOI c)。
使用Microsoft Excel 2017及Tobii Pro Lab提取原始眼動(dòng)數(shù)據(jù)并計(jì)算眼動(dòng)特征。對每道題目的每個(gè)興趣區(qū)共提取了17種眼動(dòng)指標(biāo),分別為:注視類指標(biāo),包括總注視時(shí)長、平均注視時(shí)長、注視點(diǎn)個(gè)數(shù)、總注視點(diǎn)時(shí)長、平均注視點(diǎn)時(shí)長及首次注視時(shí)長,反映被試對刺激材料的加工程度;眼跳類指標(biāo),包括眼跳個(gè)數(shù)、開始眼跳峰值速度、結(jié)束眼跳峰值速度,反映注視點(diǎn)的轉(zhuǎn)換;訪問類指標(biāo),包括總訪問時(shí)長、平均訪問時(shí)長、訪問次數(shù),反映更全面更細(xì)節(jié)的信息;掃視類指標(biāo),包括掃視總時(shí)長、平均掃視時(shí)長、最大掃視時(shí)長、最小掃視時(shí)長、掃視次數(shù)等,反映被試閱讀材料時(shí)的加工速度和效率。四類眼動(dòng)指標(biāo)從時(shí)間和空間的角度全面反映被試在作答量表時(shí)的認(rèn)知過程。
1.2.3 數(shù)據(jù)處理 使用提取的眼動(dòng)特征,用隨機(jī)森林算法構(gòu)建反應(yīng)傾向性分類模型,以預(yù)測被試的作答選項(xiàng)。隨機(jī)森林法是以決策樹為弱學(xué)習(xí)器構(gòu)建的Bagging集成方法,并在訓(xùn)練過程中增添了隨機(jī)屬性選擇,具有操作簡單、容易實(shí)現(xiàn)、計(jì)算便捷等特點(diǎn)[16]。使用反應(yīng)傾向性模型輸出的作答選項(xiàng),用支持向量機(jī)(support vector machine, SVM)算法構(gòu)建人群分類模型,以預(yù)測被試是否為抑郁障礙高危人群。SVM是一種二類分類模型,其基本模型定義為特征空間上的間隔最大的線性分類器。該方法具有較好的“魯棒性”,適合用于小樣本數(shù)據(jù)的分類學(xué)習(xí)[17]。本研究使用的機(jī)器學(xué)習(xí)算法均由Matlab軟件實(shí)現(xiàn)。
本研究共選取了17種眼動(dòng)特征。量表中每道題目均被劃分成3個(gè)AOI,故對于每道題目,共納入了51個(gè)眼動(dòng)指標(biāo)作為模型的輸入特征。使用隨機(jī)森林算法構(gòu)建反應(yīng)傾向性模型,以預(yù)測被試的作答選項(xiàng)??紤]到樣本集的規(guī)模有限,本研究采用分層交叉驗(yàn)證的方法對模型進(jìn)行評價(jià),評價(jià)指標(biāo)包括準(zhǔn)確率、精確率、召回率和曲線下面積(area under curve,AUC)。準(zhǔn)確率是對分類器在整體數(shù)據(jù)上的評價(jià)指標(biāo);精確率是對分類器在預(yù)測為陽性的數(shù)據(jù)上的評價(jià)指標(biāo);召回率是對分類器在整個(gè)陽性數(shù)據(jù)上的評價(jià)指標(biāo);AUC是受試者工作特征曲線(receiver operating characteristic curve,ROC)右下角的面積,AUC面積越大,表示分類器的性能越好。本量表共有62道題目,其中第36題只有一個(gè)“是”的樣本,其余皆為“否”,在對樣本進(jìn)行訓(xùn)練測試集劃分時(shí),無法滿足每個(gè)測試集均包含兩類結(jié)果樣本的要求,故無法構(gòu)建模型,其余61道題目使用眼動(dòng)特征對被試作答選項(xiàng)的分類結(jié)果見表1。其中,最高分類準(zhǔn)確率可達(dá)97.10%(第39題),最低分類準(zhǔn)確率為55.07%(第46題),62道題目平均識別準(zhǔn)確率可達(dá)80.47%。
表1 隨機(jī)森林模型的分層交叉驗(yàn)證
將2.1中反應(yīng)傾向性模型的輸出結(jié)果作為輸入特征,即使用眼動(dòng)數(shù)據(jù)預(yù)測的被試作答選項(xiàng)作為輸入特征,使用SVM算法構(gòu)建人群分類模型,進(jìn)行人群的分類識別。由于第36道題目無法構(gòu)建反應(yīng)傾向性模型,故該道題目的輸入特征使用被試實(shí)際的作答選項(xiàng)。該模型對正常人群的識別率可達(dá)94.40%,對抑郁障礙高危人群的識別率可達(dá)81.80%,整體準(zhǔn)確率可達(dá)88.40%。
作為世界上最重要的心理選拔手段之一[6-7],自陳式量表由于答題的主觀性遭受到了越來越多的質(zhì)疑[8-10]。本研究以自陳式量表為刺激,使用被試作答量表時(shí)的眼動(dòng)數(shù)據(jù),通過機(jī)器學(xué)習(xí)算法初步實(shí)現(xiàn)了抑郁障礙高危人群的客觀化識別,彌補(bǔ)了傳統(tǒng)自陳式量表的不足。
本研究發(fā)現(xiàn),在使用眼動(dòng)數(shù)據(jù)預(yù)測被試的作答選項(xiàng)時(shí),量表中62道題目的分類準(zhǔn)確率均高于基線準(zhǔn)確率(基線準(zhǔn)確率為50%)。同時(shí),62道題目的平均分類準(zhǔn)確率達(dá)到80.47%,遠(yuǎn)高于基線準(zhǔn)確率。這說明眼動(dòng)數(shù)據(jù)可以較好地識別出被試的作答選項(xiàng),這為抑郁障礙高危人群分類模型的建立奠定了基礎(chǔ)。此外,在人群分類模型中,研究發(fā)現(xiàn)該模型對抑郁障礙高危人群的識別準(zhǔn)確率可達(dá)88.40%,這提示我們基于眼動(dòng)的客觀化識別方法有望打破傳統(tǒng)量表僅依賴被試主觀報(bào)告的單一計(jì)分模式。
在既往類似研究中,普遍的做法是使用不同人群在量表作答整體維度的眼動(dòng)數(shù)據(jù),構(gòu)建人群分類機(jī)器學(xué)習(xí)模型[18-20]。雖然這樣的方法在數(shù)據(jù)結(jié)果上具有一定的效果,但也存在一些問題。首先,從理論上看,前人的思路分析是默認(rèn)人群間的眼動(dòng)具有差異性模式,但從量表作答的過程來看,應(yīng)是從每個(gè)條目的響應(yīng)過程出發(fā)進(jìn)行眼動(dòng)分析。其次,前人的研究雖然采用了客觀化行為,但在對客觀化行為進(jìn)行數(shù)據(jù)分析時(shí)并沒有與量表本身的計(jì)分方式進(jìn)行很好的融合,這使得量表僅僅成為了采集客觀化行為的刺激材料,而無法對數(shù)據(jù)結(jié)果賦予更多的心理學(xué)解釋。
與既往研究相比,眼動(dòng)數(shù)據(jù)在該方法中沒有直接用于人群區(qū)分,而是用于構(gòu)建題目的反應(yīng)傾向性分類模型,這使得該技術(shù)更加符合量表答題的理論邏輯,并有望解決傳統(tǒng)自陳式量表因作答動(dòng)機(jī)、社會(huì)贊許性等產(chǎn)生的反應(yīng)偏差問題。此外,在人群分類模型中,該技術(shù)考慮到了所有條目的眼動(dòng)數(shù)據(jù)輸出結(jié)果,而非整體上的平均值,這使得眼動(dòng)數(shù)據(jù)與量表的計(jì)分方法進(jìn)行了初步融合,改變了以往靠量表作答計(jì)分的傳統(tǒng)判別方式。根據(jù)本研究的結(jié)果,我們認(rèn)為下一步研究中可以納入更多的認(rèn)知神經(jīng)科學(xué)技術(shù),同步采集被試作答過程的客觀化數(shù)據(jù),并使用這些數(shù)據(jù)從單個(gè)條目出發(fā),構(gòu)建量表題目的分類識別器,而不是直接將客觀化數(shù)據(jù)進(jìn)行人群分類。
需要說明的是,既往類似研究中使用的被試大多是精神障礙人群,本研究中的抑郁高危人群本質(zhì)上不歸屬于精神障礙,因此實(shí)驗(yàn)結(jié)論能否推廣至精神障礙人群中還需要進(jìn)一步的實(shí)驗(yàn)支持。此外,本研究選取的被試均為男性,且樣本量相對較小,因此機(jī)器學(xué)習(xí)構(gòu)建的模型在實(shí)際應(yīng)用中可能存在一定的誤差,尚需更大的樣本量對結(jié)論的可靠性加以驗(yàn)證。