劉鑫子 李自艷 鄭思思 朱 虹 尹冬青 賈竑曉*
(1.首都醫(yī)科大學(xué)附屬北京安定醫(yī)院 國家精神心理疾病臨床醫(yī)學(xué)研究中心 精神疾病診斷與治療北京市重點(diǎn)實(shí)驗(yàn)室,北京 100088;2.人腦保護(hù)高精尖創(chuàng)新中心 首都醫(yī)科大學(xué),北京 100069)
抑郁發(fā)作臨床表現(xiàn)為情緒低落、興趣或愉悅感減少、自責(zé)自罪、注意力不集中、體質(zhì)量減輕、失眠等癥狀,抑郁發(fā)作可見于抑郁障礙與雙相情感障礙。雙相情感障礙是一類既有躁狂或輕躁狂發(fā)作又有抑郁發(fā)作的心境障礙。50%的雙相I型患者和75%的雙相Ⅱ型患者常以抑郁發(fā)作為首次發(fā)病的表現(xiàn)[1],且在整個(gè)病程中抑郁發(fā)作時(shí)長達(dá)躁狂發(fā)作時(shí)長的3倍[2]。當(dāng)雙相情感障礙患者首次發(fā)病且以抑郁發(fā)作時(shí),常因難以與單相抑郁進(jìn)行鑒別區(qū)分出現(xiàn)診斷轉(zhuǎn)換延遲,平均延遲長達(dá)(8.74±9.40)年[3]。雙相抑郁治療難度較大,若治療不當(dāng)造成患者轉(zhuǎn)相,出現(xiàn)躁狂發(fā)作或混合特征,進(jìn)而影響預(yù)后。因此區(qū)分抑郁發(fā)作患者是單相抑郁或雙相抑郁是臨床醫(yī)生的難點(diǎn)之一。目前因?yàn)殡p相情感障礙與抑郁障礙的發(fā)病機(jī)制尚不明確,所以臨床常由臨床醫(yī)生問診結(jié)合病史、病程配合使用輕躁狂檢測(cè)清單、心境障礙問卷等進(jìn)行診斷,因?yàn)橛糜谠\斷的信息多由臨床問診與自評(píng)量表所得,他評(píng)量表臨床應(yīng)用較少[4],缺少相對(duì)客觀化的診斷指標(biāo)。
脈診是中醫(yī)獨(dú)特且有效的診斷方法,《內(nèi)經(jīng)》曰:“夫脈者血之府也”,“諸血者,皆屬于心”,“心者,生之本,其充在血脈”?,F(xiàn)代中醫(yī)常把雙相抑郁和單相抑郁都納入中醫(yī)“郁證”的范疇,但由于雙相情感障礙與抑郁癥的病機(jī)不同[5],在證候分類上也有所不同[6],影響氣血津液的運(yùn)行輸布不同從而導(dǎo)致脈象的不同。中醫(yī)的脈診信息也因此會(huì)表現(xiàn)出特異性,可能是鑒別診斷單相抑郁與雙相抑郁的有效手段。
脈診客觀化是指通過客觀化手段采集脈象,對(duì)個(gè)體的脈圖進(jìn)行參數(shù)分析,繼而反映機(jī)體整體的病理生理指標(biāo)改變,是中西醫(yī)結(jié)合現(xiàn)代化的成果[7]。脈圖參數(shù)具有客觀化的優(yōu)點(diǎn),t檢驗(yàn)與非參數(shù)檢驗(yàn)可以提供單相抑郁與雙相抑郁脈圖參數(shù)比較,但是統(tǒng)計(jì)分析時(shí)具有數(shù)據(jù)量多,各類數(shù)據(jù)關(guān)聯(lián)較少的缺點(diǎn),機(jī)器學(xué)習(xí)則可以彌補(bǔ)t檢驗(yàn)與非參數(shù)檢驗(yàn)的不足,得到更加精確地鑒別結(jié)果。向量機(jī)算法(support vector machines,SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論中的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的機(jī)器學(xué)習(xí)方法[8],在小樣本、非線性和高維模式識(shí)別問題中都具有其特定的優(yōu)勢(shì);隨機(jī)森林算法(random forest,RF)是一種以決策樹為基分類器的常見機(jī)器學(xué)習(xí)算法,具有適用范圍廣且不易過擬合等優(yōu)點(diǎn)。在處理大量多類數(shù)據(jù)時(shí),SVM模型與RF模型都能建立較好的數(shù)據(jù)模型,并可以相互印證后得出較為準(zhǔn)確的特征變量。
本研究通過對(duì)雙相抑郁患者與單相抑郁患者脈象信息進(jìn)行采集,對(duì)數(shù)據(jù)進(jìn)行t檢驗(yàn)與非參數(shù)檢驗(yàn)獲取比較結(jié)果后,使用機(jī)器學(xué)習(xí)SVM算法和RF算法分別建立雙相抑郁與單相抑郁的SVM與RF分類模型,并對(duì)鑒別模型中的重要特征進(jìn)行分析,得出單雙相抑郁脈診特征特點(diǎn),并有可能將得到的兩個(gè)帶有特征參數(shù)的模型應(yīng)用于臨床,以期可以根據(jù)患者脈象得到患者單雙相預(yù)測(cè)概率值,對(duì)臨床單雙相抑郁的鑒別提供幫助。
研究對(duì)象均為首都醫(yī)科大學(xué)附屬北京安定醫(yī)院2020年6月至2021年11月門診就診患者。共收集88例,其中單相抑郁發(fā)作患者31名,雙相情感障礙抑郁發(fā)作患者57名。本研究經(jīng)首都醫(yī)科大學(xué)附屬北京安定醫(yī)院倫理委員會(huì)審批,倫理審批號(hào):202025FS-2。
1.2.1 入組標(biāo)準(zhǔn)
①單相抑郁發(fā)作患者符合《精神障礙診斷與統(tǒng)計(jì)手冊(cè)》(Diagnostic and Statistical Manual of Mental Disorders,DSM-5)重性抑郁障礙診斷標(biāo)準(zhǔn)[9];雙相情感障礙抑郁發(fā)作患者符合DSM-5 雙相情感障礙Ⅰ,目前或最近為抑郁發(fā)作與雙相情感障礙Ⅱ,目前或最近為抑郁發(fā)作診斷標(biāo)準(zhǔn)[9];②漢密爾頓抑郁量表(Hamilton Depression Scale,HAMD)評(píng)分>7分;③楊氏躁狂量表(Young Manic Rating Scale, YMRS)評(píng)分<6分;④可配合完成各項(xiàng)量表調(diào)查,小學(xué)以上文化者;⑤生命體征平穩(wěn);⑥患者本人或法定監(jiān)護(hù)人簽署知情同意書。
1.2.2 排除標(biāo)準(zhǔn)
①并發(fā)精神分裂癥等其他精神類疾病者;②并發(fā)重大軀體疾病者; ③孕婦、哺乳期婦女;④無人監(jiān)護(hù)或未能簽署知情同意書者。
研究者對(duì)患者進(jìn)行基本信息收集后使用道生四診儀DS01-A舌面脈信息采集體質(zhì)辨識(shí)系統(tǒng)(滬械注準(zhǔn)20202200060)采集患者脈圖信息。采集方法:待患者在安靜的環(huán)境中靜坐5 min后,在自然呼吸的條件下將脈象傳感器固定在患者左手及右手橈動(dòng)脈搏動(dòng)最強(qiáng)處進(jìn)行脈象采集獲得最佳脈圖及其參數(shù)值。將相關(guān)數(shù)據(jù)導(dǎo)出后用Excel工作表整理儲(chǔ)存。
使用Epidata 3.1軟件錄入并整理患者人口學(xué)資料與相關(guān)量表數(shù)據(jù),使用RStudio通過R語言mice程序包對(duì)缺失數(shù)據(jù)進(jìn)行多重插補(bǔ)[10],獲得最終的數(shù)據(jù)集。數(shù)據(jù)集包括患者序號(hào)、性別、年齡、診斷分組、抑郁癥狀嚴(yán)重程度(HAMD>20為中重度抑郁,7 通過R 4.0.5 “mlr3”程序包[11]將數(shù)據(jù)樣本按7∶3比例隨機(jī)分為訓(xùn)練組和測(cè)試組,利用數(shù)據(jù)集特征在訓(xùn)練組中構(gòu)建SVM全模型與RF全模型,用測(cè)試組數(shù)據(jù)進(jìn)行驗(yàn)證。 1.5.1 通過特征選擇對(duì)鑒別模型進(jìn)行優(yōu)化 數(shù)據(jù)集包含大量特征(變量),提取相關(guān)特征子集的技術(shù)稱為特征選擇。對(duì)特征進(jìn)行篩選可用于提高模型性能,清除與模型無關(guān)的變量,從而提高模型的適用性[12]。本研究使用R 4.0.5 mlr3fselect程序包[13]中的包裝器法(wrapper methods)方法,通過計(jì)算重新采樣的預(yù)測(cè)性能來評(píng)估該特征集合,得到新的特征子集。以分類誤差(classification error,classif.ce)作為衡量標(biāo)準(zhǔn)來預(yù)測(cè)特征篩選性能,classif.ce值越小,特征子集的預(yù)測(cè)效果越好。 1.5.2 通過超參數(shù)調(diào)優(yōu)對(duì)鑒別模型進(jìn)行優(yōu)化 超參數(shù)是控制模型如何適應(yīng)數(shù)據(jù)的學(xué)習(xí)器的參數(shù)。本研究通過R 4.0.5 mlr3 tuning程序包[14]中的自動(dòng)調(diào)諧(automatic tuning)方法,對(duì)特征選擇后重新構(gòu)建的SVM模型行超參數(shù)調(diào)優(yōu)。 采用 R 4.0.5 進(jìn)行統(tǒng)計(jì)學(xué)分析。為了更加準(zhǔn)確和全面地評(píng)估模型,采用模型鑒別準(zhǔn)確率及曲線下面積( area under curve,AUC )作為預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)。為了提高模型解釋性,對(duì)模型中各特征重要性進(jìn)行評(píng)價(jià),取重要性前五的特征進(jìn)行個(gè)體條件期望(individual conditional expectation,ICE)分析,形成居中個(gè)體條件期望圖(centered ICE plot)。個(gè)體條件期望是將每個(gè)實(shí)例數(shù)據(jù)顯示為一條線,當(dāng)特征發(fā)生變化時(shí)預(yù)測(cè)實(shí)例如何變化。居中個(gè)體條件期望圖是將曲線在特征中的某個(gè)點(diǎn)居中,并僅顯示與該點(diǎn)的預(yù)測(cè)差異[15]。本文擬采用居中個(gè)體條件期望圖顯示該特征的預(yù)測(cè)差異。研究流程圖詳見圖1。 圖1 研究流程圖Fig.1 Research flow chart 本研究納入單相抑郁患者31例,其中男性14例,女性17例,平均年齡(18.16±9.24)歲,HAMD分?jǐn)?shù)(18.16±9.24)分,YMRS(0.23±0.71)分;雙相抑郁患者57例,其中男性25例,女性32例,平均年齡(23.91±9.68)歲,HAMD分?jǐn)?shù)(17.21±7.76)分,YMRS(1.75±1.72)分。兩組間年齡、性別、HAMD評(píng)分差異無統(tǒng)計(jì)學(xué)意義(P>0.05),YMRS與病程差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。單相抑郁患者服用抗抑郁藥物與苯二氮卓類藥物,雙相抑郁患者除服用抗抑郁藥物與苯二氮卓類藥物外,服用心境穩(wěn)定劑與抗精神病性藥物。詳見表1。 表1 人口學(xué)資料Tab.1 Demographic data 對(duì)單相抑郁與雙相抑郁進(jìn)行雙手脈圖參數(shù)比較,其中脈力、脈率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1,組間差異有統(tǒng)計(jì)學(xué)意義(P<0.05);脈位、脈律、脈形、脈勢(shì)、H2、H3、H4、H5、T1、T2、T3、T4、T5、W1、W2、ASS、T、H4/H1、H5/H1、T1/T、T1/T4、(T4-T1)/T、T5/T4、W1/T、W2/T,組間差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。詳見表2。 表2 單相抑郁與雙相抑郁脈圖參數(shù)比較Tab.2 Comparison on scores of pulse graph parameters in different groups 在使用特征選擇清除與模型無關(guān)的變量后,SVM算法優(yōu)化后的特征子集(classif.ce=0.17)為:患者序號(hào)、診斷分組、年齡、抑郁癥狀嚴(yán)重程度、脈律、脈率、脈形、H1、H2、H4、T1、T4、W1、AD、T1/T、(T4-T1)/T、T5/T4、H3/H1,共18個(gè)特征;RF算法優(yōu)化后的特征子集(classif.ce=0.15)為:患者序號(hào)、診斷分組、年齡、抑郁癥狀嚴(yán)重程度、左右手分組、脈律、脈率、脈勢(shì)、脈形、H1、H2、H3、H4、T1、T3、T4、W1、W2、AD、T1/T、(T4-T1)/T、T5/T4、H3/H1、(H3-H1)/H1、W1/T、W2/T,共26個(gè)特征(表3)。 表3 單相抑郁與雙相抑郁脈圖參數(shù)鑒別的特征選擇結(jié)果Tab.3 Feature selection results of pulse graph parameters in different groups 在SVM模型中將抑郁癥狀嚴(yán)重程度、年齡與16個(gè)脈圖參數(shù)作為特征,基于算法進(jìn)行建模,預(yù)測(cè)結(jié)果與訓(xùn)練集中真實(shí)數(shù)據(jù)進(jìn)行比較,最終得出評(píng)判結(jié)果,分類鑒別的準(zhǔn)確率為80.56%,AUC值為83.04%(圖2)。在RF模型中將抑郁癥狀嚴(yán)重程度、年齡、左右手分組與16個(gè)脈圖參數(shù)作為特征,分類鑒別的準(zhǔn)確率為80.56%,AUC值為84.62%(圖2)。SVM模型特征重要性前十位為H4、H2、AD、AGE、(T4-T1)/T、H1、T4、脈率、T5/T4、T1(圖3);RF模型特征重要性前十位為H3、H4、AD、AGE、H2、H1、(T4-T1)/T、脈勢(shì)、T5/T4、H3/H1(圖3)。SVM和RF模型重要性前5位指標(biāo)居中個(gè)體條件期望圖詳見圖4。 圖2 SVM模型與RF模型ROC曲線Fig.2 ROC curve of SVM model and RF model 圖3 特征重要性排序(前10位)Fig.3 Importance ranking of features (top 10) 圖4 Centered ICE plot圖(前5位)Fig.4 Centered ICE plot (top 5 )ICE:individual conditional expectation;SVM:support vector machines;RF:random forest. 本研究通過分析單相抑郁患者、雙相抑郁患者的脈圖參數(shù),使用常規(guī)統(tǒng)計(jì)學(xué)方法與較為先進(jìn)的機(jī)器學(xué)習(xí)算法來評(píng)估中醫(yī)脈象識(shí)別單相抑郁與雙相抑郁鑒別診斷的可行性。兩組患者在性別、年齡、抑郁程度上差異無統(tǒng)計(jì)學(xué)意義,YMRS分?jǐn)?shù)均小于6分,患者處于抑郁發(fā)作狀態(tài)。常規(guī)統(tǒng)計(jì)學(xué)方法在對(duì)患者的雙手脈圖參數(shù)的分析中得到脈力、脈率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1共7個(gè)變量的差異有統(tǒng)計(jì)學(xué)意義,表明脈圖參數(shù)在區(qū)分單雙相抑郁中具有一定的可行性;SVM模型與RF模型分別進(jìn)行特征選擇,清除與模型無關(guān)的變量,得到優(yōu)化后的特征子集,并對(duì)其進(jìn)行建模,鑒別準(zhǔn)確率均為80.56%,AUC值處于0.80~0.85,具有較好的準(zhǔn)確率和穩(wěn)定性[16],其中AD、H2、H3、H4、(T4-T1)/T、AGE是最相關(guān)的特征變量。 脈圖是血管波動(dòng)的直觀體現(xiàn),脈圖參數(shù)是反映人體心臟、血管、血液等功能的有效信息。在對(duì)脈圖參數(shù)進(jìn)行常規(guī)統(tǒng)計(jì)學(xué)時(shí)發(fā)現(xiàn),脈力、脈率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1共7個(gè)變量差異有統(tǒng)計(jì)學(xué)意義,脈圖參數(shù)可以對(duì)單相抑郁與雙相抑郁進(jìn)行鑒別,進(jìn)而進(jìn)行了機(jī)器學(xué)習(xí)模型的構(gòu)建,得到特性重要性的排序。其中特征H1為主波幅度,即主波峰頂?shù)矫}搏波圖基線的高度,主要反映左心室的射血功能和大動(dòng)脈的順應(yīng)性。H2為主波峽高度、H3為潮波高度,即潮波峰頂?shù)矫}象圖基線的幅度。H2與H3生理意義較一致,主要反映動(dòng)脈血管張力和外周阻力狀態(tài)。H4為降中峽高度,為降中峽谷底到脈搏波圖基線的高度。降中峽高度也同樣可以反映動(dòng)脈血管外周阻力的大小,常常與被試者舒張壓相應(yīng)。H1與脈力有關(guān),H1越大,脈力越強(qiáng)。H2、H3與H4值越大,表明血壓升高時(shí)所遇到的外周阻力越大,血管張力越高,彈性越差[17]。AD為舒張期對(duì)應(yīng)的脈圖面積,AD值增大,左室射血分?jǐn)?shù)增大[18]。T1/T4為T1左心室的快速射血期與T4左心室的收縮期的比值,(T4-T1)/T為T4與T1的差值與全脈搏周期的比值,T1/T4值越大,(T4-T1)/T值越小,反映心臟急性射血期速度越慢,左心收縮功能減弱[19]。 在centered ICE plot圖中可以看到在SVM與RF兩個(gè)模型中年齡對(duì)于分類鑒別具有一定的貢獻(xiàn),機(jī)器學(xué)習(xí)認(rèn)為鑒別時(shí)雙相抑郁患者預(yù)測(cè)年齡與單相抑郁患者相比較小,這與流行病學(xué)研究雙相抑郁障礙的發(fā)病年齡要早于單相抑郁癥一致[20]。脈圖參數(shù)是反映血管功能的有效指標(biāo),抑郁癥與雙相情感障礙等患者可能因情緒變化而影響血管內(nèi)皮功能最終加速動(dòng)脈粥樣硬化和早期心血管病的形成[21]。本研究中單雙相抑郁患者均H1值較大,H3/H1>0.7,均體現(xiàn)患者動(dòng)脈血管處于高張力、高阻力狀態(tài),具有血管彈性差、外周阻力增加的特點(diǎn)[22]。這都提示患者可能已出現(xiàn)血管內(nèi)皮功能受損,具有早期心血管疾病的可能,目前單相抑郁與雙相抑郁血管功能的比較研究還需要進(jìn)一步的研究。 從中醫(yī)理論理解,在脈圖中H1、H2、H3、H3/H1、H4提示單相抑郁與雙相抑郁均為弦脈脈象,H1、AD、T1/T4與(T4-T1)/T則體現(xiàn)患者整體的虛實(shí)。弦脈血管彈性較大,壓力傳導(dǎo)速度加快,使得重搏前波抬高(H2、H3);血管血流排空速度減慢,使得降中峽高估也有所增加(H4)[23]、H3/H1、(H3-H1)/H1增大;AD與(T4-T1)/T主要體現(xiàn)左心室射血分?jǐn)?shù)與左心收縮功能的強(qiáng)弱,值較大時(shí)被試者通常為健康人或者實(shí)證患者,值較小時(shí)被試者多為虛證患者[24]。單相抑郁患者較雙相情感障礙患者H3/H1、(H3-H1)/H1值較大提示單相抑郁患者脈象較弦。而大部分雙相抑郁患者H1、AD與(T4-T1)/T值比單相抑郁患者較大,這暗示雙相情感障礙患者在躁狂、抑郁相與穩(wěn)定期三者之間反復(fù),雙相抑郁患者的脈象較弦且有力,呈實(shí)象;單相抑郁患者脈較弦且無力,呈虛象,既往中醫(yī)文獻(xiàn)研究[25]顯示從陰陽角度理解雙相情感障礙抑郁發(fā)作的病機(jī)可能與為陰陽不平衡,陽氣功能活動(dòng)的失常,陰虛失守而至的陽郁有關(guān),而單相患者可能與陽弱失用有關(guān),在脈象上與本研究結(jié)果相契合。雙相抑郁患者雖然癥狀表現(xiàn)與單相抑郁相似,均呈現(xiàn)情緒低落、興趣減退、快感缺失等虛相,但是本質(zhì)可能為實(shí)證偏多,這也許是雙相抑郁患者易轉(zhuǎn)躁的原因。遺憾的是在SVM與RF兩個(gè)模型中H2與H3在鑒別時(shí)沒有呈現(xiàn)一致的趨勢(shì),還需要進(jìn)一步探索。 臨床上,單雙相患者多因情志刺激而出現(xiàn)氣機(jī)紊亂而在脈象上共同具有弦脈的特點(diǎn)[26],但其本質(zhì)是不同的。單相抑郁虛多實(shí)少,雖易出現(xiàn)氣郁化火,但隨病程發(fā)展常兼夾氣虛、陰虛、血虛、腎虛等虛證,脈象多為弦緩、弦細(xì)脈。雙相抑郁則不然,常表現(xiàn)為實(shí)多虛少,易出現(xiàn)內(nèi)生火熱,邪熱擾神,抑郁癥狀伴隨煩躁易怒、面部痤瘡、舌邊尖紅較多,脈象多弦而有力,可隨病程轉(zhuǎn)化為躁狂與混合狀態(tài)。 綜上所述,本研究使用統(tǒng)計(jì)學(xué)分析脈圖參數(shù)與建立相關(guān)機(jī)器學(xué)習(xí)模型兩種方式進(jìn)行單雙相抑郁鑒別,得出脈圖差異變量與分類模型,且模型具有較好的鑒別準(zhǔn)確率和穩(wěn)定性。脈圖參數(shù)作為客觀化評(píng)價(jià)指標(biāo),對(duì)于臨床早期鑒別單雙相抑郁患者提供了有力的依據(jù),后續(xù)本課題組將對(duì)特征變量聯(lián)系臨床表現(xiàn)進(jìn)行進(jìn)一步的探索。1.4 單相抑郁與雙相抑郁脈圖參數(shù)鑒別模型算法
1.5 單相抑郁與雙相抑郁脈圖參數(shù)鑒別模型優(yōu)化
1.6 統(tǒng)計(jì)分析與脈圖參數(shù)鑒別模型結(jié)果評(píng)價(jià)
1.7 統(tǒng)計(jì)學(xué)方法
2 結(jié)果
2.1 一般資料
2.2 單相抑郁與雙相抑郁脈圖參數(shù)比較
2.3 單相抑郁與雙相抑郁脈圖參數(shù)鑒別的特征選擇
2.4 預(yù)測(cè)結(jié)果及單相抑郁與雙相抑郁脈圖參數(shù)鑒別模型性能
3 討論