屈云艷,王 偉,許 寧,熊周璇,張婷婷,曲蒙蒙,高 梅,余海濱
(1.河南中醫(yī)藥大學(xué),河南 鄭州 450000 2.河南中醫(yī)藥大學(xué)第一附屬醫(yī)院,河南 鄭州 450000)
支氣管擴(kuò)張癥是由于遺傳、繼發(fā)感染、免疫等原因引起支氣管樹(shù)病理性、不可逆性擴(kuò)張,進(jìn)而反復(fù)發(fā)生化膿性感染的氣道慢性炎癥。病情持續(xù)進(jìn)展會(huì)嚴(yán)重?fù)p壞患者正常肺組織及其功能,嚴(yán)重降低患者生活質(zhì)量,無(wú)論是對(duì)個(gè)人還是社會(huì),都造成了沉重的經(jīng)濟(jì)負(fù)擔(dān)[1]。中醫(yī)藥在緩解支氣管擴(kuò)張癥臨床癥狀、降低發(fā)作頻率、改善肺功能等方面有顯著療效。然而缺乏規(guī)范的證候診斷標(biāo)準(zhǔn)是限制中醫(yī)藥充分發(fā)揮療效的重要原因之一,因此對(duì)支氣管擴(kuò)張癥常見(jiàn)證候及癥狀分布特點(diǎn)進(jìn)行研究,對(duì)支氣管擴(kuò)張癥證候診斷標(biāo)準(zhǔn)的建立尤其重要[2]。本研究基于有關(guān)支氣管擴(kuò)張癥患者的病歷記錄,運(yùn)用不同的統(tǒng)計(jì)學(xué)及數(shù)據(jù)分析方法,探究支氣管擴(kuò)張癥的常見(jiàn)證型及其癥狀分布特點(diǎn),為支氣管擴(kuò)張癥中醫(yī)證型標(biāo)準(zhǔn)的建立提供客觀依據(jù)。
1.1 數(shù)據(jù)提取 基于醫(yī)院信息數(shù)據(jù)系統(tǒng),提取2012年1月至2019年12月于河南中醫(yī)藥大學(xué)第一附屬醫(yī)院呼吸科住院的2 907例支氣管擴(kuò)張癥患者的電子病歷,利用人機(jī)協(xié)同表型譜標(biāo)注系統(tǒng)對(duì)所需陽(yáng)性癥狀及證候詞條信息進(jìn)行抽取[3]。
1.2 癥狀及證候術(shù)語(yǔ)規(guī)范 對(duì)癥狀及證候類數(shù)據(jù)的規(guī)范化替換、拆分主要參考《中醫(yī)臨床診療術(shù)語(yǔ)》[4]、《中醫(yī)證候鑒別診斷學(xué)》[5]等。如“咳痰,色黃”規(guī)范為“咳黃痰”,“口、鼻、咽干燥”拆分為“口干,鼻干,咽干”,“形體消瘦”和“近期體質(zhì)量下降”統(tǒng)一為“消瘦”,證型“痰濁壅肺證”“痰濕蘊(yùn)肺證”統(tǒng)一規(guī)范為“痰濕阻肺證”。
1.3 統(tǒng)計(jì)學(xué)方法 使用頻次描述統(tǒng)計(jì)規(guī)范化之后的臨床常見(jiàn)證候分布情況;采用Lantern 5.0軟件構(gòu)建隱結(jié)構(gòu)模型[6],應(yīng)用爬山法(LTM-EAST)算法建立支氣管擴(kuò)張癥隱結(jié)構(gòu)模型,結(jié)合醫(yī)學(xué)專業(yè)知識(shí)綜合聚類并分析判斷常見(jiàn)證型;運(yùn)用SPSS 20.0軟件,開(kāi)展因子分析降維及系統(tǒng)聚類分析[7],用最大方差法得出旋轉(zhuǎn)因子載荷矩陣,提取公因子,設(shè)置平方歐氏距離計(jì)算各類之間的距離,組間聯(lián)接方法進(jìn)行維度分類,進(jìn)行系統(tǒng)聚類分析,結(jié)合樹(shù)狀圖及專業(yè)知識(shí)推斷出支氣管擴(kuò)張癥的常見(jiàn)中醫(yī)證型。
2.1 2 907例支氣管擴(kuò)張癥癥狀及證型分布情況 納入的2 907份病例記錄中涉及43個(gè)給定證候,其中頻率大于5%的有痰熱蘊(yùn)肺證、痰濕阻肺證、肺氣陰兩虛證、痰瘀阻肺證、肺脾氣虛證、肺腎氣虛證,頻次≥10次的證型見(jiàn)表1。涉及219個(gè)癥狀,其中頻次>30次的癥狀有67個(gè)。見(jiàn)圖1。
表1 支氣管擴(kuò)張癥中醫(yī)證型分布
2.2 癥狀隱結(jié)構(gòu)模型分析
2.2.1 構(gòu)建隱結(jié)構(gòu)模型 應(yīng)用Lantern 5.0軟件,對(duì)頻次>30次的癥狀,共計(jì)67個(gè)顯變量(X1、X2、X3……X67)進(jìn)行隱結(jié)構(gòu)模型構(gòu)建,得出23個(gè)隱變量(Y0、Y1、Y2……Y23),每個(gè)隱變量有2個(gè)到多個(gè)隱類,共54個(gè)隱類。見(jiàn)圖1。
注:每條邊的粗細(xì)顯示兩個(gè)節(jié)點(diǎn)之間的互信息大小,邊越粗代表兩節(jié)點(diǎn)關(guān)系越密切,括號(hào)內(nèi)數(shù)值為隱類個(gè)數(shù)
2.2.2 綜合聚類及模型詮釋 在構(gòu)建的隱結(jié)構(gòu)模型基礎(chǔ)上,依據(jù)醫(yī)學(xué)專業(yè)知識(shí),綜合考慮某證候多個(gè)側(cè)面信息,選取能反映其所有側(cè)面的顯變量,進(jìn)行綜合聚類及模型詮釋,得到該證候的綜合聚類模型。例如,隱結(jié)構(gòu)模型圖(見(jiàn)圖1)中Y6中易感冒、乏力、面色白等,Y12中口渴、手足心熱、胸痛,Y13自覺(jué)發(fā)熱、口干、咽干,Y23自汗出、盜汗、腰痛,都與肺氣陰兩虛有關(guān),因此對(duì)隱變量Y6、Y12、Y13、Y23進(jìn)行綜合聚類分析,結(jié)果見(jiàn)圖2。對(duì)23個(gè)隱變量進(jìn)行綜合聚類后,得到8個(gè)聚類即推出8個(gè)證型(記為Z1、Z2……Z8),見(jiàn)表2。對(duì)其他綜合聚類結(jié)果進(jìn)行類似的詮釋分析,得到Z1—Z8共8個(gè)綜合聚類結(jié)果,具體對(duì)應(yīng)證候見(jiàn)表2。
表2 隱結(jié)構(gòu)綜合聚類
圖2 Z1綜合聚類結(jié)果
模型詮釋以Z1(肺氣陰兩虛證)為例,信息曲線圖顯示了累計(jì)信息覆蓋達(dá)到95%的癥狀特征分布情況,從圖3中可見(jiàn)咽干、口渴、口干、易感冒癥狀信息覆蓋率已達(dá)到95%。類概率分布表中隱變量Z1把數(shù)據(jù)分為S0、S1兩個(gè)隱類,其中S0占總?cè)巳旱?1%,S1占29%。每個(gè)癥狀有兩種表現(xiàn)形式,其中S0列代表癥狀不出現(xiàn)的概率,S1列代表癥狀出現(xiàn)的概率,見(jiàn)表3。以Z1為例,S1類人群中咽干、口渴、口干、易感冒、自汗出、盜汗、手足心熱癥狀出現(xiàn)的概率依次為0.8、0.63、0.81、0.78、0.54、0.16、0.10,而S0中出現(xiàn)上述癥狀的概率依次為0.08、0.03、0.13、0.17、0.15、0.01、0.07等,對(duì)比可知,癥狀在S1類人群中出現(xiàn)的概率較高,可認(rèn)為是肺氣陰兩虛證的表現(xiàn),S0則是沒(méi)有肺氣陰兩虛證表現(xiàn)。
注:紅色曲線表示各癥狀與Z1兩兩互信息(關(guān)聯(lián)程度)高低;藍(lán)色曲線表示各癥狀對(duì)Z1的互信息的累積覆蓋度
表3 Z1(肺氣陰兩虛證)概率分布表
2.3 系統(tǒng)聚類分析 使用SPSS軟件對(duì)頻次大于60次的52個(gè)癥狀進(jìn)行因子分析。首先,對(duì)各變量之間的相關(guān)性進(jìn)行檢測(cè),檢測(cè)結(jié)果KMO值為0.711,Bartlett的球形度檢驗(yàn)對(duì)應(yīng)的P值小于0.001,表示各變量不獨(dú)立存在,相互之間有明顯關(guān)聯(lián)性,可進(jìn)行因子分析,使用相關(guān)性矩陣方法分析,用最大方差法獲得旋轉(zhuǎn)因子載荷矩陣,最終提取18個(gè)公因子(記作F1、F2……F18),保留因子載荷系數(shù)≥0.3的變量。
對(duì)所提取的公因子進(jìn)行系統(tǒng)聚類分析,并繪制聚類樹(shù)狀圖(見(jiàn)圖4),在選擇閾值為12.5的情況下,得到10類變量組合(記為C1、C2……C10),根據(jù)各公因子所代表的癥狀(因子載荷系數(shù)≥0.3),結(jié)合專業(yè)知識(shí),推導(dǎo)出10個(gè)證型,其中C1由公因子F6、F13、F15組成(陰虛內(nèi)熱兼血瘀證);C2由F4、F5、F7、F10、F18組成(肺脾氣虛兼外感證);C3包括F16(痰熱蘊(yùn)肺證);C4包括F9(痰濕阻肺證);C5包括F1、F11(肺氣陰兩虛證);C6包括F8(兼證絡(luò)傷咳血證);C7包括F2、F3(肺腎氣虛證);C8包括F17(脾氣虛證);C9包括F14(風(fēng)熱犯肺證);C10包括F12(陰虛肺熱證)。見(jiàn)表4。
表4 因子分析與系統(tǒng)聚類分析結(jié)果
圖4 聚類分析樹(shù)狀圖
2.4 支氣管擴(kuò)張癥中醫(yī)常見(jiàn)證型 綜合以上結(jié)果,痰熱蘊(yùn)肺證、痰濕阻肺證、肺氣陰兩虛證、肺脾氣虛證、肺腎氣虛證在隱結(jié)構(gòu)及系統(tǒng)聚類結(jié)果中均出現(xiàn),證型頻次統(tǒng)計(jì)中占比也較高,而風(fēng)熱犯肺證、痰瘀阻肺證及陰虛肺熱證在兩種分析結(jié)果中出現(xiàn),但證型頻次占比相對(duì)較低。參考中醫(yī)證型標(biāo)準(zhǔn)的制定原則,3種數(shù)據(jù)分析方法中重復(fù)出現(xiàn)至少2次的有痰熱蘊(yùn)肺證、痰濕阻肺證、風(fēng)熱犯肺證、痰瘀阻肺證、肺氣陰兩虛證、陰虛肺熱證、肺脾氣虛證、肺腎氣虛證8個(gè)證型,可認(rèn)為是支氣管擴(kuò)張癥的臨床常見(jiàn)中醫(yī)證型,見(jiàn)表5。
表5 支氣管擴(kuò)張癥常見(jiàn)證型及癥狀分布
中醫(yī)證候數(shù)據(jù)具有非線性、復(fù)雜性、非定量性等特點(diǎn)[8],需運(yùn)用與中醫(yī)辨證理論相貼合的現(xiàn)代數(shù)據(jù)分析技術(shù),從海量數(shù)據(jù)中發(fā)掘其中隱含的有意義的聯(lián)系[9]。目前常用的證候數(shù)據(jù)分析方法可大致分為有監(jiān)督和無(wú)監(jiān)督數(shù)據(jù)分析方法兩大類[10],不同的分析方法各有優(yōu)缺點(diǎn),為形成優(yōu)勢(shì)互補(bǔ)提高研究結(jié)果的可信度,本研究采用3種不同的數(shù)據(jù)分析方法,其中隱結(jié)構(gòu)模型、系統(tǒng)聚類分析均屬于無(wú)監(jiān)督的分析方法,頻數(shù)描述性分析屬有監(jiān)督的分析方法。隱結(jié)構(gòu)模型基于證候數(shù)據(jù)的多維多階性[11],為中醫(yī)辨證建立的一種客觀、定量的研究方法[12-13],本研究提取臨床中真實(shí)的電子病歷中記錄的支氣管擴(kuò)張癥癥狀(顯變量),構(gòu)建隱結(jié)構(gòu)模型,結(jié)合專業(yè)知識(shí)綜合聚類后,推出8個(gè)臨床常見(jiàn)證型??偰P图案骶C合聚類模型的貝葉斯信息標(biāo)準(zhǔn)(BIC)評(píng)分均較好。本研究在進(jìn)行因子分析及系統(tǒng)聚類時(shí)發(fā)現(xiàn),若選取的癥狀頻次過(guò)低,則因子分析時(shí)旋轉(zhuǎn)成分矩陣無(wú)法收斂,或聚類樹(shù)狀圖不能歸納出有實(shí)際意義的證型,當(dāng)提取頻次>60次的52個(gè)癥狀變量時(shí),可得到較為理想的聚類結(jié)果,結(jié)合專業(yè)知識(shí),進(jìn)而推斷出各聚類所代表的10個(gè)潛在證型。綜合有監(jiān)督學(xué)習(xí)方法中的頻數(shù)描述分析結(jié)果最終推出支氣管擴(kuò)張癥8個(gè)臨床常見(jiàn)證型。
支氣管擴(kuò)張癥病程長(zhǎng)且病理改變不可逆轉(zhuǎn),臨床表現(xiàn)為持續(xù)或反復(fù)性咳嗽、咳痰,或伴有痰中帶血、咯血,在中醫(yī)學(xué)中歸屬于“咳嗽”“咯血”“肺癰”“肺痿”范疇[14]。支氣管擴(kuò)張癥多因稟賦不足、外邪侵襲、久病虛損、癥積阻塞,病性為本虛標(biāo)實(shí),急性發(fā)作期偏于邪實(shí),慢性遷延期偏本虛,實(shí)邪為痰熱、痰濕、瘀血,正虛多為氣虛、陰虛、氣陰兩虛[15]。本研究總結(jié)出支氣管擴(kuò)張癥8種常見(jiàn)證型,包括痰熱蘊(yùn)肺證、痰濕阻肺證、風(fēng)熱犯肺證、痰瘀阻肺證、肺氣陰兩虛證、陰虛肺熱證、肺脾氣虛證、肺腎氣虛證,以上證型在既往文獻(xiàn)研究中均有報(bào)道[16-19]。根據(jù)病程演變,本病初期因外邪侵襲肺衛(wèi)、風(fēng)熱為主,內(nèi)郁于肺,或肺臟蓄熱,又受外風(fēng),熱傷肺氣,肺失宣降,臨床可表現(xiàn)為風(fēng)熱犯肺證;急性發(fā)作期即感染期,總屬邪熱蘊(yùn)肺,蒸液為痰,熱毒浸淫及血,熱傷血脈,血為之凝聚,臨床表現(xiàn)為痰熱蘊(yùn)肺證、痰瘀阻肺證;緩解期以正虛或正虛邪戀為主,因病程遷延不愈,肺氣損傷日久,累及脾土,脾為肺之母,子盜母氣,導(dǎo)致肺脾氣虛證;脾失運(yùn)化,無(wú)以化生、疏布津液,聚生痰液,則見(jiàn)痰濕阻肺證;肺虛損日久,母病及子,累及腎臟,致腎不納氣,則可見(jiàn)肺腎氣虛證;肺體受損,傷陰耗氣,致肺氣陰兩虛,或陰虛生內(nèi)熱,或正虛邪戀,陰津已虧,邪熱未去,則可見(jiàn)陰虛肺熱證。
本研究尚存在兩點(diǎn)需要注意的問(wèn)題:一是由于醫(yī)院系統(tǒng)原因未提取出舌脈信息,使證型癥狀描述不夠全面;二是隱結(jié)構(gòu)分析中某個(gè)綜合隱類中會(huì)出現(xiàn)個(gè)別與整體證型不符合的癥狀[20],增加了模型解釋的難度。如綜合聚類C2中,反酸燒心、腰痛癥狀并不符合肺脾氣虛兼外感證的特點(diǎn),考慮以下幾個(gè)原因:首先,研究數(shù)據(jù)來(lái)源于呼吸科住院患者出院診斷中存在“支氣管擴(kuò)張癥”這一診斷的病歷,且老年人居多,患者多存在合并病,混雜因素較多;其次,該病病機(jī)本虛標(biāo)實(shí),臨床常見(jiàn)虛實(shí)夾雜之兼證,顯現(xiàn)的癥狀亦會(huì)出現(xiàn)虛實(shí)夾雜的現(xiàn)象。