史 琦 陳建新 趙慧輝 王 偉
(1 中日友好醫(yī)院中醫(yī)肺病二部,國家中醫(yī)藥管理局重點(diǎn)研究室(肺病慢性咳喘),中醫(yī)藥防治過敏性疾病北京市重點(diǎn)實(shí)驗(yàn)室(BZ0321),中日友好醫(yī)院呼吸中心;國家呼吸疾病臨床研究中心,北京,100029; 2 北京中醫(yī)藥大學(xué),北京,100029)
冠狀動脈粥樣硬化性心臟病指冠狀動脈(冠脈)發(fā)生粥樣硬化引起管腔狹窄或閉塞,導(dǎo)致心肌缺血、缺氧或壞死而引起的心臟病,簡稱冠心病(Coronary Heart Disease,CHD),又稱缺血性心臟病(Ischemic Heart Disease)。中醫(yī)學(xué)注重整體觀念和辨證論治,在冠心病的防御和治療方面已逐步顯示出其優(yōu)勢和特色。近年來,冠心病中醫(yī)證候?qū)W的研究多采用冠脈造影金標(biāo)準(zhǔn)作為疾病診斷標(biāo)準(zhǔn),在以往文獻(xiàn)研究、回顧性研究基礎(chǔ)上采用臨床流行病學(xué)前瞻性研究,同時在系統(tǒng)論思想的指導(dǎo)下不斷引入系統(tǒng)生物學(xué)方法,使得其研究在客觀化、標(biāo)準(zhǔn)化方面取得了一定的成果和進(jìn)展。中醫(yī)“證”本質(zhì)的研究在現(xiàn)代醫(yī)學(xué)“實(shí)證主義”及“還原論”思想的引領(lǐng)下成為研究熱點(diǎn)。但由于“證”不是對人體某個局部的反應(yīng),而是涉及到多個系統(tǒng)、多個器官、多個層次的整體反應(yīng),因此單系統(tǒng)、單層面的證候?qū)W研究顯然難以全面揭示其科學(xué)內(nèi)涵。
數(shù)據(jù)挖掘(Data Mining,DM)為解決“數(shù)據(jù)豐富,知識貧乏”狀況而誕生,是數(shù)據(jù)庫研究中極具應(yīng)用前景的信息技術(shù)研究領(lǐng)域,融合了統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)、人工智能、神經(jīng)網(wǎng)絡(luò)、信息檢索、模式識別和數(shù)據(jù)可視化等多個領(lǐng)域的理論和技術(shù)[1]。中醫(yī)證候具有相對規(guī)律性、非單一趨向性改變的特點(diǎn),其研究數(shù)據(jù)屬于大量、隨機(jī)、模糊性數(shù)據(jù),涵蓋了人體多方面、多層次、多指標(biāo)的病理生理過程。數(shù)據(jù)挖掘技術(shù)正是一種從大量、有噪聲、不完全的實(shí)際數(shù)據(jù)中,提取隱含規(guī)則、挖掘潛在信息的過程。決策樹(Decision Tree,DT)是通過一系列規(guī)則對復(fù)雜數(shù)據(jù)進(jìn)行分類的過程[2]。中醫(yī)四診信息數(shù)量龐雜,在現(xiàn)代醫(yī)學(xué)看來并非疾病的臨床特異性表現(xiàn),在西醫(yī)臨床診斷和療效評價過程中的作用微乎其微。應(yīng)用決策樹的數(shù)據(jù)挖掘方法可以提取出與相應(yīng)證型相關(guān)度最大的中醫(yī)四診信息要素,從而形成證候診斷模型。中醫(yī)辨證過程以四診信息為基礎(chǔ),臨床常規(guī)生物學(xué)指標(biāo)在辨證過程中常被忽視,然而我們前期的研究發(fā)現(xiàn)宏觀層面的中醫(yī)證候與微觀層面的病理生理進(jìn)程之間的互通可能正是以這些檢測指標(biāo)為基礎(chǔ)[3-4]。
本研究采用卡方自動交互檢測(Chi-squared Automatic Interaction Detector,CHAID)決策樹方法對冠心病不穩(wěn)定性心絞痛(Unstable Angina,UA)痰熱互結(jié)證患者的臨床檢驗(yàn)、檢查指標(biāo)群進(jìn)行了分析處理,提取關(guān)聯(lián)要素,旨在探討臨床常規(guī)生物學(xué)指標(biāo)的組合模式在UA患者中醫(yī)證候/證候要素識別中的作用和意義。
1.1 一般資料 選取2010年4月至2011年4月中日友好醫(yī)院、東直門醫(yī)院、北京安貞醫(yī)院、鄭州市中醫(yī)院、武漢市中醫(yī)醫(yī)院及湖北省中醫(yī)院收治的冠心病不穩(wěn)定性心絞痛住院患者共計411例。
1.2 診斷標(biāo)準(zhǔn) 疾病診斷參照《慢性穩(wěn)定型心絞痛診療指南》(美國心臟病學(xué)院/美國心臟學(xué)會/美國醫(yī)師學(xué)院及美國內(nèi)科學(xué)會聯(lián)合議定,1999年)[5]及《不穩(wěn)定性心絞痛診斷和治療建議》(中華醫(yī)學(xué)會心血管病學(xué)分會制訂,2000年)[6]。中醫(yī)證候、證型診斷參照《中醫(yī)臨床診療術(shù)語·證候部分》(國家技術(shù)監(jiān)督管理局,1997年)[7]及《中藥新藥臨床研究指導(dǎo)原則》(2002年)[8]。
1.3 納入標(biāo)準(zhǔn) 1)符合冠心病不穩(wěn)定性心絞痛診斷標(biāo)準(zhǔn);2)年齡符合35~75歲之間;3)自愿簽訂知情同意書。
1.4 排除標(biāo)準(zhǔn) 1)急性心肌梗死、心包疾病、心肌疾病、心臟神經(jīng)官能癥、肋間神經(jīng)痛、帶狀皰疹等疾病引起胸痛的患者;2)非冠心病引起心絞痛的患者,如風(fēng)濕熱、先天性冠脈畸形、主動脈瓣狹窄或關(guān)閉不全等;3)合并重度心律失常、腦中風(fēng)、腎衰、肺部感染、腫瘤及其他嚴(yán)重原發(fā)性疾病患者;4)合并高血壓患者血壓未經(jīng)控制或控制不佳者(收縮壓≥180 mmHg和/或舒張壓≥110 mmHg);5)妊娠期、哺乳期患者;精神疾病患者;過敏體質(zhì)患者。
1.5 研究方法
1.5.1 臨床辨證及資料采集 入院24 h內(nèi)對患者進(jìn)行現(xiàn)病史、既往史、個人史、中醫(yī)四診信息等內(nèi)容的全面采集和記錄。疾病診斷及中醫(yī)辨證由3名副主任醫(yī)師及以上資格并具有相關(guān)臨床工作經(jīng)驗(yàn)5年及以上的臨床醫(yī)生完成。入院1周內(nèi)完成血、尿、便常規(guī)、生化指標(biāo)(肝功能、腎功能、血糖、血脂、心肌酶、尿酸、電解質(zhì)等)、血清胰島素、糖化血紅蛋白、B型尿鈉肽等指標(biāo)的檢驗(yàn)及胸片、心電圖、心臟彩超等的檢查。
1.5.2 指標(biāo)預(yù)處理方法 1)本研究中臨床常規(guī)理化指標(biāo)具有如下特點(diǎn):指標(biāo)數(shù)量龐雜;2)計數(shù)資料和計量資料混雜;3)部分指標(biāo)存在缺失值;4)各臨床分中心的檢測方法及參考范圍存在差異性。
1.5.3 數(shù)據(jù)預(yù)處理方法 1)缺省值>30%的指標(biāo)予以剔除;2)經(jīng)臨床醫(yī)師判斷無實(shí)際意義的指標(biāo)予以剔除;3)與冠心病心絞痛病理生理過程明確不相關(guān)的指標(biāo)予以剔除;4)采用歸一化方法對最終入選的指標(biāo)進(jìn)行處理,最終用于CHAID決策樹模型篩選的臨床理化指標(biāo)共計90項(xiàng)。
1.5.4 數(shù)據(jù)挖掘及模型驗(yàn)證 篩選過程為:將經(jīng)過預(yù)處理的90項(xiàng)臨床常規(guī)檢測指標(biāo)作為自變量,將是否具有“痰熱互結(jié)證”作為因變量,其中“痰熱互結(jié)證”以“1”代表,“非痰熱互結(jié)證”以“0”代表。適度調(diào)節(jié)父節(jié)點(diǎn)和子節(jié)點(diǎn)數(shù)以保證決策樹模型的良好生長。采用分層10倍交叉驗(yàn)證法,以判斷準(zhǔn)確率、特異度及敏感度均達(dá)到70%以上作為“痰熱互結(jié)證”決策樹分類模型成立。選取上述識別模式中已篩選出的屬性指標(biāo)作為自變量,以“痰熱互結(jié)證”作為因變量,對來自于北京安貞醫(yī)院的212例病例進(jìn)行已建立模型的外驗(yàn)證,計算模型的判斷準(zhǔn)確率、敏感度及特異度。
1.6 統(tǒng)計學(xué)方法 采用SPSS 17.0 CHAID決策樹方法進(jìn)行證候識別規(guī)律的挖掘。
2.1 2組患者基線情況比較 411例UA患者中,男占60.3%,女占39.7%,平均年齡(60.93±8.70)歲。經(jīng)臨床辨證為痰熱互結(jié)證的患者28例(6.8%),非痰熱互結(jié)證患者383例(93.2%)。2組患者在體重指數(shù)方面比較,差異有統(tǒng)計學(xué)意義(P<0.05),在吸煙史方面比較,差異有統(tǒng)計學(xué)意義(P<0.01)。在年齡、性別比例、飲酒史、冠心病病程、合并病以及用藥方面比較,差異無統(tǒng)計學(xué)意義(P>0.05)。見表1。
2.2 痰熱互結(jié)證CHAID決策樹模型結(jié)果 基于90項(xiàng)臨床常規(guī)檢測指標(biāo)建立的CHAID決策樹識別模型結(jié)果顯示:共篩選出8個用于決策樹判斷的屬性指標(biāo),分別是氯離子(Cl)、縮短分?jǐn)?shù)、D-Ⅱ聚體、紅細(xì)胞分布寬度-CV值(RDW-CV)、血常規(guī)紅細(xì)胞(RBC)、肌酸激酶同工酶(CK-MB)、凝血酶原活動度(PTA)和尿毒氮(BUN)。該模型包括了18個節(jié)點(diǎn)和10個終節(jié)點(diǎn),形成了10條判斷是否“痰熱互結(jié)證”的識別路線。比如,Cl離子≤0.367 23,縮短分?jǐn)?shù)>0.493 51,RBC>0.621 00,則判斷為痰熱互結(jié)證的比例為72.7%,非痰熱互結(jié)證的比例為27.3%,見圖1。
表1 2組患者基線情況比較表
注:與痰熱互結(jié)證患者比較,*P<0.05,△P<0.01
圖1 痰熱互結(jié)證CHAID決策樹模型
表2 痰熱互結(jié)證決策樹模型的10倍交叉驗(yàn)證結(jié)果
注:敏感度=TP/(TP+FN);特異度=TN/(TN+FP);準(zhǔn)確率=(TP+TN)/(TP+FP+TN+FN)
圖2 痰熱互結(jié)證決策樹外驗(yàn)證模型
表3 痰熱互結(jié)證外驗(yàn)證決策樹模型的10倍交叉驗(yàn)證結(jié)果
注:敏感度=TP/(TP+FN);特異度=TN/(TN+FP);準(zhǔn)確率=(TP+TN)/(TP+FP+TN+FN)
2.3 決策樹識別模型的驗(yàn)證 10倍交叉驗(yàn)證結(jié)果顯示:該決策樹模型對是否“痰熱互結(jié)證”的識別敏感度為75.0%,特異度為86.9%,準(zhǔn)確率為86.1%。見表2。
2.4 痰熱互結(jié)證決策樹的外驗(yàn)證模型 痰熱互結(jié)證決策樹外驗(yàn)證模型包括7個屬性指標(biāo):Cl離子、縮短分?jǐn)?shù)、RBC、D-Ⅱ聚體、CK-MB、PTA及BUN,原模型中的RDW-CV缺失。該模型形成了17條對判斷是否“痰熱互結(jié)證”的識別路徑。見圖2。
2.5 痰熱互結(jié)證決策樹外驗(yàn)證模型的10倍交叉驗(yàn)證 采用212例UA患者建立的痰熱互結(jié)證外驗(yàn)證模型經(jīng)10倍交叉方法驗(yàn)證后結(jié)果顯示:識別準(zhǔn)確率為85.8%,敏感度為89.5%,特異度為85.5%。見表3。
痰濁和熱毒是冠心病心絞痛患者較為常見的病因病機(jī)?!疤禎帷焙汀盁岫尽睂?dǎo)致冠心病發(fā)生發(fā)展的理論和臨床研究經(jīng)歷了3個時期。萌芽期以《黃帝內(nèi)經(jīng)》和《金匱要略》為代表。《靈樞·邪客》:“心者,五臟之大主,精神之所舍也”。心神對機(jī)體津液代謝具有重要的調(diào)節(jié)作用。心能溫肺助脾,如果脾為濕困,精微不運(yùn),凝結(jié)成痰,流于經(jīng)脈,則滯阻于心脈;心陽可下暖腎水,化氣行津。如心陽虛弱,陰陽氣血不得接續(xù),津液輸布失度,日久則累聚成痰。張仲景在《金匾要略·胸痹心痛短氣病脈證治》中提出“陽微陰弦”是胸痹心痛的主要病機(jī),由此制定的瓜蔞薤白白酒湯、瓜蔞薤白半夏湯等方開創(chuàng)了豁痰寬胸、開痹散結(jié),從痰濁論治冠心病心絞痛的大法?!端貑枴ぶ琳嬉笳摗罚骸帮L(fēng)、寒、濕、火、熱諸邪,皆能致病心痛”,《素問·刺熱篇》:“熱爭則卒心痛,煩悶善嘔,頭痛面赤,無汗”等論述初步提出了“熱毒”致病理論。在發(fā)展期,諸多后世醫(yī)家對“痰熱”理論加以發(fā)揮。如《諸病源候論》:“……邪迫于陽氣,不得宣暢,壅瘀生熱,故心如懸而急煩懊痛也”。《古今醫(yī)鑒》中指出心痛病由實(shí)熱引發(fā):“凡痛在心,連兩脅至兩乳下,牽引背板匙骨下而痛者,實(shí)熱也”。張元素主張“久痛無寒而暴痛非熱”是對“熱厥心痛”的闡述?!坝袩嶝市耐凑?,身熱足寒,痛甚則煩躁而吐,額汗出,知為熱也”?!栋Y因脈治·胸痛論》中“內(nèi)傷胸痛之因,七情六欲,動其心火……;或怫郁氣逆,傷其肺道,則痰凝氣結(jié)”,體現(xiàn)了痰熱互因。隨著現(xiàn)代醫(yī)學(xué)的不斷發(fā)展,冠心病中醫(yī)“痰”“熱”研究日臻成熟。冠心病證候要素的相關(guān)研究發(fā)現(xiàn),建立的2 029例冠心病心絞痛患者的證候數(shù)據(jù)庫中痰濁偏熱證在心絞痛證候分布特點(diǎn)上具有重要的位置[9]。采用西雅圖心絞痛量表(SAQ)評價了233例冠心病心絞痛患者的生命質(zhì)量(軀體活動受限程度、心絞痛穩(wěn)定狀態(tài)、發(fā)作情況、治療滿意度及疾病認(rèn)識程度5個維度)發(fā)現(xiàn),其中對于生命質(zhì)量的影響結(jié)果顯示痰濁證呈現(xiàn)負(fù)相關(guān),而熱蘊(yùn)證呈現(xiàn)正相關(guān);熱蘊(yùn)證可以保護(hù)心絞痛發(fā)作并影響心絞痛的穩(wěn)定狀態(tài),痰濁證對治療滿意度呈負(fù)向影響[10]。
中醫(yī)學(xué)的證候是在西醫(yī)學(xué)疾病概念的基礎(chǔ)上,對獨(dú)立的病理、生理進(jìn)程的整體概括和反應(yīng)。若將現(xiàn)代醫(yī)學(xué)中以“金標(biāo)準(zhǔn)”診斷疾病的思路方法套用至中醫(yī)證候?qū)W研究中,則必將導(dǎo)致中醫(yī)“證”的泛濫。生物學(xué)指標(biāo)與“證”的相關(guān)性研究曾一度成為中醫(yī)證候?qū)W研究的范式,但線性相關(guān)性結(jié)果難以揭示“證”的整體性。比如在冠心病中醫(yī)證候與冠脈造影結(jié)果相關(guān)性研究中,有學(xué)者認(rèn)為,冠心病實(shí)證(心血瘀阻型、痰濁內(nèi)阻型)患者冠狀動脈病變較虛證(心氣虛弱型、心腎陰虛型)重,實(shí)證以多支病變?yōu)橹?,虛證以單支病變?yōu)橹?;冠脈病變積分由高到低依次為心血瘀阻型>痰濁內(nèi)阻型>心氣虛弱型>心腎陰虛型。另有學(xué)者通過比較分析中醫(yī)證候與冠狀動脈Gensini積分、病變支數(shù)的關(guān)系發(fā)現(xiàn)冠心病患者中醫(yī)實(shí)證組以單支病變?yōu)橹?41.3%),高于虛證組(25.0%)和虛實(shí)夾雜證組(23.6%);虛證組患者的冠狀動脈病變累及支數(shù)大于虛實(shí)夾雜證組和實(shí)證組;虛證組的Gensini積分亦高于虛實(shí)夾雜證和實(shí)證組[11]。上述相互矛盾的研究結(jié)果提示我們線性研究方法無法解決“證”的模糊性和不確定性,只有復(fù)雜性科學(xué)和非線性科學(xué)研究方法的恰當(dāng)引入,才能實(shí)現(xiàn)對“證”這一復(fù)雜系統(tǒng)的實(shí)質(zhì)闡述。
決策樹法是通過確定一系列的if-then邏輯(分枝)關(guān)系,形成分層規(guī)則,從而達(dá)到對研究數(shù)據(jù)進(jìn)行精確預(yù)測或正確分類的目的。決策樹學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的范疇,是一種類似于判別分析的有監(jiān)督的學(xué)習(xí)方法,其分類結(jié)果簡單明確、結(jié)構(gòu)直觀,適用于較大規(guī)模的數(shù)據(jù)集研究[12]。近年來,決策樹在中醫(yī)藥研究中主要應(yīng)用于證候特征及診斷的規(guī)范化、建立中醫(yī)辨證識別模型、證候演變規(guī)律及其影響因素研究等方面[13-14]。Kass于1980年提出了CHAID即卡方自動交互檢測應(yīng)用于分類及等級數(shù)據(jù)的分析[15]。其學(xué)習(xí)過程為選定結(jié)果變量即目標(biāo)變量,分類指標(biāo)與目標(biāo)變量進(jìn)行交叉分類,產(chǎn)生二維分類表;計算一系列二維分類表的卡方值,以P值最小者作為最佳初始分類表,在此基礎(chǔ)上繼續(xù)應(yīng)用分類指標(biāo)對目標(biāo)變量進(jìn)行分類,不斷重復(fù)上述過程直至P值大于設(shè)定的有統(tǒng)計學(xué)意義的α值,分類停止,產(chǎn)生決策樹模型。CHAID的優(yōu)勢在于:分析過程能夠顯示出各個變量之間的相互作用關(guān)系;分析結(jié)果以樹圖形顯示,分析過程及結(jié)果清晰直觀;不會因自變量之間的共線性而遺漏有意義的變量[16]。
本研究的痰熱互結(jié)證決策樹模型包括Cl離子、縮短分?jǐn)?shù)、RDW-CV、血常規(guī)RBC、D-Ⅱ聚體、CK-MB、PTA及BUN共8個屬性指標(biāo)。CHD患者特別是發(fā)生心力衰竭的患者可能出現(xiàn)低氯血癥[17],本研究痰熱互結(jié)證患者的Cl離子水平顯著低于非痰熱互結(jié)證,說明痰熱互結(jié)證患者的電解質(zhì)紊亂情況更加明顯。冠心病心力衰竭陽虛水泛證、心陽虛脫證患者與心氣陰虛證、心氣陽虛證、氣虛血瘀證患者比較,其左室短軸縮短率(FS)有降低趨勢[18]。本研究中,痰熱互結(jié)患者的FS水平無明顯降低,說明痰熱互結(jié)證患者的心室功能尚可。痰熱互結(jié)證患者與非痰熱互結(jié)證患者的RDW水平并無顯著的統(tǒng)計學(xué)線性差異,但在決策樹模型中,RDW水平升高則痰熱互結(jié)證患者的比例上升,說明CHD痰熱證患者中RDW的升高趨勢明顯。研究顯示不穩(wěn)定性心絞痛患者氣虛血瘀證與外周血RBC、MCV、MCHC、DBIL等相關(guān);Logistic回歸結(jié)果顯示:氣虛血瘀證影響因素依次為膽紅素、RBC、MCH、HCT等[19]。本研究中,痰熱互結(jié)證患者RBC計數(shù)增高提示了其血液流變學(xué)的異常情況。D-Ⅱ聚體是交聯(lián)纖維蛋白的降解產(chǎn)物,同時反應(yīng)體內(nèi)的纖溶活性和凝血活動,D-Ⅱ聚體濃度升高是血栓形成和繼發(fā)性纖溶的重要標(biāo)記物。實(shí)驗(yàn)證實(shí)血漿D-Ⅱ聚體和AS密切相關(guān)[20]。研究發(fā)現(xiàn)AMI和UAP患者的血漿D-Ⅱ聚體水平明顯高于SAP患者,且AMI患者升高更加明顯,同時D-Ⅱ聚體還可能與冠脈病變的嚴(yán)重程度相關(guān)[21]。本次研究的識別模型及驗(yàn)證模型中,隨著D-Ⅱ聚體的升高,痰熱互結(jié)證患者的比例增多。CK-MB屬于診斷急性心肌梗死的傳統(tǒng)心肌酶學(xué)指標(biāo)。心肌急性缺血缺氧導(dǎo)致壞死時,細(xì)胞膜通透性改變,心肌細(xì)胞內(nèi)的CK-MB釋放入血清。CK-MB的增高程度能較準(zhǔn)確地反映心肌梗死的范圍,但敏感性不足,與骨骼肌有交叉[22]。痰熱互結(jié)證模型中,CK-MB被篩選為屬性指標(biāo),但其變化趨勢與該證型的關(guān)系需要進(jìn)一步探討。本研究結(jié)果顯示在決策樹模型中,隨著PTA水平的升高,診斷痰熱互結(jié)證的比例也隨之升高,提示痰熱證患者的凝血傾向更加明顯。研究認(rèn)為BUN可能是高血壓等傳統(tǒng)因素之外的冠心病不可忽視的危險因素之一[23]。本研究中,痰熱互結(jié)證患者的BUN水平明顯低于非痰熱互阻證,提示BUN可能不是識別痰熱互結(jié)證的主要屬性指標(biāo)。
中醫(yī)證候?qū)W的研究,其重點(diǎn)在于辨證的客觀化和標(biāo)準(zhǔn)化。目前對于冠心病中醫(yī)證候?qū)W研究已經(jīng)取得了較為豐碩的成果,亟待解決的問題是如何為中醫(yī)辨證提供同時具備良好特異性及敏感性的依據(jù),將辨證指標(biāo)定量化、標(biāo)準(zhǔn)化,進(jìn)而形成獨(dú)特的辨證體系,實(shí)現(xiàn)現(xiàn)代醫(yī)學(xué)病理、生理進(jìn)程與中醫(yī)證候?qū)W病因、病機(jī)之間的良好溝通,最終闡明冠心病中醫(yī)“證”的實(shí)質(zhì)和本質(zhì)。方法學(xué)一直以來都是中醫(yī)證候?qū)W研究的最大瓶頸,中醫(yī)辨證過程具有模糊性、復(fù)雜性、非線性及非定量性等特點(diǎn)。分子生物學(xué)研究方法的介入使得中醫(yī)的“證”向?qū)嵸|(zhì)化邁進(jìn)了一大步,但“證”的本質(zhì)往往不是僅涉及到一種分子,而是由多種分子相互作用而引發(fā)的證候群。針對單一分子的研究只能反應(yīng)辨證實(shí)質(zhì)的一個側(cè)面,缺乏特異性和敏感性。缺乏多層次、多角度及高通量信息特點(diǎn)的“證”的研究也無法對證候進(jìn)行全面闡釋,無法揭示人體作為一個有機(jī)整體的“證”變化規(guī)律。隨著系統(tǒng)論思想和系統(tǒng)生物學(xué)方法的不斷引入,中醫(yī)證候?qū)W的研究已經(jīng)進(jìn)入了立足于復(fù)雜科學(xué)和理論方法的全新階段。數(shù)據(jù)挖掘技術(shù)憑借其特點(diǎn)和優(yōu)勢,逐步實(shí)現(xiàn)了對龐雜的中醫(yī)證候數(shù)據(jù)的綜合考量。數(shù)據(jù)挖掘方法可以有效的對中醫(yī)證候數(shù)據(jù)進(jìn)行分類預(yù)判,獲得證候相關(guān)預(yù)測因子或核心證候,實(shí)現(xiàn)“即時辨證”[24]。中醫(yī)藥信息化的發(fā)展促進(jìn)了多數(shù)研究采用中醫(yī)藥數(shù)據(jù)庫系統(tǒng),實(shí)現(xiàn)了中醫(yī)數(shù)據(jù)的規(guī)范性和高效應(yīng)用,但目前研究大多屬于小樣本范疇,并沒有真正實(shí)現(xiàn)中醫(yī)“大數(shù)據(jù)”概念,研究的真實(shí)性、可重復(fù)性差,眾多研究結(jié)果之間缺乏可比性,甚至篩選出的“核心指標(biāo)”出現(xiàn)相互矛盾,難以指導(dǎo)臨床應(yīng)用。臨床情況的復(fù)雜性和多樣性決定了數(shù)據(jù)挖掘方法建立的證候識別模型實(shí)現(xiàn)“即時準(zhǔn)確辨證”尚待深入研究。我們在前期對冠心病不穩(wěn)定性心絞痛患者血瘀證、氣虛證、痰瘀互阻證等多種證型決策樹模型構(gòu)建及驗(yàn)證的基礎(chǔ)之上[25-27],建立了冠心病患者痰熱互結(jié)證決策樹模型,識別模型的準(zhǔn)確率、特異度及敏感度均達(dá)到75%以上,外驗(yàn)證模型的準(zhǔn)確率、特異度及敏感度均達(dá)到了85%以上。但研究中部分臨床常規(guī)檢測指標(biāo)存在缺失值,CHAID算法不能在樹的增長過程中排除缺失值;病例數(shù)特別是外驗(yàn)證病例數(shù)相對較少,不適宜采用分割驗(yàn)證法對該模型進(jìn)行進(jìn)一步的驗(yàn)證。后續(xù)研究中,我們將把應(yīng)用決策樹方法形成的“網(wǎng)絡(luò)”判斷模型與其他數(shù)據(jù)挖掘方法的識別模式進(jìn)一步比較,從而篩選出用于冠心病不穩(wěn)定性心絞痛患者證候判別的“核心因素”。