朱垚,姬承諾,倪海雯,陸明,3
1.南京中醫(yī)藥大學(xué),江蘇 南京 210029;2.南京中醫(yī)藥大學(xué)附屬醫(yī)院,江蘇 南京 210029;3.南京醫(yī)中科技數(shù)據(jù)挖掘中心,江蘇 南京 210029
淋巴瘤是由淋巴造血系統(tǒng)病變引起的惡性腫瘤,可發(fā)生在身體各部位,癥狀復(fù)雜,主要臨床表現(xiàn)為無(wú)痛性淋巴結(jié)腫大、肝脾腫大等,常伴有發(fā)熱、盜汗、消瘦、皮膚瘙癢或皮疹等全身性癥狀,隨病情發(fā)展逐漸導(dǎo)致全身各組織器官受累,晚期可轉(zhuǎn)化為急性淋巴細(xì)胞白血病。現(xiàn)代醫(yī)學(xué)運(yùn)用靶向藥物、免疫制劑與化療聯(lián)合方案能夠延緩病情進(jìn)展,在一定程度上改善患者預(yù)后,但毒副作用較大,且存在耐藥及復(fù)發(fā)情況。根據(jù)臨床表現(xiàn),淋巴瘤可歸屬中醫(yī)學(xué)“石疽”“陰疽”“痰核”“惡核”“虛勞”等范疇。中醫(yī)藥干預(yù)淋巴瘤主要基于辨證論治,不同醫(yī)家的辨治經(jīng)驗(yàn)各有特點(diǎn),系統(tǒng)整理研究淋巴瘤的中醫(yī)辨證思路及用藥經(jīng)驗(yàn),有助于優(yōu)化該病的中醫(yī)臨床診療方案。本研究通過(guò)收集淋巴瘤相關(guān)臨床醫(yī)案論文,提取病歷信息,建立淋巴瘤臨床醫(yī)案數(shù)據(jù)庫(kù),采用數(shù)據(jù)挖掘方法對(duì)醫(yī)案數(shù)據(jù)進(jìn)行集外關(guān)聯(lián)解析,研究淋巴瘤醫(yī)案不同子項(xiàng)集之間潛在的辨治規(guī)律,尤其關(guān)注中醫(yī)四診辨證信息、病機(jī)證素與治療藥物之間的高關(guān)聯(lián)特征。
以“淋巴瘤”AND“醫(yī)案”O(jiān)R“驗(yàn)案”O(jiān)R“治驗(yàn)”為核心檢索式,選擇中國(guó)知識(shí)資源總庫(kù)(CNKI)為目標(biāo)單源數(shù)據(jù)庫(kù),檢索建庫(kù)至2019 年8 月15 日公開發(fā)表的中醫(yī)治療淋巴瘤醫(yī)案類論文,形成論文數(shù)據(jù)庫(kù),保留Download Index 索引清單,進(jìn)行雙人復(fù)核,確保論文數(shù)據(jù)庫(kù)與索引清單的量值一致。
納入標(biāo)準(zhǔn):①論文醫(yī)案描述中明確“淋巴瘤”診斷;②論文醫(yī)案描述中存在中藥內(nèi)服干預(yù)方案;③論文醫(yī)案描述中有復(fù)診信息,存在可供醫(yī)案療效判斷的癥狀。排除標(biāo)準(zhǔn):在不同論文中記錄了同一主診醫(yī)師的相同醫(yī)案,排除時(shí)序首位記錄外的所有醫(yī)案。
在論文數(shù)據(jù)庫(kù)基礎(chǔ)上,采用Medcase V3.8 診籍中醫(yī)師工作室-名老中醫(yī)經(jīng)驗(yàn)傳承輔助平臺(tái)進(jìn)行醫(yī)案數(shù)據(jù)文本提取,建立淋巴瘤專病醫(yī)案數(shù)據(jù)庫(kù)。錄入完成后進(jìn)行二次數(shù)據(jù)審核。不同研究人員錄入及審核,控制相異率<3%。
針對(duì)醫(yī)案錄入與數(shù)據(jù)文本提取過(guò)程中發(fā)現(xiàn)明顯的癥狀、病機(jī)、治法、藥物、理化檢查等數(shù)據(jù)源錯(cuò)字、別字、誤字、異字及檢查單位、劑量的錯(cuò)記、誤記、漏記等非研究性數(shù)據(jù)噪點(diǎn),進(jìn)行溯源性預(yù)處理,達(dá)到降噪、優(yōu)化的目的。不同研究人員對(duì)溯源數(shù)據(jù)值與修正數(shù)據(jù)值進(jìn)行實(shí)時(shí)雙備份標(biāo)記。
預(yù)處理后的醫(yī)案研究數(shù)據(jù)庫(kù)整體數(shù)據(jù),按照不同分析類型進(jìn)行數(shù)據(jù)規(guī)范化。中醫(yī)藥術(shù)語(yǔ)分項(xiàng)集進(jìn)行規(guī)范化,癥狀項(xiàng)集、診斷項(xiàng)集、病機(jī)項(xiàng)集參照《中醫(yī)診斷學(xué)》[1],藥物項(xiàng)集參照《中藥學(xué)》[2]。數(shù)據(jù)規(guī)范化操作參考《中醫(yī)臨床醫(yī)案數(shù)據(jù)挖掘研究數(shù)據(jù)規(guī)范化標(biāo)準(zhǔn)》(QB/GL MCT 102-2019):①癥狀項(xiàng)集規(guī)范癥狀原生描述前飾或后飾的時(shí)間節(jié)律與程度特征;②診斷項(xiàng)集規(guī)范相同患者的病種與年齡;③病機(jī)項(xiàng)集規(guī)范同一患者多診醫(yī)案的默認(rèn)病機(jī);④藥物項(xiàng)集規(guī)范藥物異名與特殊煎制等。
Medcase V3.8 診籍中醫(yī)師工作室-名老中醫(yī)經(jīng)驗(yàn)傳承輔助平臺(tái)系江蘇省科技創(chuàng)新專項(xiàng)研究成果,由南京中醫(yī)藥大學(xué)國(guó)醫(yī)大師周仲瑛工作室、第二臨床醫(yī)學(xué)院、人工智能與信息技術(shù)學(xué)院聯(lián)合研發(fā)[3],已在江蘇地區(qū)中醫(yī)臨床、教學(xué)、科研單位廣泛使用。本研究采用Medcase 系統(tǒng)的XMiner V1.0 中醫(yī)藥數(shù)據(jù)挖掘平臺(tái)進(jìn)行格式化和編碼,并根據(jù)文本特征計(jì)算數(shù)據(jù)權(quán)重,參考《中醫(yī)臨床醫(yī)案數(shù)據(jù)挖掘研究數(shù)據(jù)分析操作標(biāo)準(zhǔn)》(QB/GL MCT 202-2019)執(zhí)行系統(tǒng)常規(guī)極值處理,實(shí)時(shí)記錄調(diào)參標(biāo)值,基于FP-Growth 加強(qiáng)關(guān)聯(lián)分析算法進(jìn)行挖掘運(yùn)算,并進(jìn)行數(shù)據(jù)可視化表達(dá)。
共納入醫(yī)案138 則,涉及患者138 人次、354 診次,其中男性176 診次(49.72%),女性178 診次(50.28%),年齡6~86 歲。涉及病機(jī)59 條,癥狀215 種,脈象18 種,舌象80 種,藥物451 種。僅記錄初診的單診次醫(yī)案54 則;同時(shí)記錄復(fù)診的多診次醫(yī)案84 則,其中臨床癥狀改善醫(yī)案81 則(96.43%);超過(guò)5 診次的長(zhǎng)診次醫(yī)案17 則,診療時(shí)間超過(guò)6 個(gè)月的長(zhǎng)療程醫(yī)案9 則,超過(guò)12 個(gè)月的長(zhǎng)療程醫(yī)案9則,長(zhǎng)診次及長(zhǎng)療程醫(yī)案臨床癥狀改善率均為100%。
2.2.1 臨床癥狀與藥物
臨床癥狀與藥物集外關(guān)聯(lián)規(guī)則共29 條(見表1)。支持度>0.08、置信度>0.5 的關(guān)聯(lián)規(guī)則為咳嗽與黃芪、咳嗽與陳皮、咳嗽與茯苓、夜寐不安與茯苓、淋巴結(jié)腫大與茯苓、神疲與黃芪、乏力與茯苓、乏力與黃芪。乏力、神疲等與黃芪、茯苓的關(guān)聯(lián)度較高。黃芪味甘性微溫,歸肺、脾、肝、腎經(jīng),可補(bǔ)肺脾腎之氣,臨床用于治療淋巴瘤虛損性證候;茯苓味甘、淡,性平,有滲濕健脾功效,可補(bǔ)益肺脾,治療氣虛等證。
表1 138 則中醫(yī)治療淋巴瘤醫(yī)案臨床癥狀與藥物集外關(guān)聯(lián)規(guī)則(支持度>0.03,置信度>0.5)
2.2.2 病機(jī)與藥物
病機(jī)與藥物集外關(guān)聯(lián)規(guī)則共23 條(見表2)。痰與香附、夏枯草、菟絲子等有較高關(guān)聯(lián),氣虛、血虛等與黃芪有較高關(guān)聯(lián),濕與茯苓有較高關(guān)聯(lián),氣滯與柴胡、香附等高關(guān)聯(lián),脾虛與人參、山藥高關(guān)聯(lián),腎虛與菟絲子、山藥高關(guān)聯(lián)。提示治療淋巴瘤化痰散結(jié)行氣多用香附、夏枯草;出現(xiàn)氣血不足虛性病機(jī)常用黃芪、黨參等補(bǔ)虛藥健脾補(bǔ)氣,以氣生血;脾腎兩虛是淋巴瘤常見病機(jī),多用山藥、人參、菟絲子等補(bǔ)腎健脾之品。
表2 138 則中醫(yī)治療淋巴瘤醫(yī)案病機(jī)與藥物集外關(guān)聯(lián)規(guī)則(支持度>0.05,置信度>0.5)
2.2.3 舌象與藥物
舌象與藥物集外關(guān)聯(lián)規(guī)則共21 條(見表3)。苔厚與生姜、黃芪、山藥、甘草、茯苓高關(guān)聯(lián),質(zhì)淡與白術(shù)、茯苓、黃芪高關(guān)聯(lián),苔黃與茯苓、陳皮高關(guān)聯(lián),苔膩與茯苓高關(guān)聯(lián)。苔厚多為濕阻之候,生姜發(fā)汗利濕,茯苓利水滲濕,黃芪、山藥、甘草健脾益氣。質(zhì)淡多提示氣血不足,白術(shù)、黃芪有健脾益氣功效。苔黃提示有內(nèi)熱,結(jié)合淋巴瘤病癥特點(diǎn),臨床多為氣郁、痰濕久積化熱所致,高關(guān)聯(lián)藥物陳皮、茯苓有理氣健脾、利濕化痰之功。
表3 138 則中醫(yī)治療淋巴瘤醫(yī)案舌象與藥物集外關(guān)聯(lián)規(guī)則(支持度>0.03,置信度>0.5)
2.2.4 脈象與藥物
脈象與藥物集外關(guān)聯(lián)規(guī)則共18 條(見表4)。沉脈、弦脈與陳皮、黃芪、茯苓有較高關(guān)聯(lián),弦脈與茯苓高關(guān)聯(lián),細(xì)脈與黃芪高關(guān)聯(lián)。淋巴瘤多以虛為主,兼有虛實(shí)夾雜。沉脈主里證,弦脈多為氣滯肝郁,細(xì)脈多主虛證,故用陳皮理氣調(diào)中,黃芪益氣升陽(yáng),茯苓利水滲濕兼具補(bǔ)益之功,三藥均有補(bǔ)虛功效又各有所長(zhǎng),可用于虛實(shí)錯(cuò)雜證候。
表4 138 則中醫(yī)治療淋巴瘤醫(yī)案脈象與藥物集外關(guān)聯(lián)規(guī)則(支持度>0.05,置信度>0.5)
2.2.5 臨床癥狀與病機(jī)
臨床癥狀與病機(jī)集外關(guān)聯(lián)規(guī)則共23 條(見表5)。齒松、口僵、夜尿、目澀、喜熱飲、皮膚損傷、感冒與痰高關(guān)聯(lián),脾腫大、皮膚損傷與濕高關(guān)聯(lián),足痛、口僵、夜尿、腹瀉、目澀、潰瘍、浮腫等與各種虛證高關(guān)聯(lián),口僵、皮膚損傷、潰瘍與火熱高關(guān)聯(lián)。提示淋巴瘤與虛證高關(guān)聯(lián)的癥狀較多,涉及氣虛、陰虛、陽(yáng)虛、脾虛等。無(wú)以固攝,腎氣虛則膀胱失約,夜尿增多,脾陽(yáng)虛則運(yùn)化水液失職,易于浮腫,氣滯水停則聚而生痰。陰液不足,虛熱內(nèi)生,則見目澀、潰瘍等虛火上炎諸證。
表5 138 則中醫(yī)治療淋巴瘤醫(yī)案臨床癥狀與病機(jī)集外關(guān)聯(lián)規(guī)則(支持度>0.005,置信度≥0.5)
基于中醫(yī)醫(yī)案的數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)是近年來(lái)中醫(yī)藥研究的熱點(diǎn)范式之一。中醫(yī)醫(yī)案數(shù)據(jù)挖掘研究方法眾多,符合中醫(yī)臨床辨治特點(diǎn)且能有效總結(jié)專家經(jīng)驗(yàn)的挖掘方法以頻數(shù)解構(gòu)、關(guān)聯(lián)規(guī)則、聚類分析為主。關(guān)聯(lián)規(guī)則挖掘算法主要研究項(xiàng)集內(nèi)頻繁項(xiàng)之間的關(guān)聯(lián)性。通過(guò)對(duì)中醫(yī)醫(yī)案實(shí)際數(shù)據(jù)樣本集的系列研究分析發(fā)現(xiàn),通常一個(gè)醫(yī)案數(shù)據(jù)樣本集可根據(jù)中醫(yī)臨床辨治特點(diǎn)設(shè)立多項(xiàng)字段,從而劃分成若干子項(xiàng)集。不同醫(yī)案數(shù)據(jù)子項(xiàng)集內(nèi)的項(xiàng)有較高的相關(guān)性,而不同醫(yī)案數(shù)據(jù)子項(xiàng)集間的項(xiàng)也存在符合中醫(yī)臨床辨治知識(shí)規(guī)律的高相關(guān)性,提示每個(gè)醫(yī)案數(shù)據(jù)子項(xiàng)集與其外部的潛在因子間存在著正向或負(fù)向關(guān)聯(lián)。因此,基于中醫(yī)藥學(xué)知識(shí)發(fā)現(xiàn)的客觀規(guī)律與前期大量中醫(yī)醫(yī)案挖掘?qū)嵺`[4-8],筆者所在研究團(tuán)隊(duì)提出集內(nèi)關(guān)聯(lián)與集外關(guān)聯(lián)的概念,并根據(jù)關(guān)聯(lián)規(guī)則在中醫(yī)醫(yī)案研究中的主要目的,確立集內(nèi)關(guān)聯(lián)與集外關(guān)聯(lián)的內(nèi)涵及外延,擴(kuò)展和豐富了關(guān)聯(lián)規(guī)則挖掘在中醫(yī)醫(yī)案領(lǐng)域的應(yīng)用。本研究通過(guò)對(duì)淋巴瘤醫(yī)案的集外關(guān)聯(lián)解析,系統(tǒng)梳理中醫(yī)診治淋巴瘤臨床真實(shí)世界中癥狀、舌脈、病機(jī)與藥物不同項(xiàng)集間潛在的辨治規(guī)律。
中醫(yī)臨床診療的既往知識(shí)發(fā)現(xiàn),多在臨床醫(yī)師大量診治同類疾病積累經(jīng)驗(yàn)的基礎(chǔ)上,總結(jié)高頻關(guān)聯(lián)性藥癥規(guī)律,形成知識(shí)留存。因此,中醫(yī)臨床常有“有是癥用是藥”的專癥專藥的特色藥物知識(shí)提煉規(guī)則。鄭佳彬等[9]運(yùn)用測(cè)評(píng)量表對(duì)單純中醫(yī)藥治療階段的淋巴瘤患者癥狀進(jìn)行系統(tǒng)性研究,探索淋巴瘤癥狀特征及中醫(yī)證型特點(diǎn),發(fā)現(xiàn)淋巴瘤患者普遍存在多種癥狀,其中發(fā)生頻率最顯著的3 個(gè)癥狀為口干、疲勞、睡眠不安,強(qiáng)度最顯著的3 個(gè)癥狀分別是疲勞、出汗、口干;淋巴瘤患者辨證常出現(xiàn)兩證或三證相兼的情況;在證型頻次中,虛實(shí)夾雜證出現(xiàn)最多,其次為虛證,實(shí)證較少。本研究結(jié)果顯示的臨床表現(xiàn)與同類研究基本一致,其中神疲、乏力與黃芪高關(guān)聯(lián),淋巴結(jié)腫大、夜寐不安與茯苓高關(guān)聯(lián),對(duì)于臨床表現(xiàn)蕪雜的淋巴瘤對(duì)癥用藥有一定參考價(jià)值。
病機(jī)的構(gòu)成要素包括病性、病位、病勢(shì)和病理因素,是疾病發(fā)展的動(dòng)態(tài)核心,決定了疾病發(fā)展的走向與轉(zhuǎn)歸。證候是疾病階段性特點(diǎn)的歸納與總結(jié),構(gòu)成了疾病特定時(shí)點(diǎn)的診斷要素。病機(jī)證素與證候要素在中醫(yī)辨證環(huán)節(jié)有著共性特征,但從術(shù)語(yǔ)表達(dá)層面很難明確區(qū)分,需結(jié)合運(yùn)用語(yǔ)境與辨治思路判別?!稅盒阅[瘤中醫(yī)診療指南》將惡性淋巴瘤分為氣虛證、陰虛證、血虛證、痰濕證、血瘀證、氣滯證[10]。王臻等[11]將淋巴瘤分為寒痰凝滯型、氣滯毒瘀型、肝腎陰虛型、氣血雙虧型、血熱風(fēng)燥型5 種證型辨證論治。陳錦峰等[12]將淋巴瘤分為3 類:虛證類以脾腎虧虛型、脾胃氣虛型、肝腎虧虛型、氣血雙虧型為主,實(shí)證類以血熱風(fēng)燥型、寒痰凝滯型、氣郁痰凝型、氣滯毒瘀型、痰飲凝聚型、痰瘀互結(jié)型為主,虛實(shí)夾雜類以陰虛內(nèi)熱型、脾虛夾濕型為主。國(guó)醫(yī)大師周仲瑛教授臨證精于病機(jī)辨證,善治疑難重癥,多從“癌毒”病機(jī)辨治淋巴瘤。周仲瑛工作室研究團(tuán)隊(duì)系統(tǒng)總結(jié)周仲瑛教授辨治淋巴瘤經(jīng)驗(yàn),明確淋巴瘤屬于本虛標(biāo)實(shí)之證,五臟氣血虧虛為本,癌毒夾雜痰濁、瘀熱為標(biāo)[13]。扶正以益氣養(yǎng)陰、補(bǔ)益脾腎為主,祛邪多用解毒抗癌,佐以清熱化痰散結(jié)為法。病機(jī)辨治分為五型:以痰毒凝結(jié)為核心病機(jī),治宜化痰解毒散結(jié);以瘀毒互結(jié)為核心病機(jī),治宜解毒活血;以熱毒蘊(yùn)結(jié)為核心病機(jī),治宜清熱解毒、祛痰散結(jié);以氣虛痰毒為核心病機(jī),治宜溫陽(yáng)利水祛濕;以陰虛痰毒為核心病機(jī),治宜滋補(bǔ)肝腎、解毒散結(jié)。本研究結(jié)果顯示的病機(jī)證素與現(xiàn)有專家病機(jī)分型高度重合,氣虛、血虛與黨參、黃芪,氣滯、痰與柴胡、香附、夏枯草,脾虛、腎虛與人參、山藥高關(guān)聯(lián),對(duì)于淋巴瘤辨證獲取核心病機(jī)證素及辨機(jī)用藥有指導(dǎo)意義。
本研究為單源數(shù)據(jù)庫(kù)類研究,旨在研究單一來(lái)源數(shù)據(jù)庫(kù)的醫(yī)案數(shù)據(jù)結(jié)構(gòu)特點(diǎn),其優(yōu)勢(shì)在于能夠有效降低建庫(kù)噪點(diǎn),減少研究復(fù)核能耗,留存單源數(shù)據(jù)研究樣本,為多源數(shù)據(jù)庫(kù)類研究形成比對(duì)數(shù)據(jù),確保后續(xù)多源數(shù)據(jù)庫(kù)類醫(yī)案挖掘研究的差異值顯現(xiàn)最大化。但單源數(shù)據(jù)庫(kù)類研究存在總體文獻(xiàn)樣本量偏小的客觀研究屬性,采用集外關(guān)聯(lián)研究其數(shù)據(jù)結(jié)果多為實(shí)際辨證中的高關(guān)聯(lián)、高頻率經(jīng)驗(yàn),顯示規(guī)則條目相對(duì)集中,可解釋臨床意義范圍相對(duì)局限。另外,不同集外關(guān)聯(lián)平臺(tái)采用的底層算法不同,在樣本數(shù)據(jù)量較小的情況下,挖掘結(jié)果存在算法矯正偏倚可能,從而使部分?jǐn)?shù)據(jù)規(guī)則與已知臨床知識(shí)提煉規(guī)則存在一定偏移。因此,今后在醫(yī)案類集外關(guān)聯(lián)規(guī)則研究中,為達(dá)到有效降低偏倚、規(guī)則顯現(xiàn)最大化、臨床意義高解釋性的研究目的,應(yīng)采用單源數(shù)據(jù)庫(kù)類與多源數(shù)據(jù)庫(kù)類研究平行采集、交叉校驗(yàn)的復(fù)合型數(shù)據(jù)挖掘方法,并根據(jù)中醫(yī)臨床醫(yī)案的文本特征不斷優(yōu)化底層算法。