趙安容,徐世成,崔利君,李垚,李波,王莉
636000 四川 巴中,巴中市中心醫(yī)院 神經(jīng)內(nèi)科(趙安容、徐世成、崔利君、李垚、李波);637002 四川 南充,川北醫(yī)學(xué)院附屬醫(yī)院 神經(jīng)內(nèi)科(王莉)
急性缺血性腦卒中(acute ischemic stroke, AIS)是腦血管疾病中最為常見的一種類型,約占全部急性腦血管疾病的70%,具有高發(fā)病率、高致殘率、高病死率等特征,是全球范圍內(nèi)的第一位致殘病因和第二位致死病因,已經(jīng)成為嚴(yán)重危害人類生命健康的重大疾病之一[1-2]。癌癥患者缺血性腦卒中(cancer-associated ischemic stroke, CAIS)是癌癥患者最常見的中樞神經(jīng)系統(tǒng)并發(fā)癥之一[3],CAIS 的發(fā)病機(jī)制目前尚未完全清楚,除了傳統(tǒng)腦血管病危險因素如高血壓、高血糖等因素外,CAIS 的發(fā)病可能還與癌癥介導(dǎo)的高凝狀態(tài)、瘤栓塞及腫瘤治療的并發(fā)癥或不良反應(yīng)等有關(guān)[4-5]。數(shù)據(jù)挖掘Relief 特征選擇算法作為特征權(quán)重算法之一,根據(jù)數(shù)據(jù)的特征與類別的相關(guān)性來賦予每個特征不同的權(quán)重值,并對權(quán)重進(jìn)行排序,可根據(jù)權(quán)重排序獲得分辨能力強(qiáng)的特征子集。Relief 特征選擇算法對數(shù)據(jù)類型并無明確要求且可以較好地去除數(shù)據(jù)中的無關(guān)特征,從而具有評估效率高的優(yōu)點[6]。本研究以巴中市中心醫(yī)院神經(jīng)內(nèi)科2016 年1 月至2021 年12 月連續(xù)收治的1 260 例AIS 患者構(gòu)建數(shù)據(jù)庫,運(yùn)用Relief 特征選擇算法探討各個危險因素(特征)與是否CAIS(類別)的相關(guān)性并賦予不同的權(quán)重值,為預(yù)測本地區(qū)CAIS 的危險因素提供相關(guān)參考依據(jù)。
以巴中市中心醫(yī)院神經(jīng)內(nèi)科2016 年1 月至2021 年12 月連續(xù)收治的1 260 例AIS 患者作為研究對象,收集患者的臨床資料構(gòu)建數(shù)據(jù)庫。納入標(biāo)準(zhǔn):(1)符合中華醫(yī)學(xué)會第四屆全國腦血管病學(xué)術(shù)會議修訂的診斷標(biāo)準(zhǔn)[7]診斷為AIS;(2)經(jīng)頭顱CT或MRI 證實;(3) 腦血管事件發(fā)生至入院接受治療時間小于3 d;(4)年齡>18 歲;(5)CAIS 患者必須有明確的病理診斷,確診為癌癥。排除標(biāo)準(zhǔn):(1)有腦腫瘤病史、既往腦卒中病史且造成神經(jīng)功能障礙患者;(2)伴有嚴(yán)重感染性疾病、嚴(yán)重肝、腎功能不全者;(3)拒絕登記注冊者。按照AIS 發(fā)病前有無活動性非神經(jīng)系統(tǒng)癌癥分為癌癥患者缺血性腦卒中組(CAIS 組,n=116)和非癌癥患者缺血性腦卒中組(NCAIS 組,n=1 564)。全部研究對象的知情同意均已獲得,并獲得醫(yī)院倫理委員會批準(zhǔn)。
1.2.1 資料收集 全部AIS 患者均按照標(biāo)準(zhǔn)的腦卒中注冊登記系統(tǒng)完成登記記錄,主要包括一般資料(姓名、性別、年齡等)、既往疾病史、臨床體征、格拉斯哥昏迷量表(Glasgow Coma Scale, GCS)評分、美國國立衛(wèi)生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)評分、影像學(xué)檢查結(jié)果、實驗室檢查結(jié)果、治療藥物情況、出院診斷及預(yù)后改良Rankin 量表(Modified Rankin Scale,mRS)評分等。列入待評價的可能危險因素主要包括:性別、年齡、是否吸煙、是否飲酒、是否罹患高血壓、是否罹患糖尿病、是否罹患高脂血癥、短暫性腦缺血發(fā)作疾病史、腦卒中疾病史、房顫疾病史、甘油三酯、總膽固醇、低密度脂蛋白、高密度脂蛋白、血尿素氮、血肌酐、血尿酸、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、同型半胱氨酸等,將數(shù)據(jù)資料錄入Epidata 3.1 數(shù)據(jù)庫。
1.2.2 Relief 特征選擇算法 Relief 特征選擇算法是一種基于各個特征(危險因素)與類別(是否CAIS)的相關(guān)性來計算特征(危險因素)權(quán)重的算法,與類別(是否CAIS)相關(guān)性高的特征(危險因素)更利于分類判別,因此被賦予較高的權(quán)重值。具體算法為:①設(shè)定初始集合:類別集合Y=[y1,y2];特征集合X=[x1,x2,…,xn];②運(yùn)用Relief 函數(shù)對特征集合X的所有特征值x 進(jìn)行計算,得到每個特征值的權(quán)重值;③重復(fù)運(yùn)行主程序20 次,求出每個特征值的平均權(quán)重值;④將所有特征值x按降序排列;⑤輸出降序排名后的特征值列表R。
采用SPSS 17.0 軟件進(jìn)行統(tǒng)計處理,計量資料采用均數(shù)±標(biāo)準(zhǔn)差表示,組間比較采用t檢驗,計數(shù)資料采用率或構(gòu)成比(%)進(jìn)行描述,組間比較采用χ2檢驗;以P< 0.05 表示差異有統(tǒng)計學(xué)意義。采用Matlab 軟件運(yùn)用Relief 算法對數(shù)據(jù)庫中數(shù)據(jù)進(jìn)行分析,計算不同危險因素的權(quán)重值。
CAIS組男性68例(58.62%),女性48例(41.38%),NCAIS 組男性860 例(54.99%),女性704 例(45.01%),兩組性別構(gòu)成差異無統(tǒng)計學(xué)意義(P> 0.05);CAIS 組年齡分布32~86 歲,NCAIS 組年齡分布46 ~ 84 歲,兩組平均年齡之間差異無統(tǒng)計學(xué)意義(P> 0.05)。兩組性別、年齡具有可比性(表1)。
表1 CAIS 組與NCAIS 組患者一般資料比較Table 1.General Data of Patients in CAIS group and NCAIS Group
設(shè)定初始集合:類別集合Y=[y1,y2],即y1=腦卒中患者、y2=健康對照人群;特征集合X=[x1,x2,…,xn],即x1=性別、x2=年齡、…、x20=同型半胱氨酸。具體特征名稱分配及取值范圍詳見表2。
表2 特征名稱分配及取值范圍Table 2.Characteristic Variables of Risk Factors and Their Value Ranges
權(quán)重系數(shù)取值范圍-1~1,正值表示該特征變量(危險因素)與分類(是否CAIS)具有相關(guān)性,數(shù)值越大,相關(guān)性越強(qiáng)。按權(quán)重系數(shù)排序后有15 個危險因素與CAIS 發(fā)病有關(guān),權(quán)重系數(shù)大于0.1 的危險因素依次為:腦卒中疾病史、飲酒和高血脂癥,是其最主要的危險因素(表3)。
表3 特征集中20 個危險因素的權(quán)重值Table 3.Weight Values of 20 Risk Factors in the Feature Set
AIS 因其高發(fā)病率、高致死率和高致殘率一直是近些年神經(jīng)科領(lǐng)域研究的熱點及難點問題[8-9]。近年的研究發(fā)現(xiàn)[10-11],高血壓、吸煙、糖尿病、心房顫動、其他心臟?。毙怨跔顒用}綜合征、心衰等)、血脂異常、無癥狀頸動脈狹窄、缺乏身體活動、低蔬菜水果攝入量、肥胖、飲酒、代謝綜合征、高同型半胱氨酸血癥、炎癥和感染等是目前較為公認(rèn)的腦卒中的主要危險因素。但有研究發(fā)現(xiàn),AIS 的癌癥和非癌癥患者發(fā)病危險因素及臨床特點和預(yù)后方面存在差異[12-13],如何識別CAIS 患者的主要危險因素,并進(jìn)行針對性的腦卒中危險因素的一級預(yù)防、早期干預(yù),這對減少腦卒中的發(fā)生有著重要的臨床意義[14]。
基于腦卒中注冊登記數(shù)據(jù)庫中的腦卒中疾病資料信息,神經(jīng)科醫(yī)師可以進(jìn)行一定區(qū)域范圍內(nèi)的病因?qū)W、流行病學(xué)等方面的研究。腦卒中注冊登記數(shù)據(jù)庫是大樣本的數(shù)據(jù)管理系統(tǒng),面對龐大的數(shù)據(jù),如何應(yīng)用計算機(jī)方法提取、挖掘潛在的、有用的信息是神經(jīng)科醫(yī)師需要面對的主要問題。本研究在整合腦卒中注冊登記數(shù)據(jù)庫及CAIS 人群的Epidata 數(shù)據(jù)庫資料的基礎(chǔ)上,應(yīng)用數(shù)據(jù)挖掘Relief 特征選擇算法提取數(shù)據(jù)庫中隱藏的疾病與危險因素之間相關(guān)關(guān)系的潛在信息,以明確本地區(qū)CAIS 發(fā)生的主要危險因素及其影響排序,以指導(dǎo)本地區(qū)醫(yī)師即針對癌癥相關(guān)腦卒中的危險因素進(jìn)行積極地早期干預(yù)預(yù)防等一級預(yù)防工作。
本組數(shù)據(jù)研究結(jié)果顯示,相對于非癌癥患者,本地區(qū)CAIS 發(fā)病的危險因素中,腦卒中疾病史在腦卒中發(fā)生中所占的權(quán)重值最大,其次為飲酒和高血脂癥,權(quán)重系數(shù)均大于0.1。已有大量文獻(xiàn)報道,有腦卒中疾病史是再次發(fā)生腦卒中的重要危險因素。巴中地處秦巴山區(qū),當(dāng)?shù)氐木莆幕瘽夂瘢?dāng)?shù)仫嬀迫巳杭懊咳诊嬀屏慷济黠@高于其他地區(qū)[15-16],因此,飲酒已經(jīng)成為本地區(qū)癌癥相關(guān)腦卒中發(fā)生的主要危險因素之一。在實驗室檢查方面,血尿素氮、血尿酸、總膽固醇、同型半胱氨酸及甘油三酯水平等在區(qū)別癌癥與非癌癥與腦卒中高?;颊咧芯哂兄匾崾咀饔茫鲜鲋笜?biāo)對于CAIS 的一級預(yù)防具有重要的指導(dǎo)作用,并且可以直接應(yīng)用于腦卒中的早期篩查中[17-18]。而一些傳統(tǒng)意義上的危險因素如:吸煙、高血壓、糖尿病、短暫性腦缺血發(fā)作疾病史等在區(qū)分癌癥與非癌癥腦卒中人群時的權(quán)重值為負(fù)值,表示其與腦卒中的發(fā)作的相關(guān)性并不大。既往已有臨床研究發(fā)現(xiàn)在無傳統(tǒng)腦血管疾病危險因素(包括高血壓、糖尿病等)的惡性腫瘤患者中,腦卒中的發(fā)病風(fēng)險也增加明顯[19]。這也進(jìn)一步證實了,CAIS 患者的發(fā)病危險因素與單純AIS 的發(fā)病危險因素之間存在差異,多數(shù)CAIS 患者發(fā)病缺乏傳統(tǒng)的高血壓、糖尿病等腦血管危險因素[20]。
綜上所述,利用數(shù)據(jù)挖掘Relief 特征選擇算法可以挖掘腦卒中注冊登記數(shù)據(jù)庫中與CAIS 發(fā)病密切相關(guān)的危險因素,主要包括腦卒中疾病史、飲酒和高血脂癥。但需要指出的是Relief 特征選擇算法仍然存在一定的缺陷,如對不同特征(危險因素)的權(quán)重值只能作為區(qū)別不同類別(是否CAIS)的依據(jù),但不能說明該屬性在多種疾病狀態(tài)中所的作用。因此,應(yīng)用Relief 特征選擇算法需要結(jié)合其他統(tǒng)計學(xué)方法和具體數(shù)據(jù)庫資料,方能更加準(zhǔn)確的挖掘數(shù)據(jù)庫的各種潛在信息。
作者聲明:本文全部作者對于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;并承諾論文中涉及的原始圖片、數(shù)據(jù)資料等已按照有關(guān)規(guī)定保存,可接受核查。
學(xué)術(shù)不端:本文在初審、返修及出版前均通過中國知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)的學(xué)術(shù)不端檢測。
同行評議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。
利益沖突:所有作者均聲明不存在利益沖突。
文章版權(quán):本文出版前已與全體作者簽署了論文授權(quán)書等協(xié)議。