謝桃楓 鄭婷 曹莉 黃夢圓
隨著社會的發(fā)展,女性生活節(jié)奏逐漸加快,生活壓力也不斷增加,伴隨著飲食習(xí)慣和周圍環(huán)境的改變,宮頸癌的發(fā)病率和死亡率不斷升高[1],宮頸癌是臨床最常見的婦科惡性腫瘤之一,其發(fā)病率僅次于乳腺癌[2]。目前,宮頸癌較為明確的誘因包括多產(chǎn)史、吸煙、不潔性生活、性生活過早、多次人工終止妊娠術(shù)史等[3]。多點CIN Ⅲ級的發(fā)病與HPV 感染密切相關(guān)且與患者年齡、日常生活因素存在緊密的聯(lián)系,廣大女性應(yīng)養(yǎng)成良好的生活習(xí)慣,降低宮頸癌的發(fā)病[4]。通過對安徽省黃山市女性居民進行宮頸癌的健康素養(yǎng)現(xiàn)狀的調(diào)查中發(fā)現(xiàn),今后對于宮頸癌的關(guān)注點應(yīng)更多的從“治療”轉(zhuǎn)向“預(yù)防”[5],讓更多女性參與到預(yù)防宮頸癌的篩查項目中來。本研究從飲食及避孕措施對宮頸癌篩查的病檢結(jié)果影響進行關(guān)聯(lián)規(guī)則挖掘,為預(yù)防宮頸癌的發(fā)生提供一定的有效建議。
本研究數(shù)據(jù)來自于2015—2016 年巴彥淖爾市農(nóng)村地區(qū)女性的社區(qū)調(diào)查問卷及就診前醫(yī)院調(diào)查問卷。其中社區(qū)調(diào)查問卷10 015 份,內(nèi)容包括一般情況、生活習(xí)慣、生殖情況、既往患病情況等;醫(yī)院調(diào)查問卷499 份,內(nèi)容包括一般情況、飲食情況、其他情況、實驗室檢測及病理診斷結(jié)果等。將兩份問卷所生成的Excel 表進行數(shù)據(jù)合并,刪除內(nèi)容不全和有錯誤的數(shù)據(jù),根據(jù)研究要求將清洗后的417 條數(shù)據(jù)錄入數(shù)據(jù)庫。此問卷表已向受訪者承諾嚴格保密問卷信息,且對所形成的數(shù)據(jù)庫進行數(shù)據(jù)脫敏處理,不會泄露受訪者隱私。
本研究采用關(guān)聯(lián)性分析方法和列聯(lián)表分析方法。
本研究主要對飲食和宮頸癌患者的支持度和置信度進行評價,支持度和置信度越高關(guān)聯(lián)性越強。
R 語言是統(tǒng)計軟件,R 語言能夠為不同的統(tǒng)計功能提供多種實現(xiàn)途徑,它是一套開源的數(shù)據(jù)分析解決方案,其完全免費,對于統(tǒng)計工作者非常友好,而且在全球有一個龐大且活躍的研究型社區(qū)維護。本文利用R 語言中arules 包中的Apriori()函數(shù)進行關(guān)聯(lián)規(guī)則提取,在規(guī)則提取過程中,設(shè)定最小支持度為0.7,最小置信度為0.7,得到關(guān)聯(lián)規(guī)則后,篩選出提升度大于1 的強關(guān)聯(lián)規(guī)則做分析,其中R 的版本為4.0.0,arules 包的版本為1.5-4。對部分數(shù)據(jù)利用SPSS 20.0 進行統(tǒng)計,對計數(shù)資料進行χ2檢驗,P<0.05 為差異有統(tǒng)計學(xué)意義。
2.1.1 一般資料描述
本研究針對417 位宮頸疾病患者食用16 種食物做研究。
2.1.2 數(shù)據(jù)離散化
由于Apriori 算法只能對離散變量進行關(guān)聯(lián)規(guī)則分析,則需要對原始數(shù)據(jù)進行離散化處理,如表1。
表1 變量離散化分組表
2.1.3 關(guān)聯(lián)規(guī)則結(jié)果分析
通過對飲食與病檢結(jié)果的關(guān)聯(lián)性分析得到2 條強關(guān)聯(lián)規(guī)則,結(jié)果是大多數(shù)病檢結(jié)果為患宮頸炎的女性都食用蘿卜、奶類見表2。
表2 食物與宮頸癌病理檢查結(jié)果的關(guān)聯(lián)規(guī)則分析表
2.2.1 一般資料描述
本研究共對456 名患者的問卷調(diào)查做研究,其中沒有采取避孕措施的患者是148,采取避孕措施的患者人數(shù)是308,宮頸炎的患者人數(shù)是419,CIN Ⅰ患者的人數(shù)是37。
2.2.2 數(shù)據(jù)離散化
沒有采取避孕措施的病例中宮頸炎患者是132 例,CINI 患者是16 例;采取避孕措施的病例中宮頸炎患者是287 例,CINI 患者是21 例,采取避孕措施和病檢結(jié)果的列聯(lián)表如表3。
表3 采取避孕措施和病檢結(jié)果的列聯(lián)表
2.2.3 結(jié)果分析
輸出結(jié)果給出了病檢結(jié)果與是否采取避孕措施的交叉制表、是否采取避孕措施的影響χ2檢驗表,對于顯著水平α=0.05,由χ2檢驗表知,χ2=2.137,P=0.144>0.05,故認為采取避孕措施對病檢結(jié)果為宮頸炎及CIN Ⅰ的影響差異無統(tǒng)計學(xué)意義。
針對生活習(xí)慣對宮頸癌發(fā)病的關(guān)系,宮頸癌發(fā)病是一個因素較多、機制復(fù)雜的過程。在研究宮頸癌的病因時發(fā)現(xiàn),HPV 感染、多次陰道分娩、性因素和子宮慢性疾病是導(dǎo)致宮頸癌的四大病因[6]。針對生活習(xí)慣對宮頸癌發(fā)病的關(guān)系,李曄通過SPSS 軟件對北京王府中西醫(yī)結(jié)合醫(yī)院的患者進行分組分析,對患者的基本情況和婦科情況資料進行數(shù)據(jù)挖掘,發(fā)現(xiàn)宮頸癌前病變的影響因素包括年齡、職業(yè)、流產(chǎn)次數(shù)等[7]。路文婷在宮頸癌流行病學(xué)概況中提到,吸煙或者口服避孕藥、性生活過早、配偶性生活紊亂等都是與宮頸癌密切相關(guān)的危險行為因素[8]。王穎以160 例宮頸癌患者為實驗組,160 例體檢健康的女性為對照組,調(diào)查影響兩組患者的宮頸癌發(fā)病因素,通過SPSS 軟件對數(shù)據(jù)進行處理,結(jié)果顯示患者的職業(yè)、學(xué)歷、居住地、主被動吸煙、平時陰道沖洗、結(jié)婚年齡、首次分娩年齡、陰道分娩次數(shù)、人工流產(chǎn)次數(shù)、初次性行為年齡、性伴侶包皮過長、性生活頻率、是否避孕以及性生活都對宮頸癌發(fā)病有影響[9]。新疆沙灣縣農(nóng)牧區(qū)婦女宮頸癌發(fā)病與多種因素有關(guān),應(yīng)提倡適齡結(jié)婚,重視普及與宮頸癌有關(guān)的科普知識,積極避孕,同時養(yǎng)成良好的衛(wèi)生及性生活習(xí)慣,以降低宮頸癌發(fā)病率[10]。東部沿海經(jīng)濟發(fā)達地區(qū)外來務(wù)工女性生殖道感染患病率較高,生殖道健康行為習(xí)慣較差[11]。在宮頸癌的用藥過程中,利用Apriori 算法確定處方中藥物和藥物使用頻次之間的關(guān)聯(lián)規(guī)則及治療原則,最后得出宮頸癌多用活血散結(jié)、滋陰清熱之品的結(jié)論[12]。通過對268 例宮頸癌患者臨床病例利用加強關(guān)聯(lián)規(guī)則算法進行數(shù)據(jù)挖掘,總結(jié)了江蘇省中醫(yī)院宮頸癌的辨證經(jīng)驗,得出濕熱瘀毒證、痰瘀互結(jié)證、肝郁氣滯證、肝腎陰虛證、脾腎虧虛證、瘀血內(nèi)阻證六種常見證型[1]。使用數(shù)據(jù)挖掘算法對宮頸癌臨床數(shù)據(jù)進行研究,并通過相應(yīng)的決策模型對數(shù)據(jù)進行風(fēng)險因素評估[13]。
關(guān)聯(lián)規(guī)則挖掘技術(shù)是數(shù)據(jù)挖掘的重要組成部分,它是按照用戶預(yù)先給定的最小支持度和最小置信度去研究事務(wù)數(shù)據(jù)庫中各事務(wù)屬性之間的關(guān)系,最終發(fā)現(xiàn)各項集之間的有趣聯(lián)系[14]。關(guān)聯(lián)規(guī)則算法在病案信息管理、疾病預(yù)測、健康數(shù)據(jù)可視化分析、電子病歷數(shù)據(jù)分析、輔助診療等方面都有應(yīng)用。Apriori 算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法,也是關(guān)聯(lián)規(guī)則挖掘最經(jīng)典的算法之一,目前已經(jīng)被廣泛應(yīng)用于各個領(lǐng)域。傅雷、陳未如等使用向量法和改進的Apriori 算法應(yīng)用于心臟病診斷,發(fā)現(xiàn)運動期間有心絞痛、靜息血壓>140、膽固醇含量過高等因素是心臟病致病的關(guān)鍵因素[15],并將其作為心臟病確診及預(yù)防的依據(jù)。林長方、吳洋洋利用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)在冠心病檢查中,肝功血脂(甘油三酯、低密度脂蛋白、總膽固醇)、肌鈣蛋白Ⅰ、超敏C 反應(yīng)蛋白、心電圖等屬性的檢查對冠心病的確診起到至關(guān)重要的作用[14]。姜建東通過Apriori 算法對糖尿病三種并發(fā)癥之間的關(guān)系和肝硬化病人藥物效果進行分析,并將其研究結(jié)果作為疾病預(yù)測和治療的依據(jù)[1]。利用Apriori 算法對慢性腎病的進行預(yù)測[16]。為公立醫(yī)院控制費用的不合理增長,加強成本核算提供對應(yīng)的科學(xué)依據(jù)[17]。高額住院病例主要以循環(huán)系統(tǒng)損傷和中毒、腫瘤為主,還發(fā)現(xiàn)藥品、住院天數(shù)、科室和住院費用關(guān)聯(lián)性很強[18]。
本研究以飲食對病檢結(jié)果影響的關(guān)聯(lián)性分析為例,利用數(shù)據(jù)挖掘的經(jīng)典算法Apriori 算法,通過R 語言尋找數(shù)據(jù)庫中的頻繁項集,再根據(jù)頻繁項集生成強關(guān)聯(lián)規(guī)則,得到巴彥淖爾市農(nóng)村地區(qū)女性食用蘿卜和奶類與患宮頸炎之間存在關(guān)聯(lián)性的結(jié)論;以是否避孕對病檢結(jié)果的影響為例,利用SPSS 軟件進行χ2檢驗,得到了巴彥淖爾地區(qū)農(nóng)村女性是否避孕與患宮頸炎、CIN Ⅰ之間不存在相關(guān)性的結(jié)論,研究得到的結(jié)果可以為宮頸炎癥的預(yù)防提供生活習(xí)慣方面的參考。
本研究經(jīng)過對宮頸癌相關(guān)數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘可以得到的有效信息是:針對巴彥淖爾市的農(nóng)村女性,食用蘿卜和奶類與患宮頸炎存在強關(guān)聯(lián)規(guī)則,建議當?shù)嘏詮娘嬍成嫌兴{(diào)整,加以預(yù)防宮頸炎;針對巴彥淖爾農(nóng)村地區(qū)女性,是否采取避孕措施與患宮頸炎、CIN Ⅰ的發(fā)病不存在統(tǒng)計學(xué)意義,即是否采取避孕措施不會影響宮頸炎與CIN Ⅰ的發(fā)病幾率。預(yù)防宮頸癌,年輕女性應(yīng)潔身自好,注意個人衛(wèi)生,培養(yǎng)良好的生活習(xí)慣,定期進行婦科檢查。同時,社會和家庭應(yīng)認識到宮頸癌是一種可預(yù)防,可治愈的腫瘤[19]。健康知識的推廣傳播,預(yù)防疾病的觀念意識的加強,女性身體健康問題也成了社會和國家關(guān)注的問題[20-22]。在未來的研究中可以考慮通過對生活習(xí)慣的調(diào)整來達到預(yù)防疾病的發(fā)生,有助于人們在疾病發(fā)生之前,為思考疾病的發(fā)生提供了從病理角度之外的新方向。