• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于AdaBoost和分類樹的北京市高血壓患者就診機(jī)構(gòu)選擇的影響因素分析

      2017-03-09 08:35:36代曉彤謝學(xué)勤康曉平陳卓然劉福榮
      中國衛(wèi)生統(tǒng)計 2017年1期
      關(guān)鍵詞:分率醫(yī)療衛(wèi)生分類器

      代曉彤 謝學(xué)勤 康曉平△ 陳卓然 劉福榮

      基于AdaBoost和分類樹的北京市高血壓患者就診機(jī)構(gòu)選擇的影響因素分析

      代曉彤1謝學(xué)勤2康曉平1△陳卓然1劉福榮3

      目的 通過對2013年“北京市第五次國家衛(wèi)生服務(wù)調(diào)查”中高血壓患者兩周就診數(shù)據(jù)的分析,探討高血壓患者兩周就診機(jī)構(gòu)的選擇及影響因素。方法 使用AdaBoost和分類樹組合分類器對高血壓患者兩周首次就診機(jī)構(gòu)進(jìn)行分類,獲得變量相對重要性排序結(jié)果,利用十折交叉驗證法計算錯分率,錯分率的可接受程度為0~0.3,選擇錯分率最小的模型進(jìn)行結(jié)果解釋。結(jié)果 本次1128例患者中,兩周首次就診選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)的占75.7%。選用的AdaBoost和分類樹組合分類器的模型錯分率為0.177。經(jīng)AdaBoost和分類樹組合分類器對10個自變量按照相對重要性進(jìn)行排序,其中排名最高的三個變量依次為受教育程度、家庭人均收入、家人常去醫(yī)療機(jī)構(gòu),并繪制能夠分別說明這三個變量的分類樹。結(jié)論 對于北京市兩周就診的高血壓病患者來說,首診選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)的比例較高,受教育程度、家庭人均收入和家人常去醫(yī)療機(jī)構(gòu)是影響其是否選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)的最重要因素。

      AdaBoost 分類樹 高血壓 兩周患病率 就診機(jī)構(gòu) 影響因素

      高血壓病是現(xiàn)今城市居民常見的慢性非傳染性疾病(noninfectious chronic disease,NCD),也是北京市醫(yī)療衛(wèi)生系統(tǒng)的一個重要負(fù)擔(dān)。2008年中國大城市的高血壓兩周就診率為30.5%[1],2013年北京市15歲以上人群高血壓患病率為15.5%,位居北京市兩周患病首位,其兩周就診率卻僅為24.6%。明確高血壓患者的就診方式,了解影響其就診機(jī)構(gòu)選擇的因素,有利于提出能夠改善高血壓病控制情況的政策,為促進(jìn)醫(yī)療系統(tǒng)滿足如此龐大的醫(yī)療需求提供借鑒。本研究利用2013年“北京市第五次國家衛(wèi)生服務(wù)調(diào)查”中高血壓患者兩周就診的數(shù)據(jù),探討高血壓患者兩周就診機(jī)構(gòu)的選擇及影響因素,以期為針對性的政策指導(dǎo)提供理論依據(jù)。而AdaBoost和分類樹組合分類器,是一種不必對想納入的自變量進(jìn)行特征篩選,能夠直觀獲得變量重要性排序情況的方法,適用于該衛(wèi)生政策管理問題的研究。

      對象與方法

      1.對象

      本研究選取2013年“北京市第五次國家衛(wèi)生服務(wù)調(diào)查”數(shù)據(jù),研究對象為:調(diào)查前兩周內(nèi)患有高血壓病,且因該病首次前往醫(yī)療機(jī)構(gòu)接受過醫(yī)生的診斷和治療的北京市15歲以上常住居民,有效樣本共1128例。

      2.方法

      (1) 變量定義

      因變量為兩周患病首次就診地點,分為基層醫(yī)療衛(wèi)生機(jī)構(gòu)和區(qū)縣級及以上醫(yī)療衛(wèi)生機(jī)構(gòu)。

      基層醫(yī)療衛(wèi)生機(jī)構(gòu)指符合下列情況之一者:①診所/村衛(wèi)生室,②社區(qū)衛(wèi)生服務(wù)站,③衛(wèi)生院,④社區(qū)衛(wèi)生服務(wù)中心。區(qū)縣級及以上醫(yī)療衛(wèi)生機(jī)構(gòu)指符合下列情況之一者:①縣/縣市級/省轄市區(qū)屬衛(wèi)生機(jī)構(gòu),②省轄市/地區(qū)/直轄市區(qū)屬衛(wèi)生機(jī)構(gòu),③省/自治區(qū)/直轄市屬及以上衛(wèi)生機(jī)構(gòu)。所有變量賦值情況見表1。

      表1 變量賦值表

      (2) AdaBoost組合分類器原理和步驟

      AdaBoost是adaptive boosting的簡寫,是一種自適應(yīng)Boosting算法,由Freund和Schapire在1995年提出[2]。R語言中的adabag包主要應(yīng)用于對數(shù)據(jù)集進(jìn)行的AdaBoost.M1和SAMME 算法。本文描述和調(diào)用的是AdaBoost.M1[3]。

      分類與回歸樹(classification and regression tree,CART)的結(jié)果直觀,易于解釋,是衛(wèi)生政策管理方向常用的一種分析方法。但是分類與回歸樹容易發(fā)生過擬合的情況。Adaboost.M1算法無需任何先驗知識,具有自適應(yīng)性[4],不僅能夠避免過擬合的問題,還可以有效降低模型的錯分率,提高模型的精度。

      該組合分類器的分類過程為:

      更新各樣本的權(quán)重,加大分類錯誤的樣本權(quán)重,減小分類正確樣本的權(quán)重,進(jìn)而生成新的CART。本研究按照程序默認(rèn),更新100次,產(chǎn)生100棵分類樹。

      所有訓(xùn)練完成后,采用加權(quán)投票機(jī)制將產(chǎn)生的若干個分類樹進(jìn)行組合,形成強(qiáng)分類器。變量重要性的計算考慮到最終分類樹中變量的Gini系數(shù)和這個分類樹的權(quán)重,也就是說某變量的相對重要性越大,其對選擇就診機(jī)構(gòu)的影響就越大。因此本研究篩選出變量相對重要性最大的前三個變量進(jìn)行結(jié)果解釋,繪制能夠分別說明這三個變量的分類樹。

      公式如下:

      訓(xùn)練樣本數(shù)記為N,第n個樣本的權(quán)重為Wn,迭代次數(shù)記為M,第m個分類樹記為Ym(xn)。

      (3)模型評價

      錯分率,即測試樣本中被模型錯誤分類的比例。根據(jù)不同的研究目的,錯分率的可接受程度不同。本研究最終模型錯分率的可接受程度為0~0.3。

      本研究使用十折交叉驗證法(ten-foldcross-validation)計算錯分率,用來測試算法準(zhǔn)確性。具體操作為,將1128例樣本隨機(jī)平均分成10份,將其中的1份(113例)作為測試樣本,剩余9份(1015例)作為訓(xùn)練樣本進(jìn)行試驗,共計算10次,計算出平均錯分率。選取10次中錯分率最小的最終模型的結(jié)果進(jìn)行影響因素討論。

      (4) 統(tǒng)計軟件

      使用SAS9.3進(jìn)行數(shù)據(jù)庫的清理、單因素分析,使用R語言中的adabag、caret程序包進(jìn)行分類樹和AdaBoost的分析。

      結(jié) 果

      1.基本情況

      在1128例高血壓患者中,男性508人,女性620人;年齡在65歲及以上的人占46.9%,35~64歲的占52.1%,15~34歲僅占1.0%,年齡最小者為27歲;選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)就診的有854(75.7%)人,區(qū)縣級及以上醫(yī)療衛(wèi)生機(jī)構(gòu)的274(24.3%)人。按不同就診機(jī)構(gòu)對人口統(tǒng)計學(xué)特征(年齡、性別、地區(qū)),社會經(jīng)濟(jì)特征(戶口、受教育程度、職業(yè)、家庭人均收入),衛(wèi)生服務(wù)可及性(到最近的衛(wèi)生服務(wù)機(jī)構(gòu)的時間),醫(yī)療保險情況、家庭就診習(xí)慣等進(jìn)行描述,見表2。

      表2 高血壓病患者選擇不同就診機(jī)構(gòu)的基本情況

      2.AdaBoost結(jié)果

      對1128例樣本使用十折交叉驗證法計算出10次的錯分率范圍為0.177~0.274,均符合判定標(biāo)準(zhǔn)0~0.3,平均錯分率為0.213,表示對本資料,使用該方法精確度較高,見表3。

      表3 十折交叉驗證法逐次錯分率

      選取錯分率最小的模型進(jìn)行結(jié)果解釋。分類任務(wù)中每個變量的相對重要性見表4。結(jié)果顯示:10個變量中相對重要性最高的三個變量依次為受教育程度。家庭人均收入、家人常去醫(yī)療機(jī)構(gòu)。繪制能夠說明受教育程度影響決策情況的第99棵樹,顯示當(dāng)受教育程度為初中及以下或本科及以上時,患者選擇基層醫(yī)療機(jī)構(gòu)就診的比例由原來的0.51增加到0.54(圖1)。能夠說明家庭人均收入影響決策情況的第92棵樹,顯示當(dāng)家庭人均收入最低、適中、較高時,患者選擇基層醫(yī)療機(jī)構(gòu)就診的比例由0.49增加到0.52(圖2)。繪制能夠說明家人常去醫(yī)療機(jī)構(gòu)影響決策情況的第1棵樹,顯示當(dāng)家人常去醫(yī)療機(jī)構(gòu)為非基層醫(yī)療機(jī)構(gòu)時,患者選擇基層醫(yī)療機(jī)構(gòu)就診的比例由0.25增加到0.58(圖3)。

      表4 變量相對重要性

      圖1 第99棵決策樹

      討 論

      從總體來看,本研究顯示高血壓患者選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)就診的比例較高(75.7%)。國內(nèi)外研究表明,對于高血壓病的控制,最有效的方法就是社區(qū)防治[5]。朱梅等研究顯示,社區(qū)就診的高血壓居民服藥依從率,血壓控制率均高于二、三級醫(yī)院[6]。按照中國醫(yī)療保險報銷政策,慢性病、常見病在基層醫(yī)療衛(wèi)生服務(wù)機(jī)構(gòu)的報銷比例要高于二、三級醫(yī)院。充分發(fā)揮基層衛(wèi)生服務(wù)的作用,是現(xiàn)今慢性病控制衛(wèi)生政策的導(dǎo)向。本研究提示,北京高血壓患者選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)就診的情況在現(xiàn)有水平可持續(xù)發(fā)展。

      圖2 第92棵決策樹

      圖3 第1棵決策樹

      表2顯示,不同特征的北京市高血壓患者兩周首次就診選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)的比例均較高,但還是有差別的,AdaBoost與分類樹組合分類器的方法可以在對自變量進(jìn)行排序的過程將這些差別展示出來,找出影響高血壓患者就診選擇的最重要因素。

      在以往研究中,經(jīng)濟(jì)因素始終是影響衛(wèi)生服務(wù)利用的關(guān)鍵因素[7],收入越低的患者更多地選擇醫(yī)療費(fèi)用更低的醫(yī)療機(jī)構(gòu)。本次研究的部分結(jié)果與之一致。如圖1所示,沒上過學(xué)、小學(xué)、初中和本科及以上學(xué)歷的高血壓患者基層醫(yī)療衛(wèi)生機(jī)構(gòu)就診的比例增加。圖2中家庭人均收入最低、適中和較高的患者,選擇區(qū)縣屬醫(yī)療衛(wèi)生機(jī)構(gòu)的比例增加。家庭人均收入和受教育

      程度具有交互作用,受教育程度較低的人家庭人均收入也較低。本科及以上學(xué)歷和家庭人均收入較高的高血壓患者,傾向于選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)就診,這可能與其較高的健康素養(yǎng)有關(guān)。Dennison等的研究提示,更高的受教育水平有利于高血壓病的治療[8]。受教育程度越高,具備健康素養(yǎng)的比例也越高[9]。健康素養(yǎng)的高低也會影響勞動人口對衛(wèi)生服務(wù)的利用[10]。這是受教育程度影響就診機(jī)構(gòu)選擇的一條途徑。高學(xué)歷的高血壓病患者似乎更傾向于選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)就診,這在一定程度上反映了健康素養(yǎng)較高的居民對基層醫(yī)療服務(wù)的利用更加充足。本研究結(jié)果表明,北京市常住居民高血壓病就診機(jī)構(gòu)的選擇在基層導(dǎo)向還是有空間的,深化基層衛(wèi)生服務(wù)對于高血壓病管理的作用,健康教育是必不可少的。

      家人常去基層醫(yī)療衛(wèi)生機(jī)構(gòu)就診,患者也更多地選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu),這體現(xiàn)了家庭就診的習(xí)慣也會影響高血壓患者的就診傾向。培養(yǎng)就診習(xí)慣,對于貫徹衛(wèi)生政策的實施,有著積極的推動作用。

      綜上,對于北京市有兩周就診的高血壓病患者來說,首診選擇基層醫(yī)療衛(wèi)生機(jī)構(gòu)的比例較高,受教育程度、家庭人均收入和家人常去醫(yī)療機(jī)構(gòu)是影響其就診選擇的最重要因素。

      [1]衛(wèi)生部統(tǒng)計信息中心.2008中國衛(wèi)生服務(wù)調(diào)查研究第四次家庭健康詢問調(diào)查分析報告.第1版.北京:中國協(xié)和醫(yī)科大學(xué)出版社,2009.

      [2]Freund YSRE.A decision-theoretic generalization of on-line learning and an application to boosting.In:Proceedings of IEEE Second European Conference on Computational Learning Theory.Barcelona,Spain:1995.

      [3]Alfaro E,Gamez MAGN,Guo WCFL.Applies Multiclass AdaBoost.M1,SAMME and Bagging.https://cran.r-project.org/web/packages/adabag/adabag.pdf.

      [4]吳杰法.基于整體特征的行人檢測方法研究.湖南大學(xué),2012.

      [5]吳兆蘇.我國高血壓流行情況及如何開展高血壓社區(qū)防治.心肺血管病雜志,1999,(3):18-20.

      [6]朱梅,高俊嶺,金桂勤,等.不同就診方式的社區(qū)高血壓患者血壓控制效果及費(fèi)用的比較研究.中國全科醫(yī)學(xué),2016,(1):96-99.

      [7]衛(wèi)生部統(tǒng)計信息中心.中國衛(wèi)生服務(wù)調(diào)查研究第三次國家衛(wèi)生服務(wù)調(diào)查分析報告.第1版.北京:中國協(xié)和醫(yī)科大學(xué)出版社,2004.

      [8]Dennison CR,Peer N,Steyn K,et al.Determinants of hypertension care and control among peri-urban Black South Africans:the HiHi study.Ethn Dis,2007,17(3):484-491.

      [9]衛(wèi)生部婦幼保健與社區(qū)衛(wèi)生司,衛(wèi)生部新聞宣傳中心中國健康教育中心.首次中國居民健康素養(yǎng)調(diào)查報告.北京:2009.

      [10]孫亞慧,謝興偉,曾慶奇,等.健康素養(yǎng)對某高校部分勞動力人口基本公共衛(wèi)生服務(wù)利用的影響研究.中國健康教育,2015,(3):243-246.

      (責(zé)任編輯:劉 壯)

      The Influencing Factors Regarding Choosing Medical Institutions among Hypertension Patients in Beijing on AdaBoost and Classification Tree

      Dai Xiaotong,Xie Xueqin,Kang Xiaoping,et al

      (SchoolofPublicHealth,PekingUniversity(100191),Beijing)

      Objective By analyzing the two-week prevalence and outpatient service data of 2013 Beijing Health Service Survey,this study aims at clearing and defining influence factors of choosing hospitals at different levels among hypertension patients in Beijing.Methods The first medical institutions selection of hypertension patients in two weeks were classified using Ada Boost and classification tree combination classifier,and the variables were sorted according to the relative importance of the variables.The error rate was calculated by ten-fold cross-validation method.The acceptability of the error rate was 0~0.3.The model with the smallest error rate was explained.Results The patients who chose primary health care institutions as the first medical institution in two weeks from the 1128 cases of hypertension patients,was 75.7%.The error rate of the selected AdaBoost and classification tree combination classifier was 0.177.The 10 variables was sorted according to the relative importance.The 3 highest rank variables were education level,family income per capita and the medical institutions family often went to.The classification trees,which could illustrate the three variables,were drawn separately.Conclusion For the first medical institutions selection of hypertension patients in two weeks the city of Beijing,the proportion of primary health care institutions was high.Education level,family income per capita and the medical institutions family often went to were the most important factors that affected the choice of primary health care institutions.

      AdaBoost;Classification tree;Hypertension;Two-week prevalence;Medical institutions;Influence factors

      1.北京大學(xué)公共衛(wèi)生學(xué)院(100191)

      2.北京市公共衛(wèi)生信息中心

      3.鄭州大學(xué)第一附屬醫(yī)院

      △通信作者:康曉平

      猜你喜歡
      分率醫(yī)療衛(wèi)生分類器
      量率對應(yīng) 解決問題
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      為了醫(yī)療衛(wèi)生事業(yè)健康發(fā)展
      解分?jǐn)?shù)問題例談
      分?jǐn)?shù)應(yīng)用題常見錯例剖析
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      京津冀醫(yī)療衛(wèi)生合作之路
      京津冀醫(yī)療衛(wèi)生大聯(lián)合
      利用分率巧解題
      常德市| 方正县| 兴国县| 紫阳县| 富锦市| 苏尼特右旗| 太仆寺旗| 淅川县| 仁化县| 长葛市| 中方县| 东乡县| 望奎县| 舟山市| 荔波县| 伊吾县| 邵武市| 舒兰市| 林甸县| 阜康市| 夏津县| 江华| 麻栗坡县| 中西区| 吉首市| 耒阳市| 财经| 新兴县| 乐清市| 太原市| 涡阳县| 信宜市| 石门县| 鞍山市| 钟山县| 襄汾县| 龙胜| 增城市| 莱西市| 鄂州市| 囊谦县|