華中科技大學(xué)同濟(jì)醫(yī)學(xué)院公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(430030) 萬(wàn)政策 徐小兵 熊光練
?
信息熵在系統(tǒng)結(jié)構(gòu)外部影響測(cè)量中的應(yīng)用
華中科技大學(xué)同濟(jì)醫(yī)學(xué)院公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(430030) 萬(wàn)政策 徐小兵 熊光練△
【提 要】 目的 探討系統(tǒng)結(jié)構(gòu)外部影響因素的測(cè)量方法。方法 以信息熵的原理和方法為基礎(chǔ),進(jìn)行統(tǒng)計(jì)變換,然后結(jié)合多重線性回歸分析方法,對(duì)系統(tǒng)結(jié)構(gòu)的外部影響因素進(jìn)行測(cè)量。結(jié)果 在實(shí)例分析中,武漢市某醫(yī)院2013年和2014年治療效果結(jié)構(gòu)的構(gòu)成比例非常接近,結(jié)構(gòu)均衡指數(shù)分別為0.5339和0.5358。多重線性回歸分析結(jié)果提示,危重病人搶救人次數(shù)、手術(shù)人次數(shù)、手術(shù)病人術(shù)后平均住院日、醫(yī)院轉(zhuǎn)診率等四個(gè)因素是該醫(yī)院治療效果結(jié)構(gòu)的影響因素。結(jié)論
信息熵能夠較好地運(yùn)用于多種結(jié)構(gòu)數(shù)據(jù)中,幫助我們探索結(jié)構(gòu)的外部影響因素。
【關(guān)鍵詞】信息熵 結(jié)構(gòu) 影響因素
信息熵作為現(xiàn)代生物醫(yī)學(xué)研究的一種新思路和新方法[1],目前已廣泛應(yīng)用在遺傳學(xué)、影像學(xué)、腫瘤和分子結(jié)構(gòu)研究等領(lǐng)域,在疾病診斷和病理機(jī)制探索方面正逐漸展現(xiàn)出獨(dú)特的優(yōu)勢(shì)。信息熵是一種測(cè)量系統(tǒng)結(jié)構(gòu)信息量的方法,系統(tǒng)結(jié)構(gòu)的穩(wěn)定性會(huì)受到許多外部因素的影響,本文基于信息熵的理論和方法,結(jié)合多重線性回歸,實(shí)現(xiàn)了對(duì)系統(tǒng)結(jié)構(gòu)外部影響的測(cè)量,為結(jié)構(gòu)數(shù)據(jù)的分析提供了一種新的思路和方法。
系統(tǒng)結(jié)構(gòu)可以由多個(gè)類別構(gòu)成。結(jié)構(gòu)的表觀特征一般用構(gòu)成比來(lái)描述,結(jié)構(gòu)的內(nèi)在核心特征是結(jié)構(gòu)所包含的信息量。結(jié)構(gòu)的信息量度量用信息熵表示,信息熵可以反映系統(tǒng)結(jié)構(gòu)無(wú)序或混亂的程度,系統(tǒng)越混亂,熵值越大;系統(tǒng)越有序,熵值越?。?]。信息熵最早由Shannon于1948年提出:

pi原指信源發(fā)出各種符號(hào)的頻率或者概率[3],在本文中為系統(tǒng)各類別的構(gòu)成比。系統(tǒng)共有n個(gè)類別,當(dāng)各類別構(gòu)成比相同時(shí),信息熵值最大,最大值為log2n[4]。
結(jié)構(gòu)均衡指數(shù)(BI)是信息熵與最大熵的比值,能夠反應(yīng)結(jié)構(gòu)的均衡狀態(tài),取值范圍為[0,1]。BI =0時(shí),結(jié)構(gòu)處于最不均衡狀態(tài),即此時(shí)結(jié)構(gòu)有序性最高;BI =1時(shí),結(jié)構(gòu)處于最均衡狀態(tài),即此時(shí)結(jié)構(gòu)有序性最低。BI的計(jì)算公式如下:

大數(shù)據(jù)模擬實(shí)驗(yàn)表明,對(duì)BI進(jìn)行l(wèi)ogit變換,變換后的值y服從正態(tài)分布。此時(shí)即可以y為因變量,外部因素為自變量,采用多重線性回歸的方法測(cè)量外部因素對(duì)結(jié)構(gòu)的影響。
為進(jìn)一步說(shuō)明信息熵在系統(tǒng)結(jié)構(gòu)外部影響測(cè)量中的應(yīng)用,本文使用武漢市某醫(yī)院2013年和2014年的數(shù)據(jù),對(duì)該醫(yī)院116個(gè)科室的治療效果結(jié)構(gòu)(治愈人數(shù)、好轉(zhuǎn)人數(shù)、未愈人數(shù)、死亡人數(shù))進(jìn)行分析,計(jì)算并比較該醫(yī)院兩年的結(jié)構(gòu)均衡指數(shù),并測(cè)量危重病人搶救人次數(shù)、手術(shù)人次數(shù)、出院者平均住院日、手術(shù)病人術(shù)后平均住院日、親屬陪伴率、三日確診率、醫(yī)院轉(zhuǎn)診率等七個(gè)因素對(duì)治療效果結(jié)構(gòu)的影響程度。
分析步驟如下:
1.根據(jù)各個(gè)科室的治療效果結(jié)構(gòu),計(jì)算各個(gè)科室的結(jié)構(gòu)均衡指數(shù)。2013年結(jié)構(gòu)均衡指數(shù)分布:中位數(shù)為0.3661,四分位間距為0.3579。2014年結(jié)構(gòu)均衡指數(shù)分布:中位數(shù)為0.3567,四分位間距為0.3788。對(duì)兩組結(jié)構(gòu)均衡指數(shù)分布進(jìn)行秩和檢驗(yàn),χ2=0.40,P =0.5285>0.05,說(shuō)明尚不能認(rèn)為兩組分布不同。
2.分別計(jì)算2013年和2014年該醫(yī)院治療效果結(jié)構(gòu)中各類別的構(gòu)成比例,以及相應(yīng)的信息熵和結(jié)構(gòu)均衡指數(shù)。可以發(fā)現(xiàn),2013年和2014年治療效果結(jié)構(gòu)的構(gòu)成比例、信息熵以及結(jié)構(gòu)均衡指數(shù)都非常接近,結(jié)構(gòu)均衡指數(shù)分別為0.5339和0.5358。結(jié)果見(jiàn)表1。

表1 2013年和2014年該醫(yī)院治療效果結(jié)構(gòu)情況
3.對(duì)結(jié)構(gòu)均衡指數(shù)進(jìn)行l(wèi)ogit變換,以logit變換后的值為因變量,以待研究的七個(gè)因素為自變量,采用逐步回歸的方法,入選標(biāo)準(zhǔn)為0.10,剔除標(biāo)準(zhǔn)為0.15,進(jìn)行多重線性回歸分析。2013年和2014年分析結(jié)果顯示,危重病人搶救人次數(shù)、手術(shù)人次數(shù)、手術(shù)病人術(shù)后平均住院日、醫(yī)院轉(zhuǎn)診率等四個(gè)因素是該醫(yī)院治療效果結(jié)構(gòu)的影響因素。結(jié)果見(jiàn)表2和表3。

表2 2013年治療效果結(jié)構(gòu)影響因素分析結(jié)果

表3 2014年治療效果結(jié)構(gòu)影響因素分析結(jié)果
結(jié)構(gòu)均衡指數(shù)能夠較好地反映結(jié)構(gòu)的變動(dòng)情況,從實(shí)例分析的結(jié)果中可以看出,該醫(yī)院2013年和2014年的結(jié)構(gòu)均衡指數(shù)分別為0.5339和0.5358,說(shuō)明該醫(yī)院的治療效果結(jié)構(gòu)在2013年和2014年處于比較穩(wěn)定的狀態(tài)。通常情況下,治療效果結(jié)構(gòu)在絕大多數(shù)科室中表現(xiàn)為治愈率和好轉(zhuǎn)率較高,未愈率較低,死亡率最低。如果存在某外部因素能使得結(jié)構(gòu)的均衡指數(shù)變大,治療效果結(jié)構(gòu)會(huì)朝著無(wú)序狀態(tài)發(fā)展,結(jié)構(gòu)各部分比例趨于一致,也就是治愈率、好轉(zhuǎn)率下降,或者未愈率、死亡率上升,那么該外部因素就是治療效果結(jié)構(gòu)的危險(xiǎn)因素;反之,該外部因素就是治療效果結(jié)構(gòu)的保護(hù)因素。2013年和2014年的多重線性回歸結(jié)果均提示,危重病人搶救人次數(shù)、手術(shù)人次數(shù)、手術(shù)病人術(shù)后平均住院日是治療效果結(jié)構(gòu)的危險(xiǎn)因素。原因可能是這三個(gè)因素均能在一定程度上反應(yīng)病情的惡化程度,手術(shù)病人術(shù)后住院日在有關(guān)研究中已經(jīng)被作為手術(shù)治療效果的衡量因素[5]。2014年多因素結(jié)果提示,醫(yī)院轉(zhuǎn)診率是治療效果結(jié)構(gòu)的危險(xiǎn)因素。轉(zhuǎn)診病人的病情一般比較復(fù)雜和嚴(yán)重[6],轉(zhuǎn)診過(guò)程也會(huì)影響某些急性病的救治[7],轉(zhuǎn)診率高可能就會(huì)引起治療效果結(jié)構(gòu)朝著不合理方向改變。運(yùn)用文中所探討的方法,可以得到治療效果結(jié)構(gòu)的影響因素,從而為評(píng)價(jià)和管理醫(yī)院的治療效果結(jié)構(gòu)提供有力的支持。
本文介紹的方法能夠廣泛地應(yīng)用在醫(yī)學(xué)相關(guān)領(lǐng)域中,除了文中進(jìn)行闡述的治療效果結(jié)構(gòu)外,研究中還會(huì)遇到許多其他的結(jié)構(gòu)數(shù)據(jù)。例如目前醫(yī)療費(fèi)用由政府財(cái)政投入、社會(huì)投入、個(gè)人投入三部分組成,構(gòu)成一個(gè)結(jié)構(gòu)數(shù)據(jù);該醫(yī)療費(fèi)用結(jié)構(gòu)受到國(guó)民收入總值(GDP)、居民可支配性收入、物價(jià)指數(shù)等因素的影響,可用該分析方法探究各個(gè)影響因素對(duì)醫(yī)療費(fèi)用結(jié)構(gòu)的影響大小。同樣可用該方法分析平均醫(yī)療費(fèi)用、平均住院日等因素對(duì)醫(yī)?;鹬С鼋Y(jié)構(gòu)的影響。醫(yī)學(xué)相關(guān)領(lǐng)域中大量存在的待研究的結(jié)構(gòu)數(shù)據(jù),使得該方法具有較好的實(shí)踐性和現(xiàn)實(shí)意義。在實(shí)際應(yīng)用中,文中所探討的方法也會(huì)暴露一些不足之處,比如對(duì)于小樣本數(shù)據(jù),結(jié)構(gòu)均衡指數(shù)進(jìn)行l(wèi)ogit變換后,并不一定服從正態(tài)分布,如果繼續(xù)運(yùn)用多重線性回歸分析方法就會(huì)出現(xiàn)問(wèn)題。尤其是結(jié)構(gòu)均衡指數(shù)等于或者接近1或0時(shí),logit變換后的值趨近正、負(fù)無(wú)窮大,對(duì)分析的結(jié)果會(huì)產(chǎn)生較大的影響,這時(shí)就需要對(duì)強(qiáng)影響點(diǎn)進(jìn)行相應(yīng)的處理[8],以提高回歸方程的質(zhì)量。
參考文獻(xiàn)
[1]張岱,金寶榮.信息熵在現(xiàn)代生物醫(yī)學(xué)中的應(yīng)用.數(shù)理醫(yī)藥學(xué)雜志,2001,(1):74-75.
[2]張登兵,劉思峰.熵與系統(tǒng)有序性研究綜述.數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,(24):200-206.
[3]Shannon C.A Mathematical Theory of Commumication.Bell System Technical Journal,1948,27(3):3-55.
[4]田振清,周越.信息熵基本性質(zhì)的研究.內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版),2002,(4):347-350.
[5]Cohan JN,Bacchetti P,Varma MG,et al.Outcomes after ileoanal pouch surgery in frail and older adults.J Surg Res,2015,198(2):327-333.
[6]陳敏.危重患者在基層轉(zhuǎn)診中存在風(fēng)險(xiǎn)因素及護(hù)理干預(yù)措施.蚌埠醫(yī)學(xué)院學(xué)報(bào),2014,39(7):985-987.
[7]田靜,李穎.急性缺血性腦卒中患者院前延誤因素的調(diào)查與研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2014,(4):622-624.
[8]曲桂玉,陳景武,杜國(guó)防.多元回歸分析肺吸蟲(chóng)囊蚴脫囊影響因素中有關(guān)異常點(diǎn)的探討.數(shù)理醫(yī)藥學(xué)雜志,2007,20(2):188-190.
(責(zé)任編輯:鄧 妍)
通信作者:△熊光練,E-mail:weixiong@ mails.tjmu.edu.cn