伍海鵬,劉紅雄,蘭樂霞,康 潔,張紅蓮
(冷水江市人民醫(yī)院中藥房,湖南冷水江 417500)
關(guān)聯(lián)分析在中藥斗譜編排中的應(yīng)用
伍海鵬*,劉紅雄,蘭樂霞,康 潔,張紅蓮
(冷水江市人民醫(yī)院中藥房,湖南冷水江 417500)
目的:找尋中醫(yī)處方所含藥物的關(guān)聯(lián)規(guī)律,據(jù)此對藥斗擺放進行合理規(guī)劃。方法:選取我院中藥房2009年11月至2010年8月共2 054張?zhí)幏?,采用?shù)據(jù)挖掘軟件SPSSClementine進行統(tǒng)計分析,找出藥物的排列規(guī)律。結(jié)果:使用頻數(shù)較高的為甘草、黃芩、玄參、板藍根、苦杏仁等30味藥,與這30味藥關(guān)聯(lián)度較大的有41味常用藥;把這41味藥排列在藥斗的最適位置,其相關(guān)藥在周圍,可提高調(diào)劑效率。結(jié)論:使強關(guān)聯(lián)的中藥擺放在合適區(qū)域,可加快中藥調(diào)配速度,提高勞動效率。
數(shù)據(jù)挖掘;關(guān)聯(lián)分析;中藥;斗譜
藥斗是盛裝中藥飲片的容器,為了便于調(diào)劑工作,藥斗架內(nèi)存放飲片有一定的規(guī)律,稱為“斗譜”。中藥房每天最基本的工作是中藥調(diào)劑,在基層醫(yī)院,患者的經(jīng)濟狀況決定了中藥房的絕大部分工作還得延續(xù)傳統(tǒng)的手抓稱量方式來調(diào)配中藥飲片,這使得中藥房調(diào)配任務(wù)重、用藥量多、工作繁忙。故合理的斗譜編排對于降低工作人員的勞動強度和提高勞動效率有重要意義,而且是避免發(fā)生差錯的重要因素。
中藥斗譜的編排多按處方需要、方劑組成、入藥部位、藥物性味、調(diào)配人員的習慣等原則進行。這種排列的科學性一直受到關(guān)注,有研究者采用計算機對此進行了改進[1~4],或就其排列原則闡明了自己的看法[5]。對調(diào)配的操作進行分解后,筆者發(fā)現(xiàn)調(diào)配的流程主要由單人逐張?zhí)幏綀?zhí)行,調(diào)配耗用時間與單味藥量的關(guān)系不大,但與處方中藥物的種類直接相關(guān)。在不同區(qū)域藥斗間反復(fù)走動是占用時間最多的步驟,如何減少這種重復(fù)走動是縮減工作時間的關(guān)鍵因素。使同一張?zhí)幏街械牟煌幖性谝粋€區(qū)域以方便抓取,即可有效地解決這個問題。為此,需要考慮單獨每張?zhí)幏胶兄兴幍年P(guān)聯(lián)度(或聚集度),以便更合理地進行斗譜排列。
數(shù)據(jù)挖掘(Data mining)是一個從海量數(shù)據(jù)中抽取挖掘出未知的、有價值的模式或規(guī)律等知識的復(fù)雜過程。其中的關(guān)聯(lián)分析(Association analysis)是從給定的數(shù)據(jù)集發(fā)現(xiàn)頻繁出現(xiàn)的項集模式知識,廣泛用于市場營銷、事務(wù)分析等應(yīng)用領(lǐng)域。門診中藥房處方量大,每張?zhí)幏桨畔⒘恳捕?,適合于用應(yīng)用數(shù)據(jù)挖掘原理進行關(guān)聯(lián)分析。
基于上述考慮,筆者采用數(shù)據(jù)挖掘?qū)S密浖PSSClementine(12.0版)對我院門診中藥房的處方進行了統(tǒng)計分析,以期找出其排列規(guī)律。
調(diào)取我院門診中藥房2009年11月至2010年8月所有中藥調(diào)劑處方,采用整群隨機抽樣的方法,以天為單位抽樣。隨機數(shù)由Excel隨機函數(shù)發(fā)生(2003版),乘以30后取整數(shù)即為某月抽中的天數(shù),抽中的當天所有處方均納入研究。
由于我院門診中藥房的管理軟件不能完整導出處方數(shù)據(jù),故采用人工錄入的方法,將總計2 054張?zhí)幏桨慈掌?、醫(yī)師名、處方流水號、處方藥物錄入Excel表格中,雙人核對,對其單元格數(shù)據(jù)格式進行規(guī)范化(“1”代表處方中含有該中藥,“0”代表不含有)后導入SPSSClementine軟件中建立處方數(shù)據(jù)庫,數(shù)據(jù)類型為“標志”,字段輸入方向為“兩者”,建立節(jié)點和數(shù)據(jù)流。
對所有納入研究的處方按單味藥物的使用頻數(shù)進行統(tǒng)計,并按頻數(shù)排名次序計算其累積使用頻數(shù)。從數(shù)據(jù)庫去除使用頻數(shù)低于30次以下的藥物,建立篩選數(shù)據(jù)庫。
按支持度為0.5%、置信度為40%,對篩選數(shù)據(jù)庫進行關(guān)聯(lián)分析(在同一張?zhí)幏街谐霈F(xiàn)的中藥相互間均為關(guān)聯(lián)),繪出環(huán)形Web圖(舍去300以下的鏈接,用線條粗細代表關(guān)聯(lián)的強弱);對頻數(shù)排名前30味藥物分別作關(guān)聯(lián)分析,繪制定向Web圖。
采用整群隨機抽樣的方法獲得2 054張?zhí)幏?,建立處方?shù)據(jù)庫后,統(tǒng)計共使用了229味中藥,基本覆蓋了藥房的全部中藥。對中藥使用的頻數(shù)進行統(tǒng)計排序后發(fā)現(xiàn),使用頻數(shù)最高的為甘草(1 924次),近93.8%的處方中含有它,其頻數(shù)是排序第2位黃芩(982次)的2倍。使用頻數(shù)排序前30味中藥使用頻數(shù)總和占藥物總使用頻數(shù)的61.7%,依次為甘草、黃芩、玄參、板藍根、苦杏仁、前胡、白前、旱半夏、山茱萸、浙貝母、丹參、黃芪、桔梗、川貝母、白芷、山楂、紫蘇葉、桑白皮、牛膝、黃柏、黨參、金銀花、麥芽、砂仁、生地黃、白芍、川芎、當歸、黃連、荊芥。統(tǒng)計還顯示,排名前58味的中藥使用頻數(shù)總和占藥物總使用頻數(shù)的80.4%,表明絕大部分中藥調(diào)劑工作與這些藥有關(guān)。
使用頻數(shù)第122~225位的中藥累積使用次數(shù)均在30次以下(平均每月使用<3次),可以認為這些藥的使用頻數(shù)較低,即使與其他藥有關(guān)聯(lián),其數(shù)據(jù)對分析的意義不大。為減少計算量,對使用頻數(shù)第1~121位的中藥重建篩選數(shù)據(jù)庫,對其進行關(guān)聯(lián)分析(見圖1),得到鏈接>300的17味中藥,依次為甘草(GCO)、黃芩(HQG)、玄參(XSG)、板藍根(BLG)、苦杏仁(KXR)、前胡(QHU)、白前(BQN)、旱半夏(HBX)、山茱萸(SZY)、浙貝母(ZBM)、丹參(DSG)、黃芪(HQI)、桔梗(JGG)、川貝母(JBI),白芷(BZI)、山楂(SZO)、紫蘇葉(SYE),這與使用頻數(shù)的排序基本一致(見表1)。同時對使用頻數(shù)第1~30位的中藥分別在篩選數(shù)據(jù)庫中進行定向關(guān)聯(lián)分析(例如與黃芪關(guān)聯(lián)度大的藥物依次為甘草(GCO)、山茱萸(SZY)、丹參(DSG)、黨參(DAS)、山楂(SZO)、玄參(XSG)、黃柏(HBI),見圖2),分別得到與這30味中藥關(guān)聯(lián)度較大的前8名藥物,去重復(fù)后合計共41味藥。
表1 強關(guān)聯(lián)藥物表(links>300)Tab 1 Herbswith strong correlation(links>300)
既往的斗譜排列改良所應(yīng)用的方法多為自編的計算程序[1,2]或者利用微軟 Office中的Excel程序[3,4],其表格的容積和計算量有限,并不適宜門診中藥房的大量處方統(tǒng)計;其計算原理大都基于藥物的使用頻數(shù)統(tǒng)計[3,4],相對合理的則利用模糊數(shù)學隸屬函數(shù)進行計算[1,2],未對調(diào)配過程進行更進一步的探索。數(shù)據(jù)挖掘技術(shù)用于中藥斗譜的研究尚未見報道。
本研究以關(guān)聯(lián)度而非使用頻數(shù)作為主要的統(tǒng)計變量,利用關(guān)聯(lián)分析方法對大量處方進行分析。關(guān)聯(lián)分析的計算量與處方量及每張?zhí)幏街泻械乃幬冻烧?,門診處方量每月數(shù)以千計,中藥處方的品種組合較多,無法按化學藥的系統(tǒng)疾病藥物歸類簡化,大時間跨度的處方量完全進行數(shù)據(jù)挖掘分析對計算機硬件要求較高。為了適應(yīng)現(xiàn)有的計算條件,盡可能多地涵蓋多個時間段,本研究采用整群隨機抽樣的方法對門診處方以天為單位取樣,確保了數(shù)據(jù)樣本的代表性,較好地保留了處方中的關(guān)聯(lián)度特征,又不會因處方量增加而使計算量激增。在計算過程中合理地舍棄了累積使用頻數(shù)低于一定數(shù)目的藥物,建立篩選數(shù)據(jù)庫,進一步減少了計算量,使關(guān)聯(lián)分析工作得以在普通計算機上進行。由于關(guān)聯(lián)分析的排序與使用頻數(shù)有一定的關(guān)系,某些強關(guān)聯(lián)的藥物可能由于使用率較低而被軟件漏掉,為此對單味藥進行定向關(guān)聯(lián)分析是整個數(shù)據(jù)庫關(guān)聯(lián)分析的必要補充。
本研究得到的使用頻數(shù)最高的30味藥,其組成有一定規(guī)律:多為清熱解毒或滋補藥物,表明在我院中醫(yī)科就診患者以中醫(yī)內(nèi)科疾病為主;對使用頻數(shù)排列前121味藥的關(guān)聯(lián)分析顯示其與使用頻數(shù)排序基本一致,這與臨床工作的經(jīng)驗相符。對其中每一味藥分別做定向關(guān)聯(lián)計算,也體現(xiàn)了這一特征:定向關(guān)聯(lián)得到的41種常用藥物均包含在使用頻數(shù)前60名內(nèi)。把這41味藥排列在藥斗的最適位置,其相關(guān)藥在周圍,只需要變動不多的藥斗位置,就可較好地避免斗譜改良后員工的記憶紊亂;對此筆者還采用人機工程學原理對藥斗的擺放位置、藥柜高度、強關(guān)聯(lián)藥物的分布進行了重新設(shè)計和布局,得到了較好的效果(另文發(fā)表);對于使用頻數(shù)最高的甘草,每日消耗量也大,采用大斗裝藥,并多處設(shè)斗放置的方式較好地滿足了其用量和頻數(shù)的要求。
本研究嘗試采用GRI或Apriori算法建模進一步分析處方數(shù)據(jù)的規(guī)律,未獲成功,僅作描述性的圖形分析。究其原因與數(shù)據(jù)庫規(guī)模較大(2 052×229=469 908個),藥物的種類多導致數(shù)據(jù)庫的列數(shù)很多,顯著增加關(guān)聯(lián)計算量,單味藥的使用記錄在其中占的比例較?。ㄗ畲笫褂妙l數(shù)的甘草也只占8.5%),其支持度很難滿足建模要求有關(guān)。
本研究僅從門診中醫(yī)處方的藥物關(guān)聯(lián)度進行統(tǒng)計分析,對組方的合理性未作更多的考究;基于醫(yī)師個人的組方偏好,本研究得到的結(jié)論也不完全適合其他醫(yī)院,但其應(yīng)用數(shù)據(jù)挖掘原理處理藥房數(shù)據(jù)、進行關(guān)聯(lián)分析的模式可以借鑒。在此基礎(chǔ)上更進一步地提取處方中含有的其他信息,也可以為藥房的各種藥事管理提供數(shù)據(jù)支持。
(致謝:感謝廣州中醫(yī)藥大學臨床藥理研究所伍海濤老師的指導?。?/p>
[1] 文亦兵,文洪宇,呂得屏.用模糊數(shù)學考查中藥飲片斗譜的編排[J].中國藥房,1997,8(6):288.
[2] 文洪宇,文亦兵.中藥飲片斗譜的編排與考查[J].中國醫(yī)院藥學雜志,1999,19(1):60.
[3] 陳忠東,雷 頌.中藥斗譜編排的電子計算機輔助設(shè)計[J].中國藥房,2007,18(12):950.
[4] 崔麗娟,朱立平.利用現(xiàn)代化手段科學編排中藥斗譜[J].北京中醫(yī)藥,2011,30(6):463.
[5] 石 江,楊建文,葉 風.中藥斗譜編排的合理性探討[J].遵義醫(yī)學院學報,2001,24(2):189.
Application of Association Analysisin Arrangement of Drawer Position of Traditional Chinese Medicine
WU Hai-peng,LIU Hong-xiong,LAN Le-xia,KANG Jie,ZHANG Hong-lian
(TCM Pharmacy,Lengshuijiang Municipal People’s Hospital,Hunan Lengshuijiang 417500,China)
OBJECTIVE:To look for the association rule of herbs in TCM prescription so as to arrange the position of drawers.METHODS:2 054 prescriptions collected from TCM pharmacy of our hospital during Nov.2009-Aug.2010 were analyzed statistically by using SPSS Clementine software to find out the regularity of herb arrangement.RESULTS:Herbs occupying the top place of frequency were Glycyrrhizae Radix et Rhizoma,Scutellaria baicalensis,Scrophularia ningpoensis,Isatis indigotica,Armeniacae Semen Amarum and other 30 herbs.41 commonly used herbs were closely associated with them;the 41 commonly used herbs were arranged in the suitable position of drawers and surrounded by relevant herbs to improve dispensing efficiency greatly.CONCLUSION:Herbs with close correlation should be placed at suitable position to accelerate dispensing of TCM and improve labor efficiency.
Data mining;Association analysis;Traditional Chinese medicine;Drawer position
R282;R942
B
1001-0408(2012)43-4120-03
DOI 10.6039/j.issn.1001-0408.2012.43.35
2011-11-23
2012-01-09)
*博士研究生。研究方向:藥物政策、中藥監(jiān)管。電話:024-23595055。E-mail:fangfang1119@126.com
#通訊作者:教授,研究員。研究方向:社會藥學。E-mail:h5831@yahoo.cn