張和華 向 華 吳 旋 萇飛霸 徐 力 尹 軍*
數(shù)據(jù)挖掘技術(shù)在醫(yī)療設(shè)備行業(yè)中的應(yīng)用研究
張和華①向 華①吳 旋①萇飛霸①徐 力①尹 軍①*
目的:分析我國各地區(qū)醫(yī)療設(shè)備領(lǐng)域的發(fā)展?fàn)顩r,掌握醫(yī)療設(shè)備行業(yè)發(fā)展現(xiàn)狀與趨勢(shì),提出采用數(shù)據(jù)挖掘(DM)技術(shù)管理醫(yī)療設(shè)備的措施。方法:利用DM技術(shù),通過對(duì)我國部分地區(qū)醫(yī)療設(shè)備投資額、研究設(shè)計(jì)人員數(shù)目及當(dāng)年總產(chǎn)值等數(shù)據(jù)進(jìn)行挖掘分析。結(jié)果:我國醫(yī)療設(shè)備管理的發(fā)展勢(shì)頭在華東、華北地區(qū)較為明顯,西南和西北地區(qū)則相對(duì)較為落后。結(jié)論:數(shù)據(jù)挖掘技術(shù)對(duì)于醫(yī)療設(shè)備的管理與研究具有一定的參考價(jià)值,而基于決策樹的分類方法可應(yīng)用于我國醫(yī)療設(shè)備行業(yè)的管理。
數(shù)據(jù)挖掘;醫(yī)療設(shè)備;行業(yè);決策樹;分析
[First-author’s address] Department of Medical Engineering, Institute of Surgery Research, Daping Hospital, Third Military Medical University, Chongqing 400042, China.數(shù)據(jù)挖掘(data mining,DM),即數(shù)據(jù)庫中的知識(shí)發(fā)掘(knowledge discovery in data,KDD),是指利用大量數(shù)據(jù)進(jìn)行分析,從中提取潛在的、有效的、新穎的及最終可理解的模式過程[1-3]。DM的本質(zhì)是從大量模糊的、隨機(jī)的和無規(guī)律的行為數(shù)據(jù)中尋找其背后隱藏的規(guī)律或規(guī)則,分析特定領(lǐng)域中一些已有數(shù)據(jù)的含義,并預(yù)測(cè)其在某個(gè)階段的發(fā)展方向。近年來,基于數(shù)據(jù)庫的DM技術(shù)已成為目前DM領(lǐng)域較為熱門的研究課題,在科學(xué)界及相關(guān)產(chǎn)業(yè)界引起較大關(guān)注,并作為一個(gè)新興的學(xué)科逐步崛起,DM有著較為龐大的數(shù)據(jù)系統(tǒng)及相關(guān)的知識(shí)[4-5]。目前,我國的醫(yī)療設(shè)備市場日益壯大,在世界范圍內(nèi)的醫(yī)療設(shè)備市場中仍最具發(fā)展前景,通過DM的相關(guān)技術(shù)能夠在我國醫(yī)療設(shè)備管理應(yīng)用中的大量數(shù)據(jù)進(jìn)行較為明確的分類,提取有用信息。本研究通過對(duì)遴選的18個(gè)省、市自治區(qū)醫(yī)療信息數(shù)據(jù)統(tǒng)計(jì),并通過數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,獲取有用的信息和結(jié)論。
1.1 數(shù)據(jù)集的選擇與處理
參考2013年《中國高技術(shù)統(tǒng)計(jì)年鑒》,分析2012年醫(yī)療設(shè)備行業(yè)情況。采用SPSS 18.0統(tǒng)計(jì)學(xué)軟件對(duì)我國不同地區(qū)的投資額、研究設(shè)計(jì)人員數(shù)目總量進(jìn)行有目的的分類;對(duì)入選的18個(gè)省、市、自治區(qū)根據(jù)所在區(qū)域進(jìn)行泛化。其中黑龍江省、吉林省和遼寧省隸屬東北地區(qū);北京市、天津市和河北省隸屬華北地區(qū);上海市、浙江省和福建省隸屬華東地區(qū);陜西省、甘肅省和寧夏回族自治區(qū)隸屬西北地區(qū);重慶市、四川省和貴州省隸屬西南地區(qū);河南省、湖北省和廣東省隸屬中南地區(qū)。根據(jù)6地區(qū)醫(yī)療設(shè)備投資額的不同,依次分為低、中、高3類。研究設(shè)計(jì)人員數(shù)目分為稀少、少、中、多4個(gè)層次。從數(shù)據(jù)統(tǒng)計(jì)結(jié)果來看,各地區(qū)醫(yī)療設(shè)備投資額、研究設(shè)計(jì)人員數(shù)目情況呈現(xiàn)不同的特點(diǎn)。
1.2 決策樹的生成步驟
(1)從大量數(shù)據(jù)中挑選一個(gè)較為適宜的屬性作為研究中“樹”的“根”。假設(shè)X和Y為樣本的兩大類,即一棵樹上的兩個(gè)信息源,如果屬性A被選作決策樹的“根”,其值可用A1、A2、A3、A4…分別表示,樣本集C則被分配成C1、C2、C3、C4…不同類型,其中Ci在一定程度上包括樣本集中C的屬性A的值A(chǔ)i。若Ci包含屬于T類的Ti個(gè)樣品,那么對(duì)于Ci形成的“子樹”所需信息量為H(Xi,Yi)。以屬性A形成的樹所需的信息量則表示為公式1:
則A的分支獲得信息增益表示為公式2:
(2)選擇子樹的根。方法及過程同上。
(3)決策樹的修剪。在建立一棵決策樹的過程中,要盡可能地排除混入的無用的噪聲數(shù)據(jù)。建樹所需的信息量表示為公式3:
鑒于研究設(shè)計(jì)人員增益的特殊屬性,根據(jù)決策樹的生成步驟,選其為決策樹的“根”。首先創(chuàng)建一個(gè)與其相關(guān)的結(jié)點(diǎn),利用研究設(shè)計(jì)人員顯示標(biāo)記,同時(shí)再分出不同的枝,利用對(duì)樣本的劃分對(duì)各分支行遞歸運(yùn)算分析后形成最終的決策樹(如圖1所示)。
圖1 最終決策樹框圖
研究結(jié)果顯示,我國醫(yī)療設(shè)備管理的發(fā)展勢(shì)頭在華東、華北地區(qū)較為明顯;西南和西北地區(qū)則相對(duì)較為落后,其中研究設(shè)計(jì)人員和投資額均在一個(gè)較低的水平,其原因是區(qū)域的地理位置偏僻;就發(fā)達(dá)程度比較而言,西南和西北處于相對(duì)較閉塞的地區(qū),再加之氣候、環(huán)境及土壤等自然條件也比較惡劣,以上客觀原因均可導(dǎo)致其研究設(shè)計(jì)人員比例過少、投資額不高等現(xiàn)象,這在很大程度上導(dǎo)致了這些地區(qū)醫(yī)療設(shè)備管理水平下的總產(chǎn)值較低。因此,可以運(yùn)用決策樹對(duì)我國醫(yī)療設(shè)備領(lǐng)域中的相關(guān)指標(biāo)數(shù)據(jù)進(jìn)行分類,針對(duì)連續(xù)等數(shù)據(jù)行聚類分析來做離散化處理,再通過對(duì)其行決策樹分類分析,建立與我國醫(yī)療設(shè)備行業(yè)情況較為適合的決策樹。
DM技術(shù)是由多種學(xué)科技術(shù)凝練而成,具有一定的廣泛性,可涉及到數(shù)據(jù)庫技術(shù)、高性能計(jì)算、統(tǒng)計(jì)學(xué)、機(jī)械學(xué)、信息檢索、圖像與信號(hào)識(shí)別等領(lǐng)域[6-7]。近年來,隨著科技的不斷進(jìn)步,針對(duì)DM技術(shù)的研究逐漸廣泛,已經(jīng)成為業(yè)界公認(rèn)的信息產(chǎn)業(yè)中最具前途及前景的一門交叉融合學(xué)科[8]。DM技術(shù)不僅可以幫助決策者在對(duì)現(xiàn)有的信息總結(jié)的基礎(chǔ)上來預(yù)測(cè)未來的發(fā)展,還可以根據(jù)相應(yīng)發(fā)展趨勢(shì)做出決策。常采用的主要方法有關(guān)聯(lián)規(guī)則、決策樹、神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗糙集以及聯(lián)機(jī)分析處理(on-line analytical processing,OLAP)方法等[9-12]。
目前,我國的DM技術(shù)尚未形成較大的規(guī)模,發(fā)展尚未完善,還處于起步階段,對(duì)于數(shù)據(jù)的研究分析也僅集中于電信、保險(xiǎn)及金融等較為知名、規(guī)模較大和發(fā)展較成熟的行業(yè),在與醫(yī)學(xué)相關(guān)的領(lǐng)域則較為欠缺[13]。因此,研究DM技術(shù)對(duì)于我國醫(yī)療設(shè)備管理有一定的理論和實(shí)踐意義,尤其是隨著新能源、新材料和其他一些高科技領(lǐng)域的騰飛發(fā)展。在研究設(shè)計(jì)人員的選擇方面,DM技術(shù)的結(jié)果具有一定的指導(dǎo)性。在醫(yī)療設(shè)備的高利潤、高投入的大背景下,進(jìn)行市場的推廣需要較大的成本付出,這些因素導(dǎo)致了醫(yī)療設(shè)備管理上對(duì)資金依賴程度較大。
基于決策樹的分類方法適用于我國醫(yī)療設(shè)備行業(yè)的管理情況。在醫(yī)療設(shè)備管理發(fā)展的過程中應(yīng)充分利用DM技術(shù)加強(qiáng)對(duì)醫(yī)療設(shè)備的管理,加大技術(shù)設(shè)備、資金的投入比例,改善人才匱乏的技術(shù)環(huán)境,通過建設(shè)高新區(qū)、招商引資等不同的途徑吸引更多的人才,從而促進(jìn)我國醫(yī)療設(shè)備管理領(lǐng)域綜合實(shí)力的提高。
[1]伍平陽,林意群,林木炎,等.基于數(shù)據(jù)挖掘技術(shù)的醫(yī)療設(shè)備績效預(yù)測(cè)方法的應(yīng)用研究[J].南方醫(yī)科大學(xué)學(xué)報(bào),2008,28(2):222-224.
[2]張?jiān)?,張奕,皇甫德俊,?醫(yī)療設(shè)備監(jiān)測(cè)系統(tǒng)軟件架構(gòu)設(shè)計(jì)[J].南京廣播電視大學(xué)學(xué)報(bào),2013(2):91-94.
[3]翟鳳杰,費(fèi)曉璐,洪松林,等.醫(yī)學(xué)科研數(shù)據(jù)倉庫的建設(shè)[J].中國醫(yī)療設(shè)備,2013,28(12):80-82.
[4]于春華.基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院器材管理決策支持系統(tǒng)[J].醫(yī)療衛(wèi)生裝備,2005,26(10):37-38.
[5]王丹.基于數(shù)據(jù)挖掘的醫(yī)療設(shè)備購買可行性評(píng)估系統(tǒng)構(gòu)想[J].科技信息,2010(27):492,456.
[6]魏繼勇.數(shù)據(jù)挖掘技術(shù)在用戶流失分析模型中的應(yīng)用[J].中國醫(yī)學(xué)裝備,2009,6(3):17-19.
[7]伍平陽,林意群,林木炎,等.基于數(shù)據(jù)挖掘技術(shù)的決策樹算法在醫(yī)療設(shè)備績效預(yù)測(cè)中的應(yīng)用[J].中國組織工程研究與臨床康復(fù),2008,12(9):1689-1692.
[8]霍洪波,何必仕,吳斌,等.基于數(shù)據(jù)倉庫的醫(yī)療設(shè)備績效統(tǒng)計(jì)分析[J].中國醫(yī)療設(shè)備,2013,28(9):27-30.
[9]史今馳.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)中的應(yīng)用[J].中國醫(yī)療設(shè)備,2012,27(1):86-88.
[10]伍平陽.基于數(shù)據(jù)挖掘技術(shù)的醫(yī)療設(shè)備績效預(yù)測(cè)方法的應(yīng)用研究[D].南方醫(yī)科大學(xué),2008.
[11]郝麗俊,莫國民,王艷,等.基于數(shù)據(jù)挖掘技術(shù)的AD腦電定征輔助檢測(cè)技術(shù)探討[J].中國醫(yī)學(xué)裝備,2011,8(2):1-3.
[12]蘇韶生,程敏婷,張淑娟,等.大型醫(yī)院開展數(shù)據(jù)挖掘項(xiàng)目存在的問題及對(duì)策[J].中國醫(yī)療設(shè)備,2010,25(8):59-60,84.
[13]楊曉鵬.淺談信息系統(tǒng)在醫(yī)療設(shè)備管理中的應(yīng)用[J].醫(yī)學(xué)信息(中旬刊),2011,24(9):4601-4602.
Discussion on the application of data mining technology in the medical equipment industry
ZHANG He-hua, XIANG Hua, WU Xuan, et al// China Medical Equipment,2015,12(1):48-50.
Objective: To analyze the expenditure about investment of technical, staff and annual production situation in the field of medical equipment in different regions of China, grasp the development status and trend of medical equipment industry, put forward measures and suggestions of value. Methods: Analyze the output of medical equipment investment in some areas of China, R&D and staff by data mining technology (DM). Results: Medical equipment management development momentum in East China, North China area is obvious, relatively speaking; the southwest and northwest regions are relatively backward. Conclusion: Data mining technology has some reference value to the research of management of medical equipment, which can be used in Chinese medical equipment industry management from the classification based on decision tree.
Data mining; Medical equipment; Industry; The decision tree; Analysis
張和華,男,(1982- ),博士,工程師。第三軍醫(yī)大學(xué)大坪醫(yī)院野戰(zhàn)外科研究所醫(yī)學(xué)工程科,從事醫(yī)學(xué)裝備的管理及醫(yī)療器械開發(fā)工作。
1672-8270(2015)01-0048-03
R197.324
A
10.3969/J.ISSN.1672-8270.2015.01.015
2014-06-10
①第三軍醫(yī)大學(xué)大坪醫(yī)院野戰(zhàn)外科研究所醫(yī)學(xué)工程科 重慶 400042
*通訊作者:gaiety@126.com