摘 ?要: 為了研究全國各地區(qū)醫(yī)療發(fā)展狀況,本文以31個地區(qū)為主要研究對象,選取了醫(yī)療衛(wèi)生機構(gòu)數(shù)、三級醫(yī)院數(shù)、衛(wèi)生人員數(shù)、醫(yī)療衛(wèi)生機構(gòu)床位數(shù)、衛(wèi)生總費用等10個指標,數(shù)據(jù)均來自2019中國衛(wèi)生健康統(tǒng)計年鑒,基于主成分分析(PCA)和聚類分析,運用SPSS軟件對評價指標進行標準化,降維和去相關(guān),同時對多元數(shù)據(jù)進行合理的分類,最后對各地區(qū)的醫(yī)療建設(shè)和發(fā)展水平進行評價。
關(guān)鍵詞: 醫(yī)療水平;SPSS軟件;主成分分析;聚類分析
中圖分類號: TP391.41 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2020.06.050
本文著錄格式:李季. 基于主成分分析和聚類分析的各地區(qū)醫(yī)療水平狀況研究[J]. 軟件,2020,41(06):242246
【Abstract】: In order to study the situation of medical development in various regions of the country, this paper takes 31 regions as the main research objects, and selects 10 indicators such as the number of medical and health institutions, the number of tertiary hospitals, the number of health personnel, the number of beds in medical and health institutions, and the total health expenditure. The data is extracted from the 2019 China Health Statistics Yearbook. Based on principal component analysis (PCA) and cluster analysis, SPSS software is used to standardize the evaluation indicators, reduce the dimensions and decorrelate. At the same time, the multivariate data is reasonably classified. Finally, evaluation of the level of medical construction and development in different regions in China is carried out.
【Key words】: Medical level; SPSS software; Principal component analysis; Cluster analysis
0 ?引言
醫(yī)療衛(wèi)生事業(yè)關(guān)系到人民群眾的身體健康和生老病死,與人民群眾切身利益密切相關(guān),是社會高度關(guān)注的熱點。人民群眾往往通過醫(yī)療衛(wèi)生服務(wù)看經(jīng)濟發(fā)展成果,看政府管理能力,看黨風政風建設(shè),看社會和諧公平。大力發(fā)展我國醫(yī)療衛(wèi)生事業(yè),保障公共衛(wèi)生安全,適應(yīng)廣大人民群眾日益增長的醫(yī)療衛(wèi)生需求,提高全民族健康水平,是各地區(qū)的重大任務(wù),也是彰顯一個地區(qū)發(fā)展能力的要素。本文運用主成分分析和聚類分析的方法進行多元統(tǒng)計分析,根據(jù)結(jié)果對全國各區(qū)域醫(yī)療水平狀況作出分析與評價。
1 ?主成分分析和聚類分析的基本思想
通過使用主成分分析(PCA)[1-2]的降維方法,可以保證原始數(shù)據(jù)信息不被拋棄的前提下將原始多元指標重組為幾個不相關(guān)的綜合指標,從而簡化了復(fù)雜的問題。常用的數(shù)學處理方法是將原始的 個指標線性組合為新的綜合指標,但是如果這種線性組合不受限制,則可以提出許多新的綜合指標。因此,為了確保新的綜合指標能夠盡可能多地反映原始指標的信息,在提取新指標時應(yīng)遵循主成分提取原則。即,當提取一個新的綜合指標時,只有那些累計貢獻率達到85%的最大主要成分才可用,這有助于我們在損失部分信息時抓住主要矛盾。這種減少變量數(shù)量并抓住主要矛盾的方法有助于我們分析和處理問題,并使以下聚類分析結(jié)果更加準確。
聚類分析[3]是指將一組物理或抽象對象分為幾類的過程,因此具有相似特征的對象會在同一類中,不同集群之間的對象差異很大。這是一種探索性分析。在分類過程中人們不必事先給出分類標準,而是聚類分析可以從采樣數(shù)據(jù)開始進行自動分類。使用了不同的聚類分析方法,很可能會得到不同的結(jié)論。因此,在聚類分析中,應(yīng)根據(jù)研究需要選擇合適的聚類方法。
主成分分析和聚類分析析[4-5]是一種新的綜合評價方法,它將主成分分析與聚類分析相結(jié)合。該方法首先對樣本進行主成分分析,然后提取幾個主成分作為聚類分析的變量。具體步驟如下:
(1)根據(jù)累積方差貢獻率(通常高于85%)選擇 個主成分,然后計算每個主要成分下的樣本得分;
(2)將 個主成分作為 個樣本變量并進行聚類分析;
(3)評估聚類結(jié)果并給出相關(guān)建議。
2 ?主成分分析和聚類分析的建模說明
根據(jù)上面的3個主成分的線性組合方程,我們可以將標準化后的數(shù)據(jù)帶入計算,最終可以得到表4綜合得分與排名表。
5 ?結(jié)論聚類分析
對31個地區(qū)的10個指標進行了主成分分析,我們提取了3個主成分。通過表5個案處理摘要表,我們可以看出,在整個聚類過程中,所選取的31個城市均參與了聚類分析過程,沒有遺失或未參與的樣本。這充分說明此次聚類分析已經(jīng)對31個樣本的各項指標進行了相似聚類,因而可以進行下一步分析。使用系統(tǒng)的聚類方法對3個指標進行聚類,我們得到圖1的最終結(jié)果。
從圖1看到,我們可以將31個地區(qū)分為5類。在31個地區(qū)中,北京和上海分為同一類別,廣東自成一類,其余可以分為三類,具體可見表6。這個結(jié)果也比較符合我們?nèi)粘5恼J知,作為全國政治和經(jīng)濟中心,北京和上海的醫(yī)療水平狀況也有其獨特性。同類中各省的醫(yī)療水平狀況相近,比如第四類別中的幾個省的綜合得分都是比較靠前的。
6 ?結(jié)論
根據(jù)主成分分析,醫(yī)療衛(wèi)生機構(gòu)數(shù)(個)、三級醫(yī)院數(shù)(個)、衛(wèi)生人員數(shù)(人)、每千人口衛(wèi)生技術(shù)人員數(shù)(人)、醫(yī)院人員數(shù)(人)、醫(yī)療衛(wèi)生機構(gòu)床位數(shù)(張)、每千人口醫(yī)療衛(wèi)生機構(gòu)床位(張)、衛(wèi)生總費用(億元)、人均衛(wèi)生總費用(元)和基本醫(yī)療保險參保人數(shù)(萬人)的原始數(shù)據(jù),可以將10個評估指標歸納為6個無關(guān)的綜合指標。它使聚類分析的結(jié)果更加合理和真實。
我們可以看出在醫(yī)療水平方面綜合得分排名靠前的省份有山東、四川、廣東、江蘇、河南、浙江、湖南、湖北、河北,除廣東外,幾個省份均屬于同一類。廣東自成一類且分數(shù)也不低可能是因為近年來廣東省財政支持高水平醫(yī)院建設(shè)“登峰計劃”的啟動,使其比較突出。此外,由于北京和上海兩座城市的特殊性,二者也處于同一類。其余的地區(qū)可以分為兩類,廣西、安徽、江西、福建、海南、西藏、天津?qū)儆谝活?,且得分相對較低,可見政府在以后的發(fā)展中應(yīng)該加大對醫(yī)療建設(shè)的投資,努力提高各方面的水平。
參考文獻
[1] Lin, H.M. and Du, Z.F. Principal Component Analysis Comprehensive Evaluation Should Pay Attention to the Problem[J]. Statistical Research, 2013, 8: 25-31.
[2] Ouyang, Y. Evaluation of River Water Quality Monitoring Stations by Principal Component Analysis[J]. Water Research, 2005, 39: 2621-2635.
[3] Chen, X.J. Clustering Analysis in Data Mining Research[J]. Computer Technology and Development, 2006, 9: 44.
[4] Bao, Y., Hu, Z.Q., Bai, Y. and Guo, R.S. Principal Component Cluster Analysis Applied in the Evaluation of Ecological Security of Land[J]. Journal of Agricultural Engineering, 2006, 8: 87-90.
[5] 劉璐. 主成分聚類分析在學生成績綜合評價中的應(yīng)用[J].遼寧工業(yè)大學學報(自然科學版), 2012, 3: 200-204.
[6] 國家衛(wèi)生健康委員會. 2019中國衛(wèi)生健康統(tǒng)計年鑒[M]. 北京: 中國協(xié)和醫(yī)科大學出版社, 2019.
[7] 唐功爽. 基于spss的主成分分析于因子分析的辨析[J]. 統(tǒng)計教育, 2007(2).
[8] 張士杰. 基于主成分分析的阜陽市城市競爭力評價[J]. 安 徽廣播電視大學學報, 2011, (4).