• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種社會(huì)經(jīng)濟(jì)系統(tǒng)模糊C劃分聚類數(shù)的確定方法

      2011-03-09 06:37:54鐘映竑
      統(tǒng)計(jì)與決策 2011年12期
      關(guān)鍵詞:科技進(jìn)步廣東省聚類

      賀 勇,鐘映竑

      (廣東工業(yè)大學(xué) 管理學(xué)院,廣州 510520)

      0 引言

      在社會(huì)經(jīng)濟(jì)系統(tǒng)建模與分析中,需要進(jìn)行系統(tǒng)分解,即目標(biāo)系統(tǒng)要?jiǎng)澐譃槿舾蓚€(gè)子系統(tǒng)。這會(huì)面臨兩個(gè)問(wèn)題:第一,如何劃分;第二,劃分多少個(gè)子系統(tǒng)。這實(shí)質(zhì)上是一個(gè)聚類問(wèn)題,涉及到聚類算法的選取和聚類數(shù)的確定。模糊C均值(Fuzzy C-Mean,FCM)聚類算法[1,2]作為無(wú)監(jiān)督數(shù)據(jù)分類和分析的一個(gè)重要工具,已成功地用于模式識(shí)別及系統(tǒng)建模等領(lǐng)域。社會(huì)經(jīng)濟(jì)系統(tǒng)是個(gè)邊界不明晰的軟系統(tǒng),相對(duì)于層次聚類法和快速聚類法等而言,模糊C均值劃分更加適合處理此類系統(tǒng),且可以獲得更加豐富的知識(shí)。但FCM算法必須事先給定聚類數(shù),在未知情況下,一般通過(guò)聚類有效性函數(shù)可來(lái)確定,而已提出的聚類有效性函數(shù)眾多,不同的聚類有效性函數(shù)往往得到不同的聚類數(shù)。聚類有效性函數(shù)可分為兩類:一類是以Bezdek的vPC[3]和vPE[4]為代表的基于數(shù)據(jù)集模糊劃分的觀點(diǎn);另一類基于數(shù)據(jù)集的幾何結(jié)構(gòu),以Xie和 Beni的vXB[5],F(xiàn)ukuyama和 Sugeno的 vFS[6]及Kwon的vk[7]為代表。然而,對(duì)于UCI上的標(biāo)準(zhǔn)數(shù)據(jù)集,沒(méi)有一個(gè)有效性函數(shù)能保證都得到正確的分類數(shù)。這樣,在現(xiàn)實(shí)的復(fù)雜經(jīng)濟(jì)系統(tǒng)中,將目標(biāo)系統(tǒng)采用模糊C均值劃分為若干個(gè)子系統(tǒng)時(shí),應(yīng)當(dāng)選取哪個(gè)有效性函數(shù)沒(méi)有任何根據(jù),其最佳聚類數(shù)難以確定。

      在現(xiàn)實(shí)目標(biāo)系統(tǒng)中,如果僅僅依靠某個(gè)聚類有效性函數(shù)來(lái)確定聚類數(shù),其結(jié)果可能并不理想,應(yīng)當(dāng)引入專家經(jīng)驗(yàn)??梢赃@么認(rèn)為,一個(gè)好的聚類應(yīng)該滿足:其一,其聚類數(shù)合理,符合解決問(wèn)題的需要,這需要通過(guò)專家經(jīng)驗(yàn)來(lái)判斷;其二,聚類結(jié)果科學(xué)、可信,需要通過(guò)經(jīng)典的聚類有效性函數(shù)來(lái)檢驗(yàn)。將專家知識(shí)和科學(xué)計(jì)算結(jié)合起來(lái),針對(duì)社會(huì)經(jīng)濟(jì)系統(tǒng),本文將提出一種模糊軟劃分聚類數(shù)的確定方法,主要步驟是:首先進(jìn)行數(shù)據(jù)分析,幾何結(jié)構(gòu)上,觀察數(shù)據(jù)集是否可聚;其次,專家根據(jù)問(wèn)題給出聚類數(shù)集合;最后,對(duì)可供選擇的每一個(gè)聚類數(shù),采用聚類有效性函數(shù)集來(lái)評(píng)價(jià),滿足有效性函數(shù)最多的聚類數(shù)被認(rèn)定為最佳聚類數(shù)。

      1 分類指標(biāo)的選取

      若實(shí)際產(chǎn)出為Y,有n個(gè)投入要素,則生產(chǎn)函數(shù)的一般形式為[8]:

      它代表產(chǎn)出與投入要素之間的某種依存關(guān)系。為了實(shí)現(xiàn)對(duì)廣東省21個(gè)地區(qū)的科技進(jìn)步水平進(jìn)行軟分類,遵循柯布-道格拉斯(C.W.Cobb-D.H.Douglas)[9]:

      式中α、β是常數(shù),K,L分別代表資本投入、勞動(dòng)投入,A代表技術(shù)進(jìn)步水平。從(2)式得到:

      式(3)表示一個(gè)地區(qū)的技術(shù)進(jìn)步與該地區(qū)的產(chǎn)出、資本投入、勞動(dòng)投入具有一定的依存關(guān)系。基于這種關(guān)系,這里科技進(jìn)步人均產(chǎn)出、固定資產(chǎn)投入和人力資本來(lái)反映,根據(jù)2001~2009廣東省統(tǒng)計(jì)年鑒相關(guān)數(shù)據(jù)進(jìn)行處理得到人均GDP(單位:萬(wàn)元)、人均固定資產(chǎn)(單位:萬(wàn)元)及人力資本數(shù)據(jù)(計(jì)算方法詳見(jiàn)文獻(xiàn)10),得到表1。

      表1 各地區(qū)指標(biāo)值

      2 分類數(shù)的確定

      對(duì)聚類有效性函數(shù)的研究可分為兩類:一類是基于模糊劃分的方法,認(rèn)為好的聚類對(duì)應(yīng)于數(shù)據(jù)集是較分明、較明晰的,代表函數(shù)如Bezdek提出的分割系數(shù)vPC和分割熵vPE;另一類是基于幾何結(jié)構(gòu)的方法,認(rèn)為每個(gè)子類應(yīng)當(dāng)是緊致的,子類與子類相互間盡可能分離,代表函數(shù)有Xie和Beni的vXB,F(xiàn)ukuyama和Sugeno的vFS,Kwon的vK等。上面提到的5個(gè)有效性函數(shù)如表2所示。在評(píng)價(jià)聚類結(jié)果時(shí),這5個(gè)有效性函數(shù)并不一定同時(shí)達(dá)到最優(yōu)??梢赃@樣認(rèn)為:多個(gè)有效性函數(shù)取得最優(yōu)值的聚類結(jié)果為較優(yōu)的結(jié)果,該結(jié)果對(duì)應(yīng)的聚類個(gè)數(shù)為最佳的聚類數(shù)。

      表2 聚類有效性函數(shù)

      從圖1中,我們可看到21個(gè)地區(qū)固定資產(chǎn)、人力資本和GDP構(gòu)成的三維數(shù)據(jù)散點(diǎn)圖,可看出待分析的數(shù)據(jù)是存在聚類趨勢(shì)的,具有可聚性[11]。由散點(diǎn)圖及實(shí)際研究問(wèn)題的需要,我們將聚類數(shù)區(qū)間定為c={2,3,4,5,6}。在不同類別下,5個(gè)有效性函數(shù)值都在時(shí)達(dá)到最優(yōu)。由此我們可得出結(jié)論:2000~ 2008年期間廣東省各地區(qū)按科技水平劃分的最佳類別數(shù)為3類。

      3 分類結(jié)果及分析

      圖1 21個(gè)地區(qū)數(shù)據(jù)散點(diǎn)圖

      設(shè)定分類數(shù)為3,對(duì)廣東省21個(gè)地區(qū)按技術(shù)進(jìn)步水平進(jìn)行軟劃分,即對(duì)三維向量集{(Yt,Kt,Lt)}模糊分類,結(jié)果如表3及圖2所示。

      表3 科技進(jìn)步水平分類表

      圖2 分類結(jié)果

      表4 類中心矢量

      可見(jiàn),分類結(jié)果比較好地反映了廣東省的經(jīng)濟(jì)發(fā)展情況。事實(shí)上,第一類包含兩個(gè)廣州、深圳兩個(gè)副省級(jí)城市、珠海特區(qū)及經(jīng)濟(jì)重地佛山,是珠三角的龍頭,科技進(jìn)步水平最高;第二類均為珠三角城市,區(qū)位優(yōu)勢(shì)突出,經(jīng)濟(jì)發(fā)展?jié)摿薮螅坏谌愔饕菛|西兩翼及粵北地區(qū),雖然這些地區(qū)之間以及各個(gè)地區(qū)內(nèi)部的科技進(jìn)步有明顯差異,但它們都具有農(nóng)業(yè)人口比重大,貧困人口多,科技進(jìn)步水平整體上偏低。表4列出的是各類的類中心矢量(均為歸一化后數(shù)據(jù)),表5列出的是各個(gè)地區(qū)屬于各類的程度。

      表5 隸屬度表

      從隸屬度矩陣(表 5)發(fā)現(xiàn):廣州屬于第一類的程度是0.9876,而佛山是0.7023,表明雖然它們的科技進(jìn)步水平可以認(rèn)為屬于同一類,但廣州的科技進(jìn)步水平高于佛山。中山屬于第一類及第二類的程度分別0.4031和0.5062,相對(duì)比較劃歸第二類;而江門屬于第二類及第三類的程度分別是0.6129和0.3511,相對(duì)比較劃歸第二類,但是屬于第一類程度僅為0.0360,說(shuō)明盡管中山、江門同屬第二類,但中山科技水平要比江門高。第三類地區(qū)屬于第三類的隸屬度均超過(guò)0.7以上,都劃歸第三類。可見(jiàn)表3是科技進(jìn)步的粗分類,而表5正好反映的是每一類中更細(xì)致的劃分。兩個(gè)表綜合反映了廣東省各地區(qū)科技進(jìn)步水平的分類,符合廣東省的實(shí)際情況。

      4 結(jié)論

      在對(duì)社會(huì)經(jīng)濟(jì)系統(tǒng)進(jìn)行聚類時(shí),應(yīng)將專家知識(shí)和科學(xué)計(jì)算相結(jié)合。一個(gè)好的聚類應(yīng)不僅符合客觀現(xiàn)實(shí),即聚類數(shù)合理,而且應(yīng)盡量滿足經(jīng)典的聚類有效性函數(shù),即聚類結(jié)果科學(xué)。本文在給定合理可行的聚類數(shù)集合的基礎(chǔ)上,采用多個(gè)聚類有效性函數(shù)對(duì)對(duì)各個(gè)聚類數(shù)進(jìn)行優(yōu)選的方法,以科技進(jìn)步水平對(duì)廣東省21個(gè)地區(qū)進(jìn)行了劃分:首先,確定衡量科技進(jìn)步水平的數(shù)據(jù)集;進(jìn)而對(duì)數(shù)據(jù)集進(jìn)行分析,判斷是否具有聚類趨勢(shì);然后采用所提出方法進(jìn)行聚類,得到了滿意的聚類數(shù)及聚類結(jié)果。研究顯示,廣東省按科技進(jìn)步水平應(yīng)分為3類,分類結(jié)果符合實(shí)際。

      [1]Dunn J.C.Some Recent Investigations of a New Fuzzy Partition Algorithm and Its Application to Pattern Classification Problems [J].J.Cybernetics,1974,(4).

      [2]Bezdek,J.C.Pattern Recognition with Fuzzy Objective Function Algorithm[M].NY:Plenum Press,1981.

      [3]Bezdek J.C.Cluster Validity with Fuzzy Sets[J].J.Cybernetics,1974,3(3).

      [4]Bezdek J.C.Mathematical Models for Systematic and Taxonomy [C].In:Proceedings of 8th International Conference on Numerical Taxonomy,San Francisco,1975.

      [5]Xie X.L,Beni,G.A.Validity Measure for Fuzzy Clustering[J]. IEEE Trans.Pattern Anal.Machine Intell,1991,3(8).

      [6]Fukuyama Y.,Sugeno,M.A New Method of Choosing the Number of Clusters for the Fuzzy C-means Method[C].In:Proceedings of 5th Fuzzy System Symposium,.1989.

      [7]S.H.Kwon.Cluster Validity Index for Fuzzy Clustering[J].Electron.Lett.,1998,34(22).

      [8]Solow.R.M.A Contribution to the Theory of Economic Growth [J].Quarterly Journal of Economics,1956,39(1).

      [9]Rome.P.Endogenous Technological Change[J].Journal of Political Economy,1990,98(5).

      [10]賀勇,諸克軍.基于軟計(jì)算的生產(chǎn)要素對(duì)地區(qū)經(jīng)濟(jì)影響分析[J].系統(tǒng)管理學(xué)報(bào),2009,18(3).

      [11]高新波.模糊聚類分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2004.

      猜你喜歡
      科技進(jìn)步廣東省聚類
      2018年河南省水利科技進(jìn)步獎(jiǎng)勵(lì)項(xiàng)目
      科技進(jìn)步有力推動(dòng)了煤炭工業(yè)生產(chǎn)方式轉(zhuǎn)變
      中國(guó)建材再獲國(guó)家科技進(jìn)步一等獎(jiǎng)
      江西建材(2018年4期)2018-04-10 12:36:46
      基于DBSACN聚類算法的XML文檔聚類
      廣東省海域使用統(tǒng)計(jì)分析
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      下城區(qū):建設(shè)科技進(jìn)步先進(jìn)區(qū)
      杭州科技(2014年3期)2014-02-27 15:26:49
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      1萬(wàn)億美元——廣東省預(yù)計(jì)2013年GDP
      法人(2014年2期)2014-02-27 10:41:35
      科尔| 改则县| 乡宁县| 永嘉县| 金华市| 阳东县| 谷城县| 盐源县| 读书| 斗六市| 湾仔区| 双流县| 碌曲县| 绥芬河市| 黑山县| 宁远县| 张家川| 曲靖市| 喀什市| 玉屏| 巫山县| 剑阁县| 鹤峰县| 鸡东县| 吉木乃县| 东方市| 东平县| 葫芦岛市| 鄯善县| 枣阳市| 林芝县| 奈曼旗| 鹤庆县| 龙口市| 张家川| 丰镇市| 赤水市| 凉城县| 朝阳市| 嘉鱼县| 融水|