[摘 要] 本文應(yīng)用支撐向量機(jī)模型按照不同資源位指標(biāo)體系對(duì)經(jīng)濟(jì)區(qū)域進(jìn)行更細(xì)致的分類,解決了樣本不足的問題。通過支撐向量機(jī)模型的建立,有可能在樣本比較少的情況下對(duì)經(jīng)濟(jì)區(qū)域按照資源位進(jìn)行更為合理的分類,同時(shí)與按照某一類資源位指標(biāo)體系的分類的結(jié)果進(jìn)行對(duì)比,深入地揭示該區(qū)域在哪些指標(biāo)上具有優(yōu)勢(shì)或是發(fā)展?jié)摿Α?/p>
[關(guān)鍵詞] 資源位 系統(tǒng)經(jīng)濟(jì)學(xué) 經(jīng)濟(jì)模型 支撐向量機(jī)
傳統(tǒng)統(tǒng)計(jì)學(xué)研究的是樣本數(shù)目趨于無窮大時(shí)的漸近理論,但在實(shí)際問題中,樣本數(shù)往往是有限的,統(tǒng)計(jì)學(xué)習(xí)理論為解決有限樣本問題提供了一個(gè)統(tǒng)一的框架,其中支持向量機(jī)(Support Vector Machine 以下簡(jiǎn)稱SVM)是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的推廣能力。目前,SVM算法在分類方面的應(yīng)用多在模式識(shí)別、回歸估計(jì)、概率密度函數(shù)估計(jì)等方面,本文首次將SVM算法引入經(jīng)濟(jì)領(lǐng)域,對(duì)經(jīng)濟(jì)區(qū)域進(jìn)行分類,獲得了較為滿意的效果。
一、支持向量機(jī)分類
1.分類算法原理。支持向量機(jī)從本質(zhì)上來講也是一種統(tǒng)計(jì)方法,本文的研究中著重討論和研究了非線性支持向量機(jī)的求解,而非線性支持向量機(jī)的求解是以線性支持向量機(jī)的求解為基礎(chǔ)的。SVM的核心思想在于使分類間隔最大實(shí)際上就是對(duì)概化能力的控制,就是說不僅能將兩類分開,而且使分類間隔最大。
線性可分的支持向量機(jī)問題是一個(gè)二次規(guī)劃問題,可以轉(zhuǎn)化為如下的最優(yōu)化問題:
優(yōu)化變量為和,而是學(xué)習(xí)樣本,其中是特征矢量、是歸屬的類別值。
借助Lagrange函數(shù)將問題轉(zhuǎn)化為對(duì)偶函數(shù)形式,通過分析約束條件,最后可得到分類函數(shù)
經(jīng)濟(jì)系統(tǒng)最重要的特點(diǎn)就是非線性,支持向量機(jī)能夠應(yīng)用在經(jīng)濟(jì)領(lǐng)域的原因就在于能夠處理非線性問題,可以通過非線性變換轉(zhuǎn)化為某個(gè)高維空間中的線性問題,在變換空間求最優(yōu)分類面。應(yīng)用支撐向量機(jī)模型按照不同資源位指標(biāo)體系對(duì)經(jīng)濟(jì)區(qū)域進(jìn)行更細(xì)致的分類,解決了樣本不足的問題。通過支撐向量機(jī)模型的建立,有可能在樣本比較少的情況下對(duì)經(jīng)濟(jì)區(qū)域按照資源位進(jìn)行更為合理的分類,同時(shí)與按照某一類資源位指標(biāo)體系的分類的結(jié)果進(jìn)行對(duì)比,深入地揭示該區(qū)域在哪些指標(biāo)上具有優(yōu)勢(shì)或是發(fā)展?jié)摿Α?/p>
2.指標(biāo)選擇。根據(jù)2005年的國(guó)家統(tǒng)計(jì)年鑒,需要注意的是分類指標(biāo)的選擇非常關(guān)鍵,這是分類是否成功的關(guān)鍵,本文是通過主成分分析法 進(jìn)行指標(biāo)的選擇,通過主成分分析法,本文選擇的指標(biāo)包括地區(qū)生產(chǎn)總值、資本形成總額、城鎮(zhèn)人口比重、第三產(chǎn)業(yè)人口占就業(yè)人口比重、職工平均工資、人均國(guó)民生產(chǎn)總值、城鎮(zhèn)居民可支配收入、平均每人全年消費(fèi)性支出等幾項(xiàng)指標(biāo),從而較好的對(duì)區(qū)域經(jīng)濟(jì)進(jìn)行了分類,其中第一因子主要由技術(shù)與投資指標(biāo)決定,第二因子由可持續(xù)發(fā)展類的包括綠化等指標(biāo)來決定。
二、實(shí)驗(yàn)
本文選取了28個(gè)省份的地區(qū)生產(chǎn)總值、資本形成總額、城鎮(zhèn)人口比重、第三產(chǎn)業(yè)人口占就業(yè)人口比重、職工平均工資、人均國(guó)民生產(chǎn)總值、城鎮(zhèn)居民可支配收入、平均每人全年消費(fèi)性支出等八個(gè)經(jīng)濟(jì)指標(biāo)。首先隨機(jī)選取的八個(gè)省份的數(shù)據(jù)進(jìn)行訓(xùn)練。
圖上的點(diǎn)分為兩類:紅色為經(jīng)濟(jì)發(fā)達(dá),黑色為不發(fā)達(dá)省份。紅點(diǎn)的省份:北京、天津、上海、江蘇、浙江、廣東、遼寧、山東。屬于經(jīng)濟(jì)發(fā)達(dá)的省份黑色就是其余的省份。同時(shí)按照資本,產(chǎn)業(yè)布局等多種指標(biāo)對(duì)不同指標(biāo)進(jìn)行分類,獲得如下效果:通過上面的分析可以看到,使用SVM算法對(duì)經(jīng)濟(jì)區(qū)域進(jìn)行分類得到的經(jīng)濟(jì)發(fā)達(dá)地區(qū)包括北京、天津、上海、江蘇、浙江、廣東、遼寧、山東,與實(shí)際情況非常接近。本文將支持向量機(jī)算法在使用有限樣本對(duì)數(shù)據(jù)進(jìn)行分類的能力很好的應(yīng)用在經(jīng)濟(jì)領(lǐng)域里,經(jīng)濟(jì)系統(tǒng)最重要的特點(diǎn)就是非線性,支持向量機(jī)能夠應(yīng)用在經(jīng)濟(jì)領(lǐng)域的原因就在于能夠處理非線性問題,有可能在樣本比較少的情況下對(duì)經(jīng)濟(jì)區(qū)域按照資源位進(jìn)行更為合理的分類。
參考文獻(xiàn):
[1]概化理論研究及應(yīng)用前景.心理科學(xué),2003(3)
[2]昝廷全:系統(tǒng)經(jīng)濟(jì)學(xué)探索[M].科學(xué)出版社,2004年3月