農(nóng)秋紅 韋程東 羅文婷
DOI:10.19699/j.cnki.issn2096-0298.2021.10.
摘 要:影響區(qū)域經(jīng)濟發(fā)展的因素有很多,基于不同的變量選擇方法可以構(gòu)建不同的指標(biāo)體系,本文通過Lasso變量選擇法和逐步回歸法的比較,說明Lasso變量選擇法選取的指標(biāo)在廣西區(qū)域經(jīng)濟發(fā)展研究中更具代表性,預(yù)測精度也更高。
關(guān)鍵詞:區(qū)域經(jīng)濟;Lasso;影響因素;廣西;變量選擇法
中圖分類號:F127 文獻標(biāo)識碼:A 文章編號:2096-0298(2021)05(b)--03
廣西是我國西南經(jīng)濟圈的重要組成部分,近年來,中央對廣西經(jīng)濟發(fā)展的政策扶持力度不斷加大,相繼出臺了珠江—西江經(jīng)濟帶發(fā)展規(guī)劃、西部陸海新通道總體規(guī)劃、中國(廣西)自由貿(mào)易試驗區(qū)總體方案、中國—東盟信息港建設(shè)方案、面向東盟的金融開放門戶總體方案等多項政策文件,為促進廣西經(jīng)濟的增長增添了動力。
憑借特殊的地理位置,廣西成為我國“一帶一路”倡議的重要支點,為廣西構(gòu)建“南向、北聯(lián)、東融、西合”新格局提供了重大發(fā)展機遇。
由于不同區(qū)域之間自然環(huán)境、社會資源、人文因素等方面的差異,廣西的區(qū)域經(jīng)濟發(fā)展仍存在較大差異。探討廣西區(qū)域經(jīng)濟發(fā)展差異的影響因素,經(jīng)濟指標(biāo)的選擇是關(guān)鍵環(huán)節(jié),本文運用Lasso變量選擇方法選取影響廣西區(qū)域經(jīng)濟發(fā)展的主要因素。
1 Lasso變量選擇方法簡介
Lasso方法因能從高維變量中高效提取出關(guān)鍵變量,并能有效解決變量間的多重共線性問題、提高模型的解釋精度而獲得高度評價和廣泛應(yīng)用。
假設(shè)有自變量矩陣X=(x1,x2,...,xn),其中,因變量,且假定數(shù)據(jù)已進行標(biāo)準(zhǔn)化處理即,則建立Y與X之間的線性模型:
其中,為常數(shù)項,為各變量系數(shù),為隨機擾動項。
記,則的Lasso估計如下:
其中懲罰參數(shù)。若為最小二乘估計的值,則,那么當(dāng)時,模型(1.1)中回歸系數(shù)的Lasso估計,其絕對值將小于的絕對值。而當(dāng)s逐步減小時,某些的Lasso估計值也會隨之變小甚至為0,此時,與等于0相應(yīng)的變量代表它和因變量Y的關(guān)系不大,將被剔除,進而實現(xiàn)變量選擇的作用。關(guān)于懲罰參數(shù)s常用的估計和檢驗方法有交叉驗證法、廣義交叉驗證法及常用的Akaike信息準(zhǔn)則(Akaike info criterion,:AIC)。
關(guān)于Lasso問題的求解,最小角回歸算法(least angle regression,LARS),極大提高了Lasso的計算效率。LARS算法解析
2 廣西區(qū)域經(jīng)濟發(fā)展影響因素的選取
2.1 指標(biāo)選取原則
根據(jù)經(jīng)濟增長理論,影響經(jīng)濟增長的因素有很多,在構(gòu)建指標(biāo)體系的過程中,以指標(biāo)的科學(xué)性、代表性、可得性為原則,運用相關(guān)系數(shù)來反映各指標(biāo)對廣西區(qū)域經(jīng)濟增長的影響程度,進而從廣西國民經(jīng)濟和社會發(fā)展主要指標(biāo)中篩選出與廣西各地市GDP有顯著線性關(guān)系的因素,建立指標(biāo)體系。在三次產(chǎn)業(yè)當(dāng)中,第二產(chǎn)業(yè)對廣西經(jīng)濟發(fā)展的貢獻較大,因此三次產(chǎn)業(yè)中考慮選用第二產(chǎn)業(yè)占GDP的比重作為備選影響因素,其他備選影響因素及相關(guān)系數(shù)見表1。
2.2 基于Lasso方法的變量選擇
以2017年廣西各地市GDP作為被解釋變量,記為Y,表1列舉的13個自變量中,除了X1、X2,其他變量及Y需做取自然對數(shù)處理,分別記…,隨后運用Lasso方法建立模型:
其中,為常數(shù)項,βi(i=1,2,3,...,13)為各變量系數(shù),為隨機擾動項。
圖1是利用R語言程序運行得到的變量選擇路徑圖,AIC值作為模型擬合優(yōu)良性的衡量標(biāo)準(zhǔn),當(dāng)其值變小,表明模型的擬合度得以提高,因此根據(jù)AIC準(zhǔn)則,基于Lasso方法最終選取出X1、X2、X3、X4、X6、X106個主要變量,如表2所示。
由表2可知,基于Lasso變量選擇法,影響廣西區(qū)域經(jīng)濟發(fā)展的主要因素即為第二產(chǎn)業(yè)比重、投資力度、財政收入、社會消費品零售總額、就業(yè)人員和出口總額。
2.3 基于逐步回歸法的變量選擇
利用逐步回歸法可以篩選和剔除不顯著及引起多重共線性的解釋變量,從而達到保留最優(yōu)解釋變量的效果。以下將采用逐步回歸法選取變量,以便與Lasso變量選擇法的結(jié)果進行比較。
由表3可知,基于逐步回歸法,對廣西區(qū)域經(jīng)濟發(fā)展產(chǎn)生影響的顯著因素有第二產(chǎn)業(yè)比重、社會消費品零售總額、進出口總額和私人汽車擁有量。
3 實證分析
基于Lasso變量選擇法和逐步回歸法的結(jié)果表明,作為經(jīng)濟結(jié)構(gòu)指標(biāo)的第二產(chǎn)業(yè)比重和生活質(zhì)量指標(biāo)的社會消費品零售總額對廣西區(qū)域經(jīng)濟發(fā)展均起到顯著的促進作用。但Lasso變量選擇法中投資力度、財政收入、就業(yè)人員和出口總額在逐步回歸法中并不顯著,為了進一步比較兩種方法的擬合效果,接下來分別采用兩種方法的指標(biāo)體系對2018年廣西14地市的GDP進行回歸預(yù)測。結(jié)果整理如表4所示。
基于Lasso法得到的指標(biāo)體系在進行回歸分析時,R2= 0.998009,而基于逐步回歸法建立的回歸模型R2=0.995781,故基于Lasso方法所選指標(biāo)回歸模型的擬合優(yōu)度值更高。從圖2的預(yù)測結(jié)果對比圖來看,基于Lasso方法所選的指標(biāo)體系經(jīng)過回歸預(yù)測得到的結(jié)果與2018年廣西14地市的實際GDP總量在整體上的偏差小于逐步回歸預(yù)測所得的結(jié)果。由此可見,基于Lasso變量選擇法選出的指標(biāo)更為合理,為下一步應(yīng)用于空間計量模型來深入研究廣西區(qū)域經(jīng)濟的發(fā)展奠定了基礎(chǔ)。
參考文獻
鐘金花.基于Lasso方法的上海經(jīng)濟增長影響因素實證研究[J].統(tǒng)計與決策,2013(01):154-156.
張靜.基于Lasso方法和BP神經(jīng)網(wǎng)絡(luò)的居民消費支出預(yù)測研究[D].長沙:湖南大學(xué),2014.
喻勝華,龔尚花.基于Lasso和支持向量機的糧食價格預(yù)測[J].湖南大學(xué)學(xué)報(社會科學(xué)版),2016,30(01):71-75.
劉沛榕,肖敏慧.基于LARS-Lasso算法的宏觀經(jīng)濟相關(guān)性支付指標(biāo)的挑選[J].中國國際財經(jīng)(中英文),2017(07):206-210.
劉睿智,杜溦.基于Lasso變量選擇方法的投資組合及實證分析[J].經(jīng)濟問題,2012(09):103-107.