吳思翰,樓文高,2
(1.上海理工大學(xué) 光電信息與計算機(jī)工程學(xué)院,上海 200093;2.上海商學(xué)院 校長辦公室,上海 200235)
改革開放至中共十八大之前,中國經(jīng)濟(jì)一直保持著較高速增長態(tài)勢。但是在高投入、高消耗和高增長的背景下,能源過度消耗、環(huán)境質(zhì)量下降、經(jīng)濟(jì)發(fā)展不均衡以及創(chuàng)新驅(qū)動不足等問題越來越明顯[1]。為了解決上述問題,中共十八屆五中全會提出了五大發(fā)展理念,并且在十九大報告中指出“我國經(jīng)濟(jì)已由高速增長階段轉(zhuǎn)向高質(zhì)量發(fā)展階段”,說明中國經(jīng)濟(jì)步入質(zhì)量為首的新篇章,高質(zhì)量發(fā)展成為中國當(dāng)前以及未來經(jīng)濟(jì)建設(shè)的核心[2]。
大多數(shù)學(xué)者對高質(zhì)量發(fā)展的研究主要包括基本內(nèi)涵、評價體系和水平測度3 個方面。師博等[1]采用均等權(quán)重賦值法評價了中國東部、中部以及西部地區(qū)的經(jīng)濟(jì)增長質(zhì)量;Frolov 等[3]基于矩陣方法,結(jié)合年均生產(chǎn)率增長率和人均發(fā)展指數(shù)構(gòu)建區(qū)域經(jīng)濟(jì)增長質(zhì)量評價體系;劉干等[4]從居民生活水平、產(chǎn)業(yè)結(jié)構(gòu)等5 個方面構(gòu)建經(jīng)濟(jì)高質(zhì)量發(fā)展評價指標(biāo)體系,通過模糊綜合評價法和熵值法進(jìn)行實(shí)證研究;周吉等[5]采用主成分分析法(PCA)對江西省經(jīng)濟(jì)高質(zhì)量發(fā)展水平進(jìn)行實(shí)證研究;馬茹等[6]采用線性加權(quán)法對區(qū)域經(jīng)濟(jì)高質(zhì)量發(fā)展水平進(jìn)行綜合評價研究;魏敏等[7]采用熵權(quán)TOPSIS 法對我國經(jīng)濟(jì)高質(zhì)量發(fā)展水平及其空間分布規(guī)律進(jìn)行實(shí)證研究。
上述研究中采用的評價方法都存在局限性;如采用均等權(quán)重法對權(quán)重賦值,令增長基本面(α)和社會成果(β)的權(quán)重均為0.5,但通過研究發(fā)現(xiàn),經(jīng)濟(jì)高質(zhì)量發(fā)展過程中社會成果的權(quán)重要大于增長基本面的權(quán)重,故均等權(quán)重法賦值并不合理;主成分分析法要求樣本數(shù)量相對較多,至少是指標(biāo)數(shù)的3~5 倍以上,否則結(jié)果不穩(wěn)定;TOPSIS 法屬于逼近理想解的綜合評價方法,需要采用變異系數(shù)法、信息熵等方法事先確定指標(biāo)權(quán)重,而這本身就是經(jīng)濟(jì)高質(zhì)量發(fā)展綜合評價的關(guān)鍵內(nèi)容之一。傳統(tǒng)的統(tǒng)計方法主要適用于正態(tài)分布的數(shù)據(jù),對于處理非正態(tài)分布的數(shù)據(jù)可能會出現(xiàn)無法合理解釋的結(jié)果或者結(jié)果的可靠性和有效性難以保證。綜上所述,高質(zhì)量經(jīng)濟(jì)發(fā)展綜合評價仍然是一個需要深入研究的問題。
同時,由Friedman 等[8]提出的非線性、高維、非正態(tài)分布數(shù)據(jù)建模的投影尋蹤分類(PPC)模型已廣泛應(yīng)用于各種研究領(lǐng)域,并取得較好效果,如于曉虹等[9]采用PPC 模型對省際普惠金融發(fā)展水平進(jìn)行綜合評價、排序和分類;虞玉華等[10]運(yùn)用PPC 模型對體育期刊學(xué)術(shù)水平進(jìn)行綜合評價與研究;郭倩等[11]運(yùn)用PPC 模型對水資源承載力進(jìn)行綜合評價并分析其投影特征值的歷年變化特征;Liu 等[12]運(yùn)用PPC 模型對區(qū)域地表水環(huán)境進(jìn)行評價。因此,本文基于高質(zhì)量發(fā)展理念及PPC 模型原理,建立相應(yīng)的評價指標(biāo)體系,通過PPC 模型對中國30 個省市2015-2018 年的高質(zhì)量發(fā)展水平進(jìn)行綜合評價、排序和分類,并且與采用PCA 法、TOPSIS 法的評價結(jié)果進(jìn)行對比,結(jié)果表明PPC 模型更加合理有效。
梳理有關(guān)文獻(xiàn)發(fā)現(xiàn),不同學(xué)者從自身知識結(jié)構(gòu)及對高質(zhì)量發(fā)展內(nèi)涵的不同理解,建立了相應(yīng)的評價指標(biāo)體系。師博等[1]構(gòu)建了由6 個子系統(tǒng)組成的省際經(jīng)濟(jì)高質(zhì)量發(fā)展指標(biāo)體系;魏敏等[7]則構(gòu)建了包括經(jīng)濟(jì)結(jié)構(gòu)優(yōu)化、創(chuàng)新驅(qū)動發(fā)展等10 個子系統(tǒng)53 個測度指標(biāo)的測度體系;王竹君等[13]通過福利變化與成果分配、生態(tài)環(huán)境保護(hù)以及居民經(jīng)濟(jì)素質(zhì)3 個方面7 個二級指標(biāo)17 個三級指標(biāo),構(gòu)建指標(biāo)體系結(jié)構(gòu);劉麗波等[14]根據(jù)經(jīng)濟(jì)高質(zhì)量發(fā)展內(nèi)涵和不同階段特征,構(gòu)建了由動能轉(zhuǎn)換、產(chǎn)業(yè)結(jié)構(gòu)化、需求轉(zhuǎn)型、投入產(chǎn)出效率以及優(yōu)化發(fā)展環(huán)境5 個特征29 個指標(biāo)組成的評價體系;詹新宇等[15]從創(chuàng)新、協(xié)調(diào)、綠色、開發(fā)、共享五大發(fā)展理念的角度構(gòu)建了31 個三級指標(biāo)的經(jīng)濟(jì)增長質(zhì)量指標(biāo)體系。綜合以上學(xué)者建立的經(jīng)濟(jì)高質(zhì)量發(fā)展評價指標(biāo)體系,再從高質(zhì)量發(fā)展內(nèi)涵的角度出發(fā),考慮到評價指標(biāo)體系的實(shí)用性、可比性、獲得數(shù)據(jù)的便捷性以及可操作性等原則,本文建立了由6 個方面、27 個指標(biāo)構(gòu)成的評價體系,具體指標(biāo)及含義如表1 所示。
Table 1 High-quality development level evaluation index system表1 高質(zhì)量發(fā)展水平評價指標(biāo)體系
由于港澳臺地區(qū)和西藏自治區(qū)測度指標(biāo)數(shù)據(jù)缺失較多,故只研究了其他具有完整數(shù)據(jù)的省市。所有數(shù)據(jù)均來源于2016-2019 年《中國統(tǒng)計年鑒》《中國科技統(tǒng)計年鑒》《中國能源統(tǒng)計年鑒》,個別數(shù)據(jù)采集于各省《國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》和歷年統(tǒng)計年鑒。
由于所收集到的部分?jǐn)?shù)據(jù)值較大并且計算量復(fù)雜度較高,因而建模前要對樣本數(shù)據(jù)進(jìn)行歸一化處理,公式為:Yij=(Xij-Xjmin)/(Xjmax-Xjmin);對于樣本數(shù)據(jù)的負(fù)向指標(biāo)均進(jìn)行正向化處理,公式為:Yij=(Xjmax-Xij)/(Xjmax-Xjmin)。其中,Xij和Yij分別表示原始指標(biāo)值和歸一化處理后的指標(biāo)值,Xjmin為第j 個指標(biāo)的最小值,Xjmax為最大值。
投影尋蹤就是將m維數(shù)據(jù)綜合成以(a1,a2,…,am)為投影方向的投影特征值,如式(1)所示。
PPC 模型的最有效一維模型目標(biāo)函數(shù)就是Sz與Dz乘積的最大化,即:
其中,Sz為zi的標(biāo)準(zhǔn)差,其值越大說明投影點(diǎn)在整體上越分散;Dz為其局部密度值,其值越大表示投影點(diǎn)局部越密集。Sz和Dz分別如式(4)、式(5)所示。
其中,E(z)為zi的平均值;ri,k為樣本i與k距離差的絕對值;R為局部密度的窗口半徑,最優(yōu)化結(jié)果的參數(shù)取決于R值大小,從樓文高等[17]研究結(jié)果可知,R的合理取值范圍應(yīng)為max(ri,j)/5≤R≤max(ri,)j/3;u(R-ri,k)為單位階躍函數(shù),如果u(R-ri,k)>0,則其值為1,否則為0。
由于式(3)是以aj為變量的高維復(fù)雜非線性優(yōu)化問題,因而采用群搜索算法(GSO)[18-19]對式(3)中的最佳投影向量a→及其系數(shù)aj(權(quán)重)進(jìn)行優(yōu)化求解。根據(jù)樓文高等[17]提出的定理1 求得全局最優(yōu)解。根據(jù)最終求得的指標(biāo)權(quán)重對其重要性進(jìn)行排序,同時根據(jù)各樣本投影值的大小進(jìn)行分類排序。
群搜索算法(GSO)是由發(fā)現(xiàn)者、加入者和游蕩者模型所產(chǎn)生的算法。在每次迭代中,當(dāng)前最優(yōu)個體為發(fā)現(xiàn)者,它會根據(jù)自身位置向周圍尋找更好的位置。其他個體按比例分為加入者和游蕩者,加入者在跟隨發(fā)現(xiàn)者的同時進(jìn)行搜索,游蕩者則朝任意方向隨機(jī)移動。本文將采用張雯雰等[18]提出的帶趨勢預(yù)測的GSO 算法求解上述式(3),算法簡述如下:
在n維空間中,第i個成員在第k次迭代時的位置為,經(jīng)驗(yàn)為。在迭代開始之前,成員的位置隨機(jī)分布,經(jīng)驗(yàn)值為0。
在k次迭代時,將位置最好的成員設(shè)為發(fā)現(xiàn)者,記作。當(dāng)時,隨機(jī)選取成員的20%以(6)式為基準(zhǔn)進(jìn)行經(jīng)驗(yàn)積累,再通過式(7)預(yù)測位置。
其中,r1和r2為(0,1)內(nèi)的均勻隨機(jī)數(shù),c1和c2為常量系數(shù)。再隨機(jī)選擇剩余成員的70%隨機(jī)選擇加入者,加入者通過一個隨機(jī)步長靠近發(fā)現(xiàn)者如式(8)所示。
其中,r3為(0,1)內(nèi)的均勻隨機(jī)數(shù)。剩余成員作為游蕩者向任意方向隨機(jī)游蕩,如式(9)所示。
其中,r4和r5為(0,1)內(nèi)的均勻隨機(jī)數(shù);step為步長常量;mutationprobability為分量變異概率,其值為,迭代次數(shù)越多,值越小?!?”運(yùn)算是衡量算式左右兩邊的大小,返回值為布爾值,用0、1 表示。
在27 個指標(biāo)中,x15、x20、x21、x22、x25以及x26均為負(fù)向指標(biāo),故采用負(fù)向指標(biāo)的歸一化方式處理,其他指標(biāo)采用正向指標(biāo)的歸一化方式處理。數(shù)據(jù)的直方圖分布表明,幾乎所有指標(biāo)的數(shù)據(jù)都不服從正態(tài)分布規(guī)律。
將歸一化后的數(shù)據(jù)導(dǎo)入GSO 投影尋蹤程序中,令窗口半徑R=max(ri,j)/5,根據(jù)上述定理,求得真正的全局最優(yōu)解,其中投影值標(biāo)準(zhǔn)差Sz=0.761 3,局部密度Dz=295.094,目標(biāo)函數(shù)Q(a)=224.661,窗口半徑R=0.735 7,其中各評價指標(biāo)的最佳投影向量系數(shù)(權(quán)重)aj=(0.322 2,0.254 9,0.252 8,0.299 6,0.131 8,0.210 4,0.267 8,0.131 5,0.022 3,0.159 1,0.234 9,0.209 7,0.246 2,0.186 6,0.109 6,0.070 4,0.243 0,0.154 2,0.192 8,0.204 0,0.056 8,0.185 1,0.249 9,0.045 6,0.098 5,0.188 1,0.013 8)。最后得到30個省的PPC 投影值以及排名結(jié)果如表2 所示。
Table 2 30 provinces and cities’high-quality development level PPC projection value and its ranking in China during 2015-2018表2 2015-2018 年我國30 個省市高質(zhì)量發(fā)展水平PPC 投影值及其排名
3.3.1 評價指標(biāo)特性解析
PPC 投影值與各指標(biāo)之間呈線性關(guān)系,權(quán)重越大的指標(biāo)對高質(zhì)量發(fā)展水平的影響越明顯。將這些評價指標(biāo)的最佳投影向量系數(shù)從大到小排序?yàn)閤1、x4、x7、x2、x3、x23、x13、x17、x11、x6、x12、x20、x19、x26、x14、x22、x10、x18、x5、x8、x15、x25、x16、x21、x24、x9、x27。在該評價指標(biāo)體系中通過6 個方面權(quán)衡高質(zhì)量發(fā)展水平,權(quán)重占比依次為23.82%、15.64%、13.20%、18.05%、16.72%、12.57%,可以看出,每個方面所占權(quán)重比較平均,盡管創(chuàng)新驅(qū)動發(fā)展指標(biāo)不是最多,但其權(quán)重占總權(quán)重的比例最大,說明發(fā)展創(chuàng)新驅(qū)動是決定省際高質(zhì)量發(fā)展水平高低的最重要特征,應(yīng)該優(yōu)先得到保證并且要高度重視。因此,要提升各省市高質(zhì)量發(fā)展水平,必須改進(jìn)權(quán)重大的指標(biāo)(如R&D 人員投入力度等),這樣才能取得事半功倍的效果。
3.3.2 省際高質(zhì)量發(fā)展水平分類排序
由于PPC 模型所求得的投影值均為一維實(shí)數(shù),因而既可以區(qū)分出各省市類型,又可以對同一類型的不同省市進(jìn)行詳細(xì)的排序研究。根據(jù)表2 歷年排名情況,本文將30 個省市按2017 年高質(zhì)量發(fā)展水平好壞分成三大類:第一類為超前型,包括北京和上海等6 個省市;第二類為中庸型,包括山東等15 個省市;第三類為落后型,包括山西等9 個省市。
對于綜合評價而言,確定合理的權(quán)重最為關(guān)鍵。本文采用基于變異系數(shù)法[20]、信息熵法[21]權(quán)重的TOPSIS 法和PCA 法[22]分別求得27 個指標(biāo)數(shù)據(jù)的權(quán)重及其排序結(jié)果如表3 所示。采用PCA 法建模時,KMO 值等于0.458,小于0.5,說明該樣本數(shù)據(jù)不太適合用PCA 進(jìn)行綜合評價。根據(jù)表4 可知,由于每個方法賦權(quán)重的原理不盡相同,因而最后求得的各方法權(quán)重及排名也會有所差異。其中,只有PPC方法的建?;舅枷肱c人類開展綜合評價、排序和分類研究的思維方式是一致的,又可適用于非線性、高維、非正態(tài)分布的數(shù)據(jù)分析,可以避免PCA 法要求數(shù)據(jù)近似正態(tài)分布、存在“維數(shù)禍根”等問題,同時不必像TOPSIS 法需要利用其他方法提前確定各指標(biāo)權(quán)重。
Table 3 Comparison of weights obtained by different evaluation methods and their ranking表3 不同評價方法得到的權(quán)重及其排序比較
本文基于構(gòu)建的中國省際高質(zhì)量發(fā)展水平評價指標(biāo)體系,采用以群搜索算法優(yōu)化的PPC 模型對中國30 個省市進(jìn)行高質(zhì)量發(fā)展水平綜合評價及排序分類研究。研究結(jié)果表明:①在本文研究的指標(biāo)體系中,創(chuàng)新驅(qū)動發(fā)展對高質(zhì)量發(fā)展水平影響最大,經(jīng)濟(jì)成果共享相對其他方面影響最??;②將30 個省市按投影值從高到低進(jìn)行了排序并且將其分為三大類,北京等6 個省市為超前型,山東等15 個省市為平庸型,山西等9 個省市為落后型;③不同方法賦權(quán)重的原理不同,得到的權(quán)重值就會有所差異??梢愿鶕?jù)權(quán)重值最大的指標(biāo),提出有利于提升各省市高質(zhì)量發(fā)展水平的措施和建議;④相比于PCA 等其他方法,PPC 模型建模過程簡潔,適用于分析高維、非正態(tài)的數(shù)據(jù),為研究高質(zhì)量發(fā)展水平提供一種更加科學(xué)、合理的新評價方法。