李宇飛,王 偉,陳曉紅
(安徽農(nóng)業(yè)大學(xué)經(jīng)濟技術(shù)學(xué)院,安徽合肥 230601)
近年來,隨著社會的發(fā)展,貧困問題獲得人們的廣泛關(guān)注。消除貧困、改善民生、逐步實現(xiàn)共同富裕是社會主義的本質(zhì)要求,是我們黨的重要使命。為了提高扶貧效率,政府部門啟動了脫貧幫扶機制。幫扶不僅要考慮幫扶單位的能力,還要考慮幫扶對象的情況,例如:教育情況,居民收入情況,產(chǎn)業(yè)的發(fā)展狀況,居民居住的環(huán)境,基礎(chǔ)設(shè)施建設(shè)等。因此,怎樣公平公正地評價幫扶績效成為需要解決的問題[1-7]。
根據(jù)上述背景從統(tǒng)計局數(shù)據(jù)庫選取全國的扶貧數(shù)據(jù)建立模型解決以下問題:
(1)2015 年的評分與2020 年對應(yīng)的各項評分是否有著直接或者間接的關(guān)聯(lián),并分析各個評價指標的對應(yīng)關(guān)系。
(2)根據(jù)數(shù)據(jù)分析,說明哪種類型的哪些幫扶單位在脫貧幫扶上有較高績效。同時給出不同類型的幫扶單位績效的排序和脫貧幫扶績效前十名的幫扶單位編號。
(3)找出哪些幫扶單位分別在居民收入、產(chǎn)業(yè)發(fā)展、居住環(huán)境、文化教育、基礎(chǔ)設(shè)施等評價指標上幫扶業(yè)績明顯,并列出各單項評價指標前五名的幫扶單位編號。
(4)什么因素對評“脫貧先進村莊”榮譽稱號有著重要的影響。將數(shù)據(jù)中的最后10個村的評價分數(shù)先進行剔除,然后根據(jù)前面的評分數(shù)據(jù)進行填充,再與剔除的數(shù)據(jù)對比,并且判斷它們是否能評上“脫貧先進村莊”榮譽稱號。若將該稱號分為一級和二級,它們中的誰可以評上“脫貧先進一級村莊”稱號。
根據(jù)問題1 中所給的信息和數(shù)據(jù)對2015 年評分和2020年評分進行分析。
第1步:結(jié)合題中的信息對附件中的數(shù)據(jù)進行分析,并對所用數(shù)據(jù)進行預(yù)處理。
第2 步:基于處理后的數(shù)據(jù),對兩年的各個指標進行相關(guān)性分析,采用皮爾遜相關(guān)系數(shù)進行計算。
第3 步:利用python 進行程序的編寫,計算出各指標之間的相關(guān)系數(shù),確定2015 年和2020 年各個指標是否具有一定的聯(lián)系,并分析它們的對應(yīng)關(guān)系。
在問題2 中由于幫扶單位的情況和村莊等基礎(chǔ)的不同,僅僅考慮某一年的評分高低是不可以的,我們選用2015年和2020年的數(shù)據(jù)進行對比分析。
第1 步:對數(shù)據(jù)進行處理,將幫扶單位的不同類型進行篩選,并求出兩者指標的差值。
第2 步:在考慮哪一類幫扶方式績效高時,我們選取兩年中指標的差值來進行判斷,差值大的說明變化程度大,進而說明績效較高,并在績效較高的單位中進行排序,給出對應(yīng)的幫扶單位編號。
第3 步:用多屬性決策模型求其權(quán)重,按績效對其進行排名,兩種方法相互檢驗。
不同的幫扶單位的側(cè)重點有所不同,因此在研究幫扶績效上有的時候看總的績效評分可能結(jié)果不太明顯,在研究不同幫扶單位在不同指標的幫扶業(yè)績上,我們選取2015 年和2020 年的各個指標的數(shù)據(jù)進行分析。
第1 步:對數(shù)據(jù)進行處理,獲得各個指標的增長值。
第2 步:根據(jù)處理后的數(shù)據(jù),進行分析。大家都知道斜率的傾斜程度表示這增加的快慢程度,因此我們采用一次好函數(shù)擬合模型來進行研究。
第3步:用python編寫程序進行求解,得到160個方程,在處理誤差方面,采用誤差平方和的極小的方法來進行處理。
第4 步:求數(shù)據(jù)以后,將各個對應(yīng)的指標的績效進行排名,并取用表格表示出其中前五名幫扶單位的編號。
在第2問基礎(chǔ)上,可以知道居住環(huán)境和基礎(chǔ)設(shè)施所占比重較大,因此我們認為這兩個指標影響著稱號的評估。采用多元線性回歸進行預(yù)測,通過績效的排名來判斷是否可以評上,并且評上什么稱號。
(1)假設(shè)不考慮一些重大自然因素;
(2)假設(shè)沒有人為因素的影響;
(3)假設(shè)所有村莊的得分都為實際得分。
5.1.1 模型的建立
評分是否有關(guān)聯(lián)需要考慮的指標有很多,而且每種指標對評分的影響程度也有所不同,為研究2015 年和2020 年的各項評分是否有相關(guān)性,選取題中所給的居民收入(SR)、產(chǎn)業(yè)發(fā)展(CY)、居住環(huán)境(HJ)、文化教育(WJ)、基礎(chǔ)設(shè)施(SS)等5 個評價指標來進行相關(guān)性分析,用python中的大數(shù)據(jù)分析來進行求解,同時得到各個指標的對應(yīng)關(guān)系。
因為附件中的數(shù)據(jù)已經(jīng)進行了標準化,所以在這里直接進行相關(guān)系數(shù)的計算,記數(shù)據(jù)相關(guān)系數(shù)矩陣為:
根據(jù)皮爾遜相關(guān)系數(shù)公式計算相關(guān)系數(shù):
5.1.2 模型的求解
通過python對數(shù)據(jù)進行處理和相關(guān)性分析,得到2015年各個指標和2020年各個指標之間的相關(guān)性系數(shù),結(jié)果見表1。
表1 五種指標的相關(guān)系數(shù)
Pearson相關(guān)強度的分類見表2。
由各個指標間的相關(guān)系數(shù)并參照相關(guān)強度分類情況知:產(chǎn)業(yè)發(fā)展,居住環(huán)境和文化教育三者的相關(guān)系數(shù)均在0.6 以上,所以2015 年和2020 年產(chǎn)業(yè)發(fā)展,居住環(huán)境和文化教育的相關(guān)性為強相關(guān);居民收入和基礎(chǔ)設(shè)施的相關(guān)系數(shù)在0.5~0.6 之間,所以2015 年和2020年的居民收入和基礎(chǔ)設(shè)施的關(guān)聯(lián)性為中等程度相關(guān);2015 年的總評分和2020 年的總評分的相關(guān)系數(shù)為0.78,屬于強相關(guān)。因此在無特殊情況下認為2015年各項指標的評分與2020年各項指標的評分有關(guān)聯(lián)。
表2 相關(guān)強度分類
通過數(shù)據(jù)分析得到各個指標之間的相關(guān)系數(shù)見表3。
表3 各個指標之間的相關(guān)系數(shù)
表3中的相關(guān)性系數(shù)均為正數(shù),所以說各項指標均為正相關(guān)。
5.2.1 模型的建立
每個幫扶對象的情況都有所不同,而且村莊的基礎(chǔ)也有所不同,為研究績效的排名問題,我們采用兩種方法來進行判斷,第1 種方法,采用差值法,第2種方法,采用多屬性目標決策。
在考慮哪一類幫扶績效高時,選取2年中指標的差值來進行判斷,差值大的說明變化程度大,進而說明績效較高。對數(shù)據(jù)進行處理和分析,得圖1。
圖1 差值圖
由圖1 可以看出在居民收入,居住環(huán)境,文化教育和總評分等方面第四類幫扶單位的幫扶效果較為明顯即績效較高?;A(chǔ)設(shè)施和產(chǎn)業(yè)發(fā)展第五類幫扶單位幫扶效果顯著。
圖2 幫扶單位2015年和2020年各項指標平均值的差值
將被幫扶村莊看作160個集合,稱作160個幫扶單位,共有六種(0-5)不同屬性類型的幫扶單位,不同屬性指國有企業(yè),民營企業(yè)等。由圖5.2 可以直觀看出160個幫扶單位在2015年到2020年各項指標平均值的差值,根據(jù)差值可以排出績效前10 的各類幫扶單位編號見表4-表9,還可以根據(jù)總值評出幫扶績效排名前十的幫扶單位編號見表10。
表4 0類單位績效排名
表5 1類單位績效排名
表6 2類單位績效排名
表7 3類單位績效排名
表8 4類單位績效排名
表9 5類單位績效排名
表10 根據(jù)總值評出的幫扶單位績效排名
根據(jù)Saaty提出的決策方案建立多屬性決策模型進行分析。
首先,建立合適的指標體系,所選的指標為題中所給的指標,即居民收入、產(chǎn)業(yè)發(fā)展、居住環(huán)境、文化教育、基礎(chǔ)設(shè)施。
其次確定屬性權(quán)重。
(I)根據(jù)Saaty 等人提出的一致矩陣法,構(gòu)建出合適的成對比較矩陣,
進而對其進行一致性檢驗,一致性檢驗公式:
(Ⅱ)查找相應(yīng)的平均隨機一致性指標RI。對于n=1,…,9,Saaty 給出了RI 的值,RI 值是通過隨機方法構(gòu)造500 個樣本矩陣。隨機地從1-9 及其倒數(shù)中抽取數(shù)字構(gòu)造正互反矩陣,求得最大特征值的平均值λ′max,并定義:
(Ⅲ)計算一致性比例CI,
進而根據(jù)公式計算出對應(yīng)權(quán)向量。
①計算矩陣每一行元素的乘積Mi
②計算Mi的n次方根
最后對決策方案集進行歸一化處理,采用歸一化公式:
5.2.2 模型的求解
通過對矩陣A的分析,求出最大特征值,進而求出對應(yīng)的特征向量,做歸一化處理得到各指標的權(quán)重,見表11。
表11 各指標的權(quán)重值
同時計算出CI和CR,計算結(jié)果為CI=0.0956,CR=0.0853 <0.1,所以通過一致性檢驗。之后對居民收入、產(chǎn)業(yè)發(fā)展、居住環(huán)境、文化教育、基礎(chǔ)設(shè)施進行歸一化處理,得到歸一化后各個屬性的屬性值。根據(jù)最終權(quán)值,對附件的幫扶單位績效進行了排名,所得結(jié)果與前面差值法所得結(jié)果相同。
5.3.1 模型的建立
每個幫扶單位在幫扶時側(cè)重點有所不同,為研究幫扶單位在居民收入、產(chǎn)業(yè)發(fā)展、居住環(huán)境、文化教育、基礎(chǔ)設(shè)施等評價指標的績效,我們選取2015年和2020年的各個指標和總評分作為本問題的研究對象,先進行數(shù)據(jù)處理,找到各指標的增長值進行研究。我們采用一次線性擬合來進行求解,得到哪些幫扶單位在脫貧幫扶上績效較高。
在處理誤差上,采用誤差平方和達極小來處理,誤差平方和表達式為:
顯然,誤差平方和為待定參數(shù)的二元函數(shù),即S會隨著k0或者k1的變化而變化,因此參照最小二乘準則,確定待定參數(shù)k0和k1的值,使誤差平方和S達到最小值。
5.3.2 模型的求解
除了最后10個沒有總評分的數(shù)據(jù),將剩下的數(shù)據(jù)對應(yīng)指標的增長值按照幫扶單位進行擬合,得到160個擬合函數(shù)。由于我們選取的是各個指標的增長值,k1表示斜率,表示增長速度的快慢,增長速度越快說明幫扶的業(yè)績越好,所以我們在進行排名時按照k1的變化情況來進行排名排名情況見表12~16。
表12 居民收入指標績效排名情況
表13 產(chǎn)業(yè)發(fā)展指標績效排名情況
表14 基礎(chǔ)設(shè)施指標績效排名情況
表15 文化教育指標績效排名情況
表16 居住環(huán)境指標績效排名情況
通過分析得知:
(1)在居民收入指標中,幫扶業(yè)績提高最明顯的是編號為98 的幫扶單位;編號為100 的幫扶單位位居第二位;第三,第四和第五位分別是編號為44,99,56的幫扶單位;
(2)在產(chǎn)業(yè)發(fā)展指標中,幫扶單位編號為19的幫扶單位在幫扶業(yè)績上位居首位;編號為54 的幫扶單位位居次之;編號為28,110,108 的幫扶單位的幫扶業(yè)績分別位列三,四,五名;
(3)在基礎(chǔ)設(shè)施指標中,位居幫扶業(yè)績首位幫扶單位編號為75;編號為72的幫扶單位位居第二名;編號為46,35,100 的幫扶單位的幫扶業(yè)績分別排在第三名,第四名和第五名;
(4)在文化教育指標中,幫扶單位編號為53的幫扶單位在幫扶業(yè)績上效果明顯,位居榜首;編號為110 的幫扶單位位列第二;編號為13,107,15 的幫扶單位的幫扶業(yè)績分別位列第三,四,五名;
(5)在居住環(huán)境指標中,幫扶單位編號為95的幫扶單位在幫扶業(yè)績上獲得冠軍位置;編號為73 的幫扶單位獲得亞軍;編號為9的幫扶單位的幫扶業(yè)績獲得季軍,編號86,84的幫扶單位的幫扶業(yè)績分別位列4,5名。
5.4.1 模型的建立
全國計劃給予10 000 個村莊“脫貧先進村莊”稱號,有哪些因素對這個榮譽稱號有著影響呢?第一步需要解決什么因素對稱號的有影響,通過第一問,第二問求出指標間的權(quán)重,以及相關(guān)聯(lián)系。首先是將稱號條件分為三級,并且之間的比例為1∶3∶2。然后找到綜合排名在前6 000的,將總分部分換成自己設(shè)立的比例模型,將模型中前6 000的剔除,剩余的比較總分增長率,選擇前3 000 名,然后再將總分排名前9 000 個村莊剔除,剩余的比較單項的增長。第二步還可以把每個指標的標準差算出來,通過Excel 算出每個指標的標準差,選擇標準差大的若干個指標,標準差反應(yīng)了數(shù)據(jù)里均值的遠近。標準差越小,可以認為幫扶單位在這個指標上沒有幫助村長的改善。通過第一問第二問可以看出指標SS,SR 指標比較重要,那么就分別按照SS,SR 為標準各自選取若干個值。關(guān)于題目10 個村中問題,可以求出村莊所對應(yīng)的幫扶單位及類型,對各個指標取均值,用均值作為缺失的評分分數(shù),看能否評的上。當然也可以采取相應(yīng)的機器算法,運用線性回歸預(yù)測算法,通過前面所求出的值,對缺失的數(shù)據(jù)進行預(yù)測,然后在通過SS及SR 的指標進行排序,看其中是否能夠有村莊評為“脫貧先進一級村莊”。
在求缺失值時,采用線性回歸模型。
設(shè)該回歸模型為,
y=b0+b1x1+b2x2+,…+bnxn,
其中,bj(j=0,1,2,…,n)為回歸系數(shù)。
5.4.2 模型的求解
通過matlab編寫程序,由于回歸系數(shù)表的數(shù)據(jù)較多,不一一列出。因為b的取值均在bint的各個置信區(qū)間內(nèi),所以回歸系數(shù)b0,b1,b2,…,bn在此多元回歸模型中是顯著的,也就是說自變量x1,x2,…,xn也都是顯著的。復(fù)相關(guān)系數(shù)R2、統(tǒng)計量F,P值,估計誤差方差δ24個參數(shù)的檢驗結(jié)果為:
(1)復(fù)相關(guān)系數(shù)R2=0.806 5,是服從F(1,n-p-1),說明該模型效果較好。
(2)統(tǒng)計量值F為14.589 3,而且滿足F0.95(1,n-p-1)≤F≤F0.99(1,n-p-1),也說明了模型較好。
(3)P<α?xí)r模型才有意義,在編程時,將α=0.05代入進行計算。檢驗后的參數(shù)P=0.018 6,小于α,因此所建模型有意義。
(4)估計誤差方差δ2=0.0119,同樣,也說明了該模型效果比較好。
最終求出2020年的總評分,根據(jù)總評分評出獲得榮譽稱號的10 個村莊見表17。其中編號為39 257,25 149,47 883的村莊可以評上一級稱號。
表17 評分表
(1)在建立模型時與實際緊密聯(lián)系,結(jié)合實際情況對問題進行求解,從而模型更加可信,更具有良好的推廣性;(2)在建立模型時,考慮了較多的因素,回歸和預(yù)測效果較好;(3)從研究問題的基本原理開始到模型建立,再到模型求解,以及模型檢驗,整體上結(jié)構(gòu)框架較為完整;(4)在建立模型時,都考慮了模型的檢驗問題。綜合模型得出以下4點結(jié)論:
(1)在進行脫貧幫助時,可以在不同維度和不同單位幫扶。
(2)入戶調(diào)查也存在誤差。農(nóng)戶大多有“藏富”心理,僅靠短時間的入戶調(diào)查,難以對農(nóng)村家庭收入完全摸清。加之還有少數(shù)群眾有爭當貧困戶思想,有的農(nóng)戶在識別前將子女與父母戶口分開,導(dǎo)致收入微薄的老年貧困戶增多。
(3)是精準識別有誤差。找準“人”是精準扶貧的先決條件,從目前的政策規(guī)定來看,不能準確的確定貧困戶,出現(xiàn)假扶貧現(xiàn)象。貧困農(nóng)戶的識別主要是在鎮(zhèn)、村兩個層面,村干部是識別貧困戶的關(guān)鍵人物。第二輪精準識別過程缺乏剛性標準,有的鎮(zhèn)、村存在識別貧困農(nóng)戶時盲目采用了逐級分配指標的方法,導(dǎo)致在精準識別貧困戶方面存在偏差。
(4)是探索產(chǎn)業(yè)幫扶新模式。按照“區(qū)域化布局,規(guī)模化建設(shè),產(chǎn)業(yè)化經(jīng)營,全產(chǎn)業(yè)鏈開發(fā)”的精準產(chǎn)業(yè)扶貧思路,推行“1+1+N”脫貧攻堅幫扶模式,即1名包保責(zé)任人、1 名幫扶結(jié)對能人、N項就業(yè)解困崗位,通過產(chǎn)業(yè)發(fā)展帶動貧困戶增收致富,重點打造以苗木花卉、果蔬種植、光伏為主的主打扶貧產(chǎn)業(yè),對因環(huán)保問題而關(guān)閉的貧困戶養(yǎng)殖場,實行生態(tài)補償,支持產(chǎn)業(yè)轉(zhuǎn)移。