侯宏濤
(鄭州工業(yè)應(yīng)用技術(shù)學(xué)院基礎(chǔ)教學(xué)部,河南鄭州 451150)
基于收入分組數(shù)據(jù)擬合洛倫茲曲線新模型
侯宏濤
(鄭州工業(yè)應(yīng)用技術(shù)學(xué)院基礎(chǔ)教學(xué)部,河南鄭州 451150)
洛倫茲曲線的準(zhǔn)確度關(guān)系到基尼系數(shù)的精度,結(jié)合2006年湖北省農(nóng)村和城鎮(zhèn)的收入分組數(shù)據(jù),分別針對性地提出一個洛倫茲曲線新模型。通過對2種新模型的初次分析,從擬合度上可以表明擬合效果很好。新模型擬合效果從全部模型來看還是相當(dāng)好的。
洛倫茲曲線;Matlab;曲線擬合;誤差分析;模型對比
隨著經(jīng)濟的發(fā)展,國家之間、國內(nèi)社會成員之間收入分配差距日益擴大,貧富差距問題已成為人們?nèi)找骊P(guān)心和爭論的熱門話題[1]。
洛侖茲曲線與基尼系數(shù)分別是國際上用來衡量一個國家或地區(qū)經(jīng)濟部門專門化(集中化)程度及國民收入分配不平等(貧富分化)程度的坐標(biāo)圖形和分析指標(biāo)。不僅可以用來靜態(tài)地刻畫一個國家或地區(qū)的財富分配情況及社會穩(wěn)定性,而且可以用于檢驗政府政策在調(diào)節(jié)收入分配上的作用。基尼系數(shù)可以把分析結(jié)果用一束精確的具體數(shù)據(jù)表示出來,具有可量化性和確切性。然而,這一精確的數(shù)字是建立在擁有準(zhǔn)確的洛倫茲曲線之上的。由此可見,洛倫茲曲線和基尼系數(shù)存在著密切的內(nèi)在聯(lián)系。
本文通過2006年湖北省農(nóng)村、城鎮(zhèn)的收入分組數(shù)據(jù)(見表1),分別針對性地擬合出適合農(nóng)村的洛倫茲曲線模型和適合城鎮(zhèn)的洛倫茲曲線模型。
1.1 農(nóng)村收入分組數(shù)據(jù)的洛倫茲曲線模型
2006年湖北省農(nóng)村收入分組數(shù)據(jù)如表1所示。表1中,[xi,xi+1]為收入?yún)^(qū)間,單位為元;fi是該區(qū)間內(nèi)的人口比例;IUi(Income Uunits)是所調(diào)查收入?yún)^(qū)間在[xi,xi+1]的單位數(shù)目;CAi(Class Average)是這些單位在區(qū)間[xi,xi+1]的平均收入;pi是[0,xi+1]中人口比例;Li是[0,xi+1]中人口擁有的總收入比例,因此(pi,Li)是洛倫茲曲線上的點。首先畫出數(shù)據(jù)散點圖,如圖1所示。
表1 農(nóng)村收入分組數(shù)據(jù)
圖1 農(nóng)村收入數(shù)據(jù)散點圖
結(jié)合表1的數(shù)據(jù),用最小二乘法Matlab實現(xiàn),可以分別求出α、β、γ、η的值:
將所建立的新模型應(yīng)用于表1的數(shù)據(jù),繪制出農(nóng)村收入數(shù)據(jù)模型擬合曲線,如圖2所示。然后再通過Excel運用回歸分析法做回歸統(tǒng)計,結(jié)果如表2所示。
表2 農(nóng)村收入數(shù)據(jù)模型曲線回歸統(tǒng)計值
圖2 農(nóng)村收入數(shù)據(jù)模型擬合曲線圖
從圖2擬合曲線可以直觀看出,擬合曲線非常接近數(shù)值點;從表2回歸統(tǒng)計值可以看出,擬合度R2=0.999 999 13,擬合效果很好。
1)基于ACP100S直流蒸汽發(fā)生器(once-through steam generator,OTSG)最低穩(wěn)定運行功率的要求,ACP100S反應(yīng)堆功率控制和給水控制系統(tǒng)自動控制范圍為20%滿功率(full power,FP)~100%FP.
1.2 城鎮(zhèn)收入分組數(shù)據(jù)的洛倫茲曲線模型2006年湖北省城鎮(zhèn)收入分組數(shù)據(jù)如表3所示。
表3 城鎮(zhèn)收入分組數(shù)據(jù)
將農(nóng)村收入分組數(shù)據(jù)稍作修正,建立城鎮(zhèn)收入分組數(shù)據(jù)的模型為:
用同樣的方法求出:
將所建立的新模型應(yīng)用于表3的數(shù)據(jù),繪制出城鎮(zhèn)收入數(shù)據(jù)模型擬合曲線如圖3所示。然后再通過Excel運用回歸分析法做回歸統(tǒng)計,結(jié)果如表4所示。
圖3 城鎮(zhèn)收入數(shù)據(jù)模型擬合曲線圖
表4 城鎮(zhèn)收入數(shù)據(jù)模型曲線回歸統(tǒng)計值
從圖3擬合曲線可以直觀看出,擬合曲線非常接近數(shù)值點;從表4回歸統(tǒng)計值可以看出,擬合度R2=0.999 998 504,擬合效果很好。
第3種模型,
第5種模型,
第6種模型,
第7種模型,
第8種模型,
第9種模型,
分析表5數(shù)據(jù),可以得出如下結(jié)論:①第2種模型的城鎮(zhèn)收入分組數(shù)據(jù)的最大絕對誤差、平均絕對誤差、均方誤差均大于本文模型,農(nóng)村收入分組數(shù)據(jù)的平均絕對誤差小于新模型,然而最大絕對誤差、均方誤差卻大于新模型,從其擬合度0.999 998 882小于新模型可以看出,第2種模型擬合效果不如新模型;②第9種模型的農(nóng)村收入分組數(shù)據(jù)的最大絕大誤差雖然小于新模型,但是平均絕對誤差、均方誤差卻大于新模型,這說明新模型的擬合效果還是要好些,從其擬合度0.999 998 117小于新模型可以看出;③第10種模型的城鎮(zhèn)收入分組數(shù)據(jù)最大絕大誤差雖然小于新模型,但是平均絕對誤差、均方誤差卻大于新模型,這說明新模型的擬合效果較好些,從其擬合度0.999 998 437小于新模型可以看出;④第11、12、13種模型的城鎮(zhèn)收入分組數(shù)據(jù)最大絕對誤差、平均絕對誤差、均方誤差均大于本文模型,但是農(nóng)村收入分組數(shù)據(jù)最大絕對誤差、平均絕對誤差、均方誤差均小于本文模型,盡管如此,二者誤差數(shù)據(jù)數(shù)值很接近,這可能是因為農(nóng)村收入的離散性比城鎮(zhèn)要大,故此產(chǎn)生一些偏差。
結(jié)合上述分析,第1種模型到第10種模型的擬合精度沒有新模型效果好,第11種模型到第13模型的農(nóng)村收入分組數(shù)據(jù)最大絕對誤差、平均絕對誤差、均方誤差均小于本文模型,但是城鎮(zhèn)收入分組數(shù)據(jù)最大絕對誤差、平均絕對誤差、均方誤差均大于本文模型。從整體效果來看,本文對農(nóng)村和城鎮(zhèn)收入分組數(shù)據(jù)各提出的一個新模型,擬合效果較好。
表5 模型誤差數(shù)據(jù)對比
[1]李聰睿.計算基尼系數(shù)的算法研究及其應(yīng)用[J].廣東工業(yè)大學(xué)學(xué)報,2005(2):125-128.
The Fitting New Model of Lorenz Curve Based on Revenue Packet Data
Hou Hongtao
(The Department of Fundamental Education,Zhengzhou University of Industrial Technology,Zhengzhou Henan 451150)
Accuracy of Gini Coefficient is closely related to the accuracy of the lorenz curve,combined with 2006 revenue of Hubei rural and urban packet data,a new model of lorenz curve was respectively proposed.Through the analysis of the two new models,from the fitting degree,it could be shown that the fitting effect was very good.comparative results showed that new model fitting effect among all models was still quite good.
lorenz curve;Matlab;curve-fitting;error analysis;model compare
F126.2
A
1003-5168(2016)11-0045-03
2016-10-08
侯宏濤(1988-),男,碩士,助教,研究方向:物理教學(xué)與實驗。