• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中國(guó)外出農(nóng)民工歷史的測(cè)算與未來(lái)的趨勢(shì)

      2015-11-23 07:49:56顧樂(lè)民
      浙江農(nóng)業(yè)科學(xué) 2015年1期
      關(guān)鍵詞:冪指數(shù)曲線擬合乘法

      顧樂(lè)民

      (同濟(jì)大學(xué),上海 200092)

      中國(guó)外出農(nóng)民工歷史的測(cè)算與未來(lái)的趨勢(shì)

      顧樂(lè)民

      (同濟(jì)大學(xué),上海 200092)

      由于缺乏成熟的農(nóng)民工統(tǒng)計(jì)制度,對(duì)于改革開(kāi)放30多年來(lái),每年我國(guó)外出農(nóng)民工的數(shù)量,約40%年份的數(shù)據(jù)是缺失的。最小一乘解,是在全部數(shù)據(jù)中依據(jù)準(zhǔn)則選取特征數(shù)據(jù)來(lái)實(shí)現(xiàn)的。將農(nóng)民工數(shù)量中3個(gè)權(quán)威數(shù)據(jù)作為最小一乘法特征數(shù)據(jù),按照最小一乘準(zhǔn)則,繪制出我國(guó)改革開(kāi)放以來(lái)外出農(nóng)民工數(shù)量的變化曲線。結(jié)果表明,30多年來(lái)我國(guó)外出農(nóng)民工數(shù)量的增長(zhǎng)可以用Richards生長(zhǎng)模型和一種新的指數(shù)+冪指數(shù)混合生長(zhǎng)模型來(lái)共同描述;增長(zhǎng)過(guò)程是一個(gè)沒(méi)有峰或谷的連續(xù)遞增,在1995-1998年間出現(xiàn)一個(gè)變化的拐點(diǎn),使加速的增長(zhǎng)轉(zhuǎn)變?yōu)闇p速的增長(zhǎng);2014年外出農(nóng)民工數(shù)量將達(dá)到1.71億,按1.6倍率相乘,農(nóng)民工總數(shù)為2.73億;按目前發(fā)展趨勢(shì)2021年外出農(nóng)民工數(shù)量將出現(xiàn)高點(diǎn)1.88億,折算成農(nóng)民工總數(shù)為3.0億,之后將呈現(xiàn)緩慢下降趨勢(shì)。

      外出農(nóng)民工;最小一乘法;曲線擬合;預(yù)測(cè)

      文獻(xiàn)著錄格式:顧樂(lè)民.中國(guó)外出農(nóng)民工歷史的測(cè)算與未來(lái)的趨勢(shì)[J].浙江農(nóng)業(yè)科學(xué),2015,56(1):130-136.

      DOI 10.16178/j.issn.0528?9017.20150142

      農(nóng)民工是中國(guó)工業(yè)化、城市化與農(nóng)村人口在非農(nóng)化沒(méi)有同步發(fā)展的歷史條件下產(chǎn)生的一個(gè)獨(dú)特的社會(huì)群體[1]。于20世紀(jì)80年代出現(xiàn)的農(nóng)民工,是改革開(kāi)放進(jìn)程中出現(xiàn)并迅速成長(zhǎng)起來(lái)的一支新型勞動(dòng)大軍,是現(xiàn)代產(chǎn)業(yè)工人的主體,是中國(guó)現(xiàn)代化建設(shè)的重要力量。農(nóng)民工隊(duì)伍的產(chǎn)生和不斷壯大,對(duì)改變農(nóng)村面貌做出了特殊的重要貢獻(xiàn),成為推動(dòng)中國(guó)經(jīng)濟(jì)發(fā)展和社會(huì)結(jié)構(gòu)變革的巨大力量[2-3]。但是由于沒(méi)有成熟的農(nóng)民工統(tǒng)計(jì)制度,對(duì)于30多年來(lái)我國(guó)農(nóng)民工的數(shù)量,約40%年份的數(shù)據(jù)是缺失的,存留的數(shù)據(jù)中也有不少是矛盾的,誤差在15%的居多,有的甚至達(dá)近30%。

      關(guān)于農(nóng)民工歷年數(shù)量變化的資料雖然能找到或估算出[4-5],但總體是不全的。農(nóng)民工數(shù)量數(shù)據(jù)的缺失會(huì)造成一些分析難以或無(wú)法進(jìn)行,統(tǒng)計(jì)數(shù)據(jù)之間的矛盾也會(huì)使各種分析變得有爭(zhēng)議。因此補(bǔ)全缺失的數(shù)據(jù),糾正矛盾的數(shù)據(jù),可以更好地為分析農(nóng)民工其他問(wèn)題服務(wù),具有一定的理論和實(shí)用價(jià)值。

      數(shù)據(jù)是不能憑空構(gòu)造的,農(nóng)民工數(shù)量的變化規(guī)律也是客觀存在的,將這種規(guī)律用數(shù)據(jù)形式表達(dá)是可能的。如果在存有的數(shù)據(jù)中隱含若干重要數(shù)據(jù),即統(tǒng)計(jì)過(guò)程中具有很高置信度、被公認(rèn)的、已被廣泛接受的權(quán)威數(shù)據(jù),發(fā)現(xiàn)并找出它們,以這些數(shù)據(jù)為主線,就能勾勒出一條能較準(zhǔn)確反映農(nóng)民工發(fā)展過(guò)程的曲線。它不僅能成為農(nóng)民工數(shù)量變化規(guī)律的一個(gè)很好的近似,還可以用數(shù)學(xué)上的內(nèi)插法,補(bǔ)全缺失的相關(guān)數(shù)據(jù),糾正有矛盾的數(shù)據(jù),并延伸到其他農(nóng)民工的各種分析服務(wù)上。

      最小一乘準(zhǔn)則是關(guān)于誤差絕對(duì)值之和極小化的準(zhǔn)則,源于18世紀(jì)天文學(xué)子午線長(zhǎng)問(wèn)題的古典研究,從歷史上看比最小二乘準(zhǔn)則還早了40多年。但如何在該準(zhǔn)則基礎(chǔ)上建立并實(shí)現(xiàn)回歸算法是個(gè)難題,成為困擾數(shù)理界200多年未解的難題,也形成了延續(xù)至今的對(duì)最小一乘準(zhǔn)則的各種研究,并逐漸形成了以該準(zhǔn)則為基礎(chǔ)的最小一乘法。近年來(lái),由于最小一乘解的實(shí)現(xiàn)問(wèn)題有了大的突破,使得最小一乘法在各領(lǐng)域中迅速得以應(yīng)用,成為繼最小二乘法之后一個(gè)既古典又新穎的方法[6]。最小一乘解的實(shí)現(xiàn)過(guò)程與最小二乘解有很大區(qū)別,最小二乘法是全部數(shù)據(jù)都必須參與的捆綁式的處理方法,而最小一乘法則是通過(guò)全部數(shù)據(jù)選出若干個(gè)特征數(shù)據(jù)的代表式的數(shù)據(jù)處理方法。最小一乘法的這種數(shù)據(jù)處理方式,為農(nóng)民工數(shù)量問(wèn)題的解決提供了一個(gè)極為相近的思路與方法,將最小一乘法需要的特征數(shù)據(jù)與統(tǒng)計(jì)學(xué)中的重要數(shù)據(jù)聯(lián)系起來(lái),就有可能繪出一條最小一乘準(zhǔn)則下的農(nóng)民工數(shù)量的變化曲線。

      廣義最小一乘法是最小一乘法的一個(gè)推廣[7],是合理運(yùn)用最小一乘法基于的零誤差原理,并加以推廣至關(guān)鍵數(shù)據(jù)位,使關(guān)鍵點(diǎn)位數(shù)據(jù)成為最小一乘特征數(shù)據(jù)的一種方法。所謂關(guān)鍵點(diǎn)就是特別關(guān)心的重要數(shù)據(jù)點(diǎn),是不希望出現(xiàn)誤差或誤差盡可能小的點(diǎn)。例如力峰值點(diǎn)、機(jī)床加工特殊點(diǎn)、目標(biāo)到達(dá)點(diǎn)、預(yù)測(cè)的未知點(diǎn)等。如果將農(nóng)民工數(shù)量統(tǒng)計(jì)中的重要數(shù)據(jù)點(diǎn)視為關(guān)鍵點(diǎn),那么關(guān)于農(nóng)民工數(shù)量變化曲線的建立不僅有了理論依據(jù),也成為可能。

      Richards模型是1955年Richards在von Bertalanffy生長(zhǎng)模型的基礎(chǔ)上經(jīng)一般化處理后提出的一個(gè)著名的生長(zhǎng)模型[8],也常用于人口增長(zhǎng)的描述。通過(guò)參數(shù)變化可演變?yōu)镸itscherlich、Gompertz、Logistic這3個(gè)生長(zhǎng)模型,使之成為Richards模型的3個(gè)特例。Richards曲線是一個(gè)具有漸近線功能的S形曲線,能推算出當(dāng)時(shí)間→∞條件下增長(zhǎng)的極限量。數(shù)據(jù)處理表明由于含有4個(gè)參數(shù),使得Richards模型比另外3個(gè)模型具有更小的曲線擬合誤差,在本研究中將Richards模型作為主要的數(shù)學(xué)模型之一。

      此外,在本研究中還將介紹一個(gè)新的生長(zhǎng)模型,冪指數(shù)+指數(shù)混合型生長(zhǎng)模型,一種既有冪指數(shù)功能又有指數(shù)功能,既有漸近線功能也有極值功能的新生長(zhǎng)模型,用于克服Richards模型中不具有極值的局限。在廣義的增長(zhǎng)、發(fā)展、生長(zhǎng)過(guò)程中,時(shí)間→∞條件下的極限增長(zhǎng)往往不一定都存在,當(dāng)增長(zhǎng)趨于停滯往往預(yù)示著外部條件或內(nèi)在因素?zé)o法再起作用,此時(shí)只有2種可能,一種是趨于消亡,例如植物的生長(zhǎng);另一種繼續(xù)維持生存,則必然朝著新的循環(huán)尋找出路,通過(guò)表觀下跌找到新的平衡。新模型中這2種趨勢(shì)都有可能出現(xiàn),依賴于給定的是什么類型的數(shù)據(jù),所以具有很強(qiáng)的適應(yīng)性和指示性。極大值和極限值的雙重現(xiàn)象可能更符合客觀世界的一般生長(zhǎng)規(guī)律,也可能更符合農(nóng)民工未來(lái)發(fā)展的趨勢(shì),在本研究中也將該新模型作為主要的數(shù)學(xué)模型之一,與Richards模型一起共同用于分析農(nóng)民工的數(shù)量增長(zhǎng)問(wèn)題。

      1 原理與方法

      表1是國(guó)家4部門(mén)給出的1983-2007年間主要年份外出務(wù)工的農(nóng)民工數(shù)量數(shù)據(jù)[3]。

      表1 改革開(kāi)放以來(lái)主要年份外出務(wù)工的農(nóng)民工數(shù)量萬(wàn)人

      1.1 最小一乘法

      數(shù)據(jù)(xi,yi)i=1,2,…,m是隱函數(shù)y(x)在有定義的區(qū)間內(nèi)給出的m個(gè)離散點(diǎn)組,為找到隱函數(shù)y(x),設(shè)擬合函數(shù)f(x)=f(x,a),其中參數(shù)a=(a1,a2,…,an),n≤m,而a1,a2,…,an為n個(gè)不全為0的實(shí)數(shù)。為使f(x)盡可能接近y(x),設(shè)誤差函數(shù)r(x)=y(tǒng)(x)-f(x),而誤差值(xi,ri)是誤差函數(shù)r(x)上的具體數(shù)值:

      ri=y(tǒng)i-?(xi,,a)i=1,2,…,m。

      曲線擬合的最小一乘法,是依據(jù)誤差ri=y(tǒng)if(xi,a)的絕對(duì)值之和為極小的準(zhǔn)則來(lái)選擇參數(shù)a,即依據(jù)Q=Q(a)=min而構(gòu)成的一種曲線擬合法。

      1.2 平均絕對(duì)誤差Mae、平均絕對(duì)百分誤差Mape、曲線擬合誤差

      平均絕對(duì)誤差Mae是最小一乘法一個(gè)重要的絕對(duì)量值指標(biāo):

      平均絕對(duì)百分誤差Mape是最小一乘法一個(gè)重要的相對(duì)量值指標(biāo):

      在曲線擬合中,平均絕對(duì)百分誤差常被稱為曲線擬合誤差,在后文中將應(yīng)用該術(shù)語(yǔ)。

      1.3 最小一乘解

      如果最小一乘的解存在,即存在a=a?使則至少存在n個(gè)零誤差點(diǎn)x1,x2,…,xn使yj-f(xj,a?)=0,j=1,2,…,n。

      稱參數(shù)a?為最小一乘最佳擬合參數(shù),上標(biāo)用?表示,稱f(x,a?)為最小一乘最佳擬合方程,它們構(gòu)成了最小一乘法的一般解。

      1.4 零誤差以及最小一乘法、最小二乘法、廣義最小一乘法在數(shù)據(jù)處理方式上的差異

      所謂零誤差就是沒(méi)有誤差,或誤差為0。在實(shí)際計(jì)算過(guò)程中由于計(jì)算機(jī)的浮點(diǎn)運(yùn)算功能是有限的,所以常將很小可以忽略不計(jì)的絕對(duì)值誤差作為零誤差處理。從1.3節(jié)可以看出,最小一乘法是通過(guò)n個(gè)零誤差點(diǎn)處的零誤差來(lái)獲得最小一乘解的,這種求解方式是最小一乘法獨(dú)有的。但不是任意n個(gè)數(shù)據(jù)都可以成為零誤差數(shù)據(jù),而是需要通過(guò)選優(yōu)的方式,在m個(gè)都有可能成為零誤差的數(shù)據(jù)中,擇優(yōu)選出能使誤差絕對(duì)值之和極小的n個(gè)數(shù)據(jù)作為零誤差數(shù)據(jù)。這個(gè)由全部m個(gè)數(shù)據(jù)都參與,選出n個(gè)數(shù)據(jù)作為全部數(shù)據(jù)的代表的數(shù)據(jù)處理過(guò)程可用一個(gè)通俗的語(yǔ)言代表式的數(shù)據(jù)處理方式來(lái)描述,而選中的n個(gè)數(shù)據(jù)就成了代表數(shù)據(jù)。

      最小二乘法的數(shù)據(jù)處理過(guò)程要求全部數(shù)據(jù)都參與,得到的結(jié)果是集體貢獻(xiàn)的組合性結(jié)果,是一種捆綁式的數(shù)據(jù)處理方式。如果在數(shù)據(jù)缺失情況下應(yīng)用該法,得到的結(jié)果會(huì)產(chǎn)生一定的片面性。

      廣義最小一乘法具有相當(dāng)大的靈活性,它吸收了最小一乘法的零誤差原理,卻不苛刻要求誤差絕對(duì)值之和必須極小,以部分犧牲極小化結(jié)果的代價(jià)換取對(duì)應(yīng)用條件的寬松。例如,最小一乘法規(guī)定的n個(gè)特征數(shù)據(jù)具有唯一性的特征,是不能任選的;但是廣義最小一乘法可以根據(jù)實(shí)際需要,人為確定2個(gè)數(shù)據(jù)為特征數(shù)據(jù),另外(n-2)個(gè)數(shù)據(jù)由最小一乘準(zhǔn)則來(lái)選取。這種用抬高或犧牲誤差絕對(duì)值之和極小的代價(jià)換取對(duì)關(guān)鍵數(shù)據(jù)的保護(hù)的最小一乘法就是廣義最小一乘法,是最小一乘法的一個(gè)推廣。

      1.5 原始數(shù)據(jù)中的重點(diǎn)數(shù)據(jù)

      在表1給出的1組原始數(shù)據(jù)中,可以確定以下3個(gè)數(shù)據(jù)為重點(diǎn)數(shù)據(jù):1983年外出農(nóng)民工數(shù)量200萬(wàn),這是一個(gè)被公認(rèn)的歷史性數(shù)據(jù),該數(shù)據(jù)之后的多個(gè)數(shù)據(jù)是缺失的;1996年外出農(nóng)民工數(shù)量7 223萬(wàn),該數(shù)據(jù)為第一次全國(guó)農(nóng)業(yè)普查數(shù)據(jù),具有很高的置信度和權(quán)威性,由于該數(shù)據(jù)之前的多個(gè)數(shù)據(jù)是缺失的,它定位的重要性就尤為突出;2006年外出農(nóng)民工數(shù)量13 181萬(wàn),該數(shù)據(jù)為第二次全國(guó)農(nóng)業(yè)普查數(shù)據(jù),也具有很高的置信度和權(quán)威性,該數(shù)據(jù)之前是多個(gè)矛盾數(shù)據(jù),如果需要糾正矛盾數(shù)據(jù),它的定位作用就十分重要。

      這3個(gè)數(shù)據(jù)的一個(gè)共同特征是它們分別代表了相應(yīng)的年代(80,90,00年代),使得重要數(shù)據(jù)在時(shí)間分布上比較均勻且合理。除這3個(gè)數(shù)據(jù)外,其他的數(shù)據(jù)均作為一般數(shù)據(jù)處理。2008-2013年的數(shù)據(jù)有6個(gè)在表1中并沒(méi)有列出,這6個(gè)數(shù)據(jù)具有很高的置信度,但這6個(gè)數(shù)據(jù)集中在最近的6年,數(shù)據(jù)是連續(xù)的、不缺失的、無(wú)矛盾的,所以這6個(gè)數(shù)據(jù)屬于權(quán)重相等的一般數(shù)據(jù)。

      1.6 Richards生長(zhǎng)模型

      Richards生長(zhǎng)模型是一個(gè)具有漸近線功能的S形模型,模型中的4個(gè)參數(shù)用a1,a2,a3,a4簡(jiǎn)化表達(dá):

      當(dāng)時(shí)間x→∞,e-a3x→0,所以參數(shù)a1表示為極限量。

      1.7 冪指數(shù)+指數(shù)混合型生長(zhǎng)模型

      冪指數(shù)+指數(shù)混合型生長(zhǎng)模型是冪指數(shù)模型與指數(shù)模型簡(jiǎn)單組合而構(gòu)成的一個(gè)混合型模型,用g(x)=g(x,b)表示,其中參數(shù)b=(b1,b2,b3,b4)。

      g(x)=g(x,b)=b1xb2+b3eb3x。

      g(x)的變化率即為1階導(dǎo)函數(shù)g′(x),g(x)的2階變化率即為2階導(dǎo)函數(shù)g″(x):

      式中都是超越方程,令g′(x)=0通過(guò)牛頓迭代法得到0點(diǎn)是g(x)的極大值點(diǎn);令g″(x)=0通過(guò)牛頓迭代法得到的0點(diǎn)是g(x)的拐點(diǎn),因篇幅關(guān)系不展開(kāi)對(duì)該生長(zhǎng)模型的擴(kuò)展性討論。

      2 數(shù)據(jù)處理

      表2中第1列是序號(hào),共18個(gè),第2列是年份,第3列是1983-2013年我國(guó)外出農(nóng)民工數(shù)量實(shí)際數(shù)據(jù),為母系列,其中2008-2013年的6組數(shù)據(jù)是國(guó)家統(tǒng)計(jì)局通過(guò)人民網(wǎng)財(cái)經(jīng)頻道公布的國(guó)家數(shù)據(jù)[9-10],缺失年份的數(shù)據(jù)有13個(gè)(1984,1985,1986,1987,1988,1990,1991,1992,1994,1997,1998,1999,2007年)。因最小一乘法解的實(shí)現(xiàn)是一個(gè)十分繁復(fù)的計(jì)算,文中略去所有的計(jì)算過(guò)程,只給出計(jì)算的結(jié)果。

      依據(jù)上述的討論,在最小一乘準(zhǔn)則下得到的Richards方程為:

      對(duì)數(shù)據(jù)處理的結(jié)果見(jiàn)表2第4列,表中第5列為絕對(duì)誤差(萬(wàn)),第6列為相對(duì)誤差(%)。位于i=1,5,12,18的誤差是零誤差點(diǎn),相應(yīng)的年份是1983,1996,2006,2013年。Richards方程獲得了平均絕對(duì)誤差Mae=386.8(萬(wàn))和曲線擬合誤差Mape=4.73%的條件極小化的結(jié)果。

      在最小一乘準(zhǔn)則下得到指數(shù)+冪指數(shù)混合模型方程為:

      對(duì)數(shù)據(jù)處理的結(jié)果見(jiàn)表2,其中第7列為擬合值,第8列為絕對(duì)誤差,第9列為相對(duì)誤差。位于i=1,5,12,15的誤差點(diǎn)是零誤差點(diǎn),相應(yīng)的年份是1983,1996,2006,2010年。冪指數(shù)+指數(shù)混合模型獲得了平均絕對(duì)誤差Mae=351.3萬(wàn)和曲線擬合誤差Mape=4.36%的條件極小化的結(jié)果。

      由表2可以說(shuō)明以下幾點(diǎn):

      1)4個(gè)零誤差點(diǎn)是31年間(1983-2013年)外出農(nóng)民工數(shù)量變化的4個(gè)重要數(shù)據(jù)點(diǎn),分別在80,90,00,10年代出現(xiàn),比較均衡。假設(shè)這4個(gè)重要數(shù)據(jù)是全部31個(gè)數(shù)據(jù)(含缺失的13個(gè)數(shù)據(jù))的代表數(shù)據(jù),那么最小一乘法依據(jù)這4個(gè)數(shù)據(jù)獲得的解,即獲得的曲線擬合方程就可以認(rèn)為是31年來(lái)我國(guó)外出農(nóng)民工數(shù)量變化的一個(gè)近似規(guī)律。

      2)如果假設(shè)不成立,那么就必須從給定的數(shù)據(jù)中,另外選出4個(gè)代表數(shù)據(jù),并獲得相應(yīng)的解。文中不展開(kāi)重新選擇數(shù)據(jù)的探討,因?yàn)檫@種對(duì)比將涉及大量的計(jì)算和討論,所以文中認(rèn)定給出的假設(shè)是成立的。

      3)2個(gè)生長(zhǎng)模型的數(shù)據(jù)處理有相同點(diǎn),都認(rèn)為2000年和2001年的數(shù)據(jù)誤差較大,它們的相對(duì)誤差都超過(guò)了20%,所以需要修正。

      4)根據(jù)國(guó)家統(tǒng)計(jì)局給出的我國(guó)外出農(nóng)民工與農(nóng)民工總數(shù)的比例,多年來(lái)一直在1∶1.6左右,由Richards方程給出的外出農(nóng)民工的極限數(shù)量為28 282.892萬(wàn),按1.6倍率推算,我國(guó)農(nóng)民工總數(shù)的極限量為4.53億,這個(gè)結(jié)果超出了實(shí)際可能的范圍。根據(jù)《中國(guó)農(nóng)村統(tǒng)計(jì)年鑒》數(shù)據(jù),截至2010年,我國(guó)農(nóng)村勞動(dòng)力的資源為46 875萬(wàn)人[5],Richards模型給出的理論結(jié)果接近該值,但不可能都轉(zhuǎn)化為農(nóng)民工,所以事實(shí)不可能實(shí)現(xiàn)。從意義上說(shuō)Richards模型給出的數(shù)據(jù)處理結(jié)果只能作為參考,同樣對(duì)于Mitscherlich,Gompertz,Logistic等模型,給出的結(jié)果將產(chǎn)生大的偏差而不合實(shí)際情況,這里從略。

      5)相比之下,冪指數(shù)+指數(shù)型混合模型比較符合實(shí)際的人口變化情況,且2個(gè)重要的曲線擬合指標(biāo)Mae和Mape都要較Richards模型小些,所以在后文的分析中將主要運(yùn)用該模型。

      3 數(shù)據(jù)分析

      3.1 預(yù)測(cè)的零誤差經(jīng)驗(yàn)法則

      預(yù)測(cè)的零誤差經(jīng)驗(yàn)法則適用于數(shù)值逼近[11]。大量試驗(yàn)表明,在數(shù)值逼近中若將端點(diǎn)xm處的數(shù)據(jù)值(xm,ym)設(shè)定為零誤差,即ym-f(xm)=0。則對(duì)于未知的數(shù)據(jù)(xm+1,ym+1)的預(yù)測(cè)具有較為準(zhǔn)確的結(jié)果。

      在數(shù)值逼近中,數(shù)據(jù)值的隨機(jī)誤差一般較小,函數(shù)方程越接近0點(diǎn)其誤差絕對(duì)值就越小,如果端點(diǎn)前數(shù)據(jù)的誤差rm-1=y(tǒng)m-1-f(xm-1)的絕對(duì)值誤差很小,而端點(diǎn)處的誤差為0,rm=y(tǒng)m-f(xm)=0,按照曲線延伸的慣性原理,則端點(diǎn)后數(shù)據(jù)(xm+1,ym+1)的誤差也不會(huì)大,這為預(yù)測(cè)數(shù)據(jù)(xm+1,ym+1)引入的預(yù)測(cè)誤差必定很小。如果再對(duì)預(yù)測(cè)進(jìn)行一種誤差補(bǔ)償,將誤差值rm-1簡(jiǎn)單疊加在預(yù)測(cè)值f(xm+1)上,即有ym+1=f(xm+1)±rm-1,則預(yù)測(cè)結(jié)果將更接近實(shí)際真值ym+1。

      這個(gè)經(jīng)驗(yàn)法則雖適用于數(shù)值逼近,但對(duì)于統(tǒng)計(jì)學(xué)數(shù)據(jù)而言,當(dāng)數(shù)據(jù)的隨機(jī)誤差不是很大,依然可以簡(jiǎn)單套用,僅當(dāng)隨機(jī)誤差很大,曲線失去了延伸的一般規(guī)律時(shí),該法則就不宜使用。

      3.2 預(yù)測(cè)性檢驗(yàn)

      對(duì)于未來(lái)的預(yù)測(cè),重要的是預(yù)測(cè)結(jié)果是否準(zhǔn)確,此時(shí)其他問(wèn)題,例如規(guī)律性問(wèn)題、曲線的形狀問(wèn)題等都要讓位,即凡是干擾或影響預(yù)測(cè)所需要的條件的一般都要加以限制。預(yù)測(cè)的零誤差經(jīng)驗(yàn)法則設(shè)定端點(diǎn)數(shù)據(jù)為滿足式y(tǒng)m-f(xm)=0的零誤差數(shù)據(jù),其他數(shù)據(jù)均視為一般數(shù)據(jù)以免干擾,以下給出實(shí)際預(yù)測(cè)結(jié)果。

      表2 1983-2013年我國(guó)外出農(nóng)民工數(shù)量的模型擬合

      1)用冪指數(shù)+指數(shù)模型,預(yù)測(cè)2011年外出的農(nóng)民工數(shù)量。

      由表2,取1983-2010年的15組數(shù)據(jù),設(shè)定2010年的數(shù)據(jù)為零誤差數(shù)據(jù),其余均為一般數(shù)據(jù),依據(jù)最小一乘準(zhǔn)則,獲得的擬合方程:

      g(xi)=457.293 83(xi-1 982)1.064617-250.231 44e0.027832(xi-1982)。

      零誤差在1983,1996,2004,2010年的4個(gè)數(shù)據(jù)位上出現(xiàn),擬合結(jié)果為平均絕對(duì)誤差Mae=381.2(萬(wàn)),曲線擬合誤差5.07%,將x16=2011帶入上式,得預(yù)測(cè)結(jié)果g(2011年)=15 924.1(萬(wàn)),與實(shí)際值15 863(萬(wàn))的絕對(duì)誤差為61.1(萬(wàn)),預(yù)測(cè)的相對(duì)誤差為0.39%。

      2)預(yù)測(cè)2012年外出的農(nóng)民工數(shù)量。

      同理,取1983-2011年的16組數(shù)據(jù),設(shè)定2011年的數(shù)據(jù)為零誤差數(shù)據(jù),其余均為一般數(shù)據(jù),依據(jù)最小一乘準(zhǔn)則,獲得的擬合方程:

      g(xi)=445.083(xi-1 982)1.080664-232.495 93e0.05272423(xi-1982)。

      該方程在1983,1996,2004,2011年的4個(gè)點(diǎn)位獲得零誤差,擬合結(jié)果為平均絕對(duì)誤差Mae=357.9(萬(wàn)),曲線擬合誤差4.74%,將x17=2012帶入上式,得預(yù)測(cè)結(jié)果g(2012年)=164 36.9(萬(wàn)),與實(shí)際值16 336(萬(wàn))的絕對(duì)誤差為100.9(萬(wàn)),預(yù)測(cè)的相對(duì)誤差為0.62%。

      3)預(yù)測(cè)2013年外出的農(nóng)民工數(shù)量。

      取1983-2012年的17組數(shù)據(jù),設(shè)定2012年的數(shù)據(jù)為零誤差數(shù)據(jù),其余同上,獲得的擬合方程:

      g(xi)=430.322 37(xi-1 982)1.096374-215.518 93e0.0664312(xi-1982)。

      該方程在1983,1996,2004,2012年的4個(gè)點(diǎn)位獲得零誤差,擬合結(jié)果為平均絕對(duì)誤差Mae=342.1(萬(wàn)),曲線擬合誤差4.47%,將x18=2013帶入上式,得預(yù)測(cè)結(jié)果g(2013)=16 883.2(萬(wàn)),與實(shí)際值16 610(萬(wàn))的絕對(duì)誤差為273.2(萬(wàn)),預(yù)測(cè)的相對(duì)誤差為1.64%。

      以上預(yù)測(cè)都具有一定的準(zhǔn)確性,同時(shí)也看到,雖然只設(shè)定了端點(diǎn)數(shù)據(jù)為零誤差數(shù)據(jù),其余都按一般數(shù)據(jù)論處,但按照最小一乘準(zhǔn)則的數(shù)據(jù)處理,1983年和1996年的數(shù)據(jù)都?xì)w入了零誤差數(shù)據(jù)范疇,這與上述討論中將1983,1996,2006年屬于重點(diǎn)數(shù)據(jù)的設(shè)定十分相近,這一結(jié)果也說(shuō)明了最小一乘法對(duì)于數(shù)據(jù)的選取具有與事實(shí)十分接近的優(yōu)良功能。

      3.3 預(yù)測(cè)2014年我國(guó)農(nóng)民工數(shù)量

      在以上分析基礎(chǔ)上,對(duì)2014年外出農(nóng)民工可能的數(shù)量進(jìn)行預(yù)測(cè)。取1983-2013年的18組數(shù)據(jù),設(shè)定2013年的數(shù)據(jù)為零誤差數(shù)據(jù),其余同上,獲得的擬合方程:

      g(xi)=403.336 53(xi-1 982)1.123753-186.985 37e0.083832(xi-1982)。

      將x19=2014帶入上式,得預(yù)測(cè)結(jié)果g(2014年)=17 084.7(萬(wàn)),按照1∶1.6的比率,農(nóng)民工總量為2.73億;該結(jié)果有待2015年驗(yàn)證。

      3.4 Richards曲線分析

      圖1中Richards模型是表2數(shù)據(jù)及數(shù)據(jù)處理結(jié)果的曲線形式轉(zhuǎn)化,圖中橫坐標(biāo)為年份,縱坐標(biāo)是人口數(shù)(萬(wàn)人)。

      圖1中曲線1是Richards曲線:

      在定義區(qū)間[1983,2013年]內(nèi),Richards曲線是一條無(wú)極值(極小和極大)的單增曲線。

      圖1中ARichards模型曲線2是Richards曲線的變化率曲線,即f(x)的1階導(dǎo)函數(shù)f′(x)曲線,因?yàn)橹皇嵌ㄐ哉f(shuō)明問(wèn)題,略去了該曲線的數(shù)值標(biāo)定,即沒(méi)有給出曲線2的縱坐標(biāo)數(shù)值。曲線2表明Richards曲線的變化率曲線是一條含有一個(gè)極大值的駝峰狀曲線,計(jì)算表明f′(x)曲線在x=1 994.8處獲得極大值,相當(dāng)于Richards曲線f(x)在1995年處出現(xiàn)一個(gè)變化的拐點(diǎn)。拐點(diǎn)的出現(xiàn)使Richards曲線由逐步加快的遞增變?yōu)橹鸩綔p慢的遞增。

      圖1 我國(guó)外出農(nóng)民工數(shù)量的擬合曲線

      3.5 冪指數(shù)+指數(shù)曲線分析

      圖1冪指數(shù)+指數(shù)混合模型中的曲線1是冪指數(shù)+指數(shù)曲線:

      g(x)=338.2388(x-1 982)1.187315-124.48e0.104837(x-1982)。

      g(x)曲線與Richards曲線不同之處在于,在定義區(qū)間[1983,2013年]內(nèi),g(x)曲線雖然也是一條無(wú)極值(極小和極大)的單增曲線,在它的延伸部分,在區(qū)間外的x=2 021.2,相當(dāng)于2021年將出現(xiàn)一個(gè)極大值g(2 021.2)=18 777,預(yù)示外出農(nóng)民工在2021年將達(dá)到最大值18 777萬(wàn),之后將緩慢下降。圖1冪指數(shù)+指數(shù)混合模型中曲線2是g(x)曲線的變化率曲線g′(x),這是一條含有一個(gè)極大值的駝峰狀曲線,但峰值出現(xiàn)點(diǎn)位與Richards變化率曲線略有差異。計(jì)算表明g′(x)曲線在x=1 998.4處獲得極大值,相當(dāng)于g(x)曲線1998年處出現(xiàn)一個(gè)變化的拐點(diǎn)。拐點(diǎn)的出現(xiàn)使冪指數(shù)+指數(shù)曲線由逐步加快的遞增變?yōu)橹鸩綔p慢的遞增。

      3.6 曲線分析的綜合

      Richards曲線和冪指數(shù)+指數(shù)曲線得出的結(jié)論略有不同,Richards曲線顯示,當(dāng)時(shí)間→∞,外出農(nóng)民工數(shù)量為2.8億,這既難以驗(yàn)證也超出現(xiàn)實(shí)的可能。農(nóng)民工的出現(xiàn)具有歷史局限性,必將伴隨歷史的前進(jìn)而消失,所以該值不具有參考性,可以除去。綜合2個(gè)生長(zhǎng)模型給出的結(jié)論可歸結(jié)為,1983-2013年的31年間,我國(guó)外出農(nóng)民工數(shù)量的變化是一個(gè)不存在極值(極大或極?。┑摹⑦B續(xù)遞增的發(fā)展,在發(fā)展過(guò)程中的1995-1998年出現(xiàn)了變化的拐點(diǎn),由逐步加快的遞增變?yōu)橹鸩綔p慢的遞增,這種增長(zhǎng)率的變慢必將產(chǎn)生效應(yīng),外出農(nóng)民工將在2021年左右出現(xiàn)最大值1.877 7億,按1.6倍率推算,農(nóng)民工總數(shù)為3.00億,之后農(nóng)民工數(shù)量將逐漸減少。

      31年來(lái)外出農(nóng)民工缺失的數(shù)據(jù)可用數(shù)學(xué)上的內(nèi)插法加以補(bǔ)齊,表3是按照冪指數(shù)+指數(shù)混合增長(zhǎng)模型,在最小一乘準(zhǔn)則下計(jì)算的結(jié)果。數(shù)據(jù)獲得的曲線擬合誤差為0.5%,最大誤差為1.98%,所以在實(shí)際應(yīng)用中,若考慮到統(tǒng)計(jì)學(xué)的隨機(jī)誤差,帶有?號(hào)或??的數(shù)據(jù)其誤差允許在±0.5%范圍內(nèi)波動(dòng),其中個(gè)別數(shù)據(jù)波動(dòng)的最大范圍不得超過(guò)±1.98%。

      表3 1983-2013年外出農(nóng)民工數(shù)量變動(dòng)情況

      4 小結(jié)

      最小一乘法解的實(shí)現(xiàn)過(guò)程,是一種代表式的選取方式,我國(guó)外出農(nóng)民工數(shù)量變化數(shù)據(jù)雖然缺失但仍存有重要數(shù)據(jù),將二者之間建立緊密的關(guān)聯(lián),使重要數(shù)據(jù)成為代表數(shù)據(jù),彌補(bǔ)了數(shù)據(jù)缺失的不足。通過(guò)數(shù)據(jù)處理、數(shù)據(jù)分析、實(shí)踐驗(yàn)證等多個(gè)環(huán)節(jié),得出如下結(jié)論。

      1983-2013年我國(guó)外出農(nóng)民工的數(shù)據(jù)雖然只有18個(gè),但因存有高置信度的權(quán)威數(shù)據(jù),這使得缺失的數(shù)據(jù)、矛盾的數(shù)據(jù)可以通過(guò)最小一乘法得以補(bǔ)缺及糾正。

      31年來(lái)農(nóng)民工數(shù)量的變化規(guī)律可以用Richards生長(zhǎng)模型和冪指數(shù)+指數(shù)混合生長(zhǎng)模型來(lái)描述。31年來(lái)我國(guó)外出農(nóng)民工的增長(zhǎng)是一個(gè)不存在峰或谷的連續(xù)增長(zhǎng),在增長(zhǎng)過(guò)程中,1995-1998年出現(xiàn)了變化的拐點(diǎn),使原先逐步加快的增長(zhǎng)變?yōu)橹鸩綔p慢的增長(zhǎng)。

      2014年我國(guó)外出農(nóng)民工數(shù)量將達(dá)1.71億,按照1∶1.6比率推算,農(nóng)民工總數(shù)約為2.73億;我國(guó)外出農(nóng)民工數(shù)量將在2021年左右出現(xiàn)峰值1.88億,按1.6倍率推算,農(nóng)民工總數(shù)為3.00億,之后農(nóng)民工數(shù)量將逐漸趨于減少。

      31年來(lái)外出農(nóng)民工缺失的數(shù)據(jù)可用數(shù)學(xué)上的內(nèi)插法加以補(bǔ)齊,在實(shí)際應(yīng)用中,數(shù)據(jù)誤差允許在一定范圍內(nèi)波動(dòng)。

      [1] 朱信凱.農(nóng)民市民化的國(guó)際經(jīng)驗(yàn)及對(duì)我國(guó)農(nóng)民工問(wèn)題的啟示[J].中國(guó)軟科學(xué),2005(1):28-34.

      [2] 國(guó)務(wù)院研究室課題組.中國(guó)農(nóng)民工調(diào)研報(bào)告[M].北京:中國(guó)言實(shí)出版社,2006.

      [3] 我國(guó)農(nóng)民工工作“十二五”發(fā)展規(guī)劃綱要研究課題組.中國(guó)農(nóng)民工問(wèn)題總體趨勢(shì):觀測(cè)“十二五”[J].改革,2010(8):5-29.

      [4] 王萍萍,張毅,彭麗荃,等.新生代農(nóng)民工的數(shù)量,結(jié)構(gòu)和特點(diǎn)[EB/OL].(2011?03?10)[2012?04?14].http://www.my 12340.cn/article.aspx.

      [5] 陳書(shū)偉.外出農(nóng)民工流動(dòng)態(tài)勢(shì)及潛在數(shù)量測(cè)算[J].廣東技術(shù)師范學(xué)院學(xué)報(bào),2013,34(2):99-102.

      [6] 顧樂(lè)民.曲線擬合的最小一乘法[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2011,39(9):1377-1382.

      [7] 顧樂(lè)民.曲線擬合的廣義最小一乘法[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2011,41(19):107-113.

      [8] 程毛林.Richards模型參數(shù)估計(jì)及其模型應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2010,40(12):139-143.

      [9] 統(tǒng)計(jì)局.2012年全國(guó)農(nóng)民工總量達(dá)26261萬(wàn)人[EB/OL].(2013?05?27).http://finance.people.com.cn/n/2013/0527/c1004-21624982.html.

      [10] 國(guó)家統(tǒng)計(jì)局.2013年國(guó)民經(jīng)濟(jì)發(fā)展穩(wěn)中向好[EB/OL].(2014?01?20).http://www.stats.gov.cn/tjsj/zxfb/201401/t20140120_502082.html.

      [11] 顧樂(lè)民.預(yù)測(cè)型切比雪夫多項(xiàng)式[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(7):34-38.

      (責(zé)任編輯:高 峻)

      C 921

      A

      0528?9017(2015)01?0130?07

      2014?08?28

      顧樂(lè)民(1952-),男,江蘇射陽(yáng)人,研究方向?yàn)樽罴驯平砑捌鋺?yīng)用。E?mail:gulemin@#edu.cn。

      猜你喜歡
      冪指數(shù)曲線擬合乘法
      源于學(xué)生試題疑問(wèn)的數(shù)學(xué)建模例談
      算乘法
      部分相干冪指數(shù)相位渦旋光束的傳輸特性研究*
      我們一起來(lái)學(xué)習(xí)“乘法的初步認(rèn)識(shí)”
      《整式的乘法與因式分解》鞏固練習(xí)
      把加法變成乘法
      曲線擬合的方法
      基于曲線擬合的投棄式剖面儀電感量算法
      基于逼近理想點(diǎn)冪指數(shù)評(píng)估的防空導(dǎo)彈型譜分析與研究
      一類度互質(zhì)的無(wú)標(biāo)度網(wǎng)絡(luò)研究
      考試周刊(2016年99期)2016-12-26 10:54:30
      炉霍县| 西乡县| 济南市| 隆回县| 仪陇县| 自贡市| 南靖县| 长宁县| 都安| 开远市| 镇坪县| 民乐县| 穆棱市| 扬中市| 鄄城县| 柘荣县| 东阿县| 霍山县| 怀远县| 太和县| 普陀区| 辽源市| 临夏县| 贡觉县| 恩施市| 葫芦岛市| 肇东市| 东丽区| 留坝县| 泸州市| 巴林左旗| 石阡县| 长岭县| 聂荣县| 江山市| 白银市| 泰安市| 绥滨县| 宜宾市| 屯昌县| 铜梁县|