夏 昊, 宗序平
(揚州大學數(shù)學科學學院, 江蘇 揚州 225002)
21世紀以來, 數(shù)據(jù)更加多元化, 人們發(fā)現(xiàn)單純的空間自回歸模型所建立的回歸關(guān)系偏差較大, 且適用范圍有限,為了解決傳統(tǒng)的空間模型的弊端,變系數(shù)空間自回歸模型由此提出.變系數(shù)模型最早在1988年由Shumway[1]提出, 且關(guān)于變系數(shù)模型的估計方法和假設(shè)檢驗的相關(guān)研究已經(jīng)開展多年.Yatchew[2]系統(tǒng)地闡述了非參數(shù)模型的特點, 經(jīng)過大量數(shù)據(jù)模擬研究,發(fā)現(xiàn)非參數(shù)模型的優(yōu)點在于不依賴于固定函數(shù)的假設(shè),具有很強的適應(yīng)性和實用性; 在此基礎(chǔ)之上, Fan等[3]給出了α(·)的兩階段最小二乘估計方法, 并基于局部多項式研究了非參數(shù)的最優(yōu)收斂速度, 證明得到該方法收斂速度的最優(yōu)性; Pradhan等[4]利用廣義似然比檢驗了具有不同光滑變系數(shù)模型的正確性; Fan等[5]提出了半?yún)?shù)變系數(shù)模型, 而這一模型類似于線性模型中的混合模型, 既包含了變系數(shù)模型中回歸系數(shù)隨指標變量的改變而變化的情景,同時又考慮了回歸系數(shù)不變的情形,這也是目前處理多解釋變量模型至關(guān)重要的手段之一.在此啟發(fā)之下, Sun等[6]創(chuàng)造性地將變系數(shù)模型和空間自回歸模型結(jié)合起來, 構(gòu)建變系數(shù)空間自回歸模型, 這類模型可以處理具有空間相關(guān)性且波動性較大的數(shù)據(jù).經(jīng)過長時間的發(fā)展, Lee等[7]給出了變系數(shù)空間自回歸模型的參數(shù)估計理論, 可以解決潛在的非線性和異質(zhì)性關(guān)系[8], 在單純的空間自回歸模型基礎(chǔ)之上,討論空間數(shù)據(jù)更深層的含義(空間非平穩(wěn)性), 具有深刻的現(xiàn)實意義.本文擬以2017年中國31個省級行政區(qū)(不含港澳臺)為數(shù)據(jù)樣本,利用半?yún)?shù)變系數(shù)空間自回歸模型對5個影響因素進行可行性分析,探究教育水平發(fā)展的影響因素.
半?yún)?shù)空間變系數(shù)自回歸模型假設(shè)為
表1 模型的系數(shù)估計值
圖1為函數(shù)m(u)=6[u2+log(1+u)]的圖像及λ=0.6,β=2時函數(shù)的估計結(jié)果.從圖1可以看出, 模型的擬合情況良好,而不同常參數(shù)下模擬結(jié)果類似,擬合結(jié)果均較精確.因此,估計的變系數(shù)函數(shù)很好地恢復了函數(shù)的原貌,這也證實了估計方法的有效性和精確性.
圖1 函數(shù)m(u)=6[u2+log(1+u)]圖像與模擬結(jié)果
人均受教育年限Y是指某一特定年齡段人群P接受正規(guī)學歷教育年限的綜合平均數(shù), 統(tǒng)計公式為Y=E/P, 其中E指各種文化程度的人口乘以相對應(yīng)的受教育年數(shù)之和,P指6周歲及以上的人口總數(shù).本文考慮空間數(shù)據(jù)可能同時存在兩種關(guān)系, 利用SVMRSAR模型, 著重分析人口自然增長率p、城鄉(xiāng)人口比例u、性別比例s、人均教育投入e、師資配比t等因素對人均受教育年限的影響, 文中所有數(shù)據(jù)均來自2017年中國統(tǒng)計年鑒.
Moran指數(shù)是用來描述空間鄰近地區(qū)特征值相似程度的統(tǒng)計量, 對于某個區(qū)域觀測變量Y的全局Moran指數(shù)
由表2可知, 人口自然增長率、城鄉(xiāng)人口比例、人均教育投入的增加對教育水平的提高都有一定的推動作用,師生比的增加則會制約教育水平的發(fā)展,而人均教育投入與師資力量對教育水平發(fā)展的影響尤為顯著.
由表3可知, 性別比例對教育水平發(fā)展的影響具有空間非平穩(wěn)性.從統(tǒng)計年鑒的數(shù)據(jù)來看,我國各省男性占比均大于女性占比;從變系數(shù)估計來看,男性占比大對人均受教育年限的增長也有正向作用.若影響分為4個等級,其中影響最小的地區(qū)有北京、天津、上海等,影響稍強的地區(qū)有江蘇、浙江等,而性別占比對教育影響較強的地區(qū)為新疆、西藏、四川、重慶等,影響最為顯著的地區(qū)是江西和寧夏等.
圖2是31個省市人均受教育年限的觀測值和模型預測值(圖中各地區(qū)代碼見表4).圖3給出了標準化殘差, 圖中沒有顯示一定的趨勢性,表明數(shù)據(jù)具有齊次方差[10].
表2 模型常數(shù)參數(shù)的估計值
表3 性別比例對人均教育年限的影響
表4 地區(qū)代碼
圖2 人均受教育年限觀測值與預測值
圖3 原模型的標準化殘差圖