王二院
(中國(guó)人民公安大學(xué),北京 100038)
以“警力資源配置”為關(guān)鍵詞,以“網(wǎng)頁”為對(duì)象,“百度一下”后找到相關(guān)結(jié)果約244 000個(gè)。第一篇為中國(guó)人民公安大學(xué)姜博,任亞丁的《警力資源配置問題淺析》,北京人民警察學(xué)院學(xué)報(bào),2004年5月第3期。
谷歌搜索的結(jié)果為“所有結(jié)果找到約77 000條”結(jié)果。第一篇為謝子傳的《論警力資源優(yōu)化配置的若干問題》,發(fā)表日期:2007-12-7 2:25:12。來源:中思網(wǎng)。
筆者曾經(jīng)公開發(fā)表過3篇警力資源配置方面的論文,參考文獻(xiàn)[1]、[2]為其中兩篇。
當(dāng)前關(guān)于警力資源配置的文獻(xiàn)多數(shù)認(rèn)為中國(guó)警力資源不足,主張?jiān)黾拥拇胧┛梢苑譃閮蓚€(gè)方面,一是增加民警的絕對(duì)數(shù)量,二是提高民警的內(nèi)在素質(zhì)。本文研究的目的在于組織內(nèi)部警力資源的二次配置,即民警的絕對(duì)數(shù)量和內(nèi)在素質(zhì)不變的前提下進(jìn)行二級(jí)組織之間的定量調(diào)整。
多元線性回歸模型的理論內(nèi)容包括4個(gè)方面:多元線性回歸方程;參數(shù)估計(jì);顯著性檢驗(yàn);估計(jì)標(biāo)準(zhǔn)誤差。
2.1.1 多元線性回歸模型的一般形式
設(shè)因變量Y由k個(gè)自變量 Xj(j=1,2,…,k)共同決定,則:
2.1.2 多元線性回歸模型的基本假設(shè)[3]106-107
①解釋變量Xj是確定性變量,不是隨機(jī)變量。②解釋變量之間互不相關(guān),即無多重共線性,否則無法估計(jì)回歸模型。③隨機(jī)誤差項(xiàng)服從均值為0、同方差的正態(tài)分布。④隨機(jī)誤差項(xiàng)不存在序列相關(guān)關(guān)系。⑤隨機(jī)誤差項(xiàng)與解釋變量之間不相關(guān)。
利用與一元回歸類似的最小二乘法可以得到總體參數(shù)的估計(jì)量和估計(jì)值。雖然計(jì)算過程要復(fù)雜一些,但用計(jì)算機(jī)很容易得到計(jì)算結(jié)果。在多元回歸中對(duì)回歸系數(shù)的解釋有所不同。例如變量X1的回歸系數(shù) b1應(yīng)解釋為:當(dāng) X2,X3,…,Xk不變時(shí),X1每變動(dòng)一個(gè)單位因變量Y的平均變動(dòng)量。
設(shè):
2.3.1 擬合優(yōu)度
擬合優(yōu)度R2在多元回歸中也稱為多重決定系數(shù)(multiple coefficient of determination),它反映回歸直線的擬合程度,取值范圍在[0,1]之間。R2→1,說明回歸方程擬合得越好;R2→0,說明回歸方程擬合得越差。
可以證明式(8)成立。
在多元回歸中,比較自變量個(gè)數(shù)不同的方程的擬合效果時(shí)多使用修正的判定系數(shù)(adjusted multiple coefficient of determination):
若dU<DW<4-dU(dU為DW的上臨界值),則誤差項(xiàng) μ1,μ2,…,μk之間無自相關(guān)。
2.3.5 多重共線性診斷
記R2為自變量xj對(duì)其余k-1個(gè)自變量的復(fù)決定系數(shù),定義方差擴(kuò)大因子VIF如下:
一般情況下,若VIF<10,則檢驗(yàn)通過。
多元線性回歸中的估計(jì)標(biāo)準(zhǔn)誤差是對(duì)誤差項(xiàng)ε的標(biāo)準(zhǔn)差σ的一個(gè)估計(jì)值。
式中k為模型中自變量的個(gè)數(shù)。
某市公安局下轄16個(gè)分局,由于各分局忙閑不均,市局黨委決定對(duì)全局警力進(jìn)行重新配置。假設(shè)條件有二:(1)總警力不變;(2)單個(gè)民警無差異。
表1的主要數(shù)據(jù)是某年各分局實(shí)有警力資源數(shù)和影響分局警力資源數(shù)量的4個(gè)因素。它們分別是:(1)各分局現(xiàn)有警力(y);(2)110報(bào)警數(shù)(次);(3)常住人口 (萬人);(4)刑事案件發(fā)案數(shù)(起);(5)勤務(wù)工作(人次)。根據(jù)表1的數(shù)據(jù),建立某市公安局警力資源配置模型,要求以(2)110報(bào)警數(shù);(3)常住人口;(4)刑事案件發(fā)案數(shù);(5)勤務(wù)工作為自變量,建立多元線性回歸模型。
根據(jù)問題要求,選擇多元線性回歸模型。
利用“IBM SPSS Statistics V19.0”[4]140-144生成表2和表3。
表1 某市公安局警力資源配置基礎(chǔ)數(shù)據(jù)表
表2 皮爾遜相關(guān)系數(shù)表
表2顯示刑事案件發(fā)案數(shù)與常住人口之間的皮爾遜相關(guān)系數(shù)為0.942,勤務(wù)工作與110報(bào)警數(shù)之間的皮爾遜相關(guān)系數(shù)為0.861,刑事案件發(fā)案數(shù)與110報(bào)警數(shù)之間的皮爾遜相關(guān)系數(shù)為0.771。
表2和表3都說明影響分局警力資源數(shù)量的4個(gè)自變量之間存在多重共線性,必須對(duì)變量進(jìn)行篩選。
打開“IBM SPSS Statistics V19.0”,依次單擊菜單欄中的【Analyze(分析)】→【Regression(回歸)】→【Linear(線性)】命令,彈出【Linear Regression(線性回歸)】對(duì)話框。將y變量選入“Dependent”欄后,需要將變量 x1,x2,x3,x4,同時(shí)選入“Independent(s)”欄。在【Method(方法)】選項(xiàng)組中選擇自變量的進(jìn)入方式【Stepwise(逐步)】。詳細(xì)選項(xiàng)如圖1,最后點(diǎn)擊“確定”。
表3 多重共線性診斷表
圖1 回歸分析選項(xiàng)圖
以下表4至表8共5張表均由SPSS生成。
表4顯示模型1只包含一個(gè)自變量“110報(bào)警數(shù)”,模型2只包含兩個(gè)自變量:“110報(bào)警數(shù)”和“勤務(wù)工作”。表4還顯示了設(shè)定引入和刪除變量的條件。
表5顯示了各個(gè)模型的擬合情況。模型2的復(fù)相關(guān)系數(shù) R=0.962,判定系數(shù) R Square=0.926,修正的判定系數(shù)Adjusted R Square=0.915,估計(jì)值的標(biāo)準(zhǔn)誤差Std.Error of the Estimate=507.963。表5最后一列顯示的是隨機(jī)誤差項(xiàng)序列自相關(guān)檢驗(yàn)情況。
表4 自變量進(jìn)入方式
表5 模型匯總表
表6顯示了各個(gè)模型的方差分析結(jié)果。模型2的 SSR=42 204 011.580,SSE=3 354 338.420,F(xiàn)=81.782,P=0.000。線性回歸方程顯著[5]。
表7顯示了各個(gè)模型的回歸系數(shù)。模型2的常數(shù)項(xiàng)(Constant)=420.268,“110 報(bào)警數(shù)”的回歸系數(shù)=0.035,回歸系數(shù)的標(biāo)準(zhǔn)誤差(Std.Error)=0.010 ,t檢驗(yàn)值 =3.393 ,P=0.005;“勤務(wù)工作”的回歸系數(shù)=0.042,回歸系數(shù)的標(biāo)準(zhǔn)誤差(Std.Error)=0.010 ,t檢驗(yàn)值 =3.357,P=0.005。按照α=0.05的水平,可以認(rèn)為兩個(gè)偏回歸系數(shù)都顯著有意義[3]93-135。模型2的回歸方程為
表6 方差分析表
根據(jù)求解參數(shù)過程中得到的計(jì)算結(jié)果可知,多元線性回歸模型的如下檢驗(yàn)均獲通過:1)擬合優(yōu)度R2檢驗(yàn)(表5);2)F檢驗(yàn)(表6);3)t檢驗(yàn)(表7);4)D-W檢驗(yàn)(表5);5)多重共線性檢驗(yàn)(表7)。
表7 回歸系數(shù)表
式(17)中變量x1的回歸系數(shù)為0.035,其統(tǒng)計(jì)含義:在“勤務(wù)工作”不變的條件下,“110報(bào)警數(shù)”每上升1個(gè)單位(次),分局警力“平均”上升0.035個(gè)單位(人);變量x4的回歸系數(shù)為0.042,說明在“110報(bào)警數(shù)”不變的條件下,“勤務(wù)工作”每上升1個(gè)單位(人次),分局警力就會(huì)“平均”上升0.042個(gè)單位(人)。
利用“IBM SPSSStatistics V19.0”生成表8。
表8顯示了非標(biāo)準(zhǔn)化的預(yù)測(cè)值和殘差。第2行數(shù)據(jù)6672表示B1分局現(xiàn)有警力數(shù),6264表示使用模型2計(jì)算得到的B1分局理想警力數(shù),408表示使用模型2計(jì)算得到的B1分局應(yīng)當(dāng)調(diào)出的警力數(shù)。表8中第6列數(shù)據(jù)即市局警力資源配置的主要依據(jù),正數(shù)表示調(diào)出的警力數(shù),負(fù)數(shù)表示調(diào)入的警力數(shù)。其中B6分局應(yīng)當(dāng)調(diào)出的警力數(shù)最多,為719人;B4分局應(yīng)當(dāng)調(diào)入的警力數(shù)最多,為839人。
多元線性回歸模型是進(jìn)行警力資源配置非常理想的數(shù)學(xué)模型,但在應(yīng)用過程中必須通過5種檢驗(yàn),對(duì)多重共線性和序列自相關(guān)性給予適當(dāng)?shù)奶幚怼?/p>
表8 非標(biāo)準(zhǔn)化的預(yù)測(cè)值和殘差表
多重共線性問題是違背解釋變量不相關(guān)假設(shè)所導(dǎo)致的問題。如果違背基本假設(shè),則模型的參數(shù)無法估計(jì),必須去掉一個(gè)自變量。表2顯示刑事案件發(fā)案數(shù)與常住人口之間,勤務(wù)工作與110報(bào)警數(shù)之間均存在高度多重共線性問題。此時(shí),雖然不違背OLS的基本假設(shè),正規(guī)方程仍有唯一解,OLS仍然是BLUE(Best Linear Unbiased Estimate)的,但是 t檢驗(yàn)值會(huì)減小、系數(shù)的顯著性下降。多重共線性問題會(huì)導(dǎo)致F檢驗(yàn)顯著,但所有回歸系數(shù)的t檢驗(yàn)卻不顯著,甚至回歸系數(shù)的符號(hào)與其經(jīng)濟(jì)意義相反。
在多元回歸中,預(yù)先選定的自變量不一定都對(duì)Y有顯著的影響。SPSS軟件提供了多種篩選自變量的方法[4]161-165:(1)“向前引入法(Forward)”;2)“向后剔除法(Backward)”;3)“逐步引入—剔除法(Stepwise)”。其中第3種方法比較理想,其思路是在每一步中都要對(duì)引入變量的顯著性作檢驗(yàn),僅當(dāng)其顯著時(shí)才引入,而每引入一個(gè)新變量后,對(duì)前面已引進(jìn)的變量又要逐一檢驗(yàn),一旦發(fā)現(xiàn)某變量變得不顯著了,就要將它剔除。這些步驟反復(fù)進(jìn)行,直到引入的變量都是顯著的而沒有引入的變量都是不顯著的時(shí),就結(jié)束挑選變量的工作。
如果預(yù)先選定的自變量較多,應(yīng)該利用聚類分析生成數(shù)量較少的幾個(gè)新自變量。
OLS估計(jì)需要隨機(jī)誤差項(xiàng)滿足同方差和序列不相關(guān)假設(shè),否則就會(huì)產(chǎn)生異方差和序列相關(guān)的問題。
1)異方差。當(dāng)回歸模型隨機(jī)誤差項(xiàng)μ的方差不為常數(shù)時(shí),即為異方差(Heteroscedasticity)現(xiàn)象。異方差問題是違背同方差假設(shè)的結(jié)果,當(dāng)異方差出現(xiàn)時(shí),回歸模型的估計(jì)量不再具有最小方差的性質(zhì),因此不再保持有效性;同時(shí),t檢驗(yàn)也失效,無法對(duì)回歸系數(shù)的顯著性進(jìn)行檢驗(yàn)[6]。
2)序列相關(guān)。隨機(jī)誤差項(xiàng)之間的協(xié)方差不為零時(shí),即存在序列相關(guān)(Serial Correlation),又稱自相關(guān)。序列相關(guān)問題是違背序列不相關(guān)假設(shè)的后果,此時(shí)普通最小二乘估計(jì)量仍為無偏估計(jì)量,但不再具有最小方差的性質(zhì),即不是“最優(yōu)線性無偏估計(jì)量”;回歸系數(shù)的顯著性檢驗(yàn)失效。
多元線性回歸模型是進(jìn)行警力資源配置非常理想的數(shù)學(xué)模型,但在應(yīng)用過程中必須通過5種檢驗(yàn),對(duì)多重共線性和序列自相關(guān)性給予適當(dāng)?shù)奶幚?。?yīng)用多元線性回歸模型進(jìn)行警力資源配置的程序可以劃分為6個(gè)步驟:①確定問題;②準(zhǔn)備數(shù)據(jù);③選擇模型;④求解參數(shù);⑤檢驗(yàn)?zāi)P?⑥配置警力。
[1] 饒俊新,曲京璞,王二院.優(yōu)化警力配置的四個(gè)突破口[J].公安研究,2003(11):45-49.
[2] 饒俊新,曲京璞,王二院.關(guān)于運(yùn)用定量分析方法科學(xué)配置警力資源的思考[J].貴州警官職業(yè)學(xué)院學(xué)報(bào),2003,15(6):72-75.
[3] 汪冬華.多元統(tǒng)計(jì)分析與SPSS應(yīng)用[M].上海:華東理工大學(xué)出版社,2010:106-107.
[4] 王璐,王沁.SPSS統(tǒng)計(jì)分析基礎(chǔ)、應(yīng)用與實(shí)戰(zhàn)精粹[M].北京:化學(xué)工業(yè)出版社,2012:140-144.
[5] 賈俊平.統(tǒng)計(jì)學(xué)[M].清華大學(xué)出版社,2006:400-420.
[6] 李子強(qiáng).概率論與數(shù)理統(tǒng)計(jì)教程[M].2版.北京:科學(xué)出版社,2008:247-248.