任文武 靳洪震
摘 要:本文針對(duì)"拍照賺錢"的任務(wù)定價(jià)問題,采用逐步回歸的方法從4個(gè)影響指標(biāo)中挑選出影響顯著的指標(biāo)來(lái)建立回歸模型。分析出任務(wù)與會(huì)員之間的距離以及會(huì)員的位置對(duì)任務(wù)定價(jià)的回歸模型影響顯著,發(fā)現(xiàn)任務(wù)位置越偏僻、會(huì)員與任務(wù)之間的距離越大從而導(dǎo)致任務(wù)定價(jià)越高。因此在對(duì)任務(wù)定價(jià)時(shí),首先要考慮任務(wù)的位置,任務(wù)位置越偏,則任務(wù)定價(jià)越高;其次考慮會(huì)員與任務(wù)的距離,任務(wù)與會(huì)員距離越大,任務(wù)定價(jià)也會(huì)相應(yīng)提高。
關(guān)鍵詞:逐步回歸分析 最小二乘法
0 引言
“拍照賺錢”是眾包形式下移動(dòng)互聯(lián)網(wǎng)的一種自助式服務(wù)模式。這種基于移動(dòng)互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺(tái),為企業(yè)提供各種商業(yè)檢查和信息搜集,相比傳統(tǒng)的市場(chǎng)調(diào)查方式可以大大節(jié)省調(diào)查成本,而且有效地保證了調(diào)查數(shù)據(jù)真實(shí)性,縮短了調(diào)查的周期。因此APP成為該平臺(tái)運(yùn)行的核心,而APP中的任務(wù)定價(jià)又是其核心要素。如果定價(jià)不合理,有的任務(wù)就會(huì)無(wú)人問津,而導(dǎo)致商品檢查的失敗。因此制定合理的定價(jià)方案具有重要意義。
1 模型的建立與求解
本文設(shè)計(jì)新的任務(wù)定價(jià)方案,并和原方案進(jìn)行比較。即需要對(duì)原方案進(jìn)行優(yōu)化,我們分為以下幾個(gè)步驟進(jìn)行求解。
由于影響因變量的因素可能很多,且個(gè)別因素對(duì)因變量的影響很小,那么誤差平方和不會(huì)由于包含這些因素而減少,相反會(huì)因?yàn)橐蛩氐脑黾涌赡苁拐`差變得更大,影響了整體的穩(wěn)定性。故針對(duì)此問題本文采用逐步回歸的方法從諸多影響因素中挑選出影響顯著的因素來(lái)建立回歸模型[1]。
1.1模型的建立
對(duì)于多元線性回歸模型 y=av+b ,在滿足模型經(jīng)典假設(shè)下可利用最小二乘估計(jì)法估計(jì)參數(shù), 參數(shù)估計(jì)量為 ,經(jīng)典假設(shè)是“沒有完全的多重共線性”, 但在現(xiàn)實(shí)經(jīng)濟(jì)問題分析中, 解釋變量間不可能完全線性無(wú)關(guān)。如果解釋變量v1,v2,v3…vi 之間存在線性相關(guān)關(guān)系, 則必有 ,從而 不存在,參數(shù)的最小二乘估計(jì)量不唯一,即最小二乘估計(jì)法失效, 此時(shí)模型存在多重共線性[2]。
逐步回歸分析法不僅可以對(duì)多重共線性進(jìn)行檢驗(yàn), 同時(shí)也是處理多重共線性問題的一種有效方法。采用逐步加入法來(lái)做分析。
STEP1:根據(jù)經(jīng)濟(jì)學(xué)規(guī)律或者相關(guān)主觀經(jīng)驗(yàn)分析,選出可能相關(guān)的自變量,設(shè)為v1,v2,v3…vi
STEP2:用每一個(gè)自變量分別對(duì)被解釋變量y建立回歸模型, 得到i個(gè)回歸模型
STEP3: STEP1進(jìn)行參數(shù)估計(jì), 并進(jìn)行檢驗(yàn), 選擇通過檢驗(yàn)的模型中殘差平方和最小的模型作為首選模型; 或選取擬和優(yōu)度最大的回歸方程作為首選模型。
STEP4:在首選模型中逐個(gè)增加其他解釋變量, 重新進(jìn)行線性回歸。若新增加的解釋提高了回歸方程的擬和優(yōu)度,且回歸方程中其他參數(shù)統(tǒng)計(jì)值仍然顯著, 就在模型中保留該解釋變量;若新增加的解釋變量沒有提高回歸方程的擬和優(yōu)度, 就不在模型中保留該解釋變量; 若新增加的解釋變量提高了回歸方程的擬和優(yōu)度, 但回歸方程中某些參數(shù)的數(shù)值或高了回歸方程的擬和優(yōu)度, 但回歸方程中某些參數(shù)的數(shù)值或符號(hào)等受到顯著影響, 說明模型中存在多重共線性。步驟為:
①對(duì)上述i- 1個(gè)模型分別進(jìn)行最小二乘估計(jì), 得到每個(gè)模型的擬和優(yōu)度和參數(shù)的 t 檢驗(yàn)統(tǒng)計(jì)量;
②將v1,v2,v3…vi分別帶入STEP2, 建立模型, 得到:
③進(jìn)行多重共線性分析, 如果加入新變量的模型中的系數(shù)數(shù)值甚至符號(hào)發(fā)生了重大變化, 以至結(jié)果無(wú)法接受, 則極可能存在多重共線性, 新變量不能引入模型;
④在多重共線性的模型或多重共線性不顯著的模型中,選擇對(duì)R2 進(jìn)行提高最顯著的那個(gè)模型, 進(jìn)行下一步驟;
⑤建立F 統(tǒng)計(jì)量:
,其中 n為樣本數(shù),Q(j) 表示模型包括j 個(gè)變量時(shí)的殘差平方和,給定顯著水平,查表得到Fa ;
⑥如果Fj>Fa ,則加入新變量,否則新變量不能加入;
⑦重復(fù)步驟①到⑥, 直到建立滿意的模型為止;
1.2模型的求解:
假設(shè)任務(wù)定價(jià)關(guān)于4個(gè)指標(biāo)之間的函數(shù)關(guān)系為:y=a1v1+a2v2+a3v3+a4v4+b
其中ai 為待估參數(shù),b為常量。用最小二乘法進(jìn)行估計(jì)得:
,參數(shù)v1、v2、v3、v4 對(duì)應(yīng)的p 值為0.46、0.47、0.008、0.097。對(duì)模型進(jìn)行white 異方差檢驗(yàn)得p=0.891 ,原假設(shè)H0 模型是同方差,接受原條件,即不存在異方差。序列相關(guān)性檢驗(yàn),DW=d=1.85 ,du=1.83 ,滿足du 雖然F0.05(,)= 運(yùn)用最小二乘法逐一求對(duì)各解釋變量的回歸估計(jì)方程[3],結(jié)果如表1所示 顯著水平取0.05時(shí),查得F(1,29) =4.18。 由于自變量v4 的 ,且參數(shù)估計(jì)的P 值偏大,說明v4對(duì)y 的回歸模型不顯著,表明會(huì)員信譽(yù)值與任務(wù)定價(jià)并無(wú)很大的聯(lián)系。 關(guān)于自變量v2 的回歸顯著性并不高,但對(duì)于變量v1 可以繼續(xù)進(jìn)入下一步回歸,選取各方面檢驗(yàn)結(jié)果達(dá)到較佳的v1為第一入選變量,去掉v4 對(duì)y的影響,做第二次回歸。 顯著水平取0.05時(shí),查表F0.05(2,28)=3.34,F(xiàn)0.05(1,28)=4.20 ,從表9中可以看出,隨著變量的逐個(gè)加入,變量y 方程的改進(jìn)基本不變。由于F1=42.1、F2=51.2 ,且都大于F0.05(1,18)=4.41 ,說明模型整體上是顯著的,對(duì)模型進(jìn)行white 異方檢驗(yàn)得p=0.87,認(rèn)為模型不存在方差;對(duì)模型進(jìn)行序列相關(guān)性檢驗(yàn),由于,DW=d=2.02,du=1.67 ,滿足du 參考文獻(xiàn): [1] 司守奎,《數(shù)學(xué)建模算法與應(yīng)用》[M],北京:國(guó)防工業(yè)出版社,2011.8. [2]賀江舟,龔明福,范君華,孫紅專,張利莉. 逐步回歸及通徑分析在主成分分析中的應(yīng)用[J]. 新疆農(nóng)業(yè)科學(xué),2010,47(03):431-437. [3] 李松臣,張世英. 基于逐步回歸法的人口出生率影響因素分析[J]. 統(tǒng)計(jì)與決策,2008,(04):7-9. [2017-09-17]. DOI:10.13546/j.cnki.tjyjc.2008.04.010