孫澤宇 張敬淳 姜欣欣
摘要:很多APP如果定價不合理會使任務無人問津,從而導致商品檢查失敗,基于MATALAB平臺利用定價多元線性回歸模型、經(jīng)緯度多元線性回歸模型、非線性規(guī)劃等知識,成功解決了問題,并制定合理的方案。
關鍵詞:多元線性回歸模型;MATLAB;非線性規(guī)劃;正態(tài)分布
1合理定價問題說明
“拍照賺錢”是在移動互聯(lián)網(wǎng)下的一種新型的自助服務模式,用戶下載APP,并成功注冊成為會員后,可以在APP上領取任務并獲得酬金。這種基于移動互聯(lián)網(wǎng)的自助式勞務眾包的模式與傳統(tǒng)模式相比,節(jié)約了企業(yè)采集數(shù)據(jù)的成本,但是提高了數(shù)據(jù)的準確性。這種模式更加方便快捷,用戶只需注冊APP,但APP定價是關鍵問題,一旦定價不合理,會導致很多問題,定價過高會增加企業(yè)成本,過低會使任務無人問津。所以根據(jù)已給數(shù)據(jù),判斷已結束項目任務的定價是否合理,對方案進行評價,分析任務不能完成原因,制定相應的合理方案。
2問題分析
任務的定價可以直接影響任務的執(zhí)行情況,任務的GPS經(jīng)緯度可直接影響任務的定價,從而任務的GPS經(jīng)緯度間接影響任務的執(zhí)行狀況。因而,用MATLAB軟件繪制不同的經(jīng)緯度對任務執(zhí)行狀況的影響,首先對模型進行假設,假設模型為多元線性回歸模型,經(jīng)過驗證得出結論,并確定最終的模型,找到任務定價規(guī)律,并分析任務不能完成的原因[1]。
對模型做出如下假設:假設任務是獨立選取的;假設定價升高到一定程度時,由于經(jīng)緯度等原因沒有人去完成該項任務;假設經(jīng)緯度通過直接影響價格,進而間接影響任務的完成情況,其中的符號說明見表1。
3模型的建立
問題一:對于所有給出數(shù)據(jù)進行回歸分析是有問題的,所以需要對數(shù)據(jù)進行預處理。數(shù)據(jù)預處理的一種方法是將APP的任務定價按照已給出的定價進行歸類分組,并統(tǒng)計不同定價下的任務完成情況,及任務完成占分配的總任務的比例(以下簡稱任務完成比例)[2]。為了方便起見,將定價分為20個所給出的固定值,分類后的數(shù)據(jù)如表2所示。
由圖1可知,在[65,70.5]隨著定價的上升,任務完成比例也隨之逐漸增加,在[70.5,75]內,隨著定價的增加,任務的完成比例卻逐漸降低,而[75,85]范圍內任務完成比例在無規(guī)律浮動,可見定價在75以內,由價格水平影響任務完成比例,而定價超出75,可能由經(jīng)緯度或其他因素影響著任務完成比例。
分析經(jīng)緯度對任務完成情況的間接影響,假設經(jīng)緯度與定價之間成線性關系,價格y與經(jīng)度x1,緯度x2之間的多元線性回歸模型為:
y=a0+a1x1+a2x2+
其中a0,a1,a2為待估計回歸系數(shù),ε為隨機誤差。利用MATLAB軟件得出回歸系數(shù)及其置信區(qū)間(α=0.05)、檢驗統(tǒng)計量R2,F(xiàn),p,S2的結果,如表3所示。
由表3可知,R2=0.0148,即因變量僅有1.48%可由模型決定,所以經(jīng)緯度與定價之間的關系為非線性關系[3]。其多元非線性回歸方程為y=-4.2714+2.4847x1+0.0013x2^2。
任務未完成的原因有兩點,一是如圖2所示,將原圖像和所求散點圖兩者進行比較,在所求圖像上方的點為定價偏低,反之,在所求圖像下方的點即為定價偏高。即為任務標價不合理(w= -4.8036+0.1338y-0.0008y^2;w表示任務完成比例,y表示定價)。二是所有已完成和任務總數(shù)均為0的點,由MATLAB編程可得圖3。由圖3可知,經(jīng)緯度較近的位置任務完成情況相對較好,而任務未完成情況則主要分布在經(jīng)度較高緯度較低地帶和經(jīng)度較低緯度較高地帶。而[75,80]僅在任務標價定為75,80,85時才有已完成的項目比例,由此可見任務標價在[75,80]中,項目的遠近程度和難易程度差異較大,即任務標價定為75,80,85時的任務相對距離較近或較為容易,從而導致更多的人去選擇這三個任務標價的任務去完成。