王 妍 朱家明 王欣宇 張一鳴
(1.安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030;2.安徽財經(jīng)大學(xué)金融學(xué)院,安徽 蚌埠 233030)
當今社會,隨著移動互聯(lián)網(wǎng)的發(fā)展,各種基于網(wǎng)絡(luò)平臺的APP應(yīng)運而生。“拍照賺錢”是移動互聯(lián)網(wǎng)下的一種自助式服務(wù)模式,用戶下載APP,注冊成為APP的會員,然后從APP上領(lǐng)取需要拍照的任務(wù),便可賺取APP對任務(wù)所標定的酬金。這種基于移動互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺,為企業(yè)提供了各種商業(yè)檢查和信息搜集,相比傳統(tǒng)的市場調(diào)查方式可以大大節(jié)省調(diào)查成本,而且有效地保證了調(diào)查數(shù)據(jù)的真實性,縮短了調(diào)查周期,成為當下發(fā)展的一種新潮流。這種基于移動互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺,APP是該平臺的運行核心。而APP中,任務(wù)定價又是整個APP運行的核心要素。如果定價不合理,有的任務(wù)就會無人問津,而導(dǎo)致任務(wù)的失敗。因此筆者對“拍照賺錢”任務(wù)的定價問題進行研究,從而分析任務(wù)未完成的原因并設(shè)計一套新的任務(wù)定價方案。
本文數(shù)據(jù)來源于2017年全國大學(xué)生數(shù)學(xué)建模競賽B題中附件一:已結(jié)束項目任務(wù)數(shù)據(jù);附件二:會員信息數(shù)據(jù);附件三:新項目任務(wù)數(shù)據(jù);2016年廣東省統(tǒng)計年鑒。為了便于研究問題,提出以下幾條假設(shè):⑴假設(shè)題目中的數(shù)據(jù)全部來自于同一款A(yù)PP,用戶不存在體驗感受上的差異;(2)假設(shè)所有會員領(lǐng)取的拍照任務(wù)均是親自拍攝所得,不存在他人遠程幫忙的可能;(3)假設(shè)每一位會員只有一個賬戶,不存在一位會員開設(shè)多個賬戶的情況;(4)假設(shè)在對所有任務(wù)進行區(qū)域劃分時,每一個任務(wù)都屬于某一區(qū)域內(nèi),不存在某一任務(wù)出現(xiàn)在區(qū)域邊界線上的情況。
為了探究任務(wù)定價規(guī)律與任務(wù)未完成的原因,首先為便于距離計算需將經(jīng)緯度的坐標轉(zhuǎn)化為二維距離。其次需要對數(shù)據(jù)進行分類整理,結(jié)合數(shù)據(jù)可視化圖表探究任務(wù)點的分布規(guī)律與價格分布規(guī)律;繼而建立任務(wù)定價模型,在模型中引入決定價格變化的參數(shù)并對模型的優(yōu)劣性進行驗證;最后對任務(wù)未完成的原因進行具體的分析。
2.2.1 經(jīng)緯度坐標到二維距離的轉(zhuǎn)換
由于任務(wù)點與會員的位置信息都是以經(jīng)緯度坐標給出的,而且任務(wù)與會員之間的經(jīng)緯度差距不大,緯度主要集中在北緯22.49308312~23.87839806度之間,經(jīng)度主要集中在東經(jīng)112.6832583~114.4936096度之間,經(jīng)緯度的差值過小,直接利用角度差表現(xiàn)距離會造成較大誤差。加之考慮到地球表面曲面性的特點,為了便于直觀地反映各個點之間的位置關(guān)系,需要參考GPS導(dǎo)航軟件中將經(jīng)緯度轉(zhuǎn)化為實際直線距離的原理,把各個點的經(jīng)緯度坐標轉(zhuǎn)化為直線距離[1]。原理如下:
地球赤道的周長是40075.04公里,則每度在赤道上的長度計算公式為:
結(jié)合位置點的經(jīng)緯度坐標,任意兩點的距離計算公式為:
其中,A、B表示需要計算距離的兩個點,λ表示緯度,φ表示經(jīng)度。
根據(jù)上述原理,利用MATLAB進行編程,分別得到任意兩個位置點之間的平面距離。
2.2.2 任務(wù)點的分布
首先為了實現(xiàn)數(shù)據(jù)可視化,便于直觀地看出結(jié)果,將任務(wù)點經(jīng)緯度坐標批量導(dǎo)入地圖規(guī)劃軟件中(本文使用的是地圖無憂平臺),將全部任務(wù)點坐標標注在地圖上,得到平面圖如圖1所示。
圖1 任務(wù)點地理位置分布圖
從圖1任務(wù)分布圖中可以直觀地看出,所有的任務(wù)點都分布在廣東省,并且任務(wù)點呈現(xiàn)聚類趨勢,集中分布在廣州、深圳、佛山、東莞四個城市。對任務(wù)點的經(jīng)緯度坐標進行聚類分析,得到四個任務(wù)點群體的中心坐標為:深圳(114.061355,22.629373)、廣州(113.252081,23.172494)、佛山(113.130199,23.034212)、東莞(113.755707,23.042726)。
2.2.3 任務(wù)點的價格分布
對附件一的數(shù)據(jù)進行整理。為便于計算,將23種價格分成四個分布區(qū)間,并得到如表1所示的各個價格區(qū)間任務(wù)的分布情況。
表1 任務(wù)價格區(qū)間分布
由表1可以看出,超過一半任務(wù)的價格集中在66~68價格區(qū)間內(nèi),68.5~75價格區(qū)間中的任務(wù)占38.6%,80~85價格區(qū)間的任務(wù)占總體任務(wù)的5%不到。
將不同價格區(qū)間的任務(wù)點分布反映在地圖上,得到如圖2所示的分布圖,其中紅色表示66~68價格區(qū)間的任務(wù),藍色表示68.5~71.5價格區(qū)間,紫色表示72~75價格區(qū)間,黑色表示價格是80和85的任務(wù)點。
圖2 不同價格區(qū)間內(nèi)的任務(wù)分布圖
從圖2可以看出:紅色的點集中在四個城市的中心區(qū)域,藍色和紫色的點沿道路向外分散在城市的郊區(qū)地帶,而黑色的點散亂分布,沒有明顯的分布規(guī)律。價格所呈現(xiàn)的特點為:任務(wù)集中在城市中心繁華地段時,定價會偏低,離市中心越遠,定價越高。
根據(jù)經(jīng)緯度坐標,對價格高的點進行數(shù)據(jù)挖掘,發(fā)現(xiàn)價格高的點一般都是政府機構(gòu)、銀行、高檔賓館和大型商貿(mào)城等,這說明價格高的任務(wù)可能與任務(wù)自身的難易與屬性有關(guān)系,并且數(shù)量較少,分布具有隨機性。
2.3.1 任務(wù)定價模型
根據(jù)上述對價格分布規(guī)律的探究,得出:任務(wù)的價格主要是受到任務(wù)點地理位置和任務(wù)自身的難度兩個因素的影響。將地理位置對任務(wù)價格的影響定義為某點的繁華程度,它受到人口密度情況和經(jīng)濟狀況的綜合作用,不同城市具有不同的取值且越偏遠的地方取值越小。將任務(wù)自身難度定義為任務(wù)點的特征屬性,它的出現(xiàn)與否具有隨機性,所以特征屬性需要與隨機虛擬變量(0-1變量)結(jié)合使用。
現(xiàn)給出任務(wù)定價模型:
其中,P表示任務(wù)的價格,70表示基礎(chǔ)價格,
為城市繁華度帶來的價格變動,wj表示各城市由人口密度、GDP、人均消費水平等因素通過層次分析法得到的各城市繁華度權(quán)重,fij表示城市j對任務(wù)i的繁華度指標,g表示價格波動影響參數(shù);λi為任務(wù)自身因素而帶來的價格變動,為0-1隨機變量且1出現(xiàn)的概率為5%,b為[0,20]的隨機數(shù)。
一個任務(wù)點的地理位置越靠近市中心,繁華程度參數(shù)越大,價格越低;當虛擬變量為1的時候,任務(wù)點因自身原因加價,價格越高。
2.3.2 模型的完善
首先,選取人均GDP、平均工資、人口密度、工業(yè)總產(chǎn)值這四個指標來衡量城市的繁榮程度。2016年的四個城市指標數(shù)值如表2所示。
表2 四個城市經(jīng)濟與人口的指標數(shù)值
然后,使用層次分析法[3],將決策問題分為三個層次:目標層O、準則層C、方案層 P,每層有若干個元素,如圖3所示。
圖3 層次分析圖
其中,目標層:城市繁華程度。
準則層:人均 GDP、平均工資、人口密度、工業(yè)總產(chǎn)值。
方案層:廣州、深圳、佛山、東莞四個城市。
綜合實際經(jīng)驗和參考文獻分析可近似得到以下系數(shù):
a12=1:2,a13=1:3,a14=1:4,a23=2:3,a24=2:4,a34=3:4,
從而得到正互反矩陣:
經(jīng)過MATLAB歸一化處理,得到標準化特征向量:
w=(0.2857,0.3571,0.1429,0.2143)
即四個城市的權(quán)值分別為:0.2857,0.3571,0.1429,0.2143。
其次,由于同一個城市不同的區(qū)域繁華程度也各有差異,任務(wù)點的分布主要集中在每個城市半徑30公里之內(nèi)。通過對任務(wù)點價格的分析,發(fā)現(xiàn)價格在同一個城市呈現(xiàn)向外遞增的趨勢,而且繁華程度每五公里遞減一個等級(即每五公里價格遞減0.5單位),并且部分點落在兩個不同的城市任務(wù)圈內(nèi)。
由于高價位任務(wù)分布存在隨機性的特點,且高價位的任務(wù)占總體的5%左右。按照固定的5%的比例,隨機設(shè)定高價位的任務(wù)點,即為0-1隨機變量且1出現(xiàn)的概率為5%,并設(shè)定他們的特征屬性值為[0,20]的隨機數(shù)。
根據(jù)模型參數(shù)設(shè)定規(guī)律,通過MATLAB軟件進行編程,對每個任務(wù)點利用上述任務(wù)定價模型進行定價計算,得到預(yù)測價格。由于數(shù)據(jù)過多,現(xiàn)給出部分任務(wù)點的原有價格與預(yù)測價格數(shù)據(jù),如表4所示。
表4 部分價格預(yù)測值與原有價格的比較
2.3.3 模型的檢驗
為了能直觀地反映我們給出的任務(wù)定價模型是否符合原有規(guī)律,做出原假設(shè):價格預(yù)測值與原有定價有顯著差異。利用SPSS將全部任務(wù)點的價格預(yù)測值與實際標價進行配對樣本的T檢驗[4],得到如表5所示的計算結(jié)果,結(jié)果拒絕原假設(shè)。
表5 成對樣本檢驗
(1)價位越高,完成率越低。根據(jù)表1任務(wù)價格區(qū)間分布情況可以看出,任務(wù)價格在65~68區(qū)間內(nèi)完成率為46.61017%,完成率最高。價格越高,完成率反而低,這可能與高價位任務(wù)難度大,地理位置偏遠,鮮有人特意為完成任務(wù)而到達某地有關(guān)。
(2)人均收入越高,完成率越低。結(jié)合已完成任務(wù)與未完成任務(wù)分布點的分布圖 (如圖4,紅色方塊表示未完成,紫色方塊表示已完成),可以看出東莞的任務(wù)完成率最高,廣州和佛山次之,深圳的任務(wù)完成率最低。綜合考慮城市的人均經(jīng)濟水平與邊際生產(chǎn)力分配理論,發(fā)現(xiàn)人均收入越大的地方,對任務(wù)的執(zhí)行率越低,即任務(wù)是否完成與地區(qū)的人均收入有關(guān)。
圖4 已完成與未完成任務(wù)分布圖
圖5 會員與未完成任務(wù)分布圖
(3)任務(wù)區(qū)域內(nèi)會員數(shù)量越少,完成率越低。通過對比未完成任務(wù)點的分布及會員位置的分布,不難看出,有些區(qū)域任務(wù)完成率低與會員分布稀少緊密相關(guān)。在局部地區(qū)軟件推廣不足,會員注冊人數(shù)較少,導(dǎo)致任務(wù)未完成,如圖5所示(其中紅色圓點表示未完成的任務(wù)分布,藍色星表示會員分布位置)。
(4)任務(wù)附近會員的信譽值越低,完成率越低。為了比較會員之間的差異,首先根據(jù)會員信譽值的大小將會員粗略地分成四類,然后根據(jù)四種不同的等級會員分布情況對比任務(wù)未完成點的分布圖,發(fā)現(xiàn)低等級會員分布越集中的地方任務(wù)未完成率越高,如圖6所示(灰色星代表會員信譽度較低的會員分布點,紅色表示未完成的任務(wù)分布)。
圖6 會員等級分布圖
首先綜合考慮會員的各項指標建立模糊綜合評價模型,將會員分成不同的等級,并賦予每個等級不同的數(shù)值,在原有的定價模型上加上會員等級這一新的影響因素。此時會員等級越高,可完成的任務(wù)數(shù)量越多,單價越低。最后利用所得的綜合得分對會員進行分級,再結(jié)合每一位會員的GPS經(jīng)緯度,便可得到四個城市會員的分級情況。
附件二中給出的會員指標存在多個,故先利用熵值法[3]對會員的幾個指標計算權(quán)重。
構(gòu)建原始指標矩陣。假設(shè)有m個會員,n項指標,則原始指標數(shù)據(jù)矩陣為:
為了消除各評價指標的量綱影響,需對原始數(shù)據(jù)進行無量綱化處理。對于正向指標,計算方法為:
對于負向指標,計算方法為:
式中:Xij為無量綱化后的數(shù)據(jù)值,maxXj和minXj分別為j項指標的最大值和最小值。
對無量綱化后的數(shù)據(jù)進行歸一化處理,方法為:
式中:gj為差異性系數(shù),ej為熵值。
選取附件二中會員的預(yù)定任務(wù)限額、預(yù)定任務(wù)所需時間、信譽值這三個指標,經(jīng)過MATLAB軟件編程,得到權(quán)重矩陣為:
w=(0.3371,0.6271,0.0358)
在附件二中,代入求出第i項指標的權(quán)重,求出每一位會員的綜合得分,以此來對會員進行分級,得到各個等級會員的數(shù)量。再結(jié)合每一位會員的GPS經(jīng)緯度,可得到四個城市會員的分級情況,結(jié)果如表6所示。
表6 各城市各等級會員數(shù)量百分比
原有的任務(wù)定價模型為:
P=70+g(wj·fij)+λib
結(jié)合問題一中對任務(wù)未完成原因的分析我們可以發(fā)現(xiàn),會員的數(shù)量和信譽值均會對任務(wù)的完成率產(chǎn)生影響,而原模型中并未考慮到會員的影響因素??紤]到附件二中會員的信譽值和完成任務(wù)的時間等指標,以及上文得出的會員在各個城市的分布情況,因此需從會員的質(zhì)與量兩個方面進行分析。
設(shè)j地區(qū)第i個任務(wù)會員的影響度為 hij,I是對應(yīng)的價格影響參數(shù),各城市權(quán)重為設(shè)改進后的任務(wù)定價模型為:
P=70+g(wj·fij)+I(wj·hij)λib
經(jīng)過新的模型求解,得到新的定價方案部分如表7所示。
表7 部分任務(wù)點新預(yù)測價格的數(shù)值
通過表7可以看出,已完成任務(wù)的新舊定價差別不大,說明定價合理;未完成任務(wù)的新定價方案大多都高于原價格,推測對任務(wù)完成情況有利,綜上所述,新的定價方案優(yōu)于原定價方案。
改進后定價計算公式:
其中g(shù)和I分別為繁華度和會員因素對價格波動變化的修正參數(shù),wj·fij和 wj·hij為城市 j分別對任務(wù)i的繁華度指數(shù)和會員綜合指數(shù),將地區(qū)對任務(wù)的兩種因素指數(shù)作為自變量,變動范圍在[0,10]、[0,5]之間,最終定價視為因變量,隨機變量λ取0,任務(wù)的定價方案取經(jīng)緯度為113.9356769,22.51592012的定價為65.75。針對I和g的不同取值,運用MATLAB軟件編程進行靈敏度分析,得到結(jié)果如圖7所示。
由靈敏度分析可知,在價格變化出現(xiàn)波動時,等量的對應(yīng)因素修正參數(shù)所引起的價格變化很小。故此次靈敏度分析效果較好,即兩種因素對價格變化的波動參數(shù)對最終價格的影響很小。
圖7 靈敏度分析圖
本文的突出特色是運用數(shù)據(jù)可視化和定性數(shù)據(jù)定量化分析。前者將GPS經(jīng)緯度轉(zhuǎn)化為平面地圖上多個點的分布,能更簡便、直觀地對數(shù)據(jù)進行觀察分析;后者將影響價格的不同因素定量化處理,能更直接地對定價產(chǎn)生影響。本文模型的應(yīng)用背景是基于智能手機和移動互聯(lián)網(wǎng)的勞務(wù)眾包平臺,如外賣應(yīng)用、滴滴打車、快遞跑腿服務(wù)平臺等都涉及到商品定價與地理位置、會員積極程度的關(guān)系,以上各模型在建模過程中通過相應(yīng)的軟件檢驗,具有一定的合理性。