,,
(1.安徽財(cái)經(jīng)大學(xué)金融學(xué)院,安徽 蚌埠 233000;2.安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233000)
眾包模式作為互聯(lián)網(wǎng)時(shí)代的自主式服務(wù)[1],吸引越來越多的人參與其中。眾包平臺利用互聯(lián)網(wǎng)的力量,將任務(wù)進(jìn)行分解,派發(fā)到大眾手中。用戶通過完成任務(wù)獲得相應(yīng)數(shù)量的資金報(bào)酬,企業(yè)得到需要的數(shù)據(jù)與調(diào)查問卷。不僅可以提高企業(yè)的調(diào)查效率,而且提高了調(diào)查問卷的準(zhǔn)確性。平臺任務(wù)的定價(jià)作為一個(gè)核心要素[2],關(guān)系著任務(wù)的完成效率以及企業(yè)付出的成本。
本文數(shù)據(jù)來源于全國大學(xué)生數(shù)學(xué)建模競賽以及2017年廣州市薪資水平報(bào)告。為了確保模型嚴(yán)謹(jǐn)性,提出假設(shè):(1)平臺會員都是理性經(jīng)濟(jì)人,在完成任務(wù)時(shí)會在成本和收益的關(guān)系之間進(jìn)行取舍權(quán)衡[3]。(2)地球是一個(gè)光滑球體,忽略地球表面的地形起伏變化,并認(rèn)為球體的半徑為地球的平均半徑,即R=6371.004。(3)會員不會因?yàn)榻煌〒矶聠栴}導(dǎo)致任務(wù)未完成。(4)影響會員選擇的因素只有任務(wù)與會員的距離、位置熵和任務(wù)的價(jià)格。
圍繞“任務(wù)”和“會員”兩大主體進(jìn)行分析[4],將任務(wù)標(biāo)價(jià)作為因變量,任務(wù)的經(jīng)緯度坐標(biāo)、任務(wù)的執(zhí)行情況、會員的地理位置、會員的信譽(yù)值以及會員預(yù)訂任務(wù)限額作為自變量,擬合因變量關(guān)于自變量的回歸函數(shù),代入價(jià)格檢驗(yàn)回歸函數(shù)準(zhǔn)確性。
因此首先對數(shù)據(jù)進(jìn)行預(yù)處理,剔除與任務(wù)地點(diǎn)距離較大的會員坐標(biāo)。劃定行動范圍,任何任務(wù)范圍內(nèi)會員的任務(wù)限制、開始時(shí)間、信譽(yù)度與范圍內(nèi)其他任務(wù)的位置熵決定了任務(wù)完成的可能性[5]。
圖1 定價(jià)模型的研究思路
2.3.1 確定可行范圍
設(shè)任務(wù)點(diǎn)Ai的緯經(jīng)度坐標(biāo)為(xA,yA),會員點(diǎn)的緯經(jīng)度坐標(biāo)為(xB,yB),根據(jù)經(jīng)緯度分布圖,得知任務(wù)點(diǎn)分布在東經(jīng)(112.6832,114.4936)到北緯(22.4931,23.8784)的范圍之內(nèi)。
根據(jù)經(jīng)緯度計(jì)算公式的三角推導(dǎo),兩點(diǎn)之間的經(jīng)緯度距離為
在經(jīng)緯網(wǎng)圖上,根據(jù)經(jīng)緯度計(jì)算兩點(diǎn)之間的距離。由于地點(diǎn)范圍差距較小,認(rèn)為在這個(gè)地點(diǎn)范圍內(nèi),所有經(jīng)緯度的長度都相等,即1°=111km。在不考慮交通道路與障礙物的情況下,兩點(diǎn)之間的實(shí)際距離為
d=111*Δ
2.3.2 可行范圍內(nèi)會員的情況
會員是理性經(jīng)濟(jì)人,其成本為花費(fèi)的時(shí)間和距離,一定存在一個(gè)成本最大點(diǎn),當(dāng)會員與任務(wù)的距離大于r時(shí),會員會選擇放棄任務(wù)。即在r內(nèi),會員才愿意花費(fèi)時(shí)間與精力去完成該項(xiàng)任務(wù)。令會員點(diǎn)Bi與任務(wù)點(diǎn)Ai的距離Di,對于Bi,若Di≤r,提取Bi,否則舍棄。
則對于所有的未舍棄的會員點(diǎn),給提取出的會員點(diǎn)一個(gè)新的符號Bi,影響因素預(yù)訂任務(wù)限額Ki、預(yù)訂任務(wù)開始時(shí)間Pi、信譽(yù)值Qi。任務(wù)點(diǎn)Ai的影響因素就是這些會員點(diǎn)的平均值,即:
同理
2.3.3 落入可行范圍內(nèi)的其他任務(wù)
在一定范圍內(nèi),除會員數(shù)量可能影響任務(wù)的定價(jià),任務(wù)之間的價(jià)格差異也會任務(wù)的定價(jià)產(chǎn)生影響。定義這種價(jià)格之間的相互影響為任務(wù)優(yōu)先度,任務(wù)優(yōu)先度越大,則任務(wù)對于會員的吸引力也就越大。
對于任務(wù)Ai,如果在半徑為r范圍的圓內(nèi),存在任務(wù)Aα,Aβ,Aγ,其任務(wù)標(biāo)價(jià)分別為wi,wα,wβ,wγ,則任務(wù)Ai的任務(wù)優(yōu)先度為
在半徑范圍內(nèi)不存在其他任務(wù)的情況下,即wα=wβ=wγ=0,此時(shí)σi=1。根據(jù)任務(wù)優(yōu)先度原則,此時(shí)對會員的吸引度最大。然而,現(xiàn)實(shí)情況下,人們往往無法對于偏遠(yuǎn)任務(wù)產(chǎn)生接受的興趣,這與優(yōu)先度原則相違背。于是,對任務(wù)優(yōu)先度原則做一個(gè)補(bǔ)充,當(dāng)范圍內(nèi)不存在其他任務(wù)時(shí),σi=0。
2.3.4 回歸函數(shù)的建立
建立價(jià)格與某個(gè)任務(wù)范圍內(nèi)會員平均預(yù)訂限額、平均時(shí)間、平均榮譽(yù)值、任務(wù)優(yōu)先度之間的多元回歸函數(shù)
其中,β1,β2,β3,β4分別為影響因素的系數(shù),α1,α2,α3,α4分別為影響因素的指數(shù),為隨機(jī)誤差項(xiàng)。
利用excel求得835個(gè)任務(wù)點(diǎn)對應(yīng)的任務(wù)點(diǎn)優(yōu)先度、范圍內(nèi)的會員數(shù)、平均預(yù)訂限額、平均時(shí)間和平均榮譽(yù)數(shù)。預(yù)先繪制一張散點(diǎn)圖,觀察自變量與因變量之間的關(guān)系。
建立因變量y1任務(wù)標(biāo)價(jià),y2任務(wù)執(zhí)行情況;原始自變量a1緯度,a2經(jīng)度;自變量x1落入會員數(shù),x2平均預(yù)訂任務(wù)限額,x2平均預(yù)訂任務(wù)開始時(shí)間,x4平均信譽(yù)值,x5任務(wù)優(yōu)先度。
觀察圖2,y1與a2、x2和x5之間不存在任何關(guān)系;y1與a1存在正相關(guān)關(guān)系,與x1存在負(fù)相關(guān)關(guān)系;雖然y2與x2、x4不存在直接關(guān)系,但是與x1x3、x2x4存在負(fù)相關(guān)關(guān)系。
圖2 相關(guān)關(guān)系系數(shù)圖
根據(jù)y1與其他變量之間的相關(guān)系數(shù)不斷調(diào)整,得到五個(gè)變量之間的相關(guān)系數(shù)表。觀察表中數(shù)據(jù),Y1與A1的相關(guān)性最高,說明價(jià)格受地域因素影響較大;與X1*X4的相關(guān)性最低,說明價(jià)格受周邊會員榮譽(yù)總數(shù)影響較小。
表1 變量之間相關(guān)系數(shù)表
在擬合回歸的過程中,變量中含有0變量時(shí),log函數(shù)無意義。將含有0邊量的值替換為Q,Q為無限趨向于0的數(shù),但不為0。
根據(jù)擬合結(jié)果,得到最終的定價(jià)規(guī)律函數(shù):
lny1=0.203432a1-0.052311lnx1+
0.027267lnx2x3-0.002199lnx1x4-0.410941
設(shè)計(jì)新的定價(jià)方案,并與原方案進(jìn)行比較。綜合考慮任務(wù)分布以及完成情況,運(yùn)用spss對任務(wù)進(jìn)行分類,針對各區(qū)域不同情況分別進(jìn)行討論。在定價(jià)規(guī)律的基礎(chǔ)上,引入用以修正任務(wù)價(jià)格的工資比以及用以修正任務(wù)可行范圍內(nèi)會員數(shù)量的階層比,對佛山、廣州、深圳、東莞四個(gè)區(qū)域重新進(jìn)行擬合回歸方程,得到新的定價(jià)模型。
K均值聚類法是基于劃分方法的聚類,算法過程較為簡單,執(zhí)行速度較快。在計(jì)算的過程中,需要輸入希望得到的聚類個(gè)數(shù)K,軟件會將數(shù)據(jù)劃分成K個(gè)類別。在實(shí)踐計(jì)算的過程中,K值由人為指定,包含較大的主觀性。
首先對K值做一個(gè)計(jì)算,利用Euclid距離先對于數(shù)據(jù)進(jìn)行預(yù)分類,根據(jù)任務(wù)之間的歐氏距離生成聚類樹,取聚類比重為1時(shí)的聚類個(gè)數(shù)為K,如圖3。根據(jù)比重為1時(shí)水平線與聚類樹交點(diǎn),取K=4。
根據(jù)對定價(jià)規(guī)律的研究,任務(wù)未完成的原因主要包含三大方面:定價(jià)不合理、周邊會員的數(shù)量和不活躍會員的比例。除此之外,建立模型我們還考慮了當(dāng)?shù)氐慕?jīng)濟(jì)發(fā)達(dá)程度和勞動人口的比重。
表2可以看出,任務(wù)完成率越高,該地區(qū)的平均工資越低,低收入階層所占的比例也就越低。從實(shí)施情況來看,在經(jīng)濟(jì)并不發(fā)達(dá)的地區(qū),低收入階層的人數(shù)往往越多,他們更愿意在工作時(shí)間外干兼職來改善生活。
圖3 任務(wù)聚類樹
表2不同地區(qū)任務(wù)完成率、經(jīng)濟(jì)水平和低收入階層比例情況表
任務(wù)完成率平均工資(元/月)低收入階層比例佛山市48.91%384583.7%廣州市42.92%481167.9%東莞市98.21%356885.4%深圳市17.39%519962.5%
鑒于不同地區(qū)的不同情況,任務(wù)的定價(jià)和會員的實(shí)際工作能力也需要做出調(diào)整。根據(jù)工資水平占平均工資的比例和階層人數(shù)占平均階層人數(shù)的比例來對這兩項(xiàng)變量進(jìn)行調(diào)整。
令不同地區(qū)的平均工資為Ii,低收入階層比例為Ki(i=1,2,3,4),改正后的變量遵循:
任務(wù)的完成率呈現(xiàn)區(qū)域性的特征,利用spss,針對任務(wù)完成度對835個(gè)任務(wù)點(diǎn)根據(jù)經(jīng)緯度和執(zhí)行情況以K=4進(jìn)行聚類,得到四個(gè)聚類中心點(diǎn)。
表3 聚類中心點(diǎn)情況
將這四個(gè)中心點(diǎn)在地圖上表示出來,并根據(jù)聚類情況,劃分得到每一類的具體范圍。
觀察分類框圖并查詢地圖,四個(gè)區(qū)域分別可以擬合佛山市、廣州市、東莞市和深圳市四個(gè)行政區(qū)。結(jié)合深圳市與東莞市截然不同的完成情況,推測任務(wù)完成度與任務(wù)所在地的工資和階層分布有關(guān)。根據(jù)表2,計(jì)算出四市平均工資,并將各市平均工資比四市平均工資得到工資比,同理得到階層比,結(jié)果見表4。
表4 四個(gè)地區(qū)工資比和階層比
修正不同地區(qū)的定價(jià)模型,根據(jù)定價(jià)規(guī)律模型中的算法,工資比體現(xiàn)城市的物價(jià)水平/消費(fèi)水平,因此將工資比用于對任務(wù)價(jià)格系數(shù)的修正。階層比體現(xiàn)用戶中有充分時(shí)間并且有意愿做這類可能費(fèi)時(shí)且收入較低的任務(wù)人數(shù),因此將階層比用于任務(wù)可行范圍內(nèi)會員數(shù)量系數(shù)的修正。經(jīng)過計(jì)算,得到四個(gè)區(qū)域不同的定價(jià)函數(shù)。
表5 不同地區(qū)的定價(jià)函數(shù)
圖4 任務(wù)點(diǎn)區(qū)域分類范圍
圖5 不同K值距離中心分布圖
將設(shè)計(jì)的定價(jià)方案與原方案進(jìn)行比較:
y2=0.00723x1+4.90E-0.5x4
lny2=0.2034a1-0.0523lnx1+0.0273lnx1x2-0.0022lnx1x4-0.4109
對比兩個(gè)方案,當(dāng)任務(wù)的完成度增加1單位時(shí),范圍內(nèi)會員數(shù)量增加0.072。將此線性關(guān)系運(yùn)用到定價(jià)規(guī)律模型中,在價(jià)格不變的情況下,范圍內(nèi)會員數(shù)量每增加-0.0523,其余變量將相應(yīng)改變對應(yīng)系數(shù)的單位,如表7。
表7 彈性變化表
通過上表,相對于初始值,大多數(shù)函數(shù)的彈性絕對值變化較大。在其他變量不變的情況下,增加一單位的任務(wù)完成率所需要改變的會員數(shù)量就越少,即任務(wù)完成率會相對增大。因此,分區(qū)后的定價(jià)規(guī)則可以提高任務(wù)完成率。
4.1.1 經(jīng)緯度
實(shí)際情況下,在計(jì)算經(jīng)緯度距離時(shí)需要考慮其弧度問題。設(shè)任務(wù)點(diǎn)Ai的經(jīng)緯度坐標(biāo)為(aA,yA),會員點(diǎn)Bi的經(jīng)緯度坐標(biāo)為(xB,yB),根據(jù)經(jīng)緯度分布圖,我們可以得知任務(wù)點(diǎn)分布在東經(jīng)(112.6832,114.4936)到北緯(22.4931,23.8784)的范圍之內(nèi),根據(jù)經(jīng)緯度計(jì)算公式的三角推導(dǎo),兩點(diǎn)之間的距離為
d=sin(yA)·sin(yB)+cos(Ya)·cos(yB)·
cos(xA-xB)
4.1.2 任務(wù)優(yōu)先
σi是定義的任務(wù)優(yōu)先度計(jì)算公式,但是這是在考慮在Ai任務(wù)點(diǎn)附近存在其他任務(wù)點(diǎn)的情況。在半徑r范圍內(nèi)不存在其他任務(wù)的情況下,此時(shí)σi=1。根據(jù)任務(wù)優(yōu)先度原則,此時(shí)對會員的吸引度最大?,F(xiàn)實(shí)情況下,對于偏遠(yuǎn)地區(qū)的任務(wù),人們往往無法產(chǎn)生接受的興趣,這與優(yōu)先度原則相違背。于是,對任務(wù)優(yōu)先度原則做一個(gè)補(bǔ)充,當(dāng)范圍內(nèi)不存在其他任務(wù)時(shí),σi=0。
當(dāng)聚類比重為1時(shí),選取K=4。當(dāng)變換聚類比重時(shí),K可以取不同的值。若聚類比重小于1,則K可取K=7,8,9,10,11,將經(jīng)緯度導(dǎo)入MATLAB軟件[6],繪制其聚類中心點(diǎn)分布情況,并采用不同的顏色進(jìn)行標(biāo)注,見圖5。得到不同的K值下,聚類中心點(diǎn)不同,而且存在一定的距離。當(dāng)K=9時(shí),與其他聚類點(diǎn)重合的情況最高,說明K=9的取值合理[7]。
探究眾包平臺的定價(jià)規(guī)律,選取準(zhǔn)確的影響因素并擬合回歸,能夠有效發(fā)現(xiàn)現(xiàn)有模式的不足。結(jié)合地區(qū)之間市場需求及物價(jià)水平的差異,對區(qū)域進(jìn)行聚類劃分,尋求最佳的聚類中心點(diǎn)。根據(jù)聚類區(qū)域的不同,制定符合區(qū)域范圍內(nèi)的定價(jià)策略。
參考文獻(xiàn):
[1] 李景峰,梁明蕙.分享經(jīng)濟(jì)時(shí)代下基于互聯(lián)網(wǎng)的人力資源眾包模式初探[J].經(jīng)濟(jì)問題,2016(04):96-101.
[2] 姚山季,劉德文.眾包模式下顧客參與、顧客互動和新產(chǎn)品價(jià)值[J].財(cái)經(jīng)論叢,2016(10):85-95.
[3] 林素芬,林峰.眾包定義、模式研究發(fā)展及展望[J].科技管理研究,2015,35(04):212-217.
[4] 王姝,陳勁,梁靚.網(wǎng)絡(luò)眾包模式的協(xié)同自組織創(chuàng)新效應(yīng)分析[J].科研管理,2014,35(04):26-33.
[5] 李龍一,王瓊.眾包模式用戶參與影響因素分析——基于社會交換理論的實(shí)證研究[J].現(xiàn)代情報(bào),2014,34(05):17-23.
[6] 吳禮斌, 李柏年, 閆云俠.經(jīng)濟(jì)數(shù)學(xué)實(shí)驗(yàn)與建模[M].北京:國防工業(yè)出版社, 2013.202-212.
[7] 楊桂元.數(shù)學(xué)建模[M].上海:上海財(cái)經(jīng)大學(xué), 2015.