何丹
摘 要:近些年,在移動互聯(lián)網(wǎng)時代,自助式勞務眾包平臺發(fā)展非常快,它為企業(yè)提供多種多樣的信息,同時大大降低了調(diào)查成本。其基本模式是:用戶在APP上領取需要完成的任務,賺取APP對任務所標定的酬金。由于定價規(guī)則關系到任務是否能被完成,同時影響企業(yè)付出的成本,因此至關重要。本文根據(jù)不同任務的分布情況,結(jié)合任務周圍的會員情況,分別提出了單個任務定價模型和打包任務的定價模型。經(jīng)檢驗、采用這兩種定價模型的任務完成率較高,且總價格較低,具有普遍推廣的價值。
關鍵詞:自助式勞務;眾包平臺;定價規(guī)則;聚類算法
中圖分類號:F23 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2020.30.049
1 背景介紹
首先以“拍照賺錢”的形式來說明自助式勞務眾包的含義?!芭恼召嶅X”是近幾年來興起的一種建立在移動互聯(lián)網(wǎng)基礎上的自助式服務模式。其具體模式是用戶下載APP并注冊成為的會員,通過APP領取需要拍照的任務,并賺取APP對任務所標定的酬金。傳統(tǒng)的市場調(diào)查需要大量的人力和物力,消耗大量成本,相比之下,移動互聯(lián)網(wǎng)下的自助式勞務眾包平臺,可以為企業(yè)提供各種商業(yè)檢查和信息搜集方式,也可以節(jié)省不少調(diào)查成本。與此同時,適當?shù)乜s短了調(diào)查的周期,也有效地確保了調(diào)查數(shù)據(jù)的可靠性。因此,APP成為該平臺運行的核心,而APP中的任務定價又是其核心要素,這就使得定價的合理性顯得尤為重要。如果勞務眾包定價過低,就會出現(xiàn)沒有人接單的問題,從而導致任務無法完成。
2 單個任務的定價模型
首先采集一批成功完成的任務的經(jīng)緯度坐標和價格,以及其周圍的會員的信息,包括會員的經(jīng)緯度坐標、信譽值、參考其信譽值給出的任務開始預定時間和預定限額,以便從中學習合理的定價規(guī)則。
對于每個任務,需要充分利用其周圍的會員信息。因此,首先通過對不同距離范圍內(nèi)會員人數(shù)和價格的相關系數(shù)分析,得出需要考慮的距離范圍。當距離范圍在某一固定值時,會員個數(shù)和任務價格的相關系數(shù)絕對值達到最大,也就可以把這個距離作為需要考慮的范圍半徑,利用MATLAB作圖,結(jié)果如圖1。
當考慮距離范圍為4.5km時相關系數(shù)絕對值達到最大值0.6。因此,以4.5km為界線,為每個任務計算在這個范圍內(nèi)的會員個數(shù)、會員信譽值和、開始預訂時間和、預定限額和。對這些變量進行標準化處理,再用多元擬合的方法得到下式:
定價=-0.929*會員個數(shù)-0.618*會員信譽值和+0.665*開始預訂時間和+0.410*預訂限額和
至此得到了這四個參數(shù)和定價的關系。但無法用它們來進行預測,因為多項式擬合的自變量、因變量都進行了標準化處理,無法恢復到原始值。因此,采用神經(jīng)網(wǎng)絡模型來學習四個參數(shù)和價格的關系,從而進行預測,神經(jīng)網(wǎng)絡的基本單元神經(jīng)元的示意圖如圖2。
該神經(jīng)元是一個以x1,x2,x3及截距+1為輸入值的運算單元,其輸出為:
hW,b(x)=f(WTx)=f(z)=f(3i=1Wixi+b)
其中函數(shù)f被稱為“激活函數(shù)”,W為權重,z為x經(jīng)過線性變換的結(jié)果。本模型選用sigmoid函數(shù)作為激活函數(shù)。
而神經(jīng)網(wǎng)絡模型就是將許多個單一神經(jīng)元聯(lián)結(jié)在一起。使用圓圈來表示神經(jīng)網(wǎng)絡的輸入,標上“+1”的圓圈被稱為偏置節(jié)點。神經(jīng)網(wǎng)絡最左邊的一層叫作輸入層,最右的一層叫作輸出層。中間所有節(jié)點組成的一層叫作隱藏層。按如下公式得到整個神經(jīng)網(wǎng)絡的輸出:
z(2)=W(1)x+b(1)
a(2)=f(z(2))
z(3)=W(2)a(2)+b(2)
hw,b(x)=a(3)=f(z(3))
其中,上標代表層數(shù),a為每個神經(jīng)元的輸出值。在本模型中,輸入是每個任務周圍的會員數(shù)、會員信譽值和、開始預訂時間和、預定限額和,輸出是每個任務的價格。通過訓練神經(jīng)元的各項參數(shù),使得預測得到的輸出和實際價格盡可能的相近。
檢驗訓練得到的模型,結(jié)果如圖4、圖5所示。
可以看到,誤差主要集中在標準線附近,且確定系數(shù)R較接近1。因此可以認為該模型能較為準確的擬合數(shù)據(jù)。用訓練好的模型為任務重新定價,并重新用四個參數(shù)多項式擬合新定價。發(fā)現(xiàn)新得到的參數(shù)和原參數(shù)相近,證明單個任務模型的價格制定合理,任務完成率較高。
3 打包任務的定價模型
考慮到多個任務如果位置太過密集,會發(fā)生用戶對任務進行爭搶的現(xiàn)象,于是我們選擇將這些任務聯(lián)合在一起打包發(fā)布。如果定價足夠高,那么會員理所當然的會選擇完成這些打包任務。但是,從企業(yè)角度出發(fā),需要盡可能的降低定價從而節(jié)約成本。因此,如何在這兩者之間取得平衡成了問題的關鍵。具體定價方法如下:
首先采用基于密度的DBSCAN空間聚類算法,將分布集中的任務打包成一類。DBSCAN是一個比較典型的基于密度的聚類算法。其聚類定義簡單地說是根據(jù)密度可達關系得到最大密度相連的樣本的集合,它可以將較高密度的區(qū)域劃分為簇,并可將任意形狀的稠密數(shù)據(jù)集進行聚類。事實上,DBSCAN與劃分和層次聚類方法是不同的。該算法的偽代碼如下:
輸入:包含n個對象的數(shù)據(jù)庫,半徑e,最少數(shù)目MinPts。
輸出:所有生成的簇,達到密度要求。
(1)Repeat。
(2)從數(shù)據(jù)庫中選取一個沒有處理的點。
(3)IF選取的點是核心對象THEN找出所有從該點密度可達的對象,形成一個簇。
(4)ELSE選取的點是邊緣點(非核心對象),跳出本次循環(huán),尋找下一個點。
(5)UNTIL所有的點都被處理。
分類之后,借用重心的概念,設定每一類任務的中心。設某個打包任務里有N個任務,其中心的經(jīng)緯度計算公式如下:
中心緯度=Ni=1LatitudeiN(1)
中心緯度=Ni=1LongitudeiN(2)
之后,在打包任務之外的單個任務中搜索到距離最近的N個任務J1-N,它們的價格為PJ1-N,并計算它們離重心的距離dJ1-N。而打包任務距離重心的距離為d1-N。通過查閱路費、心理學相關的資料,我們把1km行程的成本定為兩元(1.2元的汽油費和0.8元的時間成本)。打包任務的價格公式如下:
P打包=Ni=1PJi-(Ni=1dJi)(3)
該公式很容易理解,聚類范圍內(nèi)的會員如果舍近求遠,則需要花費更多的路費、時間成本、機會成本等。而如果會員選擇距離他較近的打包任務,則成本就會小得多。假設這些成本之差大于打包任務和單個任務的價格之差,也就是會員舍近求遠多賺到的錢不足以抵消他來回的成本,那么會員更愿意選擇打包的任務。
帶入實驗數(shù)據(jù),應用打包定價模型,得到圖6。
可見,打包后的任務價格下降明顯。同時,由于一個打包任務只能由一個用戶完成,而之前這些任務可能由很多用戶分別完成。那么這些沒有搶到打包任務的用戶很大可能去選擇別的任務去完成,這樣又進一步提高了任務完成率。
最后,和第二節(jié)中的方法相同,我們通過觀察多項式擬合的系數(shù)來判別任務完成度。和已完成任務的多項式參數(shù)相比,四項系數(shù)均比較相近。即:打包任務價格的制定和已完成任務的定價規(guī)則相近,完成度較高。
4 模型的評價與推廣
本文通過學習已完成任務的定價規(guī)律,提出了兩種新的定價模型,分別是來為單個任務定價,和將多個集中的任務打包發(fā)布的定價模型。通過將兩種模型預測出的定價和實際價格作比較,證明了它們具有良好的完成率,同時節(jié)約了企業(yè)的成本。另外,對于如何將任務進行打包,采用了聚類方法,檢驗結(jié)果表明該模型可以成功將分布集中的任務歸到一類。
移動互聯(lián)網(wǎng)經(jīng)濟飛速發(fā)展的形勢下,自助式勞務眾包平臺逐漸增多,使得企業(yè)能夠方便快捷地進行各種商業(yè)檢查和信息收集,大大節(jié)省了企業(yè)的調(diào)研成本。此外,共享經(jīng)濟飛速發(fā)展,拼車、拼團等商業(yè)模式也需要類似的定價方式。因此,本文中的定價模型具有廣泛的應用前景。
參考文獻
[1]劉嚴.多元線性回歸的數(shù)學模型 [J ].沈陽工程學院學報:自然科學版,2005,(Z1):128-129.
[2 ]張景陽,潘光友.多元線性回歸與BP神經(jīng)網(wǎng)絡預測模型對比與運用研究 [J ].昆明理工大學學報(自然科學版),2013,38(6):61-67.
[3 ]周水庚,范曄,周傲英,等.基于數(shù)據(jù)取樣的DBSCAN算法 [J ].小型微型計算機系統(tǒng),2010,21(12):1270-1273.