尚舒敏,陳家慰,胡錦帆,王志勇
(電子科技大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,四川 成都 611731)
移動(dòng)互聯(lián)網(wǎng)的發(fā)展產(chǎn)生了“拍照賺錢(qián)”這一自助式服務(wù)模式,用戶(hù)成為APP上的會(huì)員即可領(lǐng)取拍照任務(wù),從而賺取APP對(duì)任務(wù)標(biāo)定的酬金。APP的任務(wù)定價(jià)是平臺(tái)正常運(yùn)行的核心要素,若定價(jià)不合理,會(huì)出現(xiàn)無(wú)人領(lǐng)取任務(wù)的現(xiàn)象,因此,定價(jià)方案直接影響了項(xiàng)目實(shí)施情況。
基于已結(jié)束項(xiàng)目的任務(wù)數(shù)據(jù),解決下述問(wèn)題:
1)通過(guò)研究已完成項(xiàng)目得到任務(wù)定價(jià)規(guī)律,并分析未完成任務(wù)的出現(xiàn)原因;
2)為已完成項(xiàng)目制定新的定價(jià)方案,并與原方案進(jìn)行比較;
3)由于實(shí)際情況中可能出現(xiàn)多任務(wù)位置集中導(dǎo)致用戶(hù)爭(zhēng)搶現(xiàn)象,一種解決方案是將這些集中任務(wù)打包發(fā)布。根據(jù)這種解決方案修改定價(jià)模型,并分析改進(jìn)后的定價(jià)方案對(duì)最終的任務(wù)完成情況的影響。
為了直接觀(guān)測(cè)到不同定價(jià)的任務(wù)的時(shí)空分布特點(diǎn),首先對(duì)已完成的拍照任務(wù)的定價(jià)進(jìn)行K-means聚類(lèi)[1]將任務(wù)按定價(jià)分為3類(lèi)對(duì)每一類(lèi)別的任務(wù)進(jìn)行影響因素分析,分類(lèi)結(jié)果及對(duì)應(yīng)分值如表1所示。
表1 K-means聚類(lèi)結(jié)果
其中,類(lèi)1和類(lèi)2分值之間間隔均為0.5。
首先根據(jù)任務(wù)點(diǎn)地理位置即經(jīng)緯度x(i),對(duì)每一個(gè)任務(wù)劃分一個(gè)d鄰域,即以任務(wù)點(diǎn)為圓心d為半徑的經(jīng)緯度范圍的圓,得到:
Oi=O(x(i),d)=‖x(i)-x‖,?x∈Rn
(1)
該鄰域中包含了第i個(gè)任務(wù)點(diǎn)周遭的會(huì)員分布,用ni表示該鄰域內(nèi)的會(huì)員數(shù),直接反映的是人口對(duì)任務(wù)定價(jià)的影響。
進(jìn)一步地,針對(duì)該鄰域內(nèi)的會(huì)員,對(duì)每個(gè)鄰域會(huì)員的預(yù)定任務(wù)限額求和得到該鄰域內(nèi)會(huì)員能夠領(lǐng)取的總?cè)蝿?wù)數(shù),一般來(lái)說(shuō),鄰域內(nèi)限額總數(shù)越多,該任務(wù)被選擇完成的概率越大,任務(wù)定價(jià)較低。
在其余條件一定的情況下,定價(jià)規(guī)律受人口分布和預(yù)定概率即限額總數(shù)的影響比較顯著,然而數(shù)據(jù)會(huì)出現(xiàn)不能僅由這兩個(gè)主要因素解釋的定價(jià)任務(wù)點(diǎn),這可能由于任務(wù)點(diǎn)所在地理位置的地形或任務(wù)本身的難度等原因決定的,引入一個(gè)可變參數(shù)θi,表征任務(wù)i的其余因素對(duì)定價(jià)的影響[2]。
首先考慮附近會(huì)員數(shù)對(duì)價(jià)格的影響,在取搜索鄰域?yàn)閐=0.02(以任務(wù)點(diǎn)為圓心0.02為半徑的經(jīng)緯度范圍的圓)可見(jiàn),隨著任務(wù)附近會(huì)員數(shù)的增多,其對(duì)應(yīng)的價(jià)格也具有下降趨勢(shì)。同時(shí)注意到,價(jià)格為80元和價(jià)格為85元的任務(wù)與其他任務(wù)的差異較大,應(yīng)單獨(dú)考慮。
為了更直觀(guān)地表明任務(wù)附近會(huì)員數(shù)與任務(wù)價(jià)格的關(guān)系,可考慮相同會(huì)員數(shù)情況下的平均任務(wù)價(jià)格。在忽略任務(wù)價(jià)值為80元和85元的前提下,任務(wù)附近會(huì)員數(shù)可在[0,44]內(nèi)離散地取整數(shù)值,共有38種會(huì)員數(shù)情況,分別計(jì)算不同會(huì)員數(shù)時(shí)任務(wù)價(jià)格的平均值發(fā)現(xiàn)隨著附近會(huì)員數(shù)的升高,任務(wù)的平均價(jià)格不斷升高。
采用對(duì)數(shù)回歸模型[3-4]進(jìn)行擬合,利用所給數(shù)據(jù)(ni,vi),ni=1,2,…,38,ni表示第i種會(huì)員數(shù),vi表示第i種會(huì)員數(shù)對(duì)應(yīng)的任務(wù)平均價(jià)格,通過(guò)最小二乘法得對(duì)數(shù)回歸模型為:
v=70.978-1.698 lnn
(2)
式中,v是平均價(jià)格,n是會(huì)員分布數(shù)。
取顯著性水平α=0.01,對(duì)模型進(jìn)行顯著性檢驗(yàn),t檢驗(yàn)和F檢驗(yàn)的P-value均小于顯著性水平0.01,擬合優(yōu)度為0.866 1,模型通過(guò)顯著性檢驗(yàn)且較為準(zhǔn)確。
由以上分析可知,任務(wù)附近會(huì)員的數(shù)量會(huì)對(duì)任務(wù)的價(jià)格造成較為明顯的影響,其主要體現(xiàn)在平均價(jià)格符合對(duì)數(shù)回歸模型,因此可認(rèn)為隨著任務(wù)附近會(huì)員數(shù)的增加,任務(wù)的價(jià)格在總體上會(huì)降低。事實(shí)上,任務(wù)附近會(huì)員數(shù)與任務(wù)價(jià)格的更為復(fù)雜,無(wú)法直接通過(guò)任務(wù)附近會(huì)員數(shù)得出任務(wù)的價(jià)格,因此還需要考慮更多因素,這些因素在會(huì)員數(shù)的基礎(chǔ)上,進(jìn)一步對(duì)任務(wù)施加影響,從而確定任務(wù)實(shí)際的價(jià)格。
將任務(wù)點(diǎn)的分布與會(huì)員的分布繪圖對(duì)比,得到任務(wù)的分布與鄰域內(nèi)會(huì)員總?cè)丝跀?shù)存在相關(guān)關(guān)系,會(huì)員越密集的地區(qū),任務(wù)價(jià)格相對(duì)較低[5-7],因此第一類(lèi)任務(wù)的定價(jià)較大程度上取決于鄰域的人口數(shù)量,取d=0.02,得到任務(wù)點(diǎn)鄰域(經(jīng)緯度起伏范圍為d的區(qū)域)的人口數(shù),針對(duì)第一類(lèi)任務(wù)鄰域的人數(shù)取平均值,做第一類(lèi)任務(wù)定價(jià)與其中每個(gè)價(jià)位的人口分布平均值做一元線(xiàn)性回歸,得到:
y=68.427 642-0.204 265x
(3)
式中,y表示第一類(lèi)任務(wù)的價(jià)格,其取值為65~68之間的間隔為0.5的離散值,x為任意定價(jià)價(jià)格對(duì)應(yīng)的d=0.02的左右鄰域人口的平均值。
第2類(lèi)和第3類(lèi)分布與人口分布的關(guān)聯(lián)并不那么顯著,第二類(lèi)定價(jià)的任務(wù)更偏向于人口密集地區(qū)分布,那么考慮第二類(lèi)與會(huì)員的任務(wù)預(yù)定限額有關(guān),將這兩個(gè)因素作為決策族建立決策樹(shù)模型,結(jié)果如圖1所示。
圖1 決策樹(shù)可視化結(jié)果
該決策樹(shù)經(jīng)檢驗(yàn)錯(cuò)誤率為21%,認(rèn)為有不錯(cuò)的表征效果,其中第1和第2類(lèi)任務(wù)受人口數(shù)量和預(yù)定限額影響較大。
一般情況下,一線(xiàn)城市這類(lèi)城市人均收入較高、消費(fèi)水平也高的城市,往往居民不會(huì)去接一般定價(jià)的任務(wù),導(dǎo)致任務(wù)完成率較低,直接造成的現(xiàn)象是該處出現(xiàn)聚集性的任務(wù)未完成現(xiàn)象,定義任務(wù)完成率為:
(4)
通過(guò)求解分析各城市間的任務(wù)完成率情況,得到任務(wù)完成的區(qū)域性差異,進(jìn)而說(shuō)明未完成的可能原因。
可假設(shè)任務(wù)的完成情況滿(mǎn)足0-1分布。對(duì)于0-1分布的隨機(jī)變量,可用Logistic模型[8-10]將其進(jìn)行分類(lèi)處理,將影響任務(wù)完成的因素作為自變量,任務(wù)的完成情況作為因變量,可得到二分類(lèi)模型。利用Logistic模型,可以進(jìn)一步分析出導(dǎo)致任務(wù)未完成的原因。
要確定Logistic模型的自變量,需要考慮影響任務(wù)完成情況的因素。首先比較已完成任務(wù)與未完成任務(wù)的數(shù)據(jù),得到主要數(shù)據(jù)如表2所示。
表2 任務(wù)完成情況的結(jié)果
由上表可見(jiàn),以上因素對(duì)于任務(wù)完成情況S均有一定的影響,考慮到模型二中會(huì)員數(shù)與平均價(jià)格的關(guān)系以及會(huì)員限額與平均信譽(yù)值均與會(huì)員數(shù)有關(guān),為了減少各自變量的相關(guān)性,僅考慮價(jià)格v、會(huì)員平均限額l、會(huì)員平均信譽(yù)值cr和附近任務(wù)數(shù)b作為自變量。
根據(jù)經(jīng)緯度進(jìn)行定位,高定價(jià)的任務(wù)出現(xiàn)原因一般為比較難完成的任務(wù),比如較為偏僻的地方、危險(xiǎn)的地方和需消費(fèi)才能進(jìn)入的地方等,對(duì)會(huì)員要求較高,故定價(jià)較高,這時(shí)受人口分布和限額的影響較小,可見(jiàn)難度系數(shù)θi是權(quán)重最大的因素。在層次模型中,特殊地區(qū)應(yīng)在第1類(lèi)與第2類(lèi)定價(jià)基礎(chǔ)上考慮難度然后增加定價(jià)。
計(jì)算Logistic模型的極大似然法的估計(jì)值可得:
(5)
式中,v表示任務(wù)的價(jià)格,l表示任務(wù)附近會(huì)員的平均限額,cr表示任務(wù)附近會(huì)員的平均信譽(yù)值,b表示任務(wù)附近的任務(wù)數(shù)。
改變訓(xùn)練數(shù)據(jù),計(jì)算多組參數(shù),確定一個(gè)合適的閾值pl,使得以測(cè)試數(shù)據(jù)的錯(cuò)誤率達(dá)到最小,利用枚舉法,以0.01的為步長(zhǎng),搜索閾值,計(jì)算可得一個(gè)大致的閾值為pl=0.5。于是有:
(6)
通過(guò)多組測(cè)試數(shù)據(jù),以pl=0.5為閾值,可計(jì)算測(cè)試數(shù)據(jù)的平均錯(cuò)誤率,計(jì)算得為平均錯(cuò)誤率為36.9%,其中最小錯(cuò)誤率為29%,最大錯(cuò)誤率為43.5%,因此可得此分類(lèi)模型有一定的準(zhǔn)確性和合理性。
任務(wù)的完成情況受到價(jià)格、附近會(huì)員限額、附近會(huì)員信譽(yù)值以及任務(wù)難度的影響,一個(gè)任務(wù)未完成的原因主要有以下6種可能:
1)任務(wù)處于消費(fèi)水平和工資水平較高的城市,而定價(jià)無(wú)特殊性,對(duì)會(huì)員沒(méi)有吸引力;
2)任務(wù)的價(jià)格較低,會(huì)員完成任務(wù)的積極性降低;
3)任務(wù)附近的會(huì)員限額較高,會(huì)員在同時(shí)接受多個(gè)任務(wù)時(shí),沒(méi)有時(shí)間和精力做完每一個(gè)任務(wù),導(dǎo)致任務(wù)未被完成;
4)任務(wù)附近的會(huì)員實(shí)際信譽(yù)值較低,會(huì)員經(jīng)常不完成任務(wù)會(huì)影響其信譽(yù)值,總體上來(lái)看,低信譽(yù)值的會(huì)員完成任務(wù)的可能性更低;
5)任務(wù)附近任務(wù)數(shù)量較多,會(huì)員在選擇時(shí)可能會(huì)忽略某些任務(wù);
6)任務(wù)的難度較高,任務(wù)可能處難以到達(dá)的位置[11],這主要體現(xiàn)在中高價(jià)格的任務(wù)上。
預(yù)定任務(wù)限額影響會(huì)員配額,故對(duì)會(huì)員的預(yù)定任務(wù)限額進(jìn)行分析。會(huì)員i的預(yù)定任務(wù)限額值應(yīng)受到其地理位置、附近會(huì)員的信譽(yù)值影響。以會(huì)員附近任務(wù)總數(shù)與會(huì)員附近其他會(huì)員的平均信譽(yù)值C作為自變量,建立限額模型。
L=β0+β1Q+β2C+ε
(7)
考慮附近信譽(yù)值對(duì)任務(wù)完成的影響,可將會(huì)員臨近信譽(yù)值C進(jìn)行恰當(dāng)變換,使其在(100,1 000]增長(zhǎng)更為平緩。計(jì)算得變換函數(shù)如下:
(8)
將C*帶入多元線(xiàn)性模型中替換C,即得到優(yōu)化后的限額函數(shù)。最終的結(jié)果為:
L=4.918 300 410 5+0.000 294 303 3Q+
0.002 548 307 1C*
(9)
Logistic價(jià)格模型[12]可以通過(guò)價(jià)格、附近會(huì)員限額和附近會(huì)員信譽(yù)值計(jì)算出一個(gè)任務(wù)完成的概率p(y=1|v,l,cr,b),對(duì)于n個(gè)任務(wù),需要使得每個(gè)任務(wù)的平均完成概率pi最大,且要使任務(wù)總金額限制在一個(gè)范圍里,設(shè)最大總金額為vmax,模型為:
(10)
(11)
進(jìn)一步地,考慮任務(wù)點(diǎn)所處城市水平的差異引入水平參數(shù)φ,另外加上各種地區(qū)帶來(lái)的任務(wù)難度提升的定價(jià)θ。
同時(shí)兼顧新會(huì)員的利益,應(yīng)當(dāng)為新會(huì)員的任務(wù)完成提供機(jī)會(huì),但礙于老會(huì)員信譽(yù)值和限額的雙高現(xiàn)象,為了增加新會(huì)員的積極性,增加時(shí)間遞增參數(shù)τi,τi隨著任務(wù)發(fā)布時(shí)間遞增,經(jīng)過(guò)對(duì)數(shù)據(jù)的分析,每3 min更新一輪,從6∶30-8∶00進(jìn)行任務(wù)的選擇,由于新會(huì)員開(kāi)始選擇時(shí)間落后,將任務(wù)定價(jià)適當(dāng)提高以增加新會(huì)員的積極性。綜上所述,改進(jìn)的價(jià)格模型為
(12)
對(duì)于任務(wù)i,根據(jù)任務(wù)附近會(huì)員限額li、任務(wù)附近會(huì)員信譽(yù)值cri與任務(wù)附近會(huì)員數(shù)bi,以0.64為平均最佳概率計(jì)算初始價(jià)格為:
vi=73.047 0+0.067 5li-0.003 0cri-0.069 0bi
(13)
任務(wù)打包方案基于任務(wù)的聚集程度而定,基于這個(gè)想法,設(shè)定一個(gè)鄰域值d,在此基礎(chǔ)上,進(jìn)行逐步聚類(lèi),將在d-鄰域內(nèi)的所有任務(wù)聚為一類(lèi)。具體步驟如下:
1)根據(jù)經(jīng)緯度計(jì)算各任務(wù)點(diǎn)兩兩之間的距離得到距離矩陣D;
2)設(shè)定鄰域長(zhǎng)度d,從第一個(gè)任務(wù)點(diǎn)開(kāi)始依次查找與其余任務(wù)點(diǎn)的距離,以對(duì)于任務(wù)點(diǎn)i為例,找到滿(mǎn)足距離小于d的且任務(wù)i與任務(wù)j之間的距離distij距離最小的任務(wù)點(diǎn)j,將其與任務(wù)點(diǎn)i歸為一類(lèi),即將任務(wù)j的列名明明為i,循環(huán)全部任務(wù)點(diǎn)得到第一次聚類(lèi)結(jié)果;
3)判定距離矩陣D的類(lèi)別,將存在的類(lèi)別進(jìn)行進(jìn)一步聚類(lèi),對(duì)于第i類(lèi)任務(wù),選定其余任務(wù)點(diǎn)距離中與第i類(lèi)中的所有任務(wù)的距離最大值不超過(guò)給定鄰域范圍d的任務(wù)點(diǎn)歸入i類(lèi),即需滿(mǎn)足條件:
maxdistij=‖xj-xi‖,xi∈ci
s.t.distij (14) 式中,x表示任務(wù),ci表示第i類(lèi),distij表示任務(wù)i和任務(wù)j的距離,d為給定的鄰域范圍; 4)重復(fù)步驟3),直至不存在滿(mǎn)足鄰域范圍內(nèi)的dist為止,完成最終聚類(lèi),得到結(jié)果。 取打包范圍為0.02,打包后,任務(wù)共有446組,其中有68組包含3個(gè)任務(wù),253組包含2個(gè)任務(wù),125組包含一個(gè)任務(wù)。 以此方法對(duì)任務(wù)完成打包分類(lèi),將打包后的任務(wù)視為一個(gè)發(fā)放任務(wù),借用模型二,進(jìn)行新的定價(jià)求解。 由于將臨近的任務(wù)進(jìn)行了打包發(fā)布,臨近任務(wù)數(shù)對(duì)價(jià)格的影響被大大削弱,同時(shí)也提高了任務(wù)的完成率,為了保障商家利益,應(yīng)當(dāng)對(duì)打包訂單的單價(jià)進(jìn)行適當(dāng)降低,因此引入下降參數(shù)γ,γ隨著訂單內(nèi)任務(wù)的數(shù)量應(yīng)作出適當(dāng)改變,不妨?。?/p> γi=bi-1 (15) 式中,bi表示訂單i內(nèi)任務(wù)總數(shù)。即隨著訂單內(nèi)任務(wù)總數(shù)的增加,單個(gè)任務(wù)難度越低,因此任務(wù)單價(jià)下降越多。 改進(jìn)的訂單單價(jià)求解模型為初步修改后的Logistic模型為: (16) 借助這個(gè)模型,可以得到所有任務(wù)的基準(zhǔn)價(jià)格,以?xún)r(jià)格乘以任務(wù)數(shù)作為總價(jià),得到每個(gè)訂單的基準(zhǔn)價(jià)格。即基準(zhǔn)價(jià)格的獲得模型為: (17) 對(duì)任務(wù)打包后建立與上文相同的定價(jià)模型,取平均完成概率為0.65,得到結(jié)果為: (18) 式中,l為任務(wù)附近會(huì)員限額,cr為任務(wù)附近會(huì)員信譽(yù)值。 在計(jì)算價(jià)格時(shí),先將整個(gè)打包任務(wù)作為整體,將每個(gè)任務(wù)的會(huì)員限額和信譽(yù)值取平均值,利用定價(jià)模型計(jì)算出一個(gè)平均價(jià)格。 具體定價(jià)方案如下: 2)若vi<60,取vi=60,若vi>80,取vi=85; 4)若考慮時(shí)間因素影響,可按照價(jià)格增加規(guī)律按時(shí)間增加價(jià)格。 優(yōu)化后的新方案的定價(jià)具有更低的方差,平均價(jià)格有所提高,理論平均完成概率提高了10%??紤]進(jìn)時(shí)間因素后,理論完成概率提高了20%。 新方案在增加總成本的情況下,調(diào)整了價(jià)格,總體上任務(wù)價(jià)格有所上升。從平臺(tái)的角度考慮,此類(lèi)定價(jià)更能吸引新用戶(hù),對(duì)于擁有較多新用戶(hù)的該平臺(tái)有較高的可行性。而考慮時(shí)間因素時(shí),理論上,成本提高較多,然而預(yù)定時(shí)間較晚的用戶(hù)往往是信譽(yù)值較低的新用戶(hù),最終的價(jià)格僅針對(duì)這部分用戶(hù),由于其限額較低,在實(shí)際情況下平臺(tái)成本不會(huì)提高過(guò)多,具有可行性,考慮了新用戶(hù)的利益。進(jìn)一步地,對(duì)于任務(wù)打包方案,將多個(gè)任務(wù)視為一個(gè)任務(wù),顧及到了所有會(huì)員的利益,更有利于低限額的會(huì)員完成任務(wù),從而有利于平臺(tái)的長(zhǎng)遠(yuǎn)發(fā)展。在商家成本較為充足時(shí),打包任務(wù)的定價(jià)方案效果最佳。這是一種對(duì)新會(huì)員友好的模型,有利于平臺(tái)的持續(xù)性發(fā)展。2.4 修正的定價(jià)模型
3 結(jié)束語(yǔ)
實(shí)驗(yàn)科學(xué)與技術(shù)2019年1期