摘 要:本文是對2017年全國大學生數(shù)學建模競賽B題“拍照賺錢”的任務定價問題一的研究。首先基于任務分布熱力圖及模糊分類原理,初步推斷出原定價方案中的影響因素為交通成本和任務的復雜程度;然后,運用k-means聚類法將所有任務點分為4類,代表4座城市,將各聚類簇中心作為各個城市的新的修正中心;進一步地,通過構造模糊分類規(guī)則中的各價位判別半徑,利用待判斷任務點與修正中心的距離,確定其價格范圍,結果與原價格的相關系數(shù)在0.7577-0.8387之間、平均絕對誤差在0.6772元左右;最后,通過各區(qū)域平均價格、完成率和任務數(shù)量,再結合價位分布圖和任務完成情況分布圖,確定出任務未完成的原因為高價位任務之間過于離散以及地區(qū)經(jīng)濟發(fā)展水平高導致低價任務吸引力不夠。
關鍵詞:k-means聚類 模糊分類 定價方案 蒙特卡洛法
一、引言
眾包模式作為一個新興產(chǎn)業(yè)在中國具有非常廣闊的發(fā)展空間,越來越多的商業(yè)任務會用眾包的模式來解決。目前很多企業(yè)對兼職員工有非常大的需求,但是用兼職員工本身就是應該比較麻煩的過程,但是,如果有一個兼職勞務的眾包平臺,能夠提供這類服務,企業(yè)能夠直接把這類有需要的項目發(fā)布到平臺,將會大大節(jié)省企業(yè)的成本和時間。而“拍照賺錢”就是移動互聯(lián)網(wǎng)下生成的一種自助式眾包服務模式。用戶通過下載相關APP,注冊成為APP的會員,然后從APP上領取需要拍照的任務(比如上超市去檢查某種商品的上架情況),賺取APP對任務所標定的酬金。相比于傳統(tǒng)的市場調查方式大大節(jié)省了調查成本,而且具有有效性和真實性,縮短了調查的周期。因此APP成為該平臺運行的核心,而APP中的任務定價就顯得極其重要。如果定價不合理,有的任務就會無人問津或人人瘋搶,而導致任務市場的不平衡。
二、模型的建立與求解
附件一所給任務基本分布在廣州、深圳、東莞和佛山四市范圍內??紤]到任務價格在65-85范圍內分布較為離散的特點,將價格分為如表2-1四個區(qū)間,每個區(qū)間的任務數(shù)量如表2-1所示。
結合各個城市核心商業(yè)區(qū)分布情況,可以得出如下初步推斷:
(1)數(shù)量最多且價格最低廉的任務點(圖中綠色十字),普遍分布在距離市中心非常近的區(qū)域內,這時的任務價格可能與便利的交通和主要城區(qū)低廉的交通成本有密切關系;
(2)處于價格范圍倒數(shù)第二梯隊的任務點(圖中紅色十字),普遍分布在距離市中心有一定距離,交通便利性方面開始不如市中心,即交通成本開始增加,帶來任務價格的增加;
(3)處于價格范圍倒數(shù)第三梯隊的任務點(圖中黃色十字),普遍分布在遠離市中心的郊區(qū)內,此時交通成本較市中心時顯著增加,帶來任務價格的顯著增加;
(4)處于價格范圍第一位的任務點(圖中藍色十字),分布較為雜亂,無明顯規(guī)律可循,且其任務價格較高,可能與該任務的復雜程度有關,受任務發(fā)布方主觀因素影響較大,可視為隨機因素。
利用k-means聚類法將所有任務點分為4類對其經(jīng)緯度進行聚類,由于k-means法的隨機性,這里選取其中一次聚類結果,如圖2-2所示,圖中黑色×為聚類簇重心,令其為所代表城市的修正中心:
按照經(jīng)緯度與標準地圖對比,可判斷出上圖中聚類1為深圳,聚類2為東莞,聚類3為廣州,聚類4為佛山。
1.定義分類規(guī)則。由于任務點價位隨距離市中心遠近有一定變化規(guī)律,但并沒有明確的各價位地理位置上的范圍,以及各市管轄任務點的分界線,故將4個價位分為4個模糊集合,代表65-70價位,代表70-75價位,代表75價位,代表80-85價位,并構造分步判別算法如下:
:考慮到任務價格中最高價位的分布較為隨機,無明顯規(guī)律可循,這里首先以附件一中樣本最高價位(80-85)的任務在總樣本中所占比例0.048作為初始判別的概率,即對任何樣本,第一步無差別地使其以0.048的幾率落入80-85價位對應的模糊子集中;
:對未隨機落入最高價位的任務點,記作,先分別計算其與四個城市的修正中心距離,將其劃入距離數(shù)值最小的城市,即
(2-1)
:根據(jù)任務點已確定的與所屬城市修正中心的距離,觀察其在城市的各價位層次判別半徑中的落入情況,以任務點與落入的半徑區(qū)間兩側圓周的距離為判別依據(jù),構造隸屬度,例如,若任務點落入代表的價位圓周與代表的價位圓周中,有
(2-2)
其中為任務點對的隸屬度,為任務點對的隸屬度,將其歸入隸屬度較大的相應模糊子集中,判別完成;若任務點落入?yún)^(qū)域只有單側判別圓周,則歸為該單側圓周所屬模糊子集。
:對已經(jīng)歸為對應模糊子集的任務點,等可能取得對應價格區(qū)間中的隨機數(shù),作為該任務點定價。
2.模糊分類任務定價模型的檢驗。根據(jù)上述模型中求出的相關數(shù)據(jù)及分類規(guī)則,利用MATLAB對附件一中所有樣本連續(xù)8次重復分類,將新的價格與原價格進行對比,計算出相關系數(shù),以及平均絕對誤差,在其中設置的隨機性參數(shù)的影響下每次結果略有不同,在下表中呈現(xiàn)出來。
由此可得,該模型可以解釋大多數(shù)的定價,且誤差可以接受。
3.未完成任務的原因分析。根據(jù)附件一中數(shù)據(jù),利用MATLAB依次繪制出深圳、東莞、廣州以及佛山各自區(qū)域內任務價格范圍分布圖,以及任務完成與未完成的平面分布圖(右側圖),以深圳為例。
根據(jù)上列各圖的觀察對比,可得到下列初步推斷:
(1)未完成任務中,任務價格在最低兩個范圍內的占大多數(shù);
(2)不同城市區(qū)域對低價任務的敏感程度不同,其中深圳最為敏感,反映在深圳大部地區(qū)低價任務幾乎都未完成;
(3)所有地區(qū)內高價任務(80-85范圍)完成率非常高,任務價格的提高對會員完成任務的積極性有顯著影響。
3.1基于實際情況和圖像直觀因素的初步分析。由2.中的初步推論,結合前文k-means聚類的相關結果,將附件一中所有任務劃入各自所屬的城市中分別分析,以深圳市為例。
(1)深圳市。對深圳市內所包含的所有任務數(shù)據(jù)進行分析,提取出下表中所示信息:
高價位時(80-85),對圖(2-2)中對應任務點進行觀察可發(fā)現(xiàn)這些任務本身數(shù)量就較少,且分布較為分散,落入低價任務點聚集的區(qū)域以及位于遠郊地區(qū)的孤立高價任務點均未完成,而落入中高價(75價位)任務分布較稠密地區(qū)的高價任務點全部完成,這可能與部分傾向于高價任務的用戶的心理因素有關,即孤立偏遠的高價任務在時間、交通成本等方面處于不利地位;中價位時(75),完成率最高,從圖(2-2)中也可看出這些任務分布較為密集,其中未完成的部分也均處于離群偏遠的地區(qū)。低價位時(65-75),完成率低下,通過與其他城市的橫向對比觀察,可發(fā)現(xiàn),在深圳地區(qū),低價的任務普遍調動不起會員的積極性,只有在深圳南山區(qū)附近,低價任務完成率“反?!钡厣?,通過查找深圳市統(tǒng)計局相關數(shù)據(jù),獲悉南山區(qū)是深圳人均GDP最高的區(qū),這也是影響該地低價任務完成率的重要因素。
(2)東莞市。據(jù)分析,與深圳市有著較大差別,東莞市內的所有價位的任務完成率都很高,所有價位的任務幾乎都以聚集或連續(xù)的條帶狀分布,而為數(shù)不多的未完成任務也均為離群的任務點,這與深圳市中高價位任務的完成情況相似。
(3)廣州市和佛山市。廣州市和佛山市市毗鄰處任務完成率較高,陷入低價任務密集分布區(qū)域的高價任務完成率低,且與前兩市情況相似,處于連續(xù)條帶分布狀態(tài)的任務完成率較高,這可能與用戶想在短時間低成本下盡可能完成更多的心理傾向有關。
3.2基于初步分析的具體因素量化分析。
通過3.1中對每個城市不同情況的分析,得出下列影響完成率的因素:
(1)高價位任務離散程度。在前面的分析中,我們考慮到高價位任務分布過于分散的情況下,單個的離群任務點幾乎不可能被完成,以深圳市為例,利用k-means法對深圳區(qū)域的80-85價位樣本點進行聚類,在分為四類的情況下如圖所示。
除左上角三個任務點形成一簇外,其余各點由于其過分分散,各自獨立為一簇,這些獨立出來的點即為未完成的三個任務點,同樣的,對廣州和佛山的高價位任務點進行相同處理。得到結果與前文中任務完成與否分布基本吻合,說明高價位的任務點的分散程度對高價任務完成情況有較大影響。
(2)地區(qū)經(jīng)濟發(fā)展水平的影響。從3.1中深圳市的情況可以看出,在一個經(jīng)濟水平高度發(fā)達的地區(qū),在其他地區(qū)試用的最低定價策略在此地區(qū)效用就大大降低,深圳市作為廣東省人均GDP最高(2016年為171304.78元)的城市,在低價位定價上應適當上浮,因此地方發(fā)展水平是影響各價位任務定價的重要因素之一。
三、結語
本文通過運用聚類分析及模糊數(shù)學的相關知識,對“拍照賺錢”任務定價問題進行了分析和研究。借鑒了打車軟件的現(xiàn)有資源,研究出影響任務完成的因素為距離的遠近及價格的高低。為眾包行業(yè)的普遍定價有了明確的方向。
參考文獻:
[1]吳金洪,陳強,鞠秀芳.用戶參與大數(shù)據(jù)眾包活動的意愿和影響因素探究[J].情報資料工作,2014(30):74-75.
[2]周浩亮.模糊數(shù)學基本理論及其應用[J].建井技術,1994(5):70-71.
[3]龐建剛.眾包社區(qū)創(chuàng)新的運營機制設計[D].中國科學技術大學,2014,44.
[4]司守奎,孫兆亮.數(shù)學建模算法與應用[M].北京:國防工業(yè)出版社,2016.9-15.
[5]楊志國,楊志凱,劉東軍,劉偉杰,張召.多任務環(huán)境下眾包平臺定價方法:中國,CN201610509294.X.[P].2016-12-07.