李宇鵬
摘要: “拍照賺錢”是一種新興的自助式服務模式,用戶下載注冊APP,并領取需要拍照的任務,完成任務后領取傭金,因此APP中的任務定價又是其核心要素,本文通過聚類分析和向量機的方式,給出定價的隨機模型。
Abstract: "Photographing and making money" is a new type of self-service model. Users download and register APP and receive tasks that need to be photographed. After the task is completed, they receive commissions. Therefore, the task pricing in APP is also a core element. This paper uses cluster analysis and the vector machine approach to give a stochastic model of pricing.
關鍵詞: 隨機正態(tài)分布;“隨手拍”;動態(tài)定價模型
Key words: random normal distribution;"snapshot";dynamic pricing model
中圖分類號:TP274 文獻標識碼:A 文章編號:1006-4311(2018)12-0201-02
0 引言
通過研究廣州市一些APP的定價與任務完成情況,研究相關項目的任務定價規(guī)律,分析任務未完成的原因,同時對于內(nèi)部不同的會員給予相關的優(yōu)惠并重新設計新的任務定價方案,并和原方案進行比較。在實際情況下,多個任務可能因為位置比較集中,導致用戶會爭相選擇,可以考慮將這些任務聯(lián)合在一起打包發(fā)布,那么該如何修改前面的定價模型,并考慮對任務完成情況的影響。
1 條件假設
在實際問題中,為了方便分析不妨假設:
①假設完成任務的難度相同。
②假設每個地區(qū)的人們對拍照賺錢的認知度和熱情不變。
③假設不存在短時間大規(guī)模會員加入或減少的情況。
2 問題分析
首先對所選取的數(shù)據(jù)進行初步的篩選工作,排除個別的異常點,將數(shù)據(jù)進行降序排列,選取數(shù)據(jù)主要聚集的地區(qū),從而對其進行研究,利用聚類分析的方法,對具體地區(qū)任務分布及完成情況進行研究,探究影響其分布及價格的因素。
3 模型建立與檢驗
模型一:多元回歸模型,不妨直接將問題簡化為簡單的線性問題,通過建立多元線性回歸方程,認為定價的價格與任務的位置、任務完成情況線性相關,通過spss的聚類分析可以求出理想聚類中心的數(shù)量,針對不同中心的實際情況通過引入任務的經(jīng)緯度,以及任務的完成情況作為自變量,任務的定價作為因變量,基于以上考慮建立三元線性回歸模型,首先對三個變量進行標準化處理,然后借助spss軟件可以求得函數(shù)的表達式。但是在數(shù)據(jù)檢驗中,R2的值較大,并且引入對聚類中心的距離后,R2改善的并不明顯,因此分析可能是存在不可預測性因子,或存在其他未知函數(shù)關系的影響,所以直接引用并不適用。
模型二:插值與數(shù)據(jù)擬合模型,參考彭芳瑜的基于插值與逼近的復雜曲面擬合[1]因此可以嘗試使用插值與逼近相結(jié)合的曲面擬合思路,構(gòu)造由初始曲面擬合到曲面逼近,及曲面細化3個步驟組成的曲面造型方法。實踐表明該種方法能較好地解決原始數(shù)據(jù)點分布不均勻的造型問題。由模型一可以得到任務定價與人物經(jīng)緯度具有相關性,考慮到任務完成情況的不可控性,所以消除該因子對價格的影響,可以利用MATLAB軟件對數(shù)據(jù)進行最小二乘的線性擬合,又分別進行多項式擬合??梢缘玫饺蝿斩▋r函數(shù)表達式為:
f(x)=?琢0+?琢1x1+?琢2x2+?琢3x3+…+?琢nxn(n為多項擬合次數(shù))
將具體數(shù)據(jù)代入后,可以求出插值與數(shù)據(jù)擬合模型表達式,對模型進行可靠性分析,通過隨機抽樣的方式將已知的數(shù)據(jù)代入原方程,將預測值與實際值進行比較,結(jié)果表明該插值方法結(jié)合最小二乘思路所得模型真實有效。相比較原來的方案,該方案的定價大大提高了任務的完成度,并充分考慮了經(jīng)緯度對價格的影響。
模型三:向量機模型,支持向量機是數(shù)據(jù)挖掘中的一項新技術,是借助于最優(yōu)化方法來解決機器學問題的新工具,最初由V.Vapnik等人[2]提出,近幾年來在向量機理論研究和算法實現(xiàn)等方面都取得了很大的進展,開始成為克服“維數(shù)災難”和學習困難的強有力手段,它的理論基礎和實現(xiàn)途徑基本框架已基本形成。
基本原理:根據(jù)給定的訓練集
T={(x1,y1)(x2,y2),…,(xt,yt)}∈(X*Y)t其中xi∈=Rn,X稱之為輸入空間,輸入空間內(nèi)的每一個點xi都由n個屬性特征組成。尋找Rn上的一個實際值函數(shù)g(x),以便用分類函數(shù)推斷任意一個模式下x相對應的y值問題。通過選取已知數(shù)據(jù)的一部分作為訓練集,作向量機模型,余下一部分可以作為對方案的檢驗集,建立模型后誤判率為28.73%,說明任務定價不夠合理,也就是說準確性為71.27%,但較之多元線性回歸模型和插值模型已有很大改進。
模型四:混合博弈模型,包含合作與對抗博弈,其中合作博弈的實質(zhì)是通過調(diào)整任務發(fā)布方與會員之間的資源優(yōu)化配置,使得任務交易系統(tǒng)逐步逼近均衡狀態(tài),從而實現(xiàn)資源總收益的最大化。而對抗博弈過程的實質(zhì)是會員以各種自身優(yōu)勢(信譽度、任務限額、距任務遠近)為調(diào)節(jié)杠桿,向其最大優(yōu)勢利用率逼近的方式來實現(xiàn)資源收益的最大化。
在實際情況下,多個任務可能會因為位置分布比較集中,導致用戶會爭相選擇,可以考慮將這些任務聯(lián)合在一起進行打包發(fā)布,對于眾包問題來說要把握的幾個原則:①價格臨近性,②位置聚攏性,③打包后定價少于打包前個任務累計價格。
參考基于忠誠度的眾包模式下用戶參與意愿影響因素分析[3],信譽值就可以作為衡量忠誠度的主要因素。大眾主要是出于一時興起而參與眾包,用戶的主要參與動機是獲得收益,就如BRABHAM所認為的。最后得出用戶滿意度和參與意愿是影響其信譽值的兩個主要因素。
而從會員信譽值分布表可以明顯看出大部分會員還是處于低信譽值區(qū)間,說明,雖然有較多的會員注冊數(shù)量,但大都積極性不高,僅僅是由于一時興起注冊了該類APP,從驗證了上述分析。
所以站在用戶視角發(fā)現(xiàn)當打包任務相互之間聯(lián)系越緊密(距離近、同一類任務)時,再加上合理的定價方案,才可以大大提高用戶參與度,從而提高任務成功率。
綜合比較多元線性回歸模型、混合博弈模型。支持向量機模型,可以試建立隨機正態(tài)分布的動態(tài)定價方案。
模型函數(shù)表達式如下:yi=rand(m,1)*20+65+f(ti)
m表示任務數(shù)目,由于最低價65~最高價85之間可分為20個1,該模型還可以用于支持向量機模型中,進行多次迭代選取任務成功率最高的定價方案。如此一來必然可以大大提高任務完成度。
4 模型評價
4.1 模型優(yōu)點
①在數(shù)據(jù)處理方面,通過Google earth批量發(fā)乳經(jīng)緯度,求出各任務及會員分布情況,能更好地排除異常點及孤立點數(shù)據(jù),再進行函數(shù)擬合,從而提高模型擬合優(yōu)度。
②多元回歸模型:雖然可以人工添加交叉項、二次項再做線性回歸分析。插值與數(shù)據(jù)擬合模型:抽取一定數(shù)量的樣本對模型理論結(jié)果與實際值進行檢驗統(tǒng)計分析,增強了結(jié)果的可信度。支持向量機的模型,確保了模型的可操作性,使算法更接近于實際應用。
③從線性和非線性兩方面分別進行對比建模分析,避免了只采用一種模型時所帶來的片面性、局限性,大大增強了說服力。
④最后我們建立了基于正態(tài)分布的多次迭代求n組任務定價,再利用MATLAB中支撐向量機函數(shù),對定價結(jié)果進行篩選,從而得出最優(yōu)的任務定價方案。
4.2 模型缺點
①多元回歸分析中相關性R2仍舊在0.2以下徘徊,又考慮到存在不可控因子(任務完成度),所以該類問題并不適用于多元回歸分析。此外多元線性回歸缺乏對非線性情況的討論,存在局限性。
②對數(shù)據(jù)進行數(shù)據(jù)處理時,采用了分層抽樣的方式,因而沒有對全部數(shù)據(jù)進行統(tǒng)計分析,這樣會對實驗結(jié)果產(chǎn)生一定影響。
參考文獻:
[1]彭芳瑜,周濟,周艷紅,周云飛.基于最小二乘法的曲面生成算法研究[J].工程圖學學報,1999(03):41-46.
[2]盧新元,龍德志,陳勇.基于忠誠度的眾包模式下用戶參與意愿影響因素分析[J].管理學報,2016,13(07):1038-1044.
[3]郭明瑋,趙宇宙,項俊平,張陳斌,陳宗海.基于支持向量機的目標檢測算法綜述[J/OL].控制與決策,2014,29(02):193-200.