• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于季節(jié)性ARIMA模型的移動(dòng)APP用戶活躍度分析

      2015-03-31 12:47:47佘宏俊胡夢緣
      中國經(jīng)貿(mào)導(dǎo)刊 2015年5期

      佘宏俊+胡夢緣

      摘要:APP日活躍人數(shù)是一個(gè)核心的APP運(yùn)營評(píng)價(jià)指標(biāo),且具有明顯的周期性效應(yīng)。本文通過季節(jié)性ARIMA模型對APP中的日活躍用戶數(shù)進(jìn)行建模分析,并基于已有歷史數(shù)據(jù)進(jìn)行預(yù)測能力評(píng)價(jià)。模型估計(jì)結(jié)果表明,季節(jié)性ARIMA模型能夠很好地?cái)M合APP日活躍用戶數(shù),有效地刻畫了數(shù)據(jù)中的周期性特征,并對未來趨勢給出了較為準(zhǔn)確的預(yù)測結(jié)果。該預(yù)測模型可以對APP未來市場運(yùn)營和營銷策略的制定提供一定的數(shù)據(jù)參考。

      關(guān)鍵詞:季節(jié)性ARIMA模型 日活躍用戶數(shù) 預(yù)測分析

      一、引言

      隨著移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,智能手機(jī)的日益普及,越來越多的用戶開始從傳統(tǒng)的PC端上網(wǎng)方式轉(zhuǎn)移到了移動(dòng)設(shè)備上網(wǎng),手機(jī)已經(jīng)成為第一大上網(wǎng)終端。同時(shí),網(wǎng)民在手機(jī)電子商務(wù)、休閑娛樂、社交通訊等應(yīng)用的使用率都在快速增長,移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展帶來了整個(gè)APP移動(dòng)應(yīng)用發(fā)展的高峰期。同時(shí),基于移動(dòng)APP的第三方數(shù)據(jù)統(tǒng)計(jì)平臺(tái)也逐漸興起,如Flurry、友盟,以及TalkingData,APP開發(fā)者可以根據(jù)它們提供的運(yùn)營數(shù)據(jù)了解市場需求及產(chǎn)品運(yùn)營情況。衡量APP運(yùn)營的統(tǒng)計(jì)指標(biāo)有APP啟動(dòng)次數(shù)、日新增用戶數(shù)、用戶留存率、日活躍用戶數(shù)及用戶付費(fèi)比率等,其中APP日活躍人數(shù)始終作為一個(gè)核心的軟件評(píng)價(jià)標(biāo)準(zhǔn),它度量了該軟件的受歡迎程度和未來的發(fā)展?jié)摿Γ怯?jì)算用戶留存率及軟件收入的基礎(chǔ)指標(biāo)。每日活躍用戶的變化可以反映以下信息,如趨勢走向,人氣波動(dòng)及產(chǎn)品質(zhì)量。因此,基于日活躍人數(shù)指標(biāo)的建模分析對APP未來市場運(yùn)營和營銷策略的制定有著重要的指導(dǎo)意義。

      目前,在移動(dòng)APP領(lǐng)域,常用的數(shù)據(jù)分析方法以描述性統(tǒng)計(jì)分析、聚類分析、相關(guān)性分析等靜態(tài)分析方法為主,而從動(dòng)態(tài)預(yù)測角度對APP運(yùn)營數(shù)據(jù)進(jìn)行分析的文獻(xiàn)很少。時(shí)間序列理論中的ARIMA模型理論充分利用歷史數(shù)據(jù)及其自身規(guī)律,建模簡單,預(yù)測精度高,非常適合單變量時(shí)間序列動(dòng)態(tài)分析,且已在諸多領(lǐng)域得到了廣泛的應(yīng)用。張勃采用ARIMA模型對甘肅省1949—2009年的生態(tài)足跡及生態(tài)承載能力進(jìn)行了動(dòng)態(tài)分析,并在此基礎(chǔ)上預(yù)測了該指標(biāo)2010—2015年的變化趨勢。[1]芮少權(quán)等考慮高速公路月度交通量周期性特征構(gòu)建了一個(gè)ARIMA預(yù)測模型。[2]張華初、林洪利用ARIMA模型建模分析了我國1978—2005年間社會(huì)消費(fèi)品零售額趨勢,并對其成因進(jìn)行了深入剖析。[3]本文以ARIMA模型作為分析方法,選擇APP中用戶日活躍人數(shù)作為研究對象進(jìn)行統(tǒng)計(jì)分析,同時(shí)由于用戶日活躍人數(shù)具有明顯的周期性效應(yīng),因此還需進(jìn)一步考慮季節(jié)性ARIMA模型。

      二、季節(jié)性ARIMA模型

      在時(shí)間序列分析中,某些數(shù)據(jù)序列例如公司股票的每股季度收益,宏觀經(jīng)濟(jì)中的GDP增長率、失業(yè)率等,往往會(huì)呈現(xiàn)一定的循環(huán)或者周期性特征,這類時(shí)間序列被稱為季節(jié)性時(shí)間序列。季節(jié)性變動(dòng)的周期間隔可以長至12個(gè)月、4個(gè)季度或者短至1周,這些周期性特征可能是由氣候、節(jié)日、政策等因素造成。在實(shí)際分析中,季節(jié)性因素會(huì)掩蓋數(shù)據(jù)序列中的真實(shí)變化原因,給研究該序列的發(fā)展趨勢帶來一定的阻礙。因此,有必要在數(shù)據(jù)分析過程中考慮季節(jié)性因素,范維等對宏觀經(jīng)濟(jì)數(shù)據(jù)中運(yùn)用的季節(jié)性調(diào)整方法進(jìn)行了綜述。一般而言,剔除季節(jié)性因素主要有兩類方法:一類是直接回歸建模,包括虛擬變量法,及使用含有季節(jié)因素的計(jì)量模型。例如,欒惠德,張曉峒借鑒 X—12—ARIM A 季節(jié)調(diào)整程序中的復(fù)活節(jié)模型建立了春節(jié)模型, 實(shí)證結(jié)果表明該模型能夠很好地消除季節(jié)調(diào)整中的春節(jié)效應(yīng)。另一類方法是兩步法,即對原始數(shù)據(jù)首先進(jìn)行季節(jié)性平滑處理或者移動(dòng)平均,剔除含有的季節(jié)性特征,然后再對調(diào)整后的數(shù)據(jù)進(jìn)行建模分析。例如,Engle處理高頻數(shù)據(jù)中普遍存在的日內(nèi)效應(yīng)問題時(shí)采用的三次樣條函數(shù)擬合方法。[4]

      由于APP數(shù)據(jù)具有明顯的周效應(yīng),因此本文直接采用含有季節(jié)性因素的ARIMA模型對APP數(shù)據(jù)進(jìn)行建模分析。季節(jié)性ARIMA模型與ARMA模型的思路相似,利用差分的方法剔除時(shí)間序列中的周期性特征。其中s是序列的周期,αt是白噪聲序列,該模型的AR部分就是由正規(guī)差分和季節(jié)差分兩部分構(gòu)成,而MA部分wt 考慮滯后t期的移動(dòng)平均項(xiàng)與滯后s期的季節(jié)移動(dòng)平均項(xiàng),例如wt=(1-θB)(1-ΘB7),|θ|<1,|Θ|<1,表示滯后1期的移動(dòng)平均項(xiàng)與滯后7期的季節(jié)移動(dòng)平均項(xiàng)的交互影響。通過估計(jì)該模型可以很好地解決季節(jié)性因素影響下ARIMA模型的建模預(yù)測問題。

      三、樣本數(shù)據(jù)及實(shí)證分析

      本文數(shù)據(jù)樣本采自友盟移動(dòng)應(yīng)用數(shù)據(jù)統(tǒng)計(jì)分析平臺(tái),以一款名為“利市”的財(cái)經(jīng)類APP為例,該軟件主要為廣大投資者提供股票市場的每日要聞及公告信息。樣本的時(shí)間段為2014年8月2日至2015年1月23日。為了簡化討論,暫時(shí)不考慮節(jié)假日因素帶來的影響,因此本文剔除國慶和元旦期間的假日數(shù)據(jù),剩余共計(jì)154個(gè)觀測值,同時(shí)選擇R語言為分析平臺(tái)。圖1(a)給出了樣本數(shù)據(jù)的時(shí)序圖,該數(shù)據(jù)圖是對原數(shù)據(jù)樣本中的日活躍用戶數(shù)取對數(shù)后的結(jié)果,從中可以發(fā)現(xiàn)該序列存在線性增長的趨勢,且有明顯的周期性波動(dòng)。具體而言,利市APP軟件的日活躍用戶具有明顯的周效應(yīng),即在周末時(shí)段活躍用戶數(shù)處于低谷,而從周一開始逐漸上升,周三附近達(dá)到本周的峰值,然后開始逐漸回落,這一現(xiàn)象也符合大眾的新聞閱讀習(xí)慣。

      令對數(shù)化后日活躍用戶數(shù)為xt,圖2(a)給出了xt的樣本自相關(guān)函數(shù)圖,其結(jié)果表明該數(shù)據(jù)具有很強(qiáng)的趨勢相關(guān)性,因此有必要通過一階差分去除這種相關(guān)性。同時(shí)從圖2(b)中發(fā)現(xiàn)樣本ACF存在以7為周期的循環(huán)模式,這正好是一周的天數(shù),這一模式充分表明了周效應(yīng)的影響不可忽視。圖1(b)和圖2(b)分別給出了一階差分后Δxt的序列圖和ACF圖,可以發(fā)現(xiàn)差分后的序列消除了向上趨勢,但是從Δxt的ACF圖中仍然可以觀察到滯后階數(shù)為7時(shí)存在顯著的正相關(guān)性,說明一階差分并不能剔除數(shù)據(jù)存在的周效應(yīng)。另一方面,單獨(dú)對xt進(jìn)行季節(jié)性處理后得到Δ7xt序列,其序列圖和ACF圖分別如圖1(c)和圖2(c)所示。經(jīng)過季節(jié)性差分處理后,發(fā)現(xiàn)原序列的周期性特征已經(jīng)明顯減弱,但是一階自相關(guān)性還是很強(qiáng),且呈現(xiàn)緩慢衰減的態(tài)勢。因此,必須通過季節(jié)性差分后再次進(jìn)行差分的方式,同時(shí)處理這兩類影響。圖1(d)和圖2(d)給出了最終處理后的數(shù)據(jù)序列圖和ACF圖,從圖2(d)中可以發(fā)現(xiàn)該數(shù)據(jù)的ACF周期性特征已經(jīng)消除,同時(shí)自相關(guān)性也大幅減弱。

      然后對變量xt、一階差分變量Δxt、季節(jié)性差分變量Δ7xt及季節(jié)性差分后再次差分變量Δ(Δ7xt)進(jìn)行單位根檢驗(yàn)。結(jié)果如表1所示,可以發(fā)現(xiàn)原始序列xt的P值為0.2128,說明拒絕存在單位根的原假設(shè)。而其他變量的單位根檢驗(yàn)在5%顯著性水平下都拒絕了原假設(shè),說明不存在單位根。

      下面運(yùn)用式(3)季節(jié)性ARIMA模型對調(diào)整后的變量進(jìn)行建模分析,并檢驗(yàn)該模型的預(yù)測效果。在這里,根據(jù)式(3)本文分別選擇:

      模型1:wt=(1-θB)(1-ΘB7),

      模型2:wt=(1-θ1B-θ2B2)(1-ΘB7),

      模型3:wt=(1-θ1B-θ2B2-θ3B3)(1-ΘB7),

      模型4:wt=1-θ1B-θ2B2-θ3B3-θ4B4)(1-ΘB7)

      作為四個(gè)不同的模型進(jìn)行比較,從中選出最合適的季節(jié)調(diào)整ARIMA模型,其估計(jì)結(jié)果如表2所示。

      從表2可以看出,模型3的對數(shù)似然值為166.37和AIC值為-322.74,在所有模型中其對數(shù)似然值最大且AIC值最小,同時(shí)對其殘差進(jìn)行檢驗(yàn)發(fā)現(xiàn),殘差相關(guān)性在較長的滯后期內(nèi)(Q(10)和Q(15))都是不顯著的,說明其殘差不具有相關(guān)性。綜合上述模型評(píng)價(jià)指標(biāo),可以得出結(jié)論,模型3是所有模型中擬合最優(yōu)的。圖3給出了模型3的殘差診斷圖,圖3(a)為標(biāo)準(zhǔn)化殘差圖,用于檢驗(yàn)殘差的iid假設(shè),可以發(fā)現(xiàn)除了在9月初由于軟件版本更新出現(xiàn)一定的異常波動(dòng)現(xiàn)象,其他時(shí)間段都較為平穩(wěn)。圖3(b)為殘差的ACF圖,所有的殘差A(yù)CF都在兩倍標(biāo)準(zhǔn)誤差范圍內(nèi)。圖3(c)是殘差序列Ljung-Box統(tǒng)計(jì)量的p值,如果模型能夠很好地?cái)M合數(shù)據(jù)中的序列相關(guān)性,其殘差序列的這些p值應(yīng)該都大于0.05,即殘差不存在序列相關(guān)性,而圖中的結(jié)果驗(yàn)證了這一結(jié)論,所有Ljung-Box統(tǒng)計(jì)量的p值都在0.05以上,殘差的診斷結(jié)果也說明模型3很好地?cái)M合了APP日活躍用戶序列。

      下面進(jìn)一步考察上述模型3的預(yù)測性能,本文將154個(gè)觀測值劃分為兩部分,前147個(gè)觀測值為訓(xùn)練樣本,后面7個(gè)觀測值作為測試樣本進(jìn)行預(yù)測評(píng)價(jià)。模型3為(1-B7)(1-B)xt=(1-0.3221B-0.1489B2-0.231B3)(1-0.9999B7)αt,以h=147為預(yù)測原點(diǎn)計(jì)算超前1—7步預(yù)測值和它們的標(biāo)準(zhǔn)誤差。首先給出了模型1—7步預(yù)測的結(jié)果值,其1步預(yù)測至7步預(yù)測的均值分別為454、575、793、811、828、814、741。圖4給出了模型3的預(yù)測結(jié)果圖,為方便論述,只給出了最后21個(gè)訓(xùn)練觀測值和7個(gè)預(yù)測值區(qū)間內(nèi)的效果圖,其中實(shí)線表示原始的數(shù)據(jù)序列,預(yù)測區(qū)間的真實(shí)值用“o”標(biāo)識(shí),點(diǎn)預(yù)測值用“*”標(biāo)識(shí)。虛線表示95%的區(qū)間預(yù)測。從圖中可以看出,預(yù)測值與實(shí)際觀測值相近,有著較強(qiáng)的周期性特征,真實(shí)值都位于區(qū)間預(yù)測范圍內(nèi)。上述分析充分說明模型3對于APP的日活躍用戶數(shù)有著良好的預(yù)測效果。

      四、結(jié)論

      本文通過季節(jié)性ARIMA模型對利市APP中的日活躍用戶數(shù)進(jìn)行了建模分析,并基于已有歷史數(shù)據(jù)預(yù)測了未來一周的用戶活躍數(shù)。利市APP日活躍用戶具有明顯的周效應(yīng),受節(jié)假日影響較大,由于樣本區(qū)間處于我國股票市場的牛市行情階段,因此該財(cái)經(jīng)類APP有著穩(wěn)定上升的趨勢。模型估計(jì)結(jié)果表明,季節(jié)性ARIMA模型能夠很好地?cái)M合APP日活躍用戶數(shù),有效地刻畫了數(shù)據(jù)中的周期性特征,并對未來趨勢給出了較為準(zhǔn)確的預(yù)測結(jié)果。該預(yù)測模型能夠?yàn)锳PP開發(fā)和運(yùn)營者制定未來市場戰(zhàn)略提供一定的數(shù)據(jù)參考。

      參考文獻(xiàn):

      [1]張勃,劉秀麗.基于 ARIMA 模型的生態(tài)足跡動(dòng)態(tài)模擬和預(yù)測——以甘肅省為例[J].生態(tài)學(xué)報(bào),2011, 31(20):6251—6260

      [2]芮少權(quán),匡安樂.高速公路月度交通量ARIMA預(yù)測模型[J].長安大學(xué)學(xué)報(bào):自然科學(xué)版,2010,30(4):82—85

      [3]張華初,林洪.我國社會(huì)消費(fèi)品零售額ARIMA預(yù)測模型[J].統(tǒng)計(jì)研究,2006 (7):58—60

      [4]Engle R F,Russell J R. Autoregressive conditio-

      nal duration: a new model for irregularly spaced transaction data[J]. Econometrica,1998:1127—1162

      [5]Tsay R S. Analysis of financial time series[M]. John Wiley & Sons,2005

      (佘宏俊,1985年生,湖北武漢人,東北財(cái)經(jīng)大學(xué)數(shù)學(xué)與數(shù)量經(jīng)濟(jì)學(xué)院博士研究生)

      宝坻区| 兴文县| 壤塘县| 桃江县| 察雅县| 建湖县| 剑河县| 黄平县| 平遥县| 阜阳市| 文山县| 韶关市| 枣阳市| 汉沽区| 平顶山市| 平南县| 会东县| 屯昌县| 钦州市| 济阳县| 蒙自县| 泗阳县| 长兴县| 临沂市| 淅川县| 恩施市| 琼中| 怀柔区| 尚义县| 静乐县| 宁城县| 临猗县| 台湾省| 昌黎县| 河东区| 嫩江县| 宝山区| 鲜城| 自贡市| 信阳市| 涿州市|