• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ARMA模型的在線電視劇流行度預測*

      2016-06-13 00:17:19陳春燕呂俊龍
      計算機與生活 2016年3期
      關鍵詞:時間序列

      陳春燕,張 鈺,?!?,呂俊龍

      1.蚌埠醫(yī)學院衛(wèi)生管理系,安徽蚌埠2330302.中國科學技術大學計算機科學與技術學院,合肥2300003.蚌埠學院計算機科學與技術系,安徽蚌埠233030

      ISSN 1673-9418 CODEN JKYTA8

      Journal of Frontiers of Computer Science and Technology 1673-9418/2016/10(03)-0425-08

      ?

      基于ARMA模型的在線電視劇流行度預測*

      陳春燕1,2,張鈺1,2,常標2,呂俊龍3+

      1.蚌埠醫(yī)學院衛(wèi)生管理系,安徽蚌埠233030
      2.中國科學技術大學計算機科學與技術學院,合肥230000
      3.蚌埠學院計算機科學與技術系,安徽蚌埠233030

      ISSN 1673-9418 CODEN JKYTA8

      Journal of Frontiers of Computer Science and Technology 1673-9418/2016/10(03)-0425-08

      E-mail: fcst@vip.163.com

      http://www.ceaj.org

      Tel: +86-10-89056056

      * The Natural Science Foundation of Anhui Province under Grant No. 1408085QF110 (安徽省自然科學基金); the Fundamental Research Funds for the Central Universities of China under Grant No. WK0110000042 (中央高?;究蒲袠I(yè)務費專項資金); the University Natural Science Foundation of Anhui Province under Grant No. KJ2015B071by (安徽省高等學校自然科學研究項目); the University ExcellentYouth Talents FoundationofAnhui Provinceunder Grant No.2010SQRL126(安徽省高等學校優(yōu)秀青年人才基金).

      Received 2015-05,Accepted 2015-07.

      CNKI網絡優(yōu)先出版: 2015-08-11, http://www.cnki.net/kcms/detail/11.5602.TP.20150811.1517.003.html

      Key words: autoregressive moving average model; popularity prediction; online teleplays; time series; sharing parameters

      摘要:在線電視劇的迅速普及和發(fā)展,引發(fā)了一個全新的研究問題,即在線電視劇流行度預測。電視劇情節(jié)演化的連續(xù)性,使相鄰劇集的流行度序列具有很強的線性相關性。擴展了自回歸滑動平均(autoregressive moving average,ARMA)模型。具體地,采用多集單天和多集多天兩種不同的建模策略,使用電視劇之間共享參數(shù)方法進行模型參數(shù)估計。利用均方根誤差(root mean squared error,RMSE)評價預測方法的準確性,在大量的真實數(shù)據(jù)集上的實驗表明,上述兩種策略相比于對比方法,可以使RMSE平均分別降低22.0%和32.3%。關鍵詞:自回歸滑動平均模型;流行度預測;在線電視??;時間序列;共享參數(shù)

      1 引言

      近年來,國內網民數(shù)量一直呈上升趨勢,數(shù)量超過6億,互聯(lián)網的普及率接近50%,各種網絡應用深刻改變著網民的生活。傳統(tǒng)的電視節(jié)目在觀看時間上使用戶受到了很大的限制,已經不能滿足老百姓的日常娛樂生活。這就促使了許多提供在線電視劇網站的迅速發(fā)展,國內也迅速涌現(xiàn)出了許多視頻網站,如優(yōu)酷、愛奇藝等。使用網絡在線觀看電視連續(xù)劇,已經成為很多互聯(lián)網用戶的主要娛樂生活。

      目前國內外的研究多集中在用戶生成內容(user generated content,UGC)的流行度的預測,文獻[1]針對論壇討論帖的流行度預測問題,提出了融合多個動態(tài)因素的討論帖流行度預測。文獻[2]也是討論在線內容的流行度預測。文獻[3]提出的方法能夠精確地預測在視頻流行度問題上各種未知內容的影響。

      然而在線電視劇有它固有的特點,網站提供電視連續(xù)劇通常不會一次性更新所有劇集,而是在固定時間(每天或每周)更新一集或多集。而電視劇更新時間不同也可能會吸引不同的觀眾,比如在周末或節(jié)假日更新可能會吸引更多的上班族和學生來觀看。這就引發(fā)了一個非常實際的問題,如果能夠預測在線電視劇的流行度,可以有更廣闊的應用前景,如給用戶推薦電視劇[4]、廣告投放[5-6]等。

      若根據(jù)昨天的播放量或前若干天播放量的平均值來進行預測,則這種方法忽略了電視劇劇情發(fā)展的特點。電視劇的情節(jié)演化是在相鄰集之間,并且有強烈的順序依賴性,這是典型的時間序列[7-8]預測問題。相鄰劇集的流行度有強烈的線性相關性,本文充分考慮在線電視劇時間序列的特點和相鄰集之間的線性相關性,使用自回歸滑動平均(autoregressive moving average, ARMA)模型預測在線電視劇的流行度。在真實數(shù)據(jù)集上的實驗表明,此方法預測在線電視劇的流行度是非常有效的。

      2 問題定義

      網站通常在固定的時間更新劇集,每天或每周更新一集或多集,本文中約定同一時間更新的劇集當作一集來處理。觀眾可以在劇集更新后的任意時間觀看,更新后每一集的觀看量就組成了電視連續(xù)劇的流行度記錄[9]。

      下面介紹本文使用的符號:

      每一部在線電視劇T包括n集,記作T={e1, e1, …,ei,…, en},其中第ei集在時間戳ti釋放,相鄰兩集的更新時間間隔記為?t=ti-ti-1。

      取相鄰劇集的更新時間間隔為一個單位時間,劇集更新后每個單位時間內的觀看量構成了每一集的流行度。因此,ei集的流行度可以用如下時間序列[10]描述,即φi={vi1,vi2},其中vij表示ei在更新后的第j個單位時間間隔的流行度。我國電視劇單位時間間隔通常為一天,如v21表示第2集在更新后第一天的觀看量。用表1說明上述問題。

      從表1可以看出,不同的劇集是在不同的時間戳被更新的,那么不同的劇集ei的流行度記錄時間序列φi的長度是不同的。電視劇T的流行度記錄由每一集的流行度構成[11],記為?n={φ1,φ2,φi},其中i≤n。

      Table 1   Popularity records of online teleplay表1 一部在線電視劇的流行度記錄

      綜合以上所述,現(xiàn)給出電視劇流行度預測問題如下:給定在線電視劇T,已經發(fā)布了前i集,它的流行度記為?i={φ1,φ2,φi},預測目標是下一集(即第i+1集)在發(fā)布后的流行度記錄φi+1,φi+1= {vi+1,1,vi+1,2}。

      本文的主要工作是根據(jù)歷史劇集的流行度記錄預測即將發(fā)布劇集的流行度。然而電視劇的情節(jié)在相鄰劇集間有密切的相關性,有強烈的順序特征,符合時間序列的特征,這種特征可以用自回歸模型很好地表示[12]。因此本文利用相鄰劇集流行度序列的相關性,使用自回歸滑動平均模型ARMA預測在線電視劇的流行度。

      3  ARMA模型預測流行度

      ARMA流行度預測模型考慮了相鄰劇集間流行度序列的依賴性,利用歷史電視劇流行度數(shù)據(jù)訓練模型,訓練過程如算法1所示。算法首先對歷史電視劇流行度數(shù)據(jù)進行預處理,過濾流行度數(shù)據(jù)、集數(shù)太少、異常等的電視??;然后按照“多集單天”或“多集多天”的建模策略,提取相應的特征,構成原始數(shù)據(jù)矩陣,并使用min-max方法標準化每行數(shù)據(jù);最后根據(jù)第4章介紹的參數(shù)估計方法訓練ARMA模型,得到模型參數(shù)。使用得到的模型便可預測流行度。

      算法1 ARMA流行度預測模型訓練算法

      輸入:歷史電視劇流行度數(shù)據(jù)。

      輸出:ARMA模型參數(shù)。

      (1)歷史電視劇流行度數(shù)據(jù)預處理;

      (2)根據(jù)第3.1或3.2節(jié)中建模策略提取特征;

      (3)特征數(shù)據(jù)標準化;

      (4)根據(jù)第4章參數(shù)估計方法訓練ARMA模型。

      3.1多集單天ARMA模型

      本文使用ARMA模型[13],在劇集發(fā)布后的第j個單位時間間隔內,利用已經更新過的劇集的流行度去預測新劇集的流行度。本文用表2來進一步說明,使用相同顏色表示的流行度去預測新釋放劇集的流行度,也就是用(v1j, v2j, vi-1, j)去預測vij的流行度。具體地說,如預測v41,即第4集在發(fā)布后的第1天的流行度。使用第1、2、3集在發(fā)布后第1天的流行度去預測,即使用v11、v21和v31來預測v41。

      Table 2  Multiple episodes single day data表2 多集單天使用數(shù)據(jù)

      把每一集在更新后第j個單位時間間隔的流行度vij表示為先前p集在更新后第j個單位時間間隔的流行度的線性組合,即:

      其中,α是自動回歸系數(shù);β是滑動平均系數(shù)。誤差項εt假設是獨立同分布的隨機變量,服從均值為0,方差為σ2的正態(tài)分布[14],εtN(0,σ2)。

      式(1)中,模型參數(shù)為w=(α0,α1,αp,1,β1, β, Z=(1,vi-1,j,vi-p,j,εi,εi-1,εi-q)。式(1)可以寫成:

      3.2多集多天ARMA模型

      本文使用的方法是在劇集發(fā)布后的第j個單位時間間隔內,利用已更新的劇集的流行度去預測即將更新的劇集的流行度。在表2中體現(xiàn)為,預測新劇集的流行度只使用相同顏色標識的流行度數(shù)據(jù)。這樣就導致了在新劇集更新前的一部分流行度數(shù)據(jù)被忽略了,而這部分數(shù)據(jù)可能會對新劇集的流行度也有較大的影響。現(xiàn)在舉例說明,在表3中仍然以預測v41為例。第2.1節(jié)中使用的數(shù)據(jù)是第1、2、3集在發(fā)布后第1天的流行度,即v11、v21和v31。但是由于電視連續(xù)劇的劇情在相鄰集之間有強烈的相關性和順序依賴特征,對于v41而言,v11的影響可能不如v22(第2集在更新后第2天的流行度)對v41的影響效果明顯,而在式(1)中恰恰把v22忽略了。其次,有些用戶由于工作或學習的原因沒在劇集更新后的當天觀看,而是等到周末或節(jié)假日劇集已經更新過一段時間后才觀看,這時可以同時觀看網站連續(xù)多天的更新劇集,這部分觀眾或許也是這部電視劇的粉絲。

      本節(jié)預測更新劇集的流行度使用的數(shù)據(jù)在表3中進行詳細說明。使用被預測流行度(紅色標識)左上三角區(qū)域的歷史流行度數(shù)據(jù)(藍色標識)來預測。如預測v41使用前兩集在v41左上三角的流行度數(shù)據(jù),也就是p=2時,使用v21、v22和v31進行計算。如果令p=3,此時使用前三集在v41左上三角的流行度數(shù)據(jù),那就是使用6個數(shù)據(jù),再多加v11、v12和v13。

      Table 3  Multiple episodes multi day data表3 多集多天使用數(shù)據(jù)圖示

      同樣,預測第i集在更新后第j個單位時間的流行度vij,使用先前p集在其左上三角的流行度數(shù)據(jù)的線性組合,式(1)可以改寫為:

      n=1m=1

      其中p, q∈[1, i-1]。把式(3)展開即為:

      在式(4)中,模型參數(shù)仍然記為w,w=(α0,α11,α21, α22,α31,α32,α33,1,β11,β21,β22,β31,β32,β33)T,Z=(1, vi-1,j, vi-2,j, vi-2,j+1, vi-3,j, vi-3,j+1,vi-3,j+2,εi,εi-1,j,εi-2,j, εi-2,j+1,εi-3,j,εi-3,j+1,εi-3,j+2)

      基于上述表示,式(4)可以表示為式(2)的形式,即:vij=wTZ

      4  ARMA模型參數(shù)估計

      為了獲得更好的預測結果,本文使用了共享參數(shù)方法學習模型參數(shù)。假定所有在線電視劇有共同的參數(shù),使用共享參數(shù)方法來學習模型的參數(shù)[15]。

      給定一部在線電視劇的訓練集T和它的流行度記錄?={φ1,φ2,φs},按照經驗風險最小化的策略求解參數(shù),即多項式的系數(shù)。損失函數(shù)使用平均相對平方誤差[16](mean relative squared error,mRSE),即:

      其中vij是電視劇真實的流行度。使損失函數(shù)L(w)最小化,求解參數(shù)w,即:

      對w求偏導數(shù)并令其為0,可以求解w,然后得到最優(yōu)解w[17]。

      ARMA參數(shù)估計算法[18]如下:

      (1)估計高階AR;

      (2)估計沒有被觀察到的噪聲εt;

      (3)回歸vij到vi-1,j, vi-2,j,…,vi-p,j,εi-1,j,εi-2,j,…, εi-q,j;

      (4)再次回歸提高εt的估計。

      5 實驗

      5.1實驗數(shù)據(jù)

      實驗數(shù)據(jù)是從優(yōu)酷網(http://www.youku.com/)爬取的從2012-05-01至2014-09-08上映的我國電視劇播放量數(shù)據(jù),網站提供電視劇上映后每集每天的播放量信息,電視劇會每天更新至少一集。先從電視劇列表頁(http://www.youku.com/v_olist/c_97.html)獲取待爬取的電視劇IDs,然后根據(jù)IDs構造電視劇播放信息所對應的頁面URL,即優(yōu)酷指數(shù)(http:// index.youku.com/),例如電視劇《古劍奇譚》在優(yōu)酷內的ID是z9ffa9418853611e2a19e,所對應的優(yōu)酷指數(shù)頁面URL是http://index.youku.com/vr_show/showid_ z9ffa9418853611e2a19e.html。過濾掉集數(shù)比較少的電視劇后,實驗數(shù)據(jù)最終包括211部電視劇,而且電視劇集數(shù)分布如圖1所示。

      從圖1中可以看出,大部分的電視劇在25集到44集之間,并且電視劇通常是每天發(fā)布一集或多集,換句話說,電視劇的更新頻率是一天。因此在實驗中,設置電視劇的預測單位時間為一天。

      實驗數(shù)據(jù)所用211部電視劇的觀看量的統(tǒng)計結果分別展示在圖2和圖3中。圖2展示了211部電視劇每集在更新后一周內的平均觀看量。從圖2中可以看出,不同電視劇的流行趨勢有很大的差別,只有少數(shù)電視劇的觀看量非常多。因此預測在線電視劇的流行度是很有必要的。

      圖3展示了電視劇每集在上映后15天內的平均觀看量??梢钥闯龃蠖鄶?shù)觀眾選擇在上映后第一天觀看,從第2天開始觀看量驟減,第5天后觀看量的降幅趨于平穩(wěn)。因此在實驗中,預測新劇集在上映后7天的觀看量。

      Fig.2  Views of each episode in the first week圖2 每集首周平均播放量

      Fig.3  Average views of every day圖3 單天平均播放量

      5.2對比方法和評價指標

      為了評價ARMA模型在預測電視劇流行度時的性能,在實驗中與文獻[9]中的樸素自回歸模型(Naive Autoregressive Model,NAR)進行比較。

      把ARMA模型分為多集單天和多集多天兩種策略,分別記為ARMA-s和ARMA-m。利用均方根誤差(root mean square error,RMSE)[19]去評價流行度預測的效果,其定義為:

      其中,Pi為預測值;Ri為真實值;N為測試集大小。RMSE越小表明流行度預測效果越好。

      5.3實驗結果

      為了降低模型訓練的不確定性,利用五折交叉驗證來評價模型的性能。通過實驗證明使用被預測劇集前4集的流行度數(shù)據(jù)進行預測,能夠達到較好的預測效果。因此在本文實驗中取p=4。當p=4,q取不同值時,ARMA-s和ARMA-m方法的均方根誤差RMSE如圖4所示。

      從圖4中可以看出,取不同q值時,ARMA-s方法均方根誤差基本穩(wěn)定;當q<6時ARMA-m方法的均方根誤差比較大,當q≥6時均方根誤差趨于穩(wěn)定??傊?,當p=4,q取6時可以達到比較好的預測效果,使用更多的信息(q>6)并不意味著更好的效果。

      Fig.4  RMSE graph with different q圖4 不同q時RMSE曲線圖

      對本文方法與文獻[9]中的NAR方法進行比較。NAR方法使用先前3集的觀看量可以達到較好的預測效果,ARMA使用先前4集的流行度數(shù)據(jù)可以達到較好的預測效果。預測新劇集在播放后7天的播放量,均方根誤差詳細的比較結果展示在圖5中。

      Fig.5  RMSE graph with different algorithms圖5 不同算法的RMSE圖

      從圖5中可以看出,ARMA-s和ARMA-m比NAR預測效果要好,有較低的RMSE,可以使RMSE平均分別降低22.0%和32.3%。特別是在第4天時,ARMA-s方法的均方根誤差比NAR方法降低了29.8%,ARMA-m方法的均方根誤差比NAR方法降低了48.3%??傮w來說,ARMA模型的多集單天和多集多天策略的預測效果要比NAR方法好。從圖5中也可以看出,預測第一天時ARMA-s方法的RMSE要比ARMA-m方法低,而從第二天開始ARMA-m方法的效果要比ARMA-s好。這是因為第一天的播放規(guī)律不明顯,ARMA-m使用多集多天的信息太多,所以效果不好;在第二天以后播放量變化規(guī)律明顯,所以使用多集多天的效果更好。新劇集隨著發(fā)布時間的推移,播放量的變化規(guī)律逐漸變得明顯。因此隨著時間的推移,RMSE也逐漸降低,并且在第4天后趨于穩(wěn)定。

      為了更好地說明模型預測流行度的效果,圖6給出了使用ARMA-m模型(其中p=4,q=6)預測電視劇“產科男醫(yī)生”每次更新后第一天播放量的示例。此電視劇周一到周五每次更新3集,周六至周日更新兩集,把每次更新的劇集的播放量平均值作為此次更新的播放量。從圖6中可以看出,ARMA-m模型可以準確地預測每次更新劇集第一天的平均播放量,驗證了方法的有效性。

      Fig.6  ARMA-m predciting example圖6  ARMA-m預測示例

      6 結束語

      在線電視劇的流行度相鄰集之間有強烈的線性相關性,本文采用多集單天和多集多天兩種不同的建模策略擴展了ARMA模型,通過已更新劇集的流行度預測即將更新的新劇集的流行度。與傳統(tǒng)方法相比,預測結果更具有準確性和參考價值。在真實數(shù)據(jù)集上的實驗結果也表明,實際預測效果非常好,精度較高,與電視劇的實際觀看量非常接近??傊褂肁RMA模型預測在線電視劇的流行度,實驗表明此方法是非常有效的。未來可以探索融入其他數(shù)據(jù),如評論、搜索量等,進一步提高預測精度。

      References:

      [1] Kong Qingchao, Mao Wenji. Predicting popularity of forum threads based on dynamic evolution[J]. Journal of Software, 2014, 25(12): 2767-2776.

      [2] Szabo G, Huberman B A. Predicting the popularity of online content[J]. Communication of the ACM, 2010, 53(8): 80-88.

      [3] Borghol Y, Ardon S, Carlsson N, et al. The untold story of the clones: content-agnostic factors that impact YouTuBe video popularity[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery in Database, Beijing, China, Aug 12-16, 2012. New York, USA: ACM, 2012: 1186-1194.

      [4] Yin Peifeng, Luo Ping, Wang Min, et al. A straw shows which way the wind blows: ranking potentially popular items from early votes[C]//Proceedings of the 5th ACM International Conference on Web Search and Data Mining, Seattle, USA, Feb 8-12, 2012. New York, USA:ACM, 2012: 623-632.

      [5] Himabindu L, Jitendra A. Attention prediction on social media brand pages[C]//Proceedings of the 20th ACM International Conference on Information and Knowledge Management, Glasgow, England, Oct 24-28, 2011. New York, USA: ACM, 2011: 2157-2160.

      [6] Ahmed M, Spagna S, Huici F. A peek into the future: predicting the evolution of popularity in user generated content [C]//Proceedings of the 6th ACM International Conference on Web Search and Data Mining, Rome, Italy, Feb 4- 8, 2013. New York, USA:ACM, 2013: 607-616.

      [7] Han J W, Kamber M. Data mining: concepts and techniques [M]. Fan Ming, Meng Xiaofeng, translated. 2nd ed. Beijing: China Machine Press, 2007: 306-345.

      [8] Yu Yufeng, Zhu Yuelong, Wan Dingsheng, et al. Time series outlier detection based on sliding windows prediction[J]. Journal of Computer Applications, 2014, 34(8): 2217-2220.

      [9] Chang Biao, Zhu Hengshu, Ge Yong, et al. Predicting the popularity of online serials with autoregressive models[C]// Proceedings of the 2014 International Conference on Information and Knowledge Management, Shanghai, China, Nov 3-7, 2014. New York, USA:ACM, 2014: 1339-1348.

      [10] Zhang Dengyi, Ouyang Chufei, Wu Wenli. Cluster-based hidden Markov model in time series multi-step prediction[J]. Chinese Journal Electronics, 2014, 42(12): 2359-2364.

      [11] Figueiredo F, Almeida J M, Benevenuto F, et al. Does content determine information popularity in social media?[C]// Proceedings of the 2014 ACM Conference on Human Factors in Computing Systems, Toronto, Canada, Apr 26-27, 2014. New York, USA:ACM, 2014: 979-982.

      [12] Lütkepohl H. New introduction to multiple time series analysis[M]. New York: Springer Press, 2007: 447-491.

      [13] Autoregressive-moving-average model[EB/OL].[2014-12-20]. http://en.wikipedia.org/wiki/Autoregressive%E2%80%93 moving-average_model.

      [14] Barnard R W. Trindade AA, Wickramasinghe R I P. Autoregressive moving average models under exponential power distributions[J]. ProbStat Forum, 2014, 7: 65-77.

      [15] Merabti H, Massicotte D. FPGA based implementation of a genetic algorithm for ARMA model parameters identification[C]//Proceedings of the 2014 International Conference on Great Lakes Symposium on VLSI Systems, Houston, USA, May 21-23, 2014. New York, USA:ACM, 2014: 95-96.

      [16] Pinto H, Almeida J, Gon?alves M A. Using early patterns to predict the popularity of YouTuBe videos[C]//Proceedings of the 6th ACM International Conference on Web Search and Data Mining, Rome, Italy, Feb 4-8, 2013. New York, USA:ACM, 2013: 365-374.

      [17] Murphy K P. Machine learning: a probabilistic perspective [M]. Boston: MIT Press, 2012: 217-244.

      [18] Hannan E J, Rissanen J. Recursive estimation of mixed autoregressive moving average order[J]. Biometrika, 1982, 69 (1): 81-94.

      [19] Bishop C M. Pattern recognition and machine learning[M]. New York: Springer Press, 2006: 179-224.

      附中文參考文獻:

      [1]孔慶超,毛文吉.基于動態(tài)演化的討論帖流行度預測[J].軟件學報, 2014, 25(12): 2767-2776.

      [7] Han J W, Kamber M.數(shù)據(jù)挖掘:概念與技術[M].范明,孟小峰,譯. 2版.北京:機械工業(yè)出版社, 2007: 306-345.

      [8]余宇峰,朱躍龍,萬定生,等.基于滑動窗口的水文時間序列異常監(jiān)測[J].計算機應用, 2014, 34(8): 2217-2220.

      [10]章登義,歐陽黜霏,吳文李.針對時間序列多步預測的聚類隱馬爾科夫模型[J].電子學報, 2014, 42(12): 2359-2364.

      CHEN Chunyan was born in 1981. She received the M.S. degree in computer applications from Jiangnan University in 2008. Now she is a lecturer at Bengbu Medical College. Her research interests include data mining and machine learning, etc.陳春燕(1981—),女,安徽蚌埠人,2008年于江南大學計算機應用專業(yè)獲得碩士學位,現(xiàn)為蚌埠醫(yī)學院講師,主要研究領域為數(shù)據(jù)挖掘,機器學習等。

      ZHANG Yu was born in 1979. She received the M.S. degree in computer applications from Hefei University of Technology. Now she is a lecturer at Bengbu Medical College. Her research interests include data mining and pattern recognition, etc.張鈺(1979—),女,安徽蚌埠人,2012年于合肥工業(yè)大學計算機應用專業(yè)獲得碩士學位,現(xiàn)為蚌埠醫(yī)學院講師,主要研究領域為數(shù)據(jù)挖掘,模式識別等。

      CHANG Biao was born in 1990. He is a Ph.D. candidate at University of Science and Technology of China. His research interests include pattern recognition and machine learning, etc.常標(1990—),男,安徽阜陽人,中國科學技術大學計算機應用技術博士研究生,主要研究領域為模式識別,機器學習等。

      LV Junlong was born in 1979. He received the M.S. degree in control theory and engineering from Jiangsu University in 2010. Now he is a lecturer at Bengbu College. His research interests include data mining and machine learning, etc.呂俊龍(1979—),男,安徽蚌埠人,2010年于江蘇大學控制理論與控制工程專業(yè)獲得碩士學位,現(xiàn)為蚌埠學院講師,主要研究領域為數(shù)據(jù)挖掘,機器學習等。

      Predicting Popularity of Online Teleplays with ARMAModels?

      CHEN Chunyan1,2, ZHANG Yu1,2, CHANG Biao2, LV Junlong3+
      1. Department of Health Management, Bengbu Medical College, Bengbu,Anhui 233030, China
      2. School of Computer Science and Technology, University of Science and Technology of China, Hefei 230000, China
      3. Department of Computer Science and Technology, Bengbu College, Bengbu,Anhui 233030, China
      + Corresponding author: E-mail: ccyljl@126.com

      CHEN Chunyan, ZHANG Yu, CHANG Biao, et al. Predicting popularity of online teleplays with ARMA models. Journal of Frontiers of Computer Science and Technology, 2016, 10(3): 425-432.

      Abstract:With the rapid prevalence and development of online TV series (or teleplays), there is a novel research problem, predicting the popularity of online teleplays. The continuity of teleplay plots makes the popularity of adjacent episodes have a strong correlation. This paper extends the classical autoregressive moving average (ARMA) model. Specifically, this paper considers two modeling strategies, namely multiple episodes and single day, and multiple episodes and multiple days. Both of them use the sharing parameter method to estimate the model parameters. This paper applies the root mean squared error (RMSE) as the evaluation measure, many experiments on a real-world dataset show that the above two strategies can reduce RMSE by 22.0% and 32.3% respectively.

      doi:10.3778/j.issn.1673-9418.1505053

      文獻標志碼:A

      中圖分類號:TP181

      猜你喜歡
      時間序列
      基于分布式架構的時間序列局部相似檢測算法
      基于嵌入式向量和循環(huán)神經網絡的用戶行為預測方法
      醫(yī)學時間序列中混沌現(xiàn)象的初步研究
      科技視界(2016年26期)2016-12-17 17:12:56
      基于時間序列分析南京市二手房的定價模型
      科教導刊(2016年29期)2016-12-12 08:35:54
      云南銀行產業(yè)集聚與地區(qū)經濟增長研究
      時代金融(2016年30期)2016-12-05 19:55:50
      基于Eviews上證綜合指數(shù)預測
      時代金融(2016年29期)2016-12-05 16:12:09
      上證綜指收益率的影響因素分析
      時代金融(2016年27期)2016-11-25 17:21:02
      基于指數(shù)平滑的電站設備故障時間序列預測研究
      基于時間序列的我國人均GDP分析與預測
      商(2016年32期)2016-11-24 16:20:57
      基于線性散列索引的時間序列查詢方法研究
      軟件工程(2016年8期)2016-10-25 15:43:57
      海宁市| 闸北区| 铜山县| 西盟| 新和县| 兴仁县| 宁陵县| 肥城市| 九龙城区| 新干县| 策勒县| 象山县| 通山县| 通海县| 镇宁| 阿尔山市| 白银市| 新绛县| 罗源县| 大悟县| 横山县| 体育| 长岭县| 克山县| 昌邑市| 阳春市| 道孚县| 弥渡县| 芒康县| 宁强县| 岐山县| 托克逊县| 青海省| 延安市| 昭平县| 巩义市| 德兴市| 睢宁县| 双城市| 沙湾县| 阳江市|