郭苗苗
摘要:電影行業(yè)是我國(guó)文化產(chǎn)業(yè)的核心,而電影票房收入影響著電影行業(yè)以及我國(guó)文化產(chǎn)業(yè)的持續(xù)發(fā)展,因此對(duì)電影票房的預(yù)測(cè)就顯得尤為重要。文章以2013年3月至2018年12月全國(guó)電影票房收入為數(shù)據(jù)基礎(chǔ),建立了全國(guó)電影票房收入的自回歸移動(dòng)平均(ARIMA)模型,并對(duì)2019年1月至2019年10月我國(guó)電影票房收入進(jìn)行了預(yù)測(cè)。
Abstract: The film industry is the core of China's cultural industry, and the movie box office income affects the film industry and the sustainable development of China's cultural industry. Therefore, the prediction of the box office of the movie is particularly important. Based on the national box office receipts from March 2013 to December 2018, this paper establishes the autoregressive moving average (ARIMA) model of national box office receipts, and the box office receipts of Chinese movies from January 2019 to October 2019. A prediction was made.
關(guān)鍵詞:ARIMA模型;電影票房收入;預(yù)測(cè)
Key words: ARIMA model;movie box office income;forecast
中圖分類號(hào):J943 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào):1006-4311(2019)20-0258-04
0 ?引言
隨著人民生活水平的不斷提高,電影已經(jīng)成為人們娛樂(lè)消費(fèi)的一種新方式。與此同時(shí)作為我國(guó)文化產(chǎn)業(yè)的重要組成部分,電影行業(yè)在良好的政策支持下取得了飛速發(fā)展。2010年國(guó)務(wù)院提出要將文化產(chǎn)業(yè)發(fā)展為國(guó)民經(jīng)濟(jì)支柱產(chǎn)業(yè)。2017年《中華人民共和國(guó)電影產(chǎn)業(yè)促進(jìn)法》的實(shí)施標(biāo)志著我國(guó)電影行業(yè)立法的突破,也是我國(guó)文化體制改革的巨大進(jìn)步。據(jù)統(tǒng)計(jì)2018年共上映400多部新電影,全國(guó)電影總票房收入超過(guò)593億元。電影行業(yè)的快速發(fā)展推動(dòng)了投融資方式的不斷拓展,影片預(yù)售融資、版權(quán)質(zhì)押、電影版權(quán)資產(chǎn)證券化等融資方式不斷出現(xiàn)[1]。但電影行業(yè)作為高風(fēng)險(xiǎn)的文化行業(yè),其投資的市場(chǎng)風(fēng)險(xiǎn)巨大。我國(guó)是全球第3大電影生產(chǎn)國(guó),目前我國(guó)電影市場(chǎng)上只有少數(shù)電影投資能夠盈利,大部分的電影項(xiàng)目難以收回成本[2]。電影票房作為一部電影的經(jīng)濟(jì)收入,在一定程度上代表了該電影投資項(xiàng)目是否成功,因此電影票房收入的預(yù)測(cè)是確保電影發(fā)行投資回報(bào)、控制發(fā)行風(fēng)險(xiǎn)的重要手段,對(duì)于電影項(xiàng)目投資決策有著重要的實(shí)際意義。同時(shí)電影票房還影響著其衍生品產(chǎn)業(yè)的發(fā)展?jié)摿?,是電影產(chǎn)業(yè)持續(xù)發(fā)展的動(dòng)力源泉;從文化效益來(lái)看,電影票房代表著文化傳播的社會(huì)效益,同時(shí)也決定著電影產(chǎn)業(yè)的經(jīng)濟(jì)效益和文化效益的綜合貢獻(xiàn)水平[3]。
關(guān)于電影票房的研究開(kāi)始于20世紀(jì)80年代,其中巴瑞·李特曼提出的經(jīng)典的電影票房研究模型奠定了電影票房研究的基本模型和方法[4]。近年來(lái),有學(xué)者基于網(wǎng)絡(luò)搜索引擎的數(shù)據(jù)研究了其對(duì)電影票房的影響。Kulkarni等人研究發(fā)現(xiàn)上映之前關(guān)于影片的網(wǎng)絡(luò)搜索存在一定的規(guī)律性,并且加入網(wǎng)絡(luò)搜索這一影響因素可以提高預(yù)測(cè)精度[5]。王煉建立了基于網(wǎng)絡(luò)探索的票房預(yù)測(cè)模型,證明了網(wǎng)絡(luò)搜索量以及增長(zhǎng)趨勢(shì)都能預(yù)測(cè)到該影片的首映周票房[6]。大數(shù)據(jù)技術(shù)的發(fā)展解決了電影行業(yè)相關(guān)數(shù)據(jù)獲取方式少,獲取難度大和數(shù)據(jù)量小等問(wèn)題,因此對(duì)電影票房預(yù)期的研究也越來(lái)越多。王文文選擇在大數(shù)據(jù)條件下使用社會(huì)化媒體中的電影資料數(shù)據(jù)來(lái)分析票房收取,結(jié)果顯示社會(huì)媒體的評(píng)論數(shù)據(jù)在電影上映一周后對(duì)票房有著正向的影響[7]。李雪研究了網(wǎng)絡(luò)視頻社會(huì)化分享對(duì)電影票房的影響,結(jié)果顯示消費(fèi)者將預(yù)告片在社會(huì)化媒體上分享的次數(shù)越多,票房收入越高[8]。汪旭暉、王軍主要對(duì)我國(guó)電影“高票房低口碑”現(xiàn)象做出了解釋,其根本原因在于電影在追求視覺(jué)效果的同時(shí)忽視了內(nèi)容的鍛造,影片文化內(nèi)涵的缺失[9]。王錦慧主要對(duì)我國(guó)電影版權(quán)商業(yè)價(jià)值進(jìn)行了研究。研究結(jié)果表明,在國(guó)內(nèi)電影高速發(fā)展階段,檔期的重要性,票房收入開(kāi)始分散,這有利于我國(guó)電影產(chǎn)業(yè)的進(jìn)一步發(fā)展[10]。王崢、許敏利用Logit模型驗(yàn)證了明星名導(dǎo)效應(yīng)在票房上呈現(xiàn)邊際遞減[11]。戴建華、鄭意凡基于2012至2016年上映的電影票房數(shù)據(jù)研究了電影票房的延續(xù)性問(wèn)題,研究發(fā)現(xiàn)電影導(dǎo)演和主演曾經(jīng)的電影成績(jī)有著延續(xù)性,但系列電影的票房收入未表現(xiàn)出延續(xù)性[12]。鄭堅(jiān)基于電影票房預(yù)測(cè)精度不高、缺乏實(shí)際應(yīng)用價(jià)值等缺陷提出了基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)模型[13]。
上述研究大多都研究了影響電影票房收入的因素,并在此基礎(chǔ)上對(duì)電影票房收入進(jìn)行了預(yù)測(cè)。但是由于影響電影票房的因素多種多樣,上述預(yù)測(cè)模型中的諸多影響因素在電影上映之前并不能獲取,并且很多影響因素難以量化,電影票房中存在不能用客觀因素解釋的影響因素,因此該類預(yù)測(cè)存在著預(yù)測(cè)精度不高的問(wèn)題,這不僅會(huì)加劇投資者的投資風(fēng)險(xiǎn),更會(huì)對(duì)我國(guó)電影行業(yè)的長(zhǎng)期發(fā)展造成不利的影響。電影票房收入作為典型的時(shí)間序列,其自身包含著大量的信息,并且存在著一定的趨勢(shì)性和周期性,因此本文選取2013年3月至2018年12月的電影票房收入這一時(shí)間序列,建立電影票房收入的ARIMA模型,對(duì)電影票房收入進(jìn)行預(yù)測(cè)。
1 ?ARIMA模型及建模步驟
ARIMA模型即自回歸移動(dòng)平均模型,是一種著名的時(shí)間序列預(yù)測(cè)模型,該模型將預(yù)測(cè)對(duì)象的觀測(cè)值按照時(shí)間進(jìn)行排序形成一個(gè)隨機(jī)序列,該序列隨著時(shí)間的變化而變化,其可以通過(guò)自回歸移動(dòng)平均過(guò)程來(lái)生成,即該時(shí)間序列可以由其自身的過(guò)去值或滯后值和隨機(jī)干擾項(xiàng)來(lái)解釋。ARIMA模型可以表示為SARIMA(p,d,q)(P,D,Q)s,其中p為自回歸系數(shù),q為移動(dòng)平均系數(shù),P為季節(jié)性自回歸系數(shù),Q為季節(jié)性移動(dòng)平均階數(shù),d為非平穩(wěn)時(shí)間序列轉(zhuǎn)換為平穩(wěn)時(shí)間序列時(shí)所做的差分階數(shù),D為季節(jié)性差分階數(shù),s為季節(jié)周期[14]。
ARIMA模型的建模步驟主要包括:①平穩(wěn)性檢驗(yàn)和模型識(shí)別。首先對(duì)所觀察的時(shí)間序列的平穩(wěn)性進(jìn)行檢驗(yàn),若該時(shí)間序列為非平穩(wěn)時(shí)間序列,需要根據(jù)其序列特點(diǎn)進(jìn)行平穩(wěn)化,最終對(duì)平穩(wěn)化后的時(shí)間序列根據(jù)其自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF)識(shí)別出模型形式[15]。②參數(shù)估計(jì)。采用極大似然法對(duì)模型進(jìn)行初步的參數(shù)估計(jì),此時(shí)樣本容量最好在50以上。③診斷與檢驗(yàn)。所得參數(shù)必須使用t檢驗(yàn)來(lái)檢測(cè)其顯著性,同時(shí)殘差項(xiàng)必須通過(guò)Q檢驗(yàn),即殘差序列必須近似為一個(gè)白噪聲過(guò)程。④模型預(yù)測(cè)。將模型預(yù)測(cè)值與觀測(cè)到的實(shí)際值進(jìn)行比較,檢驗(yàn)?zāi)P偷念A(yù)測(cè)效果。
2 ?模型構(gòu)建
首先本文采用2013年3月至2018年12月共70組全國(guó)電影票房收入的歷史數(shù)據(jù)作為實(shí)驗(yàn)研究的基礎(chǔ),建立全國(guó)電影票房收入模型。其次預(yù)測(cè)2013年3月至2018年12月全國(guó)電影票房收入的數(shù)據(jù),與2013年3月至2018年12月全國(guó)電影票房收入實(shí)際值進(jìn)行比較,檢驗(yàn)?zāi)P偷臄M合程度。最終使用此模型對(duì)2019年1月至10月票房收入進(jìn)行預(yù)測(cè)。
2.1 平穩(wěn)性檢驗(yàn)
將2013年3月至2018年12月的全國(guó)電影票房收入繪制時(shí)間序列圖,如圖1所示。可以看出該圖具有一定的季節(jié)性,全國(guó)電影票房收入時(shí)間序列不平穩(wěn)。為了進(jìn)一步檢驗(yàn)平穩(wěn)性,對(duì)該時(shí)間序列進(jìn)行ADF單位根檢驗(yàn),計(jì)算結(jié)果如表1所示,在1%、5%、10%的顯著性水平下,t值均大于單位根檢驗(yàn)的臨界值,且p值為0.8989,大于顯著性水平0.05,因此進(jìn)一步證明該序列為非平穩(wěn)時(shí)間序列。
2.2 序列平穩(wěn)化
對(duì)原始的全國(guó)電影票房收入時(shí)間序列進(jìn)行一次差分和一階12步季節(jié)性差分,所得結(jié)果的時(shí)序圖如圖2所示,可以看出該時(shí)序圖無(wú)明顯趨勢(shì)性,并且在零附近上下波動(dòng),差分后的全國(guó)電影票房收入時(shí)間序列具有平穩(wěn)性。
2.3 模型初選
繪制差分后時(shí)間序列的自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF),如圖3所示。自相關(guān)圖和偏自相關(guān)圖均呈現(xiàn)拖尾特征。自相關(guān)圖中,1、3、4階顯著地不為0,則q取值可為1、3或4。12階函數(shù)值顯著不為0,24階函數(shù)值在置信區(qū)間內(nèi),因此Q取值為1。在偏自相關(guān)圖中1階和3階顯著不為0,則p取1或者3。12階函數(shù)值在置信區(qū)間內(nèi),因此P取0,且d=1,D=1,s=12?;谝陨戏治?,可以得到如下6個(gè)備選模型,分別為ARIMA(1,1,1)(0,1,1)12、ARIMA(1,1,3)(0,1,1)12、ARIMA(1,1,4)(0,1,1)12、ARIMA(3,1,1)(0,1,1)12、ARIMA(3,1,3)(0,1,1)12、ARIMA(3,1,4)(0,1,1)12。
2.4 模型確定和參數(shù)估計(jì)
對(duì)備選模型進(jìn)行參數(shù)估計(jì),得到6個(gè)備選模型的AIC值和參數(shù)估計(jì)值,各個(gè)模型的AIC值如表2所示,根據(jù)赤遲信息量準(zhǔn)則,最終選定模型為ARIMA(1,1,1)(0,1,1)12。該模型參數(shù)估計(jì)結(jié)果如表3所示。
2.5 模型檢驗(yàn)和預(yù)測(cè)
對(duì)ARIMA(1,1,1)(0,1,1)12的殘差進(jìn)行檢驗(yàn),結(jié)果如圖4所示,殘差序列的自相關(guān)函數(shù)值均在置信區(qū)間內(nèi),因此認(rèn)為模型ARIMA(1,1,1)(0,1,1)12的殘差序列為白噪聲序列,ARIMA(1,1,1)(0,1,1)12模型通過(guò)檢驗(yàn)。
基于ARIMA(1,1,1)(0,1,1)12模型,對(duì)2013年3月至2018年12月的數(shù)據(jù)采取靜態(tài)預(yù)測(cè)的方式滾動(dòng)的進(jìn)行向前一步預(yù)測(cè),得到的結(jié)果如圖5所示,擬合值和觀測(cè)值之間存在一定差距,但差距較小,因此模型的擬合程度總體上較好。繼續(xù)使用該模型,采用動(dòng)態(tài)預(yù)測(cè)的方式對(duì)2019年1月至10月全國(guó)電影收入進(jìn)行預(yù)測(cè),得到結(jié)果如圖6所示??梢钥闯?,我國(guó)電影票房收入在2019年2月左右會(huì)出現(xiàn)大幅上漲,2019年1月至10月整體的電影票房收入較2018年可能有所回落。
3 ?結(jié)論
電影票房收入是衡量一個(gè)電影項(xiàng)目投資成功與否的重要標(biāo)志,它不僅僅影響著電影投資者,更是對(duì)我國(guó)電影行業(yè)甚至文化行業(yè)的持續(xù)發(fā)展有著重要的影響。本文基于2013年3月至2018年12月全國(guó)電影票房收入數(shù)據(jù),建立了全國(guó)電影票房收入的ARIMA模型,經(jīng)過(guò)模型檢驗(yàn)和擬合,本文選取的最優(yōu)模型為ARIMA(1,1,1)(0,1,1)12,該模型的預(yù)測(cè)數(shù)據(jù)與全國(guó)電影票房收入的真實(shí)值相差較小,擬合程度好。綜上所述,該模型在預(yù)測(cè)全國(guó)電影票房收入方面效果較好,基于該模型對(duì)全國(guó)電影票房收入進(jìn)行預(yù)測(cè),可以為我國(guó)電影行業(yè)的投資和發(fā)展提供一定的理論依據(jù)。但是因?yàn)槲覈?guó)電影票房數(shù)據(jù)存在著數(shù)據(jù)量少,數(shù)據(jù)統(tǒng)計(jì)不完全的情況等問(wèn)題,本文預(yù)測(cè)存在一定的局限性,在今后的研究中,可以在拓展數(shù)據(jù)量的基礎(chǔ)上建立更為合適的模型,來(lái)提高預(yù)測(cè)精度。
參考文獻(xiàn):
[1]王錦慧,卜彥芳,李念.華萊塢電影票房預(yù)測(cè)模型的實(shí)證分析[J].新聞大學(xué),2016(01):9-14,145.
[2]王艷,金天星.市場(chǎng)營(yíng)銷與風(fēng)險(xiǎn)評(píng)估雙重視角下的電影票房預(yù)測(cè)——以中影集團(tuán)推出電影票房量化分析系統(tǒng)為例[J].中國(guó)電影市場(chǎng),2012(03):11-12.
[3]姚武華.中國(guó)內(nèi)地市場(chǎng)國(guó)產(chǎn)電影票房特征及其影響因素研究——基于PLS模型的實(shí)證分析[J].價(jià)格理論與實(shí)踐,2018(02): 83-86.
[4]Litman B, Kohl L. Predicting Success of Theatrical Movies: The 80s Experience[J]. Journal of Media Economics, 1989, 2: 35-50.
[5]Kulkarni G, Kannan P, Moe W. Using online search data to forecast new product sales[J]. Decision Support Systems, 2012, 52(3): 604-611.
[6]王煉,賈建民.基于網(wǎng)絡(luò)搜索的票房預(yù)測(cè)模型——來(lái)自中國(guó)電影市場(chǎng)的證據(jù)[J].系統(tǒng)工程理論與實(shí)踐,2014,34(12):3079-3090.
[7]王文文,周澍民.社會(huì)化媒體對(duì)電影票房的預(yù)測(cè)價(jià)值研究[J].新聞傳播,2013(12):254-255.
[8]李雪,伍晨.網(wǎng)絡(luò)視頻的社會(huì)化分享對(duì)國(guó)產(chǎn)電影票房影響的實(shí)證研究[J].技術(shù)經(jīng)濟(jì),2016,35(01):103-109.
[9]汪旭暉,王軍.網(wǎng)絡(luò)口碑如何影響電影票房——中國(guó)電影“高票房低口碑”現(xiàn)象反思[J].湖南師范大學(xué)社會(huì)科學(xué)學(xué)報(bào),2015, 44(02):152-160.
[10]王錦慧,晏思雨.中國(guó)電影版權(quán)商業(yè)價(jià)值評(píng)估模型研究[J]. 當(dāng)代電影,2015(11):73-80.
[11]王錚,許敏.電影票房的影響因素分析——基于Logit模型的研究[J].經(jīng)濟(jì)問(wèn)題探索,2013(11):96-102.
[12]戴建華,鄭意凡.電影票房表現(xiàn)的延續(xù)性研究[J].現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)),2018,40(08):124-129.
[13]鄭堅(jiān),周尚波.基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)建模[J].計(jì)算機(jī)應(yīng)用,2014,34(03):742-748.
[14]解建倉(cāng),王玥,雷社平,等.基于ARIMA模型的大壩安全監(jiān)測(cè)數(shù)據(jù)分析與預(yù)測(cè)[J].人民黃河,2018,40(10):131-134.
[15]賀簫楠,宋曉輝,朱鑫.基于ARIMA模型的洛陽(yáng)市手足口病發(fā)病率預(yù)測(cè)[J].現(xiàn)代預(yù)防醫(yī)學(xué),2019,46(03):403-406.