趙禮強(qiáng),姜 崇,唐金環(huán) (沈陽航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,沈陽 110136)
知識產(chǎn)權(quán)(Intellectual Property)簡稱IP,是時下最為流行且備受關(guān)注的名詞。網(wǎng)絡(luò)小說IP的改編在國外已有先例,J·K·羅琳創(chuàng)作的《哈利波特》、英國作家約翰·羅納德·魯埃爾·托爾金的史詩奇幻小說《指環(huán)王》,蘇珊·柯林斯創(chuàng)作的《饑餓游戲》等小說改編的電影都獲得了巨大的成功。2015年國內(nèi)IP熱潮開始,改編網(wǎng)絡(luò)文學(xué)IP在影視圈掀起了熱潮,許多網(wǎng)絡(luò)小說改編成了影視劇,因此2015年也被稱為“IP元年”。2015年年初《何以笙簫默》、《花千骨》、《瑯琊榜》,以及年尾上映的《羋月傳》等幾大網(wǎng)絡(luò)文學(xué)改編劇輪流坐擁電視收視率排行榜第一。同時,由《鬼吹燈之尋龍訣》、《九層妖塔》、《匆匆那年》等網(wǎng)絡(luò)小說改編的電影也大獲成功。網(wǎng)絡(luò)文學(xué)IP借助其天然的獨特優(yōu)勢,成為了影視業(yè)、游戲業(yè)等諸多行業(yè)的新寵,版權(quán)價值也在水漲船高。凱撒股份于2016年3月22日公告稱以總額1億元授權(quán)金,獲得騰訊動漫《從前有座靈劍山》、《銀之守墓人》、《我的雙修道侶》等若干個IP的改編授權(quán)。
判斷一部網(wǎng)絡(luò)小說擁有的隱含價值量是決定改編成功的關(guān)鍵,但網(wǎng)絡(luò)小說有其特殊的持續(xù)消費特征,隱含價值量并非穩(wěn)定不變,對隱含價值量的錯誤估計會嚴(yán)重影響運營商的運營計劃,增加無形成本,降低商業(yè)利潤?;谝陨蠁栴}的考慮,本文運用大數(shù)據(jù)對網(wǎng)絡(luò)小說隱含價值量進(jìn)行預(yù)測,希望為網(wǎng)絡(luò)小說運營商提供指導(dǎo)借鑒。
目前,國內(nèi)外一些專家針對電影票房和電視劇熱度等進(jìn)行了預(yù)測研究。比如RameshSharda[1]等通過美國各大院線公司獲取樣本數(shù)據(jù),采用對電影票房分類的方式,使用分類正確率來判斷模型分類的性能,對比回歸算法得到了更好的結(jié)果。王煉[2]等根據(jù)網(wǎng)絡(luò)搜索與電影票房之間的關(guān)聯(lián)展開研究,驗證了網(wǎng)絡(luò)搜索對電影票房的預(yù)測作用,提高了預(yù)測的準(zhǔn)確性。同時Kulkarni G[3]也通過對網(wǎng)絡(luò)搜索數(shù)據(jù)建立銷售預(yù)測驗證兩者之間的關(guān)聯(lián)關(guān)系,說明網(wǎng)絡(luò)搜索數(shù)據(jù)在電影票房的預(yù)測是一個關(guān)鍵而有顯著影響的變量。Sawhney M S[4]等建立電影預(yù)測模型分析評論正向情感傾向?qū)﹄娪捌狈康年P(guān)聯(lián)影響,研究表明,只有第三周的在線影評正向情感傾向顯著影響電影票房,且影響程度大于影評數(shù)量。Byeng-Hee Chang[5]等通過建立預(yù)測模型成功預(yù)測北美地區(qū)電影票房,為電影產(chǎn)業(yè)的市場風(fēng)險提供具有現(xiàn)實指導(dǎo)意義的風(fēng)險安全規(guī)避決策。De′Ath G[6]等采用四分位對數(shù)據(jù)進(jìn)行等級劃分,建立評價標(biāo)準(zhǔn)的思想具有很好的借鑒性。張虹[7]等基于小波多尺度分析,根據(jù)不同信號的話題借用神經(jīng)網(wǎng)絡(luò)建立不同的預(yù)測模型,隨后組合獲得最終預(yù)測,預(yù)測精度表現(xiàn)良好。趙妍妍[8等將微博傾向性分析作為一個分類問題,與小波多尺度分析有著相似的思想,目的是希望判斷評論的總體情感傾向性,對電影票房的預(yù)測有很好的指導(dǎo)作用。張源漳[9]基于讀者瀏覽行為建立狹義點擊流數(shù)據(jù)進(jìn)行讀者需求可視化分析,創(chuàng)建出多條關(guān)聯(lián)規(guī)則得出讀者信息需求規(guī)律,為圖書館決策和創(chuàng)新服務(wù)提供科學(xué)依據(jù)。易明[10]等研究的點擊流與網(wǎng)絡(luò)小說的點擊量存在相似的意義,對點擊流的站點信息組織優(yōu)化可以為網(wǎng)絡(luò)小說隱含價值量的定義提供借鑒。Igmcio Redondo[11]等認(rèn)為明星的關(guān)注數(shù)量、過去電影票房收入、藝術(shù)成就對電影票房的收入有著很強(qiáng)的關(guān)聯(lián)關(guān)系,可以通過對明星影響力的量化可以對電影票房收入進(jìn)行建模預(yù)測。利用分類技術(shù),可以通過對系統(tǒng)相似電視劇的點播量來預(yù)測電視劇的點擊量,Pinto H[12]基于此種思想展開研究并獲得較好的預(yù)測效果。S.Asur[13]等借助Twitter電影相關(guān)話題的創(chuàng)建速率等對電影的票房進(jìn)行預(yù)測,獲得了較好的預(yù)測效果,發(fā)現(xiàn)以美國為主的Twitter用戶數(shù)據(jù)與中國網(wǎng)絡(luò)用戶數(shù)據(jù)之間存在著地域文化差異。Henrique Pinto[14]借助分類技術(shù),搜尋出待預(yù)測電視劇早期點播“相近”電視劇的點播情況,與數(shù)據(jù)庫中已經(jīng)存在的電視劇數(shù)據(jù)做關(guān)聯(lián)分析,對電視劇后期點播量加以預(yù)測。
網(wǎng)絡(luò)小說IP與電影有著類似的特征,但又有其自身的特點。目前國內(nèi)外還鮮有學(xué)者針對網(wǎng)絡(luò)小說IP的潛在隱含價值進(jìn)行預(yù)測。網(wǎng)絡(luò)小說與電影票房預(yù)測主要存在以下不同:首先,網(wǎng)絡(luò)小說在完結(jié)前處于持續(xù)消費狀態(tài),根據(jù)內(nèi)容的變化,讀者基群會出現(xiàn)讀者流失與新讀者加入的現(xiàn)象,隱含價值量處于不斷變化的狀況,而電影票房則是屬于一次性消費,觀眾流失影響并不顯著;其次,網(wǎng)絡(luò)小說的隱含價值量是一個綜合指標(biāo),包含網(wǎng)絡(luò)小說本身的閱讀消費和潛在改編電影或者游戲的潛在商業(yè)價值關(guān)聯(lián)作用,而電影票房則較為單一。因此,通過數(shù)據(jù)挖掘分析,分析網(wǎng)絡(luò)小說IP存在的潛在隱含價值,分析網(wǎng)絡(luò)IP熱潮背后隱藏的關(guān)聯(lián)關(guān)系,幫助網(wǎng)絡(luò)小說運營商發(fā)現(xiàn)黑馬小說,挖掘其商業(yè)潛力,準(zhǔn)確預(yù)測網(wǎng)絡(luò)小說IP價值,對網(wǎng)絡(luò)小說運營商具有重要的決策指導(dǎo)意義。
起點中文網(wǎng)隸屬于國內(nèi)最大的數(shù)字內(nèi)容綜合平臺—閱文集團(tuán)旗下,是國內(nèi)最大文學(xué)閱讀與寫作平臺之一,也是目前國內(nèi)領(lǐng)先的原創(chuàng)文學(xué)門戶網(wǎng)站,確立了行業(yè)領(lǐng)導(dǎo)地位,具有很高的影響力。本文以起點中文網(wǎng)為平臺,運用八爪魚數(shù)據(jù)采集工具對起點中文網(wǎng)排名榜上的網(wǎng)絡(luò)小說網(wǎng)頁數(shù)據(jù)進(jìn)行抓取,從2016年05月24日至25日歷時32小時抓取3 118部小說,總計7萬余條數(shù)據(jù),對數(shù)據(jù)進(jìn)行整理后,將數(shù)據(jù)文檔輸出為 ARFF格式,在Weka平臺進(jìn)行數(shù)據(jù)處理及挖掘分析。
網(wǎng)絡(luò)小說的隱含價值量是一個多元綜合性概念,但網(wǎng)絡(luò)小說價值的基礎(chǔ)是觀眾受眾的大小,所有的商業(yè)價值都源于觀眾的喜愛。由于網(wǎng)絡(luò)小說的點擊量是一個直觀而具有說服力的重要指標(biāo),反映了一部網(wǎng)絡(luò)小說的受歡迎度,點擊量越大說明觀眾受眾越多。因此,本文選擇通過點擊量來刻畫網(wǎng)絡(luò)小說的隱含價值量,即因變量,而選取總推薦量、總字?jǐn)?shù)、總評論數(shù)、總回復(fù)數(shù)4個指標(biāo)為自變量進(jìn)行預(yù)測,變量選擇及涵義如表1所示。
表1 網(wǎng)絡(luò)小說預(yù)測數(shù)據(jù)變量定義
網(wǎng)絡(luò)小說具有一個較長的成長周期,而點擊量等數(shù)據(jù)也會隨著時間的遷移逐漸變大,對于優(yōu)秀且成功的網(wǎng)絡(luò)小說,這個數(shù)值的增長速度和最終的數(shù)值都是非常巨大的。因此,本文對整個實例集在WEKA平臺上進(jìn)行規(guī)范化數(shù)據(jù)預(yù)處理。針對以上變量的取值進(jìn)行數(shù)據(jù)預(yù)處理后的數(shù)據(jù)格式如圖1所示。
圖1 網(wǎng)絡(luò)小說變量數(shù)據(jù)預(yù)處理結(jié)果圖
最早將樹結(jié)構(gòu)應(yīng)用到回歸預(yù)測問題的是1984年Breiman[15]等提出的分類回歸樹-CART,這種樹結(jié)構(gòu)輸出的是每個葉子結(jié)點目標(biāo)屬性的平均值,盡可能地逼近回歸。1992年,在分類回歸樹的基礎(chǔ)上,Quinlan[16]提出了分段式多元線性回歸樹即M5模型樹,為了進(jìn)一步解決預(yù)測問題,1997年Wang[17]等人對M5模型樹進(jìn)行重構(gòu)改進(jìn),形成了M5模型樹??紤]到對點擊量的預(yù)測是一個數(shù)值預(yù)測而且由于M5模型樹擁有效率高、魯棒性好等優(yōu)點,該模型可以進(jìn)行有效的學(xué)習(xí),同時本模型處理輸入屬性數(shù)據(jù)可以達(dá)到幾百維的范圍,基于此本文采用M5模型樹算法建立模型進(jìn)行預(yù)測。M5模型樹組合了樹結(jié)構(gòu)和線性回歸模型,每個葉子節(jié)點是一個線性回歸模型,用一系列分段線性模型組合起來的全局模型,為處理問題帶來了所需的非線性。
本文選擇的3118部網(wǎng)絡(luò)小說大多已經(jīng)完結(jié),或是更新至少一年以上,其點擊量達(dá)到一定規(guī)模,增長速度相對穩(wěn)定,并達(dá)到了預(yù)測的要求,因此選擇作為點擊量的預(yù)測數(shù)據(jù)具有說服力。將篩選后的數(shù)據(jù)在WEKA平臺進(jìn)行建模預(yù)測,得到的M5模型樹如圖2所示。
圖2 M5模型樹預(yù)測模型結(jié)果圖
在模型樹的每一個葉節(jié)點都有一個線性回歸模型,共有LM1—LM10 10個線性回歸模型,具體模型展示如表2所示。
建立M5決策樹模型后的識別結(jié)果如表3所示。
為了進(jìn)一步確認(rèn)M5模型樹的模型精度,本文同時采用線性回歸算法和梯度下降分類樹算法對以上問題建立模型進(jìn)行了預(yù)測,與M5模型樹結(jié)果進(jìn)行對比分析。通過采用十折交叉驗證的方式評估模型的誤差率,運用關(guān)聯(lián)度R、絕對差值率MAE、均方根誤差率RMSE等指標(biāo)對模型精度進(jìn)行評估,具體結(jié)果見表4。其中關(guān)聯(lián)度R反映了模型與真實關(guān)聯(lián)函數(shù)的相似度,該值越接近1,表明模型越接近真實關(guān)聯(lián)函數(shù);MAE用于評判預(yù)測值與實際值之間的差異度,反映個體樣本的預(yù)測效果程度,越小越好。RMSE與MAE 類似,但RMSE更側(cè)重于反映樣本總體的預(yù)測效果程度,值越小越好。
關(guān)聯(lián)度:
(1)
絕對差值:
(2)
均方根誤差:
(3)
表2 M5模型數(shù)葉節(jié)點線性回歸模型展示
根據(jù)表4三種算法的模型評估指標(biāo)結(jié)果,我們可以看到M5模型樹在MAE、RMSE、標(biāo)準(zhǔn)誤差和絕對平均誤差的評估指標(biāo)都優(yōu)于線性回歸模型與梯度下降分類樹的模型,相關(guān)系數(shù)更是接近1,說明M5模型樹的精度很高,具有很強(qiáng)的準(zhǔn)確性和解釋性。
通過對M5模型樹建立的模型識別結(jié)果可以看到,本文建立的預(yù)測模型具有很好的預(yù)測精度,在MAE和RMSE的指標(biāo)反饋都較好,誤差在理想范圍內(nèi)。從M5模型樹的樹結(jié)構(gòu)可以看出,樹結(jié)構(gòu)的分支是通過總字?jǐn)?shù)來進(jìn)行劃分的,可以認(rèn)為整個樹結(jié)構(gòu)是對網(wǎng)絡(luò)小說從開始創(chuàng)作到整本完結(jié)的整個過程不同創(chuàng)作階段的劃分,由開始創(chuàng)作、逐漸成長、成熟穩(wěn)定到整本完結(jié)。通過分析模型結(jié)果,我們得到以下啟示。
(1)總推薦量負(fù)面影響。總推薦量是由讀者對網(wǎng)絡(luò)小說投出的推薦票積累所得數(shù)據(jù),其目的是為了幫助小說吸引更多的讀者,起到推薦推廣的作用。從研究結(jié)果可以看出,10個葉節(jié)點以上的線性模型中,總推薦量的權(quán)重系數(shù)全部為負(fù),相對權(quán)重較小。說明總推薦量在網(wǎng)絡(luò)小說整個創(chuàng)作的不同階段對總點擊量的增加總是起到負(fù)相關(guān)影響,總推薦量不僅沒有存在的意義,反而成為總點擊量提升的障礙,成為一個耐人尋味的問題。
表3 M5模型樹模型識別結(jié)果
表4 算法模型評估指標(biāo)對比
究其原因,本文發(fā)現(xiàn)網(wǎng)絡(luò)小說得到讀者的認(rèn)可,是促使讀者投出推薦票的動機(jī),但一千個讀者就有一千個哈姆雷特,一部網(wǎng)絡(luò)小說無法滿足所有讀者喜好。推薦票的增加是忠實讀者貢獻(xiàn)所得,存在重復(fù)性,受個人對網(wǎng)絡(luò)小說喜好程度影響。正是這種內(nèi)心喜好的偏移,讀者只會保留推薦票贈給自己喜好的網(wǎng)絡(luò)小說,投推薦票的行為無形中轉(zhuǎn)變成了網(wǎng)絡(luò)小說對讀者的“觀念綁架”,這種觀念綁架的出現(xiàn)不僅不會吸引新的讀者,提升點擊量,反而固化了讀者基群的流動性,不利于新讀者的加入,因此產(chǎn)生了對網(wǎng)絡(luò)小說點擊量的負(fù)面影響。
與此同時,網(wǎng)絡(luò)小說的總推薦量的負(fù)面影響同時反映了讀者的理性閱讀,說明讀者并不會盲目相信總推薦量。讀者會根據(jù)自我喜好對網(wǎng)絡(luò)小說的內(nèi)容進(jìn)行預(yù)判之后閱讀。網(wǎng)絡(luò)小說的作者應(yīng)當(dāng)將更多的注意力放在情節(jié)設(shè)置、文筆等文章內(nèi)容的提升上,當(dāng)文章內(nèi)容得到讀者認(rèn)可時,忠實讀者數(shù)量的提高將會促進(jìn)總推薦量與總點擊量的提高。
(2)總字?jǐn)?shù)負(fù)面影響。網(wǎng)絡(luò)小說的總字?jǐn)?shù)一方面反映了網(wǎng)絡(luò)小說的更新時長,另一方面反映了網(wǎng)絡(luò)小說內(nèi)容的豐富性與可讀性。一般認(rèn)為,更新時長越長點擊量的累積越多。網(wǎng)絡(luò)小說內(nèi)容越豐富,其對讀者的吸引力越強(qiáng)。但從研究結(jié)果可以看到,總字?jǐn)?shù)的權(quán)重系數(shù)全部為負(fù),權(quán)重相對較大。說明總字?jǐn)?shù)在整個創(chuàng)作過程中與總點擊量的影響關(guān)系總是負(fù)相關(guān),且影響程度較大,這是一個與我們常識認(rèn)知相悖的現(xiàn)象。
究其原因,在創(chuàng)作初期,由于總字?jǐn)?shù)過少無法滿足讀者閱讀需求,讀者會選擇等到章節(jié)積攢到一定數(shù)目時再選擇閱讀,因此在這個階段,總字?jǐn)?shù)對總點擊量起到了負(fù)相關(guān)的影響作用。當(dāng)網(wǎng)絡(luò)小說進(jìn)入成熟穩(wěn)定的階段后,由于網(wǎng)絡(luò)小說是由情節(jié)描述和情感描述及其他場景描述為主要寫作內(nèi)容,在情節(jié)長度相同的情況下,網(wǎng)絡(luò)小說總字?jǐn)?shù)越多,說明與情節(jié)無關(guān)的描述性語言過多,而讀者更在意的是情節(jié)的發(fā)展,對其他描述性語言關(guān)注程度并不高。由于網(wǎng)絡(luò)小說更類似于一種快餐文學(xué),過多的無關(guān)描述拖沓了情節(jié)的推進(jìn),導(dǎo)致讀者不滿情節(jié)發(fā)展過慢而流失,從而導(dǎo)致點擊量的下降。因此,情節(jié)發(fā)展長度相似的情況下,總字?jǐn)?shù)越多,讀者流失越多,對點擊量形成負(fù)面影響。
因此,這提醒網(wǎng)絡(luò)小說作者應(yīng)當(dāng)調(diào)整寫作方式,加快情節(jié)推進(jìn)速度,同時減少不必要的描述性語言,適當(dāng)控制總字?jǐn)?shù),可以為點擊量的提升提供保障。同時,人們過于崇尚快餐文學(xué)導(dǎo)致網(wǎng)絡(luò)小說更新速度過快,文章內(nèi)容文學(xué)性降低,削弱了可讀性,這種現(xiàn)象應(yīng)當(dāng)引起社會的廣泛注意及思索。無論是網(wǎng)絡(luò)文學(xué)或是線下文學(xué),同時滿足文學(xué)性和可讀性才能成為膾炙人口的優(yōu)秀文學(xué)作品,為中國文化的發(fā)展開枝散葉,過分追求利益的文學(xué)必定無法長久留存和發(fā)展。
(3)評論回復(fù)數(shù)的負(fù)影響分析。在10個葉節(jié)點的線性模型中,當(dāng)總字?jǐn)?shù)權(quán)重小于0.742時,總回復(fù)數(shù)在線性模型中的權(quán)重系數(shù)均為負(fù)值。當(dāng)總字?jǐn)?shù)權(quán)重大于0.742后,總回復(fù)數(shù)在線性模型中的權(quán)重系數(shù)均為正值。說明當(dāng)總字?jǐn)?shù)超過一個臨界值后,總回復(fù)數(shù)才會對總點擊量起到促進(jìn)作用,而在臨界值之前,總回復(fù)數(shù)對總點擊量起到抑制作用。
究其原因,一部網(wǎng)絡(luò)小說從開始創(chuàng)作至整本終結(jié),整個過程經(jīng)歷不同的時期,從開始創(chuàng)作到逐漸成熟穩(wěn)定的過程,這個成長過程在M5模型樹中是通過總字?jǐn)?shù)來進(jìn)行劃分。在創(chuàng)作初期的LM1至LM3階段,由于作品的知名度較低,閱讀基群較小,對網(wǎng)絡(luò)小說的回復(fù)內(nèi)容主要表現(xiàn)出支持鼓勵作者創(chuàng)作的情感,這類評論可以帶給作者自信心和鼓勵,但卻無法對讀者起到很好的吸引作用從而加以閱讀。在這個時期,讀者并不會過多關(guān)注文章內(nèi)容,而會主觀認(rèn)為文章的水平還顯稚嫩,因此,在這段時期的總回復(fù)數(shù)在線性模型中對總點擊量的影響是抑制作用。
隨著網(wǎng)絡(luò)小說度過初期階段,閱讀基群不斷增長,讀者將更多關(guān)注文章內(nèi)容,同時文章的回復(fù)內(nèi)容也會出現(xiàn)褒貶不一的情感。在這個時期,無論是對文章的贊揚還是貶低,都會引發(fā)讀者對文章的好奇心,想要一探究竟[18-19]。因此,當(dāng)度過初期階段,總回復(fù)數(shù)對總點擊量起到促進(jìn)作用。
因此,當(dāng)度過初期的創(chuàng)作階段,及時回復(fù)評論可以促進(jìn)點擊量的提升,提示作者可以通過加強(qiáng)與讀者的互動回復(fù),通過積極的評論和回復(fù)與讀者建立信任友好的關(guān)系,可以幫助提升網(wǎng)絡(luò)作品成績[20]。但同時應(yīng)當(dāng)注重言語文明,作者有義務(wù)監(jiān)督評論區(qū)言論走向,盡量減少負(fù)面回復(fù)的泛化惡化,盡力營造文明的閱讀氛圍,這樣能夠提升小說的潛在價值。
本文針對網(wǎng)絡(luò)小說的隱含價值量進(jìn)行預(yù)測,選擇點擊量刻畫網(wǎng)絡(luò)小說的隱含價值量,選取總推薦量、總評論數(shù)等指標(biāo),采用M5模型樹建立預(yù)測模型,預(yù)測模型的識別結(jié)果顯示模型具有很好的精度。透過葉節(jié)點中的線性模型,針對模型結(jié)果進(jìn)行分析。結(jié)果顯示網(wǎng)絡(luò)小說的總字?jǐn)?shù)、總推薦量對總點擊量均形成負(fù)面影響。論文分析了其產(chǎn)生的原因并給出了合理的建議和啟示,有效預(yù)測網(wǎng)絡(luò)小說IP,通過關(guān)聯(lián)分析挖掘網(wǎng)絡(luò)小說的潛在價值,可以為網(wǎng)絡(luò)小說運營商提供有效的決策依據(jù)和借鑒,將幫助運營商在眾多網(wǎng)絡(luò)小說中甄別出有潛力價值量的網(wǎng)絡(luò)小說,從而抑制由于IP熱潮引發(fā)的運營商盲目跟風(fēng)的社會現(xiàn)狀。
[1] RAMESH SHARDA,DURSUN DELEN.Predicting box-office success of motion pictures with neural networks[J].Expert Systems with Plications,2006,30(2):243-254.
[2] 王煉,賈建民.基于網(wǎng)絡(luò)搜索的票房預(yù)測模型-來自中國電影市場的證據(jù)[J].系統(tǒng)工程理論與實踐,2014,34(12):3079-3090.
[3] KULKARNI G,KANNAN P K,MOE W.Using online serach data to forecast new product sales[J].Decision Support Systems,2012,52(3):604-611.
[4] SAWHNEY M S,ELLIASHBERG J.A parsimonious model for forecasting gross box-office revenues of motion picture[J].Marketing Science,1996 ,15(2):113-131.
[5] BYENG-HEE CHANG,EYUNJUNG KI.A practical model for predicting theatrical movies success:focusing on the experience good property[J].Journal of Media Economics,2009,18(4):247-269.
[6] DE'ATH G, FABRICUS K E.Classification and regression trees:a powerful yet simple technique for ecological data analysis ecology [J].Ecology,2000,81(11):3178-3192.
[7] 張虹,鐘華,趙兵.基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)論壇話題熱度趨勢預(yù)報[J].計算機(jī)工程與應(yīng)用,2007,43(31):159-161+174.
[8] 趙妍妍,秦兵,劉挺.文本情感分析[J].軟件學(xué)報,2010,21(8):1834-1848.
[9] 張源漳.基于WEKA點擊流數(shù)據(jù)的讀者需求可視化分析[J].圖書館論壇,2007,27(04):67-69.
[10]易明,鄧衛(wèi)華,曹高輝.基于“點擊流”數(shù)據(jù)的站點信息組織優(yōu)化[J].現(xiàn)代圖書情報技術(shù),2006 ,22(1):51-54.
[11]IGNACIO REDONDO,MORRIS B.HOLBROOK.Modeling the appeal of movie features to demographic segments of theatrical demand[J].Journal of Cultural Economics,2010, 34(4):299-315.
[12]PINTO H,ALMEIDA J M,GONCALVES M A.Using early view patterns to predict the popularity of youtube videos[C].Proceedings of the sixth ACM international conference on Web search and data mining.NewYork,2013.
[13]S.ASUR,B.A.HUBERMAN.Predicting the future with social media[C].WebIntelligence and Intelligent Agent Technology.Toronto:IEEE,2010,7(2):492-499.
[14]HENRIQUE PINTO,JUSSARA M.ALMEIDA,MARCOS A.GONYALVES.Usingearly view patterns to predict the popularity of youtube videos[C].Proceedings ofthe sixth ACM international conference on Web search and data mining.ACM,NewYork,NY,USA,2013.
[15]BREIMAN L , FRIEDMAN J H, OLSHEN R A, et al.Classification and regression trees[M].Belmont:Wadsworth Statistical Press,1984.
[16]QUINLAN R J.Learning with continuous classes[C].5th Australian Joint Conference on Artificial Intelligence, Singapore,1992:343-348.
[17]WANG Y,WITTEN I H.Induction of model trees for predicting continuous classes[C].The 9th European Conference on Machine Learning,Prague,1997.
[18]艾瑞咨詢,艾瑞視點:2010年8月用戶產(chǎn)品評論促進(jìn)46%美國網(wǎng)民的購買行為[EB/OL].下載地址:http://ec.iresearch.cn/17/20101109/127426.shtml.2010-12-01.
[19]AINSLIE A,DREZE X,ZUFRYDEN F.Modeling movie life cycles and market share[J].Marketing Science,2005,24(3):508-517.
[20]RESNICK P,ZECKHAUSER R.Trust among strangers in internet transactions:empirical analysis of eBay’s reputation system[M].Wagon Lane:Emerald Group Publishing Limited,2002:127-157.