【摘 要】 近年來,中國電影產(chǎn)業(yè)快速增長,電影宣發(fā)推廣方式因互聯(lián)網(wǎng)技術發(fā)展而變革。電影首周票房對總票房和口碑至關重要,但國內(nèi)尚缺乏系統(tǒng)化對票房危機預警的研究。本文探討了人工智能在電影輿情分析中的應用,強調(diào)數(shù)據(jù)、算法和算力的核心作用,并提出實時監(jiān)控和分析評論數(shù)據(jù)的方法;分析了評論數(shù)據(jù)的不同形式,討論了情感和情緒分析的重要性,提出了主題挖掘和算法應用的挑戰(zhàn);并指出當前技術在電影輿情分析中的不足,展望未來的發(fā)展方向,強調(diào)構建實時票房危機預警系統(tǒng)的重要性。
【關鍵詞】 輿情分析; 情感分析; 主題抽取; 人工智能
電影投資是一個高風險行業(yè),大制作的電影在發(fā)行宣傳期伴隨著高風險,電影發(fā)行期的主要票房收入都是出現(xiàn)在上映開始的前兩三周,而首周的票房大概率與電影的總票房呈正相關系。首周亦是電影口碑能否立住的關鍵,互聯(lián)網(wǎng)的電影口碑往往是決定整體口碑的關鍵,而口碑的形成往往是自下而上的,從普通觀眾開始,逐漸通過口耳相傳、社交媒體分享和在線評論平臺擴散,最終形成廣泛的公眾意見。無論是幫助投資方和影院及時調(diào)整排座比率減少損失,還是幫助宣發(fā)團隊調(diào)整宣發(fā)策略打好電影口碑,便于制作團隊和投資方下一次的合作,收集分析觀眾反映的各項數(shù)據(jù)和信息并做出調(diào)整都是一項項關鍵的任務。
國內(nèi)目前尚未建立起針對電影票房危機的預警系統(tǒng),主要存在的問題是對輿情分析不夠、對輿情的分析方法不足以及對輿情的處理不夠及時。常見的電影監(jiān)測平臺,如燈塔等,主要提供票房等數(shù)據(jù),而對于輿情內(nèi)容的分析研究還不充分?,F(xiàn)有的關于輿情內(nèi)容分析的研究大多是個案研究,一次研究往往耗費大量時間,無法對輿情實時分析,互聯(lián)網(wǎng)的輿情發(fā)酵速度普遍較快,宣發(fā)團隊如果采取這類方式,等到發(fā)現(xiàn)具體危機時,輿論會變得無法管控。同時,這些個案研究均沒有以提取輿情潛在危機為導向,有的分析觀眾評論典型意見[1],缺少分析評論意見對輿論的影響程度;有的分析得到的輿情內(nèi)容含義較寬泛[2],得出的結果對宣發(fā)團隊分析輿情并沒有多少幫助??傊@些方式都很難在電影發(fā)行期間輔助宣發(fā)并使宣發(fā)策略及時調(diào)整優(yōu)化。
在人工智能領域,數(shù)據(jù)、算法和算力是三大核心要素。本文通過探討人工智能的電影輿情分析方法論,從分析電影輿情數(shù)據(jù)入手,剖析解決問題的算法,并探討算力帶來的研究方法的變化和進步。數(shù)據(jù)是基礎,通過對社交平臺、影評網(wǎng)站等渠道獲取的海量評論和討論數(shù)據(jù)進行清洗和預處理,可以提取出有價值的信息。算法是關鍵,通過應用自然語言處理、機器學習和深度學習等先進算法,可以有效地識別和分析觀眾的情感傾向和意見。算力是保障,現(xiàn)代計算設備和分布式計算技術的進步,使得處理和分析大規(guī)模數(shù)據(jù)成為可能,在一定程度上提高了分析的效率和精度。
一、數(shù)據(jù)·語言·在線
“大數(shù)據(jù)是當前電影輿情數(shù)據(jù)挖掘的基礎?!贝髷?shù)據(jù)“這一趨勢對我們的思維方式有了顛覆性的變革”。大數(shù)據(jù)的分析不僅僅是數(shù)據(jù)量的增加,更是對數(shù)據(jù)的深度挖掘和理解,以發(fā)現(xiàn)潛在的模式和關聯(lián)。[3]“從大樣本的描述性統(tǒng)計與中樣本的推斷性統(tǒng)計相結合,轉(zhuǎn)向超大規(guī)模樣本數(shù)據(jù)對總體的直接描述分析”[4]。也就是說,以一部電影的輿論分析為例,過去通過抽樣采訪電影觀眾的評論,來推斷整體的輿論情況。而在“大數(shù)據(jù)時代”,通過分析大部分觀眾的評論,直接得出整體輿論的真實情況。
隨著新媒體的多元化發(fā)展,數(shù)據(jù)信息有語言文字、圖像和視頻及帶有含義的數(shù)字信息等,在電影的輿情分析問題中,分別有評論討論數(shù)據(jù)、觀看照片、采訪視頻或自媒體評價視頻以及點擊率、實時觀看熱度、票房等數(shù)字信息??紤]到對照片和視頻數(shù)據(jù)的處理技術還不完善;且?guī)в泻x的數(shù)字信息處理起來較為方便,數(shù)據(jù)量相比于海量評論數(shù)據(jù)而言較少,蘊含明顯的概括信息(如電影的熱度,圍繞電影的某個話題的熱度等等),難以從中獲取潛在輿論危機信息。這類數(shù)據(jù)已經(jīng)是對電影輿情的某些宏觀分析,當這些數(shù)據(jù)發(fā)生明顯變化以至于反映出輿情問題的時候,輿情一般早已經(jīng)有明顯的發(fā)酵趨勢。故輿情監(jiān)測的主要研究對象為圍繞電影的評論討論數(shù)據(jù)。
電影的輿論“通常以顯輿論、潛輿論和行為輿論等形式體現(xiàn),顯輿論即以語言、文字形式傳遞的信息、表達的意見,潛輿論以情緒形式表達,行為輿論則是以購買、點擊等形式體現(xiàn)的”[5]。這樣的分類可以幫助人們進一步理解電影輿論,對計算機而言,沒辦法直接理解互聯(lián)網(wǎng)電影評論平臺上的輿論,故而人們必須將輿論轉(zhuǎn)化為數(shù)據(jù)。然而,如果僅僅是把輿論簡單轉(zhuǎn)化為數(shù)據(jù),則無法對龐大的數(shù)據(jù)量進行分類測算。所以人們類似地引入“顯數(shù)據(jù)”“行為數(shù)據(jù)”與“隱數(shù)據(jù)”的概念。顯數(shù)據(jù)即關于電影的語言文字信息或觀點,常常表現(xiàn)為觀影評論和討論;行為數(shù)據(jù)即反映觀眾有關電影觀看行為的數(shù)據(jù),如實時觀看熱度、票房、評論點擊率、話題搜索度等;隱數(shù)據(jù)是情緒數(shù)據(jù),潛藏在顯數(shù)據(jù)和行為數(shù)據(jù)中,需要計算機從中進行理解和提取,具體表現(xiàn)為評論數(shù)據(jù)反映出的受眾情感和行為數(shù)據(jù)中反映出的觀眾喜愛度等。
顯數(shù)據(jù)中包含大量語言文字信息,從中能找到電影輿論潛在危機的主題,是輿情危機預警中主要使用的數(shù)據(jù)。顯數(shù)據(jù)中,主要有短評論、長評論以及討論數(shù)據(jù),豆瓣和時光網(wǎng)是國內(nèi)主要的電影評論平臺。對于單部電影,豆瓣的評論數(shù)據(jù)包含短評、長評及評論數(shù)據(jù)下的討論和討論帖,時光網(wǎng)只有短評和長評,但是每條評論數(shù)據(jù)下都可以進行討論。
短評論數(shù)據(jù)中的情感表達更加簡潔明確,由于字數(shù)有限,觀眾在進行短評論的時候情感表達往往較為強烈,可以直接反映觀眾的直觀感受。同時,短評中會出現(xiàn)高頻關鍵詞,這些關鍵詞可以反映觀眾關注的主要問題和亮點。
長評論數(shù)據(jù)通常包含更詳細的分析和評價。觀眾會在長評中對觀影進行多維度的反饋,描述具體的情節(jié)、角色表演、拍攝技巧等,觀眾會詳細描述對于電影的多維情緒,甚至是引起情緒的原因。
討論數(shù)據(jù)可以反映觀眾之間的互動共鳴和觀點多樣性,引起觀眾共鳴的話題往往比個人的評論數(shù)據(jù)擁有更大的輿論影響力。引起觀眾爭論的話題是輿論分析的重要分析對象,爭論一方面會提升話題關注度,增加曝光,另一方面如果爭論中包含大量負面情緒和批評,會對電影口碑造成不利影響;不同觀點的激烈爭論可能使電影的市場定位模糊,目標受眾難以形成統(tǒng)一認知。
互聯(lián)網(wǎng)平臺網(wǎng)頁設計分為前端和后端,前端向大眾展現(xiàn)數(shù)據(jù),從互聯(lián)網(wǎng)平臺上獲取數(shù)據(jù)可以使用網(wǎng)絡爬蟲,爬蟲可以收集所有前端能展示的數(shù)據(jù)。但是后端可以接收大眾行為數(shù)據(jù)和顯數(shù)據(jù),并進行處理,也可以篩選展現(xiàn)給大眾的數(shù)據(jù),換言之,平臺公司可以不向觀眾展現(xiàn)所有的電影數(shù)據(jù)。例如豆瓣展現(xiàn)短評數(shù)據(jù)最多只能展現(xiàn)200條,平臺用這種方式維護網(wǎng)絡數(shù)據(jù)安全。這對于電影輿情分析是有阻礙的,但由于評論數(shù)據(jù)可以按時間排列,可以實時記錄隨時間變化的所有評論數(shù)據(jù)是需要的。
這樣實時的數(shù)據(jù)收集處理方法是一種在線方法,電影輿情的數(shù)據(jù)是實時變化的,故而對發(fā)行期間電影輿情的分析也是需要實時的,從電影宣發(fā)啟動的那一刻開始,有關于這部電影的數(shù)據(jù)就在不斷地積累變化,輿情監(jiān)測一般都是在線的。因此,院線電影票房危機預警系統(tǒng)的邏輯是:
1.實時監(jiān)控爬取百度、豆瓣、貓眼、微博等社交媒體對一部影片的實時評論,并對評論數(shù)據(jù)進行情緒分析;
2.迅速對這些文本信息挖掘、分析,提取主要話題和熱點;
3.對其中可能危及影片票房的負面因素進行提取、按破壞嚴重性強弱提出警告;
4.隨著時間疊加對信息及時更新;
5.為發(fā)行方調(diào)整方案提供依據(jù)支持。
合理且普適的輿情監(jiān)測方法設計,要顧及評論情感傾向和文本的主題觀點,情感傾向幫助確定受眾輿論傾向,對于輿論傾向偏消極的評論數(shù)據(jù)再進行主題抽取,挖掘出潛在危機因素,主題抽取可以反映出的具體危機因素。
二、情感·傾向
為了定位輿論危機主題在顯數(shù)據(jù)中的核心位置,需要對顯數(shù)據(jù)進行情感分析。情感可以被計算機理解計算?!皩τ谌藗兊那楦性谀撤N程度上是可以定性和定量分析的?!盵6]自麻省理工學院媒體實驗室Picard教授1997年提出“情感計算”的概念以來,“如何賦予計算機識別、理解、表達和適應人的情感的能力”這一命題逐漸被人們豐富研究。[7]計算機對于情感的識別是其中一個基礎問題,研究人員描述人類感知,并對人類情感建立起情感描述模型。中文語境中的“情感分類”主要指將情感“分為兩類(正面或反面)或三類(正面、反面與中立)”,即積極喜歡的、消極反對的和沒有偏向的三種立場。
“情緒分析”主要指“在現(xiàn)有粗粒度的情感分類基礎上,多維度地描述人的情緒態(tài)度”,情緒分析比情感分析更加注重心理學視角,也更加復雜,研究人員構建了更加豐富的情緒模型,大致分為分類模型和連續(xù)模型①。
分類任務在人工智能研究中較為基礎,對于情感的二分類任務,可以看作一個函數(shù)F(x)=0/1(消極/積極),x是指需要被情感分類的對象,在電影輿情分析中指的是單條文字評論。函數(shù)F(x)代表計算機對x的分類處理過程,也是一個非設計者們未打開的“黑箱”,這個黑箱中裝配著很多參數(shù),仿佛模擬人類的神經(jīng)元,大多數(shù)情況下,設計者們使用人工標記好的訓練數(shù)據(jù)對“黑箱”進行訓練,相當于把知識喂給“黑箱”,監(jiān)督其學習,使其具備對更多x情感二分類的能力。
這樣的情感分析方法仍然存在著一些問題,使用到這些方法的計算機中的算法大多是在特定領域下研究,使用領域內(nèi)特定的數(shù)據(jù)集對算法進行實驗。當性能優(yōu)良的算法被運用到電影輿情的分析中,往往需要適應電影領域特定的知識結構。借助情感詞典是一種情感分析的方法,但是在不同領域中,一些詞的表達并不一致,如“不可預測”在電影評論中是褒義的,表達票房潛力很大等,但在機械工程領域是貶義的,意味著會存在未知的風險。
不同的評論數(shù)據(jù)側重的情感分析關注點不完全一樣。短評論數(shù)據(jù)中的情感傾向更加簡潔明確,一般不會出現(xiàn)多種不同的情感。對其直接進行積極/消極二分類是較好的辦法;長評論數(shù)據(jù)中包含觀眾對于電影的多維情緒,故而需要設計更為復雜的情緒模型,對多維情緒進行概括,還有一種方法是對長評論數(shù)據(jù)進行分段處理,并分別分析各段的情緒,這樣可以避免將一段長評論數(shù)據(jù)的分段處理混合在一起;討論數(shù)據(jù)往往由多條短句構成,情感表現(xiàn)更加明顯簡潔,通過對一組討論數(shù)據(jù)中所有的用戶發(fā)言進行情感分析,一般會有三種結果:討論中積極的情感顯著多/差不多/顯著少于消極的情感,分別代表著引發(fā)了好的共情/爭吵/壞的共情。
通過對顯數(shù)據(jù)的情感分析,人們可以粗略地區(qū)別出情感傾向為積極的和消極的評論數(shù)據(jù),消極的評論數(shù)據(jù)中有影響電影票房口碑的潛在因素,需要對其進行主題抽取。情感傾向為積極的評論數(shù)據(jù)也不能忽視,其中包含可以幫助宣發(fā)團隊加以營銷的話題。
三、主題·挖掘
對顯數(shù)據(jù)進行情感分析后,為了明白造成負面情感的輿論主題,需要對評論文本進行主題挖掘。評論的主題挖掘,需要同時考慮到兩個角度:分析單個評論文本的時候進行主題提取或分類,分析全體評論文本的時候進行聚類分析。如果計算機想理解單個評論數(shù)據(jù)中的主題,需要對單個評論數(shù)據(jù)做主題分類。但是如果考慮到面向整體評論數(shù)據(jù),哪些主題是關鍵的?哪些容易產(chǎn)生影響?需要對單個文本提取出的主題做整合,常常用到的方法為聚類。自然語言處理已經(jīng)發(fā)展了主題分類、主題建模、文本相似度計算等具體任務,數(shù)據(jù)挖掘需要在此基礎上融合各項子任務。
如果有一堆評論數(shù)據(jù)需要弄清楚其中含有哪些主題,需要進行主題建模,而如果已經(jīng)知道電影輿論的主題可能有哪些,希望計算機對評論文本自動標注主題,這是主題分類。顯然票房危機預警系統(tǒng)需要發(fā)掘的是潛在危機,即宣發(fā)階段受輿論影響,是事先無法規(guī)避的情況。
主題建模在對評論的研究中被廣泛運用,人們大多采用LDA(潛在狄利克雷分配)主題模型,這種方式假設每個文檔都包含多個主題,而每個主題又由一組詞語組成。通過分析文檔中詞語的分布,LDA模型可以推斷出每個文檔的主題分布以及每個主題中詞語的分布。例如有一些評論數(shù)據(jù):
【1.故事節(jié)奏太快了】
【2.女主演技太差了,電影色調(diào)和情感表達有沖突】
【3.男主的配音太跳戲了,我實在看不下去】
通過LDA主題模型計算,可以獲得:
主題1:“故事”,“節(jié)奏”,“太快”
主題2:“女主”,“演技”,“太差”
主題3:“沖突”,“色調(diào)”,“情感”,“表達”
主題4:“男主”,“配音”,“跳戲”
每個主題中的主題詞都來源于原有評論數(shù)據(jù),LDA主題模型方法最終通過主題詞表達主題。站在輿情監(jiān)測使用者的角度,系統(tǒng)能夠直接給出主要的潛在危機因素遠比給出一個半成品數(shù)據(jù)需要使用者進一步分析更好。有時候,LDA方法得出的一個主題下的主題詞并不能讓人理解整體含義。
語言模型可以解決這樣的事情。這句話可以被分為多個詞如【“語言”“模型”“可以”“解決”“這樣”“的”“事情”】,詞之間有著語序上的聯(lián)系,為了生成這句話,計算機需要計算第一個詞是什么概率;在第一個詞基礎上,第二個詞是什么概率;……在前面所有詞的基礎上,最后一個詞是什么概率。這就是計算機生成語言的邏輯,語言模型需要解決的就是建構自然語言的概率分布。
采用這樣的處理方式,計算機需要計算的參數(shù)量過大。所以語言模型的發(fā)展早期較為困難,隨著算力的增強以及技術的突破,大語言模型隨之誕生。如今,大語言模型可以根據(jù)提供的問題(提示詞)作出接近人類語言的回答。機器對人類語言的理解和生成達到一個成熟的階段。大語言模型可以輕松解決對文本的觀點抽取、主題分析等等。
因此算法工程師將語言模型運用于主題模型中,提升機器對自然語言的理解能力,目前效果較好且常被人用于主題分析的方法就是BERTopic主題模型,它通過使用大語言模型將文本數(shù)據(jù)映射到高維向量空間,并在此空間中聚類相關文本,從而發(fā)現(xiàn)文本數(shù)據(jù)中的主題結構。這樣的主題模型得到的圍繞主題的關鍵詞更加容易被理解。再使用大語言模型對主題詞進行概括,得到容易被人們理解的話題句。
這樣的算法對于電影輿情檢測仍然存在著一些問題。其一是當前的處理方式并沒有良好的在線性。主題模型的每次處理都是對整體數(shù)據(jù)的直接計算,意即若剛開始有5條評論數(shù)據(jù),主題模型對5條評論數(shù)據(jù)進行主題分析,一段時間后有50條評論數(shù)據(jù),主題模型分析的數(shù)據(jù)規(guī)模擴大了10倍。隨著時間的變化,評論數(shù)據(jù)量越來越多,主題分析的每次處理都需要對全部數(shù)據(jù)進行一次計算。這會造成很大的冗余計算量,預警系統(tǒng)在電影發(fā)行中后期面臨分析時間長的問題。其二是情感分析的準確度對主題分析有著很大的影響。不準確的情感分析會將積極的評論也認為是消極的,同樣,將消極的評論認為是積極的并不參與負面因素提取的抽取。這一方面會使負面因素提取的結果中混入一些積極的評論主題,影響系統(tǒng)用戶的理解,取代原有應該被挖掘出的負面危機;一方面一些蘊含著潛在危機的負面評論被情感認為是積極的,這樣的潛在危機就很難再被發(fā)覺。
對不同評論數(shù)據(jù)的主題挖掘側重點也不一樣,短評數(shù)據(jù)觀眾的主題更加簡潔明確,較為單一,但是語言容易口語化,引發(fā)機器理解上的偏頗,所以需要更加關注對評論的主題分析;長評論數(shù)據(jù)通常包含用戶更多維度的評價和反饋,富含多元主題,觀點表達更為詳細全面,故而對評論數(shù)據(jù)的理解并不困難,反而需要認真對長評論文本進行切分,使觀點和觀點之間不會相互影響。例如情感分析中提到的,討論數(shù)據(jù)大多由短句構成,觀點較為明確,但是表達過于口語化,故對討論中單個用戶短評的分析類似于對短評數(shù)據(jù)的主題分析。除此之外需要做特殊處理,處理一個討論中涉及的主要觀點和次要觀點,并分析影響力。
四、算法·算力
從設計發(fā)行期間電影票房危機預警系統(tǒng),到分析輿情監(jiān)測中需要分析情感和文本主題兩大子問題,這一系列的步驟都在設計算法。算法一詞并非局限于計算機科學領域,在哲學乃至認知科學領域,算法具有更廣義的定義。算法是指解決特定問題或執(zhí)行特定任務的一系列有序步驟的有限序列。這是一種面向解決問題的思維方式。
人工智能的算法主要經(jīng)歷了四個階段:符號主義、統(tǒng)計方法、深度學習和大模型。①符號主義時期的算法依賴于明確的規(guī)則和邏輯進行推理和決策。這些規(guī)則通常由人類專家定義和編碼,這一時期算法可解釋性強,但對復雜問題和大規(guī)模數(shù)據(jù)處理能力有限,缺乏靈活性;統(tǒng)計方法使用概率論和統(tǒng)計學原理進行建模和推斷,可以處理不確定性和隨機問題,但模型的擴展性有限;進入深度學習時期,多層神經(jīng)網(wǎng)絡學習大規(guī)模數(shù)據(jù),獲得處理數(shù)據(jù)提取信息的能力,這個時候算法內(nèi)部結構復雜,缺乏強可解釋性,且對計算資源需求較高;隨著算法和算力的提升,模型的參數(shù)可以包含數(shù)十億甚至數(shù)千億個參數(shù),具有更強的涌現(xiàn)能力和處理能力,即所謂的大模型,算法訓練和部署成本高,對數(shù)據(jù)和算力依賴較大。
根據(jù)對人工智能算法發(fā)展的分析,可以發(fā)現(xiàn)算力隨著硬件性能的提升和計算方法的不斷優(yōu)化,以極快的速度不斷變得更強大,可以輔助更大規(guī)模的問題處理;數(shù)據(jù)方面呈爆炸性增長,且數(shù)據(jù)更加多元化;算法可解決的問題越來越廣,逐漸轉(zhuǎn)向?qū)Ω笠?guī)模和更多元數(shù)據(jù)進行處理,對算力的依賴也越來越強。強大的算力、更多的數(shù)據(jù)和智能的算法三者相互輔助又相互制約,共同建構當下的人工智能。
即使有著強算力、大數(shù)據(jù)和智能算法,對于院線電影發(fā)行期間的輿情研究,仍然存在著很多問題?!皬拇髷?shù)據(jù)分析的數(shù)學原理來看,當前通過電影輿情數(shù)據(jù)挖掘進行風險控制其實是在以偏概全,這類分析目前能夠做的是數(shù)據(jù)優(yōu)化”[8]。誠然,至今國內(nèi)電影輿情分析研究只能對宣發(fā)團隊提供警醒,告訴宣發(fā)團隊出現(xiàn)了哪些危機需要調(diào)整,并不能給他們提供建設性建議。如果需要幫助調(diào)整風險控制策略,需要幫助計算機學習營銷管理相關的知識,并讓計算機了解團隊的宣發(fā)策略?!皬碾娪皵?shù)據(jù)的積累和運用來看,需要人工研判和機器分析相結合”[9]。電影輿論的影響因素種類多樣,不好完全規(guī)避,至今計算機算法并不能做到百分之百可信。
從輿情分析技術層面看,仍然有很多不足和可展望之處。
(一)適應跨域研究,建立特色電影輿情分析體系
目前使用的人工智能算法在特定的研究領域下效果顯著,但不代表在對國內(nèi)電影輿情領域的分析就一定可以取得顯著效果。一方面是大多數(shù)算法在處理英文的效果遠比中文好,中文面臨的自然語言處理問題更加困難,如中文分詞在不同情況下容易造成歧義;另一方面是不同領域下,算法需要適應領域內(nèi)知識,如LDA主題模型算法在處理書籍或者新聞文本數(shù)據(jù)的時候效果好,但在電影評論中效果就沒那么顯著。針對這類問題的解決方案就是建立專屬電影輿情分析的方法,通過對中文自然語言處理方法進行優(yōu)化,建立電影輿情分析專有的數(shù)據(jù)集和分析體系以及對純算法研究中的算法進行本地化參數(shù)調(diào)整訓練。
(二)情感分析轉(zhuǎn)向情緒分析
更加細膩的情緒分析比情感分析能提供更豐富的情感維度,有助于更準確地捕捉觀眾的心理動態(tài)。除了建立起更加細化的情緒模型,還需要對不同情緒進行分析,哪些情緒可能在電影分析中造成不利的影響。此外,對監(jiān)測觀眾情緒隨時間的變化,識別情緒波動和轉(zhuǎn)折點也很重要,可以根據(jù)趨勢確定是否應該對某些因素進行規(guī)避。
(三)評估主題影響力和傳播路徑,識別傳播節(jié)點和意見領袖
需要對主題分析建立更全面的影響力分析不僅需要識別主題,還需評估每個主題的影響力和傳播路徑,分析其對電影票房和口碑的潛在影響。首先,通過社交網(wǎng)絡分析方法,追蹤主題在網(wǎng)絡中的傳播路徑,識別關鍵傳播節(jié)點和意見領袖;其次,構建影響力評估模型,量化每個主題對電影票房和口碑的潛在影響,提供數(shù)據(jù)驅(qū)動的決策支持;同時,實時監(jiān)測各主題的輿情熱度,識別潛在的危機或機遇,及時調(diào)整宣傳策略。
(四)適應大語言模型,獲得更精確的預警結果
大語言模型具備更強的理解和生成能力,可以提升主題分析和情感識別的準確性。利用最新的大語言模型(如GPT-3、BERT等),對電影輿情數(shù)據(jù)進行訓練和微調(diào),以提高模型在特定領域的表現(xiàn)。通過增強模型的上下文感知能力,能夠準確理解評論中的隱含信息和細微差別,從而提高情感和主題分析的準確性?;诖笳Z言模型,還可以開發(fā)生成式預警系統(tǒng),自動生成針對潛在危機的應對策略建議,從而提高預警的智能化水平。
結語
盡管當前的技術發(fā)展已經(jīng)讓輿情監(jiān)測、自然語言處理和人工智能算法在許多領域表現(xiàn)出色,例如,通過推特和微博等社交媒體平臺的大數(shù)據(jù)分析幫助企業(yè)和政府機構科學決策,這些技術的應用已經(jīng)較大地改善了信息獲取和處理的效率。然而,專用于電影行業(yè)的分析方法仍未被充分開發(fā)和應用。電影領域具有其特殊性,例如影評的情感傾向、觀眾反饋的多樣性以及影響電影票房的復雜因素,這些都需要更加精細和定制化的工具來解讀和預測。
此外,需要在監(jiān)測過程中依據(jù)新媒體輿論的傳播規(guī)律,深入理解信息如何在不同的社交網(wǎng)絡和平臺間傳播,以及這些傳播路徑如何影響公眾意見的形成和變化。這種理解對于預測電影輿論走向和市場反應至關重要。從傳播學角度來看,新媒體輿論的形成需要經(jīng)歷信源發(fā)布與議題呈現(xiàn)、輿情擴散與意見整合和輿論效應消散等關鍵節(jié)點,其中新媒體輿論的傳播規(guī)律也有著自己的特點,如次生輿情出現(xiàn)頻度增加、意見領袖影響力增強等。[10]在大數(shù)據(jù)分析中對于這些傳播要素的理解和運用可以幫助電影輿情監(jiān)測更好地適應市場。
構建一個實時的票房危機預警系統(tǒng),實時監(jiān)控輿情變化和票房數(shù)據(jù),及時提醒制片方和發(fā)行商做出實時調(diào)整是有必要的。通過引入先進的算法和模型,可以更好地理解和預測市場動態(tài)。這些數(shù)據(jù)及分析方法,對于分析預測市場受眾喜好,選擇下一部電影的題材有著更強的指引作用。希望通過這些探索和研究,推動電影輿情分析和票房預測技術的進一步發(fā)展,為電影產(chǎn)業(yè)的發(fā)展繁榮貢獻新的力量。
參考文獻:
[1]伍婷.大數(shù)據(jù)語境下動畫電影評論典型意見挖掘分析[ J ].電影評介,2022(20):11-16.
[2]劉玲玉,鄧燕燕.基于Python情感分析和批評隱喻的網(wǎng)絡話語分析——以影片《流浪地球》中美德影評為例[ J ].
江蘇大學學報:社會科學版,2022(03):76-88.
[3]王道平,宋雨情,主編.大數(shù)據(jù)分析[M].北京:北京大學出版社,2022:7.
[4][9]凌燕.新媒體時代的國產(chǎn)電影輿論生態(tài)[ J ].現(xiàn)代傳播(中國傳媒大學學報),2013(04):53-57.
[5][8]倪萬.基于大數(shù)據(jù)的電影輿情數(shù)據(jù)挖掘與風險監(jiān)控研究[ J ].當代電影,2016(02):71-76.
[6]林政,劉正宵,李江楠.情感分析進階[M].北京:機械工業(yè)出版社,2022:3.
[7][美]羅莎琳德·皮卡德.情感計算[M].羅森林,譯.北京:北京理工大學出版社,2005:13.
[10]宮承波,主編.新媒體概論[M].北京:中國廣播影視出版社,2022:175-179.