莫姝,王婷
(貴州大學(xué) 管理學(xué)院,貴州 貴陽(yáng) 550025)
2020年是我國(guó)全面建成小康社會(huì)、實(shí)現(xiàn)第一個(gè)百年奮斗目標(biāo)的歷史性節(jié)點(diǎn),然而,重大突發(fā)性疾病——新型冠狀病毒肺炎(COVID-19)的暴發(fā)打破了人們生活的祥和、威脅了社會(huì)的穩(wěn)定。如今新冠疫情仍沒(méi)有結(jié)束,世界正經(jīng)歷著史無(wú)前例的大流行危機(jī),這對(duì)我國(guó)經(jīng)濟(jì)、政治和文化等方面都產(chǎn)生了深遠(yuǎn)的影響??箵粢咔?,不僅是人類(lèi)與新型冠狀病毒的斗爭(zhēng)而且是科學(xué)研究與時(shí)間的爭(zhēng)奪。各領(lǐng)域?qū)W者高度重視新冠疫情研究,盡最大努力降低它帶來(lái)的社會(huì)成本,其研究成果在防疫中起到了至關(guān)重要的作用。在大量研究文獻(xiàn)涌現(xiàn)的情況下,通過(guò)定量研究,系統(tǒng)分析已有科研成果可以探尋其研究熱點(diǎn)與趨勢(shì),有利于更加有效地開(kāi)展疫情防控工作。
在對(duì)新冠肺炎疫情領(lǐng)域研究現(xiàn)狀與發(fā)展趨勢(shì)的研究中,一方面,部分學(xué)者采用內(nèi)容回顧等定性分析的方法,針對(duì)新冠疫情在中醫(yī)藥治療與分子病理學(xué)方面的研究進(jìn)展進(jìn)行總結(jié)與概括,綜述新冠肺炎疫情對(duì)經(jīng)濟(jì)金融與青少年心理健康的沖擊等。另一方面,少數(shù)學(xué)者采用關(guān)鍵詞圖譜等定量分析方法,對(duì)領(lǐng)域的論文或?qū)@M(jìn)行文本挖掘,從而識(shí)別研究主題。上述研究一定程度上揭示了新冠肺炎疫情的研究現(xiàn)狀、學(xué)科主題與發(fā)展態(tài)勢(shì),但所涉及的大多為其子領(lǐng)域,缺乏對(duì)新冠肺炎疫情整體研究狀況與關(guān)聯(lián)關(guān)系的研究,特別是基于計(jì)量學(xué)基礎(chǔ)的主題挖掘與演化脈絡(luò)梳理。因此,本文在現(xiàn)有研究的基礎(chǔ)上,首先采用LDA主題模型識(shí)別新冠肺炎疫情相關(guān)海量文獻(xiàn)背后所隱含的主題分布,并將其與STM結(jié)構(gòu)主題模型結(jié)果相對(duì)比進(jìn)行一致性驗(yàn)證,從而揭示該領(lǐng)域整體研究結(jié)構(gòu);其次分析各主題受關(guān)注度隨時(shí)間的演化情況,并基于K-Means算法和主成分分析(PCA)降維對(duì)每個(gè)主題分別進(jìn)行聚類(lèi),深入分析該領(lǐng)域主題的特征與差異;最后對(duì)各主題進(jìn)行情感分析,研究其情感表現(xiàn)的演化過(guò)程,并建立“關(guān)注度-情感極性”分析架構(gòu)探究各主題情況,可視化總體屬于消極情感極性主題的負(fù)面詞匯,全面地探究新冠肺炎疫情研究的主題結(jié)構(gòu)與情感演化態(tài)勢(shì),為國(guó)家、科研院所與學(xué)者等把握新冠肺炎疫情領(lǐng)域前沿及熱點(diǎn)提供智力支持與決策指南。
本文構(gòu)建的新冠肺炎疫情主題挖掘與情感分析框架主要包括五個(gè)部分,每個(gè)部分的研究流程與涉及的關(guān)鍵研究方法描述如下。
以中國(guó)知網(wǎng)作為數(shù)據(jù)來(lái)源,采用高級(jí)檢索設(shè)定檢索主題為新冠疫情或COVID-19,使用自定義批量以Excel格式導(dǎo)出題目、摘要等文獻(xiàn)信息,形成初始實(shí)驗(yàn)數(shù)據(jù)集,并人工篩選刪除不完整或重復(fù)出現(xiàn)的文獻(xiàn)記錄形成研究語(yǔ)料庫(kù)。為順利開(kāi)展后續(xù)主題挖掘與情感分析研究,首先對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行去噪處理,去除空格和參考文獻(xiàn)、統(tǒng)一大小寫(xiě)等。其次研究語(yǔ)料中的摘要部分存在一些無(wú)實(shí)際意義的高頻虛詞,使用Python編寫(xiě)程序讀取哈工大停用詞表等去掉這些虛詞,同時(shí)去除詞頻過(guò)高或高低對(duì)研究主題沒(méi)有什么意義的詞匯,如“問(wèn)題”“得到” “研究”等,并且采用jieba進(jìn)行分詞處理。
采用LDA主題模型對(duì)新冠肺炎疫情文獻(xiàn)進(jìn)行主題抽取,以發(fā)現(xiàn)各界學(xué)者關(guān)注的新冠肺炎疫情熱點(diǎn)主題。LDA主題模型是基于詞袋算法以文本-主題-詞匯的變參數(shù)三層貝葉斯結(jié)構(gòu)生成聯(lián)合概率分布的無(wú)監(jiān)督機(jī)器學(xué)習(xí)的算法,常用于文本挖掘領(lǐng)域。為保證LDA主題抽取效果,使用余弦距離、KL差分距離、對(duì)數(shù)似然、JS距離四個(gè)指標(biāo)綜合確定最佳主題數(shù)K。
為了檢驗(yàn)LDA建模的主題質(zhì)量,將其與STM結(jié)構(gòu)主題模型結(jié)果進(jìn)行比較。STM模型生成一篇文檔可以包含多個(gè)主題的混合分布。本文將用信度檢驗(yàn)(Krippendorff's alpha)探究?jī)蓚€(gè)主題算法編碼器(LDA和STM)的結(jié)果匹配程度。alpha值位于0~1之間,并且越接近1表示編碼器之間的分類(lèi)結(jié)果越一致。由于該檢驗(yàn)不受類(lèi)別數(shù)、編碼器數(shù)和數(shù)據(jù)規(guī)模及類(lèi)型等的限制,因此它被廣泛用于衡量?jī)?nèi)容分析數(shù)據(jù)的可靠性。
利用LDA主題模型探究新冠肺炎疫情的主題分布后,分析主題關(guān)注度的演化過(guò)程。本研究先針對(duì)實(shí)驗(yàn)數(shù)據(jù)建立模型,再依照設(shè)定的時(shí)間片把各文獻(xiàn)歸類(lèi),然后依據(jù)每個(gè)時(shí)間片各主題包含文獻(xiàn)數(shù)量的變化情況得出主題關(guān)注度演化過(guò)程。接著本文將使用K-Means算法對(duì)之前得到的每個(gè)主題分別進(jìn)行聚類(lèi),其基本思路是考慮組間方差與組內(nèi)方差將個(gè)觀測(cè)數(shù)據(jù)劃分為個(gè)互斥簇。聚集中心的個(gè)數(shù)是根據(jù)輪廓系數(shù)確定的。此外,為了直觀地表示群集,本文通過(guò)應(yīng)用主成分分析(PCA)將其壓縮為二維向量。
情感分析是分析正面情緒或負(fù)面情緒的過(guò)程。本文采用基于情感詞典的研究方法,以知網(wǎng)Hownet中文情感詞典為基礎(chǔ),涵蓋正負(fù)面評(píng)價(jià)詞與情感詞,同時(shí)結(jié)合新冠肺炎疫情語(yǔ)料作為語(yǔ)境,人工添加了一些詞語(yǔ),以提高該詞典的準(zhǔn)確性和相關(guān)度,從而探究學(xué)者對(duì)新冠肺炎疫情的情感態(tài)度。
構(gòu)建新冠肺炎疫情“關(guān)注度-情感極性”綜合分析框架(圖1),以橫坐標(biāo)代表關(guān)注度、縱坐標(biāo)代表情感極性的二維四象限坐標(biāo)系,并按四個(gè)象限將新冠肺炎疫情各主題分別歸類(lèi)成四種類(lèi)型。關(guān)注度是指根據(jù)文檔-主題矩陣而得到的每個(gè)主題包含的文獻(xiàn)數(shù)量,其能反映學(xué)者對(duì)新冠肺炎疫情各主題的關(guān)注度;情感極性是指每個(gè)主題所包含文獻(xiàn)的情感分?jǐn)?shù)均值,其能反映學(xué)者對(duì)新冠肺炎疫情各主題的情感態(tài)度。整理情感極性為負(fù)的主題的高頻負(fù)面詞匯,以詞云的形式可視化其結(jié)果,有助于學(xué)者有針對(duì)性地改進(jìn)相關(guān)研究。
圖1 “關(guān)注度-情感極性”綜合分析框架
采用知網(wǎng)高級(jí)檢索設(shè)定檢索主題為新冠疫情或COVID-19,選擇同義詞擴(kuò)展,數(shù)據(jù)采集時(shí)間段為2020年1月1日至2021年3月31日,文獻(xiàn)來(lái)源類(lèi)別為SCI、EI、北核、CSSCI,使用自定義批量以Excel格式導(dǎo)出來(lái)題目、摘要等文獻(xiàn)信息,人工篩選刪除不完整或重復(fù)出現(xiàn)的文獻(xiàn)記錄,經(jīng)過(guò)處理后的最后文獻(xiàn)信息共計(jì)7 242條。本文選取信息中的標(biāo)題、摘要與關(guān)鍵詞作為實(shí)驗(yàn)數(shù)據(jù),分別進(jìn)行去噪、分詞和去停用詞處理。
采用LDA主題模型對(duì)文獻(xiàn)文本進(jìn)行主題提取,使用余弦距離、KL差分距離、對(duì)數(shù)似然和JS距離四個(gè)指標(biāo)即 CaoJuan2009、 Arun2010、Griffiths2004、Deveaud2014四個(gè)參數(shù)確定最優(yōu)主題數(shù)K,結(jié)果如圖2所示。橫軸為主題個(gè)數(shù),縱軸為指標(biāo)值。可以看出,隨著主題個(gè)數(shù)的增加,CaoJuan2009、Arun2010和Deveaud2014三個(gè)參考值呈波動(dòng)下降,Griffiths2004呈波動(dòng)上升。隨著主題個(gè)數(shù)變多,LDA主題模型的計(jì)算代價(jià)對(duì)應(yīng)變大,且容易出現(xiàn)過(guò)擬合現(xiàn)象。主題數(shù)為9時(shí)存在一個(gè)局部最優(yōu)值,繼續(xù)增加主題個(gè)數(shù)收益小于投入,因此綜合四項(xiàng)指標(biāo)確定最佳主題數(shù)為9。
圖2 不同主題數(shù)K值情況下指標(biāo)值
經(jīng)過(guò)預(yù)處理數(shù)據(jù)、構(gòu)建模型、確定最優(yōu)主題數(shù)等處理,最終獲得新冠肺炎疫情領(lǐng)域7 242篇文獻(xiàn)的9個(gè)主題及每個(gè)主題前十高頻的關(guān)鍵詞,使用力導(dǎo)向圖展示文檔-主題-詞匯三層關(guān)系及信息如圖3所示。
圖3 文檔-主題-詞匯關(guān)系
結(jié)合圖3中關(guān)鍵主題詞對(duì)各主題的描述,Topic1識(shí)別為生物醫(yī)藥,Topic2識(shí)別為經(jīng)濟(jì)影響,Topic3識(shí)別為新聞與傳媒,Topic4識(shí)別為信息技術(shù)與安全,Topic5識(shí)別為國(guó)際動(dòng)態(tài),Topic6識(shí)別為在線教育,Topic7識(shí)別為心理健康,Topic8識(shí)別為社會(huì)保障和福利,Topic9識(shí)別為中國(guó)政治與國(guó)際政治。
為了驗(yàn)證LDA主題模型分類(lèi)結(jié)果的有效性,將其與STM結(jié)構(gòu)主題模型分類(lèi)結(jié)果進(jìn)行比較并探究其匹配程度,表1以橫縱分別展示了LDA和STM的分類(lèi)結(jié)果??梢钥吹浇^大部分文獻(xiàn)位于對(duì)角線上,即這兩個(gè)模型將大多數(shù)論文合理歸類(lèi)到同一相應(yīng)主題,對(duì)于某些存在歸類(lèi)主題不一致的論文,分析認(rèn)為是這一論文混合了關(guān)于多個(gè)主題的研究。該驗(yàn)證alpha為0.74,盡管不是很高,但是也確保了該模型一定程度的穩(wěn)定性,能認(rèn)為分析結(jié)果具有可信度。
表1 主題分類(lèi)結(jié)果對(duì)比
值得關(guān)注的是,經(jīng)濟(jì)影響主題和國(guó)際動(dòng)態(tài)主題經(jīng)常在同一篇論文中混合出現(xiàn),可看出新冠肺炎疫情的經(jīng)濟(jì)影響與國(guó)際貿(mào)易和進(jìn)出口策略具有一定相關(guān)性;學(xué)者以多樣的方式討論了以新聞與傳媒為主題的新冠肺炎疫情的新聞?shì)浾摴ぷ髋c社會(huì)治理,其中有與心理健康主題交叉的網(wǎng)民情緒影響研究、與信息技術(shù)與安全主題交叉的輿情的生成、傳播及其信息治理研究等;關(guān)于如何保護(hù)弱勢(shì)群體的政策和法律問(wèn)題的論文通常會(huì)被歸類(lèi)到社會(huì)保障和福利主題和信息技術(shù)與安全主題;心理健康主要是針對(duì)疫情擴(kuò)散對(duì)普通民眾的心理影響,還有與在線教育主題交叉的線上課堂對(duì)學(xué)生心理影響研究、與社會(huì)保障和福利主題交叉的針對(duì)特殊人群的心理影響研究等;中國(guó)政治與國(guó)際政治主題與經(jīng)濟(jì)影響主題、社會(huì)保障和福利也存在一定的重疊性。
根據(jù)文檔-主題概率矩陣,按主題劃分文獻(xiàn)數(shù)據(jù),分別查看每個(gè)主題所涵蓋的文獻(xiàn)數(shù)量的演化趨勢(shì),將時(shí)間分為Q1、Q2、Q3、Q4、Q5五個(gè)時(shí)間片,其分別表示2020年第一二三四季度和2021年第一季度,從而得到新冠肺炎疫情各主題-時(shí)間演化情況如圖4所示。
圖4 各主題-時(shí)間演化情況
由圖4可知,以新冠肺炎疫情為主題的文獻(xiàn)發(fā)表量在Q3時(shí)期達(dá)到峰值,后續(xù)呈下降趨勢(shì)但發(fā)文量仍然處在較高水平。這表明疫情暴發(fā)后,學(xué)界高度重視疫情防控研究,并且其快速增長(zhǎng)也部分得益于知網(wǎng)開(kāi)辟了疫情防控優(yōu)秀成果的綠色發(fā)表通道,這進(jìn)一步加快了科研知識(shí)的傳播。之后的下降與我國(guó)疫情得到有效控制、不利影響逐漸減退有關(guān)。以Q3時(shí)期為分界點(diǎn),將學(xué)者對(duì)新冠肺炎疫情的關(guān)注大致分為2個(gè)階段。Q1~Q3時(shí)期,相關(guān)研究以Topic1生物醫(yī)藥、Topic2經(jīng)濟(jì)影響和Topic7心理健康為主,體現(xiàn)了我國(guó)醫(yī)療科研和針對(duì)經(jīng)濟(jì)與民眾的疫情防控反應(yīng)迅速。隨著疫情常態(tài)化,人們的生活逐漸回歸正常。Q4~Q5時(shí)期,針對(duì)Topic6在線教育、Topic4信息技術(shù)與安全、Topic8社會(huì)保障和福利的關(guān)注逐漸增加,這是由于受疫情影響,大量線下活動(dòng)轉(zhuǎn)為線上開(kāi)展,在線教育、遠(yuǎn)程辦公等形式迅速崛起,大量的線上交互就涉及到了信息技術(shù)與安全問(wèn)題,并且對(duì)于如何保護(hù)和幫助受到疫情重創(chuàng)的弱勢(shì)群體這一話(huà)題也備受學(xué)界和政界的關(guān)注。對(duì)Topic3新聞與傳媒、Topic5國(guó)際動(dòng)態(tài)、Topic9中國(guó)政治與國(guó)際政治的關(guān)注相對(duì)穩(wěn)定,比例波動(dòng)不大。
通過(guò)K-Means算法使用關(guān)鍵字對(duì)每個(gè)研究主題進(jìn)行了詳細(xì)分類(lèi):并且應(yīng)用PCA并將其壓縮為二維,可視化的結(jié)果如圖5所示。
圖5 各主題聚類(lèi)情況
生物醫(yī)藥主題大致分為四個(gè)集群研究聚類(lèi):病理表現(xiàn)與臨床特征,醫(yī)護(hù)管理,公共防控和流行病學(xué)。新冠肺炎的暴發(fā)對(duì)整個(gè)社會(huì)是嚴(yán)峻考驗(yàn),理清新冠的病理特征與診斷方法,嚴(yán)格開(kāi)展疫情防控,特別是避免醫(yī)院內(nèi)部的患病與非患病人員的交叉感染非常重要。同時(shí)學(xué)者積極研究應(yīng)如何加強(qiáng)處理突發(fā)公共衛(wèi)生事件的舉措,如何有效解決醫(yī)療等資源分布不均的問(wèn)題,從而提高應(yīng)急能力,并探索新冠肺炎的流行趨勢(shì)與預(yù)防措施,以期早日實(shí)現(xiàn)抗疫成功。
經(jīng)濟(jì)影響主題包括:新冠肺炎疫情對(duì)旅游、物流和食品等各行業(yè),進(jìn)出口等外貿(mào)活動(dòng),電子商務(wù)等數(shù)字平臺(tái)的影響。新冠疫情從消費(fèi)到生產(chǎn)、從國(guó)內(nèi)到全球逐步蔓延,給不同行業(yè)帶來(lái)了或大或小的沖擊,我國(guó)相關(guān)部門(mén)積極開(kāi)展疫情防控,實(shí)施了保證穩(wěn)定供給、推進(jìn)復(fù)工復(fù)產(chǎn)等政策。與此同時(shí),由于線下活動(dòng)的限制,推動(dòng)電子商務(wù)等行業(yè)發(fā)展,加快數(shù)字經(jīng)濟(jì)的變革。
新聞與傳媒可以細(xì)分為輿情研究、謠言傳播與治理和媒體與公眾注意力。新冠疫情暴發(fā)初期,疫區(qū)發(fā)生各類(lèi)物資短缺事件,并且由于官方消息發(fā)布的延遲導(dǎo)致了相關(guān)謠言廣泛傳播。乃至新冠在全球大流行成為波及世界的嚴(yán)重事件,新聞與媒體在本次公共衛(wèi)生事件中的社會(huì)影響就愈發(fā)顯現(xiàn)。如何卓有成效地預(yù)防、阻止和控制謠言的擴(kuò)散,安撫民眾的情緒,開(kāi)展心理疏導(dǎo)工作是抗疫的關(guān)鍵子問(wèn)題。
在信息和通信技術(shù)與安全性主題中,討論了數(shù)字技術(shù)和法律責(zé)任、患者信息保護(hù)以及醫(yī)療保健資源分配。我國(guó)在疫情防控時(shí)運(yùn)用大數(shù)據(jù)等信息技術(shù),進(jìn)行安全監(jiān)測(cè)、感染溯源、信息統(tǒng)計(jì)、資源統(tǒng)籌等多方位調(diào)配,展示了新時(shí)期國(guó)家治理能力的數(shù)字化。但同時(shí)也帶來(lái)了信息泄露、技術(shù)風(fēng)險(xiǎn)等安全問(wèn)題,這有待進(jìn)一步研究應(yīng)對(duì)策略。
國(guó)際動(dòng)態(tài)主題可以細(xì)分為國(guó)際疫情傳播形勢(shì)、新冠疫情對(duì)全球市場(chǎng)與貿(mào)易的影響和全球衛(wèi)生治理。新冠疫情是全球?qū)用嫔系拇罅餍形C(jī),一定會(huì)給世界帶來(lái)巨大的改變,其中涉及經(jīng)濟(jì)、貿(mào)易、政治等多個(gè)方面。疫情造成經(jīng)濟(jì)不景氣、生產(chǎn)停擺、各國(guó)摩擦等問(wèn)題,暴露了全球公共衛(wèi)生治理的不足。一些以發(fā)達(dá)醫(yī)療資源著稱(chēng)的歐美國(guó)家在抗擊疫情時(shí)也一觸即潰,多數(shù)發(fā)展中國(guó)家更是難以應(yīng)對(duì)。
在線教育主題,涉及線上課程、在線討論班和混合學(xué)習(xí)的環(huán)境研究。新冠疫情暴發(fā)初期,學(xué)校正常教學(xué)工作停擺,在線教育迎來(lái)發(fā)展契機(jī)與嚴(yán)峻挑戰(zhàn)。針對(duì)各地教師素質(zhì)、網(wǎng)絡(luò)環(huán)境與設(shè)施水平參差不齊的現(xiàn)狀,如何順利開(kāi)展線上教育,實(shí)現(xiàn)教育現(xiàn)代化,保證各階段學(xué)生健康成長(zhǎng)是備受關(guān)注的問(wèn)題。
關(guān)于心理健康主題,包括新冠肺炎疫情對(duì)心理健康的影響、對(duì)民眾行為的影響以及有關(guān)媒體報(bào)道對(duì)人們的心理影響。新冠疫情的出現(xiàn)與負(fù)面新聞報(bào)道使得民眾廣泛產(chǎn)生消極心理反應(yīng),怎樣幫助民眾恢復(fù)心理健康,擯棄不良情緒是當(dāng)今心理學(xué)界的研究熱點(diǎn)。后疫情時(shí)代,如何監(jiān)測(cè)、干預(yù)民眾心理變化從而提高相關(guān)部門(mén)的抗疫能力與決策水平也極為重要。
社會(huì)保護(hù)和福利這一主題對(duì)弱勢(shì)群體的保護(hù)和福利、國(guó)家和各省市的相關(guān)保護(hù)政策、受疫情影響的各行業(yè)的幫扶這幾方面進(jìn)行詳細(xì)研究。習(xí)近平總書(shū)記在疫情暴發(fā)后頻頻強(qiáng)調(diào),政府要兜底保障弱勢(shì)群體,同時(shí)推行了大量相關(guān)政策,對(duì)象覆蓋各行業(yè)各人群,包括免除賦稅、就業(yè)援助、免費(fèi)治療與免費(fèi)疫苗注射等措施。學(xué)界在高度肯定國(guó)家政策的基礎(chǔ)上,提出自己的意見(jiàn)與建議。
在中國(guó)政治與國(guó)際政治主題中,探究了中國(guó)與其他各國(guó)的外交關(guān)系、新冠疫情對(duì)國(guó)際經(jīng)濟(jì)政治格局的影響、中國(guó)面臨的戰(zhàn)略機(jī)遇與挑戰(zhàn)。面對(duì)新冠疫情,世界各國(guó)既有互幫互助也有摩擦沖突,這對(duì)世界的和平與發(fā)展產(chǎn)生了錯(cuò)綜復(fù)雜的影響,國(guó)際格局也因此發(fā)生微妙變化。學(xué)者努力分析演進(jìn)過(guò)程,探究我國(guó)將面臨的嚴(yán)峻挑戰(zhàn)與應(yīng)對(duì)舉措。
本文運(yùn)用知網(wǎng)Hownet情感詞典,并根據(jù)語(yǔ)料庫(kù)中的文獻(xiàn)對(duì)詞典進(jìn)行補(bǔ)充,以提高其領(lǐng)域針對(duì)性。添加的部分情感詞匯如表2所示。
表2 主題分類(lèi)結(jié)果對(duì)比
通過(guò)情感分析確定正面和負(fù)面的詞匯后,計(jì)算每個(gè)季度每個(gè)主題的情感分布,結(jié)果如圖6所示。可以看出,學(xué)者針對(duì)新冠肺炎疫情的文獻(xiàn)以積極為主,不同主題不同時(shí)間段的態(tài)度有所差異。
圖6 各主題情感分類(lèi)結(jié)果
下面對(duì)各主題做具體分析。Topic1生物醫(yī)藥主題情感在各季度總體都呈現(xiàn)為負(fù)面,隨著時(shí)間的推移,積極情感的比例在逐漸增加,說(shuō)明新冠肺炎目前仍然沒(méi)有特效治療的藥物或機(jī)制,但疫苗等預(yù)防手段的出現(xiàn)讓更多學(xué)者對(duì)該主題的研究前景較為看好。Topic2經(jīng)濟(jì)影響主題情感在前兩個(gè)季度呈現(xiàn)負(fù)面,后三個(gè)季度呈現(xiàn)正負(fù)波動(dòng),可以看出在疫情暴發(fā)前期,國(guó)內(nèi)許多行業(yè)生產(chǎn)停擺、眾多民眾居家隔離,對(duì)國(guó)內(nèi)國(guó)際的經(jīng)濟(jì)產(chǎn)生巨大的沖擊,主要持消極態(tài)度,隨著國(guó)內(nèi)疫情防控工作的進(jìn)一步開(kāi)展,國(guó)外疫情的大規(guī)模暴發(fā),消極情感迅速減退且趨于穩(wěn)定。Topic3新聞與傳媒主題情感持續(xù)正負(fù)波動(dòng),初期可能是因?yàn)榉轻t(yī)務(wù)人員對(duì)新冠肺炎疫情的真實(shí)情況缺乏了解,只能通過(guò)網(wǎng)絡(luò)輿論獲得真真假假的消息,從而產(chǎn)生了一定的公眾恐慌。隨著官媒對(duì)新冠肺炎的深入科普,學(xué)者針對(duì)該主題研究的消極情感減少而積極情感增加。Topic4信息技術(shù)與安全主題情感隨著時(shí)間由負(fù)面趨向中立,可能是因?yàn)閷W(xué)者由最初對(duì)個(gè)人信息安全的擔(dān)憂(yōu)轉(zhuǎn)化為了研究如何以數(shù)字化、智能化、智慧化的方式開(kāi)展疫情防控信息管理。Topic5國(guó)際動(dòng)態(tài)主題情感在第三和第四季度呈現(xiàn)顯著的負(fù)面,這是由于以美國(guó)、法國(guó)、印度為代表的其他國(guó)家在這段時(shí)間暴發(fā)嚴(yán)重新冠肺炎疫情,一定程度上引起了國(guó)際恐慌。Topic6在線教育主題情感相對(duì)積極,呈現(xiàn)遞增的趨勢(shì),受疫情影響,人們普遍長(zhǎng)期居家,在線教育等行業(yè)需求激增,相應(yīng)的研究數(shù)量也增加,為線上服務(wù)帶來(lái)了契機(jī),有望成為經(jīng)濟(jì)發(fā)展的新動(dòng)能。Topic7心理健康主題情感在各季度總體都呈現(xiàn)為負(fù)面,大量民眾抗疫過(guò)程中產(chǎn)生了焦慮、孤獨(dú)等心理問(wèn)題,但消極情緒比例逐漸增多可能與該主題的特性有一定關(guān)系,學(xué)者研究的主要是民眾的負(fù)面情緒,因此該主題會(huì)包含較多的負(fù)面詞語(yǔ)。Topic8社會(huì)保障和福利主題積極情感呈現(xiàn)先減少后增多最后趨于穩(wěn)定的趨勢(shì),這是隨著國(guó)家各類(lèi)政策的推行,如確診感染新型冠狀病毒的患者享受免費(fèi)治療、新冠疫苗免費(fèi)接種等,越來(lái)越多學(xué)者對(duì)該主題持積極態(tài)度。Topic9中國(guó)政治與國(guó)際政治主題情感總體趨于中立,學(xué)界從客觀的角度出發(fā),針對(duì)全球共同抗疫這一特殊情況,思考中國(guó)如何在把自己的事情做好的同時(shí)幫助他國(guó)、承擔(dān)大國(guó)責(zé)任。
對(duì)新冠肺炎疫情各主題進(jìn)行關(guān)注度-情感極性的綜合分析,橫坐標(biāo)代表關(guān)注度,縱坐標(biāo)代表情感極性,并按四個(gè)象限將新冠肺炎疫情各主題分別歸類(lèi)成四種類(lèi)型,結(jié)果如圖7所示。
圖7 “關(guān)注度-情感極性”綜合分析框架
屬于高關(guān)注度的Topic1和Topic2都為消極情感極性,位于第四象限,表明學(xué)者對(duì)生物醫(yī)藥包括臨床醫(yī)學(xué)、基礎(chǔ)醫(yī)學(xué)、藥學(xué)等和對(duì)新冠肺炎疫情帶來(lái)的經(jīng)濟(jì)影響這兩個(gè)主題的關(guān)注度較高,但認(rèn)為其發(fā)展仍然有可以進(jìn)步的空間,相關(guān)學(xué)者若能攻克關(guān)鍵問(wèn)題,實(shí)現(xiàn)科研助力將會(huì)加速抗疫進(jìn)程。針對(duì)預(yù)防與治療新冠的醫(yī)學(xué)研究任重道遠(yuǎn),而相信疫情帶來(lái)的經(jīng)濟(jì)重創(chuàng)將隨著產(chǎn)學(xué)研一體化的發(fā)展逐漸恢復(fù)。Topic3、Topic5和Topic7被歸類(lèi)到第三象限,包括學(xué)者對(duì)新聞與傳媒、國(guó)際動(dòng)態(tài)和心理健康這三個(gè)主題的關(guān)注度相對(duì)較低,心理健康的消極情感最為濃烈,隨著我國(guó)進(jìn)入后疫情時(shí)期,疫后綜合癥逐漸顯現(xiàn),而國(guó)際動(dòng)態(tài)負(fù)面情緒可能來(lái)自于對(duì)國(guó)外疫情的蔓延與民眾呈現(xiàn)消極抗疫有關(guān),新聞與傳媒趨向中立。Topic8位于橫坐標(biāo)左側(cè)上,可以看出社會(huì)保障和福利主題發(fā)文量相對(duì)較低,總體情感呈中性,表明學(xué)者對(duì)我國(guó)相關(guān)幫扶政策的認(rèn)同與共建和諧美好的中國(guó)特色社會(huì)主義的信心。Topic4、Topic6和Topic9屬于第二象限,學(xué)者對(duì)信息技術(shù)與安全、在線教育和中國(guó)政治與國(guó)際政治三個(gè)主題關(guān)注度相對(duì)較少但總體呈積極情感,從文獻(xiàn)來(lái)看,對(duì)于信息技術(shù)與安全主要針對(duì)如何提高相關(guān)技術(shù),對(duì)于在線教育主要關(guān)注其可以更好地利用資源并能帶動(dòng)數(shù)字經(jīng)濟(jì),對(duì)于中國(guó)政治與國(guó)際政治主要探討了疫情期間中國(guó)應(yīng)該如何發(fā)揮大國(guó)作用等,因而對(duì)這些主題持積極態(tài)度。
對(duì)于情感極性為消極的主題,關(guān)注其負(fù)面詞匯對(duì)進(jìn)一步研究具有重要的參考價(jià)值,因此本文繼續(xù)分析呈消極情感極性的Topic1生物醫(yī)藥、Topic2經(jīng)濟(jì)影響、Topic3新聞與傳媒、Topic5國(guó)際動(dòng)態(tài)和Topic7心理健康主題相關(guān)的文獻(xiàn)文本,并挖掘這幾個(gè)主題的負(fù)面高頻詞匯,結(jié)果如圖8所示。
圖8 消極情感極性主題負(fù)面詞匯
以Topic1為例說(shuō)明。關(guān)于生物醫(yī)藥主題的相關(guān)消極文本主要涉及:民眾感染新冠肺炎,并且伴隨有咳嗽、發(fā)燒、乏力等病理表現(xiàn);部分患者病情嚴(yán)重,最終因病死亡;患者出現(xiàn)急性呼吸窘迫綜合征等。
本文基于中國(guó)知網(wǎng)相關(guān)數(shù)據(jù),利用LDA主題模型抽取學(xué)者關(guān)注的新冠肺炎疫情主題,在此基礎(chǔ)上探究了對(duì)新冠肺炎疫情的關(guān)注熱點(diǎn)和情感態(tài)度的演化趨勢(shì),并通過(guò)構(gòu)建新冠肺炎疫情主題“關(guān)注度-情感極性”框架和提取情感極性為消極的主題的負(fù)面詞頻,明確了新冠肺炎疫情相關(guān)主題導(dǎo)致學(xué)者情感偏消極的原因和待繼續(xù)研究的方面??梢缘贸鋈缦陆Y(jié)論:
一是對(duì)新冠肺炎疫情的關(guān)注主題呈現(xiàn)多元化、領(lǐng)域廣的特點(diǎn),不僅包括生物醫(yī)藥、心理健康等醫(yī)學(xué)領(lǐng)域,涵蓋經(jīng)濟(jì)影響、國(guó)際動(dòng)態(tài)、社會(huì)保障和福利、中國(guó)政治與國(guó)際政治等經(jīng)濟(jì)與社會(huì)學(xué)方面的研究,還涉及新聞與傳媒、信息技術(shù)與安全、在線教育等多種話(huà)題的討論。
二是主題關(guān)注度和內(nèi)容演化分析反映了對(duì)新冠肺炎疫情關(guān)注重點(diǎn)的變化趨勢(shì)??偟膩?lái)說(shuō),學(xué)界高度重視對(duì)新冠肺炎疫情的研究,針對(duì)不同主題,關(guān)注強(qiáng)度和變化趨勢(shì)存在一定差異。以Topic1為例,對(duì)生物醫(yī)藥的討論隨著疫情得到有效控制呈現(xiàn)波動(dòng)趨勢(shì),但所占比例最大,表明生物醫(yī)藥未來(lái)仍將是學(xué)者討論和關(guān)注的熱點(diǎn)主題。
三是情感分析反映了對(duì)新冠肺炎疫情情感傾向的變化趨勢(shì)??偟膩?lái)看,對(duì)新冠疫情以消極情感為主,不同主題的情感態(tài)度有所區(qū)別。以Topic1為例,對(duì)生物醫(yī)藥的積極情感呈現(xiàn)逐季增加的態(tài)勢(shì),表明隨著抗疫形勢(shì)逐步好轉(zhuǎn),對(duì)生物醫(yī)藥的正面情緒雖有所增多,但整體還是呈消極極性,需要相關(guān)部門(mén)的決策者和學(xué)者予以重視和關(guān)注。
四是根據(jù)“關(guān)注度-情感極性”框架劃分各主題的類(lèi)型同時(shí)進(jìn)行負(fù)面詞匯挖掘,可為明晰研究重難點(diǎn)、為相關(guān)部門(mén)制定政策提供智力支持。以Topic1為例,生物醫(yī)藥屬于“高關(guān)注度-消極情感極性”區(qū)域,學(xué)者對(duì)其關(guān)注多,表明該領(lǐng)域還存在許多有待探索的研究問(wèn)題,但呈現(xiàn)消極情感極性,說(shuō)明目前的研究還未能完全滿(mǎn)足抗疫的需要,亟須不斷完善。進(jìn)一步挖掘負(fù)面詞匯可分析導(dǎo)致產(chǎn)生消極情感的關(guān)鍵因素是重癥病人、綜合征、感染人數(shù)等。針對(duì)這些因素進(jìn)行研究,將提高學(xué)者對(duì)該主題的情感極性。
本文證明了利用知網(wǎng)挖掘新冠肺炎疫情學(xué)者觀點(diǎn)和態(tài)度的可行性,然而本文存在只以知網(wǎng)文獻(xiàn)為對(duì)象、文獻(xiàn)不夠全面等,后續(xù)研究可以擴(kuò)大數(shù)據(jù)來(lái)源。在當(dāng)前疫情防控常態(tài)化階段,有關(guān)新冠肺炎疫情的研究將在預(yù)防疫苗的有效性等領(lǐng)域呈現(xiàn)更多樣化的研究態(tài)勢(shì),但對(duì)過(guò)去研究的回顧與梳理可以為將來(lái)的新冠肺炎疫情研究提供支撐與啟示,助力我國(guó)盡早全面抗疫成功。