丁子羿,湯文蘊(yùn),馬健霄
(南京林業(yè)大學(xué)汽車與交通工程學(xué)院,江蘇 南京 210037)
新冠病毒是一種高傳染性的病毒,在人流量巨大的交通樞紐有廣泛傳播的可能性。自2021 年7 月20 日起,南京市政府為了有效控制病毒擴(kuò)散,果斷做出了對(duì)交通進(jìn)行管控的決定。交通管控會(huì)影響人們的正常生活,因此有必要分析網(wǎng)民對(duì)交通管控措施的態(tài)度。
新浪微博作為現(xiàn)在最受中國(guó)網(wǎng)民青睞的社交媒體之一,每天更新、發(fā)布大量熱點(diǎn)新聞,網(wǎng)民在微博平臺(tái)下也可以暢所欲言,把個(gè)人觀點(diǎn)傳到網(wǎng)絡(luò)空間。近些年,國(guó)內(nèi)外學(xué)者在新浪微博、推特等平臺(tái)上抓取數(shù)據(jù)并進(jìn)行處理、分析,以便從文字中獲得網(wǎng)民的真實(shí)想法。LI以“南京地鐵”為關(guān)鍵詞,抓取了2014 年1 月至2018 年4 月的微博數(shù)據(jù),根據(jù)構(gòu)建的LDA(Latent Dirichlet allocation)主題模型,分析出潛在的正面和負(fù)面話題,得到了乘客對(duì)南京市地鐵系統(tǒng)的改善建議;為了更準(zhǔn)確地分析突發(fā)公共事件中的輿情情感變化,李長(zhǎng)榮構(gòu)建了面向此類事件的領(lǐng)域情感詞典;劉江月構(gòu)建了融入中英文雙語(yǔ)的細(xì)粒度情感規(guī)范詞典C-ANEW,情感分析的結(jié)果相較于傳統(tǒng)詞典更加準(zhǔn)確。
交通輿情反映了市民對(duì)城市交通問(wèn)題的態(tài)度。其中既包含了交通信息,也反映了市民對(duì)交通出行環(huán)境以及城市交通建設(shè)的期待。LU通過(guò)多渠道社交信息,構(gòu)建了基于Word2Vec 的輿情融合模型,用于感知、檢測(cè)城市交通事故,可視化展現(xiàn)交通違章事件全貌;Cao提出基于中文微博用戶情感分析的半監(jiān)督學(xué)習(xí)方法,可用于預(yù)測(cè)交通擁道路和時(shí)間;Ali將本體論和LDA 模型方法用于分析交通輿情,研究成果可用于改善城市交通擁堵問(wèn)題。目前國(guó)內(nèi)外有關(guān)輿情的研究中,針對(duì)交通輿情的挖掘研究涉及較少,主要研究是從社交平臺(tái)中分離出特定事件的輿情信息,文本挖掘技術(shù)尚未系統(tǒng)地應(yīng)用到交通輿情研究中。本文擬通過(guò)分析新浪微博中南京疫情事件下的交通輿情信息,準(zhǔn)確地把握普通群眾對(duì)公共衛(wèi)生事件下交通管控的態(tài)度,有助于提高交通管控的有效性和滿意度。
本文選取了2021 年7 月“南京市新冠肺炎”事件作為研究對(duì)象,據(jù)相關(guān)報(bào)道,7月20日即日起南京發(fā)布嚴(yán)格落實(shí)交通出行疫情防控措施、積極主動(dòng)配合核酸檢測(cè)等防控工作的公告。兩周內(nèi),本土確診病例數(shù)直線上升,防疫指揮部發(fā)布了“非必要不離寧”的公告。8 月15 日后,疫情逐步得到控制,新增病例數(shù)降低至0 人。因此本文數(shù)據(jù)爬取時(shí)段為7月20日至9月30日,從疫情爆發(fā)初期至疫情得到控制后一個(gè)月。
數(shù)據(jù)采集是一種利用搜索引擎或數(shù)據(jù)源定向獲取結(jié)構(gòu)化數(shù)據(jù)的技術(shù),它擁有十分廣泛的應(yīng)用領(lǐng)域。此次研究選取了全球最大的中文社交網(wǎng)絡(luò)平臺(tái)——微博。我們以“南京”、“疫情”、“交通管制”為關(guān)鍵詞在新浪微博進(jìn)行爬取,時(shí)間跨度為7月20日~9月30日。每條微博抓取的內(nèi)容包括時(shí)間、博文、用戶ID、評(píng)論數(shù)等信息,共抓取數(shù)據(jù)23475條。
微博平臺(tái)的文本信息中包含了大量廣告和無(wú)意義的文字信息,獲取文本后,要對(duì)冗長(zhǎng)的文本進(jìn)行預(yù)處理。本文采用的預(yù)處理方式有文本刪除、去停用詞和中文分詞。在刪除與所研究?jī)?nèi)容無(wú)關(guān)的文本后,最終得到14622條博文。
情感分析技術(shù)可針對(duì)文本自動(dòng)地抽取主觀情感傾向,常用于判斷用戶的情緒分布并統(tǒng)計(jì)其情感變化趨勢(shì)。本文采用Python 的第三方庫(kù)SnowNLP 進(jìn)行情感分析,分別引入積極情感詞庫(kù)和消極情感詞庫(kù),以樸素貝葉斯分類算法作為理論基礎(chǔ),如公式⑴所示:
式中,(類別)表示已經(jīng)標(biāo)注好的訓(xùn)練數(shù)據(jù)先驗(yàn)概率,(詞|類別)表示不同分類詞的出現(xiàn)概率,兩個(gè)指標(biāo)的乘積與每個(gè)詞出現(xiàn)概率(詞)相比,得到最終情感值的輸出結(jié)果。
主題挖掘技術(shù)是文本挖掘領(lǐng)域中新興的一種對(duì)具有代表性的詞、短語(yǔ)或句子進(jìn)行自動(dòng)標(biāo)注和抽取的技術(shù),能快速有效地從海量數(shù)據(jù)中識(shí)別出人們感興趣和有價(jià)值的信息,其在處理大規(guī)模文本時(shí)具備獨(dú)特的優(yōu)勢(shì)。LDA 模型是一種具有優(yōu)秀降維能力的三層貝葉斯模型??梢詫⒃靖呔S的詞空間縮減成由一組主題詞組成的小主題空間。其模型概率如圖1 所示。其中,D 為文檔集合,α、β 分別為模型分布的先驗(yàn)參數(shù),θ、φ 為多重分布參數(shù),變量ω 可由給定文檔數(shù)據(jù)集直接獲得,Z為最終生成的主題詞。
圖1 LDA模型概率圖
本文的技術(shù)流程分為三個(gè)部分,如圖2所示。
圖2 技術(shù)流程圖
⑴通過(guò)Python 抓取微博數(shù)據(jù),對(duì)存儲(chǔ)的文本進(jìn)行數(shù)據(jù)預(yù)處理和詞頻統(tǒng)計(jì);
⑵ 采用Python 的第三方庫(kù)SnowNLP 進(jìn)行情感分析,得到網(wǎng)民們的正負(fù)面情感值并以地理可視化的形式展現(xiàn);
⑶通過(guò)困惑度分析得出最優(yōu)主題詞個(gè)數(shù),構(gòu)建LDA 模型分析得到積極和消極熱點(diǎn)主題詞,并引入時(shí)間節(jié)點(diǎn)分析主題演化趨勢(shì)。
對(duì)博文進(jìn)行預(yù)處理后進(jìn)行高頻詞統(tǒng)計(jì),統(tǒng)計(jì)得到23688 個(gè)不重復(fù)的原始關(guān)鍵詞及其出現(xiàn)頻次。將這些原始關(guān)鍵詞按照出現(xiàn)的頻次排序并取出現(xiàn)頻次最高的前100個(gè)關(guān)鍵詞進(jìn)行清理和分析。首先刪除和研究主題無(wú)關(guān)的詞匯,然后合并語(yǔ)義相同或相似的關(guān)鍵詞。最后得到60 個(gè)語(yǔ)義不重復(fù)且與研究主題相關(guān)的高頻詞,將這些關(guān)鍵詞及其出現(xiàn)頻次作為詞云圖分析的基礎(chǔ)數(shù)據(jù)。
通過(guò)Python 中的WordCloud 包進(jìn)行詞云圖繪制,出現(xiàn)頻次越高,字符越大,繪制的詞云圖如圖3 所示。由圖3可知,祿口機(jī)場(chǎng)、防控、核酸等詞出現(xiàn)頻率的最高,高風(fēng)險(xiǎn)地區(qū)核酸情況以及疫情期間的管控最受網(wǎng)友重視;其次,公安、警察一類的詞出現(xiàn)次數(shù)較高。作為疫情期間的執(zhí)法人員,警察是一線人員,要維護(hù)交通秩序并排查外來(lái)人員是否發(fā)燒,市民對(duì)他們的期望值也比較高。
圖3 高頻詞詞云圖
SnowNLP 情感分析輸出的每條博文的情感值區(qū)間為0 到1,大于0.5 時(shí)為積極情感,越接近1,情感越正面;小于0.5 時(shí)為消極情感,越接近0,情感越負(fù)面。情感分析的地理可視化結(jié)果如圖4 所示。由圖可知,全國(guó)人民對(duì)于此次突發(fā)公共衛(wèi)生事件基本持積極態(tài)度。江蘇其他城市與其相鄰省份,因距疫情爆發(fā)城市較近,部分當(dāng)?shù)厥忻癞a(chǎn)生了不安情緒。此外,湖南省受南京疫情傳播影響較大,因此反映出的負(fù)面情緒較多。
圖4 情緒狀態(tài)分布圖
本研究對(duì)每日的情感分析結(jié)果做了取平均值處理,如圖5所示。由圖可知,網(wǎng)民們的情緒總體上是趨于積極的。8 月15 日以后,負(fù)面情緒出現(xiàn)頻次明顯減少了。但是,7月26日~7月31日、8月9日~8月13日,這兩個(gè)時(shí)段有明顯的情緒下滑的現(xiàn)象。結(jié)合抓取的微博文本及疫情新聞,分析了產(chǎn)生消極情緒的原因:
圖5 情感值分布圖
2021 年7 月20 日后,新冠肺炎在南京市爆發(fā),網(wǎng)民們陷入了恐慌,各種消極言論在網(wǎng)絡(luò)上傳播。7 月26 日起,微博中大量涌現(xiàn)“南京市政府疫情管控以及城市交通管控不當(dāng),當(dāng)?shù)乜瓦\(yùn)樞紐并未實(shí)施嚴(yán)格的管控措施,導(dǎo)致疫情全國(guó)大范圍擴(kuò)散”的言論。
8 月初期,多處收費(fèi)站、高速出站口雙向關(guān)閉;南京部分工地因防疫措施不嚴(yán),導(dǎo)致市內(nèi)16個(gè)工程項(xiàng)目停工整改;同時(shí)惡劣的天氣也影響著交通管制的效率,這些消息造成了部分網(wǎng)民較大的情緒波動(dòng)。
8月22日,江蘇省自南京疫情以來(lái),首次無(wú)新增本土確診病例。疫情得到有效控制,網(wǎng)民對(duì)于南京市的疫情治理和交通管制的注意力逐漸轉(zhuǎn)移到正常生活和交通出行上。疫情初期的消極情感,在經(jīng)過(guò)合理的疫情防控和交通管控后逐漸轉(zhuǎn)變?yōu)榉e極,最后趨于平和。
對(duì)南京市疫情期間交通管制的正面與負(fù)面評(píng)論進(jìn)行了LDA 主題分析。首先,通過(guò)LibSVM 法對(duì)所有的微博評(píng)論文本進(jìn)行文本分類,在預(yù)處理后的14622條數(shù)據(jù)中,與交通密切相關(guān)的文本有13803條。對(duì)分類后的文本數(shù)據(jù)進(jìn)行困惑度分析,事件的主題個(gè)數(shù)隨困惑度變化的折線圖如圖6所示。在南京疫情交通管控事件中,主題個(gè)數(shù)為5時(shí)對(duì)應(yīng)的困惑度值最小,困惑度值最小時(shí)設(shè)置的主題個(gè)數(shù)最佳。因此在構(gòu)建LDA模型時(shí),將積極和消極主題數(shù)都設(shè)置為5。
圖6 南京疫情交通管控事件主題詞的評(píng)論困惑度
模型構(gòu)建完后,分別選取消極與積極占比最高的主題詞進(jìn)行可視化分析,如圖7(a)、圖7(b)所示。
圖7 南京疫情交通管控事件積極與消極熱點(diǎn)主題詞
從負(fù)面評(píng)論的潛在話題來(lái)看,“機(jī)場(chǎng)”、“防控”、“封鎖”體現(xiàn)了網(wǎng)民們對(duì)疫情早期祿口機(jī)場(chǎng)封鎖的迫切期望以及對(duì)當(dāng)?shù)毓ぷ魅藛T的不滿;“封城”、“出入口”、“雙向”、“措施”等主題詞反映出多處收費(fèi)站、高速出站口雙向關(guān)閉后對(duì)市民的出行產(chǎn)生了影響。此外,市民的出行安全與市公安局交警大隊(duì)對(duì)城區(qū)道路實(shí)行交通管制等話題的討論熱度也很高。網(wǎng)友普遍認(rèn)為,即使是在特殊時(shí)期,常規(guī)的交通規(guī)則和市公安局發(fā)布的管制措施仍應(yīng)當(dāng)嚴(yán)格遵守。
積極主題詞反映出網(wǎng)民對(duì)于市交通局發(fā)布的公告和管控措施的實(shí)施力度比較滿意?!皺z測(cè)”、“核酸”、“街道”體現(xiàn)了市民積極配合當(dāng)?shù)厣鐓^(qū)完成好多輪核酸檢測(cè)。同時(shí),城管及道路執(zhí)勤人員對(duì)于各小區(qū)、路口的有序管理很重要,交管部門對(duì)于小區(qū)的合理管控也得到了網(wǎng)友們的認(rèn)可。8 月末疫情得到控制,部分關(guān)閉的客運(yùn)站解封后,市內(nèi)公共交通恢復(fù)正常運(yùn)營(yíng)。
綜上所述,在消極主題詞中,多數(shù)網(wǎng)友對(duì)疫情期間,市內(nèi)交通管控力度、人口流動(dòng)以及高速路口封鎖的問(wèn)題十分重視。限制了人員和車輛的流動(dòng),才能降低病情傳播的風(fēng)險(xiǎn)。同時(shí),對(duì)于身處一線的醫(yī)生和交警等工作人員的生命安危感到擔(dān)憂。在積極主題詞中,網(wǎng)民們對(duì)于市內(nèi)警務(wù)人員對(duì)市民的管理、引導(dǎo)比較滿意。封鎖的客運(yùn)樞紐重新開(kāi)通也解決了市民的出行困難。
結(jié)合LDA 主題分析結(jié)果,本文選取了事件下正負(fù)面占比最高的熱點(diǎn)主題詞作為研究對(duì)象。其在微博中出現(xiàn)的次數(shù)與時(shí)間序列的關(guān)系見(jiàn)圖8。
圖8 熱點(diǎn)主題詞隨時(shí)間變化趨勢(shì)
由圖8 可知,南京疫情下交通管控的正負(fù)面熱點(diǎn)話題討論熱度總體趨勢(shì)相似,疫情初期網(wǎng)民的注意力大多放在大型樞紐的管控、人員遷徙情況上,隨著疫情逐步好轉(zhuǎn)及部分違規(guī)事件的產(chǎn)生,群眾的目光才轉(zhuǎn)向市內(nèi)的交通問(wèn)題上。在8月中旬,隨著疫情的好轉(zhuǎn),開(kāi)放各大交通樞紐、恢復(fù)公交班線等話題達(dá)到了峰值?;謴?fù)正常工作、出行的市民情緒趨向積極,相關(guān)話題討論熱度也逐漸下降。
本文通過(guò)數(shù)據(jù)采集與預(yù)處理、情感分析與地理可視化、主題挖掘及演化技術(shù),分析了網(wǎng)民對(duì)突發(fā)公共衛(wèi)生事件下交通管制的看法、建議。由分析的結(jié)果可知,網(wǎng)民對(duì)此類事件情緒總體上是積極的。疫情期間,警務(wù)人員對(duì)交通合理的管控以及疫情逐漸得到控制等信息都讓網(wǎng)民們充滿了度過(guò)疫情的信心。從主題挖掘的結(jié)果來(lái)看,安全出行、客運(yùn)樞紐管控等主題詞是網(wǎng)民關(guān)注的重點(diǎn)?,F(xiàn)在新冠疫情已成為了常態(tài)化的突發(fā)公共衛(wèi)生事件。根據(jù)本文輿情分析得到的結(jié)果,對(duì)今后突發(fā)公共衛(wèi)生事件的管制措施提出了相應(yīng)的改善建議:
⑴嚴(yán)格落實(shí)市交通局發(fā)布的交通管制措施。為了防止因車輛同行和人員流動(dòng)導(dǎo)致的疫情擴(kuò)散,無(wú)論是在疫情爆發(fā)期間或是疫情得到控制后,都需減少扎堆出行和不必要的外出,對(duì)于市內(nèi)各個(gè)小區(qū)間實(shí)施封鎖,避免不必要的人員流動(dòng)或群聚行為,嚴(yán)懲違規(guī)的出行者。
⑵嚴(yán)格管控各個(gè)高速路口、車站及機(jī)場(chǎng)出入口。仔細(xì)排查每一位進(jìn)出的本地市民和外地市民的行程以及健康情況。如有發(fā)燒或身體狀況異樣的市民要及時(shí)隔離觀察。
⑶維護(hù)好市內(nèi)正常的交通秩序。疫情期間違規(guī)行駛等情況依然存在。在特殊時(shí)期對(duì)于違規(guī)的交通行為更加不能忽視。
以上是基于研究結(jié)果總結(jié)出的突發(fā)公共衛(wèi)生事件下交通管制的建議。在進(jìn)行合理的交通管制的同時(shí),也要對(duì)于微博等平臺(tái)的輿情信息進(jìn)行正確的引導(dǎo),避免虛假輿論的傳播。從輿論控制和交通管制兩方面考慮,可以更有效地輔助并控制疫情的傳播。