徐選華, 楊 欣, 陳曉紅
(中南大學(xué) 商學(xué)院,湖南 長沙 410083)
近年來,我國重大突發(fā)事件的發(fā)生愈加頻繁,由此造成的生命財(cái)產(chǎn)損失也不斷增加,如2015年8月12日天津港瑞海公司倉庫發(fā)生的重大火災(zāi)爆炸事故,共造成165人遇難、8人失蹤,核定的直接經(jīng)濟(jì)損失達(dá)68.66億元,同時(shí)造成了惡劣的社會影響,引起了國家的高度重視。事故發(fā)生后,來自不同領(lǐng)域的專家小組緊急趕赴天津參與處置工作,但由于救援現(xiàn)場信息存在滯后性和不完整性,災(zāi)情訊息無法及時(shí)、全面的匯總到?jīng)Q策者手中,使決策分析工作面臨風(fēng)險(xiǎn)認(rèn)知缺乏、群體行為研判困難等一系列難題。因此,在應(yīng)急決策中專家群體如何利用突發(fā)事件發(fā)生初始階段產(chǎn)生的大數(shù)據(jù)信息作為決策依據(jù),并快速做出風(fēng)險(xiǎn)程度較低的決策是迫切需要解決的問題。
在過去,多屬性應(yīng)急決策過程主要依賴于專家的知識經(jīng)驗(yàn)對事件進(jìn)行主觀判斷和預(yù)測[1],但是對于一些特定場景下的應(yīng)急決策,例如面對事件發(fā)生后引發(fā)公眾強(qiáng)烈關(guān)注或?qū)<艺莆盏男畔⒉蛔阋灾苯舆M(jìn)行決策判斷的情景,則需要在決策過程中引入公眾擁有的信息,以降低決策專家與公眾之間存在的信息不對稱帶來的風(fēng)險(xiǎn)。近年來社交網(wǎng)絡(luò)的快速發(fā)展為信息傳播和發(fā)揮公眾智慧提供了重要平臺[2]。重大突發(fā)事件發(fā)生后,億萬網(wǎng)民會迅速聚集起來并參與其中,將自己的想法和見聞以文字、圖片、音頻、視頻等形式發(fā)布在網(wǎng)絡(luò)上,形成體量巨大的用戶生成內(nèi)容(User-Generated Content,UGC)。這些非結(jié)構(gòu)化數(shù)據(jù)雖然來源分散,但其中蘊(yùn)含著寶貴的信息可以用于支持應(yīng)急決策?!胺直姟笔窃趹?yīng)急管理中應(yīng)用較多的一種新興模式[3,4],它通過將任務(wù)分配給相關(guān)人群以得到整合的結(jié)果,利用網(wǎng)絡(luò)社交媒體作為“分眾”平臺可以收集和分析UGC中社會公眾對突發(fā)事件的偏好信息。目前關(guān)于突發(fā)事件背景下UGC被用于應(yīng)急管理的研究主要集中在對事件的檢測和預(yù)警[5,6]、對事件的監(jiān)控和描述[7]、對事件造成損害的評估[8,9]、信息傳播和分布模式[10,11]以及突發(fā)事件下的個(gè)人、群體行為[12,13]等領(lǐng)域,而關(guān)于將UGC用于應(yīng)急決策方案選擇的文獻(xiàn)較為匱乏。本文認(rèn)為突發(fā)事件情境下UGC中包含了公眾對事件造成的損害和事態(tài)發(fā)展趨勢的感知,決策者應(yīng)該重視公眾對事件的關(guān)注點(diǎn),并設(shè)法降低事件焦點(diǎn)方面的影響,因此需要利用數(shù)據(jù)挖掘技術(shù)對UGC進(jìn)行處理,獲取及時(shí)、有用的信息幫助決策者從全局視角進(jìn)行決策分析。
另一方面,重大突發(fā)事件具有復(fù)雜特征,往往需要多方專家聯(lián)合進(jìn)行決策,以確保結(jié)果的合理性,來自不同層次的眾多決策者將構(gòu)成決策大群體[14]。然而,事態(tài)發(fā)展的非預(yù)期性、決策信息的不完整性以及決策主體作為“有限理性人”[15]等自身的主觀性影響因素,使得決策者常常難以對突發(fā)事件做出全面、合理的判斷,因此形成了風(fēng)險(xiǎn)性決策問題。目前,國內(nèi)外學(xué)者已對這一問題進(jìn)行了大量研究。Zhu[16]考慮決策者的主觀態(tài)度,基于前景理論分別對靜態(tài)和動態(tài)決策問題提出了設(shè)定多個(gè)參考點(diǎn)的多屬性風(fēng)險(xiǎn)性群決策方法;Liu[17]以堰塞湖下游村莊的緊急疏散為背景,提出一種基于累積前景理論的分析方法來解決應(yīng)急響應(yīng)中的風(fēng)險(xiǎn)決策問題;袁媛等[18]基于后悔理論的思想,針對突發(fā)事件發(fā)生后實(shí)施不同應(yīng)急方案可能導(dǎo)致不同情景及損失產(chǎn)生的問題,提出了相應(yīng)的風(fēng)險(xiǎn)決策方法;徐選華等[19]針對復(fù)雜環(huán)境下決策者在決策過程中出現(xiàn)的偏好轉(zhuǎn)移問題,采用馬爾科夫決策技術(shù),提出一種大群體風(fēng)險(xiǎn)型動態(tài)應(yīng)急決策方法;Liu等[20]針對應(yīng)急決策具有的動態(tài)演變和多情景特征,提出基于故障樹分析的風(fēng)險(xiǎn)決策方法;Tang[21]基于調(diào)查數(shù)據(jù)、統(tǒng)計(jì)分析和領(lǐng)域?qū)<抑R建立了貝葉斯網(wǎng)絡(luò)模型,對南水北調(diào)工程產(chǎn)生突發(fā)性水質(zhì)污染事故的風(fēng)險(xiǎn)進(jìn)行了分析。上述研究雖然從心理行為或數(shù)理公式角度給出了風(fēng)險(xiǎn)性應(yīng)急決策方法,但較少應(yīng)用到大群體決策中,并且決策過程都是由決策者獨(dú)立給出偏好信息,其結(jié)果對于其他決策成員不可見。而現(xiàn)實(shí)的很多場景(例如專家會議法)中決策者的意見是開放展示的,即決策者可以觀察到別人的觀點(diǎn)再發(fā)表意見[22,23],此時(shí)決策者的意見很容易受到他人偏好的影響。同時(shí),應(yīng)急決策過程需要在高時(shí)間壓力下得出決策結(jié)果,決策者自身認(rèn)知水平和經(jīng)驗(yàn)的差異,可能導(dǎo)致其給出的偏好與其他人產(chǎn)生較大偏差。并且大群體決策成員較多,在實(shí)際決策過程中也不排除有應(yīng)付性的人員。這些專業(yè)性較低的人可能表現(xiàn)出的偏好不確定性及偏離群體一致性將造成決策風(fēng)險(xiǎn)并對最終結(jié)果產(chǎn)生較大影響,因此對決策者個(gè)人的主觀決策風(fēng)險(xiǎn)進(jìn)行有效的鑒別并合理處理是有必要研究的問題。
基于以上不足,本文將重大突發(fā)事件的UGC數(shù)據(jù)與大群體風(fēng)險(xiǎn)性應(yīng)急決策相結(jié)合,提出一種基于UGC大數(shù)據(jù)挖掘的大群體兩階段風(fēng)險(xiǎn)性應(yīng)急決策方法。首先運(yùn)用自然語言處理方法從UGC中獲取公眾偏好信息,結(jié)合專家知識構(gòu)建屬性體系,利用模糊綜合評價(jià)對事件的損害程度進(jìn)行評估,并由此確定決策屬性權(quán)重。然后,構(gòu)造兩個(gè)決策階段并收集這兩個(gè)階段的決策者偏好信息。根據(jù)同一決策者兩次偏好信息的差異計(jì)算成員決策風(fēng)險(xiǎn)系數(shù),利用聚類方法確定決策者權(quán)重,在此基礎(chǔ)上實(shí)現(xiàn)對方案的綜合排序。
本文在重大突發(fā)事件所處的大數(shù)據(jù)環(huán)境下,充分挖掘公眾對事件的關(guān)注點(diǎn)及偏好信息,針對決策者偏好的不確定性及偏離群體一致性導(dǎo)致的風(fēng)險(xiǎn),提出依據(jù)決策者意見的可靠度和準(zhǔn)確度的方法對風(fēng)險(xiǎn)進(jìn)行測度,在此基礎(chǔ)上實(shí)現(xiàn)對決策方案的科學(xué)排序。
為了將公眾信息考慮到?jīng)Q策過程中,本文從數(shù)據(jù)挖掘獲得的突發(fā)事件UGC大數(shù)據(jù)出發(fā),首先決策專家利用抽取得到的事件關(guān)鍵詞構(gòu)建屬性體系,然后對制定好的備選方案進(jìn)行評價(jià)。由于現(xiàn)實(shí)中的決策群體成員之間通常有很強(qiáng)的依賴行為,當(dāng)別人的決策是可觀察的,且決策有先后次序時(shí),很容易產(chǎn)生“羊群行為”[25]。此時(shí)決策者易跟隨他人的判斷表現(xiàn)出非真實(shí)偏好,導(dǎo)致決策信息擁有較低的可靠性。考慮這一行為特點(diǎn),可以讓決策者在意見開放的場景下進(jìn)行決策,通過記錄決策者對偏好信息做出的修改行為識別出群體中對偏好不確定程度較大的成員。因此本文將收集決策者偏好信息的過程設(shè)計(jì)為兩個(gè)階段,即決策者先獨(dú)立給出個(gè)體偏好信息,再參照其他決策者的意見重新給出個(gè)體偏好信息。最后利用屬性權(quán)重和成員權(quán)重對決策者的評價(jià)信息進(jìn)行集結(jié),獲得備選方案的排序結(jié)果。方法具體流程如圖1所示。
圖1 基于UGC大數(shù)據(jù)挖掘的大群體兩階段風(fēng)險(xiǎn)性應(yīng)急決策流程
鑒于應(yīng)急決策問題的復(fù)雜性和模糊性,決策者難以采用定量化的數(shù)值去刻畫所有決策對象的特征,同時(shí)屬性間的差異也難以適用于同一語言術(shù)語集。本文采用多粒度區(qū)間二元語義模型[26],能夠有效避免語言評價(jià)信息的損失和扭曲,使語言信息計(jì)算結(jié)果具有很好的精確性和可操作性。
定義1假設(shè)語言集S={s0,s1,…,sg}粒度為g+1,經(jīng)集成運(yùn)算得到結(jié)果β∈[0,1]。將二元語義(sr,α)表達(dá)為數(shù)值形式β的函數(shù)Δ表示如下:
(1)
“round” 為四舍五入取整算子.
存在反函數(shù)Δ-1將二元語言變量轉(zhuǎn)換成相應(yīng)的實(shí)數(shù)β∈[0,1],即:
(2)
定義2假設(shè)語言集S={s0,s1,…,sg}粒度為g+1,區(qū)間二元語義變量由兩個(gè)二元語義[(sa,αa),(sz,αz)]組成,其中(sa,αa)≤(sz,αz)。用來將區(qū)間二元語義變量表達(dá)為等價(jià)信息區(qū)間值[β1,β2](β1,β2∈[0,1],β1≤β2)的集成轉(zhuǎn)移函數(shù)Δ為
Δ[β1,β2]=[(sa,αa)≤(sz,αz)]
(3)
存在逆函數(shù)Δ-1可以將區(qū)間二元語義變量轉(zhuǎn)換為相應(yīng)的區(qū)間值,即
Δ-1[(sa,αa),(sz,αz)]
(4)
為了便于表達(dá),決策者在給出偏好信息時(shí)可以采用具體語言值或區(qū)間語言值(例如s1或[s1,s3])兩種形式,將它們轉(zhuǎn)換為區(qū)間二元語義偏好信息的方式分別為:s1→[(s1,0),(s1,0)],(s1,s3)→[(s1,0),(s3,0)]。
TF-IDF(Term Frequency times Inverse Document Frequency)是向量空間模型中一種計(jì)算文檔中特征權(quán)重的經(jīng)典方法,它由Salton在1988年提出[27]。其函數(shù)包括兩個(gè)部分:TF即詞頻,是特定文檔中某個(gè)特征項(xiàng)(字、詞或短語)出現(xiàn)的頻率;IDF即逆文檔頻率,是包含該詞或短語的文檔與文檔集總數(shù)的比例的對數(shù)。其計(jì)算公式為:
(5)
其中,wtd為文檔d中特征項(xiàng)t的權(quán)重,tftd表示文檔d中特征項(xiàng)t出現(xiàn)的頻率,N表示文檔集的總數(shù),dft表示包含特征項(xiàng)t的文檔數(shù)。
TF-IDF算法的優(yōu)勢在于其能夠通過統(tǒng)計(jì)手段分析處理非結(jié)構(gòu)化文本大數(shù)據(jù)。對于某一特定文檔內(nèi)的高頻詞語,以及該詞語在其它文檔集合中的低詞頻,可以產(chǎn)生出高權(quán)重。故TF-IDF傾向于過濾掉常見的詞語,保留一些不頻繁出現(xiàn)但重要的詞語。例如,在爆炸事故背景下許多相關(guān)文本中常見的“爆炸”一詞的逆文檔頻率會很低,權(quán)重也會相應(yīng)較低。因此,本文采用TF-IDF法分配詞語權(quán)重。
當(dāng)重大突發(fā)事件現(xiàn)場數(shù)據(jù)需要通過多環(huán)節(jié)層層上報(bào)時(shí),信息存在滯后性和不完整性,事件的實(shí)時(shí)動態(tài)監(jiān)測較為困難,這些問題增加了應(yīng)急決策分析的風(fēng)險(xiǎn)。而近年來,隨著信息技術(shù)的發(fā)展和公眾對突發(fā)事件關(guān)注度的提升,網(wǎng)絡(luò)信息資源也已成為重大突發(fā)事件應(yīng)急決策需要重視的一環(huán)。當(dāng)事件發(fā)生后,社交網(wǎng)絡(luò)平臺上會生成大量公眾對事件發(fā)表的信息,這些UGC代表了公眾當(dāng)下的關(guān)注點(diǎn),同時(shí)也包含了公眾對事件的描述、心態(tài)和造成損害的感知。因此,應(yīng)急決策方案選擇的屬性權(quán)重確定過程有必要考慮社交網(wǎng)絡(luò)中公眾的偏好信息。
(1)決策屬性體系構(gòu)建
UGC的優(yōu)勢在于其對突發(fā)事件反應(yīng)的即時(shí)性,但同時(shí)也存在信息過于分散的現(xiàn)象,通過結(jié)合專家意見的指導(dǎo)能夠有效彌補(bǔ)這一問題。本文中基于UGC的突發(fā)事件應(yīng)急決策方案評估屬性體系主要包括兩部分:①是傳統(tǒng)的突發(fā)事件應(yīng)急決策方案評估屬性;②是社交媒體用戶實(shí)時(shí)信息中的關(guān)鍵詞。具體而言,前者需要專家憑借經(jīng)驗(yàn)經(jīng)由群體討論確定,并作為屬性體系的框架部分;后者首先通過數(shù)據(jù)挖掘獲取UGC,再通過抽取算法得到若干代表文本特征的關(guān)鍵詞,作為公眾偏好信息的概括,最后根據(jù)關(guān)鍵詞與屬性的語義關(guān)系構(gòu)建屬性體系。
其中,關(guān)鍵詞的抽取采用TF-IDF算法對文本分詞后的特征項(xiàng)進(jìn)行排序,并選取特征項(xiàng)中權(quán)重較大的實(shí)詞作為關(guān)鍵詞。從社交網(wǎng)絡(luò)平臺爬取的文本數(shù)據(jù)將作為語料庫,每條文本信息被看作一篇文檔,關(guān)鍵詞的權(quán)重由包含該詞語的所有文檔數(shù)進(jìn)行算術(shù)平均得到,其計(jì)算公式為(6)式。
(6)
(2)事件損害評估及屬性權(quán)重確定
基于建立的屬性體系可以利用模糊綜合評價(jià)實(shí)現(xiàn)對事件造成損害的實(shí)時(shí)評估,并由此計(jì)算屬性權(quán)重,為決策者進(jìn)行方案選擇提供參考信息。損害程度將用于描述事件對當(dāng)?shù)厣鐣⑷藛T財(cái)產(chǎn)以及公眾心態(tài)的影響大小。由于關(guān)鍵詞的獲取方法側(cè)重于統(tǒng)計(jì)分析而非內(nèi)容分析,其權(quán)重僅代表在文檔中出現(xiàn)頻率的重要程度,而不同詞語的語義本身還反映出不同的損害程度,因此事件的損害評估需要組織專家對每個(gè)關(guān)鍵詞給出語義評判分值,以表征損害的嚴(yán)重程度。例如詞語“死亡”的嚴(yán)重程度高于詞語“受傷”,則賦予“死亡”的分值大于“受傷”。分值的范圍設(shè)定為從0到5。
不同屬性方面受到的損害程度通過各個(gè)對應(yīng)的關(guān)鍵詞語義評分進(jìn)行加權(quán)求和得到。評價(jià)第j個(gè)屬性的損害程度值Daj的計(jì)算函數(shù)為(7)式。
(7)
其中y表示屬性j對應(yīng)的關(guān)鍵詞個(gè)數(shù)。
由于損害程度的計(jì)算來源于公眾對事件造成影響的主觀感知與信息關(guān)注偏好,當(dāng)某個(gè)屬性的損害程度值越大,說明公眾在此方面受到的影響越大或給予的關(guān)注越多,決策者在評判方案時(shí)必須對此加以重視,避免制定的決策方案在此方面造成更嚴(yán)重的后果,因此屬性的權(quán)重根據(jù)各屬性損害程度值的大小確定。
(8)
隨著計(jì)算機(jī)網(wǎng)絡(luò)和信息系統(tǒng)技術(shù)的發(fā)展,專業(yè)人士已經(jīng)開發(fā)出愈加專業(yè)化的決策支持系統(tǒng),使得決策者意見的收集、處理、統(tǒng)計(jì)及交互共享更加便捷。對于重大突發(fā)事件大群體應(yīng)急決策問題,考慮到?jīng)Q策成員較多,不同成員的主觀決策能力是構(gòu)成決策風(fēng)險(xiǎn)的一項(xiàng)重要因素,決策結(jié)果將直接受其影響。因此,需要將決策者的主觀決策風(fēng)險(xiǎn)因素納入到成員權(quán)重確定中。本節(jié)基于兩階段決策流程對決策者的決策風(fēng)險(xiǎn)進(jìn)行測度,并通過定義決策者意見的可靠度和準(zhǔn)確度來量化風(fēng)險(xiǎn)的大小,決策成員的權(quán)重按照其決策風(fēng)險(xiǎn)大小進(jìn)行相應(yīng)的修正。
(1)決策偏好信息收集
在這個(gè)過程中,各決策者將群體中其他人的意見當(dāng)做一種反饋的參照系統(tǒng),因此第二階段的意見可以被認(rèn)為是參照了其他決策成員的意見。同時(shí),在第二階段某些成員的意見可能會受其他人的影響,例如專業(yè)性較低的決策者對于第一階段給出的偏好信息沒有把握,在觀察到其他成員的意見后對自己的初始偏好信息做出修改,或決策者出于從眾心理,將初始偏好信息調(diào)整為與多數(shù)人的意見保持一致,而某些決策者也可能選擇對初始偏好信息維持不變。通常來說,堅(jiān)持第一階段意見的成員意味著他們對于做出的判斷越自信,其決策偏好的確定性就越高;相反,修改偏好后與初始意見相差越大則表示其對于做出的判斷越?jīng)]有自信,決策偏好的不確定性就越高。
(2)考慮決策者意見可靠度和準(zhǔn)確度的決策風(fēng)險(xiǎn)系數(shù)測度
(9)
計(jì)算各決策方案的屬性均值以反映群體意見。例如,第l個(gè)備選方案中屬性j在個(gè)體獨(dú)立決策和參照決策過程中的平均值分別為:
(10)
對于大群體決策成員,以往的多屬性群決策研究中很少考慮決策者偏好信息的可靠性,或簡單地假設(shè)所有決策者的偏好信息都是完全可靠的。事實(shí)上,任何決策者都是不完全理性的,其做出的不同程度可靠性的判斷都將對決策結(jié)果產(chǎn)生影響。
(11)
除此之外,在群決策中群體意見的一致性也是值得關(guān)注的問題。決策結(jié)果能否被群體接受或在多大程度上能被群體接受往往更具有現(xiàn)實(shí)意義和更能快速實(shí)施。當(dāng)個(gè)體意見與群體意見偏離程度越大,其對達(dá)成群體一致性的阻力越大,由此將引發(fā)成員偏好沖突帶來的決策風(fēng)險(xiǎn)。為了使決策結(jié)果擁有較高的共識水平,本文認(rèn)為占多數(shù)的專家意見比少數(shù)意見更為準(zhǔn)確,即當(dāng)某位決策者給出的偏好信息與群體意見更接近時(shí)表明其擁有較高的專業(yè)性。
(12)
針對決策者而言,其自身決策能力導(dǎo)致的風(fēng)險(xiǎn)是無法避免的,僅僅擁有較高的可靠度并不能保證決策者擁有較低的決策風(fēng)險(xiǎn),當(dāng)決策者對事件相關(guān)的知識、經(jīng)驗(yàn)掌握并不充分時(shí),其仍可能為假裝其專業(yè)性堅(jiān)持初始意見。因此,成員的決策風(fēng)險(xiǎn)將依據(jù)其意見的可靠度和準(zhǔn)確度共同度量。
(13)
定義λi為成員ei的決策風(fēng)險(xiǎn)系數(shù),表示決策者ei偏好的不確定性及偏離群體一致性導(dǎo)致的決策風(fēng)險(xiǎn)程度,有:
(14)
其中,θ和(1-θ)表示可靠度和準(zhǔn)確度所對應(yīng)的權(quán)重,且0≤θ≤1。具體由決策者根據(jù)決策問題和實(shí)際情況而定,若無特殊偏好,取θ=1/2,表示賦予可靠度和準(zhǔn)確度相同的權(quán)重。
對于λi,首先,分別計(jì)算決策者對于方案l中屬性j給出偏好的決策風(fēng)險(xiǎn)系數(shù),再進(jìn)行簡單加權(quán)算術(shù)平均得到成員的決策風(fēng)險(xiǎn)系數(shù)。顯然,當(dāng)決策者意見的可靠度或準(zhǔn)確度越大時(shí),成員的決策風(fēng)險(xiǎn)系數(shù)λi越小,表示成員的決策風(fēng)險(xiǎn)越??;反之,λi越大,表示成員的決策風(fēng)險(xiǎn)越大。
(3)大群體偏好聚類及成員權(quán)重確定
(15)
利用決策成員風(fēng)險(xiǎn)系數(shù)λi對成員的初始權(quán)重進(jìn)行調(diào)整,λi越大,說明其提供的信息越不確定或越偏離一致性目標(biāo),應(yīng)賦予的權(quán)重越低。最終,決策成員ei的決策風(fēng)險(xiǎn)權(quán)重ωi為:
(16)
綜上所述,基于UGC大數(shù)據(jù)挖掘的大群體兩階段風(fēng)險(xiǎn)性應(yīng)急決策方法的步驟如下:
Step1從社交媒體平臺爬取突發(fā)事件相關(guān)的UGC,結(jié)合專家制定的屬性框架和UGC中抽取的關(guān)鍵詞構(gòu)建屬性體系。
Step2利用(6)式獲得的關(guān)鍵詞TF-IDF權(quán)重wh及專家評分法確定的語義評判值sh,根據(jù)(7)式計(jì)算每個(gè)屬性的損害程度值Daj,歸一化后得到各屬性的權(quán)重wj。
Step6通過TOPSIS方法對備選方案進(jìn)行排序:
(1)利用屬性權(quán)重對決策者的參照意見區(qū)間偏好矩陣進(jìn)行集結(jié),得到加權(quán)決策矩陣。
(2)確定決策方案的正理想解和負(fù)理想解。
(3)計(jì)算各方案到正理想解和負(fù)理想解的距離。
(4)計(jì)算各方案的貼近度。
(17)
最后,按照Cl的大小排列方案的優(yōu)劣次序。
2015年8月12日23時(shí)30分,天津港瑞海公司倉庫發(fā)生特別重大火災(zāi)爆炸事故,先后兩次爆炸的強(qiáng)度分別相當(dāng)于3t、21t TNT。爆炸造成重大人員傷亡,并引發(fā)大量集裝箱起火。當(dāng)?shù)叵乐笓]中心接警后迅速響應(yīng)處置,截至13日上午11時(shí),天津消防總隊(duì)已先后調(diào)派143輛消防車,1000余名消防官兵到場進(jìn)行滅火搜救。與此同時(shí),事故通過社交媒體引發(fā)了公眾的強(qiáng)烈關(guān)注,大量網(wǎng)絡(luò)用戶在爆炸發(fā)生后的短時(shí)間內(nèi)利用社交網(wǎng)絡(luò)發(fā)表了自己的觀點(diǎn)和見聞。由于現(xiàn)場存放有大量危險(xiǎn)品且具體爆炸物尚無法確定,為避免事態(tài)進(jìn)一步加劇,天津市應(yīng)急決策指揮中心在網(wǎng)絡(luò)上召集了16位應(yīng)急管理領(lǐng)域的專家,并根據(jù)當(dāng)時(shí)的事故狀態(tài)制定了如下3個(gè)應(yīng)急備選方案:
x1:持續(xù)開展環(huán)境應(yīng)急監(jiān)測,繼續(xù)增派消防人員及消防車輛支援現(xiàn)場以加強(qiáng)火情控制。
x2:持續(xù)開展環(huán)境應(yīng)急監(jiān)測,通知消防力量撤離現(xiàn)場,派遣防化團(tuán)攜專業(yè)設(shè)備進(jìn)場搜救。
x3:持續(xù)開展環(huán)境應(yīng)急監(jiān)測,暫緩撲滅或搜救工作,待緊急查明?;穬?nèi)容、數(shù)量及存儲方式后再做進(jìn)一步?jīng)Q策。
專家群體根據(jù)以往對此類突發(fā)事件的應(yīng)對經(jīng)驗(yàn)商討出六方面因素作為方案的評估屬性:方案成本u1、人員傷亡u2、財(cái)產(chǎn)損失u3、公眾恐慌程度u4、對環(huán)境的影響u5、對生活的影響u6。其中,決策者對屬性u1~u4使用粒度為9的語言術(shù)語集S1給出偏好信息,對屬性u5~u6使用粒度為7的語言術(shù)語集S2給出偏好信息。
S1={s0=極低,s1=很低,s2=低,s3=稍低,s4=-般,s5=稍高,s6=高,s7=很高,s8=極高}
S2={s0=非常小,s1=小,s2=較小,s3=中等,s4=較大,s5=大,s6=非常大}
Step1本文選取新浪微博作為UGC數(shù)據(jù)的獲取來源,以“天津爆炸”、“塘沽爆炸”為主題搜索詞,利用新浪微博提供的API接口抓取了時(shí)間段為8月12日23時(shí)30分至8月13日15時(shí)的微博數(shù)據(jù),抓取字段包括用戶名、微博內(nèi)容、發(fā)布時(shí)間、評論內(nèi)容。由于包含非公眾生成內(nèi)容或噪聲數(shù)據(jù),經(jīng)過人工篩選去除政府或主流媒體賬號發(fā)布的消息以及詞語個(gè)數(shù)少于2的消息后保留微博文本共79221條。
收集到新浪微博UGC文本數(shù)據(jù)后,對數(shù)據(jù)進(jìn)行預(yù)處理,包括去除其中的主題標(biāo)簽、@內(nèi)容、URL等無用內(nèi)容后,對文本進(jìn)行分詞、去除停用詞以及詞性標(biāo)注,再進(jìn)行詞頻算法分析。本文使用python編程實(shí)現(xiàn)關(guān)鍵詞的抽取算法,并采用其自帶的jieba分詞軟件包將文本切分成詞語特征項(xiàng)。選取TF-IDF值排名前500的特征項(xiàng)作為候選關(guān)鍵詞,對含義相同或語義接近的詞語進(jìn)行合并,如“死亡”、“遇難”、“遺體”、“去世”合并為關(guān)鍵詞“遇難”,“恐怖”、“可怕”、“害怕”合并為關(guān)鍵詞“可怕”等,并對合并詞語的TF-IDF值進(jìn)行累加。再根據(jù)專家確定的屬性框架,基于語義關(guān)系列出每個(gè)屬性下對應(yīng)的關(guān)鍵詞,從而構(gòu)成天津港“8·12”重大爆炸事故的應(yīng)急決策方案評估屬性體系,如表1所示。
表1 天津港“8·12”重大爆炸事故應(yīng)急決策方案評估屬性體系
Step2利用(6)式由python程序計(jì)算出關(guān)鍵詞的TF-IDF權(quán)重。然后采用專家評分法,組織10位專家對屬性體系中的關(guān)鍵詞按照其表征的嚴(yán)重程度賦予分值,經(jīng)過統(tǒng)計(jì)平均后得到每個(gè)關(guān)鍵詞的語義評判分值。利用(7)式計(jì)算每個(gè)屬性的損害程度值,其中屬性u2的損害程度值計(jì)算示例如表2所示,結(jié)果為21.206。
表2 屬性的損害程度值計(jì)算
在計(jì)算出每個(gè)屬性的損害程度值后,由(8)式得到各屬性的權(quán)重向量為W={0.07,0.25,0.16,0.23,0.20,0.08}。
Step3根據(jù)兩階段決策流程,各決策者按照給定的語言標(biāo)度對決策對象分別給出獨(dú)立意見、參照意見語言偏好信息。其中,除決策者e3、e13、e16外,其余決策者均在第二階段對部分偏好信息做出了調(diào)整。并利用定義2將語言偏好矩陣轉(zhuǎn)化為區(qū)間偏好矩陣,如表3~表6所示。
表3 決策者獨(dú)立意見語言偏好矩陣
表4 決策者參照意見語言偏好矩陣
表5 決策者獨(dú)立意見區(qū)間偏好矩陣
表6 決策者參照意見區(qū)間偏好矩陣
Step4針對同一決策者參照意見與獨(dú)立意見的差異以及與群體意見的差異,分別利用(11)式和(12)式計(jì)算決策者意見的可靠度和準(zhǔn)確度,并利用(13)式對其進(jìn)行規(guī)范化處理,其中決策者e1的計(jì)算結(jié)果如表7和表8所示。再利用(14)式計(jì)算得到?jīng)Q策群體中每位成員的決策風(fēng)險(xiǎn)系數(shù),如表9所示。
表7 決策者e1意見的可靠度
表8 決策者e1意見的準(zhǔn)確度
表9 群體成員決策風(fēng)險(xiǎn)系數(shù)
Step5采用文獻(xiàn)[28]方法對16位決策成員的參照意見偏好矩陣進(jìn)行聚類,取閾值γ=0.85,可以得到4個(gè)聚集及其權(quán)重,聚類結(jié)果如表10所示。
表10 聚類結(jié)果
利用(15)式計(jì)算得到?jīng)Q策成員的初始權(quán)重,并結(jié)合決策風(fēng)險(xiǎn)系數(shù)利用(16)式得到各成員的決策風(fēng)險(xiǎn)權(quán)重,如表11所示。
表11 決策成員初始權(quán)重、決策風(fēng)險(xiǎn)權(quán)重
表12 方案的貼近度和排序
Step6利用(17)式計(jì)算各個(gè)方案的貼近度Cl,并對方案進(jìn)行最終排序,結(jié)果如表12所示。
由計(jì)算結(jié)果可以得出,應(yīng)選擇方案x2對事故進(jìn)行處置,即持續(xù)開展環(huán)境應(yīng)急監(jiān)測,通知消防力量撤離現(xiàn)場,同時(shí)派遣防化團(tuán)進(jìn)場搜救。
為了說明本文方法的有效性和優(yōu)勢,將本文方法與文獻(xiàn)[29]提出的專家權(quán)重方法進(jìn)行對比,并且僅對聚集內(nèi)部決策成員權(quán)重的求解進(jìn)行相應(yīng)的變化,其結(jié)果如表13所示??梢钥闯鰞煞N方法排序結(jié)果一致。
表13 利用文獻(xiàn)[29]決策方法得到的結(jié)果
文獻(xiàn)[29]提出雙重權(quán)重模型,對大群體進(jìn)行了聚類分析,并認(rèn)為聚集內(nèi)部成員的權(quán)重取決于其對聚集一致性的貢獻(xiàn)。而本文對聚集內(nèi)部成員的權(quán)重進(jìn)行的調(diào)整不僅基于對群體一致性的考量,同時(shí)還考慮了決策者對偏好的不確定性引發(fā)的風(fēng)險(xiǎn),通過對決策成員偏好信息的可靠度和準(zhǔn)確度進(jìn)行測度,能夠有效識別專業(yè)性較低的決策者,使成員權(quán)重的確定更為合理。
本文未將屬性權(quán)重確定方法進(jìn)行對比,由于現(xiàn)階段文獻(xiàn)中屬性權(quán)重的確定大多通過專家偏好矩陣計(jì)算或由專家主觀給出,其方法不具有可比性。但就思路而言,本文從社交媒體數(shù)據(jù)中獲取屬性的重要程度其客觀性具有較強(qiáng)的優(yōu)勢。
本文針對重大突發(fā)事件產(chǎn)生的UGC大數(shù)據(jù)和決策者對偏好信息的不確定性及偏離群體一致性引起的主觀決策風(fēng)險(xiǎn),提出了一種基于UGC大數(shù)據(jù)挖掘的大群體兩階段風(fēng)險(xiǎn)性應(yīng)急決策方法。一方面,該方法將社交媒體中的UGC大數(shù)據(jù)引入到應(yīng)急決策方案選擇中,采用TF-IDF方法對關(guān)鍵詞進(jìn)行提取獲得公眾偏好信息,進(jìn)而對事件損害程度進(jìn)行評估確定屬性權(quán)重。另一方面,考慮到?jīng)Q策者在意見開放的決策場景下出現(xiàn)調(diào)整偏好的行為可能會引起決策風(fēng)險(xiǎn)的問題,設(shè)計(jì)了兩階段決策流程收集決策成員的偏好信息,并結(jié)合聚類方法確定決策者權(quán)重。
本文的研究成果主要適用于受到公眾強(qiáng)烈關(guān)注或?qū)<倚枰Y(jié)合公眾信息進(jìn)行輔助判斷的應(yīng)急決策問題,如臺風(fēng)、地震、洪澇災(zāi)害、特大安全生產(chǎn)事故等重大突發(fā)事件的處置。與傳統(tǒng)方法相比,決策屬性權(quán)重的制定考慮了公眾的信息關(guān)注傾向,可以彌補(bǔ)專家在確定權(quán)重時(shí)受主觀性干擾的不足,并增加公眾對決策的滿意度,降低事件可能造成的社會風(fēng)險(xiǎn)。關(guān)鍵詞的提取過程也不涉及對大量語法句法信息進(jìn)行復(fù)雜的語義分析,擁有較高的文本處理速度和效率,能夠滿足應(yīng)急決策的時(shí)效性要求。同時(shí),通過決策者意見的可靠度和準(zhǔn)確度對決策風(fēng)險(xiǎn)進(jìn)行量化,能夠識別出對所給偏好信息不確定程度較大或偏離群體一致性程度較高的成員,使決策結(jié)果更為合理。
當(dāng)然,本文方法也存在一定局限性,例如屬性權(quán)重的確定與UGC的質(zhì)量相關(guān),當(dāng)事件發(fā)生初期社交媒體上相關(guān)的UGC較少或文本存在較多噪聲數(shù)據(jù)時(shí)將對決策結(jié)果造成影響。未來的研究將考慮進(jìn)一步挖掘公眾對于事件的情緒表達(dá)信息,提高分析的質(zhì)量,并嘗試從UGC中自動提取構(gòu)建屬性體系,結(jié)合采用更加全面的時(shí)空模式分析,實(shí)現(xiàn)對突發(fā)事件的動態(tài)決策。