關(guān)鍵詞:社會(huì)訴求數(shù)據(jù);政務(wù)決策;四診合參;數(shù)據(jù)價(jià)值挖掘
DOI:10.3969/j.issn.1008-0821.2024.11.008
〔中圖分類(lèi)號(hào)〕D63-39 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2024)11-0080-10
隨著技術(shù)發(fā)展與數(shù)字政府建設(shè)的推進(jìn),政府的應(yīng)急決策模式逐步從“經(jīng)驗(yàn)判斷”轉(zhuǎn)向“數(shù)據(jù)驅(qū)動(dòng)”,各級(jí)各類(lèi)的政務(wù)數(shù)據(jù)成為賦能決策的重要資源。作為典型的政務(wù)數(shù)據(jù),社會(huì)訴求數(shù)據(jù)中蘊(yùn)含著公眾的意愿、觀點(diǎn)和主張,為政府決策提供了可信、可用、可得的豐富數(shù)據(jù)來(lái)源。
相較于通過(guò)問(wèn)卷、訪談等調(diào)研形式得到的民意數(shù)據(jù),政民互動(dòng)平臺(tái)的訴求數(shù)據(jù)由公眾自發(fā)生成,具有體量大、實(shí)效性強(qiáng)、真實(shí)客觀等典型特征,并且作為社情民意和熱點(diǎn)事件的載體,是社會(huì)風(fēng)險(xiǎn)的強(qiáng)感知器,政府可以通過(guò)數(shù)智技術(shù)挖掘其中蘊(yùn)含的熱點(diǎn)、難點(diǎn)、堵點(diǎn)問(wèn)題,識(shí)別潛在社會(huì)風(fēng)險(xiǎn)并賦能于預(yù)警及防范。當(dāng)前已有部分政府和第三方機(jī)構(gòu)積極開(kāi)發(fā)社會(huì)訴求數(shù)據(jù)挖掘平臺(tái),如“城感通”城市治理與風(fēng)險(xiǎn)防范系統(tǒng)、12345社情民意分析平臺(tái)等[1],但這些平臺(tái)側(cè)重于對(duì)數(shù)據(jù)單方面特征的統(tǒng)計(jì)分析與簡(jiǎn)單呈現(xiàn),數(shù)據(jù)挖掘的全面性有待提升,且對(duì)受眾認(rèn)知規(guī)律的考慮不足,導(dǎo)致數(shù)據(jù)挖掘與決策應(yīng)用之間存在斷層。因此,如何遵循數(shù)據(jù)特征并結(jié)合受眾認(rèn)知邏輯,以系統(tǒng)化的形式全面多維揭示數(shù)據(jù)內(nèi)涵并有效賦能于決策成為亟待突破的重點(diǎn)。
鑒于此,本文借鑒中醫(yī)學(xué)領(lǐng)域的“四診合參”理論,從“望、聞、問(wèn)、切”4個(gè)階段構(gòu)建社會(huì)訴求數(shù)據(jù)分析框架,在理論上為系統(tǒng)化挖掘社會(huì)訴求數(shù)據(jù)提供新的研究思路和理論模型,實(shí)踐上為社會(huì)訴求數(shù)據(jù)賦能政府決策提供一套全景化方案與方法支撐,從而輔助發(fā)揮社會(huì)訴求數(shù)據(jù)對(duì)社會(huì)治理與決策服務(wù)的獨(dú)特價(jià)值。
1相關(guān)研究與問(wèn)題的提出
1.1社會(huì)訴求數(shù)據(jù)
社會(huì)訴求數(shù)據(jù)是近年來(lái)伴隨著政務(wù)熱線發(fā)展而興起的社會(huì)感知類(lèi)數(shù)據(jù),指公眾通過(guò)特定渠道,面向政府表達(dá)意愿、觀點(diǎn)和要求時(shí)產(chǎn)生的大規(guī)模數(shù)據(jù)[2]。社會(huì)訴求數(shù)據(jù)的傳統(tǒng)渠道為政務(wù)熱線,如12345服務(wù)熱線數(shù)據(jù),在互聯(lián)網(wǎng)的發(fā)展下訴求渠道愈發(fā)多元,逐漸向門(mén)戶網(wǎng)站、社交新媒體等網(wǎng)絡(luò)平臺(tái)傾斜。
目前圍繞社會(huì)訴求數(shù)據(jù)展開(kāi)的研究主要包括3個(gè)方面:①社會(huì)訴求數(shù)據(jù)價(jià)值探究。如鄭躍平等[3]認(rèn)為,政務(wù)熱線服務(wù)體系已逐步發(fā)展為城市數(shù)據(jù)共享樞紐;KumarH等[4]、孟天廣等[5]認(rèn)為,社會(huì)訴求數(shù)據(jù)能夠推動(dòng)城市治理的智慧化轉(zhuǎn)型升級(jí)。②社會(huì)訴求數(shù)據(jù)挖掘分析。如雷玉瓊等[6]、孫宗鋒等[7]、胡廣偉等[8]使用文本分類(lèi)、情感分析、統(tǒng)計(jì)分析等方法挖掘公眾訴求;李桂華等[2]探究基于社會(huì)訴求數(shù)據(jù)的情報(bào)體系構(gòu)建路徑,并提出由數(shù)據(jù)層、方法層、業(yè)務(wù)層構(gòu)成的分析框架,剖析社會(huì)訴求數(shù)據(jù)在“情景—應(yīng)對(duì)”決策中的應(yīng)用過(guò)程[9];張莉曼等[10-11]通過(guò)構(gòu)建公眾訴求故事化描述框架,實(shí)現(xiàn)公眾訴求信息的有效傳遞。③基于社會(huì)訴求數(shù)據(jù)的決策。XuL等[12]采用局部自適應(yīng)方法建模,預(yù)測(cè)311熱線數(shù)據(jù)在時(shí)空維度的典型需求;ChatfieldAT等[13]構(gòu)建了311熱線數(shù)據(jù)與公共價(jià)值的協(xié)同耦合機(jī)制,旨在賦能智慧治理與服務(wù)決策。
盡管目前關(guān)于社會(huì)訴求數(shù)據(jù)的研究已較為豐富,但仍有以下問(wèn)題值得深入探索:一是數(shù)據(jù)挖掘的深度不足,通常只是對(duì)1個(gè)或幾個(gè)維度進(jìn)行分析,缺乏全景化數(shù)據(jù)挖掘體系。二是多將社會(huì)訴求數(shù)據(jù)視為一般性短文本,較少?gòu)纳鐣?huì)訴求數(shù)據(jù)特征與價(jià)值出發(fā)探究數(shù)據(jù)處理框架。三是社會(huì)訴求數(shù)據(jù)對(duì)決策的賦能體系尚不清晰,缺乏相應(yīng)的理論支撐??傮w來(lái)說(shuō),在特定理論指導(dǎo)下對(duì)社會(huì)訴求數(shù)據(jù)賦能決策的鏈路進(jìn)行深層次、系統(tǒng)性分析的研究還十分匱乏。
1.2四診合參理論
四診合參是中醫(yī)診斷學(xué)的重要思想,指通過(guò)望、聞、問(wèn)、切4種方法從不同角度收集病情資料后,對(duì)信息進(jìn)行綜合分析從而對(duì)病癥做出科學(xué)判斷[14]。四診從4個(gè)不同的方面對(duì)“病癥”數(shù)據(jù)進(jìn)行收集、加工與提煉,這種逐層遞進(jìn)的信息處理方式契合DIKW模型中“數(shù)據(jù)—信息—知識(shí)—智慧”的轉(zhuǎn)化鏈路[15],為數(shù)據(jù)處理與決策應(yīng)用提供了整體性的視角與思路。
四診合參最初多用于規(guī)范醫(yī)生對(duì)病患的全方位診斷流程,但隨著相關(guān)研究的不斷深入,部分學(xué)者也將其用于社會(huì)治理、風(fēng)險(xiǎn)評(píng)估等問(wèn)題的研究,在“四診”的基礎(chǔ)上做出綜合性的決策判斷,如于峰等[16]借鑒“望聞問(wèn)切”流程提出綜合風(fēng)險(xiǎn)評(píng)估框架,用來(lái)推斷級(jí)聯(lián)風(fēng)險(xiǎn)的演化態(tài)勢(shì)。由于四診合參不僅強(qiáng)調(diào)診斷已有疾病,還強(qiáng)調(diào)預(yù)防未有之病,因此,胡峰[17]基于“病灶點(diǎn)”錨定的邏輯,解構(gòu)了信息疫情治理在治未病四階段存在的困境,并提出信息疫情治理的紓困方略。任騰飛[18]基于“望聞問(wèn)切”理論,以寧波市檔案局為例梳理了服務(wù)農(nóng)村基層社會(huì)治理的參考路徑。李佳[19]提出,借鑒“望聞問(wèn)切”的中醫(yī)思維對(duì)審計(jì)信息進(jìn)行全方位的審理,以提高審計(jì)質(zhì)量和審理工作效率。
四診合參理論強(qiáng)調(diào)對(duì)“病癥”信息進(jìn)行全面收集與追根究底的分析,從而達(dá)到追本溯源、防患未然的目的,這與數(shù)據(jù)挖掘和社會(huì)治理的目的不謀而合。因此,該理論可以為數(shù)據(jù)驅(qū)動(dòng)的社會(huì)治理提供一個(gè)理論框架,為數(shù)據(jù)挖掘價(jià)值發(fā)揮與決策賦能提供系統(tǒng)性的指導(dǎo)鏈路。然而,目前將該理論應(yīng)用于數(shù)據(jù)價(jià)值挖掘的研究尚處于起步階段,且缺乏在政務(wù)數(shù)據(jù)分析方面的實(shí)踐探索。
綜上所述,社會(huì)訴求數(shù)據(jù)具有豐富的社會(huì)治理價(jià)值,對(duì)政府的數(shù)字化轉(zhuǎn)型和治理能力提升有重要意義,而四診合參理論可以為社會(huì)訴求數(shù)據(jù)的價(jià)值挖掘與決策賦能提供整體性的指導(dǎo)框架,為社會(huì)訴求數(shù)據(jù)的分析、呈現(xiàn)和決策應(yīng)用提供有章可循的研究范式。
2社會(huì)訴求數(shù)據(jù)賦能決策的理論分析框架
2.1四診合參對(duì)社會(huì)訴求數(shù)據(jù)價(jià)值挖掘的效用分析
社會(huì)訴求數(shù)據(jù)的挖掘過(guò)程也是從海量數(shù)據(jù)資源中提取核心信息并賦能于政務(wù)決策的過(guò)程,一般包括數(shù)據(jù)的獲取、處理、分析與應(yīng)用四大流程[10]。而四診合參理論強(qiáng)調(diào)從整體視角審查診斷的對(duì)象,以分層遞進(jìn)的形式對(duì)診斷對(duì)象的特征與問(wèn)題進(jìn)行全景化掃描,將其應(yīng)用到社會(huì)訴求數(shù)據(jù)挖掘方面能夠有效規(guī)范數(shù)據(jù)處理流程,實(shí)現(xiàn)訴求數(shù)據(jù)的價(jià)值增值,具體來(lái)說(shuō)有如下優(yōu)勢(shì):
1)有助于全景認(rèn)知訴求內(nèi)涵?!夺t(yī)門(mén)法律》中提出“望聞問(wèn)切,醫(yī)之不可缺一”,即在臨床運(yùn)用中需將四診有機(jī)結(jié)合,從而全面掌握病灶點(diǎn),做出正確判斷。在社會(huì)訴求數(shù)據(jù)價(jià)值挖掘時(shí)也需將各個(gè)維度處理的結(jié)果全面整合,綜合審查民生訴求點(diǎn),系統(tǒng)感知訴求表達(dá)。
2)有助于深入洞察核心問(wèn)題。四診合參的分析過(guò)程具有層次性,為臨床診斷提供縱向邏輯依據(jù)。因此,基于望聞問(wèn)切的價(jià)值挖掘,是從數(shù)據(jù)到信息到知識(shí),再到?jīng)Q策的層層深入的過(guò)程,便于政務(wù)工作者厘清問(wèn)題脈絡(luò),深度把握民意民聲。
3)有助于提升政務(wù)決策效率。四診合參中“望”“聞”“問(wèn)”“切”4個(gè)流程符合由簡(jiǎn)單到復(fù)雜、由一般到具體的個(gè)體認(rèn)知規(guī)律,因此,將其應(yīng)用在社會(huì)訴求數(shù)據(jù)分析方面可以有效減輕政務(wù)工作者的數(shù)據(jù)認(rèn)知負(fù)荷,彌合數(shù)據(jù)處理與應(yīng)用之間的鴻溝。
綜上,將四診合參理論運(yùn)用在社會(huì)訴求數(shù)據(jù)價(jià)值挖掘上有助于全景洞察數(shù)據(jù)內(nèi)涵,激活政務(wù)數(shù)據(jù)價(jià)值,為政務(wù)數(shù)據(jù)挖掘過(guò)程中的處理與集成、分析與解釋以及數(shù)據(jù)賦能決策提供系統(tǒng)性思路和研究框架。
2.2社會(huì)訴求數(shù)據(jù)賦能決策的四診合參理論分析框架設(shè)計(jì)
根據(jù)四診合參思想可知,社會(huì)訴求數(shù)據(jù)分析應(yīng)包含“四診”與“合參”共5個(gè)環(huán)節(jié)。其中,“望”注重整體化全息信息的集成,“聞”“問(wèn)”“切”則側(cè)重事實(shí)性信息的揭示、判斷性信息的聚合以及預(yù)測(cè)型信息的匯總,最后“合參”整合四診結(jié)果并提出決策建議。從四診合參理論中“望”“聞”“問(wèn)”“切”的中醫(yī)釋義出發(fā),結(jié)合社會(huì)訴求數(shù)據(jù)特征與政務(wù)決策目標(biāo),提出基于四診合參的社會(huì)訴求數(shù)據(jù)分析理論框架,如表1所示,為社會(huì)訴求數(shù)據(jù)賦能政務(wù)決策提供系統(tǒng)性理論依據(jù)。
2.2.1望表而知里——態(tài)勢(shì)感知
望診通過(guò)綜合觀察病人的神、色、形、態(tài)、舌苔等外部特征來(lái)初步測(cè)知內(nèi)部病變。這一環(huán)節(jié)強(qiáng)調(diào)的是信息的全息感知,因此,本階段引入12345熱線、網(wǎng)絡(luò)平臺(tái)與線下信訪數(shù)據(jù),基于多源社會(huì)訴求數(shù)據(jù)整體勾勒城市治理畫(huà)像,使政務(wù)工作者綜合感知城市運(yùn)轉(zhuǎn)過(guò)程中的典型問(wèn)題與治理態(tài)勢(shì),形成初步認(rèn)知預(yù)判。該環(huán)節(jié)以問(wèn)題為導(dǎo)向,運(yùn)用統(tǒng)計(jì)分析、顯著分析、對(duì)比分析等提取特定時(shí)間、空間范圍下的突出問(wèn)題,進(jìn)行圖表組織后以“治理一張題”的形式全景化呈現(xiàn)治理態(tài)勢(shì),使政務(wù)工作者了解公眾訴求的表面癥候,為后續(xù)的深入處理做鋪墊。
2.2.2聞聲而知意——民聲聚合
聞診是綜合聽(tīng)覺(jué)與嗅覺(jué)以了解病情的診察方法,本階段醫(yī)生進(jìn)一步明確患者的病灶點(diǎn),社會(huì)訴求數(shù)據(jù)中民生訴求主題可視為社會(huì)病灶點(diǎn)的集成反映,因此,本環(huán)節(jié)對(duì)訴求主題進(jìn)行挖掘,包含焦點(diǎn)分析與主題分析兩方面。焦點(diǎn)分析即識(shí)別被廣泛提到的訴求焦點(diǎn),明確當(dāng)前公眾關(guān)注的關(guān)鍵問(wèn)題,主題分類(lèi)即將描述相同或相似的訴求歸納為同一類(lèi)簇,探究各類(lèi)訴求所涉及的具體問(wèn)題。以上兩方面輔助政務(wù)工作者進(jìn)一步認(rèn)知訴求問(wèn)題靶點(diǎn)、了解民聲所向,對(duì)公眾訴求涉及的社會(huì)痛點(diǎn)問(wèn)題進(jìn)行診斷,明確城市治理方向,為后續(xù)的處理和決策奠定基礎(chǔ)。
2.2.3問(wèn)疾而曉情——民情識(shí)別
問(wèn)診階段詢問(wèn)病人的主觀體會(huì),獲取病人自述性的病態(tài)感受。醫(yī)生通過(guò)詢問(wèn)病人的痛苦程度和關(guān)聯(lián)疾病史來(lái)判斷病情的輕重緩急與深層信息。本階段主要探究民意的主觀體驗(yàn),即從文本角度進(jìn)行情感探測(cè)與關(guān)聯(lián)發(fā)現(xiàn)。情感探測(cè)通過(guò)評(píng)估文本中的情感傾向,篩選出緊急度高、亟待解決的訴求,輔助政務(wù)工作者把握決策重點(diǎn);關(guān)聯(lián)發(fā)現(xiàn)從語(yǔ)義角度對(duì)問(wèn)題進(jìn)行拓展和延伸,輔助政務(wù)工作者發(fā)現(xiàn)其他潛在問(wèn)題,形成民情主張的全息投影。
2.2.4切癥而明?!駪n研判
切診是用手觸按患者的動(dòng)脈脈搏及其他部位,測(cè)知脈象變化及有關(guān)異常征象的診法。切診通過(guò)脈象等推測(cè)病情,因此,該階段主要進(jìn)行預(yù)測(cè)分析,即針對(duì)當(dāng)前問(wèn)題預(yù)測(cè)后續(xù)的可能性風(fēng)險(xiǎn),包括對(duì)現(xiàn)實(shí)性風(fēng)險(xiǎn)的情報(bào)預(yù)警和對(duì)可能性風(fēng)險(xiǎn)的前瞻預(yù)測(cè)。情報(bào)預(yù)警監(jiān)控風(fēng)險(xiǎn)因素的變動(dòng)趨勢(shì)、評(píng)估各類(lèi)風(fēng)險(xiǎn)等級(jí)并發(fā)出預(yù)警信號(hào),前瞻預(yù)測(cè)分析事件未來(lái)一段時(shí)間的影響范圍、輿情走勢(shì)。本階段在前續(xù)分析結(jié)果的基礎(chǔ)上預(yù)測(cè)后續(xù)可能發(fā)生的問(wèn)題,以實(shí)現(xiàn)“未病先防”“未訴先辦”,可以幫助政務(wù)工作者提前進(jìn)行資源調(diào)配和方案規(guī)劃,提升社會(huì)訴求數(shù)據(jù)的決策賦能價(jià)值。
2.2.5合參而施策——決策治理
“合參”綜合利用四診結(jié)果診斷病癥,給出病癥判斷和處方依據(jù),因此,本階段主要為決策提供參考,包括智能診斷和決策參考。智能診斷總結(jié)望聞問(wèn)切結(jié)果,通過(guò)要點(diǎn)總結(jié)和雷達(dá)圖等形式,簡(jiǎn)潔、清晰地開(kāi)出“四診”后的“病例單”,使政務(wù)工作者高效獲取當(dāng)前城市運(yùn)行中存在的問(wèn)題。決策參考包括智庫(kù)推理和決策建議。智庫(kù)推理綜合案例庫(kù)和知識(shí)庫(kù),案例庫(kù)根據(jù)問(wèn)題關(guān)鍵詞匹配出以往處理方案,知識(shí)庫(kù)根據(jù)專(zhuān)家經(jīng)驗(yàn)給出決策建議。智庫(kù)動(dòng)態(tài)可更新,最終決策方案和新的專(zhuān)家建議將實(shí)時(shí)記錄,實(shí)現(xiàn)數(shù)據(jù)的更迭。此外,系統(tǒng)根據(jù)智能診斷結(jié)果和智庫(kù)數(shù)據(jù)進(jìn)行推理,自動(dòng)給出決策建議,提供“對(duì)癥下藥”的診治建議。本階段整合了問(wèn)題現(xiàn)狀和相關(guān)經(jīng)驗(yàn),為政務(wù)工作者提供了全面、具體的社會(huì)問(wèn)題診斷結(jié)果,動(dòng)態(tài)更新的智慧錦囊,以及可參考、可復(fù)用、可更新的診治建議,為數(shù)據(jù)驅(qū)動(dòng)決策提供切實(shí)可行的指導(dǎo)方案。
3社會(huì)訴求數(shù)據(jù)賦能決策的技術(shù)框架
“四診合參”結(jié)構(gòu)為社會(huì)訴求數(shù)據(jù)的挖掘過(guò)程提供了整體性、遞進(jìn)式的處理模板,如圖1所示。
從橫向來(lái)看,望、聞、問(wèn)、切規(guī)范了每一環(huán)節(jié)挖掘的重點(diǎn),關(guān)聯(lián)社會(huì)訴求數(shù)據(jù)蘊(yùn)含的不同維度信息,形成全景化特征集合,并且挖掘的內(nèi)容從事實(shí)性信息到判斷性信息再到預(yù)測(cè)性信息,符合人們對(duì)信息認(rèn)知逐步深入的過(guò)程。從縱向來(lái)看,四診合參串聯(lián)起“表象—癥候—診斷—取藥”的遞進(jìn)過(guò)程,使數(shù)據(jù)洞察層次逐步深入,形成從發(fā)現(xiàn)訴求問(wèn)題到提出解決方案的完整處理框架,能夠有效彌合數(shù)據(jù)處理與應(yīng)用之間的斷層。結(jié)合“數(shù)據(jù)—信息—知識(shí)—智慧”的數(shù)據(jù)處理過(guò)程,提出基于四診合參理論的社會(huì)訴求數(shù)據(jù)價(jià)值挖掘技術(shù)框架,如圖2所示。
3.1基于態(tài)勢(shì)感知的望診
態(tài)勢(shì)感知旨在從數(shù)據(jù)角度對(duì)整個(gè)社會(huì)治理系統(tǒng)的運(yùn)轉(zhuǎn)態(tài)勢(shì)進(jìn)行綜合感知,強(qiáng)調(diào)從多源數(shù)據(jù)中凝聚數(shù)據(jù)核心特征并進(jìn)行集成呈現(xiàn),使政務(wù)工作者產(chǎn)生宏觀印象,整體感知社會(huì)運(yùn)轉(zhuǎn)過(guò)程中的態(tài)勢(shì)和典型問(wèn)題。具體來(lái)說(shuō),首先從多渠道一體化采集社會(huì)訴求數(shù)據(jù),形成原始數(shù)據(jù)庫(kù),其次定義字段提取規(guī)則,通過(guò)規(guī)則匹配等從原始數(shù)據(jù)集中獲取所需的文本型、標(biāo)簽型、數(shù)值型、時(shí)間型數(shù)據(jù),并將提取出的元素存入特征信息庫(kù),為后續(xù)分析提供原始素材。在此基礎(chǔ)上進(jìn)行數(shù)據(jù)特征分析與可視化,形成治理一張圖,主要包括:
1)統(tǒng)計(jì)比較。統(tǒng)計(jì)訴求總量與類(lèi)別、回復(fù)率、滿意率、處理部門(mén)等基礎(chǔ)信息,在此基礎(chǔ)上進(jìn)行比例、比率、程度等方面的比較分析,反映數(shù)據(jù)在時(shí)間、空間及各事物之間聯(lián)系的差別,繪制成直觀可視的圖表,高效揭示關(guān)鍵數(shù)據(jù)內(nèi)涵。
2)顯著判斷?;诮y(tǒng)計(jì)比較的結(jié)果,抽取出具有高頻、高權(quán)、高關(guān)注的事件、部門(mén)與主題,將顯著結(jié)果匯集整合,形成以顯著問(wèn)題、高頻事件等為導(dǎo)向的視覺(jué)圖像,高效揭示多源社會(huì)訴求數(shù)據(jù)展示的核心問(wèn)題。
3.2基于民聲聚合的聞診
本環(huán)節(jié)旨在挖掘社會(huì)訴求主題,輔助政務(wù)工作者洞察社會(huì)訴求焦點(diǎn)。一方面,通過(guò)計(jì)算詞頻共現(xiàn)揭示訴求焦點(diǎn),利用Tableau等工具進(jìn)行可視化;另一方面,采用BERT進(jìn)行主題建模,劃分訴求主題并繪制主題關(guān)聯(lián)圖譜,具體來(lái)說(shuō):
1)焦點(diǎn)呈現(xiàn)。運(yùn)用TF-IDF權(quán)值法抽取原始文本中公眾廣泛提及的關(guān)鍵詞,繪制詞云圖以直觀展示訴求問(wèn)題的分布情況。通過(guò)詞云圖,可以快速了解公眾關(guān)注的焦點(diǎn)和熱點(diǎn)問(wèn)題,為進(jìn)一步分析和處理提供參考。
2)主題圖譜。BERT模型[21]能夠在大規(guī)模的文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,在具體任務(wù)上進(jìn)行微調(diào),適用于海量社會(huì)訴求數(shù)據(jù)的主題分類(lèi)任務(wù)。以《政府公共服務(wù)平臺(tái)訴求分類(lèi)與代碼》[22]文件為依據(jù),選取部分原始數(shù)據(jù)進(jìn)行人工標(biāo)注,并劃分訓(xùn)練集和測(cè)試集用于BERT模型訓(xùn)練,完成訓(xùn)練后進(jìn)行剩余數(shù)據(jù)的主題識(shí)別,最后結(jié)合主題建模以可擴(kuò)展的圖譜形式呈現(xiàn)主題類(lèi)簇。
3.3基于民情識(shí)別的問(wèn)診
本環(huán)節(jié)旨在通過(guò)識(shí)別訴求的情感傾向和強(qiáng)弱程度來(lái)判斷事件的輕重緩急,通過(guò)主題詞的語(yǔ)義關(guān)聯(lián)對(duì)關(guān)鍵詞進(jìn)行解讀與延伸,輔助發(fā)現(xiàn)更多問(wèn)題。首先使用否定詞表、程度副詞表和情感詞表構(gòu)建情感詞典及匹配規(guī)則[23],利用情感詞典及匹配規(guī)則進(jìn)行文本匹配和加權(quán)統(tǒng)計(jì),計(jì)算出情感值。在此基礎(chǔ)上進(jìn)行訴求情感探測(cè)與關(guān)聯(lián)分析,具體來(lái)說(shuō):
1)訴求情感探測(cè)。根據(jù)訴求情感傾向值繪制情感傾向分布圖,根據(jù)訴求絕對(duì)值大小劃分情感強(qiáng)烈程度,結(jié)合主題占比進(jìn)行可視化展示,從而更全面地了解公眾對(duì)特定問(wèn)題的情感傾向和強(qiáng)度,更好地了解公眾訴求強(qiáng)度。
2)語(yǔ)義關(guān)聯(lián)發(fā)現(xiàn)。使用Apriori算法[24]進(jìn)行關(guān)聯(lián)分析,找出頻繁項(xiàng)集并用Association_rules方法計(jì)算關(guān)聯(lián)規(guī)則,挖掘出與當(dāng)前焦點(diǎn)問(wèn)題關(guān)聯(lián)程度較大的相關(guān)主題,從而定位出可能發(fā)生的其他問(wèn)題,以便于預(yù)先對(duì)關(guān)聯(lián)問(wèn)題進(jìn)行干預(yù)和防范。
3.4基于民憂研判的切診
民憂研判是“未訴先辦”的前提,旨在追蹤訴求發(fā)展趨勢(shì),輔助政務(wù)工作者事先對(duì)可能發(fā)生的情況進(jìn)行部署和干預(yù)。本環(huán)節(jié)主要由事件預(yù)警和風(fēng)險(xiǎn)預(yù)測(cè)兩部分構(gòu)成:
1)事件預(yù)警。一般來(lái)說(shuō),負(fù)向情感越顯著越容易產(chǎn)生聚集性的風(fēng)險(xiǎn)問(wèn)題,因此,預(yù)測(cè)情感值可以提前感知并預(yù)防風(fēng)險(xiǎn)。對(duì)整體訴求和不同主題的訴求進(jìn)行情感值監(jiān)控,按照負(fù)向情感值權(quán)重排序,識(shí)別出高—中高—中低—低的分層預(yù)警模型。
2)風(fēng)險(xiǎn)預(yù)測(cè),在風(fēng)險(xiǎn)值探測(cè)基礎(chǔ)上,使用LGBM[25]方法結(jié)合時(shí)間序列進(jìn)行預(yù)測(cè),得到情感真實(shí)值、擬合值和預(yù)測(cè)值時(shí)間序列折線圖,直觀展示情感值變動(dòng),預(yù)知后續(xù)可能發(fā)生的風(fēng)險(xiǎn)。
3.5基于知識(shí)組織的合參
知識(shí)組織是指對(duì)知識(shí)客體進(jìn)行整理、加工、揭示、控制等一系列組織化的過(guò)程[24,26]?!昂蠀ⅰ睆?qiáng)調(diào)將四診結(jié)果凝練展示,同時(shí)組織、匹配出既往經(jīng)驗(yàn)與專(zhuān)家智慧。包含以下兩方面:
1)智能診斷。對(duì)四診結(jié)果進(jìn)行歸納,為政務(wù)工作者呈現(xiàn)決策要點(diǎn)??偨Y(jié)訴求條數(shù)、類(lèi)型、高頻詞、主題等形成事實(shí)性信息,挖掘訴求不同主題及不同主題情感值形成判斷性信息,追蹤訴求情感趨勢(shì)和焦點(diǎn)問(wèn)題趨勢(shì)形成推測(cè)性信息,以上3個(gè)層面為決策提供了由表及里、層層遞進(jìn)的參考依據(jù)。
2)決策參考。從蘇州市人民政府官網(wǎng)爬取專(zhuān)家問(wèn)答、過(guò)往訴求的相關(guān)數(shù)據(jù),設(shè)置可查詢的專(zhuān)家智慧庫(kù)和典型問(wèn)答庫(kù),為政務(wù)工作者提供處理意見(jiàn)和答復(fù)參考,提高民生訴求的處理與決策效率。同時(shí),結(jié)合歷史經(jīng)驗(yàn)數(shù)據(jù)庫(kù)進(jìn)行推理給出核心訴求要點(diǎn),提供決策建議的簡(jiǎn)潔報(bào)告,輔助政府工作者明確下一階段的工作重心。
4實(shí)驗(yàn)過(guò)程與原型系統(tǒng)搭建
4.1數(shù)據(jù)獲取與預(yù)處理
采集蘇州市人民政府官網(wǎng)政民互動(dòng)模塊2022年1月1日—2023年7月1日的訴求數(shù)據(jù)為樣本,包含信件類(lèi)型、來(lái)信時(shí)間、來(lái)信主題、來(lái)信內(nèi)容、受理單位、回復(fù)狀態(tài)、回復(fù)內(nèi)容、回復(fù)時(shí)間、回復(fù)人、公眾評(píng)價(jià)共10個(gè)字段,預(yù)處理后剩余7421條數(shù)據(jù)。按照上文提出的技術(shù)框架,對(duì)社會(huì)訴求數(shù)據(jù)運(yùn)用“四診合參”進(jìn)行“診斷”。
4.2原型系統(tǒng)呈現(xiàn)
原型系統(tǒng)圖能夠直觀展示系統(tǒng)界面的概念原貌與操作端口,為研究設(shè)計(jì)提供可視化指導(dǎo)方案。按照上文提出的思路方法進(jìn)行數(shù)據(jù)處理,并將處理結(jié)果嵌入原型界面。界面組織過(guò)程中遵循尼爾森十大可用性原則[27],通過(guò)設(shè)置布局使圖表符合格式塔原理[28]。
4.2.1態(tài)勢(shì)感知
本環(huán)節(jié)對(duì)應(yīng)四診合參中的“望診”,旨在展示社會(huì)運(yùn)轉(zhuǎn)系統(tǒng)的整體態(tài)勢(shì),輔助政務(wù)工作者產(chǎn)生宏觀認(rèn)知,如圖3所示。整個(gè)頁(yè)面以問(wèn)題為導(dǎo)向,按照“中間—兩端”的設(shè)計(jì)邏輯,頁(yè)面中心位置提供總體概覽、自然災(zāi)害、社會(huì)民生、經(jīng)濟(jì)狀況、治安情況5個(gè)端口,以蘇州市城市地圖的形式呈現(xiàn)各區(qū)域典型問(wèn)題,以“社會(huì)民生”為例,揭示事件要點(diǎn)、地域、關(guān)注度與民眾反應(yīng),按照訴求處理數(shù)量對(duì)責(zé)任部門(mén)排序;頁(yè)面左側(cè)展示訴求數(shù)據(jù)的來(lái)源渠道,可以看出當(dāng)前時(shí)段累計(jì)收到7421條數(shù)據(jù),涉及58?jìng)€(gè)責(zé)任部門(mén),平均回復(fù)時(shí)間為4天,并提示政務(wù)工作者重點(diǎn)對(duì)待投訴類(lèi)訴求;頁(yè)面右側(cè)集中提示政務(wù)工作者高頻集中在證件辦理、辦公時(shí)間咨詢等方面,群眾廣泛關(guān)注公積金辦理、交通出行等問(wèn)題,動(dòng)態(tài)展示最新訴求信息,使政務(wù)工作者能夠系統(tǒng)感知城市運(yùn)轉(zhuǎn)的整體狀態(tài)以及出現(xiàn)的痛點(diǎn)、堵點(diǎn)問(wèn)題。
4.2.2訴求診斷
本環(huán)節(jié)包含民聲聚合、民情識(shí)別、民憂研判3個(gè)環(huán)節(jié),分別對(duì)應(yīng)四診合參中的“聞診”“問(wèn)診”和“切診”,3個(gè)步驟層層遞進(jìn),共同作用于訴求數(shù)據(jù)中關(guān)鍵問(wèn)題的深度追蹤。如圖4所示,圖中3模塊由左及右推進(jìn),從民聲聚合中可以看出小區(qū)、物業(yè)、交付、垃圾等問(wèn)題是公眾訴求焦點(diǎn),從主題圖譜中發(fā)現(xiàn)訴求涉及民政社區(qū)、住房保障等8類(lèi)問(wèn)題,每個(gè)主題下展示若干關(guān)鍵詞,如民生服務(wù)主題中的關(guān)鍵詞有小區(qū)、單位、辦理等。從民情識(shí)別中可以看出民生服務(wù)類(lèi)訴求整體情感偏正面,且負(fù)面情感強(qiáng)度分布呈正金字塔結(jié)構(gòu),即情感值越高訴求數(shù)量越少,說(shuō)明雖然訴求的負(fù)面情感顯著,但民眾情緒尚為穩(wěn)定;通過(guò)對(duì)咨詢、監(jiān)督等詞的語(yǔ)義關(guān)聯(lián)分析,提示政府未來(lái)重點(diǎn)關(guān)注政府管理、統(tǒng)計(jì)數(shù)據(jù)等方面的問(wèn)題與服務(wù)。從民憂研判中可以看出,預(yù)警問(wèn)題主要存在于民政社區(qū)與住房保障,提醒政務(wù)工作者優(yōu)先關(guān)注。前瞻預(yù)測(cè)旨在對(duì)一定時(shí)期內(nèi)的總體風(fēng)險(xiǎn)態(tài)勢(shì)進(jìn)行監(jiān)控與預(yù)測(cè),該階段訴求情感值在10附近波動(dòng),呈正面,預(yù)計(jì)后續(xù)3天情感值穩(wěn)定在11左右,整體訴求情感狀況良好。
4.2.3決策治理
本環(huán)節(jié)對(duì)應(yīng)四診合參中的“合參”,旨在總結(jié)四診結(jié)果并提供決策參考,界面包含智能診斷、智庫(kù)推理和決策建議三大模塊,如圖5所示。智能診斷模塊為政務(wù)工作者提煉訴求、洞察結(jié)論,如以文本摘要的形式提煉數(shù)據(jù)總量、類(lèi)型、關(guān)鍵詞以及主題分布概況,并歸納總體風(fēng)險(xiǎn)情況、動(dòng)態(tài)趨勢(shì)以及下一階段的可能性問(wèn)題。智庫(kù)推理模塊引入智庫(kù)數(shù)據(jù)動(dòng)態(tài)展示專(zhuān)家建議,其智能問(wèn)答功能支持政務(wù)工作者自主進(jìn)行問(wèn)題查詢與深度分析,實(shí)現(xiàn)數(shù)據(jù)的靈活洞察與交互探索。決策建議模塊整合前序環(huán)節(jié)洞察出來(lái)的核心結(jié)論,結(jié)合智庫(kù)數(shù)據(jù)庫(kù)進(jìn)行推理,自動(dòng)給出優(yōu)化點(diǎn)、維持點(diǎn)及風(fēng)險(xiǎn)點(diǎn),關(guān)聯(lián)各責(zé)任部門(mén)并提出針對(duì)性應(yīng)對(duì)策略,明確當(dāng)前階段的責(zé)任主體并厘清任務(wù)的輕重緩急,實(shí)現(xiàn)各部門(mén)的協(xié)同應(yīng)對(duì)與整體治理。
上文原型系統(tǒng)界面從不同角度展示出社會(huì)訴求數(shù)據(jù)中蘊(yùn)含的關(guān)鍵信息。其中,“望診”階段主要展示全局性社會(huì)運(yùn)轉(zhuǎn)系統(tǒng),使政務(wù)工作者對(duì)整體態(tài)勢(shì)實(shí)現(xiàn)初步感知,“聞診”“問(wèn)診”“切診”對(duì)訴求內(nèi)容的主題、情感與趨勢(shì)進(jìn)行深入判斷與前瞻預(yù)測(cè)。四診完成后,“合參”階段進(jìn)行歸納總結(jié)并提供相關(guān)決策參考。界面排版采用圖文結(jié)合的形式,便于政務(wù)工作者捕捉訴求重點(diǎn),并且界面以概覽—探究—應(yīng)用的邏輯展開(kāi),符合個(gè)體由淺及深的認(rèn)知規(guī)律。
5結(jié)語(yǔ)
當(dāng)前,我國(guó)社會(huì)治理正經(jīng)歷著數(shù)字化、現(xiàn)代化轉(zhuǎn)型,政府?dāng)?shù)據(jù)日益豐富與多樣化,社會(huì)訴求數(shù)據(jù)價(jià)值日益凸顯。在此背景下,本文創(chuàng)新性地將中醫(yī)四診合參思想運(yùn)用到社會(huì)訴求數(shù)據(jù)洞察方面,為數(shù)據(jù)挖掘體系構(gòu)建提供系統(tǒng)性指導(dǎo)。在理論上,本文構(gòu)建了基于四診合參的社會(huì)訴求數(shù)據(jù)價(jià)值挖掘框架,拓展了四診合參理論的應(yīng)用場(chǎng)景,并為社會(huì)訴求數(shù)據(jù)洞察提供參考思路;在實(shí)踐上,本文提出了社會(huì)訴求數(shù)據(jù)挖掘的技術(shù)框架,為社會(huì)訴求數(shù)據(jù)價(jià)值發(fā)揮提供了切實(shí)可行的應(yīng)用方案。
由于目前從中醫(yī)視角進(jìn)行數(shù)據(jù)挖掘的文獻(xiàn)較為匱乏,因此,本文側(cè)重進(jìn)行數(shù)據(jù)分析框架搭建與可行性探索,未來(lái)將進(jìn)一步擴(kuò)展理論模型的深度,探究多場(chǎng)景視角下的政務(wù)數(shù)據(jù)挖掘體系構(gòu)建,積極推動(dòng)本研究應(yīng)用落地。