孫家坤,姚慧
(山東建筑大學(xué)管理工程學(xué)院,山東 濟(jì)南 250101)
近年來,我國建筑業(yè)持續(xù)快速發(fā)展、規(guī)模不斷擴(kuò)大,然而,由于建筑施工場地復(fù)雜、高處作業(yè)多,致使安全事故頻發(fā),建筑工程安全生產(chǎn)形勢嚴(yán)峻[1]。 據(jù)住房和城鄉(xiāng)建設(shè)部數(shù)據(jù)顯示,全國房屋市政工程生產(chǎn)安全事故起數(shù)和死亡人數(shù)呈上升的趨勢,其中高處墜落是施工致死事故的主要類型,居于“五大傷害”(高處墜落、物體打擊、機(jī)械傷害、觸電、坍塌)之首[2]。 據(jù)統(tǒng)計(jì),2017—2021 年,我國建筑行業(yè)發(fā)生的高處墜落事故占總事故的53%[3],高處墜落事故預(yù)防是當(dāng)前建筑施工安全事故防控工作的重點(diǎn)。
通過識別高處墜落事故成因,研究其關(guān)聯(lián)性是預(yù)防事故發(fā)生的基礎(chǔ)。 目前,對于事故成因的識別多采用文獻(xiàn)分析、問卷調(diào)查及描述性統(tǒng)計(jì)分析等方法[4-5],便于收集數(shù)據(jù),但處理數(shù)據(jù)時(shí)有一定的主觀性,且難以處理非結(jié)構(gòu)化數(shù)據(jù),以致事故成因提取困難。 相比之下,文本挖掘方法能夠通過自動(dòng)信息檢索,從大規(guī)模文本庫中提取隱含、有效的知識文本數(shù)據(jù),發(fā)現(xiàn)信息,并基于文本數(shù)據(jù)信息價(jià)值可再應(yīng)用[6-7]。 文本挖掘方法可從事故調(diào)查報(bào)告中獲取特征值并進(jìn)行統(tǒng)計(jì)分析,對于提取事故致因效率更高。Esmaeili 等[8]運(yùn)用文本挖掘技術(shù)在1 700 多份建筑工程事故報(bào)告中提取了22 個(gè)安全風(fēng)險(xiǎn)因素;李解等[9]將文本挖掘技術(shù)應(yīng)用于地鐵施工事故致因研究領(lǐng)域,并根據(jù)致險(xiǎn)因素的共現(xiàn)規(guī)律,構(gòu)建了事故致因集合。 針對高處墜落事故影響因素的研究,學(xué)者們采用了諸多方法進(jìn)行研究:楊慧[10]通過運(yùn)用德爾菲法,構(gòu)建解釋結(jié)構(gòu)模型,從“人-物-環(huán)-管”4 個(gè)方面總結(jié)出13 個(gè)建筑施工過程高空墜落事故的影響因素;仇國芳等[11]分析了123 例典型高處墜落事故調(diào)查報(bào)告案例,運(yùn)用系統(tǒng)結(jié)構(gòu)模型法提取出19 種致因要素,明確了一般事故中與較大事故中的關(guān)鍵因素;宋少卿等[12]運(yùn)用人因失誤理論框架的方法研究確定了教育培訓(xùn)不到位等7 類建筑施工高處墜落發(fā)生的主因;崔勇[13]通過對近5 年上海市建設(shè)工程中58 起高處墜落事故的統(tǒng)計(jì)分析,確定了高處墜落事故中最主要的因素是個(gè)人意識不到位;宋洋[14]通過事故樹法分析典型案例的方式找出了高處墜落事故的影響因素,即安全意識不強(qiáng)、培訓(xùn)教育不夠等。 對于高處墜落事故影響因素的研究大都是通過定性分析或者統(tǒng)計(jì)分析的方式研究事故因素本身影響程度,往往忽略了各因素之間的關(guān)聯(lián)性[15-17]。 社會網(wǎng)絡(luò)分析是用于社會科學(xué)、自然科學(xué)、建設(shè)管理和安全等多個(gè)領(lǐng)域的分析方法,主要分析不同個(gè)體、群體或社會所構(gòu)成的各因素相互之間的關(guān)聯(lián)性。 通過構(gòu)建社會網(wǎng)絡(luò)模型,對模型進(jìn)行量化分析,從而得出諸多因素中較為關(guān)鍵的影響因素[18],已在輿情傳播、風(fēng)險(xiǎn)投資、事故分析等方面得到廣泛運(yùn)用[19-21]。
為找出影響高處墜落事故的主要因素及其關(guān)聯(lián)性,文章基于華東地區(qū)2012—2021 年間的145 份建筑施工高處墜落事故調(diào)查報(bào)告,利用文本挖掘技術(shù)提取建筑施工高處墜落事故成因,運(yùn)用社會網(wǎng)絡(luò)分析,識別出高處墜落事故的關(guān)鍵成因并研究事故成因之間的關(guān)聯(lián)性,以期為有效防控高處墜落事故提供依據(jù)。
通過在國家應(yīng)急管理部、住房與城鄉(xiāng)建設(shè)部、各省市應(yīng)急管理廳、局等網(wǎng)站中查詢事故案例調(diào)查報(bào)告,收集2012—2021 年間145 份華東地區(qū)建筑施工高處墜落事故調(diào)查報(bào)告。 為消除文本挖掘中無關(guān)詞組的干擾,選用事故調(diào)查報(bào)告中“事故發(fā)生經(jīng)過”“事故原因分析”“事故性質(zhì)”3 部分內(nèi)容為“.txt”文本集,形成文本挖掘語料庫。
運(yùn)用文本挖掘技術(shù)旨在提取關(guān)于影響建筑施工高處墜落事故的成因,而且研究涉及建筑安全管理領(lǐng)域的專業(yè)知識,需要有自定義詞庫的功能支持,同時(shí)需要有詞云等可視化功能做數(shù)據(jù)分析支撐。 選擇內(nèi)容挖掘系統(tǒng)ROST CM[22]作為建筑施工高處墜落安全事故調(diào)查報(bào)告文本挖掘的工具。
(1) 數(shù)據(jù)清洗
將145 份事故調(diào)查報(bào)告匯總另存為ROST CM軟件可識別的“.txt”格式。 報(bào)告文本語料達(dá)11 萬字,在眾多的文本語料中難免會出現(xiàn)錯(cuò)別字、字詞缺失或者重復(fù)等現(xiàn)象,因而通過文本預(yù)處理對不合規(guī)范的語料進(jìn)行數(shù)據(jù)清洗或修正,保證待挖掘文本語料規(guī)范化。
(2) 文本擬分詞
文本擬分詞運(yùn)用ROST CM 軟件原有詞庫,在分詞的操作中先把非結(jié)構(gòu)化內(nèi)容割分為單個(gè)的名詞、動(dòng)詞和形容詞等,再將非結(jié)構(gòu)化用語轉(zhuǎn)換成統(tǒng)一性的標(biāo)準(zhǔn)用語,最終得到節(jié)選項(xiàng)次>100 的301 項(xiàng)文本集原始特征項(xiàng),見表1。 從擬分詞結(jié)果可以看出:多數(shù)安全因素被拆分為兩個(gè)及以上的詞語,如“主體”“責(zé)任”“落實(shí)”“不到位”,會使不安全影響因素表達(dá)不夠明確;有些不同的語義表達(dá)還會產(chǎn)生相同的分詞結(jié)果,如對“嚴(yán)重違反施工升降機(jī)安裝使用有關(guān)規(guī)定”和“經(jīng)調(diào)查,未違反施工升降機(jī)安裝使用規(guī)定”進(jìn)行分詞,都會產(chǎn)生包括“違反”“施工”“升降機(jī)”“使用”的分詞結(jié)果。 為確保建筑施工高處墜落事故的安全因素高效提取,需要自定義專業(yè)詞庫,以準(zhǔn)確識別專業(yè)術(shù)語。
表1 文本擬分詞結(jié)果表(部分)
(3)自定義詞庫
自定義詞庫包括專業(yè)詞庫、過濾詞詞庫和歸并詞詞庫。 其中,專業(yè)詞庫包括《土木工程專業(yè)詞典》《建筑工程安全術(shù)語字典》《安全工程詞典》以及《建筑工程專業(yè)詞匯》;過濾詞詞庫包含了中文停用詞詞庫以及《現(xiàn)代漢語虛詞詞典》;歸并詞詞庫主要是完成對同義詞的統(tǒng)一表達(dá)。
在ROST CM 軟件中啟用自定義詞表、過濾詞表、歸并詞群表之后,對文本語料進(jìn)行分詞整理,得到詞頻統(tǒng)計(jì)結(jié)果。 將詞頻統(tǒng)計(jì)結(jié)果在ROST CM 軟件中可視化處理得到詞云圖,如圖1 所示,特征詞頻越大,其詞云字體越大。
圖1 事故成因詞云圖
由圖1 可看出,建筑施工高處墜落事故調(diào)查報(bào)告中的高頻詞為安全意識淡薄、安全教育培訓(xùn)不到位、作業(yè)人員、監(jiān)督檢查不力等,但是通過ROST CM軟件篩選出的高頻詞只是初步包含高處墜落事故影響因素的含義,若要清晰準(zhǔn)確地表達(dá)出事故成因,還需深化處理這些高頻詞。
在文本挖掘的過程中,詞頻并不能完全反映一個(gè)詞在整個(gè)語料庫中的重要性,為找到事故致因中的關(guān)鍵項(xiàng),選擇使用詞頻-逆文檔頻率算法(Term Frequency-Inverse Document Frequency,TF-IDF),其可用于評估一個(gè)詞在整個(gè)文件集或者語料庫的重要程度,可通過計(jì)算文檔中關(guān)鍵詞的權(quán)重提取出特征關(guān)鍵詞[23],具體計(jì)算由式(1)~(3)表示為
式中TFij為某特征項(xiàng)在語料庫中出現(xiàn)的頻率;IDFi為逆文本頻率指數(shù);為語料庫的文檔總數(shù);nij為某特征項(xiàng)在語料庫中出現(xiàn)的次數(shù);為所有特征項(xiàng)在語料庫中出現(xiàn)次數(shù)之和;為包含某特征項(xiàng)的文檔數(shù),加1 是為了避免分母為零;Wij為每個(gè)特征項(xiàng)在文本中的權(quán)重。
某個(gè)特征項(xiàng)對文檔的重要性越高,其TF-IDF值就越大,最終提取出權(quán)重值>0.01 的25 項(xiàng)建筑施工高處墜落事故成因關(guān)鍵詞,見表2。
表2 事故成因關(guān)鍵詞表
共現(xiàn)矩陣是語料庫中兩兩詞組之間共同出現(xiàn)的次數(shù),表明兩個(gè)特征項(xiàng)之間的關(guān)系程度,構(gòu)建共現(xiàn)矩陣是繪制可視化圖譜的前提[24]。 通過計(jì)算25 個(gè)關(guān)鍵詞在不同事故調(diào)查報(bào)告中的共現(xiàn)頻率,構(gòu)建建筑施工高處墜落事故成因特征的共現(xiàn)矩陣,見表3。
表3 事故成因矩陣表(部分)
基于社會網(wǎng)絡(luò)分析軟件Ucinet 繪制建筑施工高處墜落事故成因特征網(wǎng)絡(luò)圖,如圖2 所示。 影響高處墜落事故發(fā)生的各因素之間的關(guān)聯(lián)性以網(wǎng)絡(luò)的形式連成一個(gè)整體,可清晰地看到各要素間的關(guān)聯(lián)和分布情況。
圖2 事故成因整體網(wǎng)絡(luò)圖
基于建筑施工高處墜落事故成因網(wǎng)絡(luò)的構(gòu)建,為識別出建筑施工高處墜落事故關(guān)鍵成因,使用社會網(wǎng)絡(luò)分析(Social Network Analysis,SNA)方法,通過整體與個(gè)體網(wǎng)絡(luò)密度分析、網(wǎng)絡(luò)中心性分析以及核心邊緣結(jié)構(gòu)分析,定量分析事故成因網(wǎng)絡(luò)。
整體網(wǎng)絡(luò)密度是指各節(jié)點(diǎn)之間相互連邊的緊密程度,即表明各節(jié)點(diǎn)間的相互影響程度。 密度越大,各節(jié)點(diǎn)之間關(guān)系越緊密。 一般以0.5 作為衡量密度大小的標(biāo)準(zhǔn),若密度>0.5,則表明各節(jié)點(diǎn)間有關(guān)聯(lián)且密度關(guān)聯(lián)性較高[25]。
基于Ucinet 軟件,通過Dichotomize 函數(shù)將共現(xiàn)矩陣轉(zhuǎn)化成二值化矩陣,并分析整體網(wǎng)絡(luò)密度。 結(jié)果顯示,整體網(wǎng)絡(luò)的密度為0.893,說明整體網(wǎng)絡(luò)密度較大,建筑施工高處墜落事故成因特征網(wǎng)絡(luò)中各影響因素間關(guān)聯(lián)性緊密,相互影響性相對較高。
基于Ucinet 軟件“Network-Ego networks-Egonet Density”計(jì)算得出整體網(wǎng)絡(luò)中的個(gè)體網(wǎng)絡(luò)密度,如圖3 所示。 通過測度大小計(jì)算,得出個(gè)體網(wǎng)絡(luò)密度的平均值為21.44,位于平均值之上的影響因素有主體責(zé)任不落實(shí)、防護(hù)措施不到位、安全教育培訓(xùn)不到位、現(xiàn)場管理不到位、監(jiān)督檢查不力、違規(guī)作業(yè)、安全技術(shù)交底不到位、安全意識淡薄、防護(hù)用品使用不當(dāng)、安全隱患排查治理不到位、安全隱患整改不到位、施工方案不合理、違法建設(shè)、支撐系統(tǒng)失穩(wěn),說明這些因素的個(gè)體網(wǎng)絡(luò)密度較大,與其有緊密關(guān)系的因素較多。 另外,設(shè)備故障、無資質(zhì)、臨邊防護(hù)不到位、無證上崗、冒險(xiǎn)作業(yè)、違法分包、作業(yè)環(huán)境復(fù)雜、警示標(biāo)志不齊全、技術(shù)不規(guī)范、違章指揮、施工工序不當(dāng)?shù)纫蛩氐摹?個(gè)體網(wǎng)絡(luò)弱成分?jǐn)?shù)占比(pWeakComp)”較大,說明其個(gè)體網(wǎng)絡(luò)密度較小,在整體網(wǎng)絡(luò)規(guī)模中影響較弱。
圖3 事故成因個(gè)體網(wǎng)絡(luò)密度分析圖
網(wǎng)絡(luò)中心性分析是對網(wǎng)絡(luò)中各因素的重要程度進(jìn)行量化描述,用以度量網(wǎng)絡(luò)各節(jié)點(diǎn)的中心化程度,表達(dá)每個(gè)點(diǎn)在整個(gè)網(wǎng)絡(luò)中與其他點(diǎn)之間的關(guān)聯(lián)程度[26]。
(1) 度數(shù)中心度分析
度數(shù)中心度是在社會網(wǎng)絡(luò)分析中刻畫節(jié)點(diǎn)中心度最直接的度量指標(biāo),一個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)度越大意味著這個(gè)節(jié)點(diǎn)的度中心性越高,該節(jié)點(diǎn)在網(wǎng)絡(luò)中就越重要。 度數(shù)中心度可以分為絕對度數(shù)中心度和相對度數(shù)中心度。 絕對度數(shù)中心度即點(diǎn)的度數(shù),是與點(diǎn)直接相連的其他點(diǎn)的個(gè)數(shù),若某點(diǎn)具有度數(shù)值最高,就稱該點(diǎn)位居核心位置。 對絕對度數(shù)中心度進(jìn)行標(biāo)準(zhǔn)化處理后得到相對度數(shù)中心度,可由式(4)和(5)[26]表示為
式中CADi為節(jié)點(diǎn)i 的絕對度數(shù)中心度;CRDi為節(jié)點(diǎn)i的相對度數(shù)中心度;n-1 為節(jié)點(diǎn)的個(gè)數(shù);∑iXij為用于計(jì)算節(jié)點(diǎn)i 與其他n-1 個(gè)節(jié)點(diǎn)間的直接相連的點(diǎn)數(shù)。
借助Ucinet 軟件得到度數(shù)中心度分析結(jié)果,見表4。 分析建筑施工高處墜落事故整體網(wǎng)絡(luò)中點(diǎn)的相對度數(shù)中心度并取0.130 的平均值,位于平均值之上的影響因素有主體責(zé)任不落實(shí)、防護(hù)措施不到位、安全教育培訓(xùn)不到位、現(xiàn)場管理不到位、監(jiān)督檢查不力、違規(guī)作業(yè)、安全技術(shù)交底不到位、安全意識淡薄、防護(hù)用品使用不當(dāng)、安全隱患排查治理不到位。 這10 個(gè)因素的度數(shù)中心度較高,說明對建筑施工高處墜落事故發(fā)生的影響較大。
表4 事故成因網(wǎng)絡(luò)中心性分析結(jié)果表
(2) 中間中心度分析
在建筑施工高處墜落事故成因網(wǎng)絡(luò)分析中,僅分析點(diǎn)的度數(shù)中心度,得出的結(jié)果有些片面,因?yàn)槎葦?shù)中心度刻畫的是節(jié)點(diǎn)的局部中心指數(shù),測量尺度僅是與某點(diǎn)直接相連的點(diǎn)數(shù),忽略了間接相連的節(jié)點(diǎn),故還需要進(jìn)行點(diǎn)的中間中心度分析。 中間中心度可衡量節(jié)點(diǎn)對整體網(wǎng)絡(luò)的控制程度,即某一影響因素對其他因素的影響程度。 中間中心度較高的點(diǎn)在整個(gè)社會網(wǎng)絡(luò)中起橋梁作用,若丟失這個(gè)點(diǎn),則許多節(jié)點(diǎn)關(guān)系將喪失,同時(shí)若著重控制這些點(diǎn),將有效降低風(fēng)險(xiǎn)因素影響程度。 點(diǎn)的中間中心度分為絕對中間中心度和相對中間中心度,絕對中間中心度標(biāo)準(zhǔn)化就得到相對中間中心度[27],分別由式(6)和(7)[26]表示為
式中CABi為節(jié)點(diǎn)i 的絕對中間中心度;CRBi為節(jié)點(diǎn)i的相對中間中心度;n 為節(jié)點(diǎn)的個(gè)數(shù);bjk(i)為點(diǎn)i 能夠控制點(diǎn)j、k 的連接能力,即是點(diǎn)i 位于點(diǎn)j、k 之間捷徑上的概率;gjk(i)為點(diǎn)j、k 之間存在的經(jīng)過點(diǎn)i的捷徑數(shù)量;gjk為點(diǎn)j、k 之間存在的所有捷徑數(shù)量。
運(yùn)用Ucinet 軟件“Network-Centrality Power-Freeman Betweenness-Node Betweenness”分析得出結(jié)果,見表4。 通過分析結(jié)果可知,各個(gè)節(jié)點(diǎn)的相對中間中心度平均值為1.460,在平均值之上的影響因素有主體責(zé)任不落實(shí)、監(jiān)督檢查不力、違規(guī)作業(yè)、現(xiàn)場管理不到位、防護(hù)措施不到位、施工方案不合理、安全教育培訓(xùn)不到位,表明這7 個(gè)影響因素的中介性較強(qiáng),這些影響因素在事故成因整體網(wǎng)絡(luò)中發(fā)揮了主要作用,對其他影響因素的調(diào)節(jié)控制能力較強(qiáng)。
網(wǎng)絡(luò)中心性分析能夠衡量局部核心,僅表明一個(gè)節(jié)點(diǎn)(影響因素)在整體網(wǎng)絡(luò)圖中的重要性,若要提取出整體網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)致因,還需要測定核心邊緣結(jié)構(gòu),通過核心度指標(biāo),衡量節(jié)點(diǎn)的主動(dòng)地位,進(jìn)而識別出關(guān)鍵節(jié)點(diǎn)[24]。
在個(gè)體網(wǎng)絡(luò)密度以及網(wǎng)絡(luò)中心性分析的基礎(chǔ)上,為進(jìn)一步確保高處墜落事故關(guān)鍵成因識別的精準(zhǔn)度,進(jìn)行核心-邊緣結(jié)構(gòu)分析。 核心-邊緣結(jié)構(gòu)分析能夠區(qū)分網(wǎng)絡(luò)中高密度的核心致因,以及低密度的邊緣致因,通過核心-邊緣結(jié)構(gòu)分析確定整體網(wǎng)絡(luò)中處于核心地位的影響因素,以提取出高處墜落事故發(fā)生的關(guān)鍵成因[21],分析結(jié)果見表5。 處于核心區(qū)域的網(wǎng)絡(luò)密度為36.91,而位于邊緣區(qū)域的網(wǎng)絡(luò)密度為8.06,說明處于核心區(qū)域的影響因素的關(guān)聯(lián)程度較高。 最終將各影響因素項(xiàng)歸類為核心因素與邊緣因素。 核心因素包括安全教育培訓(xùn)不到位、安全意識淡薄、現(xiàn)場管理不到位、主體責(zé)任不落實(shí)、防護(hù)措施不到位、防護(hù)用品使用不當(dāng)、監(jiān)督檢查不力等7 項(xiàng),其余影響因素項(xiàng)均為邊緣因素。
表5 事故成因網(wǎng)絡(luò)核心-邊緣結(jié)構(gòu)分析結(jié)果表
基于建筑施工高處墜落事故成因網(wǎng)絡(luò)分析,通過相應(yīng)指標(biāo)衡量整體網(wǎng)絡(luò)中處于局部核心與全局核心的節(jié)點(diǎn),從而提取出關(guān)鍵成因。
(1) 通過SNA 中個(gè)體網(wǎng)絡(luò)密度、度數(shù)中心度和中間中心度3 個(gè)指標(biāo)的分析,篩選出對高處墜落事故成因整體網(wǎng)絡(luò)有顯著影響的因素。 將各自指標(biāo)分析出的重要影響因素取交集[22],得出主體責(zé)任不落實(shí)、安全教育培訓(xùn)不到位、安全意識淡薄、監(jiān)督檢查不力、違規(guī)作業(yè)、現(xiàn)場管理不到位、防護(hù)措施不到位、安全隱患排查治理不到位等8 個(gè)影響因素,這些影響因素在整體網(wǎng)絡(luò)中處于重要的地位,對建筑施工高處墜落事故的發(fā)生影響顯著。
(2) 通過核心-邊緣結(jié)構(gòu)分析,發(fā)現(xiàn)處于核心地位的主體責(zé)任不落實(shí)、防護(hù)措施不到位、監(jiān)督檢查不力、現(xiàn)場管理不到位、安全教育培訓(xùn)不到位、安全意識淡薄、防護(hù)用品使用不當(dāng)?shù)? 項(xiàng)影響因素是建筑施工高處墜落事故的關(guān)鍵成因。 這7 個(gè)核心節(jié)點(diǎn)不僅聯(lián)系緊密,而且每個(gè)核心節(jié)點(diǎn)都與其他18 個(gè)節(jié)點(diǎn)之間存在關(guān)聯(lián)性,說明這7 個(gè)核心節(jié)點(diǎn)的出現(xiàn)會牽引出其他因素,且對高處墜落事故的發(fā)生影響力較大,故這些節(jié)點(diǎn)在高處作業(yè)中應(yīng)重點(diǎn)防范。
通過文本挖掘技術(shù)提取出25 項(xiàng)建筑施工高處墜落事故成因關(guān)鍵詞,在此基礎(chǔ)上,運(yùn)用社會網(wǎng)絡(luò)分析法,借助Ucinet 軟件構(gòu)建建筑施工高處墜落事故成因整體網(wǎng)絡(luò)圖,從整體網(wǎng)絡(luò)密度分析、個(gè)體網(wǎng)絡(luò)密度分析、網(wǎng)絡(luò)中心性分析以及核心-邊緣結(jié)構(gòu)分析等4 個(gè)方面進(jìn)行致因網(wǎng)絡(luò)分析。 確定了影響建筑施工高處墜落事故發(fā)生的關(guān)鍵成因,即主體責(zé)任不落實(shí)、防護(hù)措施不到位、監(jiān)督檢查不力、現(xiàn)場管理不到位、安全教育培訓(xùn)不到位、安全意識淡薄、防護(hù)用品使用不當(dāng)?shù)? 個(gè)關(guān)鍵成因。 關(guān)鍵致因的識別有助于為預(yù)防高處墜落安全事故的發(fā)生提供管控重點(diǎn)。