王新浩,羅 云,李 桐,黃西菲
( 1.中國地質(zhì)大學(xué)(北京) 工程技術(shù)學(xué)院,北京 100083; 2.中國特種設(shè)備檢測(cè)研究院,北京 100029)
特種設(shè)備作為我國國民經(jīng)濟(jì)和人民生活的重要基礎(chǔ)設(shè)施,量大面廣,具有特殊的專業(yè)技術(shù)性和潛在高危險(xiǎn)性[1]。近年來,我國特種設(shè)備萬臺(tái)死亡率呈下降趨勢(shì),但特種設(shè)備事故的傷亡人數(shù)仍是發(fā)達(dá)國家的4~5倍[2]。為進(jìn)一步遏制特種設(shè)備事故發(fā)生,保障人民生命和財(cái)產(chǎn)安全,我國實(shí)行嚴(yán)格的監(jiān)督檢驗(yàn)制度[3]。在此過程中,特種設(shè)備監(jiān)管機(jī)構(gòu)積累了大量的數(shù)據(jù)資料。充分挖掘、利用其中的潛在價(jià)值,將對(duì)增強(qiáng)監(jiān)管針對(duì)性,提高檢驗(yàn)效率,實(shí)現(xiàn)特種設(shè)備監(jiān)督檢驗(yàn)工作優(yōu)化提升具有重要意義。
目前,我國特種設(shè)備風(fēng)險(xiǎn)評(píng)價(jià)預(yù)警的研究主要集中在單體設(shè)備風(fēng)險(xiǎn)評(píng)價(jià)和整類設(shè)備風(fēng)險(xiǎn)評(píng)價(jià)2個(gè)方面。單臺(tái)設(shè)備風(fēng)險(xiǎn)評(píng)價(jià)方面,文獻(xiàn)[4]、文獻(xiàn)[5]、文獻(xiàn)[6]等分別以機(jī)電類、承壓類等特種設(shè)備為對(duì)象,構(gòu)建風(fēng)險(xiǎn)評(píng)價(jià)模型,指導(dǎo)企業(yè)進(jìn)行隱患查治以及風(fēng)險(xiǎn)防控。但由于此類方法的研究對(duì)象尺度相對(duì)較小,對(duì)安全監(jiān)督檢驗(yàn)工作的指導(dǎo)作用有限。在此背景下,部分學(xué)者嘗試通過風(fēng)險(xiǎn)強(qiáng)度模型[7]、功效系數(shù)法[8]等方式評(píng)價(jià)整類設(shè)備的風(fēng)險(xiǎn)等級(jí),指導(dǎo)政府合理分配監(jiān)管力量。
受上述文獻(xiàn)啟發(fā),本文擬構(gòu)建1種宏觀安全風(fēng)險(xiǎn)預(yù)警方法,以特種設(shè)備安全監(jiān)督檢驗(yàn)大數(shù)據(jù)為基礎(chǔ),利用關(guān)聯(lián)規(guī)則挖掘、社區(qū)發(fā)現(xiàn)、可視化等數(shù)據(jù)挖掘技術(shù),對(duì)區(qū)域范圍、缺陷類別等多種宏觀指標(biāo)進(jìn)行預(yù)警,以期為特種設(shè)備監(jiān)督檢驗(yàn)提供更多指導(dǎo)意見,進(jìn)一步增強(qiáng)監(jiān)管針對(duì)性,提高檢驗(yàn)效率。
宏觀安全風(fēng)險(xiǎn)是指從較大時(shí)間尺度和空間范圍來度量的系統(tǒng)性、綜合性、社會(huì)性安全風(fēng)險(xiǎn),是各種不確定性對(duì)安全監(jiān)管預(yù)期目標(biāo)的不利影響。其研究范疇是多維度視角下的風(fēng)險(xiǎn)防控規(guī)律,包含多種時(shí)間尺度(包括風(fēng)險(xiǎn)過程、周期、時(shí)段等),多種空間范圍(點(diǎn)、線、面、體、單位、行業(yè)等),多種應(yīng)用領(lǐng)域(政府檢查、行業(yè)監(jiān)管、技術(shù)檢驗(yàn)等)。因此,宏觀安全風(fēng)險(xiǎn)具有社會(huì)性、系統(tǒng)性、綜合性等特點(diǎn)。
1)社會(huì)性:宏觀安全風(fēng)險(xiǎn)具有社會(huì)風(fēng)險(xiǎn)的屬性,不僅包括本體(設(shè)備)風(fēng)險(xiǎn)因素,還包括受體風(fēng)險(xiǎn)因素。
2)系統(tǒng)性:宏觀安全風(fēng)險(xiǎn)以系統(tǒng)為研究對(duì)象,不僅涉及設(shè)備、人員、環(huán)境和社會(huì)等因素的主要特征和狀態(tài),還包含系統(tǒng)因素間的內(nèi)在聯(lián)系。
3)綜合性:宏觀安全風(fēng)險(xiǎn)具有自然風(fēng)險(xiǎn)與社會(huì)風(fēng)險(xiǎn)、個(gè)體風(fēng)險(xiǎn)與群體風(fēng)險(xiǎn)綜合的特性,包括生命安全風(fēng)險(xiǎn)、財(cái)產(chǎn)安全風(fēng)險(xiǎn)、環(huán)境安全風(fēng)險(xiǎn)、社會(huì)安全風(fēng)險(xiǎn)等形態(tài)。
基于上述定義可以認(rèn)為,為了滿足政府檢查、行業(yè)監(jiān)管、技術(shù)檢驗(yàn)的需求,實(shí)現(xiàn)宏觀安全風(fēng)險(xiǎn)預(yù)警,應(yīng)以海量數(shù)據(jù)為基礎(chǔ),分析設(shè)備、人員、環(huán)境等多種微觀因素間的聯(lián)系,進(jìn)而評(píng)估宏觀層面風(fēng)險(xiǎn)的狀況。
安全生產(chǎn)大數(shù)據(jù)是指在進(jìn)行與安全生產(chǎn)相關(guān)的活動(dòng)時(shí),通過一定方式獲取到的可反映安全生產(chǎn)本質(zhì)規(guī)律、體現(xiàn)安全生產(chǎn)基礎(chǔ)理論價(jià)值的安全生產(chǎn)數(shù)據(jù)集,以及對(duì)安全生產(chǎn)數(shù)據(jù)集進(jìn)行處理時(shí)所使用的大數(shù)據(jù)思維和大數(shù)據(jù)技術(shù)[9]。根據(jù)《特種設(shè)備安全監(jiān)察條例》相關(guān)規(guī)定,我國特種設(shè)備監(jiān)督檢驗(yàn)機(jī)構(gòu)會(huì)開展特種設(shè)備監(jiān)督檢驗(yàn)、定期檢驗(yàn)、型式試驗(yàn)以及專門為特種設(shè)備生產(chǎn)、使用提供無損檢測(cè)服務(wù),在此過程中形成了大量的安全生產(chǎn)檢查報(bào)告、設(shè)備設(shè)施檢驗(yàn)案例報(bào)告、設(shè)備設(shè)施可靠性鑒定報(bào)告等監(jiān)管數(shù)據(jù)[10]。隨著監(jiān)督檢驗(yàn)工作的開展,大量數(shù)據(jù)被不斷積累,最終匯集成了特種設(shè)備安全監(jiān)督檢驗(yàn)大數(shù)據(jù)。
數(shù)據(jù)挖掘(data mining, DM)是數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(Knowledge-Discovery in Databases, KDD)中的一個(gè)步驟,一般是指從大量數(shù)據(jù)中挖掘有趣模式和知識(shí)的過程,主要通過統(tǒng)計(jì)發(fā)現(xiàn)、機(jī)器學(xué)習(xí)、專家系統(tǒng)和模式識(shí)別等方法實(shí)現(xiàn)[11]。宏觀安全風(fēng)險(xiǎn)預(yù)警方法涉及多最小支持度關(guān)聯(lián)規(guī)則挖掘算法、快速展開(Fast unfolding)算法和可視化技術(shù)。
多最小支持度關(guān)聯(lián)規(guī)則挖掘算法是等價(jià)類變換(Equivalence class transformation, Eclat)算法[12-13]的優(yōu)化算法,可以用于挖掘各類因素間的關(guān)聯(lián)關(guān)系。Eclat算法是采用垂直數(shù)據(jù)格式挖掘頻繁項(xiàng)集的深度優(yōu)化算法,是在概念格理論的基礎(chǔ)上,利用基于前綴的等價(jià)關(guān)系,將搜索空間劃分為較小的子空間,對(duì)各子空間進(jìn)行自下而上的搜索,進(jìn)而獲取頻繁項(xiàng)集[14]。不同于傳統(tǒng)水平數(shù)據(jù)格式挖掘算法,該算法不用通過掃描所有數(shù)據(jù)集來確定(K+1)項(xiàng)集的支持度,算法效率較高,適應(yīng)于數(shù)量巨大、因素眾多的安全生產(chǎn)大數(shù)據(jù)。
現(xiàn)實(shí)世界中,許多復(fù)雜系統(tǒng)可以表示成圖或網(wǎng)絡(luò),如社會(huì)網(wǎng)絡(luò)、生物網(wǎng)絡(luò)、信息網(wǎng)絡(luò)等。復(fù)雜網(wǎng)絡(luò)可以自然地分成一些節(jié)點(diǎn)組,使同1個(gè)節(jié)點(diǎn)組內(nèi)的2個(gè)節(jié)點(diǎn)之間比不同節(jié)點(diǎn)組的2個(gè)節(jié)點(diǎn)之間更傾向于有邊相連,網(wǎng)絡(luò)的這種拓?fù)涮匦员环Q為社區(qū)結(jié)構(gòu),相應(yīng)的,每個(gè)節(jié)點(diǎn)組被稱為1個(gè)社區(qū)[15]。通過對(duì)社區(qū)信息的認(rèn)識(shí),可以幫助我們了解各安全相關(guān)因素間的親疏關(guān)系,進(jìn)而進(jìn)行針對(duì)性監(jiān)管和檢驗(yàn)??焖僬归_算法是基于模塊度對(duì)社區(qū)劃分的一種迭代的算法[16],算法包括模塊化優(yōu)化(Modularity Optimization)和社區(qū)聚集(Community Aggregation)2個(gè)階段,首先,通過模塊化優(yōu)化,將每個(gè)節(jié)點(diǎn)劃分到預(yù)期鄰接的節(jié)點(diǎn)社區(qū);然后,將第一階段得到的社區(qū)聚合成1個(gè)點(diǎn),并重復(fù)上述過程,最終使各個(gè)節(jié)點(diǎn)分配到最優(yōu)社區(qū)。
可視化技術(shù)是利用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)信息轉(zhuǎn)換為圖形信息,并交互處理的理論、方法和技術(shù)[11]。將可視化技術(shù)應(yīng)用于宏觀安全風(fēng)險(xiǎn)中,可以更加清晰地表現(xiàn)各類因素間的關(guān)聯(lián)關(guān)系,以及因素關(guān)系的緊密程度,方便監(jiān)管者理解風(fēng)險(xiǎn)信息,優(yōu)化監(jiān)管檢驗(yàn)策略。
宏觀安全風(fēng)險(xiǎn)預(yù)警主要包括數(shù)據(jù)預(yù)處理、風(fēng)險(xiǎn)預(yù)警信息挖掘、可視化分析及決策3個(gè)環(huán)節(jié),如圖1所示。
數(shù)據(jù)預(yù)處理是宏觀安全風(fēng)險(xiǎn)預(yù)警中的一個(gè)重要環(huán)節(jié),尤其是對(duì)含有異常數(shù)據(jù)、不完整數(shù)據(jù)的對(duì)象進(jìn)行挖掘時(shí),需要進(jìn)行數(shù)據(jù)預(yù)處理,以提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量,并最終達(dá)到提高所獲信息質(zhì)量的目的。
1)結(jié)構(gòu)化處理:政府檢查、行業(yè)監(jiān)管、技術(shù)檢驗(yàn)等資料多以文本形式存儲(chǔ),而數(shù)據(jù)挖掘模型往往無法直接處理這些非(半)結(jié)構(gòu)化信息,因此需要對(duì)文本資料進(jìn)行預(yù)處理,以滿足數(shù)據(jù)挖掘需求。在此階段,非(半)結(jié)構(gòu)化文本資料中的主要信息將以關(guān)鍵詞的形式被提取與存儲(chǔ),形成結(jié)構(gòu)化數(shù)據(jù)。
圖1 宏觀安全風(fēng)險(xiǎn)預(yù)警流程Fig.1 Process of macro safety risk warning
2)清理與集成:原始資料往往存在著大量的“臟”數(shù)據(jù),如主要屬性信息缺失、關(guān)鍵指標(biāo)偏離期望值、數(shù)據(jù)結(jié)構(gòu)不一致等,這些數(shù)據(jù)會(huì)影響信息質(zhì)量。在此階段,需要填補(bǔ)遺漏數(shù)據(jù)、剔除異常數(shù)據(jù)、平滑噪聲數(shù)據(jù),并對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行標(biāo)準(zhǔn)化處理,將不同來源的數(shù)據(jù)合并到一起,形成統(tǒng)一的數(shù)據(jù)集合。
3)選擇與變換:根據(jù)分析需求,選擇數(shù)據(jù)信息,然后對(duì)數(shù)據(jù)進(jìn)行規(guī)格化操作,利用一般化識(shí)別編碼(Generalized Identifier, GID)將關(guān)鍵詞轉(zhuǎn)化為結(jié)構(gòu)化代碼,形成安全生產(chǎn)監(jiān)管數(shù)據(jù)庫,為數(shù)據(jù)挖掘做準(zhǔn)備。
風(fēng)險(xiǎn)預(yù)警信息挖掘主要包括3部分,首先,利用多最小支持度關(guān)聯(lián)規(guī)則挖掘算法挖掘單臺(tái)設(shè)備微觀因素間的關(guān)聯(lián)關(guān)系;然后,根據(jù)冗余原理刪除冗余關(guān)聯(lián)規(guī)則;最后,基于快速展開算法,對(duì)關(guān)聯(lián)規(guī)則進(jìn)行社區(qū)發(fā)現(xiàn)與劃分。
1)關(guān)聯(lián)規(guī)則挖掘:因素性質(zhì)不同,出現(xiàn)頻度也不盡相同,如瓶體受火焰損傷的可能性明顯少于管路管件存在缺陷的情況,西部地區(qū)特種設(shè)備數(shù)量明顯小于東部地區(qū)等。因此,最小支持度設(shè)置過高,則無法挖掘這些低頻度因素的關(guān)聯(lián)規(guī)則;而降低支持度閾值,關(guān)聯(lián)規(guī)則數(shù)量又會(huì)急劇增多,增加分析難度。針對(duì)上述問題,設(shè)計(jì)多最小支持度關(guān)聯(lián)規(guī)則挖掘算法,在傳統(tǒng)Eclat算法基礎(chǔ)上,分別對(duì)各因素指標(biāo)設(shè)置不同的最小支持度,從而解決出現(xiàn)頻率不均勻的問題,發(fā)現(xiàn)更多有用的規(guī)則。具體步驟包括:步驟1,根據(jù)監(jiān)管需求設(shè)置多最小支持度、最小置信度、最小Kulczynski(Kulc)值和最大不平衡比(Imbalance Ratio, IR);步驟2,搜索數(shù)據(jù)集,獲得符合各自最小支持度的頻繁1項(xiàng)集;步驟3,按照最小支持度對(duì)頻繁1項(xiàng)集進(jìn)行升序排列,形成如圖2所示的搜索空間;步驟4,應(yīng)用Eclat算法,獲取滿足各自最小支持度的頻繁項(xiàng)集;步驟5,根據(jù)最小置信度、最小Kulc值和最大IR,計(jì)算滿足條件的關(guān)聯(lián)規(guī)則。
圖2 頻繁項(xiàng)集搜索樹Fig.2 Frequent item sets search tree
2)冗余發(fā)現(xiàn)與刪除:設(shè)置多最小支持度進(jìn)行挖掘關(guān)聯(lián)規(guī)則會(huì)產(chǎn)生大量規(guī)則,監(jiān)管者很難有效分析和利用這些規(guī)則。為了解決此問題,提出冗余原理,有效減少規(guī)則數(shù)量。
設(shè)關(guān)聯(lián)規(guī)則X→Y和A→B,若(X∪Y)?(A∪B),且A?X,則A→B可以稱為X→Y的冗余規(guī)則。
證明:由(X∪Y)?(A∪B)可知,Sup(A∪B)≥Sup(X∪Y);又因?yàn)锳?X,則Sup(X)≥Sup(A)。
設(shè)Sup表示項(xiàng)集支持度,Conf表示規(guī)則的置信度。
因此,可由X→Y推出A→B,即A→B為X→Y的冗余規(guī)則。
3)社區(qū)發(fā)現(xiàn)與劃分:若將關(guān)聯(lián)規(guī)則的前、后項(xiàng)分別看作通過連線連接的2個(gè)獨(dú)立節(jié)點(diǎn),那么通過關(guān)聯(lián)規(guī)則挖掘,可以得到由若干節(jié)點(diǎn)和連線組成的復(fù)雜網(wǎng)絡(luò)。利用快速展開算法,對(duì)這些節(jié)點(diǎn)進(jìn)行社區(qū)劃分,可以確定節(jié)點(diǎn)間的親疏關(guān)系。
通過上述過程,安全生產(chǎn)監(jiān)管數(shù)據(jù)庫中的監(jiān)督檢驗(yàn)信息被轉(zhuǎn)化為存在于不同社區(qū)中的關(guān)聯(lián)規(guī)則。利用關(guān)聯(lián)規(guī)則,監(jiān)管者可以根據(jù)已知因素預(yù)測(cè)其他因素存在的可能性,實(shí)現(xiàn)風(fēng)險(xiǎn)預(yù)警;根據(jù)社區(qū)劃分,則可發(fā)現(xiàn)不同因素間的緊密關(guān)系,進(jìn)而指導(dǎo)監(jiān)管檢驗(yàn)策略的優(yōu)化。
宏觀安全風(fēng)險(xiǎn)的可視化圖像可以看作是一個(gè)由若干節(jié)點(diǎn)和連線組成的復(fù)雜網(wǎng)絡(luò),節(jié)點(diǎn)代表各類安全相關(guān)因素,因素出現(xiàn)的頻度越高,對(duì)應(yīng)節(jié)點(diǎn)越大;因素間的關(guān)聯(lián)關(guān)系則由連線表示,連線越粗表示關(guān)系越緊密。關(guān)系密切的因素節(jié)點(diǎn)被歸為同1個(gè)社區(qū),并用不同的顏色進(jìn)行區(qū)別。通過對(duì)可視化圖像分析,監(jiān)管者可通過已知節(jié)點(diǎn)來預(yù)警未知節(jié)點(diǎn),并根據(jù)社區(qū)分類情況對(duì)關(guān)系密切的參數(shù)進(jìn)行統(tǒng)一監(jiān)管。
以2008—2016年全國長管拖車檢驗(yàn)數(shù)據(jù)為例,進(jìn)行應(yīng)用實(shí)踐分析,驗(yàn)證方法的可行性。
實(shí)踐過程中,收集2008—2016年全國長管拖車檢驗(yàn)案例報(bào)告1 123份,以紙質(zhì)文件和電子文檔形式為主。經(jīng)過數(shù)據(jù)預(yù)處理,得到1 123條結(jié)構(gòu)化數(shù)據(jù),每條數(shù)據(jù)均包括缺陷類型、設(shè)備使用地區(qū)、使用單位、設(shè)備類型、制造單位、制造時(shí)間、缺陷描述關(guān)鍵詞、檢驗(yàn)結(jié)論關(guān)鍵詞、檢驗(yàn)人員9類信息。其中,缺陷類型包括:管路及管件缺陷、爆破片安全裝置缺陷、氣瓶固定裝置缺陷、氣瓶腐蝕、瓶口缺陷、氣瓶鼓包等19項(xiàng)因素;缺陷描述關(guān)鍵詞包括:缺陷形式描述、缺陷位置描述、檢查方式描述3類,如:裂紋、變形、底部、鋼印端、宏觀檢查、滲透檢測(cè)等59項(xiàng)因素;檢驗(yàn)結(jié)論關(guān)鍵詞主要包括:更換、修復(fù)、繼續(xù)使用、縮短周期、報(bào)廢、復(fù)檢等10項(xiàng)因素。
分析檢驗(yàn)案例報(bào)告時(shí)間分布發(fā)現(xiàn),檢驗(yàn)案例報(bào)告數(shù)量由2008—2016年逐年遞增,且增長趨勢(shì)較為平穩(wěn),如圖3所示。分析其中原因,一方面,與我國長管拖車制造能力提升,長管拖車的保有量逐年遞增有關(guān);另一方面,自2008年國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局正式頒布《長管拖車定期檢驗(yàn)專項(xiàng)要求》起,長管拖車定期檢驗(yàn)方式方法與制度法規(guī)不斷優(yōu)化完善,相應(yīng)的氣瓶裝備報(bào)檢系統(tǒng)逐步建立并投入使用,檢驗(yàn)報(bào)告的數(shù)據(jù)質(zhì)量及存儲(chǔ)能力大幅提高,使得可利用數(shù)據(jù)量增多[17]。
統(tǒng)計(jì)設(shè)備缺陷類型及比例,共得到管路及管件缺陷、爆破片安全裝置缺陷、氣瓶固定裝置缺陷等19種缺陷,如圖4所示。數(shù)據(jù)涵蓋了主要的長管拖車缺陷問題,且前3種缺陷的數(shù)量占總數(shù)的54%,與實(shí)際情況相符[18]??梢哉J(rèn)為,本文涉及的長管拖車數(shù)據(jù)與實(shí)際情況基本相符,具有進(jìn)一步數(shù)據(jù)挖掘與分析價(jià)值。
圖3 檢查時(shí)間分布情況Fig.3 Distribution of check time
圖4 缺陷類型及比例Fig.4 Defect type and proportion
應(yīng)用Python對(duì)數(shù)據(jù)挖掘算法進(jìn)行編碼。設(shè)頻度閾值為10,即若因素出現(xiàn)次數(shù)大于10,則被劃分為頻繁1項(xiàng)集。頻繁1項(xiàng)集的最小支持度為該項(xiàng)出現(xiàn)頻率的20%,如管路及管件缺陷頻度為213,則該項(xiàng)的最小支持度為42。另外,設(shè)最小置信度為70%,最小Kulc為50%,最大IR為50%。運(yùn)算得到關(guān)聯(lián)規(guī)則4 131條,刪除冗余規(guī)則2 455條,占總規(guī)則數(shù)的59.4%,剩余1 676條關(guān)聯(lián)規(guī)則被劃分74個(gè)社區(qū),如表1所示。
關(guān)聯(lián)規(guī)則分析應(yīng)以滿足用戶需求為目的,因此,在進(jìn)行特種設(shè)備宏觀安全風(fēng)險(xiǎn)預(yù)警過程中,應(yīng)從政府監(jiān)管部門、制造企業(yè)、檢驗(yàn)機(jī)構(gòu)、使用單位4個(gè)角度進(jìn)行規(guī)則分析挖掘:
1)缺陷信息與使用地區(qū)間的規(guī)則,如規(guī)則1表示氣瓶壁薄缺陷多出現(xiàn)在04地區(qū)的長管拖車中,用于預(yù)警某地地區(qū)的某類缺陷可能存在的風(fēng)險(xiǎn)較大,指導(dǎo)政府監(jiān)管部門調(diào)整監(jiān)管策略、提高監(jiān)管針對(duì)性。
表1 關(guān)聯(lián)規(guī)則及社區(qū)Table 1 Association rules and communities
2)缺陷信息與制造企業(yè)間的規(guī)則,如規(guī)則2表示制造單位01制造的設(shè)備多出現(xiàn)氣瓶固定裝置缺陷問題,用于指導(dǎo)制造企業(yè)優(yōu)化生產(chǎn)工藝,提升設(shè)備可靠性。
3)缺陷信息與檢驗(yàn)人員、設(shè)備類型間的規(guī)則,如規(guī)則3表示檢驗(yàn)員11可以高效利用硬度檢測(cè)技術(shù)檢測(cè)硬度異常問題,用于檢驗(yàn)機(jī)構(gòu)優(yōu)化人員培養(yǎng)、調(diào)整檢驗(yàn)方法,提高檢驗(yàn)效率。
4)缺陷信息與使用單位間的規(guī)則,規(guī)則4表示使用單位08多出現(xiàn)氣瓶固定裝置缺陷問題,用于指導(dǎo)企業(yè)發(fā)現(xiàn)缺陷產(chǎn)生原因,優(yōu)化設(shè)備使用操作規(guī)程、明確維修保養(yǎng)重點(diǎn)。
關(guān)聯(lián)規(guī)則數(shù)量眾多,因素間往往存在緊密關(guān)聯(lián)關(guān)系,如表1規(guī)則3與規(guī)則5中,硬度檢測(cè)、硬度高于標(biāo)準(zhǔn)值、氣瓶硬度異常缺陷、不允許使用等因素往往同時(shí)存在。為了便于發(fā)現(xiàn)因素間的有用現(xiàn)象,指導(dǎo)分析決策,對(duì)上述1 676條關(guān)聯(lián)規(guī)則進(jìn)行可視化處理,如圖5所示。
圖5 關(guān)聯(lián)規(guī)則可視化Fig.5 Visualization of association rules
分析圖5發(fā)現(xiàn),因素間呈明顯的聚集現(xiàn)象,形成若干緊湊的社區(qū)。由各社區(qū)核心因素的標(biāo)簽可以看出,相同缺陷類型或企業(yè)類型涉及的因素關(guān)系較為緊密,不同社區(qū)間節(jié)點(diǎn)相對(duì)獨(dú)立;如:氣瓶硬度異常、使用單位03等社區(qū)節(jié)點(diǎn)數(shù)量多、連線密集,氣瓶鼓包、氣瓶腐蝕等社區(qū)間卻幾乎沒有連線。因此,只要合理控制各自社區(qū)中連線較多的關(guān)鍵因素節(jié)點(diǎn),就可以大幅降低社區(qū)規(guī)模,達(dá)到宏觀風(fēng)險(xiǎn)預(yù)控的目的。
為發(fā)現(xiàn)社區(qū)內(nèi)部因素間的關(guān)系,需對(duì)各個(gè)社區(qū)進(jìn)行逐一分析,以使用單位03社區(qū)為例進(jìn)行說明,如圖6所示。圖中x軸為關(guān)聯(lián)規(guī)則的前項(xiàng),y軸為規(guī)則后項(xiàng),第2行第3列的節(jié)點(diǎn)表示使用地區(qū)08等8項(xiàng)因素存在的條件下,會(huì)出現(xiàn)硬度超出標(biāo)準(zhǔn)值等14項(xiàng)因素,有70條規(guī)則與該類因素有關(guān)。點(diǎn)的大小代表該類規(guī)則出現(xiàn)的頻度,點(diǎn)越大表示該類規(guī)則出現(xiàn)頻度高;點(diǎn)的顏色表示規(guī)則的置信水平,顏色越深置信度越高。
具體分析如下:
1){使用地區(qū)08→硬度超出標(biāo)準(zhǔn)值}、{使用地區(qū)08→氣瓶硬度異常缺陷}、{硬度超出標(biāo)準(zhǔn)值→使用地區(qū)08 }、{氣瓶硬度異常缺陷→使用地區(qū)08 }同時(shí)出現(xiàn),且3項(xiàng)因素互為條件的現(xiàn)象,說明3項(xiàng)因素間的關(guān)系十分緊密。因此,可以認(rèn)為使用地區(qū)08的氣瓶硬度異常問題具有較高風(fēng)險(xiǎn),應(yīng)進(jìn)行針對(duì)性檢驗(yàn)與管理。
2){制造單位03→硬度超出標(biāo)準(zhǔn)值}、{制造單位03→氣瓶硬度異常缺陷}說明該單位制造的設(shè)備存在該類缺陷的可能性較大。但由于相應(yīng)節(jié)點(diǎn)顏色較淺、置信度較低,關(guān)聯(lián)度相對(duì)較弱,因此不能確定是否存在必然聯(lián)系,制造單位應(yīng)認(rèn)真進(jìn)行工藝安全分析,降低風(fēng)險(xiǎn)。
3)檢驗(yàn)員03,08,10,11均檢測(cè)出氣瓶硬度異常缺陷,其中檢驗(yàn)員11對(duì)應(yīng)的規(guī)則置信度與頻度較高,說明該檢驗(yàn)人員對(duì)該類異常問題的檢驗(yàn)較為高效,應(yīng)分析其檢驗(yàn)方式方法,并予以推廣。
4)使用單位03出現(xiàn)氣瓶硬度異常缺陷問題的概率較高,該單位應(yīng)查詢分析缺陷設(shè)備的制造單位,減少該單位設(shè)備的使用率,提升設(shè)備安全水平。
圖6 社區(qū)可視化Fig.6 Visualization of community
1)應(yīng)用并優(yōu)化關(guān)聯(lián)規(guī)則挖掘、社區(qū)發(fā)現(xiàn)、可視化等數(shù)據(jù)挖掘技術(shù),構(gòu)建1種宏觀安全風(fēng)險(xiǎn)預(yù)警方法,以特種設(shè)備安全監(jiān)督檢驗(yàn)大數(shù)據(jù)為基礎(chǔ),通過挖掘單臺(tái)設(shè)備微觀因素間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)整類特種設(shè)備宏觀安全風(fēng)險(xiǎn)的識(shí)別與預(yù)警。
2)以2008—2016年全國長管拖車檢驗(yàn)數(shù)據(jù)為例進(jìn)行應(yīng)用實(shí)踐分析,研究結(jié)果表明,該方法可以對(duì)區(qū)域范圍、缺陷類別等多種宏觀指標(biāo)進(jìn)行預(yù)警,指導(dǎo)針對(duì)性監(jiān)管與檢驗(yàn)。
3)本文提出的方法以安全生產(chǎn)監(jiān)管大數(shù)據(jù)為運(yùn)行基礎(chǔ),對(duì)于信息化水平較低、歷史數(shù)據(jù)較少的機(jī)構(gòu)單位,數(shù)據(jù)挖掘效果可能不佳,而如何增強(qiáng)對(duì)稀疏數(shù)據(jù)的挖掘能力將是下一步研究方向。
[1] 江書軍.基于動(dòng)態(tài)博弈的特種設(shè)備安全投入監(jiān)管策略研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2014,10(S1):59-64.
JIANG Shujun. Study on supervision strategies for safety investment of special equipment based on dynamic game theory [J].Journal of Safety Science and Technology, 2014, 10(S1): 59-64.
[2] 王新浩,羅云,何義,等.特種設(shè)備政府安監(jiān)職能轉(zhuǎn)變風(fēng)險(xiǎn)預(yù)警及控制決策方法研究[J].中國安全科學(xué)學(xué)報(bào),2014,24(12):103-109.
WANG Xinhao, LUO Yun,HE Yi,et al.Research on method of risk pre-warning and control decision when transferring function of government safety supervision of special equipment[J]. China Safety Science Journal, 2014,24(12):103-109.
[3] 崔慶玲,羅云,崔剛,等.基于灰色理論的特種設(shè)備安全事故預(yù)測(cè)研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2013,9(5):141-144.
CUI Qingling,LUO Yun,CUI Gang,et al.Study on prediction of special equipment accident based on grey theory [J].Journal of Safety Science and Technology, 2013, 9(5):141-144.
[4] 崔文,羅云,曾珠,等.機(jī)電類特種設(shè)備典型事故風(fēng)險(xiǎn)分級(jí)預(yù)警預(yù)控方法研究[J].工業(yè)安全與環(huán)保,2014,40(5):59-62,4.
CUI Wen, LUO Yun,ZENG Zhu,et al. The study of ranking methods of the typical accidents risks of machinery & electronic special equipment for early-warning and pre-controlling [J]. Industrial Safety and Environment Protection, 2014, 40(5):59-62,4.
[5] 楊景標(biāo),鄭炯,李緒豐,等.承壓類特種設(shè)備系統(tǒng)性風(fēng)險(xiǎn)研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2012,8(8):41-46.
YANG Jingbiao,ZHENG Jiong,LI Xufeng,et al.Investigation on the failure consequence weighting model in risk assessment for pressure equipment [J]. Journal of Safety Science and Technology, 2012,8(8):41-46.
[6] 陳學(xué)東,艾志斌,楊鐵成,等.基于風(fēng)險(xiǎn)的檢測(cè)(RBI)中以剩余壽命為基準(zhǔn)的失效概率評(píng)價(jià)方法[J].壓力容器,2006(5):1-5.
CHEN Xuedong,AI Zhibin,YANG Tiecheng,et al.Assessment method of failure probability with residual life as reference in risk-based inspection (RBI)[J].Pressure Vessel Technology, 2006(5):1-5.
[7] 門智峰,張彥朝.特種設(shè)備的風(fēng)險(xiǎn)評(píng)估技術(shù)[J].中國安全生產(chǎn)科學(xué)技術(shù),2006,2(1):92-94.
MEN Zhifeng,ZHANG Yanchao. Risk assessment of special equipment [J].Journal of Safety Science and Technology, 2006,2(1):92-94.
[8] 王冠韜,羅斯達(dá),羅云,等.基于功效系數(shù)法的特種設(shè)備宏觀安全風(fēng)險(xiǎn)評(píng)價(jià)模型[J].中國安全生產(chǎn)科學(xué)技術(shù),2016,12(9):146-151.
WANG Guantao,LUO Sida,LUO Yun,et al. Assessment model of macro safety risk for special equipment based on efficacy coefficient method [J].Journal of Safety Science and Technology, 2016,12(9):146-151.
[9] 歐陽秋梅,吳超.安全生產(chǎn)大數(shù)據(jù)的5W2H采集法及其模式研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2016,12(12):22-27.
OUYANG Qiumei, WU Chao. Research on 5W2H acquisition method and mode of big data for work safety[J]. Journal of Safety Science and Technology, 2016, 12(12):22-27.
[10] 張長魯.煤礦事故隱患大數(shù)據(jù)處理與知識(shí)發(fā)現(xiàn)分析方法研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2016,12(9):176-181.
ZHANG Changlu.Study on big data processing and knowledge discovery analysis method for safety hazard in coal mining [J]. Journal of Safety Science and Technology, 2016, 12(9):176-181.
[11] HAN J,KAMBER M,PEI J.Data mining concepts and techniques (Third Edition) [M]. Waltham: Morgan Kaufmann Publishers, 2012: 243-248.
[12] 馬明煥,王新浩,許曉輝,等.基于數(shù)據(jù)挖掘技術(shù)的事故隱患預(yù)警方法研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2017,13(7):11-17.
MA Minghuan,WANG Xinhao,XU Xiaohui,et al.Research on the method of hidden danger early warning based on data mining [J]. 2017, 13(7):11-17.
[13] 王新浩,秦緒華,羅云.基于垂直數(shù)據(jù)格式的企業(yè)隱患預(yù)警方法研究[J].中國安全科學(xué)學(xué)報(bào),2017,27(2):157-162.
WANG Xinhao, QIN Xuhua, LUO Yun,et al. Research on vertical data format based method for enterprise hidden trouble early warning [J]. China Safety Science Journal,2017,27(2):157-162.
[14] ZAKI M J. Scalable Algorithms for Association Mining[J]. IEEE Trans.knowl.data Eng, 2000, 12(3):372-390.
[15] 程學(xué)旗,沈華偉.復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2011,8(1):57-70.
CHENG Xueqi,SHEN Huawei. Community structure of complex networks[J]. Complex Systems And Complexity Science, 2011, 8(1):57-70.
[16] BLONDEL V D, GUILLAUME J L, LAMBIOTTE R A. Fast unfolding of communities in large networks[J]. Journal of Statistical Mechanics-Theory and Experiment, 2008(10): 155-168.
[17] 董紅磊,李邦憲,薄柯,等.我國長管拖車安全技術(shù)發(fā)展綜述[J].中國特種設(shè)備安全,2014,30(8):1-5.
DONG Honglei, LI Bangxian,BO Ke,et al. Review of the development of tube trailer cylinder on safety technology [J].China Special Equipment Safety, 2014, 30(8):1-5.
[18] 駱輝,薄柯,李邦憲,等.高純氣體長管拖車結(jié)構(gòu)特點(diǎn)及定期檢驗(yàn)問題[J].中國特種設(shè)備安全,2016,32(3):35-39.
LUO Hui, BO Ke,LI Bangxian,et al. Structure features and periodic inspection problem of high purity gases tube trailer [J].China Special Equipment Safety, 2016, 32(3):35-39.