馮英華
(淮南聯(lián)合大學(xué)基礎(chǔ)部,安徽 淮南 232001)
Benford’s Law在煤礦安全數(shù)據(jù)真實(shí)性判定中的應(yīng)用和優(yōu)化研究
馮英華
(淮南聯(lián)合大學(xué)基礎(chǔ)部,安徽 淮南 232001)
首先闡述了對(duì)煤礦安全數(shù)據(jù)進(jìn)行真實(shí)性判定的重要性.然后,提出了基于Benford’s Law的煤礦安全數(shù)據(jù)真實(shí)性的判定方法,并通過(guò)對(duì)淮南地礦井安全數(shù)據(jù)的分析,證明了該方法的科學(xué)性和有效性.最后,對(duì)該方法進(jìn)行優(yōu)化,使得優(yōu)化后的方法在煤礦安全數(shù)據(jù)的真實(shí)性判定上,不僅區(qū)分度高而且運(yùn)算量小.
安全數(shù)據(jù);Benford’s Law;真實(shí)性;判定;優(yōu)化
煤礦的安全生產(chǎn)是整個(gè)安全生產(chǎn)體系中最為重要的一環(huán).雖然近年來(lái)煤礦特別重大安全生產(chǎn)事故發(fā)生數(shù)年年降低,但是煤礦安全總體形勢(shì)依舊嚴(yán)峻.對(duì)煤礦安全生產(chǎn)工作只能越抓越緊,不能有絲毫放松,要從管理手段、技術(shù)手段上多管齊下,對(duì)煤礦安全進(jìn)行綜合治理.在煤礦實(shí)際運(yùn)行中,由于各種利益的糾纏,為了滿足各級(jí)監(jiān)管的要求,礦井會(huì)對(duì)各項(xiàng)安全監(jiān)測(cè)數(shù)據(jù)進(jìn)行偽造和篡改[1].對(duì)各項(xiàng)安全監(jiān)測(cè)數(shù)據(jù)進(jìn)行偽造和篡改的行為,小則會(huì)影響監(jiān)管部門對(duì)煤礦安全生產(chǎn)形勢(shì)的判斷,大則會(huì)引發(fā)惡性安全生產(chǎn)事故.因此,如何確保煤礦各項(xiàng)安全數(shù)據(jù)監(jiān)測(cè)的真實(shí)性,及時(shí)發(fā)現(xiàn)安全監(jiān)測(cè)數(shù)據(jù)偽造和篡改行為,成為煤礦安全領(lǐng)域新的研究熱點(diǎn)[2].
1.1本福特定律概述
一般常理認(rèn)為,對(duì)一個(gè)包含大量數(shù)據(jù)的數(shù)據(jù)集而言,數(shù)字1-9出現(xiàn)在每個(gè)數(shù)據(jù)的第一位的概率應(yīng)該是大致相等的,但本福特定律(Benford’s Law)完全顛覆了這個(gè)想法[3].本福特統(tǒng)計(jì)發(fā)現(xiàn),在自然形成的數(shù)字中,1-9 出現(xiàn)在數(shù)字的第一位的概率是不相等的,其概率密度可由下面的式1給出[4]:
近年來(lái),本福特定律(Benford’s Law)開(kāi)始被大量應(yīng)用于數(shù)據(jù)異常點(diǎn)的發(fā)現(xiàn)、偽造數(shù)據(jù)的檢測(cè).既然一個(gè)“正常的”數(shù)應(yīng)該服從本福特定律,那么很自然地,對(duì)本福特定律的偏離就意味著某種不規(guī)則的現(xiàn)象,很可能是人為的造假[5].在財(cái)務(wù)分析工作和抽樣統(tǒng)計(jì)工作中本福特定律就對(duì)數(shù)據(jù)的真?zhèn)斡兄譁?zhǔn)確的判斷,比如因財(cái)務(wù)造假即將退市的萬(wàn)福生科、中科云網(wǎng),其財(cái)務(wù)收據(jù)分布就嚴(yán)重偏離的本福特定律.
1.2基于本福特定律的煤礦安全數(shù)據(jù)真實(shí)性判定應(yīng)用
同樣,我們可以把本福特定律應(yīng)用于對(duì)煤礦數(shù)據(jù)真實(shí)性的判定,通過(guò)統(tǒng)計(jì)大量煤礦安全系統(tǒng)采集的數(shù)據(jù),分析其1-9位的分布概率是否符合本福特定律.如果符合則可以判定其數(shù)據(jù)真實(shí);如果偏離較大,則證明其數(shù)據(jù)存在較大的造假可能[6].我們選取了淮南地區(qū)的A礦井和B礦井進(jìn)行對(duì)比,A礦井因?yàn)榘踩珕?wèn)題被匿名舉報(bào)過(guò),但是監(jiān)控?cái)?shù)據(jù)沒(méi)有出現(xiàn)異常,現(xiàn)場(chǎng)檢查時(shí)沒(méi)有發(fā)現(xiàn)問(wèn)題;B礦井是連續(xù)多年安全運(yùn)行的國(guó)有大型礦井.
基于本福特定律的礦井安全數(shù)據(jù)真實(shí)性判定方法如下:
(1)統(tǒng)計(jì)礦井監(jiān)控系統(tǒng)采集的瓦斯?jié)舛葦?shù)據(jù)和通風(fēng)量數(shù)據(jù);
(2)依次計(jì)算A礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1-9分布比例和礦井通風(fēng)量數(shù)據(jù)中首位為1-9的分布比例;
(3)依次計(jì)算B礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1-9分布比例和礦井通風(fēng)量數(shù)據(jù)中首位為1-9的分布比例;
(4)依次計(jì)算A礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1-9分布比例和礦井通風(fēng)量數(shù)據(jù)中首位為1-9的分布比例與本福特定律概率間的方差;
(5)依次計(jì)算B礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1-9分布比例和礦井通風(fēng)量數(shù)據(jù)中首位為1-9的分布比例與本福特定律概率間的方差;
(6)通過(guò)判定各項(xiàng)方差的大小,來(lái)綜合判定A、B礦井?dāng)?shù)據(jù)的真實(shí)性,公式表達(dá)如下面的式2所示.
A、B礦井的具體采集數(shù)據(jù)如下表1所示.
表1 礦井安全數(shù)據(jù)采集項(xiàng)目表
通過(guò)對(duì)A礦井和B礦井采集的大量數(shù)據(jù)進(jìn)行處理和統(tǒng)計(jì),具體統(tǒng)計(jì)數(shù)據(jù)如下表2-表5所示.
表2 A煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
表3 A煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
表4 B煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
表5 B煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
通過(guò)表2-表5數(shù)據(jù)分析可以發(fā)現(xiàn),A煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和本福特期望對(duì)比數(shù)據(jù)的方差為10.78,A煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)的方差為25.96;而B(niǎo)煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和本福特期望對(duì)比數(shù)據(jù)的方差為1.12,B煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)的方差為2.6.A煤礦兩項(xiàng)數(shù)據(jù)對(duì)比的方差明顯較大,而B(niǎo)煤礦兩項(xiàng)數(shù)據(jù)對(duì)比的方差則在置信區(qū)間內(nèi).
通過(guò)上述分析,我們可以初步判定,A煤礦的數(shù)據(jù)可信度較低,可能存在著數(shù)據(jù)造假的嫌疑.因此,在上報(bào)相關(guān)情況后,監(jiān)管部門重點(diǎn)對(duì)A煤礦進(jìn)行現(xiàn)場(chǎng)飛行檢查,檢查過(guò)程中確實(shí)發(fā)現(xiàn)A煤礦存在篡改瓦斯監(jiān)測(cè)數(shù)據(jù)和通風(fēng)量數(shù)據(jù)的違規(guī)行為.由此可見(jiàn),本福特定律對(duì)通過(guò)對(duì)煤礦安全數(shù)據(jù)統(tǒng)計(jì)規(guī)律的分析,可以對(duì)數(shù)據(jù)真實(shí)性做出較為準(zhǔn)確的判定,及時(shí)發(fā)現(xiàn)煤礦安全數(shù)據(jù)篡改和造假行為,從而有效維護(hù)煤礦的安全生產(chǎn)工作[7].
2.1傳統(tǒng)本福特定律判定方法的不足
在煤礦的安全數(shù)據(jù)真實(shí)性的判定中,如果用上文中對(duì)2項(xiàng)數(shù)據(jù)的1-9位數(shù)字的記錄值和期望值進(jìn)行對(duì)比計(jì)算,然后計(jì)算其方差的方法來(lái)判定,存在兩個(gè)主要問(wèn)題;(1)1-9位數(shù)字中,第1位數(shù)字所占權(quán)重大,對(duì)數(shù)據(jù)真實(shí)性影響也最大,而把1-9位數(shù)據(jù)都進(jìn)行計(jì)算雖然增加了計(jì)算量,但不會(huì)增加分析結(jié)果的準(zhǔn)確性,還會(huì)造成不必要的擾動(dòng)[8].(2)對(duì)比分析數(shù)據(jù)只有2項(xiàng),數(shù)據(jù)綜合性太強(qiáng),沒(méi)有把體現(xiàn) “大數(shù)據(jù)”的細(xì)分特性,也不能通過(guò)數(shù)據(jù)細(xì)分來(lái)發(fā)現(xiàn)問(wèn)題[9].
因此,需要對(duì)傳統(tǒng)的本福特定律判定方法進(jìn)行適當(dāng)?shù)膬?yōu)化,從而提高其在煤礦安全數(shù)據(jù)真行判定中的可信度.
2.2本福特定律的優(yōu)化
本著簡(jiǎn)化計(jì)算、細(xì)化統(tǒng)計(jì)的原則,我們從新設(shè)計(jì)了判定方法.優(yōu)化型本福特定律的礦井安全數(shù)據(jù)真實(shí)性判定方法如下:
(1)按1月-6月把A、B礦井的瓦斯?jié)舛葦?shù)據(jù)和通風(fēng)量數(shù)據(jù)進(jìn)行分組;
(2)分別計(jì)算按1月-6月分組A礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1分布比例、礦井通風(fēng)量數(shù)據(jù)中首位為1的分布比例;
(3)分別計(jì)算按1月-6月分組B礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1分布比例、礦井通風(fēng)量數(shù)據(jù)中首位為1的分布比例;
(4)分別計(jì)算按1月-6月分組A礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1分布比例、礦井通風(fēng)量數(shù)據(jù)中首位為1的分布比例與本福特定律概率間的方差;
(5)分別計(jì)算按1月-6月分組B礦井瓦斯?jié)舛葦?shù)據(jù)中首位為1分布比例、礦井通風(fēng)量數(shù)據(jù)中首位為1的分布比例與本福特定律概率間的方差;
(6)通過(guò)判定各項(xiàng)方差的大小,來(lái)綜合判定A、B礦井?dāng)?shù)據(jù)的真實(shí)性,公式表達(dá)如下面的式3所示.
具體數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果如表6-表9所示.
表6 按月統(tǒng)計(jì)A煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
表7 按月統(tǒng)計(jì)A煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
表8 按月統(tǒng)計(jì)B煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
表9 按月統(tǒng)計(jì)B煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)表
通過(guò)上表可以發(fā)現(xiàn),本著簡(jiǎn)化計(jì)算、細(xì)化統(tǒng)計(jì)的原則,數(shù)據(jù)得到了簡(jiǎn)化,數(shù)據(jù)運(yùn)算量也同時(shí)降低.通過(guò)數(shù)據(jù)分析結(jié)果可發(fā)現(xiàn),用傳統(tǒng)的本福特定律A煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比方差為10.78,A煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比方差為25.96,B煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比方差為1.12,B煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比方差為2.6;用優(yōu)化型本福特定律A煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比方差為20.19,A煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)對(duì)比方差為48.5,B煤礦瓦斯?jié)舛冉y(tǒng)計(jì)和期望對(duì)比方差為0.47,B煤礦通風(fēng)量統(tǒng)計(jì)和期望對(duì)比數(shù)據(jù)對(duì)比方差為1.2.可見(jiàn),對(duì)于造假數(shù)據(jù),優(yōu)化型本福特定律放大了方差,提高了辨識(shí)度和區(qū)分度,而對(duì)于沒(méi)有造假的數(shù)據(jù)優(yōu)化型本福特定律使得方差進(jìn)一步收斂[10].
圖1 傳統(tǒng)本福特定律和優(yōu)化型本福特定律參與計(jì)算數(shù)據(jù)量對(duì)比圖
圖2 傳統(tǒng)本福特定律和優(yōu)化型本福特定律對(duì)非真實(shí)性數(shù)據(jù)敏感性對(duì)比圖
此外,本福特定律的礦井安全數(shù)據(jù)真實(shí)性判定方法需要參與最終方差運(yùn)算,即n2運(yùn)算的數(shù)據(jù)量為:A礦井的瓦斯?jié)舛葦?shù)據(jù)3000000個(gè)、通風(fēng)量數(shù)據(jù)6000000個(gè),B礦井的瓦斯?jié)舛葦?shù)據(jù)4000000個(gè)、通風(fēng)量數(shù)據(jù)6400000個(gè),共計(jì)19400000個(gè)數(shù)據(jù).優(yōu)化型本福特定律的礦井安全數(shù)據(jù)真實(shí)性判定方法需要參與計(jì)算的數(shù)據(jù)為A礦井的瓦斯?jié)舛葦?shù)據(jù)843000個(gè)、通風(fēng)量數(shù)據(jù)2046000個(gè),B礦井的瓦斯?jié)舛葦?shù)據(jù)1196000個(gè)、通風(fēng)量數(shù)據(jù)1990400個(gè),共計(jì)6075400個(gè)數(shù)據(jù).可見(jiàn),優(yōu)化型本福特定律的礦井安全數(shù)據(jù)真實(shí)性判定方法需要參與計(jì)算數(shù)量明顯減少.因此,優(yōu)化型本福特定律在煤礦安全數(shù)據(jù)的真實(shí)性判定上區(qū)分度高、運(yùn)算量少,具有較為明顯的優(yōu)勢(shì).
由于煤礦安全監(jiān)測(cè)數(shù)據(jù)具有數(shù)據(jù)專業(yè)性強(qiáng)、數(shù)據(jù)數(shù)量大、數(shù)據(jù)變化快的特點(diǎn),而煤礦的監(jiān)管機(jī)構(gòu)主要從事宏觀監(jiān)管,對(duì)礦井采集數(shù)據(jù)的真實(shí)性、可信度難以從煤礦安全技術(shù)的層面進(jìn)行判定[11].而本福特定律對(duì)數(shù)據(jù)的分析恰好可以擺脫數(shù)據(jù)代表的物理含義,只是從數(shù)字本身的統(tǒng)計(jì)規(guī)律出發(fā),對(duì)數(shù)據(jù)的真實(shí)性和可信度進(jìn)行判定,這樣就有利于監(jiān)管機(jī)構(gòu)的宏觀監(jiān)管,是一種有效的數(shù)據(jù)真實(shí)性判定方法.此外,優(yōu)化的本福特定律,在煤礦安全數(shù)據(jù)的真實(shí)性判定上不僅區(qū)分度高而且運(yùn)算量少,具有較為明顯的優(yōu)勢(shì).
[1]何葉榮,孟祥瑞,羅文科.基于耦合協(xié)調(diào)度的煤礦安全應(yīng)急管理評(píng)價(jià)[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù),2016,(8): 115-119.
[2]Wang J,Zhang L,Feng L. Coal mine accident emergency resource allocation based on dynamic game [J]. Safety in Coal Mines,2016,(1): 234-237.
[3]Benford F. The law of anomalous numbers[J]. Proceedings of the American Philosophical Society,1938,(4):551-572.
[4]Grendar M, Judge G, Schechter L. An empirical non-parametric likelihood family of data-based Benford-like distributions[J]. Statistical Mechanics and Its Applications,2012,(1):429-438.
[5]Stephens M A. Use of the Kolmogorov-Smirnov, Cramer-Von Mises and related statistics without extensive tables[J]. Journal of the Royal Statistical Society,1970,(1):115-122.
[6]Judge G, Schechter L. Detecting problems in survey data using Benford's Law [J]. Journal of Human Resources,2009,(1):1-24.
[7]商振,張虹.煤礦應(yīng)急救援能力評(píng)估指標(biāo)體系構(gòu)建研究[J].華北科技學(xué)院學(xué)報(bào),2016,(2):45-50.
[8]和富良,吳元鋒.煤礦安全預(yù)防科學(xué)決策法[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù), 1998,(4):22-23.
[9]栗繼祖.煤礦安全生產(chǎn)預(yù)防預(yù)警機(jī)制和應(yīng)急預(yù)案及其關(guān)鍵技術(shù)研究[J].太原理工大學(xué)學(xué)報(bào), 2009,(2):180-183.
[10]桑海泉. 煤礦安全監(jiān)控系統(tǒng)研究[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù), 2009,(6):184-188.
[11]王金鳳,張璐瑤,馮立杰,等.基于動(dòng)態(tài)博弈的煤礦突發(fā)事故應(yīng)急資源配置[J].煤礦安全,2016,(1): 234-237.
ApplicationandOptimizationResearchofCoalMineSafetyDataAuthenticityJudgmentBasedonBenford’sLaw
FENG Yinghua
(Department of Basic Courses, Huainan Union University, Huainan Anhui 232001, China)
Firstly, the importance of determining the authenticity of coal mine safety data is expounded. Then, the method of judging the authenticity of coal mine safety data based on Benford's Law is put forward, and the scientific and effectiveness of this method is proved by analyzing the safety data of geological and mining well in Huainan. Finally, the method is optimized so that the optimization method is not only high in indexing but also small in computation in the authenticity of coal mine safety data.
security data; Benford’s Law; authenticity; decision; optimization
TD7
A
1008-4681(2017)05-0033-05
2017-07-15
高校優(yōu)秀青年人才支持計(jì)劃重點(diǎn)項(xiàng)目(批準(zhǔn)號(hào):gxyqZD2016552);高校優(yōu)秀青年人才支持計(jì)劃重點(diǎn)項(xiàng)目(批準(zhǔn)號(hào):gxyqZD2016085).
馮英華(1979— ),女,黑龍江雞西人,淮南聯(lián)合大學(xué)基礎(chǔ)部副教授,碩士.研究方向:高等數(shù)學(xué)、數(shù)值邏輯.
(責(zé)任編校:晴川)
長(zhǎng)沙大學(xué)學(xué)報(bào)2017年5期