陳 震,陸 松,李國輝,張和平
(1.合肥市公安消防支隊(duì),合肥,230000;2.中國科學(xué)技術(shù)大學(xué)火災(zāi)科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,合肥,230026)
在統(tǒng)計(jì)學(xué)中,一般將概率分布中描述低概率事件的區(qū)間稱為尾部,該區(qū)間的分布曲線形態(tài)上像動(dòng)物的尾巴。根據(jù)文獻(xiàn)和統(tǒng)計(jì)數(shù)據(jù)[1-7],隨著人們物質(zhì)生活水平的提高,單起火災(zāi)的直接經(jīng)濟(jì)損失有增大的趨勢。火災(zāi)經(jīng)濟(jì)損失的尾部分布描述了損失較高的火災(zāi)情況。通過研究尾部分布,可以分析損失較高的極端火災(zāi)的風(fēng)險(xiǎn),為火災(zāi)防治工作提供理論依據(jù),受到了研究人員的重視。
目前對經(jīng)濟(jì)損失尾部分布的研究主要關(guān)注于冪律分布。宋衛(wèi)國等人[8]提出中國城市火災(zāi)的頻率-直接經(jīng)濟(jì)損失分布服從冪律(Power-law)分布,王靜虹等人[9]通過對合肥市火災(zāi)經(jīng)濟(jì)損失的分析,認(rèn)為合肥市火災(zāi)的頻率-經(jīng)濟(jì)損失分布也滿足冪律關(guān)系。王建[10]對城市火災(zāi)的“頻率-損失”分布開展了系統(tǒng)的研究,發(fā)現(xiàn)中日兩國的城市火災(zāi)經(jīng)濟(jì)損失也滿足“頻率-損失”冪律分布。在以上研究中,火災(zāi)經(jīng)濟(jì)損失分布的尾部分布可以用冪律關(guān)系來描述。陸松等人[11]發(fā)現(xiàn)對于死亡人數(shù)不低于3人的火災(zāi),在經(jīng)濟(jì)損失不大于50萬元時(shí),“頻率-損失”滿足冪律分布,但對于經(jīng)濟(jì)損失超過50萬元的火災(zāi),“頻率-損失”的冪律關(guān)系變得不明顯,經(jīng)濟(jì)損失的尾部分布將不能采用冪律關(guān)系描述。
綜合分析以上研究工作,可以提出如下問題:(1)在上述工作中[8-11],對數(shù)據(jù)只使用了冪律關(guān)系來擬合,是否存在其他分布能夠從統(tǒng)計(jì)學(xué)上更好地描述火災(zāi)經(jīng)濟(jì)損失的尾部分布未有涉及。(2)Clauset等人[12]指出,通過在雙對數(shù)坐標(biāo)下對“頻率-尺度”進(jìn)行最小二乘法擬合,根據(jù)擬合曲線是否為直線來判斷數(shù)據(jù)是否滿足冪律分布是不精確的。而文獻(xiàn)[8-11]所述的工作,都是通過最小二乘法擬合來判斷是否存在冪律分布。Clauset等人[12]提出了利用最大似然估計(jì)的方法來確定冪律關(guān)系,并得到了廣泛的應(yīng)用。如果使用Clauset等人提出的方法,火災(zāi)經(jīng)濟(jì)損失是否滿足冪律關(guān)系?
為了回答上述問題,將開展如下的工作。第1節(jié)將介紹使用的數(shù)據(jù);第2節(jié)簡述確定冪律關(guān)系的方法,以及擬合將使用到的4種供選分布(對數(shù)正態(tài)分布,指數(shù)分布,廣延指數(shù)分布和指數(shù)截?cái)鄡缏煞植迹?;?節(jié)將對安徽省火災(zāi)經(jīng)濟(jì)損失、按火災(zāi)原因進(jìn)行分類的經(jīng)濟(jì)損失數(shù)據(jù)進(jìn)行冪律分布和其他4種分布的擬合,并分析擬合的結(jié)果;第4節(jié)將對全文進(jìn)行總結(jié)。
本文將使用2007至2012年由安徽省公安消防部隊(duì)統(tǒng)計(jì)的火災(zāi)數(shù)據(jù)。在中國,除了森林、草原、地下礦井和軍隊(duì)的火災(zāi)以外,其余火災(zāi)都由公安消防部隊(duì)進(jìn)行統(tǒng)計(jì)和匯編。安徽省五年間共發(fā)生火災(zāi)34643起。本文主要使用火災(zāi)統(tǒng)計(jì)數(shù)據(jù)中的經(jīng)濟(jì)損失數(shù)據(jù)。
本文采用冪律分布、對數(shù)正態(tài)、指數(shù)、廣延指數(shù)和指數(shù)截?cái)鄡缏傻?種分布對火災(zāi)經(jīng)濟(jì)損失數(shù)據(jù)進(jìn)行擬合,下面分別簡介[12,13]:
(1)冪律分布(Power-law distribution)
本文研究的火災(zāi)經(jīng)濟(jì)損失可以認(rèn)為是連續(xù)變量,因此將只介紹各分布的連續(xù)變量形式。設(shè)x為我們分布的變量。連續(xù)的冪律分布可以通過如下的概率密度函數(shù)來表示:
(2)對數(shù)正態(tài)分布(log-normal distribution)
如果一個(gè)隨機(jī)變量的對數(shù)服從正態(tài)分布,就稱該隨機(jī)變量服從對數(shù)正態(tài)分布。如果X是服從正態(tài)分布的隨機(jī)變量,則Y=exp(X)服從對數(shù)正態(tài)分布;反之,如果Y服從對數(shù)正態(tài)分布,則X=log(Y)服從正態(tài)分布。對數(shù)正態(tài)分布的概率密度函數(shù)為:
(3)指數(shù)分布
指數(shù)分布相對較為常見,用于描述泊松過程的時(shí)間間隔,泊松過程中的事件以恒定速率連續(xù)且獨(dú)立發(fā)生。指數(shù)分布的概率密度函數(shù)是:
其中λ>0,λ被常稱為率參數(shù)(rate parameter),可以表示泊松過程的到達(dá)率。
(4)廣延指數(shù)分布(stretched exponential distribution)
廣延指數(shù)分布的概率密度函數(shù)是:
其中λ>0是比例參數(shù)(scale parameter);β>0是形狀參數(shù)(shape parameter)。β的值一般都小于等于1。當(dāng)β=1時(shí),廣延指數(shù)分布為指數(shù)分布;當(dāng)β<1時(shí)廣延指數(shù)分布可以認(rèn)為是冪律分布和指數(shù)分布的混合,β的值越小越接近冪律分布,即在雙對數(shù)坐標(biāo)下呈現(xiàn)線性趨勢。
(5)指數(shù)截?cái)鄡缏煞植迹╬ower-law with exponential cutoff)
指數(shù)截?cái)鄡缏煞植伎梢哉J(rèn)為是冪律分布的一種重要變形,其概率密度函數(shù)即為冪律項(xiàng)和指數(shù)項(xiàng)的乘積:
指數(shù)截?cái)鄡缏煞植贾械闹笖?shù)截?cái)囗?xiàng)會(huì)在分布尾部超越冪律行為,占據(jù)主導(dǎo)作用。這樣的分布不是冪律的近似,而是在尾部之前的有限區(qū)域內(nèi)存在近似的標(biāo)度行為。
模型的確定過程涉及到大量的統(tǒng)計(jì)分析的細(xì)節(jié)問題,詳細(xì)過程請參見Clauset等人[12]的詳細(xì)介紹。在此將簡述模型分析的過程:
(1)首先確定參數(shù)xmin和冪律分布的參數(shù)α,使用的方法分別為Kolmogorov-Smirnov統(tǒng)計(jì)和最大似然估計(jì)(Maximum likelihood estimators)。
(2)通過 Kolmogorov-Smirnov統(tǒng)計(jì)計(jì)算得到冪律分布的擬合優(yōu)度。如果p值大于0.1,則冪律分布是個(gè)可信的假設(shè);否則將拒絕冪律分布的假設(shè)。
(3)通過似然比檢驗(yàn)(Likelihood ratio test)比較冪律分布與其他4種供選分布。對每種供選分布,如果似然比顯著不為零,則通過似然比的符號可以判斷冪律分布與供選分布的優(yōu)劣。其中,似然比是否顯著不為零,可通過p值判斷。如果p≤0.1,則似然比顯著不為零。根據(jù)本文采用的計(jì)算方法,正的似然比表示冪律分布優(yōu)于供選分布,反之亦然。
本文對“經(jīng)濟(jì)損失大于x的火災(zāi)的概率”進(jìn)行冪律擬合,而不是直接擬合原始數(shù)據(jù)的頻率。根據(jù)文獻(xiàn)[14]的研究結(jié)果,直接擬合經(jīng)濟(jì)損失的頻率時(shí),會(huì)有一個(gè)數(shù)據(jù)離散化的過程,這個(gè)過程會(huì)引入誤差,造成冪律曲線的尾部出現(xiàn)噪聲。而對“經(jīng)濟(jì)損失大于x的火災(zāi)的概率”進(jìn)行擬合,不會(huì)出現(xiàn)上述問題。
對安徽2007至2012年全省火災(zāi)數(shù)據(jù)中每起火災(zāi)的經(jīng)濟(jì)損失數(shù)據(jù)進(jìn)行冪律分布擬合??梢缘玫絻缏煞植嫉南孪辺min=6.961萬元,冪律指數(shù)為2.002,擬合優(yōu)度的p值為0。因此冪律分布的假設(shè)被拒絕。這個(gè)結(jié)果在圖1中也得到了證實(shí)。如圖1,當(dāng)經(jīng)濟(jì)損失大于100萬元時(shí),冪律分布曲線嚴(yán)重偏離原始數(shù)據(jù)。
圖1 安徽省火災(zāi)經(jīng)濟(jì)損失分布的冪律分布擬合,冪律擬合曲線的起始點(diǎn)為經(jīng)濟(jì)損失6.69萬元??v軸表示發(fā)生經(jīng)濟(jì)損失大于x的火災(zāi)的概率Fig.1 Power-law distribution fitting for fire loss in Anhui province.the start point of power-law fitting curve is 66.9thousand Yuan.Y axis denotes the probability of fire with loss>x
對四個(gè)供選分布,也選擇xmin=6.961萬元作為下邊界,對數(shù)據(jù)進(jìn)行擬合。下面分析4個(gè)供選分布的擬合結(jié)果。表1給出了與冪律分布相比的供選分布的擬合結(jié)果??梢钥闯?,對4種供選分布,p值都小于0.1,即可以認(rèn)為似然比的值是顯著不等于0的。根據(jù)似然比的結(jié)果,只有指數(shù)分布比冪律分布更不適合該組數(shù)據(jù),而其他三種供選分布比冪律分布更為合適。對數(shù)正態(tài)分布、廣延指數(shù)分布和指數(shù)截?cái)鄡缏煞植嫉乃迫槐戎捣謩e為-2.66、-2.72和-11.35,表明正態(tài)分布和廣延指數(shù)優(yōu)于冪律分布,而指數(shù)截?cái)鄡缏煞植嫉臄M合效果最好。因此可以認(rèn)為在5種分布中,指數(shù)截?cái)鄡缏煞植甲钸m于描述安徽省火災(zāi)經(jīng)濟(jì)損失的尾部分布。
表1 與冪律分布相比較,4種供選分布的擬合結(jié)果Table 1 Fitting results of 4alternative distributions in comparison with power-law distribution
將五種分布對不低于xmin的數(shù)據(jù)的擬合結(jié)果繪制在一張圖上,可以更直觀地對比五種分布的擬合情況,如圖2所示??梢钥闯?,指數(shù)分布在整個(gè)區(qū)間上都偏離損失數(shù)據(jù)。冪律分布在經(jīng)濟(jì)損失約為100萬元時(shí)開始偏離損失數(shù)據(jù)。對數(shù)正態(tài)分布、廣延指數(shù)分布和指數(shù)截?cái)鄡缏煞植荚?00萬元時(shí)也開始明顯下降,偏離冪律分布,但擬合效果相對較好。對數(shù)正態(tài)分布、廣延指數(shù)分布和指數(shù)截?cái)鄡缏煞植嫉牟顒e在數(shù)據(jù)的末端才顯現(xiàn)出來,指數(shù)截?cái)鄡缏煞植枷陆档乃俾矢臁膱D2中還可看出,即使是指數(shù)截?cái)鄡缏煞植荚跀?shù)據(jù)的最末端也開始偏離原始數(shù)據(jù),但根據(jù)似然比的值,它依然是五種分布中最優(yōu)的。
省份火災(zāi)數(shù)據(jù)在經(jīng)濟(jì)損失較大時(shí)出現(xiàn)偏離冪律分布的現(xiàn)象是符合實(shí)際火災(zāi)規(guī)律的。如果火災(zāi)的尺度用經(jīng)濟(jì)損來衡量。那么隨著火災(zāi)尺度的增大,火災(zāi)發(fā)生的概率會(huì)低于冪律分布描述的概率。這是因?yàn)榇蟪叨鹊幕馂?zāi)會(huì)受到實(shí)際自然環(huán)境的限制,自然環(huán)境中沒有如此多的可燃物供一場火災(zāi)來燃燒,無法維持火災(zāi)尺度的標(biāo)度不變性,所以大尺度火災(zāi)的發(fā)生概率會(huì)下降。當(dāng)火災(zāi)尺度較小時(shí),環(huán)境中的可燃物足夠多,能夠維持火災(zāi)尺度的標(biāo)度不變性,表現(xiàn)出冪律分布的現(xiàn)象。
圖2 安徽省火災(zāi)經(jīng)濟(jì)損失數(shù)據(jù)尾部分布的擬合比較,尾部的起始點(diǎn)為經(jīng)濟(jì)損失6.69萬元。縱軸表示發(fā)生經(jīng)濟(jì)損失大于x的火災(zāi)的概率Fig.2 Comparison of tail distributions fitting for fire loss in Anhui province.the start point of power-law fitting curve is 66.9thousand Yuan.Y axis denotes the probability of fire with loss>x
火災(zāi)經(jīng)濟(jì)損失的尾部分布對實(shí)際火災(zāi)防治工作也有指導(dǎo)意義。在經(jīng)濟(jì)損失滿足冪律的階段,冪律標(biāo)度指數(shù)α應(yīng)當(dāng)較大,這樣隨著尺度的增加,火災(zāi)發(fā)生概率下降的越快。在高損失階段,應(yīng)當(dāng)使火災(zāi)盡早偏離冪律分布,呈現(xiàn)指數(shù)截?cái)?,進(jìn)而降低高損失火災(zāi)的發(fā)生概率。
表2給出了不同火災(zāi)原因下的火災(zāi)損失數(shù)據(jù)的尾部分布分析結(jié)果。根據(jù)冪律分布的p檢驗(yàn)結(jié)果,只有不明確原因、放火、靜電、生產(chǎn)作業(yè)引起的火災(zāi)可以認(rèn)為滿足冪律分布。在滿足冪律分布的基礎(chǔ)上對比其他4種分布,發(fā)現(xiàn)冪律分布對不明確原因和靜電引起的火災(zāi)的擬合效果最優(yōu)。而對放火和生產(chǎn)作業(yè)引起的火災(zāi),指數(shù)截?cái)鄡缏煞植嫉臄M合效果最優(yōu)。根據(jù)上述結(jié)果,對不明確原因、放火、靜電和生產(chǎn)作業(yè)等4種原因引起的火災(zāi)經(jīng)濟(jì)損失,可以通過對比分析尾部分布規(guī)律,研究他們的火災(zāi)風(fēng)險(xiǎn)。因?yàn)槭侵苯油ㄟ^概率分布進(jìn)行研究,結(jié)果將更加直觀和精確。
表2 火災(zāi)原因與火災(zāi)損失尾部分布Table 2 Fire causes and fire loss tail distribution
對其他7種火災(zāi)原因,根據(jù)冪律分布擬合優(yōu)度的p值≤0.1,可以認(rèn)為他們不滿足冪律分布。與4種供選分布比較,指數(shù)截?cái)鄡缏煞植几m合電氣、其他、生活用火不慎和自燃等4種原因;而對雷擊、玩火和吸煙,4種供選分布也無法提供更好的擬合效果。需要采用更多的供選分布,才能描述這些原因下火災(zāi)經(jīng)濟(jì)損失的尾部特點(diǎn)。
本文采用極大似然估計(jì)對安徽火災(zāi)經(jīng)濟(jì)損失進(jìn)行了冪律分布擬合,采用Kolmogorov-Smirnov統(tǒng)計(jì)判斷擬合優(yōu)度,并選擇了4種供選分布作為對比,研究經(jīng)濟(jì)損失數(shù)據(jù)的尾部分布。
對安徽全省火災(zāi)數(shù)據(jù),當(dāng)經(jīng)濟(jì)損失大于100萬元時(shí),數(shù)據(jù)明顯偏離冪律分布,通過p值可以拒絕數(shù)據(jù)服從冪律分布的假設(shè)。在5種分布中,指數(shù)截?cái)鄡缏煞植嫉臄M合效果最好,能夠描述數(shù)據(jù)末端偏離冪律行為的現(xiàn)象。指數(shù)正態(tài)分布和廣延指數(shù)分布一定程度上也能描述數(shù)據(jù)末端偏離冪律行為的現(xiàn)象。指數(shù)分布的擬合效果最差。
根據(jù)11種火災(zāi)原因?qū)馂?zāi)經(jīng)濟(jì)損失進(jìn)行分類,并進(jìn)行冪律分布與4種供選分布的擬合。對放火和生產(chǎn)作業(yè)兩類原因,不僅滿足冪律分布,而且指數(shù)截?cái)鄡缏煞植嫉臄M合效果最優(yōu);不明確原因和靜電兩類原因的火災(zāi)經(jīng)濟(jì)損失僅滿足冪律分布;其他7種火災(zāi)原因?qū)?yīng)的損失數(shù)據(jù)不能通過冪律分布擬合的p值檢驗(yàn)。
與前人對火災(zāi)尺度冪律分布的研究相比,本文采取冪律分布擬合,較直接進(jìn)行頻率直方圖最小二乘擬合更為精確,對是否滿足冪律分布采用p值進(jìn)行判斷。除冪律分布外,本文選擇4種常見的分布作為供選分布,一定程度上回答了“是否有其他分布更合適?”的問題。
[1]Guo TN,F(xiàn)u ZM.The fire situation and progress in fire safety science and technology in China[J].Fire Safety Journal,2007,42:171-182.
[2]公安部消防局.中國消防年鑒2006[M].北京:中國人事出版社,2006,277-355.
[3]公安部消防局.中國消防年鑒2007[M].北京:中國人事出版社,2007,409-476.
[4]公安部消防局.中國消防年鑒2008[M].北京:中國人事出版社,2008,489-517.
[5]公安部消防局.中國消防年鑒2009[M].北京:中國人事出版社,2009,207-241.
[6]公安部消防局.中國消防年鑒2010[M].北京:國際文化出版公司,2010,249-274.
[7]公安部消防局.中國消防年鑒2011[M].北京:國際文化出版公司,2011,215-240.
[8]Song WG,Zhang HP,Chen T,etc.Power-law distribution of city fires[J].Fire Safety Journal,2003,38:453-465.
[9]王靜虹,謝曙,孫金華.城市火災(zāi)自組織臨界性判斷即大火 災(zāi) 損 失 極 值 分 析 [J]. 科 學(xué) 通 報(bào),2010,55:2241-2246.
[10]王建.火災(zāi)系統(tǒng)時(shí)空分布規(guī)律及相關(guān)性分析[D].合肥:中國科學(xué)技術(shù)大學(xué),2009.
[11]Lu S,Liang CJ,Song WG,etc.Frequency-size distribution and time-scaling property of high-casualty fires in China:Analysis and comparison[J].Safety Science,2013,51:209-216.
[12]Clauset A,Shalizi CR,Newman MEJ.Power-law distributions in empirical data[J].SIAM Review,2009,51:661-703.
[13]Kelly D,Smith C.Bayesian inference for probabilistic risk assessment[M].London:Springer,2011.
[14]Newman MEJ.Power laws,Pareto distributions and Zipf’s law[J].Contemporary Physics,2005,46:323-351.