于曉虹,樓文高,洪贏政
( 1. 上海商學院 東方財富傳媒與管理學院,上海200235; 2. 上海商學院,上海200235 ;3. 公安部上海消防研究所,上海200438)
城市大型商場火災風險評價的投影尋蹤模型與應用*
于曉虹1,樓文高2,洪贏政3
( 1. 上海商學院 東方財富傳媒與管理學院,上海200235; 2. 上海商學院,上海200235 ;3. 公安部上海消防研究所,上海200438)
根據(jù)城市大型商場火災風險評價指標體系和5級風險評價標準,采用群搜索最優(yōu)化方法,建立了投影尋蹤分類模型,對15個待判定樣本進行綜合評價,得到了可靠、有效的評價結果。再應用基于信息熵權重的TOPSIS和灰色關聯(lián)法進行評價,結果與投影尋蹤模型分類結果一致。分析了現(xiàn)有的火災風險神經網絡評價模型文獻存在的主要問題。研究結果表明:投影尋蹤分類模型能很好地適用于城市大型商場火災風險的綜合評價與分類研究,數(shù)學意義清晰,后續(xù)應用方便。
火災;風險評價;投影尋蹤分類模型;城市大型商場;評價與分類;群搜索
隨著城鎮(zhèn)化加速發(fā)展和人民生活水平不斷提高,城市大型商場(包括酒店、賓館、地鐵等)越來越多,同時,火災發(fā)生數(shù)量、人員和財產損失也日益嚴重。因此,對城市大型商場火災風險進行可靠、有效的評估已成為學界和政府部門的熱點和難點問題。對火災風險開展評估研究,國外始于1970年代,國內始于20世紀末,已提出和采用多種綜合方法(模型)[1-3],還有物元可拓法(MEM)[4]、突變理論法(CT)[5]和支持向量機模型(SVM)。文獻[2-3, 6-16]把上述常規(guī)方法的計算結果作為神經網絡(NN)模型的訓練樣本,建立了各種組合NN模型。此外,還有GRA-集對分析[17]、主成分分析(PCA)-BPNN等組合模型[18]。上述常規(guī)方法都必須采用其他方法確定各個指標的權重,各種方法的合理性迄今也沒有定論,而這本身就是綜合評價要解決的核心問題之一。因此,如果權重不合理,其評價結果就難言合理了,基于這些結果建立NN模型的合理性就更難保證了。況且,建立NN模型還必須滿足二個基本條件[19-22]:①訓練樣本數(shù)量必須多于網絡連接權重個數(shù),一般要求3~5倍以上;②必須采用檢驗樣本實時監(jiān)控訓練過程以避免發(fā)生“過訓練”現(xiàn)象。令人遺憾的是,文獻[2-3,6-16]都不滿足上述條件,因此,建立的NN模型都不具有泛化能力和實用價值。文獻[1]針對具有區(qū)間評價標準的問題,通過在區(qū)間內隨機生成50個樣本的方法建立了回歸型PPC模型,取得了較好效果,但不適用于沒有區(qū)間評價標準的情況,樣本權重也很接近,有待進一步改進。因此,城市大型商場火災風險評估問題雖然進行了有益的探索性研究,但還遠沒有得到真正解決。
Friedman等提出的可用于高維、非線性、非正態(tài)分布數(shù)據(jù)建模的投影尋蹤分類(PPC)技術[23-25],在綜合評價領域獲得了廣泛應用。為此,本文在沒有區(qū)間評價標準的情況下,嘗試直接根據(jù)評價標準樣本建立PPC模型,取得了更合理和有效的結果,提供了一種新的大型商場火災風險評估方法。
不同學者往往根據(jù)已有經驗和學識建立不同的城市大型商場火災風險綜合評價指標體系??紤]到本文研究重點是比較不同評價(建模)方法的合理性和有效性,本文直接采用有較多數(shù)據(jù)和待評價樣本支撐的、由岳海玲[2]建立的評價指標體系,由19個指標和五級火災風險評價標準組成,待評價樣本(S1~S15)如表1所示。
Friedman等[23]提出了一種適用于非線性、高維和非正態(tài)分布數(shù)據(jù)處理的投影尋蹤分類(PPC)模型,把高維數(shù)據(jù)投影到感興趣的1~3維低維子空間上,通過分析低維子空間上的數(shù)據(jù)規(guī)律以達到揭示高維數(shù)據(jù)結構特征的目的。PPC建?;舅枷胧恰笆箻颖就队包c整體上盡可能分散,在局部上盡可能密集”,最有效一維模型的目標函數(shù)為[23-25]:
Q(a)=max(Sz×Dz);
(1)
一維PPC模型(1)的結果隨R值不同而改變。樓文高等[24]指出:R的合理取值范圍為rmax/5≤R≤rmax/3(rmax為ri,k的最大值)。由于(1)式為同時含有等式和不等式約束的高維非線性最優(yōu)化問題,有很多的局部最優(yōu)解,求解該問題十分困難。本文采用群搜索算法(簡稱GSO,計算原理見文獻[26])進行最優(yōu)化求解。
把很安全、安全、……、很不安全、S-max和S-min共7個樣本歸一化后的數(shù)據(jù)導入筆者編制的基于GSO的PPC程序,取R=rmax/5,得到真正的全局最優(yōu)解:最佳投影向量系數(shù)a1~19=(0.2425、-0.2406、-0.1766、0.2173、-0.2400、-0.2436、-0.2449、-0.2350、-0.2384、-0.2327、-0.2432、0.2275、-0.2176、-0.2274、-0.2312、0.2189、-0.2563、-0.2380、-0.1675),各樣本投影值z(1)~z(7)(-5.2517、-2.5145、0.2962、3.4391、6.4624、1.5539、-3.9856),Sz=4.2008,Dz=23.3822,Q(a)=98.2241,R=2.3428,rmax=11.7141。由前五個樣本的投影值意義可知,城市大型商場I~V級火災風險的模型輸出值分別為-5.2517、-2.5145、0.2962、3.4391和6.4624,其值越大表示火災風險越高,越不安全。待判定樣本(案例)的風險等級可以根據(jù)就近原則來判定。得到岳海玲[2]中15個待判定樣本S1~S15的PPC模型輸出值分別為-2.2948、-1.7998、-1.4694、-1.2191、-2.2088、-0.5362、-1.2945、-0.1157、-1.9241、-1.5303、-1.3323、-1.5701、-1.5912、-1.8125、-2.0641。待判定樣本S1~S15(圖1中用◇表示)、S-max和S-min(圖1中用Δ表示)的PPC模型值和I~V級火災風險評價標準樣本的模型值如圖1所示(直線I、II、III、IV和V分別表示I~V級評價標準樣本的模型值)。從圖1可以看出,所有待判定樣本的模型值均介于II和III級之間,其中S6和S8更接近于評價標準“較安全”水平(III級),其他樣本都更接近于“安全”水平(II級)。從樣本S-max、S-min的輸出值分別為1.5539(屬于III級風險)和-3.9856(屬于I級風險)可知,所有待判定樣本的火災風險不可能高于S-max的風險等級(III級),也不可能低于S-min的風險等級(I級)。15個待判定樣本火災風險大小排序為S8>S6>S4>S7>S11>S3>S10>S13>S12>S2>S14>S9>S15>S5>S1。
圖1 待判定樣本S1~S15(橫坐標1~15,圖中用◇表示)以及樣本S-max與S-min(橫坐標16、17,圖中用Δ表示)的輸出值和I~V級風險評價標準樣本的輸出值(圖中用直線I~V表示)
取R=rmax/3時,得到上述相似的結果,限于篇幅,不再列出(備索)。
表2 典型樣本S1、S6、S8和S11各個評價指標的火災風險等級
注:1、2、3、4和5分別表示該指標值屬于I、II、III、IV和V級風險水平,2~3表示該指標值處于II和III級的中值或很接近于中值,其他同。
PPC模型判定15個樣本的火災風險等級為:樣本S6和S8的火災風險為III級(較安全),但S8的火災風險大于S6,其他13個樣本的火災風險為“安全”(II級)。各個指標的最大權重與最小權重之比達到了1.53,說明指標之間的重要性有較大差異,比文獻[1]的結果更合理。在19個評價指標中,x17最重要,然后依次是x7、x6、x11、x1、x2、x5、x9、x18、x8、x10、x15、x12、x14、x16、x13、x4、x3和x19。
岳海玲[2]根據(jù)表1的5級評價標準,首先采用GRA對樣本S1~S14進行評價,其結果是I級風險樣本1個,II級風險樣本8個,III級風險樣本3個,IV級風險樣本2個和V級風險樣本1個。該結果又作為BPNN模型訓練樣本的期望值,沒有采用檢驗樣本進行實時監(jiān)控訓練過程以避免發(fā)生“過訓練”現(xiàn)象,建立了網絡結構為10-13-1的BPNN模型,但論文沒有說明是怎么從19個指標中篩選出10個評價指標的,而其訓練樣本的期望值卻是根據(jù)19個指標值計算得到的,這必定會出現(xiàn)誤差。作為典型分析案例,筆者列出了樣本S3、S6、S8和S11各個評價指標的風險等級,如表2所示。
樣本S3的19個指標中,分別有1個、12個、1個、3個和1個指標值屬于I、II、III、IV和V級風險,1個指標值處于I級與II級的中值,顯然,S3僅有一個指標值屬于V級風險,而岳海玲[2]卻把其判定為V級風險,顯然是不合理的。筆者與岳海玲[2]采用相同的GRA方法,得到S3與I、II、III、IV和V級標準樣本的關聯(lián)度分別為0.115、0.621、0.146、0.201和0.019,應判定其為II級風險,與大多數(shù)單個指標的風險等級是一致的,是合理的。樣本S8分別有1個、3個、8個、1個和1個指標值處于I、II、III、IV和V級風險,有4個指標值處于II級與III級的中值,1個指標值處于III級與IV級的中值。因此,S8與S3相比,火災風險應該更大,而岳海玲[2]卻把S8判定為III級,明顯低于S3的風險等級,顯然是錯誤的。對于樣本S11,分別有1個、10個、5個和1個指標值處于I、II、III和IV級風險,有2個指標值為II級與III級的中值,僅有1個指標值屬于I級風險,岳海玲[2]卻把S11判定為I級風險,顯然是不合理的,筆者計算得到S11與5級標準樣本的關聯(lián)度分別為0.117、0.522、0.319、0.034和0.011,S11顯然應該是II級風險。從各個指標值的風險等級來看,S11與S3應該基本相當,而岳海玲[2]卻把他們分別判定為I級和V級風險。本文PPC建模結果是:樣本S3、S6、S8和S11分別處于II級、III級、III級和II級風險,其中S8風險最大,S6次之,S3的風險最小,比較符合實際情況。
因此,岳海玲[2]采用GRA的評價結果存在明顯錯誤,以此作為BPNN模型訓練樣本的期望值,其結果必然也是錯誤的。而且,岳海玲[2]建立BPNN模型時,訓練樣本數(shù)量(14個)少于評價指標個數(shù)(19個),是不可能建立可靠的BPNN非線性模型的,也不可能有泛化能力和實用價值。
基于信息熵權重的TOPSIS法和GRA法的計算原理分別見文獻[27-28],本文僅給出計算結果。各指標的信息熵權重ω1~19=(0.0499、0.0519、0.0441、0.0647、0.0492、0.0499、0.0643、0.0499、0.0592、0.0596、0.0643、0.0499、0.0518、0.0489、0.0541、0.0461、0.0540、0.0499、0.0380),最大權重與最小權重之比與PPC模型的結果比較一致。求得15個待判定樣本與最優(yōu)方案(火災風險最小)的相對貼近度C1~15=(0.1496、0.1829、0.2251、0.2728、0.1349、0.3595、0.2388、0.4407、0.1776、0.2478、0.2614、0.2070、0.2211、0.1937、0.2132),S-max、S-min的相對貼近度分別為0.6578和0.0293,I~V級火災風險評價標準樣本的相對貼近度分別為0.0095、0.1236、0.4650、0.8887、1.0000。因此,可以判定所有樣本的風險等級:①S6和S8為III級風險,其他待判定樣本為II級風險;②樣本S-max和S-min分別為III級和I級風險;③15個待判定樣本的火災風險大小排序為S8>S6>S4>S11>S10>S7>S3>S13>S15>S12>S14>S2>S9>S1>S5,該結果與兩種PPC模型的排序結果基本一致,與岳海玲[2]的結果相差很大。
表3 所有待判定樣本、S-max和S-min與I、II、III、IV和V級火災風險標準樣本的關聯(lián)度
應用GRA法求得了15個待判定樣本與I、II、III、IV和V級風險的關聯(lián)度,如表3所示??梢耘卸颖維6和S8為III級風險,其他樣本為II級風險,樣本S-max 和S-min分別為III級和I級風險。因此,筆者采用GRA法的判定結果與PPC模型以及TOPSIS法的結果完全一致,與岳海玲[2]的結果相差很大。
采用NN模型進行火災風險評價的文獻如表4所示。如上所述,建立可靠的NN模型必須滿足上述二個基本條件,文獻[29]也明確指出:必須將樣本分成訓練樣本、檢驗樣本和測試樣本,訓練樣本數(shù)量應該達到網絡連接權重的10倍以上,用檢驗樣本實時監(jiān)控訓練過程,并在出現(xiàn)“過訓練”現(xiàn)象時停止訓練。顯然,文獻[4-15, 17]的訓練樣本數(shù)量都少于網絡連接權重個數(shù),還都沒有采用檢驗樣本實時監(jiān)控訓練過程,必定會發(fā)生“過訓練”現(xiàn)象,導致NN模型沒有泛化能力和實用價值。同時,NN建模具有顯著的“垃圾進去,垃圾出來”(garbage in, garbage out)特征[19, 21, 23],如果前置評價方法的結果不合理,則后續(xù)NN建模就毫無意義。
城市大型商場火災風險綜合評價是當前城市管理中的重要課題之一。研究探索出一種簡捷、實用、有效的火災風險綜合評價方法具有重要的理論意義和實踐價值。根據(jù)已有的火災風險評價指標體系和五級風險評價標準,本文嘗試建立火災風險綜合評價的PPC模型,火災風險得分與評價指標之間呈線性關系,數(shù)學意義清晰,模型結構簡單,后續(xù)應用便捷。通過計算各個新樣本的投影值,就可以很方便地判定其火災風險等級,不受其他因素的影響。對15個待判定樣本的評價研究結果表明,PPC模型得到了可靠、有效的評價結果。
表4 現(xiàn)有采用NN建模文獻的具體情況
注:*是指NN模型訓練樣本的期望輸出值是用這些方法確定的。**其他文獻沒有說明拓撲結構,故略。
采用基于信息熵法權重的TOPSIS法和GRA法進行對比研究,15個待判定樣本的評定風險等級與PPC模型的結果相同。現(xiàn)有文獻都不滿足BPNN建模的二個基本條件,樣本數(shù)據(jù)太少,沒有采用檢驗樣本實時監(jiān)控訓練過程很容易發(fā)生“過訓練”現(xiàn)象,導致NN模型沒有泛化能力和實用價值。
[1] 吳瑤,馮國珍,樓文高.投影尋蹤法在高層建筑火災風險評估中的應用[J].災害學,2016,31(3):196-201.
[2] 岳海玲.基于遺傳神經網絡的地下商場火災風險評價方法[D].西安:西安科技大學,2006.
[3] 李姍姍.大型商業(yè)綜合體火災風險性分析[D].西安:西安科技大學,2015.
[4] 雷中英,陳微.基于物元可拓方法的高層建筑防火系統(tǒng)安全評估[J].長江大學學報(自然科學版) ,2009,6(2):104-107.
[5] 丁元春,翁發(fā)祿,唐敏康.基于突變理論的高層建筑火災安全綜合評價[J].建筑科學,2012,28(1):22-25.
[6] 徐敏,陳國良,周心權.高層建筑火災風險的神經網絡評價[J].湘潭礦業(yè)學院學報,2003, 2003(3):69-72.
[7] 伍愛友,施式亮,王從陸.基于神經網絡和遺傳算法的城市火災風險評價模型[J]. 中國安全科學學報,2006,16(11):108-111.
[8] 孫寧.基于BP神經網絡的高層建筑火災危險性評估方法研究[D].西安:西安科技大學,2006.
[9] 岳海玲,李樹剛,郭子東,等. 基于RBF神經網絡的高層建筑火災風險評價[J]. 火災科學,2006,15(2):77-81.
[10] Xia D. Fire risk evaluation model of high-rise buildings based on multilevel BP neural network[C]//2007 Fourth International Conference on Fuzzy Systems and Knowledge Discovery (FSKD 2007),Haikou,Hainan,2007:24-27.
[11] 于作明,王小文.基于BP神經網絡的商場建筑火災風險評價[J]. 沈陽航空工業(yè)學院學報,2007, 24(1):72-74.
[12] 宋譯,肖國清,何利文.基于人工神經網絡理論的建筑物火災安全評價研究[J]. 中國安全科學學報,2008,18(4):61-67.
[13] 鐘凱. 基于BP神經網絡的高層建筑防火評估[D]. 呼和浩特:內蒙古科技大學,2012.
[14] 高臣勇. 高層民用建筑火災風險評估指標體系對比研究[J]. 武警學院學報,2013,29(6):35-38.
[15] 李柯萱,邵必林,劉浩.基于灰關聯(lián)和神經網絡的大型商場火災風險評價方法[J]. 安全與環(huán)境學報,2013,13(1):254-258.
[16] 周瑾. 基于神經網絡的建筑物火險評價[J]. 中國安全生產科學技術, 2013,9(10):177-182.
[17] 陳驥, 鄒樹梁,唐德文,等. 基于灰色關聯(lián)度的集對分析方法在高層建筑火災危險性評價中的應用[J]. 中國安全生產科學技術,2015,11(5):136-141.
[18] 牛發(fā)陽,段美棟,王建波,等. 基于PCA-FPP-BP神經網絡的高層建筑火災安全評價[J]. 工業(yè)安全與環(huán)保,2016,42(7):26-29.
[19] StatSoft Inc. Electronic Statistics Textbook [EB/OL]. [2013] ( http://www.statsoft.com/textbook ) .
[20] Zhang G, Patuwo B E, Hu M Y. Forecasting with artificial neural networks: The state of the art[J]. International Journal of Forecasting, 1998, 14(1):35-62.
[21] 樓文高,喬龍. 基于神經網絡的金融風險預警模型及其實證研究[J]. 金融論壇,2011(11):52-61.
[22] 樓文高. 活性污泥工藝神經網絡模擬與控制研究[D].上海:同濟大學,2005.
[23] Friedman J H, Tukey J W. A Projection Pursuit Algorithm for Exploratory Data Analysis [J]. IEEE Transactions on Computers,1974,C-23(9):881-890.
[24] 樓文高, 喬龍. 投影尋蹤聚類建模理論的新探索與實證研究[J]. 數(shù)理統(tǒng)計與管理, 2015, 34(1):47-58.
[25] 樓文高,熊聘,馮國珍,等.影響投影尋蹤聚類建模的關鍵因素分析與實證研究[J/OL].數(shù)據(jù)統(tǒng)計與管理,1-21.(2017-07-14).http://kns.cnki.net/kcms/detail/11.2242.01.20170714.1738.014.html.Dol:10.13860/i.cnki.slti.20170717-002.
[26] 張雯雰,劉華艷. 改進的群搜索優(yōu)化算法在MATLAB中的實現(xiàn)[J]. 電腦與信息技術,2010, 18(3):44-46.
[27] 樓文高,王廣雷,馮國珍. 旅游安全預警TOPSIS評價研究及其應用[J]. 旅游學刊,2013,28(4):66-75.
[28] 唐啟義.DPS 數(shù)據(jù)處理系統(tǒng): 實驗設計、統(tǒng)計分析及數(shù)據(jù)挖掘[M]. 北京:科學出版社, 2010.
[29] Marsland S. Machine Learning: An Algorithmic Perspective[M]. New York: Chapman & Hall/CRC,2014.
Abstract:Based upon the fire risk comprehensive evaluation (FRCE) index system of the urban shopping malls (USM) and its five-class evaluation criteria, the projection pursuit clustering (PPC) model for FRCE of the USM were established by applying group search optimization (GSO) in this paper. The reliable and effective results of unknown fifteen samples were obtained by applying the PPC model. The results applying PPC model are good agreement with the results using the TOPSIS (Technique for Order Preference by Similarity to Ideal Solution) and gray relation analysis (GRA) based on information-entropy weights. The shortcomings of the published literatures on FRCE using neural networks are discussed and analyzed, and these established BPNN models are unreliable, non-generalized and useless. The case study shows that the PPC model is robust and suitable for FRCE of the USM. The PPC models possess the characteristics of clear concept and convenient application.
Key words:fire risk; projection pursuit clustering model; urban large building; evaluation and clustering; group search optimization(GSO)
Fire Risk Comprehensive Evaluation of the Large Urban Building based on Projection Pursuit Clustering Model and its Application
YU Xiaohong1, LOU Wengao2and HONG Yingzheng3
(1.FacultyofEastmoneyMediaandManagement,ShanghaiBusinessSchool,Shanghai200235,China; 2.ShanghaiBusinessSchool,Shanghai200235,China; 3.ShanghaiFireResearchInstituteofMinistryofPublicSecurity,Shanghai200438,China)
10.3969/j.issn.1000-811X.2017.04.004]
TP183;X913.4
A
1000-811X(2017)04-0017-06
2017-02-22
2017-05-06
國家重點研發(fā)計劃課題(2016YFC0800608)
于曉虹(1978-),女,安徽合肥人,碩士,講師,研究方向為會計學、商業(yè)經濟與管理、投影尋蹤等數(shù)據(jù)挖掘技術及其應用. E-mail:yu_xiaohong@21cn.com
洪贏政(1976-),男,安徽亳州人,碩士,副研究員,研究方向為數(shù)字化消防單兵裝備及消防安全.E-mail:50411261@qq.com
10.3969/j.issn.1000-811X.2017.04.004
于曉虹,樓文高,洪贏政. 城市大型商場火災風險評價的投影尋蹤模型與應用[J]. 災害學,2017,32(4):17-22. [YU Xiaohong, LOU Wengao and HONG Yingzheng. Fire Risk Comprehensive Evaluation of the Large Urban Building based on Projection Pursuit Clustering Model and its Application[J]. Journal of Catastrophology,2017,32(4):17-22.