王書明 郭起劍
(1.金陵科技學院建筑工程學院 南京211169;2.江蘇建筑職業(yè)技術學院建筑工程管理學院 江蘇徐州221116)
建筑工程生產(chǎn)事故死亡人數(shù)時間序列分析*
王書明1郭起劍2
(1.金陵科技學院建筑工程學院南京211169;2.江蘇建筑職業(yè)技術學院建筑工程管理學院江蘇徐州221116)
為研究建筑工程安全生產(chǎn)事故死亡人數(shù)的變化規(guī)律,采用時間序列分析方法,分析了建筑安全事故死亡人數(shù)時間序列上的趨勢性規(guī)律,通過數(shù)據(jù)預處理和模型的識別與檢驗,最終建立了安全事故死亡人數(shù)預測模型。對全國2005—2014年建筑工程安全生產(chǎn)事故造成的死亡人數(shù)進行了分析和預測。結果表明:ARIMA模型各年預測值與實際值誤差率為0.393,相比灰色模型和BP神經(jīng)網(wǎng)絡模型誤差率最小??傮w上說,ARIMA模型較適用于隨機性較大的數(shù)據(jù)的趨勢預測。
建筑工程 時間序列 ARIMA模型 安全事故 預測
由于建筑行業(yè)的勞動密集和施工作業(yè)等特點,建筑行業(yè)每年因安全事故所造成的傷亡居高不下。建筑安全事故的發(fā)生次數(shù)和事故造成的死亡人數(shù)具有隨機性和偶然性,是隨時間變化的事件,具備時間序列的特點與規(guī)律。時間序列分析就是利用系統(tǒng)觀測得到的時間序列數(shù)據(jù),應用數(shù)理統(tǒng)計方法加以處理,以預測未來事物的發(fā)展。本文擬運用時間序列分析,建立建筑安全生產(chǎn)事故ARIMA模型,結合我國2005年至2014年建筑安全事故的時間序列數(shù)據(jù),探究建筑安全事故序列特征及其發(fā)展規(guī)律。
ARIMA模型全稱為自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,簡記ARIMA),是由Box和Jenkins于20世紀70年代提出的一種著名時間序列預測方法。所謂ARIMA模型,是指將非平穩(wěn)時間序列轉化為平穩(wěn)時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值進行回歸所建立的模型。ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,包括移動平均過程(MA)、自回歸過程(AR)、自回歸移動平均過程(ARMA)以及ARIMA過程。
設時間序列是 d階單整序列,記為:yt~I(d),則:
其中 ωt為平穩(wěn)序列,即ωt~I(0),于是可以對 ωt建立ARMA模型:
用滯后算子表示則:
式中:經(jīng)過 d階差分變化后的ARMA(p,q)模型稱為ARIMA(p,d,q)模型,等價于下式:
(1)數(shù)據(jù)平穩(wěn)性預處理。由于時間序列受到長期趨勢、季節(jié)變動、周期變動以及不規(guī)則變動等因素的影響 ,現(xiàn)實數(shù)據(jù)往往表現(xiàn)為非平穩(wěn)的特征。判斷時間序列是否平穩(wěn)可以根據(jù)時間序列的趨勢圖、自相關函數(shù)、偏自相關函數(shù)、特征根以及游程數(shù)等加以判斷。如果一個序列的均值和方差始終為常數(shù),則稱它為平穩(wěn)的;如果時間序列數(shù)據(jù)圖呈現(xiàn)線性或非線性趨勢,則它是不平穩(wěn)的;如果自相關函數(shù)或偏自相關函數(shù)表現(xiàn)出拖尾或截尾特征,則時間序列是平穩(wěn)的;如果一個序列的游程數(shù)既不太多又不會太少,則時間序列是平穩(wěn)的;反之如果游程數(shù)總是太少或者太多,則時間序列存在某種趨勢性或周期性。
(2)模型識別。在序列的偏自相關函數(shù)(PACF)圖是截尾,而自相關函數(shù)圖(ACF)是拖尾的情況下,則可判定該序列適用AR模型;在平穩(wěn)序列的PACF圖是拖尾的,而ACF圖是截尾的情況下,則可判定該序列適用MA模型;在平穩(wěn)序列的PACF圖和ACF圖均是拖尾的情況下,則該序列適用ARMA模型[1];若經(jīng)過差分處理后變?yōu)槠椒€(wěn)序列的PACF圖和ACF圖均是拖尾的,則該序列適用ARIMA模型。
關于差分階數(shù) d的選取,可采用試探法,也可利用信息準則。差分階數(shù) d通常選取較低階(一般取1、2或3)。若對于 d的某一取值相應的自相關(或偏自相關)函數(shù)呈現(xiàn)較好的截尾或拖尾特性,則認為相應的d值是適宜的。
(3)模型檢驗。檢驗模型所選參數(shù)是否具有統(tǒng)計意義 ,通過診斷殘差序列是否為白噪聲序列來確定。若是,則判定該模型可以用于實際預測;否則,可判定模型的識別與估計有誤,需重新識別與估計[2]。
(4)模型預測。利用數(shù)據(jù)平穩(wěn)化預處理、模型識別與模型檢驗3個步驟所建立的ARIMA(p,d,q)模型對未來數(shù)據(jù)進行預測。
3.1數(shù)據(jù)來源
根據(jù)中華人民共和國住房和城鄉(xiāng)建設部網(wǎng)站以及相關文獻資料 ,運用Eiews 8.0建立我國2005年至2014年建筑安全事故死亡時間序列,見圖1。
圖1 國內(nèi)建筑安全生產(chǎn)死亡人數(shù)時間序列
3.2數(shù)據(jù)平穩(wěn)性檢驗
數(shù)據(jù)平穩(wěn)性的考察,首先要考察時間序列趨勢圖,其次觀察序列的自身特性。同時要結合數(shù)據(jù)的自相關圖和偏自相關圖以及單位根進行考察。我國2005年至2014年建筑安全生產(chǎn)死亡人數(shù)趨勢圖見圖1;自相關圖和偏自相關圖分別見圖2、圖3;單位根檢驗結果見表1。
圖2 死亡人數(shù)時間序列自相關圖
圖3 死亡人數(shù)時間序列偏自相關圖
表1 建筑安全生產(chǎn)死亡人數(shù)時間序列的ADF 檢驗結果
由表1可知,ADF檢驗中得到的 t值為-1.168 993,大于1%、5%、10%3個檢驗水平的臨界值,判定該時間序列存在單位根,為非平穩(wěn)序列。另由圖2和圖3可知,序列的自相關函數(shù)既不拖尾又不截尾,原時間序列不平穩(wěn)。
3.3數(shù)據(jù)平穩(wěn)性處理
為了改良時間序列數(shù)據(jù)的特性,消除數(shù)據(jù)的不平穩(wěn)性,選擇對數(shù)據(jù)進行自然對數(shù)轉換 ,同時進行差分處理 ,見表2和表3。通過試探,當 d=1時,ADF檢驗中得到的 t值為-2.719 904大于1%、5%、10%3個檢驗水平的臨界值;當 d=2時,ADF檢驗中得到的 t值為-6.061 159,小于1%、5%、10%3個檢驗水平的臨界值。因此,ARIMA(p,d,q)模型中d應取2。
表2 建筑安全生產(chǎn)死亡人數(shù)序列1階差分后的ADF檢驗結果
表3 建筑安全生產(chǎn)死亡人數(shù)序列2階差分后的ADF檢驗結果
3.4模型的識別
為了確定ARIMA(p,d,q)模型中的 p和q,作序列的ACF圖和PACF圖,分別見圖4、圖5。由圖4、圖5可以看出,序列的自相關和偏自相關都是拖尾的,因此適用ARIMA模型。經(jīng)反復驗算比較,最終確定:p=1,q=2。從而建立ARIMA(1,2,2)模型。
圖4 原始序列2階差分自相關圖
圖5 原始序列2階差分偏自相關圖
3.5模型檢驗
殘差序列(εt)檢驗 ,Q=2.117 4,Q<p2d=0.05,可以認為在極顯著水平下殘差序列(εt)為白噪聲。
3.6模型預測
利用ARIMA(1,2,2)模型對2010年—2014年各年安全事故死亡人數(shù)進行預測。同時,本文構建了灰色模型和BP神經(jīng)網(wǎng)絡模型,并將3種預測方法的結果與實際情況進行對比,結果見表4和圖6。
圖6 預測值與實際值對比
表4 三種預測模型預測結果比較
(1)結合ARIMA模型確立了ARIMA(1,2,2)模型,并應用該模型對我國2010—2014年建筑業(yè)安全生產(chǎn)死亡人數(shù)進行預測,通過與實際值對比分析發(fā)現(xiàn),預測的趨勢與實際的趨勢基本一致 ,最大誤差為0.907%,綜合誤差僅為0.393%。與灰色系統(tǒng)、BP神經(jīng)網(wǎng)絡預測相比,精度較高,預測效果較理想。
(2)導致死亡事故發(fā)生的影響因素具有多樣性,在進行預測時應考慮多因素影響;同時,需要不斷通過新發(fā)生數(shù)據(jù)的不斷增加而對模型中的參數(shù)進行修正。因此,其長期預測的效果還有待進一步探討。
[1]蔣燕.ARIMA模型在廣西全社會固定資產(chǎn)投資預測中的應用[J].數(shù)理統(tǒng)計與管理,2006,25(5):588-592.
[2]張磊,李慧民.ARIMA模型在我國建筑業(yè)總產(chǎn)值預測中的應用[J].企業(yè)經(jīng)濟,2011(11):93-96.
Analyses on Death Tollfrom Construction Engineering Accidents Based on Time Series
WANG Shuming1GUO Qijian2
(1.College of Civil Engineering,Jinling Institute of Technology Nanjing 211169)
In order to reveal the change rules of death toll from construction engineering accidents,time series is used to analyze the trend rules of accidents and a ARIMA model is set up by data pretreatmentand model identification and testing. Based on this model,the change rules ofdeath tollfrom construction engineering accidents from 2005 to 2014 have been analyzed and predicted.The results show that the difference between the predicted value by ARIMA modeland the actual one is 0.393 and it is minimal compared with the grey model and BP neural network model.In general,the ARIMA model is suitable for the trend forecast of the randomness data.
construction engineering time series ARIMA model safety accident predict
江蘇省住建廳科研項目(2014ZD68),金陵科技學院博士科研啟動基金(jit-b-201230),金陵科技學院校級科研基金項目(jit-2016-jlxm-16)。
王書明 ,男 ,1968年生,博士,副教授,注冊安全工程師,一級安全評價師 ,主要研究方向為安全管理與安全評價。
(2015-10-09)