蔡 平,冒劉燕
(1.江蘇海事職業(yè)技術(shù)學(xué)院,南京 211170;2.東南大學(xué)交通學(xué)院,南京 210096)
隨著我國船舶工業(yè)技術(shù)的不斷發(fā)展,安全管理工作倍受重視,船舶生產(chǎn)中傷亡事故的統(tǒng)計分析工作已成為安全管理的一項基礎(chǔ)工作[1]。根據(jù)海因里希事故致因理論,事故規(guī)律的挖掘是建立在輕微事故的統(tǒng)計分析基礎(chǔ)之上的。由于輕微事故的發(fā)生具有因果性、隨機性和普遍性等特點,事故與事故之間不可避免地會具有某些關(guān)聯(lián),統(tǒng)計的指標(biāo)也會存在信息的重疊[2]。如果運用一般的統(tǒng)計方法,這種信息重疊會阻礙我們對事故特征與內(nèi)在規(guī)律的準(zhǔn)確認(rèn)識。主成分分析正是研究如何通過原來變量的少數(shù)幾個線性組合來解釋原來變量絕大多數(shù)信息的一種多元統(tǒng)計方法[3]。為了消除信息重疊的影響,本文引入主成分分析法,對船舶生產(chǎn)企業(yè)中的輕微事故進行分析,揭示事故之間的內(nèi)在聯(lián)系,得到事故特征及其發(fā)展規(guī)律,為企業(yè)的安全生產(chǎn)提供有意義的決策參考。
主成分分析也稱主分量分析,是由霍特林(Hoteling)于1933年首先提出的。主成分分析是利用降維的思想,在損失很少信息的前提下,把多個指標(biāo)轉(zhuǎn)化為幾個綜合指標(biāo)的多元統(tǒng)計方法[4]。通常把轉(zhuǎn)化生成的綜合指標(biāo)稱為主成分,其中每個主成分都是原始變量的線性組合,并且各個主成分之間互不相關(guān),使得主成分比原始變量具有某些更優(yōu)越的性能。主成分分析的計算步驟如下:
1)對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化處理。對于一個樣本資料,觀測p個變量x1,x2,…,xn,n個樣品的數(shù)據(jù)資料陣為:
為了消除變量之間在數(shù)量級或量綱上的不同,對數(shù)據(jù)進行標(biāo)準(zhǔn)化變換:
2)計算樣本相關(guān)系數(shù)矩陣。
經(jīng)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)的相關(guān)系數(shù)為:
3)求相關(guān)系數(shù)矩陣特征值和特征向量。由特征方程|λg-R|=0,求出 p 個特征根 λ1,λ2,…,λp,并將其按照從大到小的順序排列為 λ1≥λ2≥…≥λp≥0。λ是主成分的方差,其大小描述了各個主成分在被評價對象上所起作用的大小[5,6]。
4)選擇重要的主成分,并寫出主成分表達式。主成分分析可以得到p個主成分,根據(jù)各個主成分貢獻率ei的大小選取前k個主成分。
貢獻率越大,說明該主成分所包含的原始變量的信息越強。k的選取,一般要求累計貢獻率達到85%以上。
5)計算主成分。然后對k個主成分進行綜合評價,可先求每一個主成分的線性加權(quán),再對k個主成分進行加權(quán)求和,得最終評價值。
收集到某船舶生產(chǎn)企業(yè)2012年輕微事故記錄,得出事故類型的統(tǒng)計資料,原始數(shù)據(jù)如表1所示。
由于事故類型較多,將原始數(shù)據(jù)中的各類事故分別表示為x1車輛傷害、x2觸電、x3高處墜落、x4火災(zāi)、x5機械傷害、x6其他爆炸、x7其他傷害、x8起重傷害、x9物體打擊、x10中毒和窒息、x11灼燙、x12淹溺。
首先對原始數(shù)據(jù)做標(biāo)準(zhǔn)化處理,得出標(biāo)準(zhǔn)化后的數(shù)據(jù)如表2所示。
運用SPSS軟件進行主成分分析,計算出相關(guān)系數(shù)矩陣及特征值如表3和表4所示。
表4中列出了計算之后所有主成分的特征值主成分貢獻率及累計貢獻率,所有主成分的特征值按照從大到小的順序排列,可見第一個主成分的特征值為9.285,它解釋了總變量的77.373%;第二個主成分的特征值為1.095,它解釋了總變量的9.127%。第一主成分和第二主成分的累計貢獻率達到86.500,超過了主成分分析法中規(guī)定的85%,所以選取第一主成分和第二主成分,并認(rèn)為它們基本包含了以上12個指標(biāo)的所有信息。其中,第一個主成分又是最重要的,包含的信息最多,對事故分析影響最大。據(jù)此可提取的主成分矩陣如表5所示。
根據(jù)主成分計算步驟可得出第一、第二主成分表達式分別如下:表示對原始變量標(biāo)準(zhǔn)化后的變量。
其中,
表1 2012年某高危企業(yè)輕微事故統(tǒng)計
表2 標(biāo)準(zhǔn)化數(shù)據(jù)
表3 相關(guān)系數(shù)矩陣
表4 特征值與主成分貢獻率以及累計貢獻率
表5 成份矩陣
將表2中的標(biāo)準(zhǔn)化數(shù)據(jù)代入主成分表達式中,可以得出12個月的主成分得分,如表6所示。并將這12個月的得分在平面直角坐標(biāo)系中繪制出來,得到主成分得分二維圖,如圖1所示。
1)從時間上來看。從圖1中可以看出,分布在第一象限的是4、5、7三個月,分布在第四象限的是6月份,這四個月的安全事故發(fā)生情況在全年來說是最多的,安全狀況最差。這跟第一、第四象限的主要特征是第一主成分、占信息總量的比重最大有關(guān)。并且5、6、7月份的第一主成分得分最高,說明安全狀況最差,建議該企業(yè)將這三個月份作為重點安全生產(chǎn)月份來抓。
表6 主成分得分
圖1 主成分得分二維圖
處于第三象限的2月份,由于其第一主成分得分y1最低,安全情況最好。處于y2軸附近共有9、10、11、12四個月份,這四個月份得分非常接近,說明這四個月安全狀況基本一致,并且可以只用第一主成分就可以解釋它們的安全狀況。
2)從事故類型來看。根據(jù)第一主成分表達式,高處墜落、機械傷害、起重傷害和物體打擊事故所占權(quán)重比例最大,對企業(yè)安全影響最為嚴(yán)重。另外,這四類事故之間存在較強的相關(guān)性。說明這幾類事故的致因之間是有聯(lián)系的,引發(fā)一類事故的原因,在某種情況下也有可能造成另一類事故,因此在制定預(yù)防措施時必須綜合考慮這種聯(lián)系。對企業(yè)而言,可以將這幾類事故的隱患作為重點檢查和整治對象,以減少事故發(fā)生率,促進安全生產(chǎn)。
船舶生產(chǎn)企業(yè)輕微事故多,類型復(fù)雜,如果只利用簡單的數(shù)學(xué)統(tǒng)計,就會忽略各類事故間的聯(lián)系和相關(guān)性,無法充分認(rèn)識到事故致因之間的聯(lián)系,因而無法運用系統(tǒng)的觀念對這些數(shù)據(jù)進行處理。主成分分析在研究復(fù)雜問題時就可以只考慮少數(shù)幾個主成分而不至于損失太多信息,從而更容易抓住主要矛盾,揭示事物內(nèi)部變量之間的聯(lián)系和規(guī)律性,同時使問題得到簡化,提高分析效率。
[1]周明順. 船舶建造安全概論[M]. 北京: 人民交通出版社, 2011.
[2]李慧敏, 龐奇志, 鄒偉霞. 主成分分析法在煤礦事故統(tǒng)計分析中的應(yīng)用[J]. 安全與環(huán)境工程, 2012, 19(3):77-79.
[3]何曉群. 多元統(tǒng)計分析[M]. 北京: 中國人民大學(xué)出版社, 2004.
[4]張文彤. SPSS統(tǒng)計分析高級教程[M]. 北京: 高等教育出版社, 2004.
[5]Bilodeau M, Duchesne P. Principal component analysis from the multivariate familial correlation matrix[J].Journal of Multivariate Analysis, 2002, 82(2): 457-470.
[6]王家遠, 葉銀川. 主成分分析法評價地區(qū)建筑業(yè)競爭力[J]. 深圳: 深圳大學(xué)學(xué)報理工版, 2009, 26(1):92-97.