周丹+鄭中義
摘要:
為比較互見中開闊水域不同船舶領域影響因素的重要性,應用粗糙集理論的相關算法,對船舶領域影響因素之間的依賴關系進行分析,并進行影響因素約簡和影響因素重要度計算.以渤海及黃海北部船舶自動識別系統(tǒng)(AutomaticIdentificationSystem,AIS)的數(shù)據(jù)為基礎,應用MATLAB編程計算,得到船舶領域影響因素之間的依賴度、相對約簡集和影響因素重要度.結果表明:船舶領域影響因素之間存在不同程度的冗余,其中風、浪或流可約簡掉;會遇角度、航速、船舶大小、駕駛員級別、船舶密度、船舶類型和能見度的重要度分別為0.2791,0.2008,0.1794,0.2121,0.2359,0.1229和0.0935.該研究表明:在保證對船舶領域影響分辨性不變的前提下,駕駛員可選擇較重要因素對船舶領域進行判斷,并采取較恰當?shù)谋芘鲂袆?,保障航行安全;但在特殊的環(huán)境下,某些影響因素需要特別考慮.
關鍵詞:
影響因素;粗糙集理論;屬性約簡;重要度
中圖分類號:U676.1
文獻標志碼:A 收稿日期:20150818 修回日期:20151201
0引言
船舶領域的影響因素眾多,已有對船舶領域的研究中通常只包括船舶領域影響因素中的某個因素或部分因素.例如FUJII(藤井)等[1]對通常航行條件下被追越船舶的領域尺度和狹窄水域的領域尺度進行了研究.GOODWIN[2]在研究船舶領域時得到了4個不同類型海域的船舶領域尺度和在不同船舶交通流密度下的船舶領域尺度.范賢華等[3]在研究水流條件下的船舶領域模型時考慮了船長、航速和潮流速度.PIETRZYKOWSKI等[45]對開闊水域會遇局面、船舶大小和狹窄水域參數(shù)等對船舶領域的影響進行了研究.HANSEN等[6]主要研究了水域類型和水域參數(shù)對船舶領域的影響.WANG[78]提出了四維船舶領域模型,該模型中涉及的影響船舶領域大小的因素包括船舶長度和速度.隨后,WANG[9]給出了船舶領域模型的四維解析框架,它雖包含船舶領域的全部影響因素,但是如何利用模型確定全部影響因素在某數(shù)值下的船舶領域仍沒有解決.利用基于神經(jīng)網(wǎng)絡[1011]的方法能得到船舶領域與其影響因素的關系,雖然這種方法能同時考慮較多的影響因素,但它是一種黑箱的方法.
確定船舶領域模型時很難同時考慮全部的影響因素.本文利用渤海及黃海北部船舶自動識別系統(tǒng)(AutomaticIdentificationSystem,AIS)的數(shù)據(jù),應用粗糙集相關理論對船舶領域影響因素之間的關系、影響因素的重要度進行研究,并對影響因素進行約簡.
1屬性重要度計算與相對約簡
1.1屬性依賴度
1.2屬性重要度
1.3P的Q約簡
2船舶領域與其影響因素
2.1數(shù)據(jù)來源
目前,AIS數(shù)據(jù)已成為研究船舶領域的常用數(shù)據(jù).本文采用2014年9月26日到2014年10月13日渤海及黃海北部水域的AIS數(shù)據(jù).氣象數(shù)據(jù)來自中央氣象臺的天氣預報,水文數(shù)據(jù)來自國家海洋環(huán)境預報中心的預報.
2.2船舶領域
2.2.1船舶領域的選取
根據(jù)藤井和GOODWIN對船舶領域的定義,船舶領域是駕駛員為保證航行安全要保持的船舶間的安全距離,其與船舶之間的實際通過距離d直接相關.假設某船遇到一密度均勻的船舶交通流,并采取避碰措施通過.如圖1所示,船舶領域由船舶之間的最小安全會遇距離決定,且在中心船O周圍同一方向上,船O1的轉向幅度必大于船O2和O3的,在船
O1與中心船O的距離為d時,船O1處船舶密度增大最多,即為船舶密度最大處(與藤井定義的領域邊界相吻合).因此,以d作為船舶領域對船舶領域影響因素進行分析.
2.2.2船舶領域樣本的獲取
利用MATLAB編程計算船舶領域的流程見圖2,其中:5000m與3000m參考文獻[4];4.5nmile參考文獻[13],絕大多數(shù)會遇船舶在相距4.5nmile時沒有采取避碰行動;20s是通過計算得到的(假設航速為14kn,則船舶20s內航行的距離也僅為144m,誤差在可接受范圍內).船舶轉向時航速越大,AIS數(shù)據(jù)時間間隔越小,即使存在數(shù)據(jù)丟失,也是可以接受的.
判斷轉向的方法為:取任意一段船舶航跡上時間間隔分別為300s和900s的點,計算相鄰三點中第
一、第二點與第三點連線的夾角.如圖3所示,∠AOB即為判斷是否轉向的夾角,若∠AOB≥10°,則認為船舶轉向,且認為此時船舶的轉向行為必考慮到與其實際通過距離小于5000m的船舶.
樣本選取的過程中雖不能保證挑選出全部的樣本,但能夠保證選擇的樣本均為目標樣本.通過計算,選擇2107組樣本數(shù)據(jù).
2.2.3船舶領域的度量
船舶領域不同方位的邊界到中心船的距離不同.為比較船舶領域樣本的大小,將樣本中中心船周圍不同方位上的領域大小轉換為相同方位上的領域大小.設船舶領域任意方位β上的邊界到中心船的距離為dβ,尾部扇區(qū)長為l,中心船船首方向為0°,船尾為180°,左右對稱.由于本文研究的水域為開闊水域,所以參考GOODWIN[2]開闊水域船舶領域模型中dβ與l的關系.設任意船舶領域樣本均滿足
2.3船舶領域影響因素
2.3.1船舶領域影響因素的確定
表1為參考文獻[4]選取的開闊水域互見中船舶領域影響因素.
2.3.2船舶領域影響因素的離散化度量
離散化度量區(qū)間大小的劃分直接影響研究的復雜度.不同因素之間劃分粗細的不同則影響結果的
準確性,導致對不同船舶領域因素的分析產生誤差.
綜合考慮,劃分影響因素為4個等價類,個別只能劃分為3個等價類.影響因素劃分規(guī)則如下:
(1)能見度.以3km為單位等間隔劃分能見度,1=[10km,13km),2=[13km,16km),3=[16km,19km),4=[19km,22km].
(2)流.以1kn為單位等間隔劃分流速,1=[1kn,2kn),2=[2kn,3kn),3=[3kn,4kn),4=[4kn,5kn].
(3)浪.以0.6m為單位等間隔劃分浪高,1=[1.2m,1.8m),2=[1.8m,2.4m),3=[2.4m,3.0m),4=[3.0m,3.6m].
(4)風.以1級為單位等間隔劃分風級數(shù),1=[4級,5級),2=[5級,6級),3=[6級,7級),4=[7級,8級].
(5)會遇角度.會遇角度以本船為對象,左右對稱,船頭方向為0°,船尾為180°.參考會遇局面劃分,1=[0,5°),2=[5°,54°),3=[54°,112.5°),4=[112.5°,180°].
(6)船舶密度.根據(jù)所觀測的AIS數(shù)據(jù),將水域內船舶密度相近的劃分為一類,1={丹東、錦州、營口及天津與大連之間的水域},2={黃驊、東營、濰坊附近水域},3={大連、煙臺、威海、龍口附近水域},4={天津港附近水域}.
(7)駕駛員級別.1={三副},2={二副},3={大副}.
(8)航速.以5.5kn為單位等間隔劃分對地航速,1=[0kn,5.5kn),2=[5.5kn,11.0kn),3=[11.0kn,16.5kn),4=[16.5kn,22.0kn].
(9)船舶類型.按照船舶類型的特殊性劃分,2={港口作業(yè)船和特種船舶},3={貨船},4={油船和化學品},1={其他船舶}.
(10)船舶大小.以100m為單位等間隔劃分船舶長度,1=[0,100m),2=[100m,200m),3=[200m,300m),4=[300m,400m].
船舶領域大小按照l的大小等間隔劃分,1=[0,1250m),2=[1250m,2500m),3=[2500m,3750m),4=[3750m,5000m].
3數(shù)據(jù)挖掘
3.1船舶領域影響因素與船舶領域信息系統(tǒng)
在信息系統(tǒng)S=(U,R,V,f)中:U為樣本空間;R=P∪Q;P為條件屬性,對應船舶領域影響因素;Q為決策屬性,對應船舶領域;V為U中樣本值的集合,由f確定.[14]船舶領域影響因素與船舶領域決策見表2.
表2船舶領域影響因素與船舶領域決策
3.2影響因素之間依賴度和影響因素重要度計算
利用MATLAB對式(1)和(3)編程計算,過程如下:
①計算U/ai(ai∈P)和U/Q,劃分規(guī)則如2.3.2節(jié).
②計算U/P,即求P的等價類.
影響因素之間的依賴度計算結果見表3,影響因素重要度計算結果見圖4.
表3船舶領域影響因素之間的依賴度
表3中第i行第j列的元素為影響因素j對影響因素i的依賴度,保留兩位小數(shù).可以看到,C1,C2,C3,C4之間的依賴度較大,A1與A2之間也存在一定程度的依賴關系,其余影響因素之間的依賴度均為0.圖4中C1和C2的重要度都為0,C3的重要度近似為0,C4的重要度也較小,僅為0.0166.為進一步分析影響因素之間的依賴度對影響因素重要度的影響,將除去相互之間存在依賴關系的船舶領域影響因素重要度計算結果列于表4.
表4除去依賴關系的船舶領域影響因素重要度
從表4中第一行的結果可以看到,當除去A2時,與A2存在依賴關系的A1的重要度與圖4中相比增大.從其他行也可以得到相同結論.比較不同行可以看到,當去掉不同的影響因素時,影響因素重要度排序發(fā)生改變,說明某些影響因素之間也是相互影響的,即影響因素之間存在冗余.這也說明利用基于粗糙集的屬性重要度計算方法得到的影響因素重要度是每個影響因素相對于其他影響因素的重要度,所以將此重要度定義為相對重要度.因此,有必要針對影響因素之間的冗余進行約簡.
3.3影響因素約簡
根據(jù)屬性重要度的定義和相對約簡的定義,對任意的影響因素子集P′P,
①當P′的重要度為0時,必有
因此,當P′的重要度為0,P′+a的重要度不為0,且posP(Q)=posP-P′(Q)時,P-P′為P的Q約簡;當P′重要度為0,任意影響因素a∈P-P′重要度不為0時,P′+a重要度必不為0.因此,利用船舶領域影響因素重要度求相對約簡時,只需考慮重要度為0的因素.由圖4,只需考慮C1,C2,C3(近似為0).圖5為包含影響因素C1,C2,C3的可能刪掉子集的重要度,其中屬性重要度為0或近似為0,且最大子集為{C1}和{C2,C3}.計算可得
)
因此,可刪掉C1或C2,C3.船舶領域影響因素的約簡集合有兩個,分別為R={會遇局面,船舶大小,航速,風,駕駛員級別,船舶密度,船舶類型,能見度}和S={會遇局面,船舶大小,航速,浪,流,駕駛員級別,船舶密度,船舶類型,能見度}.在影響因素中去掉風或去掉浪、流時,只有與其存在依賴關系的影響因素的重要度存在變化(見圖6和7),證明了簡約結果的有效性與合理性.
綜合比較,在船舶領域的影響因素中,可以刪掉風或浪、流,必要影響因素中會遇角度、航速、船舶大小、駕駛員級別、船舶密度的重要度分別為0.2791,0.2008,0.1794,0.2121,0.2359,均大于船舶類型和能見度的重要度(0.1229,0.0935).在保證對船舶領域影響因素分辨性不變的前提下,駕駛員可有重點地選擇較重要因素對船舶領域進行判斷,并采取較恰當?shù)谋芘鲂袆?,保障航行安全,但在特殊的環(huán)境下,某些影響因素需要特別考慮.
4結論
以渤海及黃海北部開闊水域AIS數(shù)據(jù)為基礎,應用基于粗糙集的數(shù)據(jù)挖掘方法對互見中船舶領域影響因素進行了系統(tǒng)分析,發(fā)現(xiàn)影響因素對船舶領域的影響存在重疊信息.在全部的影響因素中,可刪掉風或浪、流,會遇角度、航速、船舶大小、駕駛員級別、船舶密度的重要度分別為0.2791,0.2008,0.1794,0.2121,0.2359,大于船舶類型和能見度的重要度(0.1229,0.0935).結論可為確定船舶領域模型時選擇合理的影響因素提供依據(jù),也可降低駕駛員航行決策時考慮因素的復雜度.
參考文獻:
[1]FUJIIY,TANAKAK.Trafficcapacity[J].TheJournalofNavigation,1971,24:543552.
[2]GOODWINEM.Astatisticalstudyofshipdomains[J].TheJournalofNavigation,1975,28:328344.
[3]范賢華,張慶年,周鋒,等.水流條件下內河船舶領域模型[J].大連海事大學學報,2013,39(1):4648.
[4]PIETRZYKOWSKIZ,URIASZJ.Theshipdomainacriterionofnavigationalsafetyassessmentinanopenseaarea[J].TheJournalofNavigation,2009,62:93108.
[5]PIETRZYKOWSKIZ.Shipsfuzzydomainacriterionfornavigationalsafetyinnarrowfairways[J].TheJournalofNavigation,2008,61:499514.
[6]HANSENMG,JENSENTK,LEHNSCHILERT,etal.EmpiricalshipdomainbasedonAISdata[J].TheJournalofNavigation,2013,66:931940.
[7]WANGN.Anintelligentspatialcollisionriskbasedonthequaternionshipdomain[J].TheJournalofNavigation,2010,63:733749.
[8]WANGN.Aunifiedanalyticalframeworkforshipdomains[J].JournalofNavigation,2009,62:643655.
[9]WANGN.Anovelanalyticalframeworkfordynamicquaternionshipdomains[J].TheJournalofNavigation,2013,66:265281.
[10]WANGN,TANY,LIUSM.Shipdomaninindentificationusingfastandaccurateonlineselforganizingparsimoniousfuzzyneuralnetworks[C]∥Proceedingsofthe30thChinesecontrolconference.Yantai,China:ElsevierScience,2011:52715276.
[11]ZHUXL,XUHZ,LINJQ.Domainanditsmodelbasedonneuralnetworks[J].TheJournalofNavigation,2001,54:97103.
[12]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2001:1217.
[13]鄭中義,吳兆麟.船舶避碰的模糊決策[J].大連海事大學學報,1996,22(2):58.
[14]劉紅,何鵬.基于粗糙集的海事事故影響因素分析[J].上海海事大學學報,2013,34(2):1722.