徐宏偉,葛 沛
(南通中遠海運川崎船舶工程有限公司,江蘇 南通 226005)
“大數(shù)據(jù)”是數(shù)據(jù)的集合,其特點是數(shù)據(jù)的體量大、速度快、類別多、潛在的價值含量高,且數(shù)據(jù)量不斷增長。目前,越來越多的應(yīng)用涉及大數(shù)據(jù),通過對大數(shù)據(jù)的分析可以獲取更具價值的信息。隨著互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)等信息技術(shù)的快速發(fā)展,有些大型航運公司逐步建立了覆蓋全球的船舶營運數(shù)據(jù)中心,監(jiān)控管理船舶的位置、航行狀態(tài)及設(shè)備狀況。
近年來,一批國際知名船企和相關(guān)研究機構(gòu)已經(jīng)啟動了大數(shù)據(jù)應(yīng)用項目的研究。2014年日本船舶技術(shù)研究協(xié)會開展大數(shù)據(jù)應(yīng)用項目,采集船舶的航行數(shù)據(jù)形成大數(shù)據(jù),并應(yīng)用于船舶的節(jié)能航行和船型開發(fā)[1]。我國首艘智能示范船“i-DOLPHIN”號是一艘38 800載重噸散貨船,該船以大數(shù)據(jù)為基礎(chǔ),運用實時數(shù)據(jù)的傳輸匯集結(jié)合數(shù)字建模、遠程控制等信息化技術(shù),實現(xiàn)船舶感知、分析和決策的智能化,從而提升船舶運行效率[2]。但大數(shù)據(jù)技術(shù)應(yīng)用于智能化船舶仍然是一個高度復(fù)雜、計算量大、可靠性要求極高的過程,很多相關(guān)理論和技術(shù)仍需進一步研究和應(yīng)用,數(shù)據(jù)作用的發(fā)揮還需進一步驗證。
本文基于大數(shù)據(jù)分析的理論和方法,深度挖掘船舶運營數(shù)據(jù)的應(yīng)用價值,并以開發(fā)的船舶能源監(jiān)控系統(tǒng)為例,研究大數(shù)據(jù)分析處理的過程。
大數(shù)據(jù)分析的理論和方法,從人機相互協(xié)作的角度,可以分為以下2類。
(1)第1類是從機器的角度出發(fā),重視機器的計算能力、人工智能,如各類面向大數(shù)據(jù)的機器學(xué)習(xí)和數(shù)據(jù)挖掘方法等,主要研究各種挖掘算法、智能搜索及高性能處理算法等。這類方法目前是大數(shù)據(jù)分析領(lǐng)域的研究主流。
(2)第2類認為人是分析和需求的主體,重視基于機器與人之間相互協(xié)作的、人類更加易于認識理解的分析方法,此分析方法則在分析過程中融入人類特有的且機器無法替代的認知能力,如大數(shù)據(jù)可視化分析[3]。
傳統(tǒng)數(shù)據(jù)分析方法為了節(jié)約計算資源和時間,摒棄對所有原始數(shù)據(jù)的全面分析,通過復(fù)雜精確的算法,從部分樣本空間中獲取能夠反映全局的信息。隨著計算機技術(shù)的發(fā)展,對大量數(shù)據(jù)進行計算分析已成為可能,因此大數(shù)據(jù)分析方法不追求算法的復(fù)雜性,而追求高效地對所有數(shù)據(jù)集進行分析[4]。目前,船舶數(shù)據(jù)分析中應(yīng)用的大數(shù)據(jù)分析方法主要有以下3種。
(1)深度學(xué)習(xí)法。該方法能夠發(fā)掘多維數(shù)據(jù)中錯綜復(fù)雜的關(guān)系,具體方法有人工神經(jīng)網(wǎng)絡(luò)法、模糊系統(tǒng)、演化計算和群體智能算法。人工神經(jīng)網(wǎng)絡(luò)法采用多層次架構(gòu)來分析表達數(shù)據(jù),借助于龐大的數(shù)據(jù)量,模擬數(shù)據(jù)時可以用更精確復(fù)雜的模型來表達。目前人工神經(jīng)網(wǎng)絡(luò)法在船舶的碰撞預(yù)警、風(fēng)險分析領(lǐng)域中得到廣泛的應(yīng)用。以遺傳算法為代表的演化計算和以粒子群優(yōu)化、蟻群優(yōu)化等為代表的群體智能算法主要用于解決數(shù)據(jù)量太大而不易解決的復(fù)雜優(yōu)化問題。
(2)知識計算法。該方法從大數(shù)據(jù)庫中抽取有價值的知識,并將其構(gòu)建為可查詢分析和計算的知識庫。其中多源知識融合的方法考慮了知識的共享和復(fù)用,并且通過數(shù)據(jù)的不斷更新有效提高了數(shù)據(jù)分析的實時性和有效性,因此該技術(shù)被廣泛應(yīng)用在船舶能耗決策中。
(3)可視化法。該方法將大規(guī)模、多維度的數(shù)據(jù)分析結(jié)果直觀、動態(tài)化地實時展示給用戶,輔助用戶進行實時決策。其流程是通過物聯(lián)網(wǎng)獲取數(shù)據(jù)源,對原始數(shù)據(jù)進行必要的篩選和修復(fù),然后對數(shù)據(jù)進行深度處理,找出數(shù)據(jù)間的關(guān)聯(lián)性,預(yù)測數(shù)據(jù)的發(fā)展趨勢,最后通過直觀圖形的展示讓用戶更直接地觀察和分析數(shù)據(jù),從而為決策提供數(shù)據(jù)支持。
大數(shù)據(jù)的重要來源就是物聯(lián)網(wǎng)。船舶物聯(lián)網(wǎng)(船聯(lián)網(wǎng))是通過在船舶上安裝定位、通信、監(jiān)控等設(shè)備來組建的。隨著全球定位系統(tǒng)GPS、船舶自動識別系統(tǒng)AIS、電子海圖顯示與信息系統(tǒng)ECDIS、ARPA雷達、射頻識別RFID、綜合船橋系統(tǒng)等信息化技術(shù)的發(fā)展,船聯(lián)網(wǎng)已應(yīng)用于船舶管理體系中。它以企業(yè)、船員、船舶、貨物為對象,以數(shù)據(jù)為中心,實現(xiàn)航運管理的精細化,未來將實現(xiàn)更為重要的船船互聯(lián)、船岸互聯(lián)。船舶管理公司從已建立的數(shù)據(jù)庫獲取船舶的靜態(tài)數(shù)據(jù),然后依靠衛(wèi)星通訊設(shè)備獲取船舶自身的實時動態(tài)數(shù)據(jù)(如航速、航向、機器油耗等),并且依靠岸基航道局、氣象及測繪部門等機構(gòu)和航道助航設(shè)施的功能,獲取氣象、航道、海況等外界環(huán)境數(shù)據(jù)[5]。
船舶的大數(shù)據(jù)分析對船舶的運營管理可產(chǎn)生許多價值。以常用的能效管理為例,其價值如下:
(1)通過基于大數(shù)據(jù)技術(shù)開發(fā)出的船舶能源監(jiān)控系統(tǒng),能夠監(jiān)控船舶的方位、主機油耗和轉(zhuǎn)速,以便實時遠程監(jiān)測燃油消耗狀況。然后對測量的數(shù)據(jù)進行統(tǒng)計分析,并消除外界干擾力(如風(fēng)、波浪、水流等)的影響,得到船舶排水量、船速與主機油耗量之間的關(guān)系,優(yōu)選出船舶的經(jīng)濟油耗,給出船舶的最佳航速建議,從而實現(xiàn)降低船舶油耗的目標。
(2)通過分析航速要求、航線上實時的氣象狀況和水文條件等,以靠泊港口的日程時間要求為限制條件,計算出油耗最低的航線。
(3)航運商通過能源監(jiān)控系統(tǒng)提供的船舶運營數(shù)據(jù),構(gòu)建船舶實時監(jiān)控數(shù)據(jù)管理平臺,并將數(shù)據(jù)管理平臺與運輸生產(chǎn)調(diào)度系統(tǒng)相結(jié)合,整合航運產(chǎn)業(yè)流程,從而優(yōu)化船舶在航線上的配置和減少航運業(yè)的燃油消耗量。
船舶大數(shù)據(jù)還可以應(yīng)用于船舶的水動力性能設(shè)計及節(jié)能裝置的效果驗證。
(1)通過對船舶航行數(shù)據(jù)分析處理,將不同等級波浪下的數(shù)據(jù)進行分類統(tǒng)計,了解波浪對船舶航速的影響,獲知船舶在波浪中消耗功率的相關(guān)數(shù)據(jù)信息后,就能驗證與評價不同船型的氣象因子。
(2)為驗證船舶節(jié)能裝置的效果,分別收集并統(tǒng)計安裝節(jié)能裝置前后的航行數(shù)據(jù)。通過大數(shù)據(jù)分析得到相關(guān)數(shù)據(jù)之間的關(guān)系,在消除自身因素(吃水、浮態(tài))和外界干擾因素(如風(fēng)、波浪、水流等)的影響后,就能評估節(jié)能裝置的效果。
本文以開發(fā)的船舶能源監(jiān)控系統(tǒng)為例,依托可視化、知識計算、深度學(xué)習(xí)3種方法,利用大數(shù)據(jù)分析技術(shù)從龐大的數(shù)據(jù)中快速抽出關(guān)鍵的信息,挖掘出對決策有潛在價值的模式和趨勢,為船舶的運營提供數(shù)據(jù)支撐。能源監(jiān)控系統(tǒng)構(gòu)架見圖1。
圖1 能源監(jiān)控系統(tǒng)構(gòu)架
系統(tǒng)通過數(shù)據(jù)記錄儀采集航速、航向、位置、風(fēng)速、風(fēng)向、舵角、吃水等航行數(shù)據(jù)和主機、發(fā)電機等機器的油耗、功率數(shù)據(jù),同時系統(tǒng)還能接收第三方機構(gòu)提供的氣象水文數(shù)據(jù)。利用大數(shù)據(jù)分析技術(shù),將油耗、功率、航速等信息以折線的形式進行可視化,實時監(jiān)控主機油耗信息,挖掘有價值的信息,提供船舶優(yōu)化轉(zhuǎn)速建議,以達到節(jié)能減排的效果。
由于環(huán)境因素影響或采集器故障可能導(dǎo)致數(shù)據(jù)偏差過大,因此,為保證數(shù)據(jù)的質(zhì)量和最終挖掘模型的質(zhì)量,需要對所采集的數(shù)據(jù)進行探索、審核和必要的加工處理。數(shù)據(jù)處理前需要設(shè)定異常數(shù)據(jù)的識別規(guī)則,將數(shù)據(jù)進行閾值比對,若數(shù)據(jù)偏離閾值范圍則被作為異常值刪除。
本文將大數(shù)據(jù)技術(shù)應(yīng)用于智能船舶領(lǐng)域中,主要采用了索引、數(shù)據(jù)規(guī)約、數(shù)據(jù)分割等技術(shù)。在管理數(shù)據(jù)庫的技術(shù)方面,索引技術(shù)不僅能減少磁盤讀寫開銷,還可以提高增刪改查的速度。在大數(shù)據(jù)集上直接進行復(fù)雜的數(shù)據(jù)分析和挖掘需要很長的時間,數(shù)據(jù)規(guī)約能產(chǎn)生更小的但保持原始數(shù)據(jù)完整性的新數(shù)據(jù)集。在規(guī)約后的數(shù)據(jù)集上進行分析和挖掘?qū)⒏咝?。?shù)據(jù)規(guī)范可以降低無效、錯誤數(shù)據(jù)對建模的影響,提高建模的準確性,縮減數(shù)據(jù)挖掘所需要的時間,降低存儲數(shù)據(jù)的成本。以采集頻率15 s為例,單船每年采集的數(shù)據(jù)記錄多達200多萬條,如果直接對大批量的數(shù)據(jù)進行操作,會使數(shù)據(jù)庫的執(zhí)行時間長、壓力大。一般將大批量數(shù)據(jù)分割成多塊較小的數(shù)據(jù),再對數(shù)據(jù)進行操作。本文實際采用的方法是首先創(chuàng)建臨時的數(shù)據(jù)表,將3 d的數(shù)據(jù)放入,對每天的數(shù)據(jù)進行取平均值等運算,再將運算完的1 d的數(shù)據(jù)存放入到新創(chuàng)建的數(shù)據(jù)表,降低了存儲數(shù)據(jù)的規(guī)模。
應(yīng)用C#語言編寫程序?qū)Σ杉臄?shù)據(jù)進行處理分析,并將數(shù)據(jù)保存在SQL數(shù)據(jù)庫中。在大數(shù)據(jù)應(yīng)用中,繁雜的數(shù)據(jù)本身是難以輔助決策的,需要運用可視化的分析方法,將分析后的結(jié)果以圖形、圖像處理、計算機視覺及用戶界面等形式展現(xiàn),更容易被船員接受并加以利用。從SQL數(shù)據(jù)庫中提取相關(guān)聯(lián)的數(shù)據(jù),并用折線圖實時表示出來,以便船員能夠直觀地了解到船舶性能參數(shù)變化。分析后的數(shù)據(jù)依靠衛(wèi)星通迅網(wǎng)絡(luò)和互聯(lián)網(wǎng)傳輸至岸基系統(tǒng),實現(xiàn)船舶與岸基的數(shù)據(jù)共享。岸基人員可以對船舶的狀態(tài)進行遠程監(jiān)控及故障診斷。
大數(shù)據(jù)挖掘是從大量的、不完全的數(shù)據(jù)中,通過一定的算法揭示隱藏于其中的、未知的并有潛在價值的信息的過程。數(shù)據(jù)挖掘是一種決策支持過程,主要基于人工智能、機器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、數(shù)據(jù)庫、可視化技術(shù)等,高度自動化地分析大量數(shù)據(jù),作出歸納性的推理,從中挖掘出潛在的模式[6]。
本文以船舶能源監(jiān)控系統(tǒng)采集的船舶航行數(shù)據(jù)為例,進行了深層次數(shù)據(jù)挖掘。依據(jù)船舶航行數(shù)據(jù),結(jié)合航次計劃(出港、靠泊港口時間)、航線特點、船舶效率,評估船舶燃料消耗及航行成本,給出最經(jīng)濟的航速方案,以降低燃油消耗。航速優(yōu)化系統(tǒng)界面見圖2。在航速優(yōu)化系統(tǒng)內(nèi)輸入預(yù)定的航行線路、艏艉吃水、燃油價格、出港及到港的預(yù)定時間,系統(tǒng)根據(jù)航線的形狀特點,將預(yù)定的航線分成許多航段。每個航段自動生成各自的初始航速,根據(jù)第三方機構(gòu)通過VAST衛(wèi)星網(wǎng)絡(luò)提供的氣象預(yù)報信息,得到每個航段內(nèi)考慮環(huán)境影響的速度功率關(guān)系,再根據(jù)功率與油耗率的關(guān)系得到每個航段內(nèi)的油耗。以總航程的油耗最低為目標條件,采用遺傳算法進行優(yōu)化,從而獲得每個航段內(nèi)的最優(yōu)航速。
圖2 船舶航速優(yōu)化系統(tǒng)
本文闡述了大數(shù)據(jù)的概念及其分析理論和方法,探討了大數(shù)據(jù)技術(shù)在船舶智能化中的應(yīng)用,深度挖掘了船舶運營數(shù)據(jù)信息的內(nèi)在價值。得出以下3點結(jié)論:
(1)大數(shù)據(jù)處理中具體采用的索引、數(shù)據(jù)規(guī)約、數(shù)據(jù)分割等技術(shù),對采集的數(shù)據(jù)進行必要的加工處理,有效保證了數(shù)據(jù)和挖掘模型的質(zhì)量。
(2)運用可視化的分析方法,將分析后的數(shù)據(jù)結(jié)果以多媒體形式在船上展現(xiàn)。依靠衛(wèi)星通訊系統(tǒng)和互聯(lián)網(wǎng)實現(xiàn)船舶與岸基之間大數(shù)據(jù)的共享,開展岸端遠程監(jiān)控、故障診斷等,以輔助船員決策。
(3)從采集的大量航行及設(shè)備數(shù)據(jù)中,通過一定的算法,深入挖掘出有價值的信息,實現(xiàn)船舶的智能化管理。