左毅 孫卓
摘要:近年,大量的數(shù)據(jù)朝著公開化發(fā)展,很多數(shù)據(jù)已經(jīng)可以在網(wǎng)絡(luò)上直接進(jìn)行存儲(chǔ)、讀寫乃至計(jì)算等操作。隨之而來的大數(shù)據(jù)時(shí)代和云計(jì)算時(shí)代,要求學(xué)生具備效率的數(shù)據(jù)存儲(chǔ)能力、快速的數(shù)據(jù)處理能力以及有效的數(shù)據(jù)分析能力。因此,在教學(xué)中針對(duì)以上三個(gè)主要問題,將引入云存儲(chǔ)和云計(jì)算等新一代信息技術(shù),并結(jié)合航海特色對(duì)實(shí)際數(shù)據(jù)進(jìn)行存儲(chǔ)、讀寫和分析等處理。使學(xué)生在大數(shù)據(jù)時(shí)代和云計(jì)算時(shí)代,掌握實(shí)際應(yīng)用的一系列相關(guān)技能和技術(shù)。
關(guān)鍵詞:云存儲(chǔ);云計(jì)算;大數(shù)據(jù);航??茖W(xué)與技術(shù);AIS數(shù)據(jù)
21世紀(jì)是海洋的世紀(jì),“向海則興,背海則衰”已在世界范疇形成廣泛共識(shí)。2019年,交通運(yùn)輸部聯(lián)合中央網(wǎng)信辦、國家發(fā)改委等7部門發(fā)布《智能航運(yùn)發(fā)展指導(dǎo)意見》,同樣為智能航運(yùn)未來30年發(fā)展指明方向,要求以一流的技術(shù)、一流的管理為“一帶一路”建設(shè)服務(wù)好,提升港口碼頭和航運(yùn)基礎(chǔ)設(shè)施的信息化智能化水平。根據(jù)《智能航運(yùn)發(fā)展指導(dǎo)意見》,將通過融合大數(shù)據(jù)、云計(jì)算、人工智能等新一代信息技術(shù)、建設(shè)“1個(gè)平臺(tái)+N個(gè)應(yīng)用”的綜合智能航運(yùn)示范工程,以突破關(guān)鍵技術(shù)瓶頸,填補(bǔ)國內(nèi)交叉學(xué)科領(lǐng)域的空白。
一、新技術(shù)需求下面臨的主要科學(xué)與技術(shù)問題
在各行各業(yè)都熱烈擁抱人工智能,推動(dòng)數(shù)字化改革的創(chuàng)新新時(shí)代,航運(yùn)業(yè)的信息化、網(wǎng)絡(luò)化乃至智能化的發(fā)展略顯滯后,甚至出現(xiàn)與時(shí)代脫節(jié)的種種跡象。究其原因,主要體現(xiàn)在以下幾個(gè)方面:
(1)現(xiàn)有的船舶管理多集中于線下服務(wù)、以人工為主,航企亟需從傳統(tǒng)的粗放管理模式向信息化的精細(xì)管理模式轉(zhuǎn)變。
(2)由于航運(yùn)業(yè)務(wù)建設(shè)的階段性,業(yè)務(wù)數(shù)據(jù)呈現(xiàn)出多樣性,采用不同的存儲(chǔ)方式,使得數(shù)據(jù)多源異構(gòu)問題尚未得到根本解決,航運(yùn)數(shù)字化進(jìn)程推展緩慢。
(3)缺乏深度挖掘海事大數(shù)據(jù)價(jià)值的系統(tǒng)性技術(shù)和智能化方法,在數(shù)據(jù)計(jì)算、結(jié)果分析以及決策支持等方面仍存在一定的技術(shù)性空白亟待填補(bǔ)。
二、新時(shí)代引領(lǐng)下航海類創(chuàng)新人才的必備條件
在“十四五”和國家一流學(xué)科建設(shè)規(guī)劃中,明確提出了“興海強(qiáng)校”發(fā)展戰(zhàn)略,并把海事大數(shù)據(jù)以及航運(yùn)通用人工智能等作為學(xué)科建設(shè)的重點(diǎn)科研發(fā)展方向。本課程旨在通過整合學(xué)校優(yōu)勢資源,圍繞主要研究方向開展聯(lián)合攻關(guān),以高素質(zhì)拔尖創(chuàng)新人才和學(xué)際融合數(shù)據(jù)科學(xué)家培養(yǎng)為首要目標(biāo),以建成交通運(yùn)輸工程以及海上信息工程領(lǐng)域航海類人才培養(yǎng)高地為最高遠(yuǎn)景。
(1)通過引入數(shù)據(jù)庫基礎(chǔ)知識(shí),使學(xué)生掌握數(shù)據(jù)的結(jié)構(gòu)化特點(diǎn),并能夠掌握效率化的存儲(chǔ)、讀寫等技巧。
(2)通過引入統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí),使學(xué)生具備數(shù)據(jù)分析能力,并掌握基本的數(shù)據(jù)可視化技術(shù)。
(3)應(yīng)用實(shí)驗(yàn)室的云平臺(tái),使學(xué)生掌握云存儲(chǔ)、云計(jì)算、機(jī)器學(xué)習(xí)等相關(guān)技能。
三、新一代信息技術(shù)在教學(xué)中的應(yīng)用實(shí)踐
本課程立足于新一代信息技術(shù)、交通運(yùn)輸工程與計(jì)算機(jī)科學(xué)的交叉學(xué)科領(lǐng)域,推動(dòng)技術(shù)進(jìn)程和產(chǎn)業(yè)進(jìn)程交互發(fā)展,培養(yǎng)航海類學(xué)生在大數(shù)據(jù)、云計(jì)算和人工智能三個(gè)方面的理論應(yīng)用與實(shí)踐創(chuàng)新。
3.1 AIS數(shù)據(jù)的云存儲(chǔ)
AIS(Automatic Identification System)即船舶自動(dòng)識(shí)別系統(tǒng),是一種不依賴于雷達(dá)的助航系統(tǒng),將船舶的航行信息包括經(jīng)緯度、航速、航向等信息實(shí)時(shí)的傳送至AIS基站以及附近船舶,多用于船舶航行監(jiān)管以及會(huì)遇預(yù)警等方面。在船舶高速行駛中,AIS的傳輸頻次高達(dá)2秒/次,即使在使用信息壓縮等技術(shù)前提下,依然會(huì)產(chǎn)生海量數(shù)據(jù),也使得AIS數(shù)據(jù)成為真正意義上的大數(shù)據(jù)。本課程中,將通過非關(guān)系型數(shù)據(jù)庫來對(duì)AIS數(shù)據(jù)進(jìn)行存儲(chǔ),并將AIS數(shù)據(jù)庫置于云端服務(wù)器,解決多用戶同時(shí)訪問帶來的高并發(fā)問題。同時(shí),課程給學(xué)生提供多樣化的終端訪問,包括個(gè)人電腦和智能手機(jī),讓學(xué)生可以隨時(shí)隨地的訪問AIS數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行各種操作。
3.2 AIS數(shù)據(jù)的云計(jì)算
在存儲(chǔ)空間受限、以及通信實(shí)效性高等前提要求下,AIS數(shù)據(jù)通常采用了壓縮編碼的方式進(jìn)行存儲(chǔ),僅在需要的時(shí)候,利用解碼技術(shù)將數(shù)據(jù)轉(zhuǎn)化為實(shí)際的AIS數(shù)據(jù)。通常需要轉(zhuǎn)化的數(shù)據(jù)包括:記錄時(shí)間、經(jīng)緯度、航速和航向。授課中,學(xué)生可以通過各自的客戶終端對(duì)服務(wù)器云端的數(shù)據(jù)進(jìn)行直接訪問,根據(jù)船舶的MMSI(Maritime Mobile Service Identify)水上移動(dòng)通信業(yè)務(wù)標(biāo)識(shí)碼提取目標(biāo)船舶的航跡信息。之后,根據(jù)各自需求,可以將提取的AIS數(shù)據(jù)下載到本地,以便后續(xù)進(jìn)行分析。
3.3 AIS數(shù)據(jù)的應(yīng)用實(shí)踐
本課程在應(yīng)用實(shí)踐方面,將引導(dǎo)學(xué)生自主完成基于AIS數(shù)據(jù)的航跡預(yù)測專家系統(tǒng)建立,包括以下3項(xiàng)內(nèi)容:
(1)AIS數(shù)據(jù)的預(yù)處理:主要是剔除AIS數(shù)據(jù)中異常點(diǎn)的過程,包含位置異常點(diǎn)、航速異常點(diǎn)以及航向異常點(diǎn)。位置異常點(diǎn)通常指航跡位置信息超出目標(biāo)區(qū)域邊界,通過邊界約束條件來剔除異常點(diǎn);航速異常點(diǎn)和航向異常點(diǎn)通常指相鄰兩點(diǎn)的航速/航向變化超過規(guī)定閾值,通過閾值來判定并剔除異常點(diǎn)。
(2)航跡的特征提?。和ǔ2捎玫姆椒ㄓ蠨P法(Douglas–Peucker algorithm)和LCSCA(Least-squares Cubic Spline Curves Approximation)最小二乘三次樣條擬合算法,在保持航跡復(fù)現(xiàn)率的情況,優(yōu)化航跡的簡化率。
(3)航跡擬合及預(yù)測:為學(xué)生提供線性回歸、支持向量回歸以及人工神經(jīng)網(wǎng)絡(luò)等方法,讓學(xué)生自主完成航跡預(yù)測模型的建立,形成從數(shù)據(jù)的存儲(chǔ)讀寫、計(jì)算分析到應(yīng)用實(shí)踐的體系化閉環(huán)培養(yǎng)模式。
四、結(jié)語
隨著大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)的推進(jìn),各行各業(yè)在規(guī)劃、管理、決策等方面都要以大數(shù)據(jù)分析為基礎(chǔ),依托云計(jì)算平臺(tái)的支撐,通過基于人工智能的專家系統(tǒng)來提供決策支持服務(wù)。因此,在推動(dòng)技術(shù)進(jìn)程和產(chǎn)業(yè)進(jìn)程交互發(fā)展的雙輪驅(qū)動(dòng)下,滿足產(chǎn)業(yè)發(fā)展需求的數(shù)據(jù)科學(xué)家成為新一代信息技術(shù)時(shí)代最為緊缺的人才。所以,本課程以培養(yǎng)能夠科學(xué)地分析各行各業(yè)大數(shù)據(jù)的專業(yè)型人才為目標(biāo),使學(xué)生們掌握云存儲(chǔ)和云計(jì)算等實(shí)際應(yīng)用的一系列技能和技術(shù),為學(xué)生們提供數(shù)理統(tǒng)計(jì)、計(jì)算機(jī)科學(xué)、人工智能等交叉學(xué)科領(lǐng)域的跨學(xué)科教育體制,拓展他們的學(xué)術(shù)視野,助力他們成為新一代學(xué)際融合數(shù)據(jù)科學(xué)家,為各行各業(yè)提供高素質(zhì)拔尖創(chuàng)新人才。
參考文獻(xiàn):
[1]交通運(yùn)輸部.智能航運(yùn)發(fā)展指導(dǎo)意見.交海發(fā)〔2019〕66號(hào),2019.
[2]李建中、王珊.數(shù)據(jù)庫系統(tǒng)原理.電子工業(yè)出版社,2008.
[3]劉志紅. Excel統(tǒng)計(jì)分析與應(yīng)用.電子工業(yè)出版社,2016.
[4]Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer,2006.
本文系遼寧省教育廳普通高等學(xué)校校際合作項(xiàng)目委托課題“研究生聯(lián)合培養(yǎng)”(10151)的成果之一。
作者簡介:
左毅,大連海事大學(xué)航海學(xué)院特聘教授/海事大數(shù)據(jù)與航運(yùn)通用人工智能協(xié)同創(chuàng)新中心主任,博士研究生,從事數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能等研究;
孫卓,大連海事大學(xué)交通運(yùn)輸管理學(xué)院教授,博士研究生。