張曉天, 張平靜
(中遠(yuǎn)海運科技股份有限公司, 上海 200135)
航運企業(yè)動態(tài)數(shù)據(jù)可視化方法研究
張曉天, 張平靜
(中遠(yuǎn)海運科技股份有限公司, 上海 200135)
大數(shù)據(jù)時代的來臨使得數(shù)據(jù)作為一種無形的資產(chǎn)受到越來越多企業(yè)的重視。當(dāng)前航運企業(yè)正處于十分激烈的市場競爭環(huán)境中,大數(shù)據(jù)已成為航運企業(yè)洞悉市場規(guī)律、贏得生存和發(fā)展先機(jī)的新武器。通過對R語言動態(tài)數(shù)據(jù)可視化技術(shù)進(jìn)行分析,結(jié)合航運企業(yè)數(shù)據(jù)管理和決策支持的現(xiàn)狀,構(gòu)建一套表現(xiàn)具備時間和空間雙重維度數(shù)據(jù)的可視化方法,可幫助企業(yè)更直觀地發(fā)現(xiàn)數(shù)據(jù)中隱藏的規(guī)律。
R語言;數(shù)據(jù)可視化;數(shù)據(jù)地圖
“大數(shù)據(jù)”在當(dāng)今的商業(yè)社會中扮演著越來越重要的角色,貫穿于企業(yè)運營的整個生命周期,關(guān)乎企業(yè)的生存和發(fā)展,受到越來越多企業(yè)的重視。如何依托當(dāng)前先進(jìn)的大數(shù)據(jù)技術(shù)挖掘出海量數(shù)據(jù)背后蘊含的價值,是每個現(xiàn)代企業(yè)都必須面對和思考的問題。
1.1航運業(yè)大數(shù)據(jù)發(fā)展趨勢分析
大數(shù)據(jù)時代來臨是當(dāng)今社會一股不可逆轉(zhuǎn)的潮流,越來越多的企業(yè)開始關(guān)注數(shù)據(jù)資產(chǎn)的價值。現(xiàn)代航運企業(yè)一般經(jīng)歷了多年的企業(yè)信息化建設(shè),具備比較完善的數(shù)據(jù)采集和管理條件,在多年的運營過程中收集了大量的數(shù)據(jù)。這些數(shù)據(jù)具有維度多、頻度密、帶有時間和空間等屬性,能真實地反映企業(yè)經(jīng)營的健康狀況和市場規(guī)律,使得航運企業(yè)具備大數(shù)據(jù)分析的基礎(chǔ)。此外,企業(yè)如何在坐擁龐大數(shù)據(jù)資產(chǎn)的同時,建立一種有效利用數(shù)據(jù)產(chǎn)生附加價值的手段,是在大數(shù)據(jù)背景下每個企業(yè)都在思考的問題。借助大數(shù)據(jù)技術(shù),通過全面細(xì)致地分析生產(chǎn)數(shù)據(jù),航運企業(yè)可實現(xiàn)航線和船舶的精準(zhǔn)運營,掌握全球不同地區(qū)的運力部署情況,明確各港口的貨物運輸需求量,進(jìn)而優(yōu)化航線配置、提升準(zhǔn)班率。同時,借助大數(shù)據(jù)分析技術(shù)可優(yōu)化班輪的航線速度,節(jié)約船舶的燃油消耗,降低企業(yè)運營成本[1]。此外,數(shù)據(jù)可視化技術(shù)的研究近年來愈發(fā)火熱,借助先進(jìn)的數(shù)據(jù)可視化技術(shù)能更加直觀地揭示數(shù)據(jù)中隱含的商業(yè)規(guī)律和潛在商業(yè)價值,能幫助企業(yè)推進(jìn)商業(yè)模式的創(chuàng)新,這對同質(zhì)化競爭激烈的航運業(yè)而言十分重要。
1.2航運企業(yè)數(shù)據(jù)利用問題
Z集裝箱航運企業(yè)成立于1997年,是全球領(lǐng)先的集裝箱班輪運輸企業(yè),其信息化建設(shè)至今,已在公司的日常運營過程中積累大量數(shù)據(jù)。一份海運合同的履行,從制訂班期、客戶訂艙開始,到客戶提貨、結(jié)清費用,整個過程步驟眾多,涉及到的數(shù)據(jù)主要有航次信息、客戶資料、船舶信息、集裝箱動態(tài)、提單數(shù)據(jù)、合同信息和費用信息等。這些數(shù)據(jù)不僅在企業(yè)內(nèi)部各系統(tǒng)之間流轉(zhuǎn),還通過主流EDI格式與海關(guān)、碼頭及收發(fā)貨人等外部單位交互。企業(yè)為存儲和管理這些運營數(shù)據(jù),必須投入一定的資源,而數(shù)據(jù)價值卻得不到充分挖掘,企業(yè)在數(shù)據(jù)管理中的投入和產(chǎn)出嚴(yán)重不成比例,使得企業(yè)管理成本增加。
造成數(shù)據(jù)價值難以產(chǎn)生的一個重要原因是沒有有效的數(shù)據(jù)分析和展現(xiàn)方式。目前Z航運企業(yè)內(nèi)部數(shù)據(jù)分析和展現(xiàn)方式主要有以下2種。
1.2.1 使用Microsoft Excel
目前Z航運企業(yè)內(nèi)部數(shù)據(jù)管理仍有一部分需借助Microsoft Excel來完成,有些是人工制作的Excel表格,有些是借助業(yè)務(wù)系統(tǒng)導(dǎo)出的表格(見圖1)。Excel表格的優(yōu)勢在于方便、易用和硬件環(huán)境要求低,而其不足之處在于需投入一定的人力進(jìn)行表格制作,數(shù)據(jù)的展現(xiàn)方式有限(如無法準(zhǔn)確展現(xiàn)具有時空維度的數(shù)據(jù)),同時無法滿足復(fù)雜的數(shù)據(jù)建模要求。
1.2.2 業(yè)務(wù)系統(tǒng)導(dǎo)出固定報表
多年的信息化建設(shè)使得Z航運企業(yè)建立有十分完備的業(yè)務(wù)系統(tǒng),這些業(yè)務(wù)系統(tǒng)是企業(yè)業(yè)務(wù)數(shù)據(jù)的主要入口,在輔助業(yè)務(wù)正常運行的同時,承擔(dān)著對業(yè)務(wù)數(shù)據(jù)進(jìn)行初級分析和展示的任務(wù)。在系統(tǒng)的建設(shè)過程中,企業(yè)管理層不斷地對業(yè)務(wù)系統(tǒng)提出各種數(shù)據(jù)上報的要求,因此業(yè)務(wù)系統(tǒng)內(nèi)逐步開發(fā)出滿足各種統(tǒng)計上報要求的報表。但是,受制于業(yè)務(wù)系統(tǒng)的架構(gòu)設(shè)計,這些上報報表格式固定,僅能完成對數(shù)據(jù)的匯總、篩選和排序等初級分析工作,沒有更加直觀、生動的展現(xiàn)形式,因此也不能有效挖掘數(shù)據(jù)價值。
綜上所述,當(dāng)前這種數(shù)據(jù)管理現(xiàn)狀造成企業(yè)投入的資金和擁有的數(shù)據(jù)資產(chǎn)的雙重浪費,選擇一套簡單高效的大數(shù)據(jù)分析方法是航運企業(yè)的當(dāng)務(wù)之急。R語言在開發(fā)之初就被用來進(jìn)行數(shù)據(jù)分析,具有簡單的語法、豐富的函數(shù)和擴(kuò)展包,支持復(fù)雜的數(shù)據(jù)模型及豐富的可視化技術(shù),可應(yīng)用到航運企業(yè)的大數(shù)據(jù)分析工作中。
2.1R語言與可視化技術(shù)
對于人類而言,視覺帶來的感受往往更加直接,人們在分析大量數(shù)據(jù)時更傾向于依托視覺的方式。因此,創(chuàng)造出很多數(shù)據(jù)可視化工具,諸如Google Spreadsheets,IBM Many Eyes,Tableau Software等。然而,這些工具主要關(guān)注快速、方便和美觀等特點,適合小數(shù)據(jù)量及新人使用,當(dāng)數(shù)據(jù)量級增大,需做可定制化的深入分析并輸出印刷品質(zhì)的圖像時,這些工具可能無法滿足要求。因此,需借助可編程語言的可視化技術(shù),例如R語言。
R語言從誕生之初就是為數(shù)據(jù)分析設(shè)計的,不僅是一門程序化語言,更是一整套數(shù)據(jù)分析的解決方案。R語言最大的特點是免費、開源,且使用非常靈活。此外,R語言包含十分豐富的擴(kuò)展包,從數(shù)據(jù)模型、分析工具,到繪圖工具、數(shù)據(jù)接口等,幾乎全部包含,方便統(tǒng)計人員應(yīng)對各種統(tǒng)計場景。以ggplot2為代表的一系列繪圖包為R語言數(shù)據(jù)可視化提供了強(qiáng)大的支持。
ggplot2繪圖包由Hadley Wickham開發(fā),經(jīng)過多年的演化完善逐漸成為R語言數(shù)據(jù)可視化技術(shù)的主流選擇。ggplot2具有美觀優(yōu)雅的圖形外觀和極其強(qiáng)大的語法特性,采用圖層和映射的設(shè)計理念,允許用戶分層構(gòu)建和修改圖形,將數(shù)據(jù)屬性映射到視覺屬性,這些特性使得ggplot2能以非常簡潔的語法來構(gòu)建復(fù)雜的圖形,非常精細(xì)地控制可視化的展現(xiàn)方式,同時保持很高的繪圖品質(zhì)[2]。
2.2數(shù)據(jù)地圖技術(shù)
地圖作為分析空間數(shù)據(jù)的一種傳統(tǒng)方法,在當(dāng)今的大數(shù)據(jù)時代依然值得關(guān)注。對于包含地理信息的空間數(shù)據(jù),將其與地圖上的經(jīng)緯度坐標(biāo)相結(jié)合,能在地圖上直觀地展現(xiàn)數(shù)據(jù)的空間分布,便于人們通過眼睛直接發(fā)現(xiàn)數(shù)據(jù)及其分布中蘊含的規(guī)律。要繪制數(shù)據(jù)地圖,需依托詳細(xì)的地理測繪信息,特別是地理坐標(biāo)信息。最常用的一種方法是利用第三方提供的地圖API,例如Google和Microsoft地圖。然而,這種地圖的定制化程度很低,其外觀與原生的Google和Microsoft地圖基本沒有區(qū)別,無法滿足特定統(tǒng)計場景下的主題要求。
為應(yīng)對企業(yè)環(huán)境下多樣性的數(shù)據(jù)地圖需求,很多第三方機(jī)構(gòu)或個人開發(fā)靈活而詳細(xì)的矢量地理信息庫,為數(shù)據(jù)地圖開發(fā)者提供更加靈活的解決方案。這其中最重要、應(yīng)用最廣泛的就是Shapefile格式文件。Shapefile是美國環(huán)境系統(tǒng)研究所開發(fā)的一種空間數(shù)據(jù)格式,目前已成為地理信息軟件領(lǐng)域的一種開放標(biāo)準(zhǔn)。Shapefile由一系列包含位置信息的矢量幾何圖形組成,由于是矢量圖形,因此任意縮放都不會影響輸出圖像的質(zhì)量。
Natural Earth是一個由志愿者開發(fā)的公共區(qū)域地圖數(shù)據(jù)集,已得到北美制圖信息協(xié)會的支持,該數(shù)據(jù)集提供1∶10 000 000,1∶50 000 000和1∶110 000 000等3種比例的Shapefile格式矢量地圖文件。作為一個定制化地圖開發(fā)便捷資源的提供方,Natural Earth不像用于科學(xué)研究和軍事用途的地圖數(shù)據(jù),其從設(shè)計之初就是為滿足地圖繪制者從事與生產(chǎn)作業(yè)相關(guān)的制圖工作,且這種工作可使用多種多樣的軟件應(yīng)用來實現(xiàn)。Natural Earth地圖數(shù)據(jù)庫包含文化矢量數(shù)據(jù)主題、物理矢量數(shù)據(jù)主題和光柵數(shù)據(jù)主題等三大數(shù)據(jù)主題(見圖2~圖4),其中:文化矢量數(shù)據(jù)主題包含國家、區(qū)域、省份、居民區(qū)、城市區(qū)域、公園和保護(hù)區(qū)、太平洋島國及水域邊界等內(nèi)容;物理矢量數(shù)據(jù)主題主題包含海岸線、陸地、海洋、群島、珊瑚礁、河流湖泊、冰川、南極冰架及經(jīng)緯度等內(nèi)容;光柵數(shù)據(jù)主題主題則包含衛(wèi)星測繪得到的大陸、洋底的混合地形數(shù)據(jù)。由于Natural Earth地圖數(shù)據(jù)庫包含的數(shù)據(jù)種類繁多、內(nèi)容詳細(xì),可滿足大部分定制化地圖開發(fā)的要求。
3.1收集和處理數(shù)據(jù)
R語言擁有豐富的擴(kuò)展包,允許使用者以多種方式收集數(shù)據(jù)。R語言支持從鍵盤直接輸入數(shù)據(jù),使用者也可從文本文件、Microsoft Excel和Access、多種統(tǒng)計軟件、特殊格式的文件及關(guān)系型數(shù)據(jù)庫中導(dǎo)入數(shù)據(jù)[3]。
對于企業(yè)級應(yīng)用,特別是在已存在大型數(shù)據(jù)庫的情況下,通過設(shè)置數(shù)據(jù)庫驅(qū)動來允許R語言訪問外部數(shù)據(jù)庫是一種常用且高效的手段,同時可發(fā)揮SQL語言和R語言各自的優(yōu)勢。R語言的優(yōu)勢在于對數(shù)據(jù)進(jìn)行分析,而SQL語言的優(yōu)勢在于數(shù)據(jù)管理。在檢索原始數(shù)據(jù)時,可使用SQL語言對數(shù)據(jù)進(jìn)行清洗,例如篩選、匯總、排序及空值轉(zhuǎn)換等操作,然后將整理好的數(shù)據(jù)導(dǎo)入到R語言中進(jìn)行分析。要在R語言中使用SQL語言訪問外部數(shù)據(jù)庫,首先需加載RODBC包并設(shè)置數(shù)據(jù)庫連接。在編寫SQL語言腳本進(jìn)行數(shù)據(jù)抽取之前,要明確從業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫抽取數(shù)據(jù)的維度,排除不必要的信息,需抽取的業(yè)務(wù)信息主要有預(yù)計離港時間、箱量(TEU)、目的港名稱和目的港所屬國家代碼,其中箱量按月份匯總,并進(jìn)行標(biāo)準(zhǔn)化處理,按箱型轉(zhuǎn)換為統(tǒng)一的計量單位TEU,以方便統(tǒng)計計算。在從業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫抽取數(shù)據(jù)時,還進(jìn)行一些基本的數(shù)據(jù)清洗工作,例如過濾目的港名稱為空的數(shù)據(jù)等很可能是錯誤數(shù)據(jù)或非出口業(yè)務(wù)數(shù)據(jù),然后將數(shù)據(jù)按預(yù)計離港時間排序(見圖6)。
3.2導(dǎo)入Shapefile地理信息
為展現(xiàn)出口箱量在全球的分布情況,選擇Natural Earth提供的陸地多邊形矢量數(shù)據(jù)集(ne_10m_land.shp),該數(shù)據(jù)集以標(biāo)準(zhǔn)的Shapefile格式存儲大陸及主要島嶼的海岸線數(shù)據(jù),不包含行政區(qū)劃分界,以避免數(shù)據(jù)地圖上圖形過于復(fù)雜,導(dǎo)致觀察者難以獲取地圖傳遞的信息(見圖7)。此外,為在地圖背景上繪制相關(guān)目的港的位置,還需導(dǎo)入港口經(jīng)緯度數(shù)據(jù),這里選擇Natural Earth提供的全球主要居民區(qū)坐標(biāo)數(shù)據(jù)集(ne_10m_populated_places.shp),而非港口坐標(biāo)數(shù)據(jù)集,主要是因為并非所有業(yè)務(wù)的目的港都是主要港口,可能涉及內(nèi)陸點,因此居民區(qū)坐標(biāo)數(shù)據(jù)要比全球主要港口數(shù)據(jù)更加全面(見圖8)。通過加載maptools擴(kuò)展包,R語言就可讀取該數(shù)據(jù)集對應(yīng)的Shapefile格式文件,使用readShapePoly命令讀取陸地多邊形矢量數(shù)據(jù)集,使用readShapePoints命令讀取居民區(qū)坐標(biāo)數(shù)據(jù)集,文件讀取后還需轉(zhuǎn)換為數(shù)據(jù)框才可用于繪制矢量地圖。居民區(qū)坐標(biāo)數(shù)據(jù)集導(dǎo)入之后,由于一些居民區(qū)會有多個距離不遠(yuǎn)的坐標(biāo),因此需去掉多余坐標(biāo),只需保留1個即可,以避免在整合箱量數(shù)據(jù)和坐標(biāo)數(shù)據(jù)時出現(xiàn)重復(fù)。
地理信息數(shù)據(jù)導(dǎo)入后,還需將集裝箱出口業(yè)務(wù)數(shù)據(jù)和地理信息數(shù)據(jù)整合到一起,匹配的依據(jù)是地名和國家代碼,例如Alexandria,Queenstown,Richmond等地名在不同國家均存在,因此用符合ISO 3166標(biāo)準(zhǔn)的2位國家代碼加以區(qū)分。此外,在匹配時還需去掉地名中的空格,并統(tǒng)一為大寫字符,以保證匹配正確。
整合之后的數(shù)據(jù)混合在一個數(shù)據(jù)集中,為針對不同目的港的箱量數(shù)據(jù)進(jìn)行數(shù)據(jù)可視化繪制,需對出口箱量數(shù)據(jù)按目的港名稱進(jìn)行分組,并分解為以目的港名稱命名的多個子數(shù)據(jù)集。分組之后,并非所有港口在整個統(tǒng)計時間范圍內(nèi)都有箱量數(shù)據(jù),有些港口可能因為貨源或其他外部因素,導(dǎo)致部分月份缺少所需數(shù)據(jù)。因此,需將缺少的字段補(bǔ)全,統(tǒng)計月份按照時間順序補(bǔ)全,箱量賦值為0,港口名稱、國家代碼和經(jīng)緯度與其他記錄相同。
3.3繪制動態(tài)數(shù)據(jù)地圖
3.3.1 繪制地圖背景
使用已導(dǎo)入的陸地多邊形矢量數(shù)據(jù)集繪制世界地圖背景,為體現(xiàn)一種簡約、素雅的可視化風(fēng)格,地圖背景整體呈淺色,海洋部分使用白色填充,陸地部分使用灰色填充,同時設(shè)置陸地部分的透明度為60%。使用主題設(shè)置函數(shù)theme()去掉背景網(wǎng)格線、坐標(biāo)軸及坐標(biāo)軸標(biāo)題及圖例,并調(diào)節(jié)圖形顯示高度以便隱藏南北極,得到的世界地圖背景(見圖9)。
3.3.2 繪制各目的港箱量分布
ggplot2擴(kuò)展包最強(qiáng)大的地方在于可單獨控制、添加和刪除組件,因此將每個目的港數(shù)據(jù)集作為一個繪圖組件單獨繪制,方便對每個港口展現(xiàn)的美學(xué)特征進(jìn)行調(diào)整。將數(shù)據(jù)的展現(xiàn)圖形設(shè)置為紅色圓環(huán),圓環(huán)的大小反映數(shù)據(jù)的大小。由于不同港口的箱量數(shù)據(jù)差異很大,直接顯示會導(dǎo)致有些港口的圖形過大,覆蓋其他港口的圖形;此外,有些港口的圖形只是一個微小的點,很難觀察其演變趨勢,需對箱量數(shù)據(jù)進(jìn)行對數(shù)轉(zhuǎn)換,對數(shù)轉(zhuǎn)換不會消除數(shù)據(jù)的趨勢和相關(guān)關(guān)系,而是壓縮數(shù)據(jù)的尺度,使數(shù)據(jù)變得更加平穩(wěn),轉(zhuǎn)換前提是數(shù)據(jù)中不包含負(fù)數(shù)。
3.3.3 生成GIF動畫
GIF動畫在本質(zhì)上是很多張圖片按一定的順序逐幀播放的結(jié)果,這里生成的GIF動畫也是基于該原理。從2010年1月—2016年3月,每個月繪制1張所有港口在該月份箱量的分布圖,就得到75幀圖片,然后通過ImageMagick軟件將75幀圖片組合生成GIF動畫,設(shè)置每幀動畫時間間隔為0.12 s,并增加每幀動畫的日期顯示,得到最終的動態(tài)數(shù)據(jù)地圖(見圖10)。為方便說明,只截取動態(tài)圖中的一部分來說明。
從全球分布來看,Z航運企業(yè)的出口箱量流向分布主要集中在歐洲、北美和東南亞,東亞的日本和韓國也是貨物的主要出口國。歐洲一直是Z航運企業(yè)出口箱量的主要流向,是企業(yè)收入的主要來源之一。由圖10可知,北歐、波羅的海沿岸國家一直保持著穩(wěn)定的箱量水平,地中海國家的箱量經(jīng)過了一個早期的發(fā)展階段,特別是意大利箱量的增加成為歐洲的亮點。
對于經(jīng)營集裝箱班輪的航運企業(yè)而言,北美也是其重點經(jīng)營的區(qū)域之一。由圖10可知,Z航運企業(yè)出口到美西和美東的箱量呈現(xiàn)出不同的特點。美西區(qū)域的箱量主要集中在幾個大的港口,且常年保持穩(wěn)定;美東區(qū)域的箱量在集中在幾個大的港口的同時,隨著時間的推移逐漸新增一些較小的箱量分布點,很可能是因為加大了美東航線的開發(fā)力度??傮w來看,北美區(qū)域的箱量經(jīng)歷了一個初期的增長過程,并持續(xù)保持穩(wěn)定,為企業(yè)的發(fā)展提供了持續(xù)的收入來源。
此外,南美西岸的箱量穩(wěn)中有增,南美東岸市場的箱量呈下滑趨勢,而東南亞、中東、黑海、西部非洲和新西蘭等地區(qū)的箱量分布也呈現(xiàn)出增長的趨勢,這與這些地區(qū)的經(jīng)濟(jì)發(fā)展及Z航運企業(yè)積極開辟新市場等因v
動態(tài)數(shù)據(jù)地圖非常清晰地展現(xiàn)出Z航運企業(yè)從2010年到2016年全球出口集裝箱箱量的分配情況及發(fā)展趨勢,分析的基礎(chǔ)是企業(yè)生產(chǎn)經(jīng)營中產(chǎn)生的數(shù)據(jù),因此其展現(xiàn)出來的內(nèi)容也是真實、客觀的,企業(yè)的管理者在此基礎(chǔ)上做出的決策將更加科學(xué)、合理,真正做到在數(shù)據(jù)驅(qū)動下的決策。
通過對企業(yè)動態(tài)數(shù)據(jù)可視化進(jìn)行研究可知,對大量數(shù)據(jù)進(jìn)行有效組織,從多個角度對數(shù)據(jù)進(jìn)行剖析和開發(fā),運用色彩化的圖形圖像來表現(xiàn)具有復(fù)雜維度的數(shù)據(jù),能成為信息傳達(dá)和溝通的一種有效手段[4]。通過繪制動態(tài)圖像可表現(xiàn)數(shù)據(jù)在一定時間范圍內(nèi)的變化情況,使人們更容易發(fā)現(xiàn)數(shù)據(jù)中隱藏的季節(jié)規(guī)律和時間趨勢;將其與數(shù)據(jù)地圖結(jié)合起來,非常有利于展現(xiàn)同時具有時空特征的數(shù)據(jù)。此外,大數(shù)據(jù)的分析方法盤活了企業(yè)的數(shù)據(jù)資產(chǎn),幫助企業(yè)的管理者發(fā)現(xiàn)問題、做出科學(xué)合理的決策,使企業(yè)對數(shù)據(jù)管理的投入產(chǎn)生新的價值。
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)呈爆發(fā)式增長。在電子技術(shù)和信息技術(shù)的幫助下,航運企業(yè)在日常運營過程中獲得數(shù)據(jù)的手段越來越多,例如通過船舶雷達(dá)與感應(yīng)裝置時刻獲得船舶運行狀態(tài)與水文信息,通過RFID技術(shù)、GPS技術(shù)和多功能傳感器技術(shù)獲得集裝箱的運輸狀態(tài),通過EDI數(shù)據(jù)交互、互聯(lián)網(wǎng)技術(shù)獲得業(yè)務(wù)數(shù)據(jù)等。航運企業(yè)擁有非常廣闊的大數(shù)據(jù)應(yīng)用場景,如何開發(fā)新的大數(shù)據(jù)分析和可視化技術(shù)、充分挖掘數(shù)據(jù)中蘊含的價值,是值得航運企業(yè)不斷思考和探索的課題。
[1] 李舜,新常態(tài)下航運企業(yè)的商業(yè)模式創(chuàng)新[J].交通企業(yè)管理,2015(12):19-21.
[2] CHANG W. R Graphics Cookbooks[M]. 北京: 人民郵電出版社, 2014.
[3] KABACOFF R I. R in Action:Data Analysis and Graphics with R[M]. 北京:人民郵電出版社, 2013:158.
[4] 彭戎軒.數(shù)據(jù)可視化技術(shù)應(yīng)用趨勢與類型分析[J].西部資源,2015(6):84-85.
VisualizationofShippingCompanyDatawithR
ZHANGXiaotian,ZHANGPingjing
(COSCO SHIPPING Technology Co., Ltd., Shanghai 200135, China)
Big Data era is coming, and more and more enterprises are increasingly paying attention to the intangible assets. Shipping companies are in a very competitive market environment, and Big Data has become a new weapon for them to gain insights into the market and find the opportunities of survival and development. This paper analyzes the dynamic data visualization technology in R, and presents the implementation of time-space 2-dimentional visualization of shipping data, particularly for data management and decision-making support of shipping companies.
R; data visualization; data map
TP311
A
2017-06-05
張曉天(1984—),男,遼寧錦州人,助理工程師,碩士,主要從事集裝箱航運系統(tǒng)工作。
1674-5949(2017)03-0077-08