文/聶虎
隨著計(jì)算機(jī)技術(shù)的高速發(fā)展和物聯(lián)網(wǎng)在能源領(lǐng)域的運(yùn)用,獲取的能源數(shù)據(jù)量越來越大,且呈現(xiàn)出高維、多態(tài)、多場景和動(dòng)態(tài)性等特征。如何有效的展示海量能源數(shù)據(jù),對(duì)于政府和企業(yè)理解數(shù)據(jù)的意義、發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的規(guī)律、作出正確的決策,意義重大。通過將能源數(shù)據(jù)可視化,借助人眼快速的視覺感知和人腦的智能認(rèn)知能力,能夠有助于高效的理解海量數(shù)據(jù),并輔助數(shù)據(jù)分析。
能源數(shù)據(jù)產(chǎn)生于能源生產(chǎn)和消費(fèi)過程,可以通過統(tǒng)計(jì)調(diào)查、實(shí)時(shí)采集等方式獲取。統(tǒng)計(jì)調(diào)查是有組織和目的的搜集數(shù)據(jù),有明確的統(tǒng)計(jì)對(duì)象和調(diào)查表格,一般由政府部門和行業(yè)協(xié)會(huì)發(fā)起,此類能源數(shù)據(jù)結(jié)構(gòu)化強(qiáng),價(jià)值密度高,反映的意義明確;實(shí)時(shí)采集是供能和用能企業(yè)通過智能設(shè)備采集能源生產(chǎn)和消費(fèi)過程中產(chǎn)生的實(shí)時(shí)數(shù)據(jù),此類能源數(shù)據(jù)體量大,結(jié)構(gòu)化和非結(jié)構(gòu)化并存,價(jià)值密度低,通過數(shù)據(jù)挖掘能反映潛在規(guī)律。
能源數(shù)據(jù)體系龐大復(fù)雜,具備高維、多態(tài)、多場景和動(dòng)態(tài)性等特征。具體來說,從品種看,就包括煤炭、石油、天然氣、電力、新能源和可再生能源等,從業(yè)務(wù)看,又可分為能源資源、能源消費(fèi)、能源生產(chǎn)、能源供應(yīng)、能源貿(mào)易、能源價(jià)格和能源效率等,從時(shí)序看,有實(shí)時(shí)、日度、周度、旬度、月度、季度、年度等,從粒度看,企業(yè)和地區(qū)等數(shù)據(jù)粒度較小,行業(yè)和國別等數(shù)據(jù)粒度較大。
陳為、沈則潛、陶煜波等著的《數(shù)據(jù)可視化》中,定義數(shù)據(jù)可視化為綜合運(yùn)用計(jì)算機(jī)圖形學(xué)、圖像、人機(jī)交互等技術(shù)、將采集或模擬的數(shù)據(jù)映射為可識(shí)別的圖形、圖像、視頻或動(dòng)畫,并允許用戶對(duì)數(shù)據(jù)進(jìn)行交互分析的理論、方法和技術(shù)。數(shù)據(jù)可視化遵循成熟的流程框架,比較有代表性的有科學(xué)可視化的早期可視化流水線和信息可視化參考流程,前者是單向流程,描述將數(shù)據(jù)映射到可視空間,重點(diǎn)突出數(shù)據(jù)處理和圖形繪制,后者將前者的單向流程改為具備用戶交互的雙向流程,且用戶可在任何階段進(jìn)行交互,突出了用戶的重要性。如圖1和圖2所示。
總結(jié)上述經(jīng)典流程模型,數(shù)據(jù)可視化流程主要包括三個(gè)方面:
(1)數(shù)據(jù)表示與轉(zhuǎn)換。此部分是數(shù)據(jù)可視化的基礎(chǔ),重點(diǎn)在于將數(shù)據(jù)由原始狀態(tài)轉(zhuǎn)換為便于計(jì)算機(jī)進(jìn)行可視化處理和展現(xiàn)的狀態(tài)。
(2)數(shù)據(jù)可視化的呈現(xiàn)。此部分將處理后的數(shù)據(jù)轉(zhuǎn)換為可視化形式并呈現(xiàn)給用戶,由于同一數(shù)據(jù)集可能存在多種視覺呈現(xiàn)形式,因此重點(diǎn)和難點(diǎn)在于從中選擇最直觀、準(zhǔn)確和易于操作的方式。
(3)用戶交互。由于用戶通過交互操作看到視圖,因此交互是可視化手段輔助分析決策的推動(dòng)力,重點(diǎn)和難點(diǎn)在于設(shè)計(jì)出適用于海量數(shù)據(jù)的交互技術(shù)。
數(shù)據(jù)可視化一般可分為統(tǒng)計(jì)數(shù)據(jù)可視化、地理空間數(shù)據(jù)可視化和關(guān)系數(shù)據(jù)可視化。統(tǒng)計(jì)數(shù)據(jù)可視化,表現(xiàn)形式有表格、折線圖、柱形圖、直方圖、散點(diǎn)圖、面積圖和餅圖等,能顯示數(shù)據(jù)分布情況、變化趨勢(shì)或?qū)Ρ汝P(guān)系,統(tǒng)計(jì)學(xué)上也常用莖葉圖和箱形圖顯示原始數(shù)據(jù)的統(tǒng)計(jì)值分布情況;地理空間數(shù)據(jù)可視化,一般結(jié)合地圖與熱力圖、散點(diǎn)圖、線圖等實(shí)現(xiàn);關(guān)系數(shù)據(jù)可視化,有錐形圖、樹圖、?;鶊D等,其中?;鶊D在能源數(shù)據(jù)可視化領(lǐng)域使用較多,也被稱為能流圖,用于反映能源生產(chǎn)和消費(fèi)之間的流動(dòng)狀況。
鑒于能源數(shù)據(jù)高維、多態(tài)、多場景、動(dòng)態(tài)性的特點(diǎn),能源數(shù)據(jù)可視化借助機(jī)器的高效提高工作效率,讓用戶可以專注于決策分析。能源數(shù)據(jù)可視化遵循信息可視化參考流程,強(qiáng)調(diào)交互過程,通過用戶與可視化的交互挖掘能源數(shù)據(jù)深層次的信息。目前,常用于實(shí)現(xiàn)能源數(shù)據(jù)可視化的技術(shù)路線有基于可視化軟件和Web可視化開發(fā)兩種,前者基于成熟的軟件,優(yōu)點(diǎn)是學(xué)習(xí)成本低,只需掌握軟件的功能操作,基本上可以零代碼量完成數(shù)據(jù)可視化工作,缺點(diǎn)是只能實(shí)現(xiàn)軟件提供的功能,局限性較大,后者基于Web開發(fā)技術(shù),優(yōu)點(diǎn)是可以結(jié)合需求和實(shí)際情況定制開發(fā),靈活性高,缺點(diǎn)是需要具備基本的Web編程技術(shù),有一定技術(shù)門檻。
適用于能源數(shù)據(jù)可視化的常用軟件有Tableau、Power BI和FineBI等,此類軟件一般屬于商業(yè)軟件,能提供良好的使用體驗(yàn),用戶通過拖拽、選擇和過濾等所見即所得的方式即可完成數(shù)據(jù)可視化工作。
3.1.1 Tableau
Tableau是數(shù)據(jù)可視化領(lǐng)域的明星產(chǎn)品,起源于斯坦福大學(xué)的科研成果,在Gartner發(fā)布的商務(wù)智能及分析平臺(tái)魔力象限圖中長期位于領(lǐng)導(dǎo)者地位。Tableau使用獨(dú)有的VizQL數(shù)據(jù)庫,能夠?qū)⑼蟿?dòng)轉(zhuǎn)化為數(shù)據(jù)查詢,然后將數(shù)據(jù)以可視化的形式呈現(xiàn),實(shí)現(xiàn)了數(shù)據(jù)可視化的快速實(shí)現(xiàn)。此外,Tableau用戶體驗(yàn)良好,并提供了豐富的可視化圖表組件。
3.1.2 Power BI
Power BI是由微軟開發(fā)的可視化軟件,在Gartner發(fā)布的商務(wù)智能及分析平臺(tái)魔力象限圖中也位于領(lǐng)導(dǎo)者地位。Power BI的交互操作類似于Microsoft Office軟件,熟悉Office操作能較快上手。Power BI提供了免費(fèi)版,免費(fèi)版雖然不具備共享和協(xié)作等功能,但是極大的降低了使用成本。
3.1.3 FineBI
FineBI是帆軟推出的可視化軟件,帆軟在IDC發(fā)布的中國BI市場跟蹤報(bào)告中處于領(lǐng)先地位。FineBI基于B/S架構(gòu),能支持多種數(shù)據(jù)源連接,并提供了豐富的可視化圖表組件和樣例,也提供免費(fèi)試用。此外,帆軟作為國內(nèi)廠商,在中文社區(qū)資源和本土化支持方面更有優(yōu)勢(shì)。
Web可視化是數(shù)據(jù)可視化技術(shù)和互聯(lián)網(wǎng)蓬勃發(fā)展帶來的產(chǎn)物,其基于B/S結(jié)構(gòu),通過HTML、CSS、JavaScript等Web前端開發(fā)技術(shù)和瀏覽器實(shí)現(xiàn)數(shù)據(jù)的可視化。Web可視化的底層技術(shù)規(guī)范有SVG、Canvas 2D、Canvas 3D WebGL等,區(qū)別在于SVG是矢量圖形,Canvas是位圖?;谏鲜鯳eb可視化底層技術(shù),目前流行的數(shù)據(jù)可視化組件庫有D3.js、ECharts、AntV等,均能提供豐富的圖表元素,滿足能源數(shù)據(jù)可視化的需求。
圖1:科學(xué)可視化的早期可視化流水線
圖2:信息可視化參考流程
3.2.1 D3.js
D3.js(Data-Driven Documents) 是面向Web標(biāo)準(zhǔn)的JavaScript可視化庫,基于HTML、SVG和Canvas構(gòu) 建,能 支 持Chrome、Edge、Firefox和Safari等主流瀏覽器。D3.js通過數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn)數(shù)據(jù)的可視化,即將數(shù)據(jù)綁定到DOM,對(duì)DOM進(jìn)行操作實(shí)現(xiàn)數(shù)據(jù)的可視化。由于D3.js提供基于數(shù)據(jù)的DOM操作,能直接對(duì)底層數(shù)據(jù)操作,數(shù)據(jù)可視化的靈活性極強(qiáng),可以實(shí)現(xiàn)各種復(fù)雜的可視化圖表,劣勢(shì)是相較于ECharts等charts類庫實(shí)現(xiàn)成本較高。
3.2.2 ECharts
ECharts是由百度開源的JavaScript可視化庫,起源于百度自身業(yè)務(wù)數(shù)據(jù)可視化的需求,目前已進(jìn)入Apache孵化器。ECharts包括ZRender層和Echarts層,ZRender層用于隔離底層的渲染引擎,能支持Canvas、SVG、VML等格式,ECharts層是具體的可視化圖表、交互和外部程序調(diào)用的接口。Echarts提供了豐富的圖表樣式和交互形式,開發(fā)人員通過較簡單的配置和學(xué)習(xí)就能實(shí)現(xiàn)數(shù)據(jù)的可視化,劣勢(shì)是靈活性不如D3.js,實(shí)現(xiàn)定制化的圖表較為困難。
3.2.3 AntV
AntV是螞蟻金服開源的可視化解決方案,由G2、G6、F2和L7組成,已被阿里集團(tuán)內(nèi)外的大量業(yè)務(wù)系統(tǒng)使用。其中,G2提供了一套數(shù)據(jù)驅(qū)動(dòng)、高交互的數(shù)據(jù)可視化圖形語法,F(xiàn)2是G2設(shè)計(jì)理念在移動(dòng)端的實(shí)現(xiàn),G2和F2可以提供豐富的統(tǒng)計(jì)數(shù)據(jù)可視化圖表,并在實(shí)現(xiàn)上遵循《The Grammar of Graphics》,將可視化理論和Web技術(shù)做了很好的結(jié)合;G6、L7分別面向關(guān)系數(shù)據(jù)可視化和地理空間數(shù)據(jù)可視化。由于AntV采用了圖形語法,并對(duì)復(fù)雜交互作了封裝,其靈活性和實(shí)現(xiàn)成本介于D3.js和Echarts之間。
通過數(shù)據(jù)可視化技術(shù),能顯著提高對(duì)復(fù)雜能源數(shù)據(jù)的分析能力,對(duì)于政府和企業(yè)開展規(guī)劃、決策和支持有重要意義。本文基于能源數(shù)據(jù)的特點(diǎn)和數(shù)據(jù)可視化理論,提出了適用于能源數(shù)據(jù)可視化的兩種技術(shù)路線,即使用可視化軟件和Web可視化開發(fā),并分別介紹了不同技術(shù)路線的主流實(shí)現(xiàn)方式和特點(diǎn)。