畢綠 李華
摘要:隨著網(wǎng)絡(luò)和數(shù)據(jù)信息科學(xué)的發(fā)展,由于數(shù)據(jù)的量和復(fù)雜度上的爆炸式增長(zhǎng)使得世界進(jìn)入了大數(shù)據(jù)時(shí)代。技術(shù)的快速發(fā)展給我們帶來(lái)方便也帶來(lái)了前所未有的挑戰(zhàn),以最高效率快速解釋并使用數(shù)據(jù)成為當(dāng)前重要的課題。數(shù)據(jù)可視化(DataVisualization)通過(guò)將數(shù)據(jù)映射為容易感知的圖形、符號(hào)、顏色等,利用人的高速信息采集能力為大腦提供數(shù)據(jù)的全面信息,很大程度上提高了數(shù)據(jù)的理解性。并且可以直觀展示數(shù)據(jù)內(nèi)部隱含的模式,對(duì)數(shù)據(jù)的進(jìn)一步分析和處理提供了基礎(chǔ)。多維數(shù)據(jù)可視化是將數(shù)據(jù)信息以某種圖形圖像可視化的形式呈現(xiàn)出來(lái),給觀察者提供一種量化的方式,用來(lái)理解嵌入在數(shù)據(jù)中的隱藏信息。這些隱藏信息通常是異常信息和模式信息。異常信息會(huì)使得用戶觀察到了意想不到的圖形圖像分布信息,通常由異常的數(shù)據(jù)現(xiàn)象或者數(shù)據(jù)特征引起。通過(guò)交互式的可視化數(shù)據(jù)挖掘可以觀察數(shù)據(jù)的細(xì)節(jié),能夠增加數(shù)據(jù)的可理解性和可信度。
關(guān)鍵詞:多維數(shù)據(jù);可視化技術(shù);應(yīng)用
計(jì)算機(jī)網(wǎng)絡(luò)和數(shù)據(jù)信息科學(xué)在當(dāng)今社會(huì)以迅猛的速度發(fā)展,大數(shù)據(jù)時(shí)代中存在著海量的結(jié)構(gòu)復(fù)雜的多維數(shù)據(jù)。多維數(shù)據(jù)技術(shù)也在此基礎(chǔ)上快速發(fā)展起來(lái),在帶給我們應(yīng)用便捷的同時(shí)也帶來(lái)了基于WEB的技術(shù)性挑戰(zhàn),我們將以高效率且快速解釋并應(yīng)用數(shù)據(jù)作為當(dāng)前的主要課題進(jìn)行研究。數(shù)據(jù)可視化DataVisualization技術(shù)將能夠直觀表示數(shù)據(jù)內(nèi)部隱含的特征,此技術(shù)通過(guò)人眼容易識(shí)別感知的顏色、圖形、符號(hào)等信息,應(yīng)用高效數(shù)據(jù)挖掘技術(shù)給予的數(shù)據(jù)信息,得到高效的分析測(cè)試結(jié)果。并且為多維數(shù)據(jù)的深入分析和處理提供了基礎(chǔ)。一圖勝千言,圖表表達(dá)與句型表達(dá)具有信息和計(jì)算上的等價(jià)性。一張圖片的最大價(jià)值在于,它迫使我們注意到我們從未期望看到的東西。可視化是一門利用人眼的感知能力和人腦智能對(duì)數(shù)據(jù)進(jìn)行交互的可視表達(dá)以增強(qiáng)認(rèn)知的學(xué)科,數(shù)據(jù)可視化是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過(guò)程,多維數(shù)據(jù)可視化是指通過(guò)一些手段將高維的數(shù)據(jù)展示在二維的平面中。同時(shí)可視化與數(shù)據(jù)挖掘、人機(jī)交互的關(guān)系密不可分。我們主要研究其中的三個(gè)方面:首先是數(shù)據(jù)信息如何表示,即用戶面對(duì)數(shù)據(jù)的認(rèn)識(shí)程度來(lái)檢驗(yàn)可視化信息技術(shù)的效果,這里需要為數(shù)據(jù)信息的多重結(jié)構(gòu)和數(shù)據(jù)關(guān)系進(jìn)行深入分析處理成為用戶可以識(shí)別的視圖應(yīng)用工具。其次是數(shù)據(jù)可視化的方法,最后是數(shù)據(jù)可視化的應(yīng)用領(lǐng)域。
1 數(shù)據(jù)信息的表示
1.1星型圖
星型結(jié)構(gòu)圖形一般是以圖形中央節(jié)點(diǎn)為中心,使用獨(dú)立線段連接中心點(diǎn)及其余節(jié)點(diǎn),中心點(diǎn)的作用是溝通各個(gè)相鄰節(jié)點(diǎn)。以中心點(diǎn)集中控制通信的方式,這種管理多維可視化的方式構(gòu)造明確。數(shù)據(jù)庫(kù)中的數(shù)據(jù)由星形圖代表,一組星形來(lái)標(biāo)識(shí)一組數(shù)據(jù)。
1.2雷達(dá)圖
雷達(dá)圖分析法(radarchart)亦稱綜合財(cái)務(wù)比率分析圖法,又可稱為戴布拉圖、螂蛛網(wǎng)圖、蜘蛛圖。與星形圖的構(gòu)造方法不同之處為:每條線段作為一個(gè)坐標(biāo)軸,其中每一數(shù)據(jù)維數(shù)據(jù)型屬性的數(shù)值大小按照坐標(biāo)軸上的刻度比例的不同來(lái)確立。數(shù)據(jù)集合中一組記錄對(duì)應(yīng)著一組連接坐標(biāo)點(diǎn)及線段的折線。以上散點(diǎn)矩陣AndrewsGurves即是多維數(shù)據(jù)元素由周期函數(shù)作用后的結(jié)構(gòu)型數(shù)據(jù)組合,利用數(shù)據(jù)曲線展示分布情況例如shapecoding技術(shù)和Grand-tour技術(shù)都是分解元素或不同視角分析多維數(shù)據(jù)。
1.3氣泡圖
排列在工作表的列中的數(shù)據(jù)(第一列中列出 x 值,在相鄰列中列出相應(yīng)的y值和氣泡大小的值)可以繪制在氣泡圖中。氣泡圖具有下列圖表子類型:氣泡圖和三維氣泡圖 氣泡圖與 XY 散點(diǎn)圖類似,但是它們對(duì)成組的三個(gè)數(shù)值而非兩個(gè)數(shù)值進(jìn)行比較。第三個(gè)數(shù)值確定氣泡數(shù)據(jù)點(diǎn)的大小??梢赃x擇氣泡圖或者三維氣泡圖子類型。
2 數(shù)據(jù)可視化的方法
數(shù)據(jù)可視化已經(jīng)提出了許多方法,這些方法根據(jù)其可視化的原理不同可以劃分為基于幾何的技術(shù)、面向像素技術(shù)、基于圖標(biāo)的技術(shù)、基于層次的技術(shù)、基于圖像的技術(shù)和分布式技術(shù)等。
2.1面向像素的技術(shù)
面向像素技術(shù)的基本思想是將每個(gè)數(shù)據(jù)項(xiàng)的一個(gè)屬性映射為一個(gè)彩色的屏幕像素,整個(gè)屬性值的范圍映射為固定的顏色范圍,在不同的子窗口表現(xiàn)不同的數(shù)據(jù)屬性值。
2.2基于圖標(biāo)的技術(shù)
也成為圖標(biāo)顯示技術(shù),它的基本思想是定制一些稱為圖標(biāo)的幾何對(duì)象,如矩形、錐體、箭頭等,然后將每一個(gè)多維數(shù)據(jù)項(xiàng)映射一個(gè)對(duì)應(yīng)的圖標(biāo),并按一定順序排列這些圖標(biāo)。圖標(biāo)的各項(xiàng)屬性如大小、顏色、形狀等均可用于數(shù)據(jù)項(xiàng)維的對(duì)應(yīng)。
2.3變化視圖技術(shù)
多維數(shù)據(jù)的可視化計(jì)算需要通過(guò)處理映射關(guān)系來(lái)解決,通常采用視圖變化的技術(shù)手段。交互式投影。研究結(jié)構(gòu)數(shù)據(jù)集合中多項(xiàng)數(shù)據(jù)維之間的數(shù)據(jù)關(guān)系是通過(guò)散點(diǎn)圖來(lái)對(duì)二維數(shù)據(jù)進(jìn)行分析表示的,分析處理多維數(shù)據(jù)技術(shù)有一定難度,如ExplorN,GrandToursystem系統(tǒng)的投影組合是指數(shù)級(jí)別高。交互式過(guò)濾。是利于特別的窗口來(lái)顯示用戶數(shù)據(jù),過(guò)濾器對(duì)此窗口的信息進(jìn)行處理且分別顯示其視圖,這里提供了豐富的數(shù)據(jù)信息。平行坐標(biāo)技術(shù)和AndrewsGurves技術(shù),是通過(guò)利用計(jì)算機(jī)應(yīng)用軟件工具改變圖形圖像和數(shù)據(jù)元素的映射關(guān)系來(lái)解釋數(shù)據(jù)?;驊?yīng)用放大或縮小可視化結(jié)構(gòu)或改變視角分析數(shù)據(jù)信息的細(xì)節(jié),從而揭示數(shù)據(jù)的內(nèi)部規(guī)律。
2.4數(shù)據(jù)可視化使用工具的選擇
用戶使用的數(shù)據(jù)結(jié)構(gòu)不存在一定的復(fù)雜程度時(shí),需要將數(shù)據(jù)展現(xiàn)的多彩且具有交互性,需要將數(shù)據(jù)轉(zhuǎn)換為決策信息并能夠成為BI系統(tǒng)、分析會(huì)議、匯報(bào)材料等數(shù)據(jù)分析的工具,應(yīng)該首先具有多個(gè)實(shí)用性控件和主題,其次空間占用小并能將分析結(jié)果直接嵌入到Web及相關(guān)應(yīng)用軟件上,最后當(dāng)然必須簡(jiǎn)單易學(xué)。
3 可視化技術(shù)的應(yīng)用領(lǐng)域
可視化技術(shù)在科學(xué)、工程、互聯(lián)網(wǎng)等方向都有重要應(yīng)用。
3.1科學(xué)領(lǐng)域
可視化技術(shù)成為基礎(chǔ)自然科學(xué)研究的必要手段,是科學(xué)大數(shù)據(jù)發(fā)展的必需。例如:活組織細(xì)胞運(yùn)動(dòng)三維影像可視化、在化學(xué)分子式中查找分子、在蛋白質(zhì)網(wǎng)絡(luò)中查找化合物、在DNA 中查找特定序列等。
3.2工程領(lǐng)域
可視化技術(shù)是對(duì)大工程仿真、實(shí)測(cè)、融合、預(yù)測(cè)、測(cè)試等不同環(huán)節(jié)產(chǎn)生的信息進(jìn)行綜合理解與分析的必要手段。如:物聯(lián)網(wǎng)與智慧城市。在動(dòng)態(tài)網(wǎng)絡(luò)交通中查找最短路徑、在郵政快遞領(lǐng)域進(jìn)行郵路規(guī)劃、疾病爆發(fā)路徑的預(yù)測(cè)與科技文獻(xiàn)的引用關(guān)系等.
3.3互聯(lián)網(wǎng)領(lǐng)域
可視化技術(shù)在互聯(lián)網(wǎng)與社交媒體中有廣泛的應(yīng)用。隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,以Web 2.0 技術(shù)為基礎(chǔ)的社交網(wǎng)絡(luò)(如Facebook、人人網(wǎng))、微博(如Twitter、新浪微博、騰訊微博)等新興服務(wù)中建立了大量的在線社會(huì)網(wǎng)絡(luò)關(guān)系??梢暬硎救伺c人之間的關(guān)系.在社交網(wǎng)絡(luò)中,基于可視化研究社區(qū)發(fā)現(xiàn)等問(wèn)題;在微博中,通過(guò)可視化研究信息傳播與影響力最大化等問(wèn)題。
4結(jié)論
現(xiàn)代網(wǎng)絡(luò)數(shù)據(jù)急速增長(zhǎng)則功能強(qiáng)大的可視化技術(shù)成為當(dāng)前的重要任務(wù),通過(guò)使用先進(jìn)的數(shù)據(jù)分析技術(shù)對(duì)大數(shù)據(jù)進(jìn)行研究,數(shù)據(jù)可視化(DataVisualization)能夠幫助我們理解和分析數(shù)據(jù)數(shù)據(jù),有效并及時(shí)處理后高效利用。數(shù)據(jù)可視化的前景都不容小覷。企業(yè)需要將數(shù)據(jù)展現(xiàn)交互性,需要將數(shù)據(jù)換為決策信息并能夠成為BI系統(tǒng)、分析會(huì)議、匯報(bào)材料等數(shù)據(jù)分析的工具,才能在競(jìng)爭(zhēng)環(huán)境中獲得業(yè)務(wù)優(yōu)勢(shì)。
參考文獻(xiàn):
[1]周志光,孫暢,樂(lè)丹丹,石晨,劉玉華.多維時(shí)空數(shù)據(jù)協(xié)同可視分析方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2017,29(12):2245-2255.
[2]彭俊,盧艷松,夏凱.一種基于SOM的多維農(nóng)業(yè)時(shí)空數(shù)據(jù)可視化分析方法[J].江蘇農(nóng)業(yè)科學(xué),2017,45(20):244-249.
[3]趙凡,蔣同海,周喜,馬博,程力.面向多維稀疏時(shí)空數(shù)據(jù)的可視化研究[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),2017,47(07):556-568.
[4]陳冠臣.智慧城市時(shí)空信息多維可視化關(guān)鍵技術(shù)探討[J].礦山測(cè)量,2017,45(03):97-99.
[5]陳為,沈澤潛,陶煜波 《數(shù)據(jù)可視化》 電子工業(yè)出版社 2013
作者簡(jiǎn)介:
畢綠(1996.11-)、女、漢、學(xué)生、河南南陽(yáng)、專業(yè):軟件工程、研究方向:數(shù)據(jù)可視化、身份證號(hào):411302199611123729.
李華、男、講師.