曾瀟瀟
(華中科技大學(xué),武漢 430070)
在人類所有的感官中,視覺(jué)被認(rèn)為是一種主要的、強(qiáng)大的輸入通道。它吸收了我們周圍的一切事物,并將這些信息傳遞給大腦,以便對(duì)它的含義進(jìn)行即時(shí)分析。在視覺(jué)與認(rèn)知的密切聯(lián)系下,學(xué)習(xí)和創(chuàng)造視覺(jué)設(shè)計(jì)的第一步是通過(guò)理解人類視覺(jué)感知的工作方式。視覺(jué)感知是相對(duì)的,不斷地掃描,不斷調(diào)整焦點(diǎn),不斷適應(yīng)。我們的視覺(jué)將信息傳遞給我們的大腦,我們的大腦負(fù)責(zé)處理所看到的信息,人類的視覺(jué)和認(rèn)知進(jìn)行特定的相互作用。更重要的是,人類視覺(jué)的復(fù)雜和神秘的本質(zhì),它為視覺(jué)設(shè)計(jì)師創(chuàng)造了大量的機(jī)會(huì)來(lái)利用人類的視覺(jué)感知,因?yàn)樗c信息可視化有關(guān)。在所有獨(dú)特的視覺(jué)特征中,兩種感知特性在信息可視化中被普遍應(yīng)用:前意識(shí)的處理和格式塔法。
在感官記憶中進(jìn)行的前意識(shí)的視覺(jué)處理,是創(chuàng)建視覺(jué)表征的基礎(chǔ)。在沒(méi)有意識(shí)干預(yù)的情況下,觀眾可以瞬間感知到前意識(shí)關(guān)注的視覺(jué)屬性。信息可視化研究的關(guān)鍵問(wèn)題之一是研究人類視覺(jué)系統(tǒng)如何處理和分析圖像,這項(xiàng)研究的一個(gè)重要的初步結(jié)果是,少量的視覺(jué)特性可以被“低級(jí)”視覺(jué)系統(tǒng)快速而準(zhǔn)確地檢測(cè)出來(lái)。這些特性被稱為“前意識(shí)”,因?yàn)樗鼈兊臋z測(cè)似乎是在集中注意力之前。要充分認(rèn)識(shí)到這一觀點(diǎn)的價(jià)值可能是困難的,但理解前意識(shí)的處理對(duì)于可視化設(shè)計(jì)是很重要的。特別是,通過(guò)開(kāi)發(fā)前意識(shí)的處理能力,可以回答幾個(gè)重要的設(shè)計(jì)問(wèn)題,例如,可以立即感知到什么?哪些視覺(jué)特性是好的鑒別器?是什么誤導(dǎo)觀眾呢?怎樣才能設(shè)計(jì)出這樣引人注意的信息?
來(lái)自北卡羅來(lái)納州立大學(xué)的Christopher G. Healey創(chuàng)建了一個(gè)網(wǎng)站,以展示關(guān)于信息可視化體驗(yàn)的前意識(shí)處理方法。圖1中給出了他的一個(gè)例子:該圖顯示了如何根據(jù)顏色差異搜索目標(biāo)圓——在所有較亮圓圈中較暗的圓會(huì)凸顯出來(lái)。這是前意識(shí)處理的基礎(chǔ)卻普遍使用的用法。前意識(shí)設(shè)計(jì)中也會(huì)使用其他一些基本工具包括長(zhǎng)度,寬度和強(qiáng)度,還有更高級(jí)的符號(hào),包括照明和運(yùn)動(dòng)方向。
格式塔組織法則也被稱完形法則,描述如何在圖形顯示中安排視覺(jué)符號(hào),以優(yōu)化圖像達(dá)到一個(gè)更好、更有效的可視化效果。這些法則關(guān)注的是人們?nèi)绾谓庾x世界,提供有關(guān)知覺(jué)組織的相關(guān)原則。格式塔法最早是由德國(guó)心理學(xué)家在20世紀(jì)初提出的,它們的主要目的是幫助理解感知模式,同時(shí)也提供對(duì)許多基本感知現(xiàn)象的清晰描述。心理學(xué)家稱他們?yōu)榉▌t,這些原則更像是啟發(fā)式,是解決問(wèn)題的思維捷徑。
> 圖1 Christopher G. Healey運(yùn)用顏色差異搜索目標(biāo)
> 圖2 Chernoff Faces
> 圖3 用平行坐標(biāo)表示汽車變量的關(guān)系
一個(gè)著名的格式塔定律被稱為“花瓶”圖,這幅圖畫(huà)出了圖形組織和邊緣分配的關(guān)鍵要素,以及它對(duì)形狀感知的影響。人們可以注意到,在花瓶畫(huà)中,感知到的形狀取決于被分配的黑白區(qū)域的邊界。與其相反,物的認(rèn)知可以被認(rèn)為是識(shí)別物體的基本知覺(jué)行為的一部分。必須承認(rèn)格式塔法在信息可視化中起著重要的作用。這些法則適用于圖形的創(chuàng)建以避免其相互干擾。具體來(lái)說(shuō),根據(jù)格式塔法則,可視化設(shè)計(jì)應(yīng)該避免不加標(biāo)記,使用感知有效的編碼,而不是分散觀眾的注意力。用真實(shí)的信息創(chuàng)建有效和富有表現(xiàn)力的視覺(jué)設(shè)計(jì)是信息可視化的重中之重。
在信息可視化的一個(gè)定義中,有必要說(shuō)明“使用計(jì)算機(jī)支持的交互式數(shù)據(jù)可視化來(lái)放大認(rèn)知”強(qiáng)調(diào)信息可視化與人類認(rèn)知的緊密聯(lián)系。圖形的一個(gè)顯著優(yōu)點(diǎn)是通過(guò)人類視覺(jué)幫助簡(jiǎn)化任務(wù)完成所需要的信息。尤其是為了使知識(shí)具體化,僅當(dāng)數(shù)據(jù)無(wú)法輕易提供信息時(shí),使用信息可視化可以提供幫助。視覺(jué)輔助的認(rèn)知是由于它增加了記憶和資源的處理,通過(guò)前意識(shí)的屬性、格式塔定律,和許多其他的知覺(jué)屬性。通過(guò)簡(jiǎn)化對(duì)信息的搜索并增強(qiáng)對(duì)模式的識(shí)別,可視化可以實(shí)現(xiàn)感知推理操作。
Edward Tufte愛(ài)德華·塔夫特是《紐約時(shí)報(bào)》的“數(shù)據(jù)達(dá)芬奇”(The da Vinci of data)的作者,他用簡(jiǎn)潔的文字和巧妙的插圖書(shū)籍顯示了數(shù)據(jù)的視覺(jué)效果。除了在信息設(shè)計(jì)方面的著述,Tufte也是該領(lǐng)域的先鋒。通過(guò)他的作品,他提出了視覺(jué)化設(shè)計(jì)的關(guān)鍵原則,為展示信息提供了實(shí)質(zhì)性的和重要的見(jiàn)解,以達(dá)到最大的效果。
Tufte的原則的一個(gè)后果是通過(guò)信息可視化實(shí)現(xiàn)卓越的圖形化能力。根據(jù)Tufte的說(shuō)法,圖形化的卓越是“精心設(shè)計(jì)的有趣數(shù)據(jù)的展示——實(shí)質(zhì)、統(tǒng)計(jì)和設(shè)計(jì)的問(wèn)題?!敝纼?yōu)秀的圖形是由復(fù)雜的想法(圖中沒(méi)有歧義或混亂)、精確性(真實(shí)的結(jié)果和不失真的演示)和效率(極少量的圖表“垃圾”)組成的,這是一個(gè)關(guān)鍵的問(wèn)題。卓越的圖形能力將使觀眾在最短的時(shí)間內(nèi)獲得最多的創(chuàng)意,并且在最小的空間內(nèi)使用最少的筆墨。這樣的圖形化的優(yōu)秀通過(guò)兩個(gè)目標(biāo)來(lái)實(shí)現(xiàn):(1)通過(guò)圖形完整性原則來(lái)說(shuō)明數(shù)據(jù)的真實(shí)性;(2)通過(guò)設(shè)計(jì)原則實(shí)現(xiàn)的清晰和精確的可視化。
圖形完整性原則涉及具有清晰,詳細(xì)和徹底的標(biāo)簽,可用于防止圖形失真和模糊。Tufte還將“謊言因素”定義為“描述圖形中顯示的效果大小與數(shù)據(jù)中顯示的效果大小之間關(guān)系的值”。具體地說(shuō),數(shù)字的表示,就像在圖形本身表面上測(cè)量的那樣,應(yīng)該與所代表的數(shù)量成正比。Tufte介紹的另一個(gè)設(shè)計(jì)原則是“數(shù)據(jù)墨水比”。Tufte將數(shù)據(jù)墨水稱為“非可擦的圖形核心”,非冗余墨水是為了響應(yīng)數(shù)字的變化而排列的。從定義上說(shuō),非數(shù)據(jù)墨水是不傳遞信息的墨水,而是用于衡量尺度、標(biāo)簽和邊緣。為了進(jìn)一步擴(kuò)展,數(shù)據(jù)墨水比率是“用于提供實(shí)際數(shù)據(jù)的墨水比例,與整個(gè)顯示器使用的像素總量相比?!彼羞@些細(xì)節(jié)和目標(biāo)的教訓(xùn)是,好的圖形應(yīng)該只包括數(shù)據(jù)墨水;應(yīng)盡可能刪除所有非數(shù)據(jù)墨水,以避免在演示文稿中引起注意力分散、無(wú)關(guān)的內(nèi)容。其目標(biāo)是設(shè)計(jì)一個(gè)具有最大可能的數(shù)據(jù)——墨水比率的顯示器,而不會(huì)消除有效通信所必需的內(nèi)容。
非數(shù)據(jù)墨水的概念也導(dǎo)致了避免“圖表垃圾”的討論。圖表垃圾是圖表和圖表中的所有視覺(jué)元素,對(duì)于觀看者來(lái)說(shuō),沒(méi)有必要去理解圖表上的信息,或者轉(zhuǎn)移觀眾對(duì)這些信息的注意力。不需要的元素的例子包括重的或暗的網(wǎng)格線,不必要的文本,或不適當(dāng)?shù)膹?fù)雜字體。有趣的是,有研究表明人們接受這種“極簡(jiǎn)主義”的信息可視化方法。與Tufte所寫的不一致的研究表明,在某些情況下,圖表垃圾被認(rèn)為是有用和有效的。這些信息可視化學(xué)者認(rèn)為,精化并非都是壞事,視覺(jué)修飾可能還有其他好處。特別是當(dāng)使用圖的目的是說(shuō)服或演示時(shí),它們應(yīng)該被設(shè)計(jì)成幫助提供數(shù)據(jù)的可記憶性的特定目標(biāo)。通過(guò)對(duì)現(xiàn)有研究的評(píng)價(jià),支持?jǐn)?shù)據(jù)圖形必須引起讀者的興趣,這是通過(guò)使用圖形圖像來(lái)實(shí)現(xiàn)的。
當(dāng)涉及到信息可視化時(shí),有很多技術(shù)可以被利用。這些技術(shù)包括簡(jiǎn)單的圖表,如條形圖和線形圖,以及更高級(jí)的技術(shù),如熱圖和散點(diǎn)圖矩陣。有些技術(shù)是為特定目的而創(chuàng)建的,因此很難對(duì)它們進(jìn)行分類。在本節(jié)中,主要重點(diǎn)將介紹幾種常用的信息技術(shù)。
讓我們從定義多變量數(shù)據(jù)開(kāi)始,因?yàn)樗窃S多技術(shù)中常用的術(shù)語(yǔ)和概念。多變量數(shù)據(jù)指的是三維以上的數(shù)據(jù)。換句話說(shuō),在數(shù)據(jù)集中每個(gè)案例中有三個(gè)以上的變量。
可視化多變量數(shù)據(jù)的第一種方法是通過(guò)多個(gè)視圖。使用這種技術(shù),如果一個(gè)人不能在一個(gè)圖中顯示所有的維度數(shù)據(jù),你可以嘗試在多個(gè)圖形中顯示它們,每個(gè)圖形都傳遞一個(gè)特定的信息。思想的邏輯進(jìn)展是確定一種更直觀的方式,使每個(gè)變量都有自己的顯示,每個(gè)變量得到一個(gè)圖并顯示在對(duì)應(yīng)的軸上,將多變量數(shù)據(jù)表示劃分為數(shù)個(gè)子圖,子圖再將數(shù)據(jù)映射到二維平面上。雖然這種可視化技術(shù)易于實(shí)現(xiàn)和直觀,但存在一個(gè)直接的缺點(diǎn):隨著變量數(shù)量的增加,每個(gè)變量所需的子圖的數(shù)量也會(huì)增加。這增加了一次有太多子圖的風(fēng)險(xiǎn),這增加了影響判斷的因素,使信息的理解和處理具有挑戰(zhàn)性。
一種更復(fù)雜的可視化多變量數(shù)據(jù)的方法是使用散點(diǎn)圖矩陣。散點(diǎn)圖矩陣是可視化設(shè)計(jì)人員所鐘愛(ài)的圖形工具之一。散點(diǎn)圖會(huì)呈現(xiàn)一個(gè)視覺(jué)顯示,以捕獲一對(duì)變量之間的相關(guān)性。給定一組n個(gè)變量,有n個(gè)選擇2對(duì)變量,因此有相同數(shù)量的散點(diǎn)圖。這些散點(diǎn)圖可以被組織成一個(gè)矩陣,使得在一個(gè)地方可以很容易地表示和觀察所有的成對(duì)關(guān)聯(lián)。
另一種有趣的視覺(jué)形象被稱為Chernoff Faces。赫爾曼·切爾諾夫是一位應(yīng)用數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家、物理學(xué)家和教育家,他發(fā)明了切爾諾夫臉譜,用人臉的形狀來(lái)顯示多變量數(shù)據(jù)。Chernoff在美國(guó)統(tǒng)計(jì)學(xué)會(huì)雜志上發(fā)表的論文中他建議簡(jiǎn)化,卡通形式的面孔形狀能夠代表數(shù)據(jù)集中的許多變量。如圖2通過(guò)映射數(shù)字頭偏心,眉形、眼大小,眼睛偏心率、瞳孔大小,鼻子大小,鼻子寬口曲率、口寬度,和嘴開(kāi)放,能夠達(dá)到視覺(jué)理解。Chernoff的臉譜幫助觀眾更快更準(zhǔn)確地檢測(cè)出模式、分組和相關(guān)性。這一理論建立在這樣一個(gè)事實(shí)基礎(chǔ)之上:人類的大腦有能力識(shí)別面部特征的細(xì)微差異,同時(shí)也能同時(shí)吸收許多面部特征。
當(dāng)數(shù)據(jù)集由純分類數(shù)據(jù)組成時(shí),就會(huì)使用一種流行的可視化工具——馬賽克圖。鑲嵌圖讓分析師可以檢驗(yàn)兩個(gè)或更多的分類變量之間的關(guān)系。馬賽克圖以長(zhǎng)度為1的正方形開(kāi)始,然后根據(jù)與第一個(gè)分類變量相關(guān)聯(lián)的概率的比例水平劃分。然后,每個(gè)水平的橫條根據(jù)第二個(gè)分類變量的條件概率的比例,在垂直方向上進(jìn)一步分裂??梢允褂玫谌偷谒膫€(gè)變量,等等。
類似馬賽克圖的可視化技術(shù)是treemap。Treemaps是理想的情況,在這種情況下,需要可視化大量的樹(shù)結(jié)構(gòu)(或?qū)哟谓Y(jié)構(gòu))數(shù)據(jù)。treemap的空間首先被分割成矩形,這些矩形的大小和順序都是基于一個(gè)數(shù)量變量。通過(guò)可視化嵌套的矩形來(lái)捕獲treemap的層次結(jié)構(gòu)。例如,代表一個(gè)國(guó)家的矩形可能包含代表該國(guó)的多個(gè)矩形。表示狀態(tài)的每個(gè)矩形依次包含代表這些狀態(tài)中的城市的矩形??梢允褂迷S多不同的算法來(lái)確定treemap中矩形的大小和順序,并考慮到treemapping的一般規(guī)則。一般來(lái)說(shuō),在treemap中,矩形的大小是:最大的矩形將被放置在左上角,最小的矩形將被放置在右下角,中間的所有東西都放在treemap的中間部分。當(dāng)矩形被嵌套時(shí),層次結(jié)構(gòu)被呈現(xiàn)。
另一個(gè)被廣泛采用和有用的可視化技術(shù)是平行坐標(biāo)。平行坐標(biāo)是最著名的可視化技術(shù)之一,也是最常見(jiàn)的可視化學(xué)術(shù)論文主題之一。雖然一個(gè)人對(duì)平行坐標(biāo)的最初印象可能是令人困惑的,一旦他們理解了,就很容易理解為什么他們是理解多維數(shù)字?jǐn)?shù)據(jù)集的強(qiáng)大工具。如何通過(guò)一個(gè)例子更好地解釋平行坐標(biāo)的作用。圖3顯示了一個(gè)平行坐標(biāo)的例子,其中包含了汽車變量的關(guān)系,包括每加侖(MPG)里程、氣缸數(shù)、馬力、重量,以及它們被引入的年份。在這個(gè)可視化中,每個(gè)汽車變量都被映射到一個(gè)垂直軸上。因此,每一個(gè)數(shù)據(jù)值都在直線上的某個(gè)位置上,并被縮放到位于底部的最小值和頂部的最大值之間。對(duì)于行中的每一個(gè)情況,數(shù)據(jù)點(diǎn)都是連通的,并構(gòu)成折線??梢詮倪@個(gè)可視化中獲得有用的見(jiàn)解。例如,圓筒軸是值得注意的,因?yàn)樗挥袔讉€(gè)不同的值。由于柱體的數(shù)量只能是一個(gè)整數(shù),在這個(gè)例子中只有8個(gè)值,所以所有的線都要經(jīng)過(guò)一小部分點(diǎn)。在MPG和氣缸之間的空間中,可以看出,八缸汽車的里程一般比六缸和四缸汽缸低。
線條的“外觀”即它們?nèi)绾谓徊嬉约叭绾握郫B,可以說(shuō)明的不僅僅是數(shù)據(jù)。例如,線路的過(guò)度交叉是反向關(guān)系的指標(biāo);例如,汽缸越多,里程越低。在氣缸和馬力之間也可以發(fā)現(xiàn)類似的相關(guān)性:氣缸越多,馬力越大。還有一些交叉線表明,更多的汽缸并不總是意味著更多的權(quán)力;然而,總體趨勢(shì)顯然存在。 在馬力和重量之間,情況是相似的:更大的馬力意味著總體上更重的汽車,但是在價(jià)值上存在一些差異。 人們也可以看到,只有一個(gè)很輕的高馬力八缸汽車是個(gè)例外。最后,重量和年份之間的界線十分交叉,這意味著多年來(lái)汽車變得更輕。
經(jīng)過(guò)幾十年的信息可視化的快速變化,創(chuàng)造引人注目、視覺(jué)刺激的內(nèi)容的能力比以往任何時(shí)候都要大。通過(guò)專門的努力,研究人員、學(xué)者和實(shí)踐者已經(jīng)開(kāi)發(fā)出可視化的理論、技術(shù)、軟件工具和應(yīng)用程序,它們可以用于各種各樣的目的,并且可以以一種引人注目的方式面向目標(biāo)受眾。為了最大限度地利用這些發(fā)現(xiàn)和技術(shù),可視化學(xué)習(xí)者要思想開(kāi)放,不斷地尋找新的知識(shí)和技能,同時(shí)跟上潮流和變化這是很重要的。■