羅煜楚,吳昊,郭宇涵,譚紹聰,劉燦,蔣瑞珂,袁曉如,2
1. 北京大學智能學院機器感知與智能教育部重點實驗室,北京 100871;
2. 北京大學大數(shù)據(jù)分析與應用技術國家工程實驗室,北京 100871
信息技術的發(fā)展促使社會發(fā)生了深刻的變革,推動了學術研究中數(shù)據(jù)驅動的第四范式的誕生。自然科學領域很早就開始了對大規(guī)模數(shù)據(jù)驅動的研究,如天文學家對大量觀測數(shù)據(jù)進行收集和分析,從而發(fā)現(xiàn)關于宇宙的新知識。近年來,社科人文領域也逐漸發(fā)展了數(shù)據(jù)驅動的研究方式,傳統(tǒng)的人文學科在信息技術的支持下走向大數(shù)據(jù),形成人文學科與計算機學科的交叉領域——數(shù)字人文(digital humanities)[1]。
在信息技術之中,可視化作為一種與人聯(lián)系格外緊密的技術,在數(shù)字人文研究中一直飽受關注。近年來,可視化在國際數(shù)字人文大會的摘要與標題中詞頻排名第一[2]。本文分析數(shù)字人文領域研究中可視化技術的應用與發(fā)展。
可視化與數(shù)字人文都是在計算機發(fā)明后才正式形成的學科,但可視化與數(shù)字人文之間的聯(lián)系可以追溯到更早的時候。在計算機發(fā)明之前,傳統(tǒng)人文學科和傳統(tǒng)的可視化方法已經(jīng)有了許多交集。早在數(shù)千年前,人們就已經(jīng)開始使用圖形圖像表達數(shù)據(jù),創(chuàng)作出了地圖這類原始的可視化作品,隨著文明的發(fā)展,也出現(xiàn)了越來越豐富的可視化方法,在各類統(tǒng)計圖表被發(fā)明后,可視化與人文學科的合作變得更加深入。20世紀計算機的發(fā)明帶來了強大的計算能力,并賦予了傳統(tǒng)人文學科與傳統(tǒng)可視化圖表新的生命形式,可視化學科與計算人文學科也碰撞出了新的火花。本節(jié)從可視化與數(shù)字人文的歷史談起,介紹可視化學科與數(shù)字人文的發(fā)展沿革,并總覽性地介紹當今可視化在計算人文研究中的現(xiàn)狀。
可視化的歷史可以追溯至史前時期。史前時期人類已經(jīng)通過編制繩結、刻畫圖形等形式對他們的社會生活進行有效記錄。巴比倫人在公元前6世紀就開始制作黏土板地圖,記錄巴比倫周圍的城鎮(zhèn)、河流等地理信息,這也是現(xiàn)存最早的地圖。隨著經(jīng)濟社會發(fā)展,人們需要使用更加精細的地圖來管理城市和國家。例如,南宋《平江圖》石碑詳細記錄了南宋時期蘇州城的城市布局,是目前已知最古老的刻有城市地圖的石碑。
從18世紀末期開始,可視化的先驅者發(fā)明了更加豐富的可視化形式,用于分析日益復雜的經(jīng)濟形勢變化、講述歷史事實等,并將其應用于政治、經(jīng)濟、歷史等領域的寫作中,以更好地分析數(shù)據(jù)和支持觀點。蘇格蘭工程師威廉·普萊費爾(William Playfair)發(fā)明了折線圖、柱狀圖和餅圖等可視化類型,他設計了用于比較英國、丹麥與挪威進出口數(shù)據(jù)的折線圖,清晰地展現(xiàn)了國家間貿易額的變化和貿易順逆差的變換。法國工程師查爾斯·約瑟夫·米納德(Charles Joseph Minard)于1869年出版了著名的拿破侖行軍信息圖,詳細展示了法國軍隊的進軍過程和損失情況,并展示了地形和天氣對戰(zhàn)爭結果造成的影響,此外,他還通過在地圖上繪制流圖表現(xiàn)國家間的貿易情況和人口遷移等經(jīng)濟社會議題。
隨著20世紀70年代計算機顯示技術的發(fā)展和80年代超算模擬、醫(yī)學等領域大量數(shù)據(jù)的產(chǎn)生,人們對探索大規(guī)??茖W數(shù)據(jù)有了強烈的需求,科學可視化也隨之產(chǎn)生和發(fā)展。1987年,美國國家科學基金會首次以科學可視化為主題舉辦了會議,給出了科學可視化的定義,并提出了科學可視化的需求和發(fā)展路徑[3]。此后,可視化的用途很快被拓寬到了對抽象數(shù)據(jù)的展示與分析,從而誕生了信息可視化[4]與可視分析[5]的概念。人文社科數(shù)據(jù)作為常見的抽象數(shù)據(jù)形式,也是信息可視化與可視分析中重要的研究對象。
現(xiàn)在的可視化技術更強調借助計算機的能力,幫助人們更好地解決數(shù)據(jù)任務。可視化將人與計算機共同包含在內的數(shù)據(jù)分析流程及其高效的信息傳遞能力能夠在數(shù)字人文研究中發(fā)揮重要作用。
數(shù)字人文概念的前身是“人文計算”(humanities computing)[6]。在計算機被發(fā)明之后,人文學科的研究者敏銳地觀察到了計算機快速處理數(shù)據(jù)的能力,從而提出人文計算方法,即利用新興計算工具輔助傳統(tǒng)的人文研究。在世界第一臺通用計算機誕生僅僅3年之后的1949年,羅伯托·布薩(Roberto Busa)獲得了國際商業(yè)機器公司(International Business Machines Corporation,IBM)創(chuàng)始人托馬斯·約翰·沃森(Thomas John Watson)的支持,開始嘗試使用計算機為海量文本編制詞語索引(index),這也是人文計算實踐的開端[7]。
近20年來,隨著計算機技術與多媒體技術的發(fā)展,計算機的存儲與運算能力更加強大,在文本之外,人文研究中的大量圖片、音頻與視頻等多媒體信息也可以被計算機處理與分析。計算機的能力早已不再局限于簡單的統(tǒng)計與計算,在計算機領域,可視化與可視分析、數(shù)據(jù)挖掘、知識推理、智能檢索等數(shù)字技術都能與人文學科碰撞產(chǎn)生新的火花,計算機參與了人文學科研究的各個階段,計算機學科與人文學科的交叉使人文研究進入新階段——數(shù)字人文時代[1]。
數(shù)字人文科研社區(qū)的形成可以追溯到人文計算時代,1964年IBM在美國約克城高地(Yorktown Heights)組織了關于人文計算的研討會,并出版了《文學數(shù)據(jù)處理會議論文集》(literary data processing conference proceedings)[6]。20世紀80年代,陸續(xù)出現(xiàn)了關于人文計算與數(shù)字人文的學術組織、期刊與國際性會議,如文學和語言計算協(xié)會(Association for Literary and Linguistic Computing,ALLC)、計算機與人文協(xié)會(Association for Computers and the Humanities,ACH)、《數(shù)字人文季刊》(Digital Humanities Quarterly,DHQ)等。2002年于德國圖賓根大學(Tuebingen University)舉辦的文學和語言計算協(xié)會與計算機與人文協(xié)會聯(lián)合會議(ALLC/ACH),發(fā)起了成立數(shù)字人文組織聯(lián)盟(Alliance of Digital Humanities Organizations,ADHO)的討論,嘗試協(xié)調整合世界多個地區(qū)的數(shù)字人文組織與會議。2005年,ADHO正式召開了第一次大會。經(jīng)過數(shù)年的發(fā)展,ADHO吸收多個區(qū)域性數(shù)字人文組織,覆蓋歐洲、美洲的主要區(qū)域,亞洲、非洲也有部分數(shù)字人文組織加入,成為當前國際上最具有權威性與代表性的數(shù)字人文組織[8]。ADHO每年組織開展一次國際數(shù)字人文大會(DH Conference),收錄長文、短文、海報等不同形式的發(fā)表物。
ADHO的國際數(shù)字人文大會是具有代表性的大規(guī)模數(shù)字人文會議,通過對其內容進行檢查,可以了解當前數(shù)字人文研究的發(fā)展情況。筆者從卡內基梅隆大學(Carnegie Mellon University,CMV)的數(shù)據(jù)庫中爬取了2013年至2020年國際數(shù)字人文大會的所有發(fā)表物信息,共3 043個條目。每個條目都包括作者、主題、關鍵詞、摘要等屬性。通過統(tǒng)計每年的發(fā)表物數(shù)量可以看到,大會的規(guī)模保持著較快的增長速度。為了展開更具體的分析,筆者從發(fā)表物的屬性中提取了研究主題的關鍵詞,利用可視化中的平行詞云方法[9]分析每年大會發(fā)表物中研究主題關鍵詞分布的變化情況(如圖1(a)所示),在代表年份的每一列中,出現(xiàn)次數(shù)越多的關鍵詞排名越靠前,且字號越大。除了可以發(fā)現(xiàn)可視化(visualization)一詞一直居于高位之外,筆者高亮標出的合作(collaboration)與教育學(pedagogy)也是數(shù)字人文研究中的熱門,而機器學習(machine learning)在最近幾年詞頻排名突飛猛進。除此之外,筆者還使用詞向量嵌入與t-分布鄰域嵌入算法(t-SNE),繪制了每年的研究主題關鍵詞投影地圖。對比2006年至2020年的關鍵詞投影地圖(如圖1(b)所示),筆者發(fā)現(xiàn)許多與傳統(tǒng)人文學科相關的關鍵詞及計算(computing)、語料(corpus)等與人文計算中經(jīng)典方法相關的關鍵詞始終出現(xiàn)在投影地圖中。從2014年開始,網(wǎng)絡(networking)、建模(modeling)、編碼(encoding)、合作(collaborative)等主題逐漸受到更多的關注,這也體現(xiàn)了數(shù)字人文研究中數(shù)據(jù)與方法的豐富與完善,而在2020年的投影圖中可以看到可視化(visualization,visualizing)、自然語言處理(natural language process)等主題開始出現(xiàn)。這些現(xiàn)象體現(xiàn)了數(shù)字人文領域的研究重心變化及多學科融合的大趨勢。
近年來,多方面促成可視化與數(shù)字人文學科交叉快速發(fā)展。一方面,信息技術的不斷發(fā)展使復雜數(shù)據(jù)的數(shù)字化與計算處理成為可能,同時眾多人文學者的持續(xù)努力使數(shù)字化的人文數(shù)據(jù)持續(xù)增長,這些數(shù)據(jù)使人文學者的研究空間變得更加廣闊,但復雜且龐大的數(shù)據(jù)也對數(shù)字人文的研究提出了新的挑戰(zhàn)。更多更復雜的數(shù)據(jù)使學者們更難理解數(shù)據(jù)中的關鍵信息,也更難做出決策,調整參數(shù),操縱算法處理數(shù)據(jù)。為了使人和機器更有效地參與數(shù)據(jù)分析協(xié)作,人文學者不斷探尋更好的可視化方法和工具,以搭建更好地連接人與機器的橋梁,提高人機協(xié)作的效率。另一方面,從可視化研究者的角度,數(shù)字人文領域中出現(xiàn)的新數(shù)據(jù)和新任務也向可視化領域提出了新需求與新挑戰(zhàn),激勵著更多的可視化研究者進行與數(shù)字人文相關的可視化方法研究和工具開發(fā)。同時隨著數(shù)據(jù)公開性與方法易用性的增長,藝術家、數(shù)據(jù)記者與社會大眾等群體也能夠更好地參與進來,使用可視化的工具和數(shù)字人文中的數(shù)據(jù)進行探索與創(chuàng)作。
近10年來,可視化與數(shù)字人文的交叉已經(jīng)形成了一股顯著趨勢。在國際數(shù)字人文大會中可以發(fā)現(xiàn),近10年可視化的詞頻都穩(wěn)居前列(如圖1(c)所示)。在平行詞云圖(如圖1(c)所示)中展開可視化一項,可以總結出在數(shù)字人文中與可視化關聯(lián)較強的八大主題為:文學研究、文本分析、歷史研究、網(wǎng)絡關系分析、知識表達、古物保存、時空分析以及文化研究。
圖1 使用可視化分析歷年DH會議出版物的總體情況
可視化在數(shù)字人文中的應用場景復雜多樣。在數(shù)字人文研究中,可視化方法需根據(jù)數(shù)字人文的任務與數(shù)據(jù)特性來確定。此外,被使用的可視化方法也受研究者的知識背景和個人偏好的影響。本節(jié)從可視化在數(shù)字人文中參與的任務、可視化在數(shù)字人文中處理的數(shù)據(jù)以及可視化在數(shù)字人文中不同的使用視角3個角度剖析可視化在數(shù)字人文中的應用情況。
數(shù)字人文中的任務種類繁多,在討論可視化在數(shù)字人文中參與的任務時,筆者選擇一種抽象的任務分類方法,以便在較短的篇幅中更加全面地分析問題。數(shù)字人文的整體研究流程包括3個階段,分別為數(shù)據(jù)收集、數(shù)據(jù)分析、結果展示。
數(shù)據(jù)收集指數(shù)據(jù)的采集錄入與標注加工等任務。在此類任務中,研究者需要將原本非數(shù)字化的材料電子化。例如實體書籍的錄入或雕塑作品的掃描建模,或初級數(shù)字化材料的加工(如文本識別)等。在數(shù)據(jù)收集的過程中,可視化本身雖然是一種信息輸出的方法,但其根本作用是輔助用戶與機器的交互,從而將用戶的知識凝結在最終的加工結果之中。一方面,可視化能較好地對信息進行簡化與轉換,降低標注的門檻,使專業(yè)性不那么強的用戶也能參與數(shù)據(jù)收集的工作,為數(shù)字人文中的眾包(crowdsourcing)[10]提供強大的支持。另一方面,可視化能高效地使用圖形向用戶反饋錄入與標注的數(shù)據(jù)結果,使用戶能及時檢查數(shù)據(jù)是否符合預期,能更容易地發(fā)現(xiàn)數(shù)據(jù)或標注中的錯誤。
在數(shù)據(jù)分析階段,人文學者借助計算機高效的計算能力,結合人文專業(yè)知識,進行數(shù)據(jù)驅動的分析與研究。而可視化正好可以作為用戶與計算機之間的雙向橋梁,有機地將用戶的領域知識與計算機高效的計算能力相結合。在可視分析的過程中,用戶基于可視化結果和自身專業(yè)知識不斷做出決策(decision making)[11],通過與可視化界面交互向計算機發(fā)出指令,而計算機也根據(jù)用戶的決策不斷地計算并展示新的可視化結果。在循環(huán)迭代的過程中,用戶不斷加深對數(shù)據(jù)的理解,最終從數(shù)據(jù)中得到結論。
在最后的結果展示階段,研究者需要向學術社區(qū)高效地傳達自己的研究結論,或使用偏向故事敘述或藝術展示的方式向大眾宣傳結果。可視化此時被作為一種高效的信息輸出手段??梢暬膬?yōu)點不僅在于更高的信息密度與更快的信息傳輸速度,同時圖形化的結果展示也更加有趣易懂,能讓不具備專業(yè)背景的大眾更愿意、更容易理解人文學者的成果,在教育科普領域起著重要的作用。
本節(jié)分析數(shù)字人文研究中可視化應對的數(shù)據(jù)形式。數(shù)據(jù)的形式在很大程度上直接決定了可視化的類型。從廣泛的可視化定義來說,應對簡單統(tǒng)計數(shù)據(jù)的統(tǒng)計圖表必然是數(shù)字人文研究中最為常見的可視化形式,但此類圖表的應用早已是學術寫作中的慣例,故不對此進行討論。
首先,文本可視化是數(shù)字人文中應用最多的可視化類型,在2019年的國際數(shù)字人文大會中,有68篇與可視化相關的長文,其中32篇都是與文本可視化相關的,占比高達47%。文本可視化應用廣泛的原因首先在于人文研究中文本材料的普遍性,同時文本的非結構化特征使研究者難以使用完全自動化的方法完成任務。在數(shù)字人文研究中,針對文本數(shù)據(jù)中字、詞、句、篇、主題等不同層次有不同的分析任務,但總體來說,可以將這些文本分析任務按照所分析的細節(jié)程度分為近讀與遠讀兩種類型,對應地,文本可視化也能被分為近讀與遠讀兩種可視化[12]。近讀是一種關注文本中語言自身結構的分析方式,包括實體分析、文字特征分析和文字復用分析等,近讀可視化往往在不丟失文本細節(jié)的情況下突出展示任務關注的部分,如使用不同顏色、不同大小的圖標符號對“白底黑字”的原始文本進行增強,或使用交互方法與多視圖提高用戶的閱讀效率。例如J?nicke S等人[13]為了比較多個版本的文本,使用了一種變化圖的可視化形式突出不同版本間文字的異同(如圖2(a)所示)。而在遠讀中,研究者更加關注文本總體特征與性質,往往先通過各類統(tǒng)計方法與數(shù)學模型總結抽象文本的特征,然后進行視覺展示。遠讀可視化常包含像素、詞云、地圖等抽象形式,如在Keim D A等人[14]對杰克·倫敦(Jack London)兩部小說的可視化中,使用顏色編碼了小說不同章節(jié)中用詞的豐富程度(如圖2(b)所示)。
圖2 數(shù)字人文中對文本數(shù)據(jù)進行可視化的例子
除文本外,網(wǎng)絡關系數(shù)據(jù)與地理時空數(shù)據(jù)也是數(shù)字人文中較多通過可視化方法被分析的對象。這兩種數(shù)據(jù)本身較高的復雜性給予了人文學者更多使用可視化方法的動力。
數(shù)字人文中的網(wǎng)絡關系數(shù)據(jù)多提取自文本,包括人物關系、家譜族譜、知識圖譜等。在對網(wǎng)絡關系數(shù)據(jù)進行可視化的過程中,使用符號與線條代表圖中點與邊的點邊圖(node-link)是一種最常見的方式。點邊圖的編碼方式簡單易懂,其中可以設置不同的位置布局方法和附加編碼方式,使其能應對不同的任務場景,呈現(xiàn)不同的效果。例如Canon C等人[15]在使用點邊圖對氣候傳播學的學術合作關系(如圖3(a)所示)進行可視化時,使用了顏色與大小的視覺編碼及力導向的方法,使代表相似概念的點聚集在一起。而Mcguffin M J等人[16]將點邊圖以分層布局排布,則能較好地完成家族樹的可視化任務(如圖3(b)所示)。在點邊圖之外,矩陣(matrix)也是常見的圖可視化方法,在矩陣中,常使用矩陣格點的顏色對關系是否存在或關系的權重大小進行編碼。相比點邊圖,矩陣可視化更加整潔,空間利用率更高,但在與路徑相關的關系分析任務中其表現(xiàn)明顯遜色于點邊圖。
地理時空數(shù)據(jù)是包含地理空間位置與時間信息的數(shù)據(jù),在研究與歷史、地理等相關的數(shù)字人文中較為常見。數(shù)字人文中的地理時空數(shù)據(jù)有兩種常見的來源。一類數(shù)據(jù)來源于文本,主要是從文本中提取的地名實體或時空事件,這種數(shù)據(jù)需要通過額外的先驗知識才能映射到地理空間中,如從古地名對應到目前現(xiàn)實的地理坐標。從文本中提取的地理數(shù)據(jù)通常規(guī)模較大,可能達到數(shù)萬個地名實體。例如在參考文獻[17]中,學者通過從1839年至1922年巴黎的城市目錄中提取400萬個人名與地址,重構了19世紀的巴黎市地圖。在應對此類數(shù)據(jù)時,數(shù)字人文學者往往使用現(xiàn)有的地理信息系統(tǒng)(geographic information system,GIS)進行數(shù)據(jù)可視化,使用符號與圖標編碼數(shù)據(jù),在地圖中分析數(shù)據(jù)中的地理分布、群體移動趨勢,或隨時間改變的數(shù)據(jù)特征等。例如Donaldson C等人[18]使用地圖上的熱力圖分析文本中描述英國湖區(qū)不同景點的用詞偏好。另一類數(shù)據(jù)來源于圖像數(shù)據(jù),如古代手繪地圖,此時常需要對手繪地圖進行變形,使其與現(xiàn)有地圖對齊,然后開始分析任務。El Khatib R等人[19]對古籍中的手繪古巴比倫地圖變形,使其與今天的世界地圖對齊。
除了上面討論的3種數(shù)字人文中常用于可視化的數(shù)據(jù)類型,數(shù)字人文中還有圖像、聲音、三維模型,乃至更多與具體領域相關的數(shù)據(jù)形式,但是針對這些數(shù)據(jù)的可視化方法遠不如前3種常見數(shù)據(jù)類型成熟。但即使在3種較為常見數(shù)據(jù)類型的可視化應用中,數(shù)字人文中對具體可視化技術的使用與可視化領域中對方法與工具的研究之間依然存在溝壑,人文學者由于缺少可視化的知識與經(jīng)驗,往往難以選出最有效的參數(shù)或方法來完成任務。Grandjean M等人[20]提到在處理網(wǎng)絡關系數(shù)據(jù)時,人文學者常常無法找到合適的可視化技術改善圖中嚴重遮擋的問題,同時也常忽略圖布局與分析任務的匹配性,這一類問題降低了可視化在數(shù)字人文研究中的有效性。同時,這一類問題也對可視化領域提出了新的需求,暴露了當前許多可視化工具無法支持靈活匹配任務的可視化創(chuàng)建,或對編程技能與可視化專業(yè)知識依賴過高的問題。因此,當前可視化工具的發(fā)展還存在巨大的進步空間。
可視化在數(shù)字人文中的使用也受使用者知識背景和興趣偏好的影響,本節(jié)分別從數(shù)字人文學者、可視化研究者以及藝術家的角度探索若干可視化與數(shù)字人文結合的案例。
人文學者在數(shù)字人文中的研究往往是從數(shù)據(jù)出發(fā)的。在國內的數(shù)字人文數(shù)據(jù)中,中國歷代人物傳記資料庫CBDB[21]是極負盛名的數(shù)據(jù)庫之一。CBDB項目自2005年啟動以來,以眾包的方式收錄了各類歷史文獻中的人物基本資料、關系往來和生平年表等信息。截至2022年8月,數(shù)據(jù)庫中已經(jīng)包含了52萬余人的傳記信息。面對這樣一個包含了大量復雜數(shù)據(jù)的數(shù)據(jù)庫,人文學者借助了許多現(xiàn)有的可視化工具進行分析。對于CBDB中復雜的地理信息數(shù)據(jù),人文學者往往使用現(xiàn)有GIS進行分析,如包弼德等人[22]使用顏色與大小編碼的圓圈在地圖上比較明初(1400年)與明末(1600年)時期的進士來源地。而對于關系數(shù)據(jù),現(xiàn)有Gephi[23]、UCINET[24]等圖可視化工具也能為人文學者提供許多的支持,CBDB官方網(wǎng)站上就使用UCINET中的Pajek插件對CBDB中朱熹書信往來記錄進行了可視化,如圖4所示。
圖4 CBDB中的朱熹書信往來可視化
另外,Schich M等人[25]使用可視化工具分析了Freebase、General Artist Lexicon以及Getty Union List of Artist Names這3個數(shù)據(jù)庫中15萬位名人的出生地和死亡地信息,Schich M等人[25]借助散點圖(如圖5(a)所示)分析了不同城市的名人出生數(shù)與死亡數(shù),從散點圖中可以快速識別出生數(shù)與死亡數(shù)顯著不平衡的城市。同時作者借助圖可視化對古玩收藏家從出生到死亡的流向進行可視化(如圖5(b)所示),在使用顏色和大小編碼的點邊圖中,古玩收藏家聚集的城市十分明顯。為了使大眾也能輕松理解這些埋藏在數(shù)據(jù)之中的有趣事實,作者還使用了一種三維可視化方法制作故事敘述視頻(如圖5(c)所示),這種可視化故事敘述的方法不僅能夠向大眾普及歷史知識,也能通過藝術化的表現(xiàn)形式引起公眾的興趣。
圖5 S chich M等人[25]分析與展示名人的出生與死亡數(shù)據(jù)
人文學者利用已有可視化工具或方法對人文數(shù)據(jù)進行分析,而隨著分析任務的深入,傳統(tǒng)的工具難以應對更加復雜的任務,針對人文數(shù)據(jù)與任務的特點深度定制化的可視化工具和方法能發(fā)揮更大的作用。而可視化研究者則傾向于針對一類新的數(shù)據(jù)或任務研發(fā)新的可視化方法與技術,在文學可視化中就有許多例子。
Keim D A等人[14]提出的“文學指紋”結合了文本分析算法和像素可視化方法,為單部文學作品計算出了多層次、多種類的特征值,并以特征指紋的形式展示給用戶。圖2(b)中的杰克·倫敦的兩部小說呈現(xiàn)出不同的特征指紋,直觀地展現(xiàn)出兩部作品在結構上的不同。傳統(tǒng)上,學者在對文學作品的通讀中逐步建立對文本特征的整體印象,而“文學指紋”采用的遠讀方法為領域學者提供了一種新的研究路徑,即由概覽到細節(jié)。隨著交互技術的發(fā)展,更多研究工作支持用戶在概覽與原始文本細節(jié)間切換,便于學者進行多層次的文本分析。Alharbi M等人[26]提出了莎士比亞戲劇《奧賽羅》德語譯本的對讀可視分析系統(tǒng),將遠讀和近讀集成在同一界面中,支持用戶通過選擇、過濾等交互方式在不同的粒度上進行探索。
可視分析技術的創(chuàng)新與發(fā)展為人文領域研究提供了新的數(shù)據(jù)探索與分析方式,對于從可視化研究者出發(fā)的可視化技術創(chuàng)新,要考慮的問題則是如何更深入、更泛化地將其應用到人文研究中,如何提高方法的通用性使其能適用于更多的人文研究,又如何幫助人文學者快速掌握可視化工具的使用方法。針對這些問題,智能交互技術是一種未來可能的發(fā)展方向,在未來,智能交互技術與可視分析系統(tǒng)的融合能進一步提升系統(tǒng)的有效性、易用性,輔助人文學者更加便捷、深入地分析領域數(shù)據(jù)。
除了人文學者和可視化研究者,一部分藝術領域學者也從藝術的角度出發(fā),創(chuàng)作出兼具藝術、科普與學術價值的數(shù)字人文作品。Xiang F等人[27]從家譜中獲得靈感,基于CBDB中的人物親屬關系,構建了中國古代家譜樹,并以交互可視化的方式呈現(xiàn)給大眾。不同于傳統(tǒng)的樹可視化方法,家譜樹引入分支、生長的視覺隱喻,對樹的視覺形態(tài)進行了增強,如采取自下而上的生長順序,使用藝術化編碼方式與三維布局。圖6(a)和圖6(b)分別是明代和宋代的皇室家族樹,兩者形態(tài)差異較大,展現(xiàn)出兩個朝代皇室傳承方式的不同。張姓家族樹(如圖6(c)所示)中雜亂的水平線則意味著歷史記載中“一子多父”的錯誤。藝術手法的融入使作品風格與數(shù)據(jù)特點緊密契合,作品具有極高的藝術價值,亦不失有效性,既易于大眾理解,也能為歷史研究提供線索。
圖6 中國古 代家譜樹可視化[27]
從這些例子中可以發(fā)現(xiàn),人文學者、可視化研究者以及藝術家都能結合自身所長,分別從人文數(shù)據(jù)分析、可視化技術創(chuàng)新以及藝術美學等角度開展可視化與數(shù)字人文結合的項目。但在大部分實際的項目中,單一背景的學者難以兼顧3個角度,最終的產(chǎn)出具有一定的局限性。要真正提升可視化與數(shù)字人文結合項目的效用,就需要強調學科之間的交叉,兼顧這些不同的角度。
在信息時代的新任務之下,數(shù)字人文項目需要多領域緊密交叉與合作,但現(xiàn)有的數(shù)字人文項目往往是由人文、技術、藝術等領域的研究者分別開展的。為了探究未來可視化與數(shù)字人文結合的新范式,北京大學可視化與可視分析實驗室對數(shù)字人文與可視化的交叉進行了許多探索,這些探索包含教育、科普與研究領域。筆者通過開展暑期學校,在教育方面探索人文、計算機、藝術多元合作模式下交叉人才的培養(yǎng)。同時,為了使公眾或其他相關領域學者了解可視化與數(shù)字人文交叉的強大能力,推廣新概念新方法,助力人文知識的傳播,筆者與人文藝術等領域的專家合作,開展面向公眾的敘事可視化實踐,參加公共展覽。在科研方面,筆者積極探索智能技術賦能數(shù)字人文研究,將可視化領域專業(yè)知識融入計算機智能,解決其他領域專家甚至公眾在使用可視化工具時的困難,提升可視化工具的易用性與有效性。
為了更好地探索數(shù)字人文和可視化結合項目的多領域合作模式和交叉學科人才培養(yǎng)方法,北京大學開設暑期學校并發(fā)起多個數(shù)字人文合作項目。首屆可視化暑期學校于2009年展開,此后每年邀請多元背景的國內外學界精英到北京大學授課,13年來,面向全國院校、研究機構、工業(yè)界培養(yǎng)的可視化人才已超過千人次。暑期學校的學員背景覆蓋計算機、設計以及人文社科等各應用領域。
暑期學校提供高質量的教學內容和高水平的課程設計,注重技術、藝術、應用領域多元結合,讓學員在提升可視化理論知識和設計素養(yǎng)的同時,提升項目設計的實踐能力。一方面,堅持邀請海內外可視化研究領域具有深厚造詣的知名學者,涵蓋可視化的各個研究領域,面向學員系統(tǒng)探討不同領域的主要挑戰(zhàn)、前沿理論和研究方法;同時邀請設計和交互領域的專家,介紹可視化在交叉領域的應用和發(fā)展。優(yōu)秀的講者確保了課程內容的高質量,極大地拓展了學員的知識面,為學員的動手實踐打下堅實的基礎。另一方面,在課程設計中,學員混合背景組隊,開展學科交叉教學實踐,提升學員在可視化技術、設計審美以及文化理解等方面的綜合能力。學員從復雜的數(shù)據(jù)中抽絲剝繭,設計美觀且高效的圖形圖像傳達信息,制作支持交互探索的可視化內容。在10余天的時間內,實現(xiàn)技術堅實、賞心悅目、具有文化內涵又解決實際問題的可視化項目。
課程設計的選題覆蓋廣泛,與中國和世界的文化發(fā)展密切相關,包括歷史、文化、經(jīng)濟以及教育等大眾關心的話題。最近兩年,暑期學校特別關注了與中國歷史人文有關的領域,如中國宋代木建筑、早期符號刻畫、春秋戰(zhàn)國戰(zhàn)爭、中國古塔、歷史人物軌跡、二十四節(jié)氣等。其中優(yōu)秀項目發(fā)布在“可視化看中國”在線欄目和“可視分析”公眾號上。部分項目經(jīng)過后續(xù)迭代和完善,并經(jīng)過歷史、人文等方向的領域專家改進后,在國內的數(shù)字人文展和博物館展覽中亮相。
在暑期學校的成果中,一個典型的數(shù)字人文項目是全國十大考古新發(fā)現(xiàn)可視化項目。該項目回顧了1990—2021年全國十大考古發(fā)現(xiàn),為分析和理解中國考古的情況提供了新穎、便捷且有趣的視角。在可視化界面中(如圖7所示),作者通過地圖展示考古發(fā)現(xiàn)的地域分布,并提供時間軸篩選展示。項目總覽視圖展示各年代考古發(fā)現(xiàn)的數(shù)目、遺址類型的差異,揭示了歷朝歷代中華文明的分布情況;單位分布視圖提供了考古發(fā)現(xiàn)所在省份排行榜和考古發(fā)掘單位排行榜,幫助用戶了解不同單位參與發(fā)掘的項目;合作關系視圖提供了不同考古單位的合作關系網(wǎng)絡,展示考古學研究交流與發(fā)展情況。用戶選擇具體的考古單位,還可以查看其與合作伙伴的詳細關系?!皻v年全國十大考古新發(fā)現(xiàn)”幫助領域專家從不同維度分析中國考古的發(fā)展,促進公眾了解中華文明的風采。
圖7 1990—2021年全國十大考古新發(fā)現(xiàn) 可視 化
面向公眾展覽的敘事可視化也是一個重要的嘗試,在向社會公眾科普人文知識的同時,也是對數(shù)字人文與可視化交叉學科中新概念、新方法的推廣。以《大運河流域名人軌跡地圖》數(shù)字人文在線系統(tǒng)為例,系統(tǒng)結合多種時空可視化軌跡可視化方法,在古代名人軌跡數(shù)據(jù)上進行可視化敘事,講述名人行跡與大運河文化故事。項目參加浙江美術館“大地史詩——中國大運河主題藝術展”。系統(tǒng)的封面輪播展示了不同時期大運河全貌,軌跡總覽視圖根據(jù)時間篩選展示名人主要遷移方向,以箭頭的形式繪制在地圖上,其箭頭粗細表示移動方向的規(guī)模。個人軌跡視圖使用點與邊表示人物移動與停留,系統(tǒng)提供軌跡的動畫順序播放與整體軌跡探索功能,隨著用戶對地圖的縮放,系統(tǒng)提供不同細節(jié)層次的軌跡展示。
此外,實驗室探索了多方合作創(chuàng)作更加偏向于藝術可視化作品的路徑。例如《宋元學案傳承關系圖》藝術可視化作品,該作品針對《宋元學案》一書的專業(yè)性較強、大眾理解難度較高的問題,通過藝術形式普及《宋元學案》中的學派源流,幫助大眾理解中華文化在宋元時期的發(fā)展傳承關系,具體如圖8所示。該作品采用宋畫卷軸風格的藝術方法,以《千里江山圖》為背景,以宋式房屋建筑隱喻宋元時期的不同學派。建筑之間的路徑和行人隱喻學派之間的思想傳承關系。卷軸上學派按照傳承順序從左至右排放,行人們匆匆前行,為公眾展示了一幅宋元時期中華文化流轉傳承的動態(tài)卷軸(如圖8(a)所示)。在系統(tǒng)中,用戶能夠直接了解各學派與學者的基本信息,能夠通過交互探索學派的傳承路徑與代表人物(如圖8(b)所示),能夠在這幅人物與建筑形象豐富各異的山水宋畫中(如圖8(c)所示)沉浸式地感受學派傳承中文化思想的交融變遷。在可視化系統(tǒng)的豐富表現(xiàn)力之下,原本復雜的學派流傳關系被以一種有趣、美觀且實用的形式展示給大眾。
圖8 《宋元學案傳承關系圖》可視化
將特定的領域背景知識融入計算機智能,讓計算機智能在涉及學科交叉的項目中彌補缺失的專業(yè)技能,這是智能時代的數(shù)字人文與可視化結合的重要方面。從可視化出發(fā),將可視化知識與計算智能結合,使計算機能夠理解用戶的任務需求,研究能通用地支持不同數(shù)據(jù)、不同用戶需要的新一代可視化創(chuàng)作工具,則能為人文學者或藝術家提供極大的支持。在結合數(shù)字人文的智能可視化技術方面,筆者也做了大量研究探索[28-30]。
憑借在深度學習驅動的可視化流程上多年的積累,筆者搭建了數(shù)據(jù)的可視化問答系統(tǒng),支持用戶通過自然語言表達自身需求,對通用的人文數(shù)據(jù)進行解析,并且快速構建可視化系統(tǒng)。問答系統(tǒng)的深度模型在大規(guī)模的語料數(shù)據(jù)上進行預訓練,獲得了通用的數(shù)據(jù)支持能力,并且在支持可視化任務的擴展數(shù)據(jù)集上進行訓練,從而獲得了可視化感知能力。以包含時間、省份、戶籍等屬性維度的數(shù)萬名明朝進士數(shù)據(jù)集為例(如圖9所示),在用戶輸入自然語言后,問答系統(tǒng)解析用戶的自然語言輸入,并且以可視化的形式回答問題。在此過程中,用戶只需使用自然語言表達需求而不用學習特定的模板。用戶想知道“不同戶籍的進士數(shù)目隨時間的變化趨勢如何?”,系統(tǒng)通過深度模型給出“戶籍”和“年份”趨勢,并繪制堆疊柱狀圖表達不同戶籍進士的變化趨勢。用戶可以通過自然語言自由地表達需求,系統(tǒng)自動渲染相應的可視化回答。通過深度學習技術與可視分析流程的結合,數(shù)字人文將會具有更廣闊的用戶群體。大眾以低成本方式將可視化技術運用于各類數(shù)據(jù),實現(xiàn)面向大眾的智能數(shù)字人文時代。
圖9 可視化問答系統(tǒng)
在這3個方面的 實踐中筆者發(fā)現(xiàn),促進未來數(shù)字人文與可視化交叉融合要從加強人人合作與人機合作兩方面同時推進。人人合作是要加強不同領域專家之間的協(xié)作,不僅包含探索更好的協(xié)作流程、框架與模式,同時也包含探索教學模式,培養(yǎng)兼?zhèn)涠鄬W科知識的交叉人才,讓這些交叉人才在學科合作中發(fā)揮關鍵的協(xié)調作用。除此之外,加強對數(shù)字人文與可視化交叉的前景和能力的宣傳,吸引更多學者嘗試與探索多領域合作,這也是一個重要的方面。而人機合作要強化計算機的能力,把專家知識融入智能計算機系統(tǒng),使計算機智能在數(shù)字人文與可視化交叉項目中能提供一些之前只有專家才能提供的知識支持,如讓計算機能自動根據(jù)用戶需求設計并生成合適的可視分析系統(tǒng),這將使人文領域的專家或大眾能夠在沒有可視化專家的幫助下有效地使用可視化分析探索數(shù)據(jù)。
可視化在其發(fā)展歷史中,一直與人文社科有重要的聯(lián)系。隨著計算機技術的發(fā)展,可視化進入與數(shù)字人文領域深度耦合的時代。通過對當前數(shù)字人文中可視化的發(fā)展現(xiàn)狀進行總結與分析,筆者發(fā)現(xiàn),現(xiàn)有的數(shù)字人文與可視化結合項目往往分別從人文學者、可視化研究者、藝術家的角度出發(fā),而下一代的數(shù)字人文期待多元領域更深度的合作。為了探索下一代可視化與數(shù)字人文結合的新范式,北京大學從教育、科普、研究3個方面出發(fā),組織多背景人才合作,開展暑期學校探索交叉人才的教育培養(yǎng)。同時與人文藝術專家合作推出可視化展覽作品,普及人文知識,宣傳可視化與數(shù)字人文結合的前景與魅力。在研究上,筆者摸索面向數(shù)字人文的智能可視化技術,通過實踐總結了可視化與數(shù)字人文交叉學科的兩個重要發(fā)展方向,即加強人與人之間的合作,改進合作方法與模式,加強交叉人才培養(yǎng),吸引更多領域專家的合作,以及增強人與機器之間的合作,將相關領域知識融入計算機智能中,發(fā)展下一代智能可視化技術。