徐彤陽 黃映思
(山西財經(jīng)大學信息學院,太原 030006)
目前數(shù)字文化建設廣受重視,推動中華文化“走出去”,不僅需要文化工作者努力,更需要推進文化的數(shù)字化開發(fā)和跨文化傳播,賦予中華文化“活的靈魂”。年譜可視化的方法重點展示了領域中人物之間的社會關系,通過挖掘各個人物的歷史時間、社會關系從而展示該人物在領域中的歷史地位,更直觀地展現(xiàn)出人物為其所在的領域文化帶來的影響。在傳統(tǒng)文化數(shù)字化傳承與發(fā)展的過程中,數(shù)字化轉型是關鍵的一步,傳統(tǒng)年譜資源的研究可以為傳統(tǒng)文化數(shù)字化轉型提供技術范式。
年譜是我國一種特殊的人物傳記資源,是按照時間節(jié)點考述一個人物或者群體人物的生平事跡,其活動軌跡在特定的時間與空間上進行,是一種以傳記體裁為主的文獻資源,其本身可以為學術研究提供翔實的實證資料,具有重要的學術價值和研究意義[1]。我國的年譜發(fā)展自北宋以來已有上千年的歷史,《中國歷代年譜總錄》中共著錄年譜3 015種,加上族譜約有1萬種[2]。家譜和年譜都是一種經(jīng)后人進行修繕而匯編的特殊文書。家譜是一種以血緣關系為主體記錄的家族世系繁衍信息和重要人物等信息,具有家族內(nèi)部的可追溯性。而年譜是按年月記載人物生平事跡的傳記體裁,通俗來說,就是以時間為順序編排譜主的生平活動和經(jīng)歷的一種特殊史書,具有個人史和編年史的性質,屬于一種特殊的人物傳記文書。目前年譜的數(shù)字化利用程度仍比較低,數(shù)字化研究更少,主要還是面向家譜文本資源比較多,使得年譜本身所蘊含的價值未能充分體現(xiàn)?,F(xiàn)階段,我國年譜的編撰隨著數(shù)字人文研究范式的發(fā)展,重新涌起了研究熱潮[3],如何在創(chuàng)新年譜資源編撰方式的同時充分利用年譜資源進行領域文化的學術研究[4],是目前對于年譜資源數(shù)字化再利用且充分利用的關鍵點之一。此外,年譜作為譜系文本資源的一種,其發(fā)展經(jīng)過了皇族帝王譜系到姓氏譜系、家族譜牒,再到年譜成為一個獨立的譜系文本[5],其所蘊含的文化、史料價值、學術價值及教育功能隨著社會需求的不斷變化而不斷豐富內(nèi)在含義,對年譜資源的數(shù)字化再利用及深入研究,也是學界通過學術研究的渠道傳播年譜資源的文化、引導等作用的重要方式。
近年來,針對譜系文本的研究開始嶄露頭角,研究范疇較為主要集中在家譜文書資源,例如,在家譜本體構建方面,陳艷[6]、夏翠娟等[7]對中國家譜本體模型展開了研究,分別構建了中國家譜的領域知識本體及上海圖書館家譜本體模型,從領域知識單元組織關系的角度重新解讀了中國家譜資源。在本體知識圖譜構建方面,張政平等[8]提出融合骨架法和七步法構建孔子世家譜本體的方法,并利用Protégé、Neo4j等工具構建本體并實現(xiàn)孔子世家譜知識圖譜的構建;祝振媛[9]則采用本體構建技術實現(xiàn)《吳氏西宅宗譜》的本體模型架構,并依據(jù)本體模型完成吳氏家譜知識譜系的實踐;姜贏等[10]基于Java EE框架B/S模式構建了家譜知識圖譜檢索系統(tǒng),系統(tǒng)功能包括家譜檢索、人物檢索、字輩排行、追根溯源等;吳信東等[11]基于知識圖譜,開發(fā)融合了知識圖譜構建技術的家譜數(shù)據(jù)中臺——華譜系統(tǒng)(Huapu-CP)。
學界家譜本體的研究充分驗證了本體技術、知識圖譜與譜系文本融合研究的可行性,但是對年譜資源進行本體與知識圖譜的構建依舊很少。筆者將嘗試利用本體模型構建年譜知識圖譜,在家譜本體構建模型的基礎上,考慮現(xiàn)有模型復用的可能性,以徐朔方先生編纂的《晚明曲家年譜》作為原始材料構建年譜本體,借助中國歷代人物傳記資料庫(CBDB)及其他歷史數(shù)據(jù)庫查詢補充與糾正相關資料,結合知識圖譜,深度挖掘晚明曲家核心人物的家族、作品、歷史事跡等,探討構建易讀的、具備共享性的名人群體年譜知識圖譜。知識圖譜是利用圖形之間的聯(lián)系反映知識之間的關聯(lián)關系,通過語義關系、關鍵詞索引、知識實體構架聯(lián)系等方式,強化知識之間的關系[12]。知識圖譜的構建方法[13]主要包括自頂向下和自底向上兩種體系,自頂向下通常應用于領域知識圖譜,是一種通過定義完善的本體模型及其關系屬性,依據(jù)原始數(shù)據(jù)進行實體抽取,并填充相應數(shù)據(jù)實例,以完成領域知識圖譜的構建[14];自底向上的體系多用于數(shù)據(jù)量較大的知識圖譜構建,首先需要先從數(shù)據(jù)中抽取實體、關系、屬性,再進行數(shù)據(jù)層的知識填充與處理,最終實現(xiàn)知識圖譜的整體構建[15]。筆者將依據(jù)自頂向下的架構方法論體系完成晚明曲家年譜知識圖譜的構建工作,為后續(xù)的傳統(tǒng)年譜的轉型研究提供一定的借鑒參考,這也符合當前對于年譜資源數(shù)字再利用的需要,具有較強的現(xiàn)實意義。
本文將以徐朔方先生所著的《晚明曲家年譜》(浙江古籍出版社,1993年版)作為主要研究素材?!锻砻髑夷曜V》共三大卷,分為蘇州卷、浙江卷、皖贛卷,共收錄起于徐霖終于金圣嘆[16],約二百年間的39位戲曲家年譜;囊括了明中后期至清初的重要曲家,幾乎涵蓋了晚明戲曲領域的重要人物,對全面了解明代戲曲的發(fā)展乃至名人年譜的編撰,甚至是對整個學術界都有非常大的價值,對促進年譜資源再利用有著實踐意義。因此,對名人年譜資源展開知識圖譜構建研究,是將年譜資源推向數(shù)字化發(fā)展的關鍵渠道。在原始數(shù)據(jù)預處理方面,首先利用OCR文字識別軟件對掃描文件進行文字識別轉錄,然后人工校對古籍原文,最終形成研究所需的年譜文本。
《晚明曲家年譜》記載內(nèi)容是按曲家籍貫劃分,有年譜、行實系年、事實錄存,所蘊含的知識本體類別單一又多重,如何準確提取分類點,設計一個充分融合年譜內(nèi)容的知識本體類別框架,以便對知識本體進行因果關系的提取,這是晚明曲家年譜本體構建所面臨的難點。
在本體模型的設計方面,為了能夠實現(xiàn)對晚明曲家年譜中各個人物大事記的因果關系等方面的構建,筆者結合中國歷代人物傳記資料庫、上海圖書館家譜知識服務平臺等開放數(shù)據(jù)庫查閱相關人物資料,以輔助本體模型中各個實體的分類與因果關系揭示。筆者還參考了上海圖書館家譜知識服務平臺[17]、中華尋根網(wǎng)[18]以及現(xiàn)有的家譜本體模型的相關研究,提取適合晚明曲家年譜知識本體的分類與因果關系描述方法,其中Zeebaree等[19]將TM模型的本體論進行了改進,從靜態(tài)描述開始,發(fā)展出一個動態(tài)模型,以確定指定行為的事件,從而對概念模型中的因果關系進行分析,將一個概念轉變成為可識別的模型內(nèi)部結構的實體。Zeebaree等還將TM模型應用于分析實體的因果關系,因此本文將借助Zeebaree對因果關系的研究范式,對晚明曲家年譜中知識本體類別的因果關系進行提取和分析。
目前本體模型構建的研究一般圍繞“本體模型-關系型數(shù)據(jù)庫”的研究范式而開展研究工作,比較常用的骨架法(又稱ENTERPRISE法)和斯坦福大學的七步法,結合通用關系型數(shù)據(jù)庫輔助本體模型數(shù)據(jù)的存儲與提供信息檢索服務,以滿足用戶需求。骨架法[20]主要包括確定本體應用的目的和范圍、本體分析、本體表示、本體評價、本體建立;七步法主要包括確定本體的專業(yè)領域和范疇,考查復用現(xiàn)有知識本體的可能性,列出本體中的重要術語,定義類和類的等級體系,定義類的屬性,定義屬性的分面,創(chuàng)建實例[21]。前者缺乏本體模型的重用性,易導致本體的可重構特性無法實現(xiàn)效用最大化[22];后者步驟較為完整,本體分析環(huán)節(jié)緊扣,本文將考慮以七步法入手,嘗試融入其他本體方法步驟以完善整個晚明曲家年譜本體模型的構建。
筆者還考慮到晚明曲家年譜記載了晚明曲家較為詳細的人物信息,主要以時間線及人物歷史大事記作為記載的內(nèi)容,包含人物的生卒年、人物評價、生平經(jīng)歷、官宦過往、著作作品等。相對于晚明曲家年譜數(shù)據(jù)來說,現(xiàn)有的本體結構無法融合大規(guī)模的年譜數(shù)據(jù),容易導致數(shù)據(jù)冗余、查詢體驗感下降等問題。將選取Neo4j圖數(shù)據(jù)庫作為本文數(shù)據(jù)的處理工具,一方面是Neo4j圖數(shù)據(jù)庫能夠高效地處理大規(guī)模數(shù)據(jù),支持非常靈活和細粒度的數(shù)據(jù)模型,且每一個節(jié)點都直接包含一個關系列表,關系列表中能夠存放該節(jié)點與其他節(jié)點的關系[23];另一方面是圖數(shù)據(jù)庫支持多種類型數(shù)據(jù),兼容性大,能夠以面向圖的格式進行數(shù)據(jù)的存儲和匯出,提供了非常完善的數(shù)據(jù)庫特性,包括ACID事務的支持、集群支持[24-25]等。
綜上,由于年譜文本為主的知識圖譜構建存在一定的現(xiàn)實難度,一方面是譜系領域本體構建與知識圖譜方法并不全面,現(xiàn)有的家譜本體與年譜本體又存在差異問題;另一方面,關系型數(shù)據(jù)庫存儲的效率較低且可視化需求無法滿足用戶的個性化檢索需求。針對以上問題,本文主要采用自頂向下的方式構建晚明曲家年譜知識圖譜。首先在晚明曲家年譜原始數(shù)據(jù)的基礎上,融合七步法、骨架法及其他研究范式構建晚明曲家年譜本體結構;其次根據(jù)年譜本體的結構,對原始數(shù)據(jù)中的實體進行提取,將實體數(shù)據(jù)整合為圖數(shù)據(jù)庫可以讀取的CSV數(shù)據(jù)格式,再匯入Neo4j圖數(shù)據(jù)庫,完成初步的晚明曲家知識圖譜構建;最后通過Neo4j圖數(shù)據(jù)庫實現(xiàn)對數(shù)據(jù)的存儲,構建晚明曲家年譜知識圖譜。
結合晚明曲家年譜原始數(shù)據(jù)的特點以及人物關系的描述,本文將結合具體的研究需要,以七步法為基礎,借鑒已有的譜系本體構建框架并進行調整,構建曲家年譜本體,具體流程如圖1所示。
圖1 晚明曲家年譜的本體模型構建流程
(1)明確本體的應用范圍。年譜本體應準確描述記載年譜人員的詳細信息、歷史事件信息,由此才能厘清人物之間的關聯(lián)關系,以確保人物分類符合現(xiàn)存文獻中的事實記錄。
(2)考查復用現(xiàn)有知識本體模型的可能性。由于目前以年譜作為本體構建的研究仍處于探索階段,而家譜與年譜之間具有一定的共同點和相似性,通過調研已有且比較成熟的家譜領域本體模型,對夏翠娟等[7]構建的上海圖書館家譜本體模型、張政平等[8]構建的孔子世家譜本體模型進行分析復用,并參照本體的構建方法論,以保障如期能夠實現(xiàn)晚明曲家年譜本體的初步構建。
(3)列出領域中的重要術語。本文從晚明曲家年譜中提取出相應的重要術語,包括卷次(volume)、引論(introduction)、譜序(number of the chronicle)、人物(person)、出生日期(date of birth)、死亡日期(date of death)、籍貫(native place)、性別(gender)、名(given name)、字(courtesy name)、號(pseudonym)、曲腔派系(song cavity factions)、人物評價(character comments)、著作名稱(title of book)、著作年份(year ofwork)、著作評價(book comments)、事記年份(year of the event)、事記(events)、歷史事件(historical events)、歷史活動地(historically active)、居住地(residence)。
(4)定義類及其等級體系。將本文的術語歸納出六大核心類別,分別為卷次、譜序、人物、著作、事記數(shù)、曲腔派系,其他術語歸納核心類別的子類別。
(5)定義類的屬性及約束。將文中的其他類別進行歸納整理,將其作為屬性劃分給對應的類,并確立類別之間的關聯(lián)。類的屬性包括對象屬性與數(shù)據(jù)屬性。晚明曲家年譜本體的五大核心類涵蓋11個對象屬性和20個數(shù)據(jù)屬性。對象屬性包括:屬于卷次、屬于曲腔派系、屬于譜序、有人物、有卷次、有歷史事件、有引論、有派系、有社會關系、有著作、同一人物;數(shù)據(jù)屬性包括:事記ID、事記年份、人物ID、人物評價、出生日期、卷次ID、歷史事件、歷史活動地、名字、號名字、居住地、性別、曲腔派系ID、死亡日期、籍貫、著作ID、著作名稱、著作年份、著作評價、譜序ID。
(6)本體表示。晚明曲家年譜本體OWL文件部分內(nèi)容表示如下。
①類的定義
②對象屬性的定義
③數(shù)據(jù)屬性的定義
(7)創(chuàng)建實例。在Protégé中填充實例以便判斷類與類之間的關系是否明確,本體結構是否符合應用需求。圖2是Protégé中的一位戲曲家的年譜本體實例化的成功運用,說明整個本體模型能夠使用,且可以準確地表達晚明曲家年譜中主要術語、對象屬性和數(shù)據(jù)屬性之間的組織關系。
圖2 晚明曲家年譜本體沈璟實例化示意
(8)本體構建。上述步驟完成之后,最終構建完成晚明曲家年譜本體模型(見圖3)。
圖3 晚明曲家年譜本體概念模型
本文利用圖數(shù)據(jù)庫Neo4j來完成CSV數(shù)據(jù)的存儲和可視化呈現(xiàn),構建晚明曲家年譜的知識圖譜,基于晚明曲家年譜本體模型中節(jié)點關系之間的設定,對節(jié)點的CSV文件進行整合,確保每個節(jié)點有唯一的ID值及清晰的關系屬性,利用Neo4j-admin import工具將數(shù)據(jù)導入圖數(shù)據(jù)庫Neo4j,最終實現(xiàn)晚明曲家年譜知識圖譜的可視化。具體流程包括實體及關系抽取、節(jié)點CSV文件構建、數(shù)據(jù)導入以及可視化4個步驟。
利用ORC掃描工具將晚明曲家年譜紙質文本轉換為數(shù)字文本,總結出以年譜譜主為核心實體單元,并以其為切入點,再以年譜文本內(nèi)容的原始框架及概念模型,選擇圍繞人物相關的知識單元作為晚明曲家年譜本體模型中的實體,保障實例數(shù)據(jù)匯入的準確性,實現(xiàn)本體的實例化及相關可視化。
由于筆者在自然語言處理及其實體模型訓練方面的能力有限,本研究的實體抽取選擇傳統(tǒng)的人工抽取方式,抽取完成后按照本體知識構建的需要進行CSV文件的保存。一是實體,核心實體以晚明曲家年譜文體結構為準,整個譜主論述中包含人物、卷次、譜序、事記(歷史事件)、著作、社會關系六大類內(nèi)容。由于晚明曲家年譜是以譜主為核心的人物類傳記資料,所以圍繞六大類主體,并著重以人物這一概念實體為準,人工抽取出符合年譜文本結構的相關實體數(shù)據(jù),并存儲為CSV文件格式。二是構建實體之間的關系,即實體關系數(shù)據(jù)。確定實體數(shù)據(jù)之后,結合其他歷史資料,分析人物本身具有的社會屬性與社會身份,如生平經(jīng)歷、交游關系、社會評價等。再參照復用本體的概念實體關系,復用或依據(jù)年譜資源特點構建整個實體的關系網(wǎng)絡,形成一個以人物為中心的關系網(wǎng)絡,即以人物實體為映射的實體關系數(shù)據(jù),最終融合概念本體模型,設計出知識圖譜所需要本體模型框架。
使用Neo4j-admin import工具存儲知識圖譜,需要建立節(jié)點知識圖譜的節(jié)點CSV文件,一是進行數(shù)據(jù)文件與頭文件(header file)分開建立,二是頭文件與數(shù)據(jù)文件合并建立,其中每個節(jié)點都有唯一的ID值,以便進行關系分類時能夠直接引用。依據(jù)本體模型的六大核心類別分別建立CSV文件,將數(shù)據(jù)文件與頭文件合并建立并存儲。
設置的節(jié)點文件包括6個。①卷次節(jié)點文件:juan_ci_nodes.csv。②譜序節(jié)點文件:pu_xu_nodes.csv;③曲腔派系節(jié)點文件:qu_qiang_nodes.csv。④人物節(jié)點文件:ren_wu_nodes.csv。⑤事記節(jié)點文件:shi_ji_nodes.csv;⑥著作節(jié)點文件:zhu_zuo_nodes.csv。
數(shù)據(jù)文件中的每一行代表一個實例。如事記節(jié)點文件部分內(nèi)容:事件ID(eventID)為“0300001”的主人公(personName)“徐霖”,事件時間(yearOfTheEvent)為“明英宗天順六年壬午(1462)”,歷史事件(Historical Events)為“徐霖生于松江華亭”。
Neo4j-admin import通過連接節(jié)點ID創(chuàng)建關系(relationships)。根據(jù)本體確定的核心類的對象屬性關系,可知晚明曲家年譜知識圖譜中共涉及11個關系,并根據(jù)這11個關系建立關系CSV文件。例如,“有歷史事件”關系的CSV文件具體關系如下。屬于卷次:“曲腔派系→卷次”;屬于曲腔派系:“人物→曲腔派系”;屬于譜序:“卷次→譜系”;有人物:“曲腔派系→人物”;有卷次:“譜序→卷次”;有歷史事件:“人物→事記”;有引論:“人物→譜序”;有派系:“卷次→曲腔派系”;有社會關系:“人物→人物”;有著作:“人物→著作”;同一人物:“人物→人物”。
將數(shù)據(jù)導入Neo4j,共導入了5 195個節(jié)點實例、5 559個關系和22 474個屬性。數(shù)據(jù)導入完畢,在控制臺輸入命令啟動Neo4j數(shù)據(jù)庫,再使用瀏覽器打開Neo4j數(shù)據(jù)庫的默認網(wǎng)址(http://localhost:7474/),即可看到導入成功的數(shù)據(jù)集,并且可以根據(jù)不同節(jié)點構建知識圖譜,如徐霖人物歷史事件關系知識圖譜(見圖4),描述了徐霖相關的歷史事件和著作,可以發(fā)現(xiàn)徐霖把蘇州當作他的第二故鄉(xiāng),而且作為晚明戲曲的先行者,其影響力并不像大眾所認為的那樣“無名”,其著作的影響力得到同期戲曲家的贊許,甚至皇帝南下還特意召見了徐霖,兩次光臨徐家,在當時可謂是十分難得的遭遇??梢?,通過知識圖譜所展示的知識關系,可以挖掘到大眾認知之外的新發(fā)現(xiàn),也可以更加直觀、清晰地描述與人物有關的事件、著作等信息。
圖4 徐霖人物歷史事件關系知識圖譜示例
年譜知識圖譜的構建以其內(nèi)在的知識關聯(lián)性、數(shù)據(jù)的可挖掘性及系統(tǒng)開發(fā)性,為傳統(tǒng)年譜資源轉型研究發(fā)展提供了基礎,并能從內(nèi)容上深化年譜資源,從而實現(xiàn)年譜資源的整體可讀性與數(shù)據(jù)量化。此外,借助成熟的數(shù)字人文技術和研究體系,將年譜文本作為一種信息資源,并以年譜知識圖譜模型研究為切入點,融入數(shù)字人文研究對象范疇,實現(xiàn)從技術的角度突破傳統(tǒng)年譜資源的研究,讓年譜知識圖譜研究向數(shù)字人文領域靠攏,以達到理論與技術上的借力;并依據(jù)自身的資源特色,從資源內(nèi)化出發(fā),激發(fā)創(chuàng)新的年譜資源知識檢索與挖掘等智能系統(tǒng)的研究,不斷深化和豐富年譜知識圖譜的內(nèi)在資源,打造一個具有領域代表性的數(shù)字年譜知識圖譜檢索系統(tǒng),真正將年譜資源轉換成大眾所需要的知識,讓更多的用戶能夠參與到年譜的知識“活化”中。
數(shù)字人文的內(nèi)涵之一便是人文與科技的深度融合,學界在數(shù)字人文的跨領域研究方面已經(jīng)有了相對成熟的技術體系,年譜作為特殊的歷史資源,本質上也是一種文化資源,但是面對數(shù)字經(jīng)濟新業(yè)態(tài)背景下,傳統(tǒng)的年譜資源已經(jīng)不能滿足大眾的數(shù)字文化需求,大眾更傾向于有個性化、互動性及可視化的數(shù)據(jù)需求,而年譜知識圖譜所具有的交互性、知識組織性恰好能夠滿足大眾的個性化需求,從共享交互的角度為用戶提供年譜數(shù)字資源平臺。此外,提高企業(yè)、高校及科研機構對年譜資源化、數(shù)字化的認可,強調年譜資源的學術價值、歷史和社會價值,助推年譜數(shù)字空間的開發(fā),從經(jīng)濟、技術、人文的角度豐富年譜知識圖譜的內(nèi)涵。年譜知識圖譜數(shù)字空間的構建,是年譜資源從傳統(tǒng)文本資源轉變?yōu)閿?shù)字資源的重要升級,也是年譜資源未來走向深度智能化的關鍵一步。
目前數(shù)字人文已逐漸趨向于研究對象的知識完備性,年譜文本資源的特殊性決定了自身資源的原始完備性,如何將資源的完備性通過數(shù)字技術轉化為能夠讓計算機解讀的數(shù)據(jù)對象,是運用數(shù)字人文技術研究年譜資源所面臨的挑戰(zhàn)。年譜知識圖譜能夠在數(shù)字化的過程中,最大化地保存原始數(shù)據(jù)的完備性,無疑破除了數(shù)據(jù)超大規(guī)模分析中數(shù)據(jù)原始完備性的損耗。此外,深度學習技術在數(shù)字人文領域已有較多的成熟應用,如循環(huán)神經(jīng)網(wǎng)絡詩歌數(shù)據(jù)分析、卷積神經(jīng)網(wǎng)絡古籍量化分析以及文本詞句解剖等,在技術層面上能夠最大限度地融合到歷史文化資源的研究中。因此,基于年譜知識圖譜和深度學習技術,解決年譜文本資源的原始完備性、語義關系等相關問題,研發(fā)年譜知識圖譜的衍生數(shù)字產(chǎn)品,使得年譜資源更趨向于數(shù)字智能化,調動年譜資源的轉型升級。
智慧技術賦能年譜本文資源的數(shù)字轉型,年譜知識圖譜的構建一方面是對傳統(tǒng)年譜資源的新嘗試,從技術層面將年譜資源拉到知識重構研究對象領域,是打開年譜資源走向智慧化的技術基礎;另一方面,年譜知識圖譜的構建本質上是依靠數(shù)據(jù)庫進行的數(shù)據(jù)分析,離不開用戶需求。因此,在年譜資源復雜多樣的情況下,對年譜知識圖譜構建和深化要借助數(shù)字人文理念開展相關研究,用可視化、智慧化的手段去呈現(xiàn)年譜名人群體的精神文化;以群體需求為主,搭建年譜知識圖譜智慧數(shù)據(jù)庫,實現(xiàn)年譜資源的深度挖掘和深度分析,這也是數(shù)字人文領域研究的核心。因此,以年譜知識圖譜為基礎,擴充年譜知識圖譜的技術路線,研制年譜知識圖譜智慧數(shù)據(jù)庫,是促進年譜資源走向數(shù)據(jù)人文領域的渠道,同時也從技術對象上豐富了數(shù)字人文的研究范疇,兩者是互相成就的良性融合。
本文以徐朔方《晚明曲家年譜》作為研究素材,通過數(shù)字人文研究范式、本體構建工具及知識圖譜結合的方法,轉變傳統(tǒng)的紙質年譜資源共享性的立體數(shù)字資源,多維度地呈現(xiàn)年譜中人物、歷史事件、社會關系等內(nèi)容;探究本體技術與知識圖譜技術在年譜資源中可視化研究的可能性,為我國傳統(tǒng)年譜資源,如名人年譜、名人群體年譜、傳記年譜及其他領域年譜資源的研究提供了技術框架的參考與借鑒,符合目前對于傳統(tǒng)譜系文書資源轉型研究的時代要求。但是僅以年譜知識圖譜為基礎實現(xiàn)多樣化數(shù)字化是遠遠不夠的,未來還需要對年譜知識圖譜進行更深層次的研究,才能真正實現(xiàn)年譜資源的“活化、活用”。