吳艷飛 張強 周樹斌 汪睿思 周洪
摘要:[目的/意義]革命文物承載著深厚的歷史文化價值,對其進行知識組織研究有助于推動革命文物資源在數(shù)智時代的開發(fā)利用,為實現(xiàn)革命文物資源的知識關聯(lián)與發(fā)現(xiàn)研究提供新路徑。[方法/過程] 以大別山革命文物為研究對象,首先,通過構建本體模型實現(xiàn)對革命文物資源領域內概念的規(guī)范化描述;其次,在分析革命文物資源結構特征的基礎上,對不同來源與結構的數(shù)據(jù)進行實體、屬性和關系抽取,并利用知識融合技術解決歧義問題;最后,將數(shù)據(jù)存儲到Neo4j圖數(shù)據(jù)庫中完成革命文物知識圖譜的構建,以實現(xiàn)對革命文物資源的多維知識發(fā)現(xiàn)研究。[結果/結論]通過構建革命文物知識圖譜,可以對革命文物資源進行深層次知識挖掘,實現(xiàn)對其知識單元的細粒度分析與知識關聯(lián),為革命文物資源的智能化應用奠定基礎。
關鍵詞:革命文物;知識圖譜;數(shù)字人文;知識發(fā)現(xiàn)
分類號:G251.2
引用格式:吳艷飛, 張強, 周樹斌, 等. 數(shù)字人文視角下的大別山革命文物知識圖譜構建[J/OL]. 知識管理論壇, 2024, 9(2): 148-160 [引用日期]. http://www.kmf.ac.cn/p/384/. (Citation: Wu Yanfei, Zhang Qiang, Zhou Shubin, et al. Construction of Knowledge Graph of Dabie Mountain Revolutionary Cultural Relics from the Perspective of Digital Humanities [J/OL]. Knowledge Management Forum, 2024, 9(2): 148-160 [cite date]. http://www.kmf.ac.cn/p/384/.)
革命文物是中國共產黨領導人民群眾在追求民族復興的實踐與奮斗過程中所保留下來的歷史遺存物,承載中國革命的偉大歷程與光榮歷史,蘊涵豐富的革命文化與紅色精神。當前黨和政府從政策方面對革命文物資源的保護利用給予高度重視。2018年,中共中央辦公廳、國務院辦公廳頒布了《關于實施革命文物保護利用工程(2018—2022年)的意見》,對開展革命文物保護利用工程提出具體要求[1]。習近平總書記在2021年召開的全國革命文物工作會議中,明確了加強革命文物保護工作對紅色文化的弘揚與傳承具有重要作用[2]。革命文物是偉大革命斗爭中歷史事件的縮影,承擔著賡續(xù)紅色基因的責任[3]。實施革命文物資源的深度開發(fā)利用,不僅可以直觀全面地挖掘文物中蘊含的歷史知識,還可以集中彰顯中國偉大革命歷程的獨特魅力,發(fā)揮革命文物以史鑒今、資政育人的重要作用。
現(xiàn)代信息技術發(fā)展的浪潮為人文學科研究提供了新思路與方法,拓寬了人文研究范疇,為文化遺產領域資源的傳承與保護提供技術支撐?,F(xiàn)階段,我國的文化遺產領域資源建設側重于應用現(xiàn)代技術進行數(shù)字化加工與存儲,忽視了對資源的深度挖掘與規(guī)范化表示。為解決這一問題,需要利用語義網(wǎng)技術對資源進行細粒度分析及關聯(lián)聚合,從而實現(xiàn)將研究重點從“藏”向“用”的轉變。革命文物作為重要的文化遺產,數(shù)量多、種類豐富,隱含豐富的文化價值,但目前尚未實現(xiàn)資源的語義描述,也無法滿足用戶的可視化展示、語義檢索的需求。因此,可以借助知識圖譜所具有的強大數(shù)據(jù)表示與描述特性,打破革命文物資源的固化藩籬,以可視化的方式將資源及資源間的關系呈現(xiàn)出來,完成知識重組,再現(xiàn)革命歷史場景。構建革命文物知識圖譜是對革命文物資源的內涵進行深層挖掘的過程,不僅能夠提升資源的利用廣度與深度,也可以為用戶開發(fā)利用資源提供切實的解決途徑。
筆者立足數(shù)字人文視角,以大別山革命文物為研究對象,在分析資源結構特征的基礎上,明確革命文物所涉及的相關概念與屬性,進而構建革命文物本體模型。然后,以此為模式層構建革命文物知識圖譜實現(xiàn)資源之間的知識關聯(lián),深層次挖掘資源背后隱含的語義知識,為探究革命文物資源的知識組織與知識發(fā)現(xiàn)提供了新的研究路徑,改變革命文物資源的服務模式,實現(xiàn)從單一的信息瀏覽到語義化的智能服務的轉變,有助于革命文化的傳播與共享。
1? 研究現(xiàn)狀/Research status
1.1? 革命文物資源研究
革命文物見證了中國革命艱辛歷程,是中國共產黨領導人民在革命、建設和改革的奮斗過程中遺留下的歷史遺物與遺跡。其具體形態(tài)表現(xiàn)為革命遺址遺跡、名人故居、英烈紀念館等不可移動文物,以及相關的檔案、文獻、史料、實物等可移動文物。革命文物作為紅色文化的載體,相關研究主要集中于國內。革命文物的保護與利用研究隨著數(shù)字技術的變革而發(fā)展,其發(fā)展歷程可以分為3個方面:①革命文物資源的數(shù)字化研究,主要是通過OCR、數(shù)字影像等方式來實現(xiàn)對革命文物資源的數(shù)字化保存與整理。如彭慶紅等[4]提出根據(jù)資源類型的不同設計相適應的開發(fā)利用路徑,來推動紅色檔案資源的數(shù)字化建設。②革命文物資源的數(shù)據(jù)化利用,數(shù)據(jù)化的關鍵在于重構革命文物資源的數(shù)據(jù)顆粒形態(tài),使用元數(shù)據(jù)、領域本體構建等方法實現(xiàn)革命文物資源標準化和有序化。如羅素潔等[5]以“余杭紅色記憶”專題資源庫為例,探索在基層公共圖書館建設紅色文獻數(shù)據(jù)庫的實踐路徑。③革命文物資源的關聯(lián)聚合研究,主要是對結構化數(shù)據(jù)進行開發(fā)利用,實現(xiàn)資源間的相互關聯(lián)。如付靖宜等[6]分析紅色文獻資源特征,構建基于語義關聯(lián)的紅色文獻資源知識聚合模型。關于革命文物資源的研究已不局限于數(shù)字化與信息化處理,目前的研究正在將視角集中在如何將革命文物資源進行語義描述,然而針對革命文物資源的語義組織研究相對比較匱乏,需要利用語義網(wǎng)來實現(xiàn)對革命文物資源的深度開發(fā)利用。
1.2? 基于知識圖譜的紅色文化資源研究
現(xiàn)階段,紅色文化資源的定義尚未有統(tǒng)一的結論,可被表示為:中國共產黨在領導人民實現(xiàn)中華民族偉大復興道路上所形成的各種物質及精神載體的總和,如革命精神、紅色遺跡等。目前,關于紅色文化資源的研究主要是從數(shù)字化保護與利用、建設與服務等方面出發(fā),立足數(shù)字人文視角深入研究紅色文化資源的研究較少。數(shù)字人文為從大量的紅色文化資源中挖掘隱含知識提供了可能性,為歷史的演化發(fā)展研究提供了新路徑。知識圖譜技術是人文學者進行數(shù)字人文研究的關鍵技術,并憑借強大的語義組織與描述能力,成為對紅色文化資源進行知識組織與可視化呈現(xiàn)的重要工具。通過梳理紅色文化資源知識圖譜構建研究,發(fā)現(xiàn)當前學者在研究內容上有所側重,其研究主要有:劉竟等[7]以黨史主題美術作品為著力點,構建相適用的元數(shù)據(jù)框架與本體模型,探究知識圖譜在黨史主題美術作品研究的可行性;徐曉娟等[8]以皖西紅色文獻為研究實例,構建皖西紅色文獻數(shù)據(jù)庫,并利用知識圖譜實現(xiàn)文獻檢索與知識發(fā)現(xiàn)服務;郭嘉欣[9]通過構建“紅色記憶”知識圖譜,對多源異構的紅色文化資源進行深層次的關系挖掘;張云中等[10]以紅色歷史人物為對象,搭建基于知識圖譜的知識問答服務架構,為用戶提供知識交互服務。不難發(fā)現(xiàn),有關紅色文化資源知識圖譜構建的相關研究已有了一定的成果,但其研究重點聚焦于宏觀視角,極少有以紅色文化資源的物質載體即革命文物資源為主體進行深入的研究,不過已有的研究方法與思路對筆者構建革命文物知識圖譜提供了指導作用與借鑒經驗。
縱觀上述研究可以發(fā)現(xiàn),針對革命文物資源的數(shù)字化保護的標準規(guī)范不夠清晰,資源分散在各機構和地區(qū),難以實現(xiàn)革命文物資源的共享,有礙于革命文化的傳播與傳承。雖然已有學者構建“紅色記憶”知識圖譜、紅色歷史人物知識圖譜,但其關注點集中于非物質性的紅色文化資源,在革命文物資源領域深入研究,對其知識結構進行知識關聯(lián)與深層次的知識發(fā)現(xiàn)研究仍有待進一步展開。因此,筆者以大別山革命文物為研究對象,借助本體理論與方法從多源異構的數(shù)據(jù)中提取核心概念與屬性,以此構建革命文物知識圖譜,將分散的知識單元進行有序化組織與可視化展示,實現(xiàn)對革命文物知識內涵進行深度分析與挖掘,為紅色文物資源的深度開發(fā)與利用提供可行的研究思路。
2? 框架構建/ Building framework
革命文物資源數(shù)量大、形態(tài)多樣、蘊含豐富的歷史內涵,但現(xiàn)有革命文物資源建設還停留在粗粒度階段,缺乏對其知識單元進行深度挖掘與知識關聯(lián)。針對這些問題,急需利用知識圖譜技術揭示革命文物資源中的知識元素與關系,實現(xiàn)對知識深層次的語義描述與組織?;诖耍P者提出構建革命文物知識圖譜框架(見圖1),該框架包括數(shù)據(jù)來源層、知識組織層、圖譜構建層和知識應用層4個層次。
數(shù)據(jù)來源層是革命文物知識圖譜框架的基礎,主要是將大量離散的多源異構數(shù)據(jù)采集并整合起來。革命文物資源的存在形態(tài)多樣,且在空間分布分散,大多屬于非結構化數(shù)據(jù)與半結構化數(shù)據(jù),需要采用網(wǎng)絡爬蟲與人工采集相結合的方式獲取相關數(shù)據(jù),同時利用領域內的相關數(shù)據(jù)資源對其進行完善與補充。在此基礎上將經過整合處理后的數(shù)據(jù)存儲到數(shù)據(jù)庫中,為后續(xù)的研究提供數(shù)據(jù)支撐。
知識組織層是圖譜構建的關鍵任務,是對領域內的知識進行邏輯化和體系化的過程,即構建革命文物本體。通過構建本體模型可以對革命文物資源進行知識建模,規(guī)范化描述資源中所涉及的概念及概念間的關系。分析革命文物資源的結構特征,界定革命文物本體的相關概念與屬性,同時在考慮復用現(xiàn)有本體的基礎上,結合自建本體實現(xiàn)革命文物本體模型的構建,以此完成知識圖譜模式層的搭建。
圖譜構建層是對獲取到的原始數(shù)據(jù)集進行知識抽取、知識融合和知識存儲。知識抽取是基于設計的本體模型,根據(jù)數(shù)據(jù)形式的差異采用不同的方法進行實體、屬性與關系的抽取,并以“實體—關系—實體”及“實體—屬性—屬性值”兩種模式表示數(shù)據(jù)。經過知識抽取環(huán)節(jié)獲取到的新知識存在共指與冗余等問題,需要采用相應的知識融合方法對其進行整合處理。最后,將處理完成的結構化數(shù)據(jù)以RDF三元組形式存儲到Neo4j圖數(shù)據(jù)庫中,完成革命文物知識圖譜的構建。
知識應用層是指基于已構建的革命文物知識圖譜,為用戶提供便捷獲取知識的服務,滿足用戶深層次開發(fā)利用革命文物資源的需求。革命文物知識圖譜以圖的方式將知識與知識間的關系呈現(xiàn)出來,實現(xiàn)知識間的語義關聯(lián)。用戶可以通過構建查詢語句來檢索所需的節(jié)點與關系,為用戶從不同角度進行革命文物知識內容的深度挖掘與知識發(fā)現(xiàn)研究提供便利。
3? 實證研究/Empirical research
3.1? 數(shù)據(jù)來源
大別山革命老區(qū)是中國革命的重要策源地,其包含的革命文物資源具有規(guī)模大、分布廣泛、類型多樣、時間跨度大等突出特征。大別山革命文物資源作為支撐大別山精神的重要載體,承載寶貴的紅色基因,以其作為實證對象進行研究對識別紅色文化資源基因特質、發(fā)揚紅色精神具有重要的現(xiàn)實價值。大別山革命根據(jù)地位于鄂豫皖三省交界處,其革命文物資源分布在該地區(qū)的博物館、紀念館與紅色旅游景點等。根據(jù)實例分析,發(fā)現(xiàn)大別山革命文物資源的數(shù)據(jù)來源多樣,筆者以鄂豫皖地區(qū)紅色文化網(wǎng)頁、黨史建設平臺、紅色旅游網(wǎng)頁及百度百科—數(shù)字博物館為主要數(shù)據(jù)源,同時利用中國共產黨創(chuàng)建史詞典和百度百科資源進行補充,通過網(wǎng)頁爬取與手工采集相結合的方式來獲取所需的數(shù)據(jù)。
3.2? 本體構建
本體作為一種抽象化的知識描述模型,可以清晰地定義和表示特定領域內的概念及概念間的關系,是共享概念模型的形式化規(guī)范說明[11]。本體源于哲學領域,具有約束和規(guī)范概念屬性的作用,應用領域非常廣泛。構建本體的過程較為復雜,其模型設計過程為了保證規(guī)范性,必須遵循明確性、客觀性、可擴展性等原則。當前,關于本體構建方法已經較為成熟,如TOVE 法、METHONTOLOGY 法、骨架法和七步法等,筆者選擇通用性較強的七步法來構建本體[12],并綜合考慮革命文物資源自身的結構特點,參考借鑒社會網(wǎng)絡人物本FOAF(Friend of a Friend)[13]、國際博物館理事會開發(fā)的概念參考模型CIDOC CRM(CIDOC Conceptual Reference Model)[14]、DC(Dublin Core)[15]、Time、GeoNames以及上海圖書館本體SHL[16]等國內外通用本體模型,對本體模型中人物、時間、事件、地點等相關概念與屬性進行復用,此外,由于當前可復用的本體詞表無法充分滿足對革命文物資源知識單元細粒度描述的需求。因此,筆者在調研已有本體詞表的基礎上,構建自定義詞表革命文物資源RCRR(revolutionary cultural relics resources),對革命文物知識的概念與屬性進行描述,進而完成革命文物資源本體模型構建。
3.2.1? 定義核心類與層級
革命文物資源本體模型構建的關鍵在于明確定義領域內知識的核心概念。核心概念也稱類,是本體建模的基礎,是某領域相關對象實例的集合[17]。在充分剖析革命文物資源知識內涵的基礎上,確定該領域內的核心元素,可以深層次地揭示革命文物資源間的相互關系。筆者結合革命文物資源特征,從中梳理提取出重要概念與術語,將革命文物資源頂層概念劃分為革命文物、人物、機構、時間、地點、事件和資源7個核心類。此外,還需要關注核心概念之間的層級關系,對其進行細分,確定其所包含的類及子類的關系,實現(xiàn)對革命文物知識語義要素體系的完善。革命文物資源類及層次關系如表1所示:
革命文物類是本體構建的核心概念,與其余6大類即人物類、時間類、機構類、地點類、事件類、資源類相互關聯(lián),共同構成革命文物領域內語義層面的知識網(wǎng)絡。為了確保對革命文物資源進行細粒度的描述,在分析已有文物分類標準的基礎上,根據(jù)自身屬性將革命文物資源劃分成實物(rcrr:practicality)和建筑(rcrr:Architecture)兩個子類,實物類包括戰(zhàn)史材料、書籍、日記等各種文獻資料,以及紀念品、旗幟等代表性實物,建筑類是指名人故居、革命舊址及紀念設施。
人物類是指與革命文物資源相關的個人與團體等實體,主要包含個人(foaf:Person)和團體(foaf:Group)兩個子類。個人是指與革命文物資源密切相關的人物,如報紙、圖書資料的撰寫者、生活用品或武器裝備的使用者。團體即與革命文物緊密關聯(lián)的團體組織,如政府組織、運動工會組織、文學社團等,這些組織在革命事件中常作為關鍵出現(xiàn),其數(shù)據(jù)屬性包括團體類型和組織宗旨。
機構類是指革命文物資源的收藏機構,其與革命文物類、時間類與地點類相互聯(lián)系,將館藏機構作為革命文物資源的核心類目,從館藏機構的角度實現(xiàn)資源組織。其數(shù)據(jù)屬性主要有機構名和機構類型。
時間類是用來描述革命文物資源的時間特征,包括革命文物資源的創(chuàng)造時間、個人的出生時間與死亡時間及事件的發(fā)生時間等。革命文物產生的時間往往不是某一時間點,而是某一時間段,因此,需要根據(jù)時間的跨度將時間類劃分成時間點和時間段兩個子類。時間點可以通過年月日來表示精確的時間,時間段以2021年中共中央發(fā)布的《中共中央關于黨的百年奮斗重大成就和歷史經驗的決議》中關于中國共產黨百年奮斗歷史的4個階段為依據(jù),分為新民主主義革命時期、社會主義革命時期、改革開放和社會主義現(xiàn)代化建設時期、中國特色社會主義新時代[18]。
地點類是涵蓋了革命文物、人物、事件所涉及的空間信息,對于革命文物而言,尤其是建筑類,主要是指建筑當前的所在地;對于人物而言,是指個人的出生地與死亡地以及團體的創(chuàng)建地點;對于事件而言,主要涉及事件的發(fā)生地。地點類的數(shù)據(jù)屬性包括地名、舊稱、經度和緯度等信息。
事件類主要是指革命文物資源中所涉及的相關歷史事件的集合,革命文物中蘊含豐富的革命事件,記載了艱苦奮斗的革命歷程。事件類與革命文物類、人物類、時間類、地點類均存在對象屬性關系,其具體數(shù)據(jù)屬性有事件名、事件主題和描述等。
資源類是指與革命文物資源相關的資源類型,如文本、圖譜、視頻等。革命文物的數(shù)據(jù)來源多樣決定知識呈現(xiàn)方式的多樣性,由此可以從多維視角來表示革命文物資源。資源類的數(shù)據(jù)屬性包括文本資源、圖片資源和視頻資源。
3.2.2? 定義屬性及關系
在完成革命文物資源本體模型的核心類的定義后,還需要進一步定義類的屬性來詳細描述資源結構特征。在本體構建中,屬性可分為對象屬性與數(shù)據(jù)屬性,通過定義類的屬性可以豐富革命文物資源關系和特征的語義描述。對象屬性即關系屬性,主要用于描述不同實體之間的關系,其定義域和值域均為類。對象屬性在本研究中的作用是為了表述革命文物資源概念間的關聯(lián)關系,以此實現(xiàn)革命文物資源的知識關聯(lián),幫助用戶對革命文物知識圖譜進行知識檢索服務,具體對象屬性設置見表2。數(shù)據(jù)屬性是用于描述類的內在和外在屬性,是對類自身信息的補充說明,其定義域為類,值域是某特定的數(shù)據(jù)類型,通過數(shù)據(jù)屬性的設計可以幫助用戶了解革命文物資源實例數(shù)據(jù)的詳細特征,擴充實例的內涵,具體數(shù)據(jù)屬性設置見表3。
基于上述所定義的類與屬性,最終確定的革命文物資源本體模型(見圖2)。革命文物資源本體模型揭示了類與類之間錯綜復雜的關系,為革命文物資源所蘊含的知識提供規(guī)范化描述,為后續(xù)的知識圖譜構建與應用研究提供有效的頂層邏輯基礎。
3.3? 革命文物知識圖譜構建
3.3.1? 知識抽取
知識抽取是革命文物知識圖譜構建的基礎,其決定了后續(xù)進行知識融合與知識存儲的質量。知識抽取的具體步驟是根據(jù)已構建的本體模型,從數(shù)據(jù)來源層形成的數(shù)據(jù)集中將所需的實體、關系及屬性抽取出來,并轉換成實體關系三元組。革命文物知識圖譜以RDF(資源描述框架)數(shù)據(jù)模型對抽取出的知識進行表示,常表示為<實體,屬性,屬性值>或<實體,關系,實體>,使知識得到規(guī)范描述。通過分析革命文物資源的數(shù)據(jù)來源,需采用不同的知識抽取方法來抽取革命文物資源中的實體、對象屬性和數(shù)據(jù)屬性。筆者采用深度學習與人工相結合的方法來實現(xiàn)知識抽取,針對非結構化數(shù)據(jù)(如鄂豫皖蘇區(qū)革命博物館的資源),通過調用LTP(哈工大語言技術平臺)[19],對采集到的語料進行分析、標注等處理,進而從文本中抽取所需的三元組關系。此外,為了完善領域內的相關數(shù)據(jù),還需要利用Jiagu自然語言處理工具對百度百科資源中的半結構化數(shù)據(jù)進行實體關系抽取。例如,以“黃麻起義開始于1927年11月13日,地點位于紅安、麻城”為示例,LTP知識抽取結果見圖3。以“劉伯承,1892年12月4日出生于四川省開縣”為示例,Jiagu抽取的結果見圖4。
3.3.2? 知識融合
知識融合是指在相同框架規(guī)范的基礎上,對不同來源的知識進行異構數(shù)據(jù)整合。多源異構的革命文物資源的融合需要對概念的關系進行判斷并整合,其知識融合包括概念層的本體融合以及數(shù)據(jù)層的實例、屬性的融合,前者擴展了本體的通用性和共享性,后者消除了實體的歧義性和多樣性[20]。在完成知識抽取任務后,得到由實體和關系組成的三元組數(shù)據(jù)集,但這些數(shù)據(jù)中仍存在一些冗余與歧義的問題,比如某些實體可能存在共指問題,即同一個實體有多個指稱項,同一概念的實體指向交叉,需要對其進行整合處理以便消除歧義,進而為知識圖譜的推理提供底層支撐。針對實體存在歧義問題,因其問題復雜且領域性較強,常規(guī)的算法無法對其融合,需要利用人工構建自定義詞典的方式來完成實體融合。此外,針對關系存在的歧義問題,則采用哈工大同義詞詞林(擴展版)[21]與余弦相似度相結合的方式來消歧關系名的多樣性。
3.3.3? 知識存儲
在完成知識融合任務后,需要選擇合適的數(shù)據(jù)庫來有效地表達和存儲數(shù)據(jù),當前知識圖譜的存儲方式主要有3種,分別是傳統(tǒng)的關系型數(shù)據(jù)庫、RDF數(shù)據(jù)庫和圖數(shù)據(jù)庫。Neo4j圖數(shù)據(jù)庫與傳統(tǒng)的關系型數(shù)據(jù)庫相比,具有獨特的優(yōu)勢,能夠以圖的方式可視化展示數(shù)據(jù)。因此,筆者選擇Neo4j圖數(shù)據(jù)庫作為革命文物資源的存儲工具,以實現(xiàn)革命文物知識圖譜的構建。Neo4j圖數(shù)據(jù)庫主要有標簽、節(jié)點、關系、屬性4種組成元素,由于本體模型與圖數(shù)據(jù)庫的知識表現(xiàn)形式存在差異,需要通過RDF三元組這一數(shù)據(jù)形式實現(xiàn)本體模型到圖數(shù)據(jù)庫結構的互相映射,其映射規(guī)則是將本體中的類與實例映射為節(jié)點,對象屬性映射為節(jié)點間的關系,數(shù)據(jù)屬性映射為節(jié)點的屬性。最終,形成包含357個實體節(jié)點和523個三元組關系的革命文物知識圖譜,詳細描述了革命文物資源中蘊含的豐富的歷史內涵,為實現(xiàn)革命文物資源知識檢索、知識發(fā)現(xiàn)等智能化服務提供支撐。
3.4? 知識應用
3.4.1? 知識關聯(lián)
知識圖譜具有強大的可視化功能,可以通過有向圖的方式清晰地展示革命文物資源的整體知識特征,詳細地描述節(jié)點與節(jié)點間關系的知識表示結構。知識圖譜由節(jié)點和邊構成,通過節(jié)點和關系將革命文物資源中蘊含的革命文物、人物、時間、地點、事件等知識單元關聯(lián)起來,進而將平面、靜態(tài)的零散知識單元轉換成立體、動態(tài)的知識網(wǎng)絡,為挖掘隱含的知識提供便利。筆者利用知識圖譜實現(xiàn)革命文物資源的實例化展示,其整體的展示效果見圖5,用戶可以通過單擊節(jié)點對節(jié)點的大小與顏色進行調節(jié),同時也可以查看節(jié)點的屬性信息,以便用戶快速了解革命文物資源的知識關聯(lián),進而對資源有更加深入的認識,賦能知識發(fā)現(xiàn)研究。
3.4.2? 知識檢索
革命文物知識圖譜提供知識檢索服務,其存儲方式的不同使得檢索方式也存在差異。Neo4j圖數(shù)據(jù)庫運用Cypher查詢語言進行知識檢索,與傳統(tǒng)關系型數(shù)據(jù)庫使用結構化查詢語言而言,具有簡便快捷的優(yōu)勢。革命文物知識圖譜的檢索功能可以讓用戶根據(jù)自身需要構建合適的檢索語言準確、快捷地獲取所需的節(jié)點和關系,如以“黃麻起義”為例進行檢索,構建Cypher查詢語句:MATCH(n)-[r:相關事件]-(m:Event{eventName:黃麻起義}) RETURN n,m,將與之相關的節(jié)點與關系直接呈現(xiàn)出來,查詢結果見圖6。從圖6中可以看出,與黃麻起義相關聯(lián)的革命文物資源有5項,分別是黃麻起義和鄂豫皖蘇區(qū)革命烈士陵園、黃麻起義使用的銅鑼、麻城烈士陵園、1928年黃麻起義領導人吳煥先用過的羅盤和1927年11月程儒鈿烈士參加黃麻起義時使用過的軍號(殘)。通過知識檢索可以發(fā)現(xiàn)革命文物背后蘊含的革命歷史事件,以便用戶全面了解革命文物資源,此外,知識圖譜還為用戶的知識檢索提供多維度的切入點,實現(xiàn)全方位、多視角地獲取革命文物資源的相關信息,有助于紅色文化的傳播與發(fā)展。
3.4.3? 知識發(fā)現(xiàn)
知識圖譜最重要的價值是為用戶提供知識發(fā)現(xiàn)服務,利用上述的知識關聯(lián)與檢索功能,可以快速檢索革命文物的相關節(jié)點與關系,還可以從不同維度出發(fā)挖掘知識關聯(lián)下的隱含知識,實現(xiàn)對革命文物資源的知識智慧發(fā)現(xiàn),助力人文領域研究從數(shù)據(jù)、學術到創(chuàng)造整合方向發(fā)展[22]。革命文物資源承載了諸多英雄事跡和重要的歷史事件,以革命文物為核心進行知識發(fā)現(xiàn)可以探尋文物背后所蘊含的歷史事件,通過“文物—事件—時空”知識脈絡實現(xiàn)對革命歷史場景再現(xiàn)。如以“王大灣會議會址紀念館”為核心,在圖數(shù)據(jù)庫進行多層路徑查詢,由于路徑深度對檢索結構與中心節(jié)點的關聯(lián)效果具有較大的影響,因此,將路徑深度設置為2—5的范圍依次檢索,發(fā)現(xiàn)路徑深度為2—3的時候,關聯(lián)效果最好,其結果見圖7。
從圖7中可以發(fā)現(xiàn),劉鄧大軍在大別山地區(qū)的作戰(zhàn)經歷:1947年8月27日,以劉伯承、鄧小平領導的晉冀魯豫野戰(zhàn)軍到達大別山地區(qū)。抵達大別山地區(qū)后,為了增強部隊斗志,克服,克服可能產生的右傾情緒,1947年9月27日至29日,劉伯承、鄧小平同志組織召開了一次旅以上高級干部會議,會議分析了部隊進入大別山后的艱巨任務,對后期的作戰(zhàn)方向部署任務。在這次會議之后,同年10月份,劉鄧大軍先后取得了張家店戰(zhàn)斗與高山鋪大捷重大勝利。綜上,以革命文物資源為線索進行知識發(fā)現(xiàn),可以為相關學者進行革命事件歷史溯源研究與紅色記憶重構提供支撐與保證。
通過知識圖譜可以將分散的數(shù)據(jù)進行有序化組織與關聯(lián),并以可視化的呈現(xiàn)方式清晰地呈現(xiàn)革命文物資源的知識結構特征,拓展了用戶的知識檢索范圍,便于用戶對革命文物資源進行深層次的多維知識發(fā)現(xiàn)研究。知識圖譜具有知識查詢和推理的特性,以節(jié)點與邊相連接的方式展示資源間的關系,為知識重組和深入挖掘革命文物資源的潛在知識提供重要的研究思路。
4? 結語/Conclusion
知識圖譜以其所具有的語義理解與組織能力,可以深度揭示革命文物資源的實體信息及知識關聯(lián),正成為各領域進行大規(guī)模語義信息集成和提供智慧化服務的關鍵所在。因此,將知識圖譜技術應用于革命文物資源的開發(fā)與利用研究,是推動革命文物資源建設向知識化乃至智能化發(fā)展的必然抉擇。筆者以大別山革命文物為實例對象,在明確革命文物資源所包含的相關概念與關系后,完成知識建模,并以此為基礎構建革命文物知識圖譜,實現(xiàn)碎片化資源的知識重組,對革命文物資源的語義化組織進行了探索性研究,為革命文物資源的數(shù)字化傳播與紅色文化基因的傳承提供了新的研究路徑。通過構建革命文物知識圖譜將多類型、多層次的革命文物資源中包含的知識與知識間的關系聯(lián)系起來,且能夠將分布在不同區(qū)域的零散碎片化的實物資源進行知識重組與集成,進而以更加直觀、更加動態(tài)、更加關聯(lián)的方式呈現(xiàn)給用戶,為用戶了解及學習革命文化提供智能化的信息服務。
本研究為革命文物資源提供了語義化組織方案,充分描述了資源中所蘊含的歷史價值。但本研究仍存在一些不足:受到案例數(shù)據(jù)的限制,僅以大別山革命文物作為數(shù)據(jù)源進行研究,其數(shù)據(jù)量相對有限,未來會考慮添加更多的革命文物數(shù)據(jù)進行研究,擴大數(shù)據(jù)規(guī)模。此外,雖然本研究實現(xiàn)了對革命文物資源的知識檢索與發(fā)現(xiàn)服務,但為了提升研究深度和廣度,滿足用戶對革命文物資源的智慧化服務需求,需要進一步探討智能問答、知識推薦等系統(tǒng)的實現(xiàn)。
參考文獻/References:
[1] 中國政府網(wǎng).中共中央辦公廳 國務院辦公廳印發(fā)《關于實施革命文物保護利用工程(2018-2022年)的意見》[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2018-07/29/content_5310268.htm.(Chinese Government Website. General Office of the Central Committee of the Communist Party of China and General Office of the State Council issued “Opinions on the implementation of the project for the protection and utilization of revolutionary cultural relics (2018-2022)”[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2018-07/29/content_5310268.htm.)
[2] 中國政府網(wǎng).習近平對革命文物工作作出重要指示[EB/OL]. [2024-03-10]. http://www.gov.cn/xinwen/2021-03/30/content_5596770.htm. (Chinese Government Website. Xi Jinping gave important instructions on the work of revolutionary cultural relics[EB/OL]. [2024-03-10]. http://www.gov.cn/xinwen/2021-03/30/content_5596770.htm.)
[3] 田艷, 李帥. 革命文物保護與中華民族共有精神家園建設研究[J]. 中央民族大學學報(哲學社會科學版), 2023, 50(2): 13-23. (TIAN Y, LI S. Research on the protection of revolutionary cultural relics and the construction of the common spiritual home of the Chinese nation[J]. Journal of Minzu University of China (philosophy and social sciences edition), 2023, 50(2): 13-23.)
[4] 彭慶紅, 孫曉丹. 紅色檔案資源數(shù)字化開發(fā)利用的路徑與梯度[J]. 檔案學通訊, 2022(4): 10-16. (PENG Q H, SUN X D. Paths and gradients of digital development and utilization of the red archives resources[J]. Archives science bulletin, 2022(4): 10-16.)
[5] 羅素潔. 基層公共圖書館紅色文獻數(shù)據(jù)庫建設研究——以“余杭紅色記憶”專題資源庫為例[J]. 圖書館雜志, 2021, 40(7): 151-156. (LUO S J. Research on red literature database construction of grassroots public library: take Yuhang red memory thematic resource database as an example[J]. Library journal, 2021, 40(7): 151-156.)
[6] 付靖宜, 李姍姍, 項欣溢, 等. 新四軍蘇浙軍區(qū)多模態(tài)紅色文獻資源知識聚合模式研究[J]. 檔案學研究, 2022(4): 24-31. (FU J Y, LI S S, XIANG X Y, et al. Research on knowledge aggregation model of multimodal red literature resources of New Fourth Army in Jiangsu and Zhejiang military region[J]. Archives science study, 2022(4): 24-31.)
[7] 劉竟, 王萌, 劉桂鋒, 等. 數(shù)字人文視角下紅色文化資源知識圖譜構建研究[J]. 圖書館雜志,2023, 42(7): 102-109, 125. (LIU J, WANG M, LIU G F, et al. Research on the construction of knowledge graph of red cultural resources from the perspective of digital humanities[J]. Library journal, 2023, 42(7): 102-109, 125.)
[8] 徐孝娟, 孫愛華, 史如菊, 等. 數(shù)字人文視角下皖西紅色文獻知識本體及其應用[J]. 圖書館論壇,2023, 43(10): 139-151. (XU X J, SUN A H, SHI R J, et al. Research on knowledge ontology and application of red documents in western Anhui from the perspective of digital humanities[J]. Library tribune, 2023, 43(10): 139-151.)
[9] 郭嘉欣.基于多源異構數(shù)據(jù)挖掘的“紅色記憶”知識圖譜構建[J]. 知識管理論壇, 2020, 5(1): 59-68. (GUO J X. Construction of “red memory” knowledge graph based on multi-source heterogeneous data mining[J]. Knowledge management forum, 2020, 5(1): 59-68.)
[10] 張云中, 郭冬, 王亞鴿, 等. 基于知識圖譜的紅色歷史人物知識問答服務框架研究[J]. 圖書情報工作, 2021, 65(16): 108-117. (ZHANG Y Z, GUO D, WANG Y G, et al. Framework of knowledge Q&A service for red historical figures based on knowledge graph[J]. Library and information service, 2021, 65(16): 108-117.)
[11] STUDER R, BENJAMINS V R, FENSEL D. Knowledge engineering: principles and methods[J]. Data & knowledge engineering, 1998, 25(1/2): 161-197.
[12] 岳麗欣, 劉文云. 國內外領域本體構建方法的比較研究[J]. 情報理論與實踐, 2016, 39(8): 119-125. (YUE L X, LIU W Y. A comparative study of the construction method of domain ontology at home and abroad[J]. Information studies: theory & application, 2016, 39(8): 119-125.)
[13] FOAF[EB/OL]. [2024-03-10]. http://xmlns.com/foaf/.
[14] CIDOC CRM[EB/OL]. [2024-03-10]. https://cidoc-crm.org/.
[15] DCMI Schemas[EB/OL]. [2024-03-10]. https://www.dublincore.org/schemas/.
[16] 上海圖書館名人手稿[EB/OL]. [2024-03-10]. http://sg.library.sh.cn/mrsg/ipwarning/nopage. (Manuscripts of celebrities in the Shanghai Library [EB/OL]. [2024-03-10]. http://sg.library.sh.cn/mrsg/ipwarning/nopage.)
[17] 鄧君, 王阮. 口述歷史檔案資源知識組織與關聯(lián)分析[J]. 情報資料工作, 2021, 42(5): 58-67. (DENG J, WANG R. Analysis on the knowledge organization and relevance of oral history archives resources[J]. Information and documentation services, 2021, 42(5): 58-67.)
[18] 中國政府網(wǎng). 中共中央關于黨的百年奮斗重大成就和歷史經驗的決議[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2021-11/16/content_5651269.htm.(Chinese Government Website. Resolution of the Central Committee of the Communist Party of China on the major achievements and historical experience of the party in the past century[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2021-11/16/content_5651269.htm.)
[19] HanLP[EB/OL]. [2024-03-10]. https://www.hanlp.com/.
[20] 宋雪雁, 張偉民, 張祥青.基于檔案文獻的清代祭祀禮器知識圖譜構建研究[J]. 圖書情報工作, 2022, 66(3): 140-151. (SONG X Y, ZHANG W M, ZHANG X Q. Research on the construction of knowledge graph of sacrificial vessels in Qing Dynasty based on archival documents[J]. Library and information service, 2022, 66(3): 140-151.)
[21] LTP[EB/OL]. [2024-03-10]. http://ltp.ai/.
[22] 趙星, 喬利利, 葉鷹. 面向數(shù)據(jù)智能和知識發(fā)現(xiàn)的圖書情報學跨界拓展——數(shù)據(jù)—學術—創(chuàng)造整合論[J]. 中國圖書館學報, 2020, 46(6): 16-25. (ZHAO X, QIAO L L, YE Y. An interdisciplinary extension of library and information science facing data intelligence and knowledge discovery: integration of data-academy-creativity[J]. Journal of library science in China, 2020, 46(6): 16-25.)
作者貢獻說明/Author contributions:
吳艷飛:設計研究方案,撰寫論文初稿;
張? 強:提出研究思路,論文定稿;
周樹斌:修改論文;
汪睿思:進行數(shù)據(jù)采集;
周? 洪:修改論文。
Construction of Knowledge Graph of Dabie Mountain Revolutionary Cultural Relics from the Perspective of Digital Humanities
Wu Yanfei1? Zhang Qiang1? Zhou Shubin1? Wang Sirui2? Zhou Hong3
1School of Information Management, Central China Normal University, Wuhan 430079
2School of Art, Chengdu Jincheng College, Chengdu 610097
3School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190
Abstract: [Purpose/Significance] Revolutionary cultural relics carry profound historical and cultural value, and the study of their knowledge organization will help promote the development and utilization of revolutionary cultural relics resources in the digital and intelligent era, and provide a new path for the knowledge association and discovery research of revolutionary cultural relics resources. [Method/Process] This study takes the revolutionary cultural relics of Dabie Mountain as the study object. Firstly, the concept of revolutionary cultural relics resources was standardized by constructing an ontology model. Secondly, based on analyzing the structural characteristics of revolutionary cultural relics resources, the entities, attributes, and relationships of data from different sources and structures were extracted, and the knowledge fusion technology was used to solve the existing ambiguity problem. Finally, the data was stored in the Neo4j graph database to complete the construction of the knowledge map of revolutionary cultural relics, and to realize the multi-dimensional knowledge discovery and research of revolutionary cultural relics resources. [Result/Conclusion] By constructing the knowledge map of revolutionary cultural relics, in-depth knowledge mining of revolutionary cultural relics resources can be carried out, fine-grained analysis and knowledge correlation of their knowledge units can be realized, and the foundation can be laid for the intelligent application of revolutionary cultural relics resources.
Keywords: revolutionary cultural relics? ? knowledge graph? ? digital humanities? ? knowledge discovery
Fund project(s): This work is supported by the Key Project of Philosophy and Social Science Research in Colleges and Universities in Anhui Province: “‘Positive up: Research on the Inheritance of Red Gene in Colleges and Universities from the Perspective of Digital Humanities” (Grant No. 2023AH050893)
Author(s): Wu Yanfei, master candidate; Zhang Qiang, doctoral candidate, corresponding author, E-mail: zhangqiang_dh@163.com; Zhou Shubin, master candidate; Wang Sirui, undergraduate; Zhou Hong, doctoral candidate.
Received: 2023-11-20? ? Published: 2024-04-08