當(dāng)前針對本體的知識圖譜在存儲復(fù)雜實體知識方面存在局限,難以滿足像斗拱這樣復(fù)雜組合體的知識存儲與應(yīng)用需求。為更好地分析斗拱各構(gòu)件間的關(guān)系,實現(xiàn)斗拱知識的數(shù)字化存儲與應(yīng)用,文章基于明清時期文獻(xiàn)中關(guān)于斗拱的種類、位置、尺寸、構(gòu)件等關(guān)鍵概念,以及構(gòu)件間的約束關(guān)系,構(gòu)建了全面的斗拱構(gòu)件實體知識圖譜。文章利用圖數(shù)據(jù)庫Neo4j進(jìn)行知識圖譜的存儲與管理,為復(fù)雜實體的知識存儲與分析提供了創(chuàng)新的解決方案,并為明清斗拱的數(shù)字化研究與應(yīng)用提供了新思路。
斗拱是古代木制建筑的重要組成構(gòu)件,融合了力學(xué)與美學(xué)的價值,體現(xiàn)了豐富的歷史文化,彰顯了中國古代建筑的偉大成就。作為構(gòu)件間相互組合約束的復(fù)雜組合體,斗拱由多種多樣的單一構(gòu)件按照特定的規(guī)則組合而成,其種類、尺寸、位置以及構(gòu)件之間的連接關(guān)系規(guī)則,構(gòu)成了一個復(fù)雜的知識體系。在當(dāng)今數(shù)字化技術(shù)快速普及發(fā)展的背景下,對斗拱的研究逐漸由傳統(tǒng)的紙質(zhì)文獻(xiàn)和事物測繪轉(zhuǎn)向數(shù)字化保護(hù)和信息化管理。然而,斗拱相關(guān)知識大都散落于書籍之中,如何有效地存儲、組織和應(yīng)用斗拱相關(guān)知識,來滿足數(shù)字化保護(hù)和實際應(yīng)用的需求,仍然是一個重要的課題。知識圖譜以節(jié)點和關(guān)系的形式來表達(dá)實體及其間的關(guān)系,能夠清晰明了地展示復(fù)雜實體的結(jié)構(gòu)和內(nèi)容,因而在信息管理和知識表達(dá)領(lǐng)域得到了廣泛應(yīng)用。針對斗拱構(gòu)件種類繁多、關(guān)系復(fù)雜的特點,構(gòu)建斗拱知識圖譜可以有效地梳理斗拱相關(guān)知識,并為其數(shù)字化保護(hù)、構(gòu)件分析和三維建模提供基礎(chǔ)支持。
文章以明清時期的斗拱文獻(xiàn)為基礎(chǔ),圍繞斗拱的種類、位置、尺寸、構(gòu)件及其間的約束關(guān)系,提出了構(gòu)建斗拱構(gòu)件知識圖譜的方法,利用Neo4j圖數(shù)據(jù)庫對斗拱的知識進(jìn)行存儲和可視化展示,并形成了一套完整的構(gòu)建流程,為復(fù)雜實體的知識圖譜構(gòu)建提供了新的思路,同時也為斗拱的數(shù)字化保護(hù)與應(yīng)用奠定了基礎(chǔ)。
研究現(xiàn)狀
知識圖譜是一種以圖形化形式表示知識的工具,能夠清晰地展示實體及其關(guān)系。通過結(jié)構(gòu)化和語義化的方式,知識圖譜可以有效地組織信息,幫助人們更好地理解和使用領(lǐng)域內(nèi)的知識。針對小規(guī)模專業(yè)領(lǐng)域的研究,研究人員深入剖析中醫(yī)典籍里的病癥及其相關(guān)屬性,手工構(gòu)建出中醫(yī)古籍知識圖譜。大規(guī)模知識圖譜構(gòu)建是個難題,研究人員提出基于大語言模型的科技領(lǐng)域知識圖譜構(gòu)建方法。這種方法采用分層架構(gòu),把數(shù)據(jù)存儲、知識構(gòu)建以及應(yīng)用展示整合起來,實現(xiàn)了科技領(lǐng)域知識的高效提取與利用。在古建筑領(lǐng)域數(shù)字化應(yīng)用方面,學(xué)者通過運用貝葉斯算法對古建筑構(gòu)件及其關(guān)系進(jìn)行建模,以數(shù)據(jù)驅(qū)動的方式實現(xiàn)快速模型生成。用戶只需在交互式界面選取少量構(gòu)件前提,即可完成古建模型的生成。古建筑知識庫在遺產(chǎn)保護(hù)中起著關(guān)鍵作用,研究表明,系統(tǒng)化的知識庫所提供的信息對古建筑修復(fù)和保護(hù)至關(guān)重要。
圖譜構(gòu)建方法
屬性和關(guān)系。斗拱這一實體的屬性和關(guān)系相對簡單,采用手工創(chuàng)建的方式能夠滿足需求。由于目前缺少相應(yīng)的數(shù)據(jù)庫支持,無法依賴已有的基礎(chǔ)進(jìn)行擴展,因此文章選擇自下而上的手動創(chuàng)建方法來構(gòu)建斗拱的知識圖譜。該知識圖譜構(gòu)建分為以下5個步驟(如圖1所示)。
建立知識圖譜搭建框架:根據(jù)斗拱的搭建法則構(gòu)建一種適用于斗拱構(gòu)件實體的知識圖譜搭建框架。
概念層的構(gòu)建:采用自下而上的方法,從基礎(chǔ)數(shù)據(jù)出發(fā),逐步建立圖譜的基本概念結(jié)構(gòu)。
知識抽?。豪冒虢Y(jié)構(gòu)化的XML等數(shù)據(jù)以及非結(jié)構(gòu)化的書本、圖片等多源數(shù)據(jù),系統(tǒng)地抽取了斗拱實體、關(guān)系和屬性信息,并進(jìn)行整理。通過深度挖掘這些數(shù)據(jù)源,提取出關(guān)于斗拱的信息,包括不同構(gòu)件的特征、它們之間的關(guān)聯(lián)關(guān)系以及相關(guān)的屬性。
知識加工:整理抽取的知識,按照不同的斗拱構(gòu)件,對實體和關(guān)系進(jìn)行精細(xì)的數(shù)據(jù)加工。
知識存儲:利用Neo4j圖數(shù)據(jù)庫存儲與斗拱相關(guān)的知識數(shù)據(jù)。Neo4j提供了強大的圖數(shù)據(jù)庫管理系統(tǒng),能夠有效地組織和查詢斗拱知識圖譜,為我們的研究提供可靠的基礎(chǔ)。
想法和框架。斗拱的造型極為復(fù)雜,構(gòu)件間遵循特定的搭建法則,使得斗拱成為一個構(gòu)件間相互約束的復(fù)合體。由于斗拱具有特殊性,因此目前尚缺乏統(tǒng)一的分類標(biāo)準(zhǔn),而根據(jù)不同特征屬性可以將其劃分為多個類別。文章通過深入分析斗拱的空間結(jié)構(gòu)、構(gòu)成構(gòu)件以及連接關(guān)系等,提出了一套適用于斗拱構(gòu)件標(biāo)注的知識圖譜構(gòu)建規(guī)則。這些規(guī)則不僅考慮了斗拱的整體形態(tài),還充分考慮了構(gòu)件之間的相互作用,為知識圖譜的構(gòu)建提供了具體而全面的指導(dǎo)(如下頁圖2所示)。
在對斗拱進(jìn)行知識劃分時,根據(jù)其所處的空間結(jié)構(gòu),將斗拱劃分為不重合的不同空間單元,每個空間內(nèi)的斗拱包含不同的類型和屬性。根據(jù)斗拱及其構(gòu)件的形制,我們將其劃分為斗、升、昂、翹、拱等類別。每類構(gòu)件根據(jù)自身特性進(jìn)一步細(xì)化為多個子類,而每個子類又依據(jù)不同的斗拱屬性生成獨特的構(gòu)件實例。不同的構(gòu)件通過不同的榫卯以特定方式進(jìn)行連接,銷子榫卯用于豎直方向有關(guān)系的構(gòu)件相疊(如昂和翹之間),刻半榫卯用于構(gòu)件之間十字插交的情況(如拱與翹),而剔(入)袖榫卯則用于構(gòu)件的相鄰連接(如栱與十八斗)。
同時,構(gòu)件的空間與結(jié)構(gòu)屬性直接影響其連接關(guān)系。各構(gòu)件實體通過特定的連接方式彼此關(guān)聯(lián),不同要素的屬性相互制約與作用,共同構(gòu)成完整的斗拱整體。這一知識體系為斗拱構(gòu)件實體知識圖譜構(gòu)建提供框架。
知識圖譜構(gòu)建。斗拱構(gòu)件知識圖譜構(gòu)建分為以下3個步驟(如下頁圖3所示)。
概念層構(gòu)建,知識圖譜的概念層主要是指圖譜主體框架的構(gòu)建,需要對圖譜的實體和關(guān)系進(jìn)行定義。斗拱構(gòu)件知識圖譜的構(gòu)建,首先分析斗拱空間結(jié)構(gòu)形式以及基元構(gòu)件和連接關(guān)系,以斗拱空間位置、斗拱形制、構(gòu)件實體進(jìn)行劃分。按照斗拱所處的空間位置劃分不同的空間。根據(jù)斗拱的類型劃分不同類型的斗拱(斗科、品字科等),每種類型包含不同的構(gòu)件。不同的構(gòu)件實體按照形狀特征及空間位置劃分為斗、升、昂、翹、拱等類別,進(jìn)一步劃分到特定的基元構(gòu)件(大斗、三才升等)。構(gòu)件實體間通過特定的連接關(guān)系形成完整的斗拱。圖譜模式層(如圖4所示)。
知識抽取。從《斗拱》《工程做法則例》《中國古建筑木作營造技術(shù)》等相關(guān)資料中獲取信息,采用屬性和關(guān)系描述模式層的結(jié)果。在實體描述方面,包括斗拱名稱、斗拱構(gòu)件名稱、斗拱種類等(如表1所示)。對于關(guān)系的描述主要涵蓋斗拱的空間關(guān)系、斗拱與構(gòu)件之間的關(guān)系、構(gòu)件之間的連接關(guān)系等。共有九類關(guān)系用來描述概念及它們之間的關(guān)聯(lián)(如圖5所示)。
知識加工,通過斗拱資料制定表示文本資源規(guī)則,為斗拱資料的內(nèi)容分析、編輯、加工等工作提供基準(zhǔn)。采用Neo4j軟件數(shù)據(jù)格式,對抽取的知識數(shù)據(jù)進(jìn)行詳細(xì)的分析、加工和轉(zhuǎn)換,包括XML、WORD、JPG、PDF、TXT等文本及圖片文件,實現(xiàn)對斗拱文本的結(jié)構(gòu)化分析處理。同時,將從資料中提取的實體、屬性和關(guān)系整理為結(jié)構(gòu)化數(shù)據(jù),為構(gòu)建斗拱知識圖譜提供必要的基礎(chǔ)支持。整理后的資料內(nèi)容(如表2所示),為后續(xù)的知識存儲提供了基礎(chǔ)保障。
知識存儲與可視化展示。文章采用Neo4j圖數(shù)據(jù)庫管理系統(tǒng)來儲存數(shù)據(jù)和可視化。Neo4j使用圖像來表示和儲存數(shù)據(jù),數(shù)據(jù)由節(jié)點(Nodes)和關(guān)系(Relationships)組成,這種模型非常適合表示斗拱這種構(gòu)件種類多和連接關(guān)系較為復(fù)雜的實體。通過圖源數(shù)據(jù)可以更直觀有效地對斗拱構(gòu)件知識進(jìn)行可視化展示和調(diào)用。在數(shù)據(jù)處理過程中,將加工整理后的知識數(shù)據(jù)進(jìn)一步加工為結(jié)構(gòu)化數(shù)據(jù)的CSV文件(如表3所示),并通過導(dǎo)入功能加載至Neo4j系統(tǒng)中。
將這些資料按照模型層結(jié)構(gòu)以及上文定義的規(guī)則進(jìn)行斗拱本體知識圖譜構(gòu)建,并將實體知識數(shù)據(jù)存儲到Neo4j圖數(shù)據(jù)庫中。褐色圓圈表示斗拱分類節(jié)點,粉色圓圈表示斗拱構(gòu)件實體節(jié)點,綠色圓圈表示斗拱位置實體節(jié)點,黃色圓圈代表斗拱形制實體節(jié)點,藍(lán)色圓圈代表斗拱構(gòu)件類別實體,橙色圓圈代表具體的類型斗拱實體。圓圈之間的連線代表各實體關(guān)系。該圖譜涵蓋明清斗拱中的13類主要類型斗拱與各部分之間的關(guān)系,形成了一個完整的明清斗拱知識庫。利用Neo4j圖數(shù)據(jù)庫中的Cypher語言完成對數(shù)據(jù)庫的增刪改查操作,實現(xiàn)對每一個斗拱的檢索、遍歷等功能。
文章詳細(xì)介紹了手動構(gòu)建斗拱構(gòu)件知識圖譜的方法,并介紹了斗拱構(gòu)件實體知識圖譜的構(gòu)建流程。針對斗拱這種復(fù)雜組合體的節(jié)點及關(guān)系繁多且難以梳理的情況,提出一種知識梳理框架,明確整理斗拱構(gòu)件的種類、位置、尺寸及其約束關(guān)系,并以此為基礎(chǔ)構(gòu)建知識圖譜。在梳理斗拱的知識之后,利用Neo4j圖數(shù)據(jù)庫存儲知識,用屬性圖模型表示知識。最后利用Neo4j圖數(shù)據(jù)庫可視化地展示斗拱構(gòu)件實體知識圖譜。文章構(gòu)建的知識圖譜為復(fù)雜組合體的知識整理與存儲提供了方法參考,同時也為斗拱的數(shù)字化保護(hù)和知識應(yīng)用提供了支持。
(作者單位:北京建筑大學(xué) 測繪與城市空間信息學(xué)院)