摘要:隨著我國非遺保護(hù)工作的開展,非遺數(shù)字資源與日俱增,資源的異構(gòu)問題亟待解決,需要一種針對非遺異構(gòu)資源的描述與組織方式以實(shí)現(xiàn)非遺主題下異構(gòu)資源的互操作及合理利用。文章通過確定非遺主題領(lǐng)域構(gòu)建非遺核心元數(shù)據(jù),從而實(shí)現(xiàn)非遺主題領(lǐng)域內(nèi)各信息資源統(tǒng)一有效的數(shù)據(jù)描述;定義核心元數(shù)據(jù)為核心元數(shù)據(jù)本體,在此基礎(chǔ)上根據(jù)各信息資源的專有屬性,定制化生成非遺專門元數(shù)據(jù)本體,從而實(shí)現(xiàn)各類型非遺資源較為精準(zhǔn)的數(shù)據(jù)描述和組織,實(shí)現(xiàn)非遺主題下各數(shù)據(jù)的語義互操作,借助Protg,最終實(shí)現(xiàn)基于語義網(wǎng)的非遺資源有效描述、組織和利用。
關(guān)鍵詞:非遺;資源描述與組織;元數(shù)據(jù)本體
中圖分類號:G250.76文獻(xiàn)標(biāo)志碼:A
0引言
非物質(zhì)文化遺產(chǎn)(以下簡稱“非遺”),是指各族人民世代相傳,并視為其文化遺產(chǎn)組成部分的各種傳統(tǒng)文化表現(xiàn)形式,是一個(gè)國家和民族歷史文化成就的重要標(biāo)志,是優(yōu)秀傳統(tǒng)文化的重要組成部分。我國作為擁有56個(gè)民族的歷史文化古國,非物質(zhì)文化遺產(chǎn)因其種類繁多,表現(xiàn)形式多樣而令人矚目。非物質(zhì)文化遺產(chǎn)因其活態(tài)傳承性被稱為“活態(tài)靈魂”,對人類文明進(jìn)步和發(fā)展有著不可或缺的作用,2021年我國頒布的《關(guān)于進(jìn)一步加強(qiáng)我國非物質(zhì)文化遺產(chǎn)保護(hù)工作的意見》要求貫徹“保護(hù)為主、搶救第一、合理利用、傳承發(fā)展”的工作方針,深入實(shí)施非物質(zhì)文化遺產(chǎn)傳承發(fā)展工程,切實(shí)提升非物質(zhì)文化遺產(chǎn)系統(tǒng)性保護(hù)水平,為全面建設(shè)社會(huì)主義現(xiàn)代化國家提供精神力量[1]。
圖書館作為社會(huì)記憶的儲(chǔ)存和傳遞機(jī)構(gòu),就搜集、保護(hù)以及傳承人類非物質(zhì)文化遺產(chǎn)而言責(zé)無旁貸。我國相關(guān)學(xué)者于2003年開始參與相關(guān)非遺保護(hù)的研究[2],隨著社會(huì)信息化的發(fā)展,全國非遺數(shù)字化保護(hù)(首批)試點(diǎn)工作總結(jié)會(huì)于2014年在北京召開,越來越多的學(xué)者提出我國非物質(zhì)文化遺產(chǎn)保護(hù)的研究應(yīng)側(cè)重于數(shù)字資源建設(shè)。許鑫等[3]調(diào)研和梳理了圖書館非遺數(shù)字資源建設(shè)的現(xiàn)狀,提出公共圖書館參與非遺保護(hù)應(yīng)優(yōu)化模式和方法,重視相關(guān)數(shù)字技術(shù)的借鑒、應(yīng)用與普及,除此以外還應(yīng)重視知識產(chǎn)權(quán)保護(hù)以及資源數(shù)據(jù)庫的建設(shè)。蔡璐等[4]將本體的組織功能與元數(shù)據(jù)的描述功能相結(jié)合,通過對非遺保護(hù)的五大基本要素進(jìn)行分析和整序,實(shí)現(xiàn)對非遺資源的有效揭示與組織。張勇等[5]在研究已有非遺元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,通過對標(biāo)準(zhǔn)的試著錄檢驗(yàn)及在全文檢索數(shù)據(jù)庫管理平臺(tái)上的模擬實(shí)現(xiàn),分析其在具體項(xiàng)目應(yīng)用中對接非遺資源、應(yīng)用平臺(tái)、用戶等模塊時(shí)可能出現(xiàn)的問題及注意事項(xiàng),為我國未來非遺元數(shù)據(jù)標(biāo)準(zhǔn)的制定、完善和推廣應(yīng)用提供指導(dǎo)。張文錫[6]基于數(shù)字人文視域構(gòu)建了圖書館非遺資源保護(hù)平臺(tái)并提出平臺(tái)實(shí)施策略。
上述研究工作對我國非物質(zhì)文化遺產(chǎn)的研究、傳承、保護(hù)以及非遺數(shù)字資源的描述、組織及整體性建設(shè)提供了設(shè)計(jì)方案,立足資源特征、特定民族、特定項(xiàng)目、特定載體來驗(yàn)證其可行性。然而,隨著信息技術(shù)的日新月異,我國非遺數(shù)字資源與日俱增,暫未形成統(tǒng)一的針對全部類別的非遺數(shù)據(jù)管理規(guī)則和體系,海量非遺數(shù)據(jù)異構(gòu)問題亟待解決。本文構(gòu)建一種適用于不同類型非遺資源的數(shù)據(jù)描述和組織模型,用以實(shí)現(xiàn)在語義網(wǎng)環(huán)境下非遺資源有效的描述、組織及互操作,促進(jìn)非遺數(shù)字資源建設(shè)進(jìn)程,最終推動(dòng)非遺保護(hù)和傳承工作的有效開展。
1基于語義網(wǎng)的非遺資源描述與組織模型構(gòu)建
1.1數(shù)據(jù)來源
國務(wù)院于2006—2021年公布了5個(gè)批次的國家級非遺項(xiàng)目名錄(前3批名錄名稱為“國家級非物質(zhì)文化遺產(chǎn)名錄”,《中華人民共和國非物質(zhì)文化遺產(chǎn)法》實(shí)施后,第4批名錄名稱改為“國家級非物質(zhì)文化遺產(chǎn)代表性項(xiàng)目名錄”),名錄中包含1557個(gè)國家級非物質(zhì)文化遺產(chǎn)代表性項(xiàng)目,3610個(gè)子項(xiàng)(以下統(tǒng)稱“非遺項(xiàng)目”)[7]。這些項(xiàng)目信息通過層層甄選后由國家相關(guān)部門進(jìn)行公示,極具代表性,本文擬采用上述信息作為來源數(shù)據(jù)。
1.2核心元數(shù)據(jù)構(gòu)建
中國非物質(zhì)文化遺產(chǎn)網(wǎng)上公布了上述國家級十大類非物質(zhì)文化遺產(chǎn)及其相關(guān)信息,但每個(gè)大類的資源特征并不一致,資源結(jié)構(gòu)迥異,要想實(shí)現(xiàn)上述資源的關(guān)聯(lián),就必須實(shí)現(xiàn)該資源集合的有效描述,即構(gòu)建非遺核心元數(shù)據(jù)。本文所構(gòu)建的核心元數(shù)據(jù)是非遺主題下異構(gòu)資源的最小數(shù)據(jù)單位。
經(jīng)過調(diào)研,目前國內(nèi)非遺領(lǐng)域還未出現(xiàn)統(tǒng)一的詞表及主題分類方法,根據(jù)上述研究,結(jié)合非遺資源活態(tài)化的特征,本文參考、復(fù)用WH/T 99—2023《非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù) 數(shù)字資源采集和著錄》[8]、DCMI Terms、FOAF、EVENT、TimeLine、GeoNames本體、SKOS語言等國內(nèi)外相關(guān)本體及數(shù)字資源著錄標(biāo)準(zhǔn),確定非遺核心元數(shù)據(jù)元素(見表1)及元數(shù)據(jù)語法(見圖1),并借助Protg獲取URI值,實(shí)現(xiàn)可視化。
綜上,該核心元數(shù)據(jù)可以實(shí)現(xiàn)對非遺主題領(lǐng)域內(nèi)各資源共有屬性的描述和組織。然而就我國目前公布的名錄中國家級非物質(zhì)文化遺產(chǎn)分為十大類,且每一大類又可以分為視頻、文本、口述等多種類型信息資源,每個(gè)類型資源的外部特征各有不同,加之元數(shù)據(jù)自身語義的不足,上述構(gòu)建完成的非遺核心元數(shù)據(jù)無法實(shí)現(xiàn)針對十大類非遺資源專有屬性的精確描述和組織,無法實(shí)現(xiàn)非遺主題資源之間、非遺主題資源和與之相關(guān)的資源之間的數(shù)據(jù)互操作。
2本體構(gòu)建
元數(shù)據(jù)實(shí)現(xiàn)了非遺主題資源平面化的數(shù)據(jù)描述,由于元數(shù)據(jù)語義定義的短缺及機(jī)器識別的不便,非遺主題下的資源描述和組織需要建立一種立體化的機(jī)制,在實(shí)現(xiàn)資源描述和組織的基礎(chǔ)上實(shí)現(xiàn)資源的推理及語義互操作。本體作為語義網(wǎng)技術(shù)的核心關(guān)鍵之一,對于資源的語義描述、推理、互操作及機(jī)器識別有著不可或缺的作用,因此,本文以本體構(gòu)建作為實(shí)現(xiàn)資源描述和組織的有效機(jī)制。
本文基于非遺主題領(lǐng)域構(gòu)建了非遺核心元數(shù)據(jù),根據(jù)元數(shù)據(jù)特殊的組織規(guī)范及存在形式,加之元數(shù)據(jù)也是一種本體,故而定義非遺核心元數(shù)據(jù)為非遺核心元數(shù)據(jù)本體,該元數(shù)據(jù)本體并不容納非遺資源中所有的元數(shù)據(jù)元素及語法,而僅僅是對各類型非遺元數(shù)據(jù)中核心或共享元素的形式化描述和組織,以及對非遺主題領(lǐng)域形式化的描述和組織。但是,非遺核心元數(shù)據(jù)元素的語義釋義有限,非遺資源眾多且各有其特殊性,這些特殊性是非遺核心元數(shù)據(jù)本體中所未容納的,比如,非遺視頻資源的“出版商”“導(dǎo)演”“主演”“視頻來源”等屬性。因此,綜合上述本體的特征以及本體構(gòu)建的可行性,在核心元數(shù)據(jù)本體的基礎(chǔ)上定制化生成針對非遺主題資源的專門元數(shù)據(jù)本體。
目前,國內(nèi)非遺分10個(gè)門類,上述構(gòu)建完成的非遺核心元數(shù)據(jù)本體可用于每一門類非遺資源的通用領(lǐng)域及共同屬性的描述和組織,但是每個(gè)門類的非遺資源外部特征并不一致。以民間文學(xué)為例,民間文學(xué)是一種來源于生活的口頭傳統(tǒng)藝術(shù),極具變異性,包括神話、史詩、書面文獻(xiàn)、唱本等,隨著時(shí)代的變遷,民間文學(xué)和多種媒介相互碰撞,又多出了類似數(shù)字媒介等新時(shí)代的民間文學(xué)載體,這樣一來其外部特征多種多樣,即該門類的信息資源有其特殊屬性。已構(gòu)建完成的非遺核心元數(shù)據(jù)本體并不能滿足針對特殊屬性的描述和組織。本文在已構(gòu)建非遺核心元數(shù)據(jù)本體框架基礎(chǔ)上,通過定義新的屬性或?yàn)楝F(xiàn)有屬性添加子屬性來擴(kuò)展性地定制出不同類型非遺資源的專門元數(shù)據(jù)本體框架,結(jié)合非遺核心元數(shù)據(jù)本體形成非遺元數(shù)據(jù)本體框架(見圖2),以此實(shí)現(xiàn)針對不同類型非遺資源的有效描述和組織,實(shí)現(xiàn)非遺主題下信息資源的語義互操作,最終實(shí)現(xiàn)非遺信息資源與相關(guān)其他數(shù)據(jù)的有效關(guān)聯(lián)。
根據(jù)非遺核心元數(shù)據(jù)本體框架,從Title定義非遺項(xiàng)目名稱,從Creator定義非遺項(xiàng)目的創(chuàng)造者、發(fā)起者、傳承人,并添加作者、導(dǎo)演、主演等屬性,從Subject定義非遺項(xiàng)目主要內(nèi)容,并添加項(xiàng)目發(fā)生地、輻射地、發(fā)生時(shí)間、事件主體等圍繞事件(Event)的屬性,從Time定義非遺項(xiàng)目申報(bào)時(shí)間,并添加非遺項(xiàng)目發(fā)生時(shí)間、持續(xù)時(shí)間等圍繞時(shí)間(TimeLine)的屬性,從Type定義非遺項(xiàng)目歸屬門類,并添加非遺項(xiàng)目資源所屬類型,從Group定義非遺項(xiàng)目申報(bào)單位、保護(hù)機(jī)構(gòu)、研究機(jī)構(gòu),并擴(kuò)展出Type擴(kuò)展項(xiàng)資源類型的主要責(zé)任機(jī)構(gòu)(比如視頻來源、文獻(xiàn)來源等),從Relation定義與非遺項(xiàng)目相關(guān)聯(lián)的視頻、音頻、文獻(xiàn)、圖片等信息。
因?yàn)樵獢?shù)據(jù)中各元數(shù)據(jù)元素之間的映射關(guān)系是固定的,根據(jù)本體的可擴(kuò)展性,借助Protg的推理功能,新定義以及添加的屬性之間的映射關(guān)系也隨之形成,不需要重新構(gòu)建。由于Protg是基于語義網(wǎng)的開源軟件,且該軟件主要使用OWL/RDF本體語言,因此,在專門元數(shù)據(jù)本體構(gòu)建完成后可以獲取各屬性對應(yīng)的URI,并且可以統(tǒng)一描述語言,這樣一來,可以實(shí)現(xiàn)非遺資源基于語義網(wǎng)的互操作。綜上,非遺資源描述與組織模型構(gòu)建完成。
3實(shí)例驗(yàn)證
為了讓本文更加直觀,筆者從民間文學(xué)中選取某一項(xiàng)目作為實(shí)例,根據(jù)上述研究,構(gòu)建專門元數(shù)據(jù)本體。經(jīng)過調(diào)研,選取項(xiàng)目白蛇傳傳說作為實(shí)例。白蛇傳傳說是我國家喻戶曉的經(jīng)典文學(xué)作品,與梁祝傳說、孟姜女傳說、牛郎織女傳說并列為漢族流傳較廣的四大傳說。隨著時(shí)代發(fā)展,白蛇傳傳說衍生出故事、歌謠、寶卷以及電影、電視、動(dòng)漫等多種信息資源類型,因此,白蛇傳傳說作為民間文學(xué)實(shí)例是較為典型的非遺異構(gòu)資源的代表。白蛇傳傳說這一項(xiàng)目中,較為完整又具代表性的資源有:明代馮夢龍整理加工過的話本《白娘子永鎮(zhèn)雷峰塔》;清代夢花館主所著小說《白蛇全傳》;由夏祖輝、何麒執(zhí)導(dǎo),趙雅芝、葉童、陳美琪等主演,1992年上映的電視劇《新白娘子傳奇》。
以非遺核心元數(shù)據(jù)本體框架為基礎(chǔ),結(jié)合《國家圖書館視頻資源元數(shù)據(jù)規(guī)范與著錄規(guī)則》,結(jié)合元數(shù)據(jù)的著錄特性及本體的可拓展性,借助Protg的推理功能,可以定制出基于語義網(wǎng)的白蛇傳專門元數(shù)據(jù)本體(見圖3),不難看出,定制出的非遺專門元數(shù)據(jù)本體可以有效描述和組織白蛇傳主題下的異構(gòu)資源。由于構(gòu)建核心元數(shù)據(jù)本體時(shí)參考、復(fù)用了FOAF、EVENT、TimeLine、GeoNames本體、SKOS語言等本體,因此,在專門元數(shù)據(jù)本體中,針對地名、人名、事件、時(shí)間以及知識組織等各類信息的資源描述、定義和擴(kuò)展多用上述本體或語言,又因?yàn)樯鲜霰倔w及語言所包含的屬性較為齊全,在語義網(wǎng)環(huán)境中,相關(guān)本體內(nèi)信息又可以實(shí)現(xiàn)與其他數(shù)據(jù)的有效組織和關(guān)聯(lián)。以地名為例,GeoNames地理數(shù)據(jù)庫中包括620萬個(gè)地名,每個(gè)地名除擁有唯一的URI外,還基于GeoNames本體進(jìn)行了語義化描述,并且已經(jīng)發(fā)布為關(guān)聯(lián)數(shù)據(jù),這樣一來,在非遺專門元數(shù)據(jù)本體中某一資源的地名、地理信息,在語義網(wǎng)環(huán)境中可以實(shí)現(xiàn)有效描述和管理,并且實(shí)現(xiàn)該數(shù)據(jù)與其他數(shù)據(jù)的有效關(guān)聯(lián)。
結(jié)合圖3可知,非遺元數(shù)據(jù)本體框架可以將某一非遺項(xiàng)目所涉和包含的不同類型資源進(jìn)行統(tǒng)一有效的描述和組織。首先,針對同一非遺項(xiàng)目,核心元數(shù)據(jù)本體可以對該項(xiàng)目進(jìn)行核心描述,明確該項(xiàng)目核心信息,并將通用屬性進(jìn)行初步管理;其次,針對不同資源類型,立足核心元數(shù)據(jù)本體定義新的特殊屬性,形成專門元數(shù)據(jù)本體,對該項(xiàng)目的不同類型資源進(jìn)行精確描述,并實(shí)現(xiàn)資源間有效組織和管理。如圖3所示,白蛇傳傳說這一非遺項(xiàng)目包括小說、電視劇、話本,根據(jù)上述研究,首先將國家級非遺項(xiàng)目名錄中該項(xiàng)目的信息輸入非遺核心元數(shù)據(jù)本體框架,該框架可以對非遺主題下各類型信息資源進(jìn)行總體性描述和管理,又因小說、電視劇、話本各有各的特殊屬性,根據(jù)非遺專門元數(shù)據(jù)本體框架,定制出白蛇傳傳說專門元數(shù)據(jù)本體,其中針對話本、小說、電視劇的描述和組織都較為符合相關(guān)資源著錄標(biāo)準(zhǔn)。從圖3中不難看出,不管是話本、小說還是電視劇,盡管主題內(nèi)容一致,但各自的描述項(xiàng)(專有屬性)都不盡相同,這樣的資源描述和組織方式也保證了各信息資源本身的獨(dú)特性,從而實(shí)現(xiàn)圍繞白蛇傳傳說的各類型信息資源的有效組織和聚合。
4結(jié)語
綜上所述,本文從非遺領(lǐng)域的內(nèi)部特征出發(fā),構(gòu)建適用于非遺主題下不同門類、不同外部特征的資源描述和組織模型:(1)本文構(gòu)建的模型可以實(shí)現(xiàn)非遺數(shù)據(jù)的有效描述。本文從搭建非遺主題領(lǐng)域模型出發(fā),明確非遺主題領(lǐng)域范圍,在此基礎(chǔ)上構(gòu)建非遺核心元數(shù)據(jù),實(shí)現(xiàn)非遺資源核心屬性描述,結(jié)合元數(shù)據(jù)的特殊性,確定非遺核心元數(shù)據(jù)本體,實(shí)現(xiàn)基于非遺主題領(lǐng)域的資源描述和組織。(2)本文構(gòu)建的模型可以實(shí)現(xiàn)非遺數(shù)據(jù)的有效組織。非遺核心元數(shù)據(jù)本體實(shí)現(xiàn)的是非遺主題資源中共享的、通用的資源屬性的描述和組織,在滿足非遺主題領(lǐng)域核心屬性描述和組織的基礎(chǔ)上要實(shí)現(xiàn)非遺特殊屬性的描述和組織,從而實(shí)現(xiàn)語義網(wǎng)環(huán)境下非遺異構(gòu)資源的互操作。(3)本文構(gòu)建的模型可以實(shí)現(xiàn)一定程度上的數(shù)據(jù)關(guān)聯(lián)。本文在構(gòu)建非遺核心元數(shù)據(jù)本體時(shí)考慮到了語義網(wǎng)環(huán)境下數(shù)據(jù)的關(guān)聯(lián)性問題,參考、復(fù)用了眾多國內(nèi)外著錄標(biāo)準(zhǔn)及本體,這些本體中多數(shù)有獨(dú)立的URI,形成并發(fā)布關(guān)聯(lián)數(shù)據(jù),運(yùn)用這些本體對非遺資源進(jìn)行描述的同時(shí)可以實(shí)現(xiàn)相關(guān)數(shù)據(jù)的有效關(guān)聯(lián)。
但是由于相關(guān)資源的限制,目前非遺數(shù)據(jù)的關(guān)聯(lián)程度還不夠高,未上升到關(guān)聯(lián)數(shù)據(jù)的層面。為了加快我國非遺數(shù)字資源管理的規(guī)范化及便捷化,促進(jìn)我國非物質(zhì)文化遺產(chǎn)的傳承和保護(hù),下一步筆者將在本文基礎(chǔ)上圍繞非遺關(guān)聯(lián)數(shù)據(jù)開展研究。
參考文獻(xiàn)
[1]中國非物質(zhì)文化遺產(chǎn)網(wǎng).關(guān)于進(jìn)一步加強(qiáng)非物質(zhì)文化遺產(chǎn)保護(hù)工作的意見[EB/OL].(2021-08-13)[2024-02-10].https://www.ihchina.cn/zhengce_details/23400.
[2]金曉妹,陳仰珊,鐘志蕓.圖書館如何積極參與非物質(zhì)文化遺產(chǎn)的保護(hù)[J].圖書館雜志,2003(2):55-56.
[3]許鑫,趙嘉倫.圖書館參與非物質(zhì)文化遺產(chǎn)保護(hù)的現(xiàn)狀與建議[J].圖書情報(bào)工作,2014(21):6-12.
[4]蔡璐,熊擁軍,劉燦姣.基于本體和元數(shù)據(jù)的非遺資源知識組織體系構(gòu)建[J].圖書館理論與實(shí)踐,2016(3):39-43.
[5]張勇,蔡璐,李月明.非物質(zhì)文化遺產(chǎn)數(shù)字資源元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)用的研究和思考[J].圖書館,2016(2):38-42.
[6]張文錫.數(shù)字人文視域下圖書館非遺資源保護(hù)平臺(tái)的構(gòu)建[J].江蘇科技信息,2021(15):47-49.
[7]中國非物質(zhì)文化遺產(chǎn)網(wǎng).國家級非物質(zhì)文化遺產(chǎn)代表性項(xiàng)目名錄[EB/OL].(2006-05-20)[2024-02-10].https://www.ihchina.cn/project#target1.
[8]佚名.WH/T 99—2023《非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù) 數(shù)字資源采集和著錄》[J].標(biāo)準(zhǔn)生活,2023(6):48-51.
(編輯編輯李春燕)
Research on the construction and visualization of intangible cultural heritage metadata ontology based on semantic web
ZHANG Qian
(Library, Changzhou University, Changzhou 213159, China)
Abstract: With the development of China’s intangible cultural heritage protection work, the digital resources of intangible cultural heritage are increasing day by day, and the problem of resource heterogeneity urgently needs to be solved. A description and organization method for heterogeneous resources of intangible cultural heritage is needed to achieve interoperability and rational utilization of heterogeneous resources under the theme of intangible cultural heritage. The article constructs core metadata for intangible cultural heritage by identifying the thematic areas of intangible cultural heritage, thereby achieving unified and effective data description of various information resources within the thematic areas of intangible cultural heritage. Define core metadata as the core metadata ontology, and based on the proprietary attributes of each information resource, customize the generation of specialized metadata ontology for intangible cultural heritage, thereby achieving more accurate data description and organization of various types of intangible cultural heritage resources, realizing semantic interoperability of data under intangible cultural heritage themes, and ultimately achieving effective description, organization, and utilization of intangible cultural heritage resources based on the semantic web with the help of Protg.
Key words: intangible cultural heritage; resource description and organization; metadata ontology