• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      水書習(xí)俗非物質(zhì)文化遺產(chǎn)知識元組織與可視化研究

      2023-10-07 12:14:46宋雪雁張祥青張偉民
      現(xiàn)代情報 2023年10期
      關(guān)鍵詞:甲子水族習(xí)俗

      宋雪雁 張祥青 張偉民

      (吉林大學(xué)商學(xué)與管理學(xué)院,吉林 長春 130012)

      水書習(xí)俗涉及水族文化信仰、各類民間知識等內(nèi)容,融合了天文、地理、歷史、文學(xué)、哲學(xué)、宗教、倫理道德等多學(xué)科、多元化的知識,具有重要的研究價值。2002年經(jīng)貴州省檔案館提名申報,水書入選《中國檔案文獻遺產(chǎn)名錄》。2006年,國務(wù)院批準(zhǔn)“水書習(xí)俗”為“首批國家非物質(zhì)文化遺產(chǎn)”,“水書習(xí)俗”主要是指水族社會中水書先生運用水書文獻為水族人民擇吉避兇(包括婚嫁、喪葬、起造、農(nóng)事、出行等)的民俗活動[1]?;趯λ畷?xí)俗相關(guān)研究梳理,發(fā)現(xiàn)水書習(xí)俗非物質(zhì)文化遺產(chǎn)內(nèi)容涉及水書文獻、水書先生、水族人民及其生活等內(nèi)容。國家重視水書習(xí)俗非物質(zhì)文化遺產(chǎn)資源的傳承與開發(fā),然而,由于水書先生面臨年齡較高、數(shù)量較少的狀態(tài),水書習(xí)俗非遺資源傳承與開發(fā)利用面臨困境與挑戰(zhàn)。為了傳承與開發(fā)水書習(xí)俗非遺資源,需要探索可行的知識化開發(fā)途徑,助力水書習(xí)俗非遺資源傳承與發(fā)展。

      1 文獻回顧

      通過對相關(guān)文獻的檢索與梳理,本研究擬從水書習(xí)俗、知識抽取、基于知識元的知識組織3個方面對現(xiàn)有研究展開分析。

      1.1 水書習(xí)俗相關(guān)研究

      1.1.1 水書概念與特征

      水書具有實用的操作性,廣泛運用于民間婚喪嫁娶、生產(chǎn)生活趨吉避兇等諸多方面,對水族社會影響深遠[2]。水書反映了水族宗教信仰、天文歷法、哲學(xué)思想、文字起源、文學(xué)藝術(shù)、布陣攻守諸多方面的內(nèi)容,是水族的百科全書,水族的“易經(jīng)”,既是解讀水族社會歷史文化的重要典籍,也是進行宗教學(xué)、歷史學(xué)、民族學(xué)、民俗學(xué)、語言文學(xué)等多學(xué)科研究的重要資料,水書是中華民族的寶貴文化遺產(chǎn),具有極高的文物價值、文獻價值、史料價值[3]?!八畷钡母拍钪饕?個方面:在表征上是指水族的古文字系統(tǒng)和書范體系;在內(nèi)涵上是指用水族古文字書寫、編著的水族民間信仰文化和傳統(tǒng)知識的成文典籍;在外延上指與其具體應(yīng)用相關(guān)聯(lián)的民俗事項以及保留在水書先生頭腦中無文字記述的口傳知識與經(jīng)驗[4]。從學(xué)者對水書的概念界定與特征描述中,可以發(fā)現(xiàn)水書在水族社會生活中占據(jù)重要的地位,是研究水族歷史、社會生活重要的載體,具有重要的歷史文化價值和文獻價值。

      1.1.2 水書習(xí)俗傳承

      現(xiàn)有學(xué)者關(guān)于水書習(xí)俗傳承研究涵蓋的內(nèi)容主要包括水書傳承人、水書傳承困境、水書傳承影響因素等方面。歐陽大霖[1]從水書先生群體狀態(tài)對水書習(xí)俗傳承危機進行了分析,指出水書先生是水書習(xí)俗傳承的橋梁,在水書傳承中發(fā)揮重要的作用,由于當(dāng)前水書先生群體存在數(shù)量偏少、年齡偏大、文化程度偏低等問題,使水書習(xí)俗的傳承面臨嚴(yán)峻的危機。戴建國等[5]指出,在水書傳承中,主要方式為水書先生口傳心授,絕大部分普通水族人不識水字和水書,水書先生主導(dǎo)著水書的傳承和發(fā)展,而有些水書先生有自身相對狹隘的利益取向,強化了水書神秘性,使得水書只能為少數(shù)人掌握和運用,因此阻礙了水書習(xí)俗的傳承。瞿智琳等[6]指出,水書的傳承方式、水書的學(xué)習(xí)過程等方面影響水書傳承和發(fā)展,其中,水書的傳承方式為家族傳承、擇徒傳承,這種傳承方式限制了水書學(xué)習(xí)群體,水書學(xué)習(xí)包括舉行拜師儀式、學(xué)習(xí)基礎(chǔ)知識等事項,過程漫長且艱辛。從以上學(xué)者對水書習(xí)俗傳承的研究可以發(fā)現(xiàn),水書先生在水書習(xí)俗傳承中起著主導(dǎo)作用,并且水書先生群體是年齡偏大以及數(shù)量較少的,只靠口耳相傳的方式限制了水書習(xí)俗的傳承。從學(xué)者的研究可以得出,應(yīng)探索以數(shù)字化的方式對水書習(xí)俗進行知識化開發(fā),以此助力水書習(xí)俗非遺資源的傳承。

      1.1.3 水書習(xí)俗資源的開發(fā)與利用

      在水書習(xí)俗資源的開發(fā)與利用方面,王觀玉等[7]認為,對水書習(xí)俗開發(fā)與利用的途徑包括對水書文獻進行研究與翻譯,并對其進行數(shù)字化處理、傳承水書習(xí)俗活動以及開發(fā)水書文化產(chǎn)品,與旅游文化產(chǎn)品相結(jié)合,開發(fā)的產(chǎn)品如“牛角水書”“馬尾繡水書”等。黃天嬌等[8]指出,需要在文化傳承視域下建設(shè)水書古籍檔案數(shù)據(jù)庫,分析當(dāng)下古籍檔案數(shù)據(jù)庫存在水書古籍檔案資源分布零散、數(shù)據(jù)庫建設(shè)標(biāo)準(zhǔn)缺少規(guī)范化、古籍?dāng)?shù)字化缺乏專業(yè)人才等問題,從整合資源、規(guī)范格式、培養(yǎng)人才等方面對建設(shè)數(shù)據(jù)庫提出了建議。水書習(xí)俗資源的開發(fā)和利用目前主要集中于水書數(shù)字化處理、建立數(shù)據(jù)庫等方面的探討,鮮少涉及對水書習(xí)俗資源內(nèi)容的深層次開發(fā)。

      1.2 深度學(xué)習(xí)與知識抽取相關(guān)研究

      深度學(xué)習(xí)技術(shù)可以實現(xiàn)細粒度的知識元抽取[9]。本研究通過梳理相關(guān)文獻,發(fā)現(xiàn)國內(nèi)外學(xué)者運用深度學(xué)習(xí)技術(shù)對知識進行抽取的研究領(lǐng)域涉及軍事領(lǐng)域、醫(yī)療領(lǐng)域、非遺領(lǐng)域以及重大突發(fā)事件領(lǐng)域等,涉及的層次深入到文本的細粒度知識元抽取。Liao F等[10]提出了基于BiLSTM-CRF的軍用命名實體識別方法,應(yīng)用Attention結(jié)合BiLSTM的模型識別實體之間的語義關(guān)系,構(gòu)建了層次清晰、結(jié)構(gòu)靈活、可視化程度高的軍事知識體系。李培林[11]將BiLSTM-CRF模型運用到電子病歷命名實體中,將Attention組合BiLSTM-CRF的模型運用到電子病歷醫(yī)療關(guān)系抽取中,實現(xiàn)了患者診斷與癥狀、用藥情況及治療方式之間潛在聯(lián)系與隱性知識的挖掘。曾剛等[12]利用深度學(xué)習(xí)技術(shù)對萬里茶道數(shù)字資源進行知識元抽取與知識元關(guān)系的分類研究,實現(xiàn)了對細粒度、多維關(guān)聯(lián)知識的揭示與展示。江川等[13]基于BERT模型對突發(fā)公共衛(wèi)生重大事件傳染病事件實體知識自動抽取進行了研究,對相關(guān)部門及時、可靠、有效地做決策具有借鑒意義。基于既有研究可以發(fā)現(xiàn),深度學(xué)習(xí)技術(shù)可以實現(xiàn)知識的有效抽取,能實現(xiàn)細粒度的知識元抽取,適用的研究領(lǐng)域?qū)挿骸?/p>

      1.3 基于知識元的知識組織相關(guān)研究

      1.3.1 知識元概念與特征

      基于對知識元相關(guān)文獻的梳理,發(fā)現(xiàn)目前對知識元概念的界定有兩種含義。張靜等[14]指出,知識元是獨立的、表征知識的不可再分割的一個元素,可以是一個公式、一個圖片、一個章節(jié)、一個概念、一段程序等。溫有奎等[15]指出,知識元結(jié)構(gòu)化特征可以表示為(SPO)三元組形式。本研究在梳理既有研究基礎(chǔ)上,認為知識元是描述知識的最小單位,其可以用三元組形式結(jié)構(gòu)化表示。比如,《泐金·紀(jì)日卷》這本書是文獻知識元,〈《泐金·紀(jì)日卷》,是,水書文獻〉是三元組結(jié)構(gòu)化描述形式下的文獻知識元。在知識元特征的研究方面,孫成江等[16]認為,知識元具有獨立性、唯一性、完整性、拓撲性、鏈接性、可組合性、可認知性、可導(dǎo)航性等諸多特點,文庭孝等[17]認為,可以對知識元進行自由切分與存取、自由組織與檢索,進而實現(xiàn)對知識本身的自由組合與創(chuàng)造。

      1.3.2 知識元描述

      畢崇武等[18]借鑒元數(shù)據(jù)對信息資源的描述方法,提出知識元實體對象結(jié)構(gòu)的描述框架,該框架從知識標(biāo)識、知識描述、知識關(guān)系3個層面構(gòu)建知識元的實體對象結(jié)構(gòu),標(biāo)識組揭示知識元的內(nèi)在知識內(nèi)容、知識特征和屬性;關(guān)系組揭示知識元與其他知識元間的關(guān)聯(lián)關(guān)系,以及知識元與實體資源間的關(guān)系,將知識元劃分為方法型、概念型、事實型和數(shù)值型。索傳軍等[19]認為,平面顯性N(通常N≥2,N為正整數(shù))元組是知識的主要表達方式,知識元的描述元素逐漸增加,描述模型日趨完備和全面。在知識元三元組描述模型中,高國偉等[20]描述為〈概念,關(guān)系,問題〉。在知識元四元組描述模型中,溫有奎等[21]描述為〈名稱,屬性,操作,導(dǎo)航〉,姜永常[22]描述為〈名稱,屬性,操作,鏈接〉。在知識元五元組描述模型中,劉淼等[23]描述為〈編號,名稱,來源,類型,特征詞內(nèi)容〉。在知識元六元組描述模型中,姜永常[24]描述為〈對象名稱,對象起因,對象內(nèi)容,對象過程,對象結(jié)論,對象引文〉。

      1.3.3 基于知識元的圖像資源和非物質(zhì)文化遺產(chǎn)資源知識組織

      在基于知識元的圖像資源和文化遺產(chǎn)資源知識組織方面,趙雪芹等[25]構(gòu)建了一種數(shù)字人文圖像知識元本體模型,運用Protégé實現(xiàn)了圖像知識元本體的可視化構(gòu)建,并以萬里茶道圖像資源為例進行了數(shù)字人文圖像語義關(guān)聯(lián)展示,促進了數(shù)字人文圖像資源的知識組織、語義關(guān)聯(lián)及知識服務(wù)。曾剛等[12]構(gòu)建了知識元語義描述模型,在此模型基礎(chǔ)上,利用深度學(xué)習(xí)技術(shù)進行了萬里茶道知識抽取與知識組織,實現(xiàn)了萬里茶道歷史人文資源的細粒度、多維關(guān)聯(lián)知識的揭示與展示,促進了萬里茶道數(shù)字資源的高效率開發(fā)與利用。董坤[26]構(gòu)建了非遺知識元描述模型,基于該模型對非遺多元知識及其知識之間語義關(guān)系進行了抽取,實現(xiàn)了非遺知識的細粒度、多維關(guān)聯(lián)組織與聚合。

      基于對既有研究的梳理可以發(fā)現(xiàn),水書習(xí)俗非遺資源是研究水族人民生活的重要資料。水書習(xí)俗傳承方式主要靠水書先生擇徒傳承,水書先生年齡普遍偏高并且數(shù)量較少,這造成了水書傳承的困境以及水書習(xí)俗難以高效開發(fā)和利用的問題。從細粒度知識元層面開發(fā)水書習(xí)俗非遺資源,將有助于其傳承與開發(fā)、利用。深度學(xué)習(xí)技術(shù)可以實現(xiàn)命名實體識別和關(guān)系抽取,可以從最小粒度知識元層面挖掘水書習(xí)俗內(nèi)容以及建立知識元之間的關(guān)聯(lián),因此本研究擬利用深度學(xué)習(xí)技術(shù)抽取水書習(xí)俗非遺資源知識元,建立知識元之間的關(guān)聯(lián)來實現(xiàn)水書習(xí)俗非遺資源的深層次開發(fā)與利用。

      2 水書習(xí)俗非遺資源知識元描述模型構(gòu)建

      2.1 水書習(xí)俗非遺資源知識元語義模型

      水書習(xí)俗非遺資源知識元既需要考慮知識元內(nèi)部結(jié)構(gòu)化知識的揭示和描述,也需要考慮知識元間多元關(guān)聯(lián)關(guān)系,充分挖掘水書習(xí)俗資源知識元的內(nèi)部屬性關(guān)系與外部多元關(guān)聯(lián)關(guān)系。文本借鑒董坤[26]的研究,將水書習(xí)俗非遺知識元語義模型定義為:KE=,其中,KE為水書習(xí)俗非遺知識元,C表示水書習(xí)俗知識元所對應(yīng)的具有唯一性的編碼信息,主要是水書習(xí)俗的領(lǐng)域術(shù)語。K表示知識項,知識項是知識元的主體信息,是知識元知識內(nèi)容的具體描述,依據(jù)其不同的表現(xiàn)形式將其劃分為短語型知識項W與句子型知識項S。P表示知識元屬性,R表示關(guān)系,主要描述知識元與知識元之間語義關(guān)聯(lián)信息。

      基于以上模型對水書習(xí)俗非遺資源機構(gòu)/組織知識元“貴州省水家學(xué)會”這一實例進行解析,如表1所示。

      表1 機構(gòu)/組織知識元語義描述模型實例

      2.2 水書習(xí)俗非遺資源知識元類型及關(guān)系

      本研究借鑒了曾剛等[12]、董坤[26]關(guān)于非遺領(lǐng)域知識元抽取的相關(guān)研究,以及本體概念模型“人”“事”“地”“時”“物”基本要素,結(jié)合對水書習(xí)俗非遺資源的分析,將水書習(xí)俗非遺資源的知識元定義為人物知識元、文獻知識元、時間知識元、空間知識元、機構(gòu)/組織知識元、實物知識元、事件/活動/行為知識元、歷法知識元、項目知識元9種不同的類型。

      人物知識元:包括解讀與翻譯水書的水書先生,出版、編著相關(guān)水書文獻的作者等;

      文獻知識元:包括水書非遺資源相關(guān)內(nèi)容呈現(xiàn)的各類文獻形式;

      時間知識元:包括水書相關(guān)出版時間,水書文化起源時間,以及水族一些事件活動的發(fā)生時間等;

      空間知識元:包括水書保存的地點位置,水書習(xí)俗起源的地點,水族人民聚集的地點等;

      機構(gòu)/組織知識元:包括水書資源保管機構(gòu),水家協(xié)會,以及大力支持與保護水書習(xí)俗非遺資源發(fā)展的相關(guān)機構(gòu)/組織等;

      實物知識元:包括水族民俗事項、活動等用到的器具等;

      事件/活動/行為知識元:包括水族人民生活中發(fā)生的各種民俗事件/活動/行為等;

      歷法知識元:包括水書記載的天干、地支、二十八星宿、六十元甲子等相關(guān)的歷法知識等;

      項目知識元:包括與水書習(xí)俗非遺資源相關(guān)的項目,例如,非遺項目水族端節(jié)、水書馬尾繡等。

      上述9種水書習(xí)俗非遺資源知識元之間存在語義關(guān)系,比如,人物知識元與文獻知識元存在翻譯、出版等關(guān)系,人物知識元與歷法知識元存在依據(jù)、解讀等語義關(guān)系,文獻知識元與時間知識元存在出版時間等語義關(guān)系……,根據(jù)知識元類型與其語義關(guān)系組織水書習(xí)俗資源知識元語義網(wǎng)絡(luò),可以構(gòu)建較為系統(tǒng)的水書習(xí)俗知識組織體系,實現(xiàn)水書習(xí)俗知識元多維關(guān)系的關(guān)聯(lián)與展示。依據(jù)上述分析,本研究繪制了水書習(xí)俗非遺資源知識元類型與關(guān)系示例圖,如圖1所示。

      圖1 水書習(xí)俗非遺資源知識元類型與關(guān)系示例

      根據(jù)圖1可以得到,水書文獻《水書·九星卷》《泐金·紀(jì)日卷》包含了十大天干(甲、已、丙、丁等),十二地支(子、丑、寅、卯等)以及28星宿(東方青龍七宿:角木蛟等,北方玄武七宿:斗木獬等,西方白虎七宿:奎木狼等,南方朱雀七宿:井木犴等)等歷法知識。水書先生根據(jù)水書記載以及自身頭腦中存儲的歷法知識推算水族端節(jié)舉行的日期,端節(jié)是水族盛大的節(jié)日,其舉行日期為農(nóng)歷8月的第一個“亥”日開始至10月的亥日結(jié)束,歷時49天,在端節(jié)這一天需要舉行祭祀活動,祭祀時需要用到鼓,鼓面的圖案需要依據(jù)水書歷法繪制?!躲罱稹ぜo(jì)日卷》2007年出版,由貴州省檔案局、荔波縣人民政府編制,并且存放于荔波縣檔案館,荔波縣檔案館的地址位于貴州省黔南州荔波縣?!端畷ぞ判蔷怼?015年8月出版,責(zé)任者為貴州省民族古籍整理辦公室。

      基于知識元類型與其語義關(guān)系可以構(gòu)建水書習(xí)俗非遺資源知識元語義網(wǎng)絡(luò),實現(xiàn)了細粒度知識元層面的水書習(xí)俗資源知識組織,形成序化的水書習(xí)俗知識結(jié)構(gòu)網(wǎng)絡(luò),推動水書習(xí)俗非遺資源的開發(fā)和傳承,促進其理解與利用。

      3 基于實體識別與關(guān)系抽取的水書非遺資源知識元組織

      3.1 基于實體識別與關(guān)系抽取的水書習(xí)俗非遺資源知識元組織框架

      本研究基于實體識別與關(guān)系抽取對水書習(xí)俗知識元組織進行研究,運用深度學(xué)習(xí)技術(shù)進行水書習(xí)俗文本資源語料實體識別與關(guān)系抽取。實體識別是對水書習(xí)俗資源知識元術(shù)語的抽取,實體關(guān)系抽取是對知識元術(shù)語之間語義關(guān)聯(lián)的抽取。核心思想在于從最細粒度的知識元著手,挖掘知識元知識項及知識元之間具體的語義關(guān)聯(lián)關(guān)系,最后鏈接知識元形成水書習(xí)俗非遺資源知識網(wǎng)絡(luò)與組織體系。該方法主要包括構(gòu)建水書習(xí)俗資源的文本語料庫、實體識別、實體與實體關(guān)系抽取、實體屬性抽取、知識元關(guān)聯(lián)和知識元表征。本研究構(gòu)建的水書習(xí)俗非遺資源知識元組織框架如圖2所示。

      圖2 基于實體識別與關(guān)系抽取的水書習(xí)俗非遺資源知識元組織框架

      3.2 基于實體識別與關(guān)系抽取的水書習(xí)俗非遺資源知識元抽取實驗

      本研究將獲取的水書習(xí)俗非遺資源劃分為水書文獻、水書先生口述檔案、報紙、會議文獻、期刊文獻、網(wǎng)頁文獻等類型,采用基于規(guī)則的知識元屬性抽取方法[27]進行水書習(xí)俗非遺資源的知識元抽取。

      3.2.1 水書習(xí)俗非遺資源數(shù)據(jù)處理

      本文運用正則表達將水書習(xí)俗非遺資源各類型文獻由篇章級整理為句子級,每個類型下選取代表性的文本,對包含人物、文獻、時間、機構(gòu)/組織、空間、事件/活動/行為、項目、實物、歷法知識元的句子進行實體以及實體關(guān)系標(biāo)注。因為相同的文字可能根據(jù)語境的不同代表不同的含義,比如“水書”在不同語境下代表“項目”“文獻”不同實體含義,“水族馬尾繡”在不同語境下可能代表“項目”“實物”不同實體含義,而領(lǐng)域字典對其的方式可能會出現(xiàn)語義表達的錯誤,并且水書習(xí)俗非遺領(lǐng)域目前沒有比較全面與權(quán)威的可供直接使用的字典,因此運用領(lǐng)域字典的方式實現(xiàn)實體的自動對齊與標(biāo)注的方式不太適用于本研究,所以本研究運用人工標(biāo)注對領(lǐng)域文檔進行標(biāo)注,選擇水書習(xí)俗非遺資源中涵蓋實體與實體關(guān)系較為全面的代表性文檔進行標(biāo)注,以期獲得較為全面、科學(xué)的人工標(biāo)注數(shù)據(jù)集來進行模型的訓(xùn)練與預(yù)測。由于領(lǐng)域文檔集數(shù)量較大,并且并非所有文本數(shù)據(jù)都涉及人物、時間、空間、機構(gòu)/組織、事件/活動/行為等知識元,這會影響文本實體識別與關(guān)系抽取預(yù)測的結(jié)果。因此,本研究分別對各類型文獻中含有人物、時間、空間等知識元的關(guān)鍵句進行部分標(biāo)注,并利用文本分類方法Bert Textcnn訓(xùn)練了一個魯棒性良好的關(guān)鍵句抽取模型,依次對每篇文檔進行關(guān)鍵句和非關(guān)鍵句的預(yù)測與識別,最終將預(yù)測與識別出的關(guān)鍵句一一放入預(yù)先訓(xùn)練好的實體識別和關(guān)系抽取的模型,可以實現(xiàn)對水書習(xí)俗非遺資源的實體識別和關(guān)系抽取。

      3.2.2 水書習(xí)俗非遺資源知識元抽取實驗

      1)數(shù)據(jù)標(biāo)注。本研究數(shù)據(jù)標(biāo)注采用人工標(biāo)注方式,標(biāo)注的實體與實體關(guān)系示例如圖3所示。

      圖3 實體與實體關(guān)系標(biāo)注示例

      2)實體識別模型訓(xùn)練。本研究應(yīng)用Bert-Bilstm-Crf方法進行水書習(xí)俗非遺資源的實體識別,將標(biāo)注的數(shù)據(jù)80%用于訓(xùn)練,剩余20%進行預(yù)測,獲得的實體預(yù)測模型結(jié)果如表2所示,從表2中可以看出,人物、文獻、時間、空間等實體識別的區(qū)間準(zhǔn)確率達到81.63%,區(qū)間召回率達到83.07%,區(qū)間F1值達到82.24%,經(jīng)過實驗反復(fù)訓(xùn)練,獲得了一個魯棒性良好的實體預(yù)測模型,可以實現(xiàn)對水書習(xí)俗非遺資源語料的實體識別預(yù)測。

      表2 水書習(xí)俗非遺資源領(lǐng)域?qū)嶓w識別預(yù)測模型參數(shù)結(jié)果 %

      3)關(guān)系抽取模型訓(xùn)練。本研究應(yīng)用Bert-Att-Bilstm模型對水書習(xí)俗非遺資源領(lǐng)域已標(biāo)注數(shù)據(jù)進行實體關(guān)系的訓(xùn)練與預(yù)測,將隨機抽取80%的數(shù)據(jù)集進行訓(xùn)練,20%數(shù)據(jù)進行測試,測試的數(shù)據(jù)集是從未參加過訓(xùn)練的數(shù)據(jù),提升測試模型的泛化能力,獲得的關(guān)系抽取預(yù)測結(jié)果如表3所示,將實體與實體的關(guān)系設(shè)定為祭祀對象/紀(jì)念對象、推算、聚居于/生活于/起源于、學(xué)習(xí)/翻譯/解讀/應(yīng)用等14種類型,每種關(guān)系對應(yīng)的主題類別、客體類別、準(zhǔn)確率、召回率、F1值如表3所示,由數(shù)據(jù)結(jié)果可以得出,本研究訓(xùn)練的預(yù)測模型可以較好地實現(xiàn)水書習(xí)俗非遺資源人物、時間、空間、文獻等實體之間關(guān)系抽取。

      表3 水書習(xí)俗非遺資源領(lǐng)域?qū)嶓w關(guān)系識別預(yù)測模型參數(shù)結(jié)果 %

      4)模型預(yù)測結(jié)果。對領(lǐng)域集文檔選擇具有代表性的文檔人工標(biāo)注特征句,以含有人物、文獻、時間、空間、機構(gòu)/組織、實物、歷法實體特征詞來標(biāo)注特征句,運用Bert Textcnn方法對人工標(biāo)注的文檔集進行特征句與非特征句分類的訓(xùn)練與預(yù)測,預(yù)測模型特征句識別的效果準(zhǔn)確率達到了93%,模型魯棒性較優(yōu)。將剩余文檔集每篇文檔一一放入訓(xùn)練好的模型中,共抽取出8 321條數(shù)據(jù)。將識別出的知識元特征句放入預(yù)先訓(xùn)練好的實體識別和關(guān)系抽取模型中,經(jīng)過人工檢查與校對,共整理出水書習(xí)俗非遺資源人物(水書先生、陸鐸公等)、行為/事件/活動(拜師儀式、祭拜陸鐸公、占卜算命等)、文獻(《二十八卷》《營造卷》等)、空間(貴州省荔波縣等)、機構(gòu)/組織(荔波縣檔案史志館等)、歷法(一元甲子、七元甲子、水歷、天干地支等)、時間(殷商時期、秦漢時期等)、實物(鼓、鑼、馬尾繡等)、項目(水書、水書習(xí)俗、水族馬尾繡、水族卯節(jié)等)456個核心實體。

      3.3 基于知識元鏈接的水書習(xí)俗非遺資源知識元組織網(wǎng)絡(luò)

      水書習(xí)俗非遺資源的知識組織包括內(nèi)部知識單元聚合與外部知識單元聚合,在上述知識元抽取基礎(chǔ)上,可以基于知識元鏈接構(gòu)建水書習(xí)俗非遺資源知識元語義組織網(wǎng)絡(luò),本研究以水書習(xí)俗非遺資源相關(guān)文獻知識元、機構(gòu)知識元、歷法知識元為例,構(gòu)建的知識元語義組織網(wǎng)絡(luò)如圖4所示。

      圖4 基于知識元鏈接的水書習(xí)俗非遺資源知識元組織網(wǎng)絡(luò)

      從圖4可以看出,《泐金·紀(jì)日卷》《水書常用字典》是文獻知識元,十天干是歷法知識元,荔波縣檔案史志館是機構(gòu)知識元。知識元的內(nèi)部聚合指的是知識元術(shù)語與知識項的關(guān)聯(lián),知識項是知識元自身屬性也就是實體屬性,例如在《泐金·紀(jì)日卷》中,其自身屬性是貴州人民出版社出版,2007年10月出版,內(nèi)容包括七元甲子,貴州省檔案局(館)、荔波縣人民政府編著等。知識元的外部聚合指的是知識元與知識元的關(guān)聯(lián),如圖所示,《泐金·紀(jì)日卷》《水書常用字典》之間是關(guān)聯(lián)關(guān)系,其都包含十天干歷法知識元,并且《泐金·紀(jì)日卷》保管的機構(gòu)是荔波縣檔案館。

      依據(jù)知識元之間邏輯依存關(guān)系可以構(gòu)建水書習(xí)俗非遺資源知識鏈,知識鏈的邏輯組合形成了水書習(xí)俗非遺資源知識元語義網(wǎng)絡(luò),從而實現(xiàn)由水書習(xí)俗非遺資源知識元到知識網(wǎng)絡(luò)的有效遞進?;谥R元聚合組織水書習(xí)俗非遺資源實現(xiàn)了復(fù)雜語義的表達,助力了水書非遺資源的知識化開發(fā)與利用。

      4 基于知識元鏈接的水書習(xí)俗非遺資源知識元重組與可視化

      知識元具有自由組合的特點,即知識元通過自由的鏈接實現(xiàn)知識的重組,帶來知識的創(chuàng)造與增值,本部分研究以抽取的《泐金·紀(jì)日卷》歷法知識元為例,對知識元重組與可視化進行探究。

      4.1 同一甲子關(guān)系鏈接的知識元重組與可視化

      圖5 第一元甲子立法知識元

      4.2 同一活動關(guān)系鏈接的歷法知識元重組與可視化

      圖6 宜出行活動歷法知識元(第一元甲子)

      4.3 兩類活動關(guān)系鏈接的歷法知識元重組與可視化

      對于水族人而言,可能在同一天會進行兩種或者兩種以上的活動/行為,比如以修造魚塘和修糧倉為例,忌諱進行這兩種活動的宿日有甲子虛日鼠、庚申虛日鼠、壬子虛日鼠、戊申虛日鼠、丙子虛日鼠、庚子虛日鼠、丙申虛日鼠等,這些宿日分別屬于《泐金·紀(jì)日卷》的第一元甲子、第二元甲子、第三元甲子、第四元甲子、第五元甲子、第六元甲子,如圖7所示。

      圖7 忌修造魚塘糧倉歷法知識元

      通過對歷法知識元重組,可以發(fā)現(xiàn)不同鏈接關(guān)系重組知識元,會得到不同的結(jié)果,例如,依據(jù)《泐金·紀(jì)日卷》七元甲子組織,依據(jù)活動分類組織。

      依據(jù)活動分類去重組宿日知識元時,可能會得到交叉重復(fù)的結(jié)果,宿日既適宜出行,也適宜嫁娶,有可能宿日適宜出行,忌諱做其他的活動。除此之外,根據(jù)宿日的屬性(吉/兇/吉兇)組織宿日知識元,也會得到不同的結(jié)果,依據(jù)《泐金·紀(jì)日卷》,屬性吉的宿日共75個,屬性兇的宿日共62個,屬性有吉有兇的共283個,而以上屬性吉、屬性兇以及屬性吉兇的宿日分布在不同的甲子中,比如在一元甲子中,屬性吉的宿日有12個,屬性兇的宿日有9個,屬性有吉有兇的宿日39個;在二元甲子中,屬性吉的宿日有9個,屬性兇的宿日有11個,屬性有吉有兇的宿日有40個;在七元甲子中,屬性吉的宿日有10個,屬性兇的宿日有7個,屬性有吉有兇的宿日有43個。因此,一元甲子至七元甲子下的屬性吉的宿日可以重組為一個單元,一元甲子至七元甲子下的屬性兇的宿日可以重組為一個單元,一元甲子至七元甲子下屬性有吉有兇的宿日可以重組為一個單元。

      5 水書習(xí)俗非遺資源知識元庫構(gòu)建示例

      知識元庫構(gòu)建是面向知識構(gòu)建的[28],知識元庫可以存儲抽取的水書習(xí)俗非遺資源知識元及其語義關(guān)聯(lián),形成知識內(nèi)容之間的內(nèi)在協(xié)同關(guān)聯(lián)[29],可以實現(xiàn)水書習(xí)俗非遺資源知識元的長久存儲、有效管理,為利用者提供高質(zhì)量的知識檢索服務(wù),促進水書習(xí)俗非遺資源的深度利用。基于以上研究,本文構(gòu)建水書習(xí)俗非遺資源知識元庫示例,如圖8所示。

      圖8 水書習(xí)俗非遺資源知識元庫示例

      根據(jù)圖8可知,在關(guān)聯(lián)事件/活動/行為知識元下,祭祀神族、婚喪等是水族人民依靠水書的指導(dǎo)進行的各類民俗活動,水族水書先生依據(jù)水書利用竹子、石頭等實物進行卜卦,以此推算各類活動吉兇時間,拜師儀式是一些水族人向水書先生拜師學(xué)習(xí)水書的儀式。在關(guān)聯(lián)項目知識元下,水書是中國檔案文獻遺產(chǎn),水族端節(jié)、水族馬尾繡是國家級非物質(zhì)文化遺產(chǎn),水族卯節(jié)是省級非物質(zhì)文化遺產(chǎn)。在關(guān)聯(lián)人物知識元下,陸鐸公是水族水書的創(chuàng)始人,潘老平、歐金海是水書習(xí)俗非遺項目的相關(guān)傳承人,潘朝霖、蒙耀遠是現(xiàn)代研究水書的知名學(xué)者。在關(guān)聯(lián)實物知識元之下,豪灘酒、九阡酒等是水族當(dāng)?shù)丶漓?、招待客人的必備食物,鼓、嗩吶是水族人民在?jié)日里慶祝、祭祀等活動中用到的重要器具,牛角、錢幣等是水書重要的載體。在關(guān)聯(lián)的文獻知識元下,《百越留源史》是關(guān)于水族人民起源的文獻,《水書常用字典》收錄了水族常用的水字,《喪葬卷》《超度卷》《祭祖卷》是關(guān)于對已逝水族人的出喪以及對祭奠祖先活動的相關(guān)文獻,《營造卷》《金堂卷》主要關(guān)于水族入新房選擇吉時的文獻,《婚嫁卷》是關(guān)于水族婚姻嫁娶活動指導(dǎo)的文獻,其他《日歷卷》《七元宿卷》等是關(guān)于水族歷法的相關(guān)文獻。在關(guān)聯(lián)的空間知識元下,貴州省三都縣、荔波縣、獨山縣是水族人民聚居的地區(qū),貴州省黔南布依族苗族自治州是水書習(xí)俗申報的地區(qū)。在關(guān)聯(lián)的機構(gòu)/組織知識元下,國家檔案局、中央檔案館首批“水書文獻”為“中國檔案文獻遺產(chǎn)名錄”,荔波縣檔案史志館保管了很多珍貴的水書文獻,貴州省水家學(xué)會是以水族及水族地區(qū)為研究對象的學(xué)術(shù)機構(gòu)。關(guān)聯(lián)時間知識元下,傳說水族是殷商之后逐步繁衍而形成的單一民族[30],唐宋時期,水族散居于龍江流域黔桂兩省區(qū)毗鄰地帶,農(nóng)歷十月初至十一月中旬是水族舉行端節(jié)的時間,農(nóng)歷五月六月的卯日是水族人民舉行卯節(jié)的時間。在關(guān)聯(lián)的歷法知識元下,十天干、十二地支、二十八星宿之間的不同組合形成水書歷法的七元甲子,九宮八卦是古代中國天文學(xué)家將天宮以井字劃分乾宮、坎宮、兌宮等9個部分。

      水書習(xí)俗非遺資源知識元庫可以展示分類后的具體知識元實例,便于發(fā)現(xiàn)知識元之間的邏輯關(guān)聯(lián),在知識元主題領(lǐng)域劃分清晰的前提下,利用者可以高效獲取和利用水書習(xí)俗相關(guān)知識,并發(fā)現(xiàn)新的知識。構(gòu)建知識元庫可以實現(xiàn)水書習(xí)俗非遺資源的結(jié)構(gòu)化、有序化和語義關(guān)聯(lián),為利用者提供更為有效的知識服務(wù),促進水書非遺資源的知識化傳承與利用。

      6 結(jié) 語

      本文基于實體識別與關(guān)系抽取對水書習(xí)俗非遺資源知識元組織進行了研究,在知識元及其關(guān)系抽取的基礎(chǔ)上,進行了知識元重組與可視化,并構(gòu)建了水書習(xí)俗非遺資源知識元庫示例。未來將繼續(xù)豐富水書習(xí)俗非遺相關(guān)資源知識組織網(wǎng)絡(luò),并建立水書習(xí)俗非遺資源知識元庫以不斷深化研究,助力水書習(xí)俗非遺資源數(shù)字化、知識化開發(fā)與傳承。

      猜你喜歡
      甲子水族習(xí)俗
      明 文震孟 行書甲子除夕詩卷
      中國書法(2023年7期)2023-09-14 09:59:45
      水族敬酒歌
      黃河之聲(2021年18期)2021-12-14 04:10:42
      沈鵬《迎戊戌雙甲子》
      中華詩詞(2018年3期)2018-08-01 06:40:42
      上帝的水族館
      《夢溪筆談》“甲子納音”構(gòu)造方法的數(shù)學(xué)分析
      天下責(zé)任與先秦諸子學(xué)說的內(nèi)在差異
      古代文明(2016年2期)2016-10-21 19:21:50
      水族經(jīng)典及其思想信仰
      人間(2015年23期)2016-01-04 12:47:44
      習(xí)俗
      處暑
      清明
      南漳县| 阜城县| 太原市| 保亭| 托克逊县| 那坡县| 温州市| 荔浦县| 玉环县| 三明市| 桐乡市| 昆明市| 安徽省| 武威市| 兰西县| 普定县| 梨树县| 武隆县| 台中市| 辽中县| 平谷区| 漳州市| 资溪县| 麟游县| 固原市| 靖州| 区。| 天镇县| 东辽县| 德钦县| 裕民县| 盘锦市| 永吉县| 阳西县| 汉川市| 三门峡市| 鄄城县| 龙井市| 康保县| 南涧| 金沙县|