范 青, 談國新,孫傳明
(1.荊楚理工學(xué)院文學(xué)與傳媒學(xué)院, 湖北 荊門 448000; 2.華中師范大學(xué)國家文化產(chǎn)業(yè)研究中心, 武漢 430079)
非物質(zhì)文化遺產(chǎn)(簡(jiǎn)稱“非遺”)是中華民族傳統(tǒng)文化的靈魂,其保護(hù)與傳承受到廣泛重視.2021年8月,中共中央辦公廳 國務(wù)院辦公廳印發(fā)《關(guān)于進(jìn)一步加強(qiáng)非物質(zhì)文化遺產(chǎn)保護(hù)工作的意見》,強(qiáng)調(diào)運(yùn)用現(xiàn)代科技手段對(duì)全國非遺資源開展調(diào)查、記錄、整合與共享,構(gòu)建更加科學(xué)合理的資源保護(hù)體系.在智能媒體時(shí)代,以視頻為媒介的傳播方式超越了文本、圖像等傳統(tǒng)媒介,改變了人們的閱讀習(xí)慣.對(duì)非遺視頻進(jìn)行語義描述,形成計(jì)算機(jī)能識(shí)別和處理的資源庫,以知識(shí)元建立關(guān)聯(lián)關(guān)系實(shí)現(xiàn)視頻資源的共享及智能應(yīng)用,是當(dāng)前非遺資源保護(hù)和傳承的迫切需求.然而,以視頻為主流的數(shù)字媒體時(shí)代,視頻資源的利用和管理需求矛盾突出,傳統(tǒng)的視頻資源管理僅僅是對(duì)視頻文件進(jìn)行簡(jiǎn)單的標(biāo)記和命名,缺乏知識(shí)組織和語義關(guān)系表述,資源碎片化嚴(yán)重,限制了海量視頻資源的管理和有效傳播.由于非遺視頻屬于非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)資源零散,必須通過建立視頻之間的語義關(guān)聯(lián),滿足智能時(shí)代視頻資源檢索及個(gè)性化推薦需求.
非遺視頻資源豐富,數(shù)據(jù)量大,如何應(yīng)用計(jì)算機(jī)進(jìn)行科學(xué)管理是當(dāng)下研究難點(diǎn).目前,基于元數(shù)據(jù)的檢索應(yīng)用比較廣泛,但基于視頻內(nèi)容的知識(shí)組織與管理還不成熟,特別是非遺視頻包含傳承項(xiàng)目、人物、事件和時(shí)空?qǐng)鼍暗榷嘀匾?高效準(zhǔn)確建立視頻之間的組織關(guān)聯(lián)還面臨眾多技術(shù)挑戰(zhàn),制約了非遺的智能化傳播.語義關(guān)聯(lián)是信息時(shí)代多源異構(gòu)資源的聚合,能實(shí)現(xiàn)知識(shí)組織、共享與檢索.基于語義關(guān)聯(lián)的非遺視頻知識(shí)組織,是將非遺視頻以本體構(gòu)建方式,結(jié)構(gòu)化表達(dá)視頻資源信息,并構(gòu)建視頻之間語義關(guān)聯(lián),進(jìn)而達(dá)到視頻資源的語義化和關(guān)聯(lián)化目的.
本文利用信息組織學(xué)及本體論等相關(guān)理論,提出一種非遺視頻資源的語義描述框架,包括非遺視頻資源的采集、知識(shí)元、本體模型、語義關(guān)聯(lián)與知識(shí)服務(wù)等過程.研究如何將非結(jié)構(gòu)化視頻資源轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),并構(gòu)建視頻本體,以知識(shí)可視化形式展現(xiàn)非遺視頻之間的豐富關(guān)系.在理論研究的基礎(chǔ)上,以湖北省非遺項(xiàng)目為例,構(gòu)建非遺視頻知識(shí)服務(wù)平臺(tái),向用戶提供非遺視頻資源檢索及智能知識(shí)服務(wù),實(shí)現(xiàn)非遺視頻資源的共享和智能傳播應(yīng)用.
非遺數(shù)字化保護(hù)與傳承的一項(xiàng)重要任務(wù)就是將大量的視頻、音頻、文字、圖片等多媒體資源進(jìn)行管理,利用語義描述這些資源的知識(shí)組織,并構(gòu)建語義關(guān)聯(lián),建立知識(shí)庫,以供用戶檢索及訪問.對(duì)于早期的多媒體描述研究,Tamura等最早認(rèn)為影像資源的描述是根據(jù)多媒體資源的內(nèi)容以手工方式添加描述文本[1].這種描述提高了計(jì)算機(jī)對(duì)視頻內(nèi)容的識(shí)別,方便系統(tǒng)對(duì)資源進(jìn)行檢索,但該方法也存在一定缺陷.其一,對(duì)于分散的視頻資源,手工描述因個(gè)人差異導(dǎo)致描述的詞匯有所差異,并且還會(huì)出現(xiàn)漏標(biāo)或錯(cuò)標(biāo),從而影響計(jì)算機(jī)檢索的精準(zhǔn)度.其二,對(duì)于小型視頻資源庫可以采用人工描述方式進(jìn)行標(biāo)注,但對(duì)于數(shù)量龐大的視頻庫,手工描述顯然難以勝任.
為了提高視頻內(nèi)容描述的準(zhǔn)確率和效率,學(xué)者們開始研究計(jì)算機(jī)自動(dòng)標(biāo)注方法,借助神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)提取視頻影像的底層特征,通過樣本訓(xùn)練讓計(jì)算機(jī)智能識(shí)別視頻內(nèi)容,從而實(shí)現(xiàn)自動(dòng)標(biāo)注和描述[2].自動(dòng)提取即“共生模型”,其功能是在影像資源間建立語義關(guān)聯(lián)[3],這種自動(dòng)提取算法誕生于1999年.目前基于機(jī)器的自動(dòng)標(biāo)注準(zhǔn)確性不高,造成了大量的信息歧義,無法滿足用戶檢索要求,導(dǎo)致了語義鴻溝出現(xiàn).
為了解決用戶和計(jì)算機(jī)之間的語義鴻溝,語義標(biāo)注的概念和方法被提出并進(jìn)行了較多的研究與應(yīng)用實(shí)踐.視頻本身不具備語義信息,只有被標(biāo)注后才包含信息文本.語義描述是知識(shí)服務(wù)的基礎(chǔ),通過在不同層次之間提取視頻特征并進(jìn)行分析,形成視頻的語義描述.鑒于此,Eakins提出三層模型,為資源語義標(biāo)注提供了一個(gè)框架結(jié)構(gòu)[4].王曉光等在Eakins的基礎(chǔ)上提出一種影像語義描述層次模型,在高層語義中加入相關(guān)術(shù)語表及元數(shù)據(jù),用于敦煌壁畫的語義標(biāo)注[5].彭太樂提出基于鏡頭的標(biāo)注方法,通過視頻的上、下幀關(guān)系提出視頻分類算法[6].此外,謝瀟等針對(duì)地理視頻提出了一種表達(dá)視頻變化的多層次語義模型,該模型通過變化的三域(特征域-行為過程域-事件域)定義層次結(jié)構(gòu),描述地理信息與視頻內(nèi)容的語義關(guān)系[7].Duong等采用基于本體的方法標(biāo)注社交網(wǎng)絡(luò)中的視頻資源,達(dá)到視頻標(biāo)注的一致性和完整性[8].
描述視頻語義關(guān)系需構(gòu)建本體模型.“本體”一詞屬于哲學(xué)范疇的概念,后來應(yīng)用到計(jì)算機(jī)領(lǐng)域,用于知識(shí)表示[9].有文獻(xiàn)表明,Studer等在1998年給出本體定義,提出本體是對(duì)領(lǐng)域知識(shí)的抽象和描述,是用于表達(dá)、共享知識(shí)的方法[10].一個(gè)本體包括術(shù)語和術(shù)語間的關(guān)系,其實(shí)質(zhì)是規(guī)范概念模型,對(duì)領(lǐng)域概念標(biāo)準(zhǔn)化描述,實(shí)現(xiàn)知識(shí)共享和應(yīng)用[11].本體作為知識(shí)組織層描述模型工具,在知識(shí)工程中廣泛應(yīng)用.基于本體的視頻描述框架基本思想是通過本體模型對(duì)視頻特征和信息進(jìn)行描述,根據(jù)視頻資源的相關(guān)屬性及關(guān)聯(lián)關(guān)系,建立資源分類,使龐大的視頻媒體資源形成一個(gè)有效鏈接的知識(shí)庫.基于本體的多媒體資源描述已成為當(dāng)前研究熱點(diǎn),相關(guān)機(jī)構(gòu)都對(duì)領(lǐng)域本體開展研究與應(yīng)用,形成各具特色的本體模型.Kong等提出影像語義標(biāo)注的頂層本體,該模型允許用戶根據(jù)領(lǐng)域?qū)I(yè)特點(diǎn)在頂層模型中建立個(gè)性化的本體[12].Vincenzo等提出了影視戲劇本體模型,該模型由戲劇數(shù)據(jù)類型、戲劇名稱、戲劇內(nèi)容描述、外部引用等四個(gè)模型組織,通過本體模型的建立,展現(xiàn)戲劇中人物情感、不同人物的關(guān)系,為戲劇數(shù)字化展示提供了智能應(yīng)用.Ghosh等提出“現(xiàn)實(shí)世界因果概念的網(wǎng)絡(luò)多媒體本體”,將現(xiàn)實(shí)中事件、概念與多媒體呈現(xiàn)內(nèi)容建立關(guān)聯(lián)[13].此外,夏立新等對(duì)非遺圖片的社會(huì)化標(biāo)簽進(jìn)行研究,從多維度揭示非遺數(shù)字化資源的特征[14].候西龍?jiān)谠O(shè)計(jì)非遺視頻語義組織模型中,明確非遺視頻的概念及語義關(guān)系,提出非遺視頻領(lǐng)域共享的概念模型[15].
在本體模型構(gòu)建方面,目前成熟的本體模型有DublinCore、IAFATemplate、CDWA、VRACore、FOAF、COMM、CIDOC-CRM等.VRACore是美國可視資源協(xié)會(huì)提出的本體模型,用于描述可視化作品及圖片資源,包括17個(gè)核心目錄,涵蓋文藝作品、古建筑、照片等可視化資源[16];CDWA本體模型用于藝術(shù)品、文獻(xiàn)資源及可視資源描述;COMM模型,擴(kuò)展了MPEG-7概念表述,采用模型化結(jié)構(gòu)定義數(shù)據(jù)格式,包括視頻、媒體、文本信息等核心要素[17];CIDOC-CRM模型是非遺領(lǐng)域廣泛采用的本體模型,該模型涵蓋了實(shí)體、時(shí)間、地理位置及人物等要素,以事件為核心,對(duì)非遺描述比較全面.談國新等人參考CIDOC模型,基于視頻、圖像、語音等影像資源構(gòu)建了一種多層資源描述本體[18].
綜上所述,目前國內(nèi)外非遺知識(shí)組織的研究主要集中在文本、圖片及檔案數(shù)字化層面,并取得了一定的研究成果,但在非遺視頻知識(shí)組織方面研究較少,視頻知識(shí)組織的粒度不夠細(xì),資源之間關(guān)聯(lián)度不強(qiáng),智能服務(wù)質(zhì)量不高.此外,缺乏有效的視頻知識(shí)本體模型,沒有統(tǒng)一的領(lǐng)域本體,難以對(duì)非物質(zhì)文化遺產(chǎn)視頻資源進(jìn)行有效描述和規(guī)范.針對(duì)以上問題,本文圍繞非遺視頻知識(shí)組織和關(guān)聯(lián)問題,從視頻資源的知識(shí)元組織、本體構(gòu)建及語義關(guān)聯(lián)等方面入手,提出非遺視頻的知識(shí)組織模型.該模型涵蓋多維度的知識(shí)層面,讓讀者從可視化角度更加全面了解非遺信息,為我國非遺數(shù)字化保護(hù)和傳播提供更加智能的服務(wù)方式.
多媒體集聲音、圖像、動(dòng)畫等多種媒介于一體,經(jīng)計(jì)算機(jī)加工后可以輸出多種形式,實(shí)現(xiàn)媒體格式多樣化.多媒體信息無論在空間還是時(shí)間上都存在著一定的聯(lián)系,具有時(shí)空性、集成性、實(shí)時(shí)性和空間性.視頻按其結(jié)構(gòu)由幀、鏡頭、場(chǎng)景和故事單元構(gòu)成,其中幀是視頻基本單元,由每幅靜止圖片構(gòu)成,多組幀在時(shí)間線上按序排列形成鏡頭,多種鏡頭形成場(chǎng)景.通常情況下,故事單元的場(chǎng)景由獨(dú)立場(chǎng)景鏡頭按時(shí)間序列排列組成,相鄰幀在視頻特征上基本相同,相鄰兩幀特征發(fā)生變化則其鏡頭也產(chǎn)生變換[19].非遺視頻的層次化結(jié)構(gòu),從上而下可以表示為視頻層、故事場(chǎng)景、鏡頭層和幀,按非遺可以劃分為人物、事件和時(shí)空等類別,其結(jié)構(gòu)關(guān)系如圖1所示.文中影像圖片來自華中師范大學(xué)國家文化產(chǎn)業(yè)研究中心“湖北省非物質(zhì)文化遺產(chǎn)綜合展示平臺(tái)”.
圖1 非物資文化遺產(chǎn)視頻層次結(jié)構(gòu)圖Fig.1 Hierarchy of intangible cultural heritage video
非遺視頻資源的知識(shí)組織實(shí)質(zhì)是對(duì)資源的概念、關(guān)系及屬性的描述.為保證非遺視頻描述的準(zhǔn)確性,需通過細(xì)致分析后以顆粒度更細(xì)的方式描述資源組織結(jié)構(gòu),更好地挖掘非遺本體之間的關(guān)聯(lián)關(guān)系.本文根據(jù)非遺視頻資源特性,參考Eakins提出的層次模型[4]和周知等提出的語義描述層次[20],采用自頂而下的方法確定非遺視頻資源知識(shí)組織的層次模型,分為關(guān)系層、語義層、對(duì)象層和底層4個(gè)層級(jí)(如圖2).層級(jí)越高,其語義描述的抽象程度越高,細(xì)粒度越好.
圖2 非物質(zhì)文化遺產(chǎn)視頻知識(shí)組織層次模型Fig.2 Hierarchical model of knowledge organization for intangible cultural heritage video
底層是非遺視頻描述特征層,包括視頻的色彩、分辨率、時(shí)長、格式、大小、碼率等基本數(shù)據(jù).該層次知識(shí)描述是對(duì)其視頻基本特征進(jìn)行抽取,這種知識(shí)抽取可通過計(jì)算機(jī)自動(dòng)完成.
對(duì)象層是視頻所顯示的影像信息,包括非遺相關(guān)的人物、物品和背景等.對(duì)象層描述內(nèi)容包括三個(gè)方面:非遺項(xiàng)目的分類、屬性及關(guān)系.除了視頻元數(shù)據(jù)以外,視頻對(duì)象可以是現(xiàn)實(shí)中反映非遺屬性的信息,如視頻中的非遺項(xiàng)目名稱和傳承人姓名等.此外,除了對(duì)象自身屬性描述外,還可以描述對(duì)象之間的語義關(guān)系,如師徒關(guān)系、長幼關(guān)系等.對(duì)象屬性可通過計(jì)算機(jī)識(shí)別自動(dòng)提取一部分信息,更多的還需人工完成.對(duì)于對(duì)象的識(shí)別,不同的研究者對(duì)其采用的方法也不同,有些學(xué)者采用視頻標(biāo)注模型來判斷視頻對(duì)象的區(qū)域[21],以達(dá)到識(shí)別效果.
語義層包括非遺傳承人的場(chǎng)景、動(dòng)作技藝、情感.場(chǎng)景是非遺中特定的關(guān)系抽取,是對(duì)非遺的內(nèi)容背景及事件所處環(huán)境的描述.視頻中除對(duì)象、物品之外,都可以稱為場(chǎng)景,包括非遺項(xiàng)目的歷史演變、文化空間、地域.由于非遺環(huán)境位置與現(xiàn)實(shí)場(chǎng)景還有些區(qū)別,可以通過計(jì)算機(jī)來識(shí)別顏色、紋理等視覺特征.對(duì)于字畫、藝術(shù)等非遺場(chǎng)景,計(jì)算機(jī)識(shí)別會(huì)存在一定誤差.動(dòng)作技藝是指?jìng)鞒腥嗽谔囟ōh(huán)境下對(duì)非遺項(xiàng)目的展示過程,其含義比較廣泛,包括事件、活動(dòng)等行為.情感是視頻人物在技藝活動(dòng)中流露的動(dòng)作、表情.視頻的語義層采用兩個(gè)維度描述情感:一是時(shí)空背景表達(dá)情感由于時(shí)空背景的復(fù)雜性,當(dāng)前計(jì)算機(jī)還無法處理,因此不作為本文研究范圍.另一個(gè)就是傳承人所流露的面部表情,一般為喜怒哀樂.對(duì)于不同的傳承人,其情感是不同的,因此人物情感的識(shí)別需根據(jù)現(xiàn)實(shí)情況進(jìn)行描述.
關(guān)系層是根據(jù)非遺視頻中對(duì)象之間的關(guān)系進(jìn)行描述,包括人物、事件、人與物品、人與事件等關(guān)系描述,既有顯性關(guān)系,也有隱性聯(lián)系.通過語義描述,反映非遺視頻在內(nèi)容、類別、實(shí)體、概念等不同維度之間的關(guān)系.
通過分析非遺視頻資源組織結(jié)構(gòu),本文構(gòu)建了一套基于語義描述的非遺視頻知識(shí)組織框架(如圖3).該框架包括視頻資源采集、資源描述、本體模型、語義關(guān)系、知識(shí)服務(wù)等五部分,以滿足視頻資源描述粒度從低到高的要求,詳細(xì)描述視頻資源的知識(shí)組織.該框架從底層數(shù)據(jù)采集到知識(shí)服務(wù),采用統(tǒng)一的資源描述語言,通過關(guān)聯(lián)數(shù)據(jù)互聯(lián)共享機(jī)制,實(shí)現(xiàn)異構(gòu)視頻資源互操作.
非遺視頻來源于網(wǎng)絡(luò)數(shù)據(jù)及實(shí)地拍攝,這些資源是知識(shí)組織與描述的基礎(chǔ).從數(shù)據(jù)編輯格式來看,有MAV、MP4、AVI、MOV等.非遺視頻數(shù)據(jù)進(jìn)行處理時(shí),對(duì)于自行拍攝的非結(jié)構(gòu)化視頻數(shù)據(jù),首先需要進(jìn)行集中清洗,剔除無效視頻,統(tǒng)一編碼格式,利用元數(shù)據(jù)規(guī)范,對(duì)其統(tǒng)一描述,將其轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù).對(duì)于網(wǎng)絡(luò)視頻數(shù)據(jù),因其大部分是結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),只需對(duì)已有數(shù)據(jù)進(jìn)行規(guī)范和補(bǔ)充,利用計(jì)算機(jī)自動(dòng)采集即可.從非遺資源類型看,有舞蹈、民俗、傳統(tǒng)藝術(shù)、傳統(tǒng)手工藝、傳統(tǒng)音樂、戲劇、曲藝等.這些不同類型的視頻資源,其實(shí)質(zhì)是不同幀按一定的序列排列在時(shí)間線的集合.在智能媒體時(shí)代,對(duì)視頻進(jìn)行逐幀描述的計(jì)算工作量非常龐大,無法滿足用戶智能檢索服務(wù).目前,非遺視頻資源種類繁多、專業(yè)性強(qiáng),語義檢索和特征提取難度較大,因此,本文采用視頻關(guān)鍵幀提取,將用戶對(duì)視頻的知識(shí)服務(wù)需求轉(zhuǎn)換成圖像搜索.
3.2.1 非物質(zhì)文化遺產(chǎn)視頻資知識(shí)元提取 知識(shí)元提取即非遺視頻以知識(shí)元形式化表示,是非結(jié)構(gòu)化轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)關(guān)鍵.知識(shí)元是對(duì)知識(shí)描述的最小單元,能準(zhǔn)確表達(dá)知識(shí)的本質(zhì),是知識(shí)組織、檢索和智能應(yīng)用的最小單元.非遺視頻知識(shí)元是非遺知識(shí)組織的基本單元,具有完整性、獨(dú)立性、唯一性.一般視頻知識(shí)元抽取包括視頻分割、關(guān)鍵幀抽取和特征提取.
1) 視頻分割是將視頻劃分為不同的視頻片段,并識(shí)別視頻知識(shí)元,其目的是抽取實(shí)體對(duì)象,通常這種實(shí)體對(duì)象也是非遺知識(shí)元的一部分.常用的視頻分割有基于鏡頭的分割和基于故事內(nèi)容的分割[22].在故事性非遺視頻中,假設(shè)有N個(gè)場(chǎng)景,每個(gè)場(chǎng)景的邊界集合為B={b1,b2,b3,…,bn-1},其中bi的邊界用場(chǎng)景相似度來區(qū)別,相似度越低,說明存在故事視頻分割,相似度越高,表明故事情場(chǎng)之間變化較小,其計(jì)算公式如式(1)[23].
(1)
式中,場(chǎng)景特征間距集合DC={d1,d2,d3,…,dn-1},di為bi的間距,V為最小值邊界集合,P為最大值邊界點(diǎn)集合,OT表示最小值和最大值以外情況,B=V∪P∪OT,如式(2).
(2)
其分割效果如圖4所示.
圖4 視頻鏡頭分割效果Fig.4 Effect of video shot segmentation
關(guān)鍵幀抽取,指在分割視頻中抽出反映主要內(nèi)容的一幀或幾幀圖像,以準(zhǔn)確表達(dá)分割視頻的信息內(nèi)容,通過關(guān)鍵幀消除視頻幀冗余.關(guān)鍵幀提取有基于運(yùn)動(dòng)分析、基于聚類和基于HSV直方圖特征分析[23].本文采用HSV直方圖特征分析的方法抽取非物質(zhì)文化遺產(chǎn)視頻中的關(guān)鍵幀.首先計(jì)算鏡頭中每一幀的顏色的直方圖,其次計(jì)算鏡頭中所有幀直方圖的平均值,再次將每幀的直方圖與平均值的直方圖進(jìn)行對(duì)比,找出最大和最小直方圖作為關(guān)鍵幀.其計(jì)算公式如式(3).
(3)
其中,S(y)為鏡頭幀的直方圖總和,A(y)為鏡頭的直方圖的平均值,K(j)為關(guān)鍵幀[23].
2) 視頻特征提取是描述視頻資源的重要因素,包含基本特征和語義信息.在知識(shí)組織中,基本特征包括對(duì)象形狀、紋理和顏色.形狀特征是基于數(shù)學(xué)模型的描述,對(duì)圖像空間感要求較高,對(duì)于變化的形狀其特征描述精度較低,穩(wěn)定性不高.顏色特征抽取的是全局特征,其原理是基于像素點(diǎn)的描述,優(yōu)點(diǎn)在于能準(zhǔn)確描述像素顏色在關(guān)鍵幀中所占比例.紋理特征是描述關(guān)鍵幀表面特征,對(duì)區(qū)域中的多個(gè)像素點(diǎn)進(jìn)行計(jì)算.視頻的特征包括重要的語義信息,如何完整提取視頻特征信息將直接影響到視頻語義關(guān)系描述的準(zhǔn)確率.語義信息描述特征包括非遺人物、場(chǎng)景、動(dòng)作、物體、聲音、空間位置等.其中,場(chǎng)景是指非遺視頻中傳承人所處的環(huán)境及相關(guān)的人或事,人物特征是視頻中傳承人的面部表情和周圍相關(guān)人員的姿態(tài),聲音特征是非遺場(chǎng)景中當(dāng)事人的聲音和周邊環(huán)境的聲音,運(yùn)動(dòng)特征是指視頻中人物或?qū)ο蟮倪B續(xù)變化.語義描述特征是最核心的特征,其特征提取的準(zhǔn)確度將直接影響非遺視頻資源的描述質(zhì)量.
3.2.2 非物質(zhì)文化遺產(chǎn)視頻資源描述 通過視頻組織層次分析,本文從非遺視頻資源的底層、對(duì)象層、語義層等三個(gè)方面建立資源描述框架,如圖5所示.根據(jù)聯(lián)合國教科文組織《保護(hù)非物質(zhì)文化遺產(chǎn)公約》中非物質(zhì)文化遺產(chǎn)分類,結(jié)合非遺視頻資源實(shí)際情況,將其為兩大實(shí)體,13個(gè)對(duì)象.在視頻內(nèi)容實(shí)體中,視頻內(nèi)容包含七個(gè)對(duì)象,主要表達(dá)與非遺的傳承人、事件、起源、組織機(jī)構(gòu)、時(shí)空、非遺項(xiàng)目、非遺類型等客觀對(duì)象.考慮到語義關(guān)聯(lián)及智能知識(shí)服務(wù),視頻內(nèi)容描述必須對(duì)非遺所包括要素高度歸納和概括,針對(duì)不同的非遺類型細(xì)化,以達(dá)到通用性和可移植性.視頻資源實(shí)體是資源描述的最底層,是對(duì)視頻信息的描述,視頻資源描述包括存儲(chǔ)格式、時(shí)長、分辨率、標(biāo)簽、創(chuàng)建者、主題等信息.
圖5 非物質(zhì)文化遺產(chǎn)視頻資源描述框架Fig.5 Description framework of intangible cultural heritage video resources
本文參考已有概念模型(CIDOC-CRM、FOAF、MPEG-7及VRA),通過從下而上的方式分析非遺視頻知識(shí)、提取視頻內(nèi)容屬性,元素精煉,提出適合于非遺視頻描述的概念模型.該模型設(shè)計(jì)從非遺底層視頻特征到內(nèi)容特征入手,從視頻資源信息、傳承人、非遺類型、事件及地理空間信息等方面綜合描述非遺對(duì)象,規(guī)范化主題元素.非遺視頻資源包含13類屬性,考慮非遺視頻智能知識(shí)服務(wù),視頻內(nèi)容的屬性提取至關(guān)重要,因此元數(shù)據(jù)描述模型需要進(jìn)行細(xì)分,使其粒度更細(xì).此外,通過元素屬性的定義及描述規(guī)范,便其通用性更好(見表1).
表1 非物質(zhì)文化遺產(chǎn)視頻對(duì)象數(shù)據(jù)屬性表
表1(續(xù))
在整個(gè)非遺視頻知識(shí)組織框架中,本體模型是重要的中間環(huán)節(jié),本體構(gòu)建需要考慮視頻資源的語義描述、語義特征及語義關(guān)系,也要考慮到視頻知識(shí)組織的底部特征及語義關(guān)聯(lián)關(guān)系,因此本體模型構(gòu)建是建立在語義描述之上,是實(shí)現(xiàn)智識(shí)知識(shí)服務(wù)的重要環(huán)節(jié).本文在充分考慮非遺視頻資源特征要素及非遺知識(shí)抽取的基礎(chǔ)之后,結(jié)合藝術(shù)、地理信息空間、數(shù)字人文等學(xué)科知識(shí),提出非遺視頻資源本體模型.該本體類包含傳承人、地理空間、事件/活動(dòng)、類型、組織機(jī)構(gòu)、起源、視頻資源等七個(gè)核心類.
3.3.1 傳承人 傳承人是非遺文化傳播的主體,是非遺活態(tài)性保護(hù)的傳承者,非遺本體的核心要素,是非遺知識(shí)組織的重要組成部分.本文的傳承人是指非遺技能的傳播者,包括個(gè)人和群體.個(gè)人屬性包括姓名、性別、年齡、民族、介紹;群體指保護(hù)單位,如博物館、文化館等.
3.3.2 時(shí)空 在非物質(zhì)文化遺產(chǎn)資源的時(shí)空類中,按其粒度可以為分時(shí)間和地理空間位置兩個(gè)子類.時(shí)間類,是“非遺”內(nèi)容中所涉及的時(shí)間表達(dá),描述的是“非遺”事件或內(nèi)容的發(fā)生時(shí)間、時(shí)長,而地理空間位置是記錄事件發(fā)生地點(diǎn),以及非遺資源分布的空間位置及時(shí)空變遷的過程.非遺時(shí)空類的語義關(guān)系如圖6所示.
圖6 非物質(zhì)文化遺產(chǎn)時(shí)空類語義關(guān)系圖Fig.6 Semantic relation diagram of space-time class for intangible cultural heritage
1) 時(shí)間.在非遺中的時(shí)空類用于描述與非遺事件、內(nèi)容等存在時(shí)間要素.非物質(zhì)文化遺產(chǎn)是一種活態(tài)性,在現(xiàn)實(shí)世界中依托人和事件的發(fā)生而存在,在非遺保護(hù)和傳承過程中,時(shí)間扮演著重要的角色.例如,非遺的傳承人在歷史的變遷中代代更替?zhèn)鞒?以至于非遺的表現(xiàn)方式發(fā)現(xiàn)了演化,尤其在動(dòng)作技藝等方面;非遺的傳承人的表現(xiàn)方式逐漸發(fā)生動(dòng)態(tài)演繹.因而,時(shí)間類對(duì)非遺內(nèi)容及事件是密切相聯(lián).在研究時(shí)間類的信息表示時(shí),時(shí)間類可以分時(shí)間點(diǎn)、時(shí)間段.
現(xiàn)階段雖然國內(nèi)學(xué)者對(duì)時(shí)間的本體有一定的研究,但仍不成熟,難于在非遺資源的時(shí)空本體中應(yīng)用.本文對(duì)非遺時(shí)空特征進(jìn)行提煉,根據(jù)非物質(zhì)文化遺產(chǎn)本體構(gòu)建要求,綜合考慮非遺資源的通用性和兼容性,避免非遺時(shí)間類的項(xiàng)目過于復(fù)雜,語義描述難度增大,不利于知識(shí)管理和應(yīng)用.
2) 地理空間.非遺最大的特點(diǎn)就是具有地域性,不同的地域其語言、文化、生產(chǎn)技藝、風(fēng)俗人情等各具特色,不同的區(qū)域非遺之間存在一定的關(guān)聯(lián).在本體構(gòu)建中,地理空間描述了非遺的區(qū)域分布特征,另一方面,記錄著非遺的事件及活動(dòng)的空間信息.
本文的地理空間對(duì)地理場(chǎng)景的概念進(jìn)行定義,參考了CRM參考模型與Geo Names本體模型中的有關(guān)內(nèi)容,并賦予了我國的行政劃分的位置,以更好表達(dá)非遺的空間位置.例如傳統(tǒng)的《撒葉兒嗬》是清江流域土家人的一種民俗舞蹈,其地理位置可以是“清江流域”,也可以 “湖北省宜昌市長陽縣”,后者更能準(zhǔn)確描述其地理空間,以方便后續(xù)知識(shí)組織時(shí)對(duì)時(shí)空數(shù)據(jù)進(jìn)行處理.另一方面,地理空間表達(dá)的是區(qū)域,比較宏觀,往往是山川、河流、城市、村寨,對(duì)于更微細(xì)的空間表達(dá),則無法實(shí)現(xiàn).為此,通過復(fù)用CRM概念本體中的相關(guān)定義,用于描述具體的空間,比如房前屋后、廣場(chǎng)、田間、草地等.地理空間的屬性如圖7所示.
圖7 非物質(zhì)文化遺產(chǎn)地理空間屬性圖Fig.7 Geospatial attributes of intangible cultural heritage
3.3.3 事件/活動(dòng) 描述非遺傳承人在特定時(shí)空背景下展示的事件或活動(dòng)過程.事件/活動(dòng)是非遺知識(shí)組織的核心內(nèi)容,是對(duì)非遺視頻內(nèi)容的概述,描述非遺歷史發(fā)展及演變過程.此外,非遺具有活態(tài)性,其發(fā)展和形成具有一定的外部環(huán)境和歷史條件,是一種動(dòng)態(tài)發(fā)展的過程.例如,湖北天門糖塑,也叫吹糖、糖人模,是中國傳統(tǒng)民間手工藝品.在舊時(shí),江漢平原的天門、沔陽一帶,這里人多地少,地勢(shì)低洼,汛期常鬧水荒.為了謀生,人們被迫流浪在外地學(xué)手藝,學(xué)成后又回家鄉(xiāng)發(fā)展,糖塑由此發(fā)展起來.舊時(shí)農(nóng)閑時(shí)節(jié),天門、沔陽的藝人們便分赴外地,甚至遠(yuǎn)到湖南、江西、河南等地賣藝謀生.
3.3.4 類型 描述非遺項(xiàng)目的類型屬性,當(dāng)下各國對(duì)非遺的具體分類并不完全一致,但參考聯(lián)合國教科文組織頒布的《保護(hù)非物質(zhì)文化遺產(chǎn)公約》,結(jié)合我國非遺現(xiàn)狀,本文將非遺類型分為十大類,分別為:傳統(tǒng)舞蹈、民俗、傳統(tǒng)藝術(shù)、傳統(tǒng)手工藝、傳統(tǒng)音樂、戲劇、曲藝、雜技、民間文學(xué)、傳統(tǒng)武術(shù)等.
3.3.5 組織機(jī)構(gòu) 指非遺項(xiàng)目對(duì)應(yīng)的管理機(jī)構(gòu),包括組織機(jī)構(gòu)名稱、聯(lián)系電話等.這些機(jī)構(gòu)承擔(dān)著非遺發(fā)掘、保護(hù)和傳承的職能,是非遺保護(hù)的主體,為我國非遺傳播提供重要參考.
3.3.6 起源 非遺的發(fā)展起源與特定的時(shí)間、區(qū)域、人們的生活習(xí)慣及傳承方式有關(guān).正是這些因素才造就了今天豐富多彩的非物質(zhì)文化.在特定的歷史朝代,非遺的表現(xiàn)形式不同,表現(xiàn)的方式、動(dòng)作技藝及生產(chǎn)方式不同,其依賴的文化空間也會(huì)隨著時(shí)間演變而發(fā)生變化.歷史演變就是非遺在時(shí)間演變過程中抽取的特征,包括非物質(zhì)文化的起源時(shí)間、發(fā)展歷程.分布區(qū)域展現(xiàn)非遺空間的演變,主要指同一非遺在不同區(qū)域的發(fā)展變化,包括呈現(xiàn)時(shí)間、表達(dá)方式等.例如,國家級(jí)非遺名錄“端午節(jié)”,在不同的區(qū)域表現(xiàn)形式各異.在福建端午節(jié)當(dāng)天有煮粽水潔身的習(xí)俗,在江蘇是劃龍舟比賽;在廣東主要形式有扒龍船、食粽、插艾草、龍點(diǎn)睛;在湖北是掛艾葉、包粽子、飲雄黃酒等.相關(guān)人物是指參與非遺起源研究的相關(guān)人員或?qū)<?提出非遺的重要的歷史事件和演變的相關(guān)知識(shí),包括人物、歷史事件、重要的文獻(xiàn)等.傳承方式包括傳統(tǒng)的言傳身教和歷史文獻(xiàn).其中歷史文獻(xiàn)包括對(duì)非物質(zhì)文化的變遷、起源、歷史人物.非物質(zhì)文化遺產(chǎn)起源的屬性如圖8所示.
3.3.7 視頻資源 采用DC元數(shù)據(jù)規(guī)范中的視頻圖像類,包括視頻格式、分辨率紋理、顏色、形狀,視頻時(shí)長等進(jìn)行描述.視頻資源類作為非遺本體構(gòu)建中唯一影像資源類,與非遺傳承人、事件/活動(dòng)、空間地理位置等產(chǎn)生復(fù)雜關(guān)聯(lián)關(guān)系,豐富非遺的表現(xiàn)形式,為語義描述、知識(shí)關(guān)聯(lián)、知識(shí)可視化提供應(yīng)用基礎(chǔ).
語義關(guān)聯(lián)主要是描述非遺視頻資源庫中語義層隱性或顯性關(guān)聯(lián)關(guān)系,使零散的非遺視頻資源匯聚、關(guān)聯(lián),形成計(jì)算機(jī)可識(shí)別的數(shù)據(jù).因此,語義關(guān)聯(lián)是以RDF方式將非遺視頻數(shù)據(jù)建立關(guān)聯(lián),將資源庫中龐大的視頻數(shù)據(jù)以RDF鏈接融合成互為聯(lián)系的有機(jī)整體,向用戶提供智能化知識(shí)服務(wù).語義關(guān)聯(lián)可分為三個(gè)步驟,分別為:命名實(shí)體資源、實(shí)體RDF化、實(shí)體關(guān)聯(lián).
圖8 非物質(zhì)文化遺產(chǎn)起源屬性圖Fig.8 Origin attribute of intangible cultural heritage
3.4.1 命名實(shí)體資源 它是為每一個(gè)資源實(shí)體提供一個(gè)可解析的永久標(biāo)識(shí)符URI(uniform resource identifier),其作用是為非遺視頻資源中各對(duì)象賦予一個(gè)Web可以讀取的地址,以規(guī)范網(wǎng)絡(luò)空間命名.一般情況下,非遺視頻資源中實(shí)體對(duì)象(如項(xiàng)目類別、傳承人、組織機(jī)構(gòu)、視頻資源等)都必須采用唯一的標(biāo)識(shí)符來命名,以確保在XML環(huán)境下這些信息資源能被計(jì)算機(jī)讀取并訪問.目前Web架構(gòu)提供303URIs、HashURIs兩種訪問方式[24].303URIs采用帶有“/”標(biāo)識(shí)符命名資源,命名格式如“http://www.hbinc.cn/heritageproject/01”.采用303URIs會(huì)存在一定的延時(shí),但對(duì)于大量的RDF資源庫穩(wěn)定性較好.HashURIs采用帶“#”標(biāo)識(shí)符來命名資源,一般命名小型RDF資源庫,其命名格式如“http://www.w3.org/2000/01/rdf-schema#”.本文采用303URIs與HashURIs結(jié)合方式,即用303URIs命名實(shí)體資源,用HashURIs命名本體資源.
3.4.2 實(shí)體RDF化 該步驟以RDF方式描述非遺視頻資源中實(shí)體對(duì)象,使其規(guī)范化和結(jié)構(gòu)化.在RDF、XML環(huán)境下,通過實(shí)體對(duì)象描述形成領(lǐng)域共享詞庫,包括類和對(duì)象的概念、屬性、領(lǐng)域和實(shí)例.下面以非遺視頻《天門糖塑》內(nèi)容中實(shí)體對(duì)象為例展示實(shí)體RDF化過程.
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdf="http://www.w3.org/2000/01/rdf-schema#" xmlns:inc="http://hbinc.com/tra/handicraftc/01#" xmlns:inc="http://hbinc.com/trahandicraft/02#"> rdf:about="http://hbinc.com/tra/handicraftc/01/TianmenSugarsculpture"> rdf:about="http://hbinc.com/trahandicraft/02/Tianmen">
3.4.3 實(shí)體關(guān)聯(lián) 實(shí)體關(guān)聯(lián)是將雜亂無序的實(shí)體對(duì)象以RDF鏈接,形成一個(gè)有序整體.實(shí)體關(guān)系是語義關(guān)聯(lián)的核心.通過本體的構(gòu)建可清晰梳理非遺類及屬性,但本體與本體之間的關(guān)聯(lián)關(guān)系無法拓展,無法在Web應(yīng)用中實(shí)現(xiàn)實(shí)體對(duì)象關(guān)聯(lián).因此語義關(guān)聯(lián)是通過RDF描述非遺視頻資源的深層邏輯結(jié)構(gòu),形成不同資源本體鏈接,實(shí)現(xiàn)非遺視頻資源的關(guān)聯(lián)關(guān)系.通過RDF三元組描述,建立多維度數(shù)據(jù)鏈接,發(fā)掘隱藏的關(guān)系節(jié)點(diǎn),增加非遺視頻知識(shí)的關(guān)聯(lián)維度和廣度.在語義關(guān)系中,采用REF的URI模型描述實(shí)體對(duì)象,以實(shí)現(xiàn)非遺視頻資源的規(guī)范,為不同的知識(shí)平臺(tái)及資源庫提供統(tǒng)一接口.本文通過已有本體及資源描述框架,對(duì)實(shí)體進(jìn)行抽取、RDF化及實(shí)體關(guān)聯(lián),以呈現(xiàn)隱藏語義關(guān)系.根據(jù)資源描述模型及本體建構(gòu),本文主要抽取傳承人、地理空間、資源類、事件、起源、組織機(jī)構(gòu)等6個(gè)實(shí)體建立關(guān)聯(lián)(如圖9).
圖9 非物質(zhì)文化遺產(chǎn)視頻資源實(shí)體關(guān)聯(lián)圖Fig.9 Entity association of intangible cultural heritage video resources
本文以《天門糖塑》為例,對(duì)非遺視頻知識(shí)服務(wù)應(yīng)用進(jìn)行描述,建立視頻知識(shí)元與視頻內(nèi)容之間的語義關(guān)系,實(shí)現(xiàn)非遺視頻資源描述與知識(shí)組織的融合.通過對(duì)非遺視頻知識(shí)結(jié)構(gòu)描述,使得非遺視頻資源知識(shí)組織的粒度更細(xì),知識(shí)更加清晰.同時(shí),增加領(lǐng)域本體在非遺視頻知識(shí)組織中的融合應(yīng)用,為非遺的知識(shí)服務(wù)提供更加清晰的對(duì)象及屬性描述.
對(duì)非遺視頻資源結(jié)構(gòu)化描述,是實(shí)現(xiàn)知識(shí)可視化的基礎(chǔ),視頻知識(shí)組織是對(duì)實(shí)體進(jìn)行語義描述為其建立關(guān)聯(lián)關(guān)系的過程,以實(shí)現(xiàn)視頻知識(shí)單位與視頻內(nèi)容的關(guān)聯(lián).非遺視頻關(guān)聯(lián)關(guān)系建立包括實(shí)體間關(guān)系及概念與屬性之間的關(guān)聯(lián).根據(jù)資源描述模型,將零散的視頻知識(shí)單元分割后,進(jìn)行描述、鏈接,形成相互關(guān)聯(lián)的知識(shí)組織,以實(shí)現(xiàn)異構(gòu)非遺數(shù)據(jù)多維度、可視化展示.
圖10以國家級(jí)非遺《天門糖塑》視頻資源為例,對(duì)視頻中相關(guān)鏡頭進(jìn)行描述.圖中對(duì)視頻資源分兩部分描述,一部分是資源本身信息,另一部分是視頻內(nèi)容描述.在視頻內(nèi)容中主要描述天門地域非遺傳統(tǒng)手藝人羅照英熬制麥芽糖、制作“獨(dú)占鰲頭狀元公”糖塑作品.通過對(duì)視頻知識(shí)組織描述,展示了更多與非遺視頻背景相關(guān)信息,如天門城市的曾用名,非遺傳承人師承王培林大量關(guān)聯(lián)信息等.這些不同的知識(shí)單元通過語義描述建立關(guān)聯(lián),向用戶提供更多的隱性知識(shí).
知識(shí)搜索是計(jì)算機(jī)根據(jù)用戶需求實(shí)現(xiàn)知識(shí)查找的過程,它是自然語言處理的一個(gè)重要步驟,也是知識(shí)可視化的前提.針對(duì)非遺視頻資源的知識(shí)檢索,本文將收集的非遺視頻數(shù)據(jù)進(jìn)行處理后建立非遺視頻資源庫,形成非遺視頻本體,按照對(duì)象類及屬性關(guān)系,將其轉(zhuǎn)換為RDF結(jié)構(gòu)化數(shù)據(jù),再通過Drupal平臺(tái)建立映射,并用SPARQL對(duì)大量關(guān)系數(shù)據(jù)進(jìn)行遍歷查找.在用戶層面,用戶通過瀏覽器輸入自然語言檢索的表達(dá)請(qǐng)求后,通過NLPIR分詞工具進(jìn)行分詞處理和標(biāo)注,將不同問題與SPARQL語句匹配,在本體庫中遍歷查找,得到用戶匹配結(jié)果,并反饋到用戶界面.在查詢過程中,系統(tǒng)將與主題相關(guān)的非遺視頻信息形成聚合,包括視頻間隱性關(guān)系,并呈現(xiàn)在用戶瀏覽器中.非遺視頻資源庫中RDF知識(shí)單元通過Drupal映射形成關(guān)聯(lián)數(shù)據(jù),對(duì)于具備計(jì)算機(jī)專業(yè)知識(shí)的用戶,可以根據(jù)知識(shí)檢索需求直接輸入SPARQL語句,以更加精準(zhǔn)實(shí)現(xiàn)知識(shí)查詢,這些專業(yè)查詢語句使非遺知識(shí)智能服務(wù)更加便利.針對(duì)普通大眾的知識(shí)檢索服務(wù),用戶可在瀏覽器查找窗口中輸入關(guān)鍵詞進(jìn)行檢索,系統(tǒng)自動(dòng)對(duì)關(guān)鍵詞進(jìn)行命名實(shí)體識(shí)別、知識(shí)抽取、關(guān)系映射等操作,并轉(zhuǎn)換成SPARQL語句,并將查詢結(jié)果反饋給用戶.
圖10 《天門糖塑》視頻語義描述Fig.10 Semantic description of Tianmen Sugar Sculpture video
SPARQL查詢可以搜索RDF形式的非遺視頻數(shù)據(jù).本文以“天門糖塑”為例,通過SPARQL語句查詢湖北天門地區(qū)的非遺視頻資源,具體如下:
prefixrdf:
Prefixdft:
prefixdc:
FROM
WHERE
{
?titledftc:city?city.
?titledft:tag?tag.
?titledft:type?type.
Filterregex(?city,"∧TianMen")
Filterregex(?ty,"∧tangsu")
}
在查詢語言中,非遺項(xiàng)目與區(qū)域、類型形成關(guān)聯(lián)關(guān)系,使得非遺視頻知識(shí)形成聚合,并展現(xiàn)非遺視頻知識(shí)之間的關(guān)聯(lián),以滿足用戶對(duì)非遺視頻資源不同粒度的檢索需求.具體來講,SPARQL查詢就是以非遺視頻資源對(duì)象為出發(fā)點(diǎn),以實(shí)體URI為線索,實(shí)現(xiàn)不同知識(shí)元組織的遍歷查找,并以可視化形式呈現(xiàn).計(jì)算機(jī)用戶可以通過設(shè)計(jì)SPARQL語言,更加精準(zhǔn)的實(shí)現(xiàn)非遺視頻知識(shí)查詢,這為非遺視頻智能服務(wù)提供了便利.
非遺視頻知識(shí)關(guān)聯(lián)的獨(dú)特之處在于非遺視頻內(nèi)容以事件或非遺動(dòng)作技藝為樞紐將零散的實(shí)體聯(lián)系在一起.視頻資源通過Drupal系統(tǒng)實(shí)現(xiàn)可視化,其最大優(yōu)點(diǎn)是能夠通過可視化方式向用戶呈現(xiàn)站內(nèi)搜索結(jié)果.基于SPARQL的Drupal平臺(tái)可以實(shí)現(xiàn)RDF數(shù)據(jù)導(dǎo)航,自動(dòng)匹配RDF三元組信息,并與其他數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)搜索.
圖11是本文以非遺視頻資源《天門糖塑》為例搜索結(jié)果及可視化界面,用戶在頁面中可以查找《天門糖塑》的視頻,觀看與“糖塑”相關(guān)的人物、動(dòng)作技藝等視頻內(nèi)容.在視頻信息中,列出該視頻的標(biāo)題、標(biāo)簽、簡(jiǎn)介等相關(guān)字段信息.此外,系統(tǒng)會(huì)根據(jù)用戶觀看內(nèi)容及資源庫中構(gòu)建的關(guān)聯(lián)關(guān)系,在下方推薦與所觀看視頻內(nèi)容相關(guān)的其它視頻,用戶可以點(diǎn)擊下方視頻直接跳轉(zhuǎn)感興趣視頻,以實(shí)現(xiàn)深層次語義關(guān)聯(lián)信息挖掘與展示.
圖11 《天門糖塑》關(guān)聯(lián)視頻Fig.11 Related video of Tianmen Sugar Sculpture
非物質(zhì)文化遺產(chǎn)是人類文明發(fā)展和自然演進(jìn)的重要成果,非遺視頻資源是促進(jìn)世界文化交流的重要載體,高質(zhì)量的開發(fā)設(shè)計(jì)和智能服務(wù)是人類文明和世界發(fā)展的必然要求.利用語義描述及數(shù)據(jù)關(guān)聯(lián)構(gòu)建非遺視頻資源庫,并通過互聯(lián)網(wǎng)平臺(tái)融合多源異構(gòu)數(shù)據(jù),有助于提高我國非遺傳播的效果及影響力.本文針對(duì)非遺視頻資源特征和知識(shí)組織進(jìn)行深入研究,首先對(duì)視頻鏡頭分割及關(guān)鍵幀抽取,其次描述非遺視頻的語義內(nèi)容,梳理出非遺視頻知識(shí)相關(guān)概念及屬性關(guān)系,構(gòu)建非遺視頻知識(shí)間的關(guān)聯(lián)關(guān)系,以展示非遺視頻之間的顯性及隱性關(guān)系,再次基于這種關(guān)聯(lián)關(guān)系為用戶提供知識(shí)共享及智能應(yīng)用等服務(wù).
本文構(gòu)建的非遺視頻本體庫,將本體內(nèi)各實(shí)體對(duì)象形成關(guān)聯(lián),通過Web向用戶提供智能知識(shí)服務(wù).借助非遺視頻知識(shí)庫建設(shè),讓非遺知識(shí)得到進(jìn)一步傳承和保護(hù).非遺視頻知識(shí)組織的構(gòu)建,向大眾提供知識(shí)共享和智能應(yīng)用,不僅能夠促進(jìn)非遺知識(shí)行業(yè)化和規(guī)范化發(fā)展,而且還能實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)的互聯(lián)、共享及創(chuàng)新發(fā)展.基于語義描述的知識(shí)組織研究為數(shù)字人文環(huán)境下我國優(yōu)秀傳統(tǒng)文化發(fā)展提供了新思路,為非遺知識(shí)組織和創(chuàng)新服務(wù)提供了借鑒.
雖然本文對(duì)非遺視頻資源的特征分析、鏡頭分割、關(guān)鍵幀抽取、本體構(gòu)建、數(shù)據(jù)關(guān)聯(lián)及發(fā)布等內(nèi)容展開研究,但非遺視頻本體的相關(guān)概念、屬性及知識(shí)元提取的顆粒度還需進(jìn)一步細(xì)化,本體模型也有待完善.后續(xù)研究將搜集更多的多源異構(gòu)非遺數(shù)字資源,包括文本、圖像、音頻等數(shù)據(jù),擴(kuò)展本體資源庫,深挖非遺實(shí)體、概念及知識(shí)間的關(guān)聯(lián)關(guān)系,進(jìn)一步豐富非遺知識(shí)庫,促進(jìn)非遺的數(shù)字化保護(hù)與智能傳播.