[摘 要]隨著大數(shù)據(jù)時(shí)代的到來(lái),非物質(zhì)文化遺產(chǎn)(以下簡(jiǎn)稱(chēng)\"非遺\")的信息來(lái)源、數(shù)據(jù)量以及傳播渠道正發(fā)生著深刻的變化,大數(shù)據(jù)技術(shù)的成熟使得挖掘非遺更深層次的價(jià)值成為可能;同時(shí)在大數(shù)據(jù)時(shí)代下,更廣泛的挖掘非遺的價(jià)值和內(nèi)涵也是非遺工作者義不容辭的責(zé)任;本文針對(duì)當(dāng)前非遺數(shù)字化工作的現(xiàn)狀進(jìn)行了分析,以及大數(shù)據(jù)對(duì)當(dāng)今社會(huì)信息化進(jìn)程的巨大影響,并從三方面對(duì)大數(shù)據(jù)背景下的非遺數(shù)字化建設(shè)進(jìn)行探討。
[關(guān)鍵詞]大數(shù)據(jù) 非遺 數(shù)字化 信息
一、何謂大數(shù)據(jù)
所謂大數(shù)據(jù)其實(shí)就是用數(shù)學(xué)建模的方法對(duì)海量數(shù)據(jù)進(jìn)行建模、挖掘和分析,從而發(fā)現(xiàn)事物的潛在發(fā)展規(guī)律以及和其他事物之間的相互關(guān)系,并對(duì)未來(lái)進(jìn)行預(yù)測(cè)的方法。
大數(shù)據(jù)時(shí)代正在催生的最大技術(shù)和社會(huì)變革,是重新構(gòu)造互聯(lián)網(wǎng),現(xiàn)有的互聯(lián)網(wǎng)將從網(wǎng)頁(yè)連接發(fā)展到數(shù)據(jù)“聯(lián)接”,互聯(lián)網(wǎng)將發(fā)展成為數(shù)據(jù)網(wǎng)。在互聯(lián)網(wǎng)時(shí)代,互聯(lián)網(wǎng)上每天都產(chǎn)生出海量的數(shù)據(jù),一方面極大的拓展了人們獲取信息的廣度和深度,而另一方面,面對(duì)海量的數(shù)據(jù),人們基本還是靠檢索再篩選的方式來(lái)獲取信息,在信息迅速膨脹的今天這種方式越來(lái)越不合時(shí)宜了,因此信息的采集、處理、傳播以及展現(xiàn)方式必須向更高層次演變;信息共享、交流互動(dòng)已經(jīng)不再是目前最迫切的需求,數(shù)據(jù)的分析和整合,以及讓數(shù)據(jù)更加智能,才是最大的挑戰(zhàn)。下面通過(guò)一個(gè)非常著名的大數(shù)據(jù)分析的案例來(lái)了解什么是大數(shù)據(jù):
2009年上半年,Google通過(guò)分析5000萬(wàn)條美國(guó)人最頻繁檢索的詞匯,將之和美國(guó)疾病中心在2003年到2008年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,并建立一個(gè)特定的數(shù)學(xué)模型。最終google成功預(yù)測(cè)了2009冬季流感的傳播時(shí)間甚至可以具體到特定的地區(qū)和州。
使用傳統(tǒng)的信息處理方法,人們無(wú)法從數(shù)據(jù)庫(kù)中檢索到未來(lái)流感爆發(fā)的任何數(shù)據(jù),但是通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,并和其他數(shù)據(jù)進(jìn)行關(guān)聯(lián)就能準(zhǔn)確的推導(dǎo)出流感爆發(fā)的時(shí)間和地點(diǎn),這只有大數(shù)據(jù)能做到,發(fā)現(xiàn)數(shù)據(jù)下面所暗含的本質(zhì)規(guī)律,才是大數(shù)據(jù)真正的魔力所在。
二、當(dāng)前非遺數(shù)字化的現(xiàn)狀及面臨的新問(wèn)題
(一)非遺數(shù)據(jù)的迅速增加
現(xiàn)代信息化技術(shù)可將非遺檔案,如現(xiàn)場(chǎng)演出、歷史照片、歷史影像、藝術(shù)圖片等編輯轉(zhuǎn)化為數(shù)字化格式完整保存,甚至是鼓聲、吟唱、音樂(lè)等非語(yǔ)言類(lèi)或者某種技能和手藝等,都可用多媒體技術(shù)記錄和表達(dá)。和文物檔案管理不同,非遺的活態(tài)流變性決定了非遺檔案的持續(xù)更新性,因此隨著非遺工作的不斷深入發(fā)展,會(huì)不斷產(chǎn)生大量數(shù)據(jù)。
信息化社會(huì)的今天,人們的每項(xiàng)日?;顒?dòng)都會(huì)產(chǎn)生大量數(shù)據(jù),例如在深圳,每年都會(huì)有各級(jí)非遺名錄申報(bào)、傳承人認(rèn)定,更有非遺各類(lèi)常態(tài)性宣傳活動(dòng)、督查及普查調(diào)研等,這些繁瑣的非遺事項(xiàng)都會(huì)產(chǎn)生大量數(shù)據(jù),如何將這些數(shù)據(jù)安全且有效的存儲(chǔ)、管理、提取,將是擺在非遺工作者面前的一個(gè)重要工作。隨著時(shí)間的積累,預(yù)計(jì)3-5年之后,非遺數(shù)據(jù)的規(guī)模將是海量級(jí)的,而且數(shù)據(jù)形態(tài)、業(yè)務(wù)模型也是多種多樣的,倘若沒(méi)有建立起有效的海量數(shù)據(jù)管理平臺(tái),那么將來(lái)發(fā)掘非遺數(shù)據(jù)就猶如大海撈針。
(二)非遺數(shù)據(jù)挖掘能力不足,難以發(fā)現(xiàn)更多有價(jià)值的內(nèi)容
目前,非遺信息包括文圖、音視頻等數(shù)據(jù)都能夠按目錄完整保存,但這些數(shù)據(jù)是靜止孤立的,數(shù)據(jù)與數(shù)據(jù)之間缺乏關(guān)聯(lián)性,就如同一個(gè)個(gè)“信息孤島”,很難發(fā)現(xiàn)其共同特征和內(nèi)在聯(lián)系。
例如,深圳目前建立的59個(gè)市級(jí)以上非遺代表性名錄,有很大一部分都與客家文化息息相關(guān),證明客家文化對(duì)深圳非遺有著極為重要的意義,如舞獅、舞麒麟、山歌、涼帽制作、傳統(tǒng)食品制作、祭祀等有關(guān)項(xiàng)目都體現(xiàn)了客家文化在深圳以非遺的形態(tài)續(xù)存;但是這些非遺歷史文化的共通性,傳衍的規(guī)律,傳承人的祖籍分布特征、性格特征,深圳非遺的客家文化和外地非遺客家文化之間的差異,以及行成這些差異的原因和其背后的政治、經(jīng)濟(jì)、社會(huì)等起作用的因素等,都無(wú)法分析,也難以對(duì)深圳非遺的客家文化缺失部分進(jìn)行推理和修補(bǔ),以及對(duì)未來(lái)非遺保護(hù)提供積極的指導(dǎo)意見(jiàn)。
(三)非遺數(shù)據(jù)互動(dòng)性不足
非遺檔案不同于傳統(tǒng)檔案,傳統(tǒng)檔案有著一定的保密性,而絕大多數(shù)非遺檔案,其信息話(huà)建設(shè)的最終目的是保護(hù)、展現(xiàn)、共享、傳播和傳承珍貴的非遺資源。有效的將非遺數(shù)據(jù)傳播出去,展現(xiàn)出來(lái),并和熱衷于非遺文化的群眾產(chǎn)生良好的互動(dòng),是非遺保護(hù)工作的核心之一;近年來(lái),非遺檔案的社會(huì)需求越來(lái)越旺盛,需求者的來(lái)源也越來(lái)越廣泛,既有文化遺產(chǎn)愛(ài)好者,也有科研學(xué)者,甚至普通群眾,都渴望近距離了解非遺;同時(shí),民眾的個(gè)人素質(zhì)和鑒賞力也在不斷提高,他們已不再滿(mǎn)足接收靜態(tài)的圖文信息,更希望欣賞音視頻等多媒體資源;雖然目前非遺信息都可用文字以及多媒體形式保存,但對(duì)外提供服務(wù)的能力卻很有限,一些非遺檔案還處于“隱蔽”狀態(tài),不僅不為外界所知,更無(wú)法和群眾產(chǎn)生互動(dòng)。這些珍貴的非遺數(shù)據(jù)靜靜的躺在檔案室就是極大的浪費(fèi)。充分利用現(xiàn)有的非遺檔案,對(duì)外提供豐富多彩的服務(wù),并與群眾產(chǎn)生良好的互動(dòng),只有這樣,非遺才能得到更好的弘揚(yáng)。
三、大數(shù)據(jù)環(huán)境下非遺的數(shù)字化建設(shè)
互聯(lián)網(wǎng)信息化尤其是大數(shù)據(jù)的發(fā)展,為我們解決非遺信息化建設(shè)過(guò)程中遇到的難題提供了契機(jī)。大數(shù)據(jù)環(huán)境下的非遺數(shù)據(jù)建設(shè),要以非遺相關(guān)信息的數(shù)字化處理為前提,通過(guò)揭示海量信息資源的內(nèi)容和特征以及信息的相互關(guān)系體系構(gòu)建規(guī)范、開(kāi)放的信息資源系統(tǒng),為非遺的傳播、保護(hù)、研究提供強(qiáng)大的信息資源支撐。
(一) 充分了解非遺的信息屬性
大數(shù)據(jù)環(huán)境中,非遺的數(shù)據(jù)信息應(yīng)當(dāng)以即時(shí)更新、海量、復(fù)雜關(guān)系模式的信息數(shù)據(jù)形式存在;非遺資源非常豐富,分為民間文學(xué)、傳統(tǒng)音樂(lè)、曲藝、傳統(tǒng)技藝、傳統(tǒng)醫(yī)藥、民俗等十類(lèi);而描述每一個(gè)具體非遺的方式也是多方面的,包括:非遺項(xiàng)目的產(chǎn)生、發(fā)展、演變的歷史過(guò)程;非遺項(xiàng)目標(biāo)識(shí)性載體和表現(xiàn)形式,非遺傳承人情況;非遺的實(shí)物檔案,如工藝品、媒介、工具等實(shí)物;非遺的記憶檔案,反映非遺活動(dòng)的檔案資料、文獻(xiàn)資料;以及在網(wǎng)絡(luò)媒介中存在的資源信息的總和。這些數(shù)據(jù)都是以信息的形式傳輸并匯聚在各個(gè)節(jié)點(diǎn)中,并且這些信息可以被搜集、分析、挖掘、檢索、加工、傳播。如果充分利用好非遺的信息屬性,并將這些屬性進(jìn)行標(biāo)準(zhǔn)化描述,那么非遺將會(huì)以更清晰的形態(tài)存在。
(二) 建立統(tǒng)一的非遺信息描述技術(shù)標(biāo)準(zhǔn)——語(yǔ)義描述
由于非遺數(shù)據(jù)的多樣性、復(fù)雜性,因此建立統(tǒng)一、標(biāo)準(zhǔn)化的規(guī)范來(lái)描述非遺信息,可極大提高海量信息的處理能力、資源共享能力以及資源被搜索、傳播的能力。
為非遺建立統(tǒng)一的信息描述技術(shù)標(biāo)準(zhǔn)就是對(duì)非遺數(shù)據(jù)進(jìn)行語(yǔ)義化,所謂語(yǔ)義,就是遵循一個(gè)統(tǒng)一的標(biāo)準(zhǔn),給每一片信息賦予一個(gè)計(jì)算機(jī)都能理解的意義,這個(gè)標(biāo)準(zhǔn)的意義,用術(shù)語(yǔ)說(shuō)就是“元數(shù)據(jù)”,也可以形象的理解為給信息貼上各種標(biāo)準(zhǔn)化的“標(biāo)簽”。這樣數(shù)據(jù)將像網(wǎng)頁(yè)一樣,成為資源組織的單位。一個(gè)數(shù)據(jù)可以獲得一個(gè)地址,還有統(tǒng)一的語(yǔ)義對(duì)它進(jìn)行描述。
這樣語(yǔ)義上的數(shù)據(jù),就不再是一個(gè)冰冷的數(shù)字,而是一個(gè)活的“細(xì)胞”,它可以被定位,還擁有和其他數(shù)據(jù)語(yǔ)義一致的標(biāo)簽,這意味著它可以和其他數(shù)據(jù)相聯(lián),之所以稱(chēng)為相“聯(lián)”,而不是相“連”,是因?yàn)?,它們并不是像網(wǎng)頁(yè)一樣通過(guò)一個(gè)鏈接簡(jiǎn)單連在一起,而是通過(guò)數(shù)據(jù)之間內(nèi)在的關(guān)系掛起鉤來(lái),“聯(lián)”在一起。這種關(guān)系是基于數(shù)據(jù)的含義和屬性產(chǎn)生的。對(duì)用戶(hù)而言,這意味著可以從一片數(shù)據(jù)跳轉(zhuǎn)到其他數(shù)據(jù),這個(gè)跳轉(zhuǎn),依靠的不是人為的鏈接,而是本質(zhì)關(guān)系上的聯(lián)接。
當(dāng)然,對(duì)非遺語(yǔ)義的建設(shè)并非一日之功,首先大量關(guān)于元數(shù)據(jù)的標(biāo)準(zhǔn)需要統(tǒng)一制定,只有通過(guò)這些計(jì)算機(jī)能夠理解的語(yǔ)義標(biāo)記,每一個(gè)數(shù)據(jù)才能和其他數(shù)據(jù)自動(dòng)發(fā)生聯(lián)系,整合成聯(lián)接關(guān)系。因此,非遺大數(shù)據(jù)的建設(shè),制定元數(shù)據(jù)是前提。
(三) 重視大數(shù)據(jù)時(shí)代非遺數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)建設(shè)
數(shù)據(jù)庫(kù)是數(shù)據(jù)匯聚、分析和分發(fā)的基礎(chǔ)和核心,非遺數(shù)據(jù)庫(kù)的建設(shè)對(duì)于非遺信息化的建設(shè)至關(guān)重要,在大數(shù)據(jù)時(shí)代,非遺信息的匯聚、處理、傳播方式正發(fā)生著深刻的變化,因此也要求非遺數(shù)據(jù)庫(kù)一定能夠支撐上層的大數(shù)據(jù)服務(wù);在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的存儲(chǔ)不再是單一的關(guān)系型數(shù)據(jù)表,而是關(guān)系型數(shù)據(jù)和非關(guān)系型數(shù)據(jù)并存,靈活的信息存儲(chǔ)方式就意味著靈活的業(yè)務(wù)模型,豐富的業(yè)務(wù)展現(xiàn)方式以及交互式的信息。可以預(yù)計(jì),隨著數(shù)據(jù)的海量級(jí)增長(zhǎng),很多日常工作單靠人工已經(jīng)不能完成,因此更高一級(jí)的數(shù)據(jù)分析能力,如圖片智能識(shí)別、視頻分析、視頻智能檢索等都將在非遺產(chǎn)業(yè)中展開(kāi)。
四 結(jié)語(yǔ)
非遺作為一種特殊的信息存在方式,其信息屬性決定了非遺的保護(hù)和傳承的核心就是如何充分利用各種手段對(duì)數(shù)據(jù)進(jìn)行記錄、處理和傳播;而在大數(shù)據(jù)時(shí)代,新的思維和技術(shù)為非物質(zhì)文化遺產(chǎn)提供了更廣闊的展現(xiàn)平臺(tái),改變了傳統(tǒng)信息傳播的途徑和方式,不僅能夠使得匯聚海量數(shù)據(jù)成為可能,還能夠?yàn)榉沁z項(xiàng)目和其他文化特征之間建立廣泛的聯(lián)系,進(jìn)一步挖掘非遺潛在的尚不為人知的價(jià)值,并以豐富多彩的形式和廣大群眾產(chǎn)生互動(dòng),真正實(shí)現(xiàn)“人人都是文化遺產(chǎn)的主人”。
參考文獻(xiàn):
〔1〕宋俊華 王明月.我國(guó)非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù)的現(xiàn)狀與問(wèn)題分析.文化遺產(chǎn),2015(6):P1-9;
〔2〕維克托·邁爾-舍恩伯格 肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代.浙江人民出版社,2013(1):P135-169。
作者簡(jiǎn)介:蘇小雨(1982--),女,本科,館員,研究方向:非物質(zhì)文化遺產(chǎn)保護(hù),現(xiàn)任職深圳博物館(深圳市非物質(zhì)文化遺產(chǎn)保護(hù)中心)。