王琳珠
摘要:隨著數(shù)字技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,學(xué)者對(duì)家譜數(shù)字化的研究積極拓展,中國(guó)傳統(tǒng)家譜的豐厚內(nèi)容和內(nèi)在價(jià)值不斷被挖掘。依托于網(wǎng)絡(luò)、信息技術(shù)構(gòu)建的家譜平臺(tái)可以大量存儲(chǔ)、分析數(shù)據(jù)、人性化互動(dòng)、趣味性呈現(xiàn)。本文從近年來(lái)我國(guó)傳統(tǒng)家譜數(shù)字化的發(fā)展進(jìn)程為出發(fā)點(diǎn),對(duì)現(xiàn)階段家譜數(shù)字化的實(shí)踐成果進(jìn)行分析,指出發(fā)展過(guò)程中的問(wèn)題,并提出相應(yīng)的對(duì)策。
關(guān)鍵詞:傳統(tǒng)家譜;數(shù)字化;發(fā)展進(jìn)程
家譜又稱(chēng)為宗譜、族譜,以一種表譜的形式記載著一個(gè)家族的世系繁衍及重要人物事跡的特殊文獻(xiàn)形態(tài),可以集合文、表、圖、畫(huà)等元素為一體,展現(xiàn)基于同一血緣關(guān)系的家族發(fā)展脈絡(luò)及大事記。“家譜數(shù)字化就是采用計(jì)算機(jī)技術(shù),將常見(jiàn)的文字或圖形符號(hào)轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),從而制成家譜書(shū)目數(shù)據(jù)庫(kù)和家譜全文數(shù)據(jù)庫(kù),用以揭示家譜中所蘊(yùn)涵的極其豐富的信息資源,從而達(dá)到保護(hù)和利用家譜的目的”。結(jié)合目前學(xué)界的研究成果,家譜數(shù)字化的實(shí)踐成果主要表現(xiàn)在家譜書(shū)目數(shù)據(jù)庫(kù)、家譜全文數(shù)據(jù)庫(kù)、家譜網(wǎng)站以及家譜軟件的建立和開(kāi)發(fā)。
一、傳統(tǒng)家譜數(shù)字化的實(shí)踐成果研究
(一)家譜數(shù)據(jù)庫(kù)的建立
根據(jù)不同的內(nèi)容主體,家譜數(shù)據(jù)庫(kù)的建立主要分為家譜書(shū)目數(shù)據(jù)庫(kù)和家譜全文數(shù)據(jù)庫(kù)。從20世紀(jì)90年代,國(guó)內(nèi)的各大圖書(shū)館開(kāi)始作為主導(dǎo)機(jī)構(gòu)建立家譜書(shū)目數(shù)據(jù)庫(kù),隨著技術(shù)的發(fā)展和前期家譜書(shū)目數(shù)據(jù)庫(kù)的基礎(chǔ),家譜全文影像數(shù)據(jù)庫(kù)以家譜全文作為揭示對(duì)象,形成了可儲(chǔ)存、可檢索、可量化的家譜信息資源。
家譜書(shū)目數(shù)據(jù)庫(kù)初建,上海圖書(shū)館建立的“家譜書(shū)目查詢(xún)”數(shù)據(jù)庫(kù)是當(dāng)時(shí)數(shù)據(jù)量最大的家譜書(shū)目數(shù)據(jù)庫(kù),數(shù)據(jù)量高達(dá)17041條。上海圖書(shū)館在家譜數(shù)字化道路上的探索并不僅局限于某一地區(qū)的書(shū)目數(shù)據(jù)庫(kù)的建立,其當(dāng)時(shí)的目標(biāo)是我國(guó)的家譜聯(lián)合目錄、人名信息數(shù)據(jù)庫(kù)以及全文數(shù)據(jù)庫(kù)。中國(guó)國(guó)家圖書(shū)館建立的“地方志家譜書(shū)目”數(shù)據(jù)庫(kù)收錄的信息數(shù)量?jī)H次于上海圖書(shū)館,其建立目標(biāo)是集全文文本、影像、書(shū)目等資源瀏覽、檢索功能為一身的地方志家譜數(shù)據(jù)庫(kù)。
與家譜書(shū)目數(shù)據(jù)庫(kù)相比,家譜全文數(shù)據(jù)庫(kù)收錄的則是家譜全文內(nèi)容,也是在家譜書(shū)目數(shù)據(jù)庫(kù)基礎(chǔ)上的進(jìn)一步探索,如中國(guó)國(guó)家圖書(shū)館家譜庫(kù)、中國(guó)國(guó)家圖書(shū)館徽州善本家譜、上圖家譜等。由于家譜全文數(shù)據(jù)量過(guò)大且繁雜,收錄難度較大,其發(fā)展速度一直沒(méi)有家譜書(shū)目數(shù)據(jù)庫(kù)快。
在現(xiàn)代技術(shù)的支撐下,2018年6月,中國(guó)農(nóng)村數(shù)據(jù)庫(kù)的一個(gè)子數(shù)據(jù)庫(kù)“中國(guó)家譜族譜數(shù)據(jù)庫(kù)”正式與公眾見(jiàn)面,成為全球目前電子化家譜族譜資料收錄最多的數(shù)據(jù)庫(kù),可達(dá)8.44TB,共17723冊(cè),120893卷。與20世紀(jì)建成的家譜數(shù)據(jù)庫(kù)相比,該數(shù)據(jù)庫(kù)具有收錄家譜信息多樣化、時(shí)間跨度大、姓氏涵蓋全、地域覆蓋廣的特點(diǎn),網(wǎng)絡(luò)訪問(wèn)者可通過(guò)關(guān)鍵字詞、標(biāo)簽化處理,直接在搜索框輸入相關(guān)信息,一鍵獲取相關(guān)家譜資料,實(shí)現(xiàn)對(duì)資料的精確查詢(xún),也可通過(guò)設(shè)定具體地區(qū)、年份、姓氏等不同篩選條件的限制,找出自己所需要的系列家譜,并且得出相應(yīng)的數(shù)量統(tǒng)計(jì)。
(二)家譜網(wǎng)站及軟件的開(kāi)發(fā)
家譜數(shù)字化的應(yīng)用開(kāi)發(fā)主要表現(xiàn)為家譜網(wǎng)站的建立,隨著后來(lái)移動(dòng)互聯(lián)的到來(lái),家譜移動(dòng)軟件的開(kāi)發(fā)應(yīng)用也逐漸火熱。在當(dāng)下應(yīng)用較廣的有“家譜先生”“天下家譜”“族脈家譜”等。這些軟件可以滿(mǎn)足人們新修、續(xù)修、改修家譜,強(qiáng)化了傳統(tǒng)家譜的內(nèi)容管理、修繕效率、傳播效果等。就家譜網(wǎng)站而言,對(duì)家譜信息做改動(dòng)的權(quán)利仍然沒(méi)有開(kāi)放,目前還只是通過(guò)后臺(tái)編輯人員進(jìn)行具體操作。家譜移動(dòng)軟件相對(duì)而言,增強(qiáng)了個(gè)人在家譜信息完善方面的主體性,主要的運(yùn)作思維還是通過(guò)應(yīng)用軟件的社交性來(lái)得以實(shí)現(xiàn),由于受家譜信息私密性較強(qiáng)的特殊屬性,其傳播廣度仍然不是很大。此外,家譜應(yīng)用軟件的受眾使用率還不是很高,觸及用戶(hù)有效率較低,一般都是出于好奇、有趣等心理,下載了解一下,更不用提及這些家譜應(yīng)用軟件的用戶(hù)粘度。
二、傳統(tǒng)家譜數(shù)字化的技術(shù)支撐概述
(一)關(guān)聯(lián)數(shù)據(jù)技術(shù)
關(guān)聯(lián)數(shù)據(jù)技術(shù)在家譜數(shù)字化的運(yùn)用中,能夠打破數(shù)據(jù)庫(kù)資源中的間隔,實(shí)現(xiàn)各個(gè)數(shù)據(jù)庫(kù)之間、各個(gè)數(shù)據(jù)之間的有機(jī)連接,從而提高用戶(hù)在訪問(wèn)家譜網(wǎng)站主頁(yè)時(shí)的檢索效率和信息獲取量。這一技術(shù)的應(yīng)用也適應(yīng)了家譜內(nèi)容繁雜、數(shù)量龐大的特點(diǎn)。
(二)GIS技術(shù)
GIS是一種特定的空間信息系統(tǒng)。其技術(shù)原理是通過(guò)對(duì)空間中的相關(guān)地理分布數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、處理、分析、描述和顯示。GIS在不斷發(fā)展的計(jì)算機(jī)硬件、軟件技術(shù)的支持下,被應(yīng)用到各種專(zhuān)業(yè)化領(lǐng)域中,其逐漸社會(huì)化應(yīng)用的發(fā)展,為推動(dòng)家譜數(shù)字化進(jìn)程提供了充足的技術(shù)支撐。如家譜內(nèi)容中人們的活動(dòng)和變動(dòng)都發(fā)生在一定的空間環(huán)境中,實(shí)現(xiàn)一個(gè)姓氏的空間分布展示、捕捉家族生活軌跡,進(jìn)而分析和深入挖掘一個(gè)家族的起源和發(fā)展概況,GIS技術(shù)可以提供準(zhǔn)確且高效的技術(shù)基礎(chǔ)。
(三)文本挖掘技術(shù)
文本挖掘技術(shù)是從非結(jié)構(gòu)化文本中抽取目標(biāo)信息,從而將還沒(méi)有使用過(guò)的文本中獲取未知、有價(jià)值的知識(shí),其涉及信息抽取、信息檢索、數(shù)據(jù)挖掘、文本分析等多種技術(shù)。將文本挖掘技術(shù)應(yīng)用在家譜數(shù)字化的探索中,提取傳統(tǒng)家譜中的人物關(guān)系、家族關(guān)系、大事記等,將家譜檔案中的姓名、地點(diǎn)、時(shí)間等元素加以結(jié)構(gòu)化,從而實(shí)現(xiàn)家譜信息的有機(jī)連接,提高用戶(hù)檢索信息的效率,深化家譜內(nèi)容的挖掘深度。
(四)信息檢索技術(shù)
檢索是獲得信息的捷徑。信息檢索技術(shù)在圖書(shū)館數(shù)據(jù)庫(kù)建設(shè)、資源查詢(xún)中應(yīng)用廣泛,以一定的組織形式將大量的無(wú)規(guī)律的文本內(nèi)容按照一定的規(guī)律或規(guī)范組織起來(lái),也是一種過(guò)濾機(jī)制,在大量的數(shù)據(jù)中準(zhǔn)確快速地獲取用戶(hù)的目標(biāo)數(shù)據(jù),它就像是對(duì)圖書(shū)館中每本書(shū)籍上進(jìn)行統(tǒng)一規(guī)范地編碼,按照一定書(shū)序進(jìn)行排列后,讀者在同一編碼類(lèi)型的書(shū)架上可以找到相應(yīng)的書(shū)籍。家譜數(shù)字化的實(shí)現(xiàn),信息檢索是用戶(hù)獲得家譜信息的一個(gè)人口,輸入關(guān)鍵字、關(guān)鍵詞可以在數(shù)據(jù)庫(kù)收錄的信息中找到自己想要獲得的內(nèi)容。
家譜數(shù)字化建設(shè)中除了以上的技術(shù)支持以外,還可以通過(guò)現(xiàn)有的技術(shù)軟件進(jìn)行家譜信息的呈現(xiàn),如方正德賽DESI系統(tǒng)軟件、思維導(dǎo)圖軟件Freeplane以及Excel工作表。另外,由于家譜本身蘊(yùn)含的資源豐富,其挖掘出的數(shù)據(jù)類(lèi)型與多學(xué)科都有聯(lián)系,如醫(yī)學(xué)、倫理學(xué)、生物學(xué)、情報(bào)學(xué)、政治學(xué)、史學(xué),本文只是關(guān)注現(xiàn)有的傳統(tǒng)家譜數(shù)據(jù)中的文本可以數(shù)字化呈現(xiàn),并沒(méi)有針對(duì)某一研究領(lǐng)域?qū)易V數(shù)字化的實(shí)現(xiàn)技術(shù)作詳細(xì)闡述。
三、傳統(tǒng)家譜數(shù)字化發(fā)展進(jìn)程中的問(wèn)題探析
(一)家譜內(nèi)容的挖掘深度不夠
家譜本身包含的內(nèi)容龐雜,如一個(gè)家族的人物關(guān)系,各個(gè)家族的連系,著名人物事跡以及其中包含的姓名、年代、地點(diǎn)等元素。基于文本挖掘技術(shù)的家譜信息數(shù)據(jù)采集具有較大的難度。因此,就目前已有的家譜數(shù)字化的實(shí)踐成果而言,還存在對(duì)家譜內(nèi)容的挖掘深度不夠,如家譜檔案館重點(diǎn)建設(shè)的骨干網(wǎng)站“家譜數(shù)據(jù)庫(kù)”作為國(guó)內(nèi)最早建設(shè)的為公眾提供家譜查詢(xún)的網(wǎng)站,界面上設(shè)置了“首頁(yè)”“讀者來(lái)信”“家譜知識(shí)”等6個(gè)欄目,收錄的數(shù)據(jù)數(shù)量也較少,6個(gè)欄目中只有讀者來(lái)信更新著一條信息,其他下設(shè)欄目中都為空。對(duì)家譜相關(guān)資源的挖掘深度不夠是當(dāng)下數(shù)字化家譜網(wǎng)站、軟件的共性問(wèn)題。
(二)家譜數(shù)字化建設(shè)資金鏈薄弱
家譜數(shù)字化的實(shí)現(xiàn)需要持續(xù)且大量的技術(shù)支撐、資金支持,但是有些地區(qū)的政府在家譜數(shù)字化建設(shè)方面的經(jīng)費(fèi)比較緊缺,出現(xiàn)財(cái)力投入不足的問(wèn)題,從而減緩了家譜數(shù)字化的進(jìn)程。
(三)家譜網(wǎng)站、軟件設(shè)計(jì)單一,缺乏運(yùn)營(yíng)意識(shí)
目前已有的家譜網(wǎng)站也比較多,各個(gè)省市主辦的、個(gè)人資源建立的都有,但是普遍存在收錄信息不完整,仍然停留在對(duì)姓氏地域分布、姓氏來(lái)源等方面的普及性知識(shí),沒(méi)有進(jìn)行針對(duì)用戶(hù)的個(gè)性化查詢(xún)?cè)O(shè)計(jì)。另外,家譜網(wǎng)站、軟件的界面設(shè)計(jì)較為簡(jiǎn)單,缺乏設(shè)計(jì)美感,對(duì)家譜的可視化呈現(xiàn)程度仍然較低。在家譜網(wǎng)站、軟件的運(yùn)營(yíng)方面,做不到及時(shí)的數(shù)據(jù)更新,家譜網(wǎng)站提供的信息服務(wù),家譜軟件的功能升級(jí)處于較為低級(jí)的層面。
四、傳統(tǒng)家譜數(shù)字化的發(fā)展前景分析
(一)家譜數(shù)字化的建設(shè)需求升級(jí)
家譜可視化趨勢(shì)不可逆轉(zhuǎn),我國(guó)相關(guān)機(jī)構(gòu)應(yīng)在家譜數(shù)字化的推進(jìn)中一定會(huì)投入更多支持。筆者認(rèn)為主要有以下兩個(gè)方面的原因:
出于對(duì)中華民族優(yōu)秀文化資源的保護(hù)與傳承。家譜作為中國(guó)特有的一種文化資源,其中蘊(yùn)藏著深厚的文底蘊(yùn),是中華民族優(yōu)秀傳統(tǒng)文化的傳播載體。習(xí)近平總書(shū)記多次強(qiáng)調(diào)對(duì)家庭、家教與家風(fēng)建設(shè)的重要性。我國(guó)的傳統(tǒng)家譜中正是蘊(yùn)含著各個(gè)時(shí)代對(duì)于“家風(fēng)”不同層次、不同深度的記載內(nèi)容,充分挖掘家譜內(nèi)容,運(yùn)用現(xiàn)代人們喜聞樂(lè)見(jiàn)的方式加以呈現(xiàn),對(duì)于現(xiàn)代家庭道德建設(shè)具有重大意義。
出于對(duì)其他學(xué)科領(lǐng)域的科研實(shí)用價(jià)值的開(kāi)發(fā)。前文筆者已經(jīng)提到家譜涉及的學(xué)科多樣,史學(xué)、地理學(xué)、醫(yī)學(xué)、生物學(xué)等領(lǐng)域均有家譜的科研參考價(jià)值,對(duì)家譜的保護(hù),加強(qiáng)對(duì)家譜資源的開(kāi)發(fā)利用,就是對(duì)其他學(xué)科領(lǐng)域發(fā)展提供珍貴的理論依據(jù)和現(xiàn)實(shí)依據(jù)。
(二)以政府主導(dǎo)的家譜數(shù)字化工作機(jī)制亟待確立
目前來(lái)看,家譜數(shù)字化工作的推進(jìn)并沒(méi)有明確的工作機(jī)制,有的省市由政府主導(dǎo),有些省市以公共圖書(shū)館機(jī)構(gòu)作為支撐,還有一些省市是由個(gè)人承擔(dān)主要的工作內(nèi)容,甚至還有對(duì)家譜的保護(hù)力度不夠的現(xiàn)象,因此,建立一套由政府主導(dǎo)的家譜數(shù)字化工作機(jī)制是目前亟待解決的,政府主導(dǎo)下,無(wú)論是家譜數(shù)字化的任務(wù)下達(dá),還是在建設(shè)資金的投入,后期建設(shè)成果的維護(hù)和保障方面都是必要的。
(三)強(qiáng)化社會(huì)各界對(duì)家譜數(shù)字化的認(rèn)識(shí)深度
公眾對(duì)于家譜數(shù)字化建設(shè)的認(rèn)知度仍然不夠,家譜作為家族傳承、中華民族優(yōu)秀傳統(tǒng)文化的傳播等都有重要的作用。強(qiáng)化社會(huì)各界對(duì)家譜數(shù)字化的認(rèn)知,為后續(xù)的家譜數(shù)字化建設(shè)進(jìn)程的推動(dòng),是必要而且重要的。如家譜數(shù)字化的建設(shè)投入資金、技術(shù)支撐,都可以通過(guò)公眾的力量進(jìn)行籌備。