摘 要 基于南京圖書館圖像數(shù)字資源建設(shè)與推廣工程元數(shù)據(jù)倉(cāng)儲(chǔ)建設(shè)之間的轉(zhuǎn)換關(guān)系,論文解讀了元數(shù)據(jù)倉(cāng)儲(chǔ)圖像數(shù)字資源的制作規(guī)范,通過映射關(guān)系,重點(diǎn)介紹兩者的不同點(diǎn)并給予解決的辦法,并對(duì)轉(zhuǎn)換過程中的出現(xiàn)的一些特殊情況給出解決辦法。論文旨在為今后的元數(shù)據(jù)倉(cāng)儲(chǔ)工作積累經(jīng)驗(yàn),為南京圖書館的圖像數(shù)字資源建設(shè)提供一些可行性的改變和突破,使圖像數(shù)字資源建設(shè)更加規(guī)范化、標(biāo)準(zhǔn)化。
關(guān)鍵詞 圖像數(shù)字資源 元數(shù)據(jù)倉(cāng)儲(chǔ) 數(shù)字資源建設(shè) 數(shù)字資源建設(shè)規(guī)范
分類號(hào) G250.73
DOI 10.16810/j.cnki.1672-514X.2018.03.014
Abstract Based on the transformation relationship between the construction of image digital resources in Nanjing Library and the construction of metadata repository in the Digital Library Promotion Project, this paper interprets the production specification of the metadata repository in image digital resources. It introduces the differences between the two by the mapping relationship, and gives some solutions, as well as some special cases in the process of transformation. The aim is to accumulate experience for the construction of metadata repository in future, and provide some feasible changes and breakthroughs for the construction of digital image resources in Nanjing Library, so as to make the construction of digital image resources more further normalized and standardized.
Keywords Image digital resources. Metadata repository. Digital resources construction. Standard of digital resources construction.
元數(shù)據(jù)倉(cāng)儲(chǔ)是數(shù)字圖書館推廣工程資源聯(lián)建項(xiàng)目的首選數(shù)字資源整合方式。數(shù)字圖書館推廣工程元數(shù)據(jù)倉(cāng)儲(chǔ)建設(shè)旨在收集整理國(guó)家圖書館,國(guó)內(nèi)省、市級(jí)公共圖書館各種資源的元數(shù)據(jù),通過元數(shù)據(jù)互操作在國(guó)家圖書館形成一個(gè)結(jié)構(gòu)統(tǒng)一的元數(shù)據(jù)倉(cāng)儲(chǔ),為公眾提供對(duì)公共圖書館界各種資源集中檢索與獲取的一站式服務(wù)。完成國(guó)家圖書館、全國(guó)各級(jí)公共圖書館館藏資源元數(shù)據(jù)的匯集、整合及有效管理,實(shí)現(xiàn)各館各異構(gòu)系統(tǒng)間的元數(shù)據(jù)交換與互通互用,全面提升數(shù)字圖書館精細(xì)化服務(wù)能力與服務(wù)水平[1]。
數(shù)字圖書館推廣工程元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目的收錄對(duì)象是分布在全國(guó)各公共圖書館已發(fā)布的且擁有對(duì)象數(shù)據(jù)的本館自建數(shù)字資源,主要包括八種類型:數(shù)據(jù)庫(kù)、圖書、連續(xù)性資源、文章、圖像、音頻、視頻、網(wǎng)頁(yè)。隨著資源聯(lián)建工作的深入,收錄對(duì)象還可以細(xì)化出更多的類型,例如拓片、扇面、手稿等等。筆者以南京圖書館為例,重點(diǎn)介紹圖像數(shù)字資源元數(shù)據(jù)倉(cāng)儲(chǔ)建設(shè)。
1 圖像數(shù)字資源建設(shè)概述
隨著現(xiàn)代信息技術(shù)和新媒體技術(shù)的廣泛應(yīng)用,圖像數(shù)字資源因其直觀、生動(dòng)有趣、易于理解等特點(diǎn),被廣泛使用與傳播。根據(jù)CNNIC《第35次中國(guó)互聯(lián)網(wǎng)調(diào)查報(bào)告》 統(tǒng)計(jì)結(jié)果,在按多媒體形式分類的網(wǎng)頁(yè)情況統(tǒng)計(jì)表中,以JPG和PDF形式的網(wǎng)頁(yè)占比分別是31.5%和31.4%,兩者合計(jì)占總比例的62.9%[2]。在各館的自建數(shù)字資源中,圖像數(shù)字資源所占比重也較大。例如南京圖書館已發(fā)布的29個(gè)自建數(shù)據(jù)庫(kù)中,有15個(gè)圖像數(shù)據(jù)庫(kù)和5個(gè)圖文資料庫(kù)。在數(shù)字圖書館推廣工程網(wǎng)絡(luò)書香資源檢索平臺(tái)上,從八種類型資源檢索數(shù)據(jù)總量可以看出,圖像資源以69萬多條的發(fā)布數(shù)據(jù)遙遙領(lǐng)先于音頻和圖書資源,后兩者位居二三位,資源總量分別是29萬多條和25萬多條[4]。因此圖像數(shù)字資源的元數(shù)據(jù)倉(cāng)儲(chǔ)建設(shè)在整個(gè)元數(shù)據(jù)倉(cāng)儲(chǔ)建設(shè)中占有很大的比重。
南京圖書館自2004年組建信息資源開發(fā)部數(shù)據(jù)庫(kù)組以來,一直致力于館藏文獻(xiàn)數(shù)字化工作。2004年,南京圖書館申報(bào)并開始建設(shè)《中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)》 項(xiàng)目,先后建成中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)、抗日戰(zhàn)爭(zhēng)歷史圖片庫(kù)、百年商標(biāo)、紅色記憶、江蘇名人故居、館藏民國(guó)連環(huán)畫等多個(gè)特色專題數(shù)據(jù)庫(kù)。按照元數(shù)據(jù)著錄規(guī)范,已制作完成二十多萬條數(shù)據(jù)。從2014年開始,南京圖書館每年從中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)和抗日戰(zhàn)爭(zhēng)歷史圖片庫(kù)這兩個(gè)自建專題數(shù)據(jù)庫(kù)中選取一萬條數(shù)據(jù)來制作元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目。目前南京圖書館主要解決的問題就是圖像數(shù)字資源與圖像資源元數(shù)據(jù)倉(cāng)儲(chǔ)之間的轉(zhuǎn)換關(guān)系。
2 南京圖書館圖像數(shù)字資源與圖像數(shù)字資源元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)映射關(guān)系
元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目針對(duì)不同的數(shù)據(jù)類型制訂了不同的制作規(guī)范,各類型數(shù)據(jù)按照各自統(tǒng)一的規(guī)范制作元數(shù)據(jù)即可實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫(kù)系統(tǒng)的元數(shù)據(jù)互操作,從而方便形成一個(gè)集中、統(tǒng)一的檢索服務(wù)平臺(tái)。2015年出版發(fā)行的《公共圖書館元數(shù)據(jù)倉(cāng)儲(chǔ)編目規(guī)則》是元數(shù)據(jù)倉(cāng)儲(chǔ)制作的最新標(biāo)準(zhǔn)規(guī)范,此規(guī)則參考了DC元數(shù)據(jù)術(shù)語集、DC抽象模型和DC圖書館應(yīng)用綱要,以及數(shù)字圖書館推廣工程標(biāo)準(zhǔn)規(guī)范成果。南京圖書館自建數(shù)據(jù)庫(kù)《中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)》元數(shù)據(jù)制作也是從DC元數(shù)據(jù)(都柏林核心元數(shù)據(jù),Dublin Core Metadata)術(shù)語集中選取字段,集合本館資源特點(diǎn)在建設(shè)過程中逐漸總結(jié)出的一套標(biāo)準(zhǔn)規(guī)范。作為圖像數(shù)據(jù)類型,南京圖書館自建數(shù)據(jù)與元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目之間可以通過映射關(guān)系實(shí)現(xiàn)互操作,其映射關(guān)系的對(duì)照如表1所示。
南京圖書館在對(duì)《中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)》圖像數(shù)字資源進(jìn)行建設(shè)之初無任何可參考、可借鑒的地方,是在數(shù)據(jù)庫(kù)的建設(shè)實(shí)踐中不斷摸索出的一套規(guī)則。從兩者的映射關(guān)系中可以看出,南京圖書館的圖像資源建設(shè)標(biāo)準(zhǔn)的元素選取比較全面,涵蓋了12個(gè)核心元素和一個(gè)資源類型核心元素。兩者相同之處顯而易見,兩者最大的不同點(diǎn)在于元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目增加了對(duì)圖像資源屬性的描述字段,例如文件大小、文件分辨率、顏色、格式等字段。下文側(cè)重闡述兩者在映射時(shí)的不同點(diǎn)和需要注意的地方。
3 圖像資源字段中有關(guān)各條目語義的理解與區(qū)分
3.1 正題名及其他題名
南京圖書館自建元數(shù)據(jù)的“題名”項(xiàng)是描述圖片的名稱,是對(duì)圖片內(nèi)容的概括,基本可以和元數(shù)據(jù)倉(cāng)儲(chǔ)的“正題名”項(xiàng)直接轉(zhuǎn)換。但是元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)中還設(shè)置了一個(gè)“其他題名”項(xiàng)。主要用于著錄其他語種的題名或用于限定、補(bǔ)充、解釋正題名的題名信息。
3.2 主題詞或關(guān)鍵詞
元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)里的“主題詞或關(guān)鍵詞”項(xiàng)是用于描述資源主題內(nèi)容的受控或非受控的詞匯。在標(biāo)引時(shí)要求客觀、細(xì)致、全面,并且根據(jù)資源的內(nèi)容進(jìn)行分析概況。詞匯選擇上要具有檢索意義,以通用、常用為原則。選用主題詞標(biāo)引時(shí)應(yīng)與主題概念相對(duì)應(yīng),并選用具有最小粒度的語義。選取數(shù)量不應(yīng)超過十個(gè)。南京圖書館當(dāng)初在制作元數(shù)據(jù)時(shí),因?yàn)闊o可借鑒的實(shí)例,關(guān)于“關(guān)鍵詞”項(xiàng)采用的是主題詞和自由詞相結(jié)合的方式,并總結(jié)出了一張關(guān)鍵詞表,主要揭示圖片的主體內(nèi)容,數(shù)量不超過四個(gè)。因此在制作元數(shù)據(jù)倉(cāng)儲(chǔ)時(shí),此字段與元數(shù)據(jù)倉(cāng)儲(chǔ)編目規(guī)則要求略有不符,需要標(biāo)引人員針對(duì)每一張圖片,根據(jù)圖片所包含的內(nèi)容盡量完整、全面的標(biāo)引出相關(guān)主題詞和關(guān)鍵詞。舉例如下。
例1:南京圖書館自建數(shù)據(jù)中對(duì)于孫中山發(fā)布的政令著錄題名:孫中山頒佈剪除盜賊以利民生令;關(guān)鍵詞:政令;孫中山。而在元數(shù)據(jù)倉(cāng)儲(chǔ)規(guī)范標(biāo)準(zhǔn)要求中著錄的正題名:孫中山頒佈剪除盜賊以利民生令;關(guān)鍵詞或主題詞:孫中山;政令;民生;盜賊;社會(huì)治安。
例2:南京圖書館對(duì)國(guó)民政府中央銀行發(fā)行壹元法幣圖像的著錄題名:中央銀行發(fā)行的壹元法幣(寳鼎)背面;關(guān)鍵詞:金融。而元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)規(guī)范準(zhǔn)要求中著錄的正題名:中央銀行發(fā)行的壹元法幣(寳鼎)背面;主題詞或關(guān)鍵詞:金融;錢幣;中央銀行;壹元;法幣。
從以上兩個(gè)例子可以看出,南京圖書館制作的元數(shù)據(jù)關(guān)鍵詞比較簡(jiǎn)單、概括,不能滿足元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)所要求的全面、細(xì)致、完整的標(biāo)引需求,需要標(biāo)引人員逐條加以人工標(biāo)引。
3.3 編目分類
南京圖書館自建元數(shù)據(jù)“分類名”的制作主要根據(jù)原文獻(xiàn)的專題來劃分,主要包括政治、經(jīng)濟(jì)、軍事、文化、科技、教育、體育、宗教、法律、人物、建筑、風(fēng)俗、廣告、醫(yī)藥衛(wèi)生、歷史地理這15個(gè)大類。另外下設(shè)了一個(gè)“子類”,分類名不超過兩個(gè),子類用于填寫第一個(gè)分類名的下位詞。分類時(shí),首先需要將文字的分類名轉(zhuǎn)換成標(biāo)準(zhǔn)的依據(jù)《中國(guó)圖書館分類法(第五版)》 的字母數(shù)字型的分類號(hào);其次,標(biāo)引人員需綜合考慮分類名、子類及圖片內(nèi)容屬性等多方面的因素,全面客觀地選取分類號(hào),并能與主題詞或關(guān)鍵詞字段相對(duì)應(yīng)。
例:自建數(shù)據(jù)庫(kù)著錄
題名:邳縣城皇廟遺址
內(nèi)容摘要:邳縣城皇廟遺址,1938年2月,邳縣抗日青年救國(guó)團(tuán)在此成立。
分類名:全民抗戰(zhàn)
子類:民眾
元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn):
正題名:邳縣城皇廟遺址
內(nèi)容摘要:邳縣城皇廟遺址,1938年2月,邳縣抗日青年救國(guó)團(tuán)在此成立。
主題詞或關(guān)鍵詞:古蹟;邳縣;城隍廟;抗日青年救國(guó)團(tuán)
中圖分類:K928.7;K265
3.4 責(zé)任者名稱
元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)項(xiàng)目里的“責(zé)任者名稱”主要是專指照片的拍攝者、書畫作品的書寫者或者繪制者。這與南京圖書館自建元數(shù)據(jù)的“內(nèi)容創(chuàng)建者”有所區(qū)別。南京圖書館自建數(shù)字資源時(shí)內(nèi)容類型為“照片”,因此內(nèi)容創(chuàng)建者字段大多錄入照片的拍攝者,但是元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)的內(nèi)容形式是根據(jù)圖片的內(nèi)容屬性來判斷,而非簡(jiǎn)單判斷為照片。例如吳道子畫作《天王送子嗣》 的著錄中,南京圖書館將之作為照片來制作,而元數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)中歸入繪畫類型,責(zé)任者名稱項(xiàng)錄入該畫的繪制者。
例:自建數(shù)據(jù)庫(kù)著錄:
題名:《天王送子嗣》豐卷之一段(中國(guó)畫)
內(nèi)容摘要:吳道子畫《天王送子嗣》豐卷之一段
內(nèi)容創(chuàng)建者:延光堂照相館攝
內(nèi)容類型:照片
元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目標(biāo)準(zhǔn):
正題名:《天王送子嗣》豐卷之一段 (中國(guó)畫)
責(zé)任者名稱:吳道子
責(zé)任方式:繪
其他:延光堂照相館攝
內(nèi)容形式:圖像(靜態(tài))
另外,南京圖書館元數(shù)據(jù)還設(shè)置了“其他責(zé)任者”字段,用于錄入照片的贈(zèng)送者或者寄送者。在建設(shè)元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目時(shí)其他責(zé)任者字段的內(nèi)容可以放在“附注”字段或其他字段,以作補(bǔ)充。
3.5 內(nèi)容形式
南京圖書館自建元數(shù)據(jù)時(shí)規(guī)定了“內(nèi)容類型”字段,近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)和抗日戰(zhàn)爭(zhēng)歷史圖庫(kù)的數(shù)據(jù)都是照片形式,所以統(tǒng)一錄入內(nèi)容類型為照片。而在元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目里設(shè)定了一個(gè)“內(nèi)容形式”字段,規(guī)定將圖片形式統(tǒng)一錄為圖像,根據(jù)圖像內(nèi)容中有無運(yùn)動(dòng)的狀態(tài),可以細(xì)分為圖像(靜態(tài))和圖像(動(dòng)態(tài))。此字段為必備字段,用于區(qū)分不同的資源類型。
3.6 創(chuàng)建日期和時(shí)間范圍
元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目要求如果能夠確定圖像內(nèi)容具體的創(chuàng)作日期,則錄入“創(chuàng)建日期”字段;如果根據(jù)圖片內(nèi)容只能判斷出所反映的大致時(shí)間段,則需錄入“時(shí)間范圍”字段。而南京圖書館在錄入作品日期字段時(shí),往往是根據(jù)圖片說明所反映的時(shí)間來錄入,所以在制作元數(shù)據(jù)倉(cāng)儲(chǔ)時(shí),需要根據(jù)具體情況來分別錄入。
3.7 出自與所屬數(shù)據(jù)庫(kù)
元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目里“出自”字段是指用于說明資源所屬的的原始文獻(xiàn)。比如一張圖片是從哪種書里數(shù)字化而來。這與南京圖書館自建元數(shù)據(jù)的“圖像出處”字段基本吻合。但是需要注意的一點(diǎn)是,“出自”不同于所屬數(shù)據(jù)庫(kù)或者叢編項(xiàng)。元數(shù)據(jù)倉(cāng)儲(chǔ)建設(shè)項(xiàng)目里的所屬數(shù)據(jù)庫(kù)是指對(duì)象數(shù)據(jù)所在的自建數(shù)據(jù)庫(kù)名稱。
例:正題名:廣州航空界慶祝第一架自造飛機(jī)“成功”號(hào)試飛成功
出自:良友第34期
所屬數(shù)據(jù)庫(kù):中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)
4 南京圖書館建設(shè)元數(shù)據(jù)倉(cāng)儲(chǔ)時(shí)遇到的特殊情況
4.1 一條發(fā)布地址對(duì)應(yīng)多張圖片的情況
元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目要求建設(shè)對(duì)象必須是已發(fā)布的有對(duì)象數(shù)據(jù)的本館自建元數(shù)據(jù)。南京圖書館在已發(fā)布的近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)中呈現(xiàn)出一種現(xiàn)象:一個(gè)發(fā)布地址點(diǎn)擊后出現(xiàn)兩張圖片,甚至多張圖片。例:http://www2.jslib.org.cn/was5/web/detail?record=4&channelid;=56009。發(fā)布地址里出現(xiàn)了三張圖片。由于每一張圖片的文件大小和分辨率均不相同,所以需要分開錄入,做成三條數(shù)據(jù)。三條數(shù)據(jù)中只有文件大小和分辨率字段是不同的,其他字段幾乎相同。此為解決辦法1。解決辦法2是一個(gè)地址做成一條數(shù)據(jù),但是在附注字段說明此條數(shù)據(jù)有三張圖片,另外在文件大小和分辨率字段按照順序分別填入三張圖片的文件大小和分辨率,中間用半角分號(hào)隔開。此方法能夠有效保持?jǐn)?shù)據(jù)的完整性。
4.2 資源類型判定的問題
雖然南京圖書館自建的近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)和抗日戰(zhàn)爭(zhēng)歷史圖庫(kù)都是圖片形式。但是元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目里的資源類型是根據(jù)圖片的內(nèi)在內(nèi)容屬性判定的,不能根據(jù)資源的外在形式來判斷。例如毛澤東親筆書寫的手稿照片,從外在形式看,它是一張照片,是關(guān)于文本的照片;但是從它內(nèi)在的內(nèi)容屬性看,它是一份手稿,是毛澤東親筆書寫的手稿,因此不能以圖像類型來制作元數(shù)據(jù)倉(cāng)儲(chǔ),必須按照手稿的形式制作元數(shù)據(jù)倉(cāng)儲(chǔ)。目前推廣工程元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目將不能歸入原有八種類型(圖書、期刊、論文、報(bào)紙、圖片、音頻、視頻及網(wǎng)頁(yè)采集數(shù)據(jù))的元數(shù)據(jù)統(tǒng)一使用通用類型來制作,比如手稿、信札、拓片、扇面、印鑒、書影、法律作品等。因此對(duì)于圖像數(shù)字資源,在制作元數(shù)據(jù)倉(cāng)儲(chǔ)時(shí)并不能全部按照?qǐng)D像資源類型來制作,需要標(biāo)引人員根據(jù)資源內(nèi)在內(nèi)容屬性逐條客觀判斷。不同的資源類型須使用不同的制作規(guī)范來制作。元數(shù)據(jù)倉(cāng)儲(chǔ)針對(duì)每一種資源類型都列出了不同的術(shù)語表,以方便元數(shù)據(jù)的制作。
5 對(duì)南京圖書館元數(shù)據(jù)倉(cāng)儲(chǔ)建設(shè)及自建數(shù)字資源的一些思考
南京圖書館自2004年申報(bào)《中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)》 自建項(xiàng)目以來,歷經(jīng)了十幾年,已完成自建數(shù)據(jù)二十多萬條,初具規(guī)模,成績(jī)是顯而易見的。但南京圖書館的自建資源庫(kù)就像一個(gè)資源孤島,沒有和其他圖書館、其他文化機(jī)構(gòu)形成互聯(lián)互通。我們不得不思考,南京圖書館的這些數(shù)據(jù)是否與其他館或者機(jī)構(gòu)有重復(fù)的現(xiàn)象?這些數(shù)據(jù)能不能被其他機(jī)構(gòu)所直接使用?隨著大數(shù)據(jù)時(shí)代的到來,必須打破這種孤島現(xiàn)象,堅(jiān)持合作共建、合理共享的原則,實(shí)現(xiàn)數(shù)字資源建設(shè)與其他圖書館和機(jī)構(gòu)的互聯(lián)互通。結(jié)合元數(shù)據(jù)倉(cāng)儲(chǔ)項(xiàng)目建設(shè)中發(fā)現(xiàn)的一些問題,筆者建議南京圖書館自建資源可以從以下幾個(gè)方面作出一些調(diào)整和改變。
5.1 資源選題
南京圖書館近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)主要是集中收錄1911年至1949年之間的民國(guó)文獻(xiàn),隨著圖像資源建設(shè)的不斷成熟,可以適當(dāng)向前延伸,進(jìn)一步挖掘本館館藏資源。同時(shí),可以結(jié)合本地政治、經(jīng)濟(jì)、文化事業(yè)等發(fā)展情況并結(jié)合館藏特色,建設(shè)專題資源庫(kù),并努力尋求與博物館、檔案館及其他文化館的合作,以保存與展示本地的政治、經(jīng)濟(jì)、文化等方面的建設(shè)發(fā)展情況。例如,第26屆世界大學(xué)生夏季運(yùn)動(dòng)會(huì)于2011年8月在中國(guó)深圳舉行,深圳圖書館就以“大運(yùn)足跡——第二十六屆世界大學(xué)生夏季運(yùn)動(dòng)會(huì)媒體報(bào)道匯編”為主題制作了一個(gè)專題數(shù)據(jù)庫(kù)。此外,深圳圖書館還制作了“中國(guó)國(guó)際高新技術(shù)成果交易會(huì)媒體報(bào)道專題數(shù)據(jù)庫(kù)”和“深圳讀書月媒體報(bào)道專題數(shù)據(jù)庫(kù)”等。再如,遼寧省圖書館制作的“東北方志人物數(shù)據(jù)庫(kù)、口述歷史、地名數(shù)據(jù)庫(kù)、地方建筑數(shù)據(jù)庫(kù)”,這些內(nèi)容都是取自于該館館藏特色文獻(xiàn)《東北地方文獻(xiàn)聯(lián)合目錄》 《東北方志人物傳記資料索引》 《遼寧舊方志·奉天通志》 《東北鄉(xiāng)土志叢編》 《遼寧省地名錄》等。另外還要注意資源建設(shè)的連續(xù)性,盡量完整、全面的建設(shè)一批自建資源數(shù)據(jù)庫(kù)。
5.2 資源建設(shè)遵循全國(guó)統(tǒng)一的標(biāo)準(zhǔn)與規(guī)范
隨著十幾年的圖像數(shù)字資源建設(shè)發(fā)展,南京圖書館在制作圖像數(shù)據(jù)庫(kù)的實(shí)踐中總結(jié)出了“近代圖像標(biāo)引關(guān)鍵詞表”和“近代圖像數(shù)據(jù)庫(kù)分類表”的一些著錄經(jīng)驗(yàn),但在現(xiàn)有標(biāo)準(zhǔn)規(guī)范基礎(chǔ)上,南京圖書館的自建數(shù)據(jù)庫(kù)的建設(shè)項(xiàng)目仍需要結(jié)合最新數(shù)字資源建設(shè)標(biāo)準(zhǔn)和其他國(guó)內(nèi)外較成熟的標(biāo)準(zhǔn)規(guī)范,制定出一套更適用的更完善的標(biāo)準(zhǔn)規(guī)范。目前,全國(guó)圖書館標(biāo)準(zhǔn)化技術(shù)委員會(huì)最新制訂的有關(guān)數(shù)字資源建設(shè)的國(guó)家標(biāo)準(zhǔn)有《圖書館館藏資源數(shù)字化加工規(guī)范》 (第2部分:文本資源)、《圖書館館藏資源數(shù)字化加工規(guī)范》 (第4部分:音頻資源)、《圖書館館藏資源數(shù)字化加工規(guī)范》 (第3部分:圖像資源)、《圖書館館藏資源數(shù)字化加工規(guī)范》 (第5部分:視頻資源)[6]。南京圖書館可依據(jù)上述全國(guó)性的標(biāo)準(zhǔn),并根據(jù)本館的客觀實(shí)際情況,對(duì)自建數(shù)據(jù)的著錄項(xiàng)目做一些調(diào)整和改變。比如,在分類字段,可以依據(jù)《中國(guó)圖書館分類法(第五版)》 的標(biāo)準(zhǔn)來使用分類號(hào),盡量不使用文字形式。在關(guān)鍵詞字段,盡量選擇比較成熟穩(wěn)定的、具有生命力的概念,選用常用、慣用、通用詞匯??梢栽黾又黝}詞形式,盡量統(tǒng)一使用最新版的 “中國(guó)分類主題詞表”里的主題詞。
5.3 加強(qiáng)人才隊(duì)伍建設(shè)
圖書館還應(yīng)定期對(duì)數(shù)字資源編目人員進(jìn)行系統(tǒng)培訓(xùn),培訓(xùn)范圍涵蓋編目流程、著錄規(guī)則和著錄規(guī)范以及著錄工具等方面,增強(qiáng)信息著錄的規(guī)范化、標(biāo)準(zhǔn)化,確保數(shù)字資源的準(zhǔn)確性和一致性。同時(shí)培訓(xùn)內(nèi)容還應(yīng)該包括數(shù)字資源項(xiàng)目本身的概況,要使編目人員不僅要知其然,還要知其所以然,這樣才能增強(qiáng)數(shù)字資源制作者的主觀能動(dòng)性,提高數(shù)字資源制作者的參與感,從而提高工作熱情和積極性,防止一成不變、消極怠工狀態(tài)的出現(xiàn)。
5.4 利用現(xiàn)代技術(shù)手段,減少人工輸入
數(shù)字資源創(chuàng)建過程中,尤其在著錄環(huán)節(jié),人工輸入出錯(cuò)率較高,元數(shù)據(jù)的質(zhì)量受到影響。可以選擇創(chuàng)建模版,給出限定詞等方法保證數(shù)據(jù)的準(zhǔn)確性和一致性。對(duì)于能批量處理的字段,盡可能批量制作,以節(jié)省人力和時(shí)間,將有限的人力充分用來處理不能自動(dòng)處理的環(huán)節(jié),提高數(shù)字資源的質(zhì)量。特別是中圖分類和主題詞字段,需要標(biāo)引人員重點(diǎn)著錄。另外也要抽調(diào)人員定期對(duì)制作的數(shù)字資源進(jìn)行審查和抽樣審查,及時(shí)發(fā)現(xiàn)錯(cuò)誤,并進(jìn)行整改,防止問題長(zhǎng)期積累。
參考文獻(xiàn):
薩蕾.數(shù)字圖書館元數(shù)據(jù)基礎(chǔ)[M].北京:中央編譯出版社,2015:172.
梁蕙瑋,薩蕾.數(shù)字圖書館推廣工程面向數(shù)字資源整合的元數(shù)據(jù)倉(cāng)儲(chǔ)構(gòu)建[J].國(guó)家圖書館學(xué)刊,2012(5):27-32.
CNNIC第35次中國(guó)互聯(lián)網(wǎng)調(diào)查報(bào)告[EB/OL].[2017-04-15].
https://wenku.baidu.com/view/e59d309aff00bed5b9f31dc3.html?from=search.
數(shù)字圖書館推廣工程網(wǎng)絡(luò)書香資源檢索平臺(tái)[EB/OL].[2017-04-15].http://zyjs.ndlib.cn/nlibrary/index.html.
王國(guó)平.公共圖書館自建特色數(shù)據(jù)庫(kù)的實(shí)踐與思考:以南京圖書館《中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)》為例[J].河南圖書館學(xué)刊,2015,35(12):25-27.
全國(guó)圖書館標(biāo)準(zhǔn)化技術(shù)委員會(huì)[EB/OL].[2017-04-15].
http://www.nlc.cn/tbw/bzwyh_bzhxd.htm.
丁文娟 南京圖書館館員。 江蘇南京,210018。
(收稿日期:2017-05-10 編校:謝艷秋)