劉潔璇
(南京師范大學(xué)圖書館)
機(jī)讀目錄 (Machine-Readable Cataloging,MARC)是描述文獻(xiàn)著錄的國(guó)際標(biāo)準(zhǔn)格式,MARC21(USMARC)與中國(guó)機(jī)讀目錄(China Machine Readable Catalogue,CNMARC)對(duì)圖像著錄采用了代碼加子字段描述的形式,代碼類型豐富,每種代碼含義各異,很容易被機(jī)器自動(dòng)識(shí)別,字段結(jié)構(gòu)與對(duì)應(yīng)關(guān)系易于代碼校驗(yàn)。
MARC是一種結(jié)構(gòu)化數(shù)據(jù),CNMARC格式字段比都柏林核心(Dublin Core,DC)元素豐富,信息揭示詳備、檢索體系完備、擴(kuò)充修改功能強(qiáng)、安全控制操作便捷,其應(yīng)用優(yōu)勢(shì)主要體現(xiàn)在對(duì)圖像的描述、管理方面。將數(shù)據(jù)從一個(gè)系統(tǒng)移動(dòng)到另一個(gè)系統(tǒng),并進(jìn)行轉(zhuǎn)換,正是基于底層的元數(shù)據(jù)。一方面,認(rèn)真區(qū)分中西文著錄中代碼含義差別有助于提高應(yīng)用集成的精確度。如,MARC21的008字段按字符位定義數(shù)據(jù)元素,為區(qū)分不同的含義,同一數(shù)據(jù)元素有時(shí)會(huì)被定義多種代碼。對(duì)圖像代碼含義進(jìn)行對(duì)比分析是避免機(jī)器自動(dòng)識(shí)別與文獻(xiàn)實(shí)體偏差的前提。另一方面,準(zhǔn)確理解字段間的對(duì)應(yīng)關(guān)系與結(jié)構(gòu)有助于代碼選擇、校驗(yàn)。如,MARC21的034字段的編碼形式反映了255字段著錄的與制圖資料有關(guān)的比例說明、投影說明、坐標(biāo)說明,天體圖的赤緯、赤經(jīng)以及二分點(diǎn)等數(shù)學(xué)數(shù)據(jù)說明;MARC21的007字段采用屬性樹結(jié)構(gòu),由00字符位定義資料類型代碼,再由此代碼定義該資料類型的其他數(shù)據(jù)元素代碼,在數(shù)據(jù)管理操作時(shí)應(yīng)注意代碼變化引起的格式變化。
再者,除了參照《國(guó)際標(biāo)準(zhǔn)書目著錄》(International Standard Bibliographic Description,ISBD) 外,中文圖書著錄還要考慮我國(guó)國(guó)情、中文名稱特點(diǎn)、文獻(xiàn)的特殊性。尤其是中國(guó)人的姓名具有形式簡(jiǎn)短、重名率高的特點(diǎn),編目工作中對(duì)個(gè)人知識(shí)責(zé)任的準(zhǔn)確識(shí)別直接影響文獻(xiàn)的有效查找、選擇和獲取。[1]隨著網(wǎng)絡(luò)交互信息資源、書目數(shù)據(jù)關(guān)聯(lián)化的迅速發(fā)展,合作信息行為、合作信息查尋與檢索不斷發(fā)展,社會(huì)標(biāo)注的應(yīng)用越來越廣泛。然而社會(huì)標(biāo)注中語義、語法表達(dá)及拼寫不規(guī)范等問題會(huì)影響信息標(biāo)引、檢索的準(zhǔn)確性、全面性。去除標(biāo)簽噪聲、信息干擾,將為信息資源的標(biāo)引、組織、檢索提供更開放的共享模式。[2]
同時(shí),編制規(guī)范記錄、建立規(guī)范文檔、實(shí)施規(guī)范控制、進(jìn)行規(guī)范維護(hù)有助于完善目錄的匯集功能、查詢功能,滿足國(guó)際、國(guó)內(nèi)書目資源的共享需求。雖然越來越多的公共圖書館、高校圖書館跟隨美國(guó)國(guó)會(huì)圖書館采用《資源描述與檢索》(Resource Description and Access,RDA)新規(guī)則進(jìn)行編目,但RDA仍以ISBD中的基本數(shù)據(jù)元素為著錄基礎(chǔ)?;赗DA的測(cè)繪制圖資源 MARC21書目數(shù)據(jù)編目變化主要是著錄規(guī)則的變化,如縮略詞的使用。[3]可見,書目標(biāo)準(zhǔn)化研究進(jìn)一步促進(jìn)了元數(shù)據(jù)在知識(shí)管理領(lǐng)域的推廣應(yīng)用,為拓片、輿圖等中國(guó)特色古文獻(xiàn)的數(shù)字化管理提供了技術(shù)標(biāo)準(zhǔn),為反映我國(guó)宏富的傳統(tǒng)文化,解決資源共享中的兼容、映射等問題提供了支持。書目標(biāo)準(zhǔn)化著錄的可持續(xù)發(fā)展既需要理論的不斷更新,也需要及時(shí)的經(jīng)驗(yàn)總結(jié)。我國(guó)長(zhǎng)期以來延續(xù)使用的編目規(guī)則及在此基礎(chǔ)上形成的龐大的CNMARC記錄仍具有重要的研究意義。
隨著網(wǎng)絡(luò)資源的冪指數(shù)增長(zhǎng)及圖像識(shí)別、圖像檢索的發(fā)展,對(duì)文獻(xiàn)特殊細(xì)節(jié)項(xiàng)的著錄有助于測(cè)繪制圖資料的準(zhǔn)確定位與知識(shí)發(fā)現(xiàn)線索的系統(tǒng)梳理。由于知識(shí)關(guān)聯(lián)以數(shù)據(jù)集成為主要操作,所以,MARC元數(shù)據(jù)的描述、檢索功能在知識(shí)定位、檢索點(diǎn)查重、資源對(duì)接、安全管理操作實(shí)踐中發(fā)揮著重要作用。通曉著錄規(guī)則有助于保證書目著錄的一致性、整體性,方便資源共享、數(shù)據(jù)無障礙交換。
MARC元數(shù)據(jù)描述、標(biāo)識(shí)了信息資源對(duì)象的內(nèi)容、屬性和外觀特征,記錄了圖像資料的內(nèi)容、索引及關(guān)系,提供了對(duì)象的實(shí)體位置或網(wǎng)絡(luò)地址,反映了數(shù)據(jù)的更新、遷移等變化,高質(zhì)量的MARC元數(shù)據(jù)便于資源定位與獲取。
(1)CNMARC與MARC21的920館藏信息字段揭示了收藏機(jī)構(gòu)及館際互借方式。必備子字段$a揭示了收藏該文獻(xiàn)的成員館代碼,該代碼在OPAC(Open Public Access Catalogue,開放的公共查詢目錄)以文字形式顯示;必備子字段$z揭示了館際互借方式:0不提供館際互借,1返還式館際互借,2文獻(xiàn)傳遞,3提供電子傳遞,4訂購(gòu)中,9注銷。9XX本地使用塊的規(guī)范著錄規(guī)定直接關(guān)系文獻(xiàn)資源定位。
(2)CNMARC字段間的對(duì)應(yīng)關(guān)系映射了文獻(xiàn)間的關(guān)聯(lián)關(guān)系,解讀關(guān)系有助于兼顧圖像資料的系統(tǒng)性、完整性獲取。如,MARC21的76X-79X連接款目字段采用標(biāo)準(zhǔn)子字段結(jié)構(gòu),按照數(shù)據(jù)功能定義不同的子字段數(shù)據(jù)內(nèi)容,說明相關(guān)文獻(xiàn)與編目文獻(xiàn)間的關(guān)系:空間(年代)關(guān)系——書目文獻(xiàn)間的時(shí)間性關(guān)系。如,先前和后續(xù)關(guān)系的連續(xù)出版物;平行(橫向)關(guān)系——書目文獻(xiàn)間的不同版本關(guān)系,如,不同語種的版本、不同載體或形式的版本等;層次(垂直)關(guān)系——總體對(duì)部分或部分對(duì)總體的層次關(guān)系,如,期刊文章與期刊的關(guān)系、附屬叢編對(duì)主叢編的關(guān)系等。CNMARC的4XX連接款目塊連接了與在編文獻(xiàn)有關(guān)的其他實(shí)體記錄,CALIS聯(lián)合目錄4XX字段采用了嵌套式結(jié)構(gòu)將需要連接的數(shù)據(jù)字段(包括字段標(biāo)識(shí)符、指示符、子字段標(biāo)識(shí)符和數(shù)據(jù))作為子字段內(nèi)容嵌套在$1子字段內(nèi),直觀反映文獻(xiàn)間的叢編、補(bǔ)編(或增刊)、正編(或正刊)、替代/部分替代、吸收/部分吸收、并入/部分并入、合并、分成、譯為、譯自、復(fù)制為、復(fù)制自、總集、分集等關(guān)系。如果違背統(tǒng)一的著錄規(guī)則,在不同的應(yīng)用系統(tǒng)之間移動(dòng)數(shù)據(jù)、在一個(gè)應(yīng)用系統(tǒng)組合中管理復(fù)雜的接口都將非常困難。
(3)基于關(guān)聯(lián)數(shù)據(jù)的書目數(shù)據(jù)模型BIBFRAME(Bibliographic Framework,書目框架)將為未來網(wǎng)絡(luò)世界書目描述帶來改變。BIBFRAME利用關(guān)聯(lián)數(shù)據(jù)模型,定義了一套由RDF類、屬性及其關(guān)系組成的詞匯。[4]這種新的數(shù)據(jù)格式通過屬性特征區(qū)分不同實(shí)體,又通過實(shí)體的屬性關(guān)系各個(gè)實(shí)體相互關(guān)聯(lián),更適應(yīng)網(wǎng)絡(luò)資源整合、定位。在新技術(shù)環(huán)境中,MARC元數(shù)據(jù)定期維護(hù)更新機(jī)制的建立有助于滿足讀者對(duì)圖像信息檢索廣度與深度的需求。隨著電子文獻(xiàn)引用比例的增大,通過對(duì)856字段增設(shè)DOI(Digital Object U-nique Identifier,數(shù)字對(duì)象唯一標(biāo)識(shí)符)著錄,在MARC與DC之間建立映射關(guān)系,實(shí)現(xiàn)二者的相互轉(zhuǎn)換,使圖書館信息資源與網(wǎng)絡(luò)資源合二為一。[5]由于DOI對(duì)期刊論文、科學(xué)數(shù)據(jù)的子項(xiàng)(包括圖形、表格、圖片,以及書籍章節(jié)/條目等提供編碼注冊(cè)),其后綴可以通過分隔開的子字符串(節(jié)點(diǎn))來反映等級(jí)信息或粒度層次。出版機(jī)構(gòu)可在期刊論文編碼中增加節(jié)點(diǎn),將期刊論文編碼方案進(jìn)行擴(kuò)展得到這些論文部件,如圖表、圖片的DOI編碼方案。[6]通過DOI標(biāo)識(shí)符的多重解析功能,實(shí)現(xiàn)圖像知識(shí)鏈接和對(duì)相關(guān)知識(shí)的整合、集成。[7]
MARC元數(shù)據(jù)提供了多種檢索途徑:分類、仿照復(fù)分方法便于圖像的批量查找;子字段具有檢索、查重功能;代碼可作為包含或排斥某類圖像資料的限定信息。
圖像資料的積累為考古文化譜系研究的深入、探討中華文明的形成與發(fā)展提供了資料基礎(chǔ)。CNMARC的690字段記錄了中國(guó)圖書館分類法(Chinese Library Classification,CLC)分類號(hào)。分類中出現(xiàn)的類目復(fù)分、仿分現(xiàn)象為圖像資料的查找、分類提供了線索。在中國(guó)文物考古(K87)中,對(duì)于圖錄、題跋等具有共性的類目,在需要詳細(xì)分類的類號(hào)上直接加上復(fù)分類號(hào)(圖錄+2,題跋+4);而在K873出土文物圖錄類目復(fù)分時(shí)需使用《中國(guó)地區(qū)表》(如甘肅+42)。
壁畫是敦煌學(xué)研究的重要分支。為保護(hù)敦煌壁畫藝術(shù)遺產(chǎn),敦煌研究院與浙江大學(xué)合建的敦煌壁畫數(shù)字資源庫(kù)系統(tǒng)對(duì)壁畫及相關(guān)文獻(xiàn)的數(shù)字資源采用了三層嵌套式元數(shù)據(jù)規(guī)范描述:以石窟元數(shù)據(jù)為上層元數(shù)據(jù),石窟內(nèi)的壁畫元數(shù)據(jù)為中層元數(shù)據(jù),研究信息、臨摹信息、拍攝信息等壁畫相關(guān)元數(shù)據(jù)為下層元數(shù)據(jù),以支持信息匯聚、分析。[8]從CLC分類檢索上看:敦煌文獻(xiàn)研究集中在G256.1;敦煌學(xué)(總論)集中在K870.6;壁畫集中在K879.41;壁畫圖錄集中在K879.412。以“敦煌裝飾圖案”做主題檢索,可以發(fā)現(xiàn)《敦煌裝飾圖案》(2010)、《敦煌歷代精品邊飾·圓光合集》(2010)等書目,通過對(duì)相關(guān)作者、叢編的查重,可不斷發(fā)現(xiàn)新的“路標(biāo)”并建立關(guān)聯(lián)。
文獻(xiàn)學(xué)科內(nèi)容的主題概念是標(biāo)引的主要概念和主要對(duì)象。深度標(biāo)引為圖像信息的準(zhǔn)確表達(dá)、篩選、存儲(chǔ)、檢索、提取提供了有力保障。CNMARC的606論題主題、607地理名稱主題所設(shè)子字段,$a款目要素,$x論題復(fù)分,$y地理復(fù)分,$z年代復(fù)分,$j形式復(fù)分都具有重要的檢索意義。
多重標(biāo)引為信息檢索提供了多個(gè)檢索入口。賀蘭山在607地理名稱標(biāo)目中屬自然特征名稱標(biāo)目,通常記錄在$a款目要素子字段,而在606論題主題標(biāo)目字段通常記錄在$y地理復(fù)分子字段。$j形式復(fù)分子字段描述了文獻(xiàn)類型或形式,圖解、圖譜、畫冊(cè)、攝影集、圖集、地圖集是圖像資料的常用詞。通過“賀蘭山”主題檢索書目列表可以發(fā)現(xiàn):賀蘭山圖像資料研究涉及神話、原始宗教、石畫、文字、地理、地質(zhì)、生物、林業(yè)幾大學(xué)科領(lǐng)域。圖錄具有較高的科學(xué)、歷史、藝術(shù)、文獻(xiàn)史料價(jià)值,多檢索點(diǎn)查重對(duì)跨學(xué)科、交叉學(xué)科間的資料對(duì)比、佐證提供了有力支持。
系統(tǒng)地搜集整理圖書中不同時(shí)期的各類圖表,對(duì)藝術(shù)風(fēng)格演變、流派劃分研究意義重大。如,木刻版畫的構(gòu)圖、畫風(fēng)、刀鋒、鐫刻極具時(shí)代特色,其摹真常用作畫稿范式,在長(zhǎng)達(dá)千年的版刻版畫發(fā)展史中,書籍中附著的木刻插圖作品林林總總,內(nèi)容涉及宗教、戲曲、小說等經(jīng)史子集各類,形式或長(zhǎng)版方式、或圓形月光式、或連版或單幅、或上圖下文、或文中插圖。[9]如果僅以“版畫”做主題檢索,檢出的文獻(xiàn)數(shù)量過于龐大,難以一一瀏覽,而僅以類號(hào)做分類檢索又可能出現(xiàn)漏檢,且這兩種常用的檢索方式對(duì)圖像專指度不高。
MARC21與CNMARC對(duì)圖書所含圖表著錄采用了代碼及子字段描述。對(duì)專著性文字資料所含圖表:MARC21在008字段18-21字符位選用4種代碼(不足用空位,超過選擇主要4種)描述,代碼信息與300字段$b其他形態(tài)細(xì)節(jié)子字段對(duì)應(yīng);CNMARC在105字段0-3字符位選用4種代碼(不足用空位,超過選擇主要4種)描述,代碼信息與215字段$c其他形態(tài)細(xì)節(jié)子字段對(duì)應(yīng)(見下表)。
表 MARC21、CNMARC專著性文字資料圖表代碼對(duì)比
與MARC21相比,CNMARC增加了對(duì)透射圖片(n)的定義,以代碼o表示彩飾,刪除了對(duì)照片的定義(CALIS規(guī)定不使用插圖、照片、手跡等表示圖的來源的字樣)。代碼識(shí)別與主題檢索配合使用,可將分散在不同文獻(xiàn)中的同類型圖像(如摹真(a)h、地圖b)解析出來;與CNMARC 6XX主題標(biāo)引塊$z年代復(fù)分或MARC21 6XX主題標(biāo)引塊$y年代復(fù)分配合使用,能進(jìn)一步提高信息資源的年代專指度。
圖像資源與信息資源的統(tǒng)一揭示是實(shí)現(xiàn)各類資源(圖像、文字、影像、網(wǎng)絡(luò)資源等)無縫對(duì)接的基礎(chǔ),也是立體呈現(xiàn)研究對(duì)象、實(shí)現(xiàn)資源整合對(duì)接的重要途徑。
隨著定位與定量觀測(cè)、遙測(cè)技術(shù)的不斷成熟,地形圖、遙感影像與圖像、斷面圖、平面圖、投影圖、數(shù)學(xué)方程、數(shù)理模型、立體圖示成為近代地理學(xué)的重要描述方式。在機(jī)器學(xué)習(xí)和統(tǒng)計(jì)中,一般的圖像關(guān)聯(lián)數(shù)據(jù)包含了對(duì)象的屬性、同類型對(duì)象間的同質(zhì)關(guān)聯(lián)和不同類型間的異質(zhì)關(guān)聯(lián)。CNMARC、MARC21在地圖資料著錄時(shí),對(duì)比列尺、坐標(biāo)、制圖數(shù)學(xué)數(shù)據(jù)等也做了相應(yīng)記錄。
傳統(tǒng)聚類方法以同質(zhì)數(shù)據(jù)為主要對(duì)象,如,河洛文化文獻(xiàn)數(shù)據(jù)庫(kù)“河洛碑志拓片”、“洛陽師范學(xué)院館藏拓片及志石”子庫(kù)對(duì)拓片資源數(shù)據(jù)進(jìn)行標(biāo)引時(shí),按照不同文獻(xiàn)種類元數(shù)據(jù)建立不同的元數(shù)據(jù)標(biāo)引模板,再按不同元數(shù)據(jù)模板分配相應(yīng)的數(shù)據(jù)項(xiàng)目分類標(biāo)引,通過超鏈建立子庫(kù)間的關(guān)聯(lián)。[10]然而,現(xiàn)實(shí)的數(shù)據(jù)分析需要涉及多種類型的數(shù)據(jù)對(duì)象,從學(xué)術(shù)科研角度看,同一金石器物、拓片、拓片數(shù)字圖像雖然記載的內(nèi)容是重復(fù)的,但不同載體形態(tài)反映的信息量無法絕對(duì)分離。CNMARC的191編碼數(shù)據(jù)字段描述了拓片的內(nèi)容與外觀特征。通過856電子資源定位與檢索字段與影像掛接后,能清晰反映器物的銘文圖像、不同時(shí)期器物的狀況,全面揭示不同版刻、刻本與復(fù)本間的差異;451字段連接了在編文獻(xiàn)同一載體的其他版本,如,不同語種的其他印刷版;452字段連接了在編文獻(xiàn)不同載體的其他版本,如印刷版與電子版、盲文版。
MARC元數(shù)據(jù)對(duì)資源對(duì)象使用、保存、管理權(quán)限的描述,保障了數(shù)據(jù)安全風(fēng)險(xiǎn)控制。如,MARC21的307文獻(xiàn)檢索或獲取時(shí)間字段記錄了可以獲取文獻(xiàn)或檢索文獻(xiàn)(主要是電子資源)的日期和/或時(shí)間信息。355保密級(jí)別控制字段包含了有關(guān)文獻(xiàn)、題名、文摘、內(nèi)容附注、作者等信息的保密級(jí)別,相關(guān)文獻(xiàn)處理說明和外傳規(guī)定,包含文獻(xiàn)保密級(jí)別的降級(jí)和解密數(shù)據(jù)、保密體系名稱、國(guó)家原代碼等內(nèi)容。357文獻(xiàn)傳播控制字段記錄了編目文獻(xiàn)的原創(chuàng)者(作者、生產(chǎn)者)對(duì)文獻(xiàn)傳播控制的說明。561所有權(quán)與保管史字段包含了有關(guān)編目文獻(xiàn)從產(chǎn)生到檢索獲取這一時(shí)間段的所有權(quán)及其保管史方面的信息。583業(yè)務(wù)措施附注字段包含了對(duì)文獻(xiàn)檢索、評(píng)估、鑒定、分類、復(fù)制、微縮、保存、轉(zhuǎn)移和保護(hù)措施,及執(zhí)行措施的方法或技術(shù),如郵寄方式、處理時(shí)粉碎等。856電子資源定位與檢索字段包含了文獻(xiàn)相關(guān)電子資源的地址、登錄方式、讀取方式、傳輸方法、口令等重要信息。
大數(shù)據(jù)環(huán)境下,館藏資源的有效組織與序化是圖書館的基本業(yè)務(wù),對(duì)圖像文獻(xiàn)的內(nèi)容特征及資源實(shí)體對(duì)象之間關(guān)聯(lián)狀態(tài)描述的元數(shù)據(jù)是學(xué)科資源重組、關(guān)聯(lián)應(yīng)用的基礎(chǔ)。由于CNMARC主要用于數(shù)據(jù)描述與交換,CNMARC XML格式更適應(yīng)互聯(lián)網(wǎng)+和數(shù)字圖書館應(yīng)用環(huán)境。
CNMARC XML結(jié)構(gòu)中,記錄頭標(biāo)、控制字段、子字段、代碼分別與ISO 2709中的術(shù)語、元素名稱相對(duì)應(yīng)。遵循國(guó)際通用的標(biāo)準(zhǔn)與規(guī)范便于上層應(yīng)用的設(shè)計(jì)與開放互聯(lián)。通過轉(zhuǎn)化格式,CNMARC實(shí)現(xiàn)以XML語法描述原始資源,并以XML樣式表的方式表達(dá),為XML環(huán)境下CNMARC記錄的交換處理及數(shù)據(jù)變換、復(fù)制提供臨時(shí)格式。通過OAI-PMH協(xié)議收割典藏機(jī)構(gòu)的元數(shù)據(jù),Z395.0分布式虛擬聯(lián)合數(shù)據(jù)庫(kù)檢索體系,能實(shí)現(xiàn)對(duì)分布式系統(tǒng)的統(tǒng)一查詢。
CNMARC與MARC21在地圖信息限定檢索、主題聚類統(tǒng)計(jì)中具有一定的應(yīng)用價(jià)值,記錄頭標(biāo)區(qū)06字符位代碼反映了記錄類型:a專著性文字資料,e測(cè)繪制圖資料。CALIS專著性文字資料著錄參考ISBD(M)、《普通圖書著錄規(guī)則》(GB3792-85),測(cè)繪制圖資料著錄參考ISBD(CM)、《地圖資料著錄規(guī)則》(GB3792.6-87)。當(dāng)專著性文字資料105字段0-3字符位包含代碼“b”,215字段$c子字段包含“地圖”時(shí),表示該專著含有地圖。如,該條記錄105字段10字符位指示符為1,表示含有索引。圖表索引的使用能進(jìn)一步提高地圖查檢效率和精確度。測(cè)繪制圖資料120字段1字符位對(duì)索引進(jìn)行了詳細(xì)的代碼描述;121字段對(duì)測(cè)繪制圖資料的出版形式進(jìn)行了詳細(xì)的代碼描述;123字段記錄了206字段著錄的測(cè)繪制圖資料的比例尺與坐標(biāo),為定位包含我國(guó)臺(tái)灣島、釣魚島、南海諸島等重要島嶼測(cè)繪制圖資料,核查南海斷續(xù)線、國(guó)界線的表示與標(biāo)注,維護(hù)國(guó)家領(lǐng)土完整提供識(shí)別信息。
從690字段CLC來看,中國(guó)地圖主要集中在K992類目。此外,氣候圖入P469,地圖制圖學(xué)入P28。6XX主題分析塊$j形式復(fù)分子字段與CLC總論復(fù)分相結(jié)合(加在主表分類號(hào)碼后的“-復(fù)分號(hào)”),便于區(qū)分資料類型統(tǒng)計(jì)圖表,使地圖析出更加序化。
文獻(xiàn)學(xué)科內(nèi)容的主題概念是標(biāo)引的主要對(duì)象,地理名稱標(biāo)目是重要檢索點(diǎn)。607字段記錄了某一行政管轄區(qū)名稱、某一自然地域的地名、某一歷史地域的地名等。一方面,注重?cái)?shù)據(jù)元素來源的規(guī)范性和數(shù)據(jù)元素之間的關(guān)聯(lián)度,明確主題詞規(guī)范所依據(jù)的詞表類型及人名、地名的取值范圍,有助于強(qiáng)化規(guī)范控制;[11]另一方面,對(duì)詞表中沒有的歷史地名、歷史遺址以原歷史名稱標(biāo)目,以我國(guó)習(xí)見名對(duì)江、河、湖、海、山脈等自然特征區(qū)域名稱標(biāo)目,有助于檢索語言與自然語言的結(jié)合,適應(yīng)未來RDA發(fā)展要求。
與CNMARC相比,MARC21專著性文字資料008字段18-21字符位包含圖表元素代碼“b”,300字段$b子字段包含“map”時(shí),表示該專著含有地圖。如該條記錄31字符位指示符為1,表示含有索引。測(cè)繪制圖資料008字段25字符位說明了測(cè)繪制圖資料的出版形式,比CNMARC 121字段定義的代碼更豐富;33-34字符位還對(duì)測(cè)繪制圖資料的特殊形式進(jìn)行了定義,在地圖相關(guān)制品審查中具有統(tǒng)計(jì)意義。
《韓熙載夜宴圖》是中國(guó)十大傳世名畫之一,以連環(huán)長(zhǎng)卷的方式描摹了韓府夜宴的全過程。CNMARC記錄在畫作相關(guān)研究資源分層關(guān)聯(lián)揭示上具有重要意義,通過對(duì)CNMARC記錄檢索可以發(fā)現(xiàn)以下幾點(diǎn)。
(1) 《顧閎中·韓熙載夜宴圖》(2016)含摹真,高31cm,經(jīng)折裝。北京師范大學(xué)(代碼211260)、淮陰師范學(xué)院(代碼232370)都藏有該書,前者不提供館際互借,后者提供返還式館際互借。
(2)電子資源《韓熙載夜宴圖:古代諜報(bào)史上的藝術(shù)佳作》(DVD,NTSC3.58)載體形態(tài)為光盤,播放時(shí)長(zhǎng)39分鐘,內(nèi)容涉及古畫鑒賞、歷史事件等。
(3)鄭振鐸的鋼筆手稿《五代顧閎中畫韓熙載夜宴圖》被中國(guó)國(guó)家圖書館收藏。
(4) 《韓熙載夜宴圖》的相關(guān)研究——學(xué)位論文。328學(xué)位論文附注字段揭示了研究者學(xué)位、所屬學(xué)科、專業(yè)、學(xué)位授予單位、學(xué)位授予時(shí)間等相關(guān)信息。
(5) 《韓熙載夜宴圖》圖像志考(2014)以中國(guó)畫繪畫研究為主題,含彩圖、肖像、摹真,有書目和索引。
在美術(shù)評(píng)論、工筆畫/人物畫技法研究中,分析級(jí)文獻(xiàn)(又稱析出文獻(xiàn))具有重要的參考價(jià)值。分析級(jí)文獻(xiàn)指檢索時(shí)要通過另一個(gè)書目及其所在位置識(shí)別的文獻(xiàn),如,專著的某一章節(jié)或期刊的某篇文章,多層析出文獻(xiàn)包含兩個(gè)以上子析出文獻(xiàn)。CNMARC要求析出文獻(xiàn)不僅要著錄析出文獻(xiàn)本身,還應(yīng)包括連接單元、宿主文獻(xiàn)的標(biāo)識(shí)、析出文獻(xiàn)在宿主文獻(xiàn)中的準(zhǔn)確位置(常用頁(yè)碼表示)幾部分。[12]有明確責(zé)任者(顧閎中)的作品(《韓熙載夜宴圖》)為在編文獻(xiàn)《臆說〈韓熙載夜宴圖〉》的研究對(duì)象時(shí),采用604名稱與題名主題字段,其結(jié)構(gòu)與4XX連接款目類似,將著作名稱記錄在$1內(nèi)嵌套的500統(tǒng)一題名字段,著者名稱記錄在$1內(nèi)嵌套的7XX知識(shí)責(zé)任字段,便于建立文獻(xiàn)間關(guān)聯(lián)。隨著數(shù)據(jù)庫(kù)技術(shù)及應(yīng)用的發(fā)展,對(duì)特色文獻(xiàn)進(jìn)行全文掃描并提供網(wǎng)絡(luò)檢索、圖像識(shí)別,使篇目中的照片、圖版,地圖集中的單幅輿圖、圖片等析出文獻(xiàn)通過856字段建立關(guān)聯(lián),能方便讀者反復(fù)查閱。
對(duì)美術(shù)作品的相關(guān)研究機(jī)構(gòu)、研究者、研究文獻(xiàn)、臨摹人、臨摹作品收藏地、臨摹作品收藏者、拍攝者、圖片處理信息等元素進(jìn)行規(guī)范描述并分層關(guān)聯(lián),有助于通過典籍間的關(guān)系考證實(shí)現(xiàn)知識(shí)溯源。中文個(gè)人名稱標(biāo)目由主標(biāo)目及其附加成分(限制性信息)組成。普通漢語名稱標(biāo)目(直序式)為區(qū)分同名同姓的人物,附加生卒年;筆名、藝名標(biāo)目(直序式)也會(huì)附加生卒年。如,畫家朱耷(1626-約1705年),號(hào)八大山人。在600個(gè)人名稱主題標(biāo)目時(shí),朱耷、八大山人都可作個(gè)人名稱的款目要素,都是規(guī)范檢索點(diǎn)。CLC K82-64類目集中了中國(guó)人物的生卒年表、疑年表、年譜。200字段$f、$g子字段按照規(guī)定信息源照實(shí)著錄了對(duì)文獻(xiàn)的知識(shí)內(nèi)容負(fù)主要責(zé)任的個(gè)人或團(tuán)體,$f著錄第一責(zé)任說明、$g著錄其他責(zé)任說明。7XX知識(shí)責(zé)任者塊一般將繪畫者、攝影者、臨摹者記錄在701、711、721字段,插圖者、插畫者記錄在 702、712、722字段,通過$4子字段的關(guān)系詞代碼說明。7XX責(zé)任者標(biāo)目的對(duì)應(yīng)附注記錄在314字段。對(duì)個(gè)人與文獻(xiàn)間責(zé)任關(guān)系的記錄方便下一步資源連接。
拓片是記錄中國(guó)古代文化的重要載體,為語言文字、書法、篆刻等相關(guān)學(xué)科發(fā)展提供研究素材。如,甲骨文字?jǐn)?shù)量多、字符繁復(fù)并具圖畫結(jié)構(gòu),甲骨拓片字形特征提取是計(jì)算機(jī)輔助甲骨學(xué)研究的關(guān)鍵,尋找拓片是應(yīng)用數(shù)學(xué)形態(tài)學(xué)方法進(jìn)行圖像處理與分析、提取甲骨拓片字形特征指標(biāo)的前提。[13]CALIS使用CNMARC對(duì)拓片的物理特征進(jìn)行代碼描述,著錄規(guī)則參閱《中國(guó)文獻(xiàn)編目規(guī)則》第五章“金石拓片”。與專著性文字資料相比,金石拓片的規(guī)定信息源、主要信息源多取自拓片整體:如,題名一般根據(jù)所題文字?jǐn)M定,器物主人或出資制作器物者加器物名稱;墓主、碑主姓名及寺、觀、廟、堂名稱加石刻形式;題名、題記加題名、題字詞、題記形式;圖像、圖所在地或其內(nèi)容加畫像、圖形等。責(zé)任說明包括撰文者、書篆者、鐫刻者及其責(zé)任方式。常用版本名稱包括傳拓朝代+拓本、影印本、石刻本、縮印本等,版本說明的著錄內(nèi)容應(yīng)作考證,考證依據(jù)須在附注項(xiàng)說明,器物出土的地點(diǎn)、時(shí)間、收藏者也著錄于附注項(xiàng)。尺寸是著墨部分的尺寸,著錄為“長(zhǎng)×寬”,不足1cm以1cm計(jì)算。
對(duì)于拓片CNMARC記錄頭標(biāo)區(qū)06字符位選用代碼u,200題名與責(zé)任說明字段$b一般資料標(biāo)識(shí)子字段著錄“拓片”。191字段反映了拓片的基本物理形態(tài)特征,以所拓制的原文獻(xiàn)所屬資料類別將拓片分為甲骨、金屬、玉、石、陶、竹六大類,當(dāng)2-3字符位取值aa或ac表示拓片來源為龜骨或獸骨。191字段與690字段相對(duì)應(yīng),從CLC來看古書契集中在K877下的類目,并與H121古文字學(xué),J292.2碑帖、書法作品,J292.4篆刻、治印及作品、K879.3古代雕塑研究密切相關(guān)。除了原始拓片,拓片圖錄、文字、題跋索引也具有較高的文獻(xiàn)史料價(jià)值,如Z89:K877組配復(fù)分類目下的專著。
為保證國(guó)家數(shù)字圖書館拓片元數(shù)據(jù)在功能、數(shù)據(jù)結(jié)構(gòu)、格式、語義、語法等方面的一致性、整體性及大范圍互操作和數(shù)據(jù)共享,國(guó)家圖書館采用了24個(gè)元素,包括14個(gè)核心元素、6個(gè)古文獻(xiàn)類型核心元素、4個(gè)拓片個(gè)別元素,并擴(kuò)展了元素修飾詞及編碼體系修飾詞,實(shí)現(xiàn)對(duì)拓片原物及由拓片原物復(fù)制轉(zhuǎn)換而成的數(shù)字化拓片資源的精確描述。[14]如,對(duì)核心元素“題名”的元素修飾詞拓展了首題、額題、陰首題、陰額題、蓋題、中題、尾題;對(duì)“相關(guān)資源”的元素修飾詞拓展了金石原物、拓片底本、合刻、合拓、合裱、合訂、叢編、子目、書目文獻(xiàn)、錄文,編碼體系修飾詞拓展為URI。對(duì)古文獻(xiàn)類型核心元素“收藏歷史”的元素修飾詞拓展了獲得方式、題跋印記;對(duì)“文獻(xiàn)保護(hù)”的元素修飾詞拓展了文物級(jí)別、破損級(jí)別。對(duì)拓片個(gè)別元素“書刻特征”的元素修飾詞拓展了書體、鐫刻特征、銘文行款、字?jǐn)?shù)。元素的專指性、精確性提升了元數(shù)據(jù)的分析應(yīng)用價(jià)值。由于復(fù)用了DC標(biāo)準(zhǔn),為XML環(huán)境下拓片元數(shù)據(jù)與MARC記錄的交換處理創(chuàng)造了條件。