內(nèi)容摘要:敦煌是絲綢之路上的重鎮(zhèn),古代多種文化在此交融、碰撞。由于特有的歷史、風(fēng)土條件,以原藏于莫高窟第17窟的遺書(shū)為代表,敦煌保存了大批古代遺書(shū)。敦煌遺書(shū)的發(fā)現(xiàn),是近代重大學(xué)術(shù)發(fā)現(xiàn)之一,引起世界的高度重視,促成了敦煌學(xué)的誕生。但是,敦煌遺書(shū)數(shù)量巨大,形態(tài)復(fù)雜,蘊(yùn)藏的研究信息十分豐富,為編目工作帶來(lái)極大的困難。本論文介紹為解決這一困難所建設(shè)的敦煌遺書(shū)數(shù)據(jù)庫(kù)。相信這一數(shù)據(jù)庫(kù)的最終完成并上網(wǎng)公布,將為敦煌研究者提供實(shí)用、高效的研究平臺(tái)。
關(guān)鍵詞:敦煌遺書(shū);數(shù)據(jù)庫(kù);敦煌研究平臺(tái)
中圖分類(lèi)號(hào):K870.6;TP393.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1000-4106(2010)05-0119-06
一、導(dǎo) 言
全世界所藏漢文敦煌遺書(shū)的總數(shù)為58000余號(hào),至今缺乏一個(gè)完整、翔實(shí)、實(shí)用的總目錄。敦煌遺書(shū)兼具文物、文獻(xiàn)、文字三方面的研究?jī)r(jià)值。蘊(yùn)藏的研究信息量極為龐大。敦煌遺書(shū)的形態(tài)極其復(fù)雜,所蘊(yùn)藏的研究信息的形態(tài)也極其復(fù)雜。以上兩點(diǎn),為全面著錄敦煌遺書(shū)、進(jìn)行編目帶來(lái)極大的困難。現(xiàn)代數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,使利用數(shù)據(jù)庫(kù)進(jìn)行敦煌遺書(shū)編目成為可能,但如何建設(shè)一個(gè)符合敦煌遺書(shū)實(shí)際情況的數(shù)據(jù)庫(kù)。依然是我們面臨的重大課題。2005年,國(guó)際敦煌學(xué)界曾經(jīng)齊聚在上海師范大學(xué),專(zhuān)題討論有關(guān)建設(shè)“敦煌知識(shí)庫(kù)”的問(wèn)題。會(huì)議論文結(jié)集為《敦煌學(xué)知識(shí)庫(kù)學(xué)術(shù)論文集》,2006年由上海古籍出版社出版。會(huì)議的召開(kāi),說(shuō)明建設(shè)數(shù)據(jù)庫(kù)進(jìn)行敦煌遺書(shū)編目與研究已經(jīng)成為敦煌學(xué)界的共識(shí)。
筆者長(zhǎng)期從事敦煌遺書(shū)的調(diào)查與編目。20世紀(jì)80年代后半期,曾經(jīng)將黃永武《敦煌遺書(shū)最新目錄》輸入計(jì)算機(jī),編撰為《敦煌遺書(shū)索引》。這個(gè)索引,類(lèi)似于后來(lái)釋禪叡編纂的《敦煌寶藏遺書(shū)索引》。眾所周知,80年代后半期計(jì)算機(jī)漢字字庫(kù)的數(shù)量有限,故當(dāng)時(shí)不少字只好用符號(hào)替代,加上其他一些原因,那個(gè)《敦煌遺書(shū)索引》的內(nèi)容比較簡(jiǎn)單,只有典籍名稱與卷號(hào)兩項(xiàng),只能滿足簡(jiǎn)單的檢索。所以完成以后沒(méi)有公開(kāi)發(fā)表,僅供個(gè)人參考使用。其后,隨著數(shù)據(jù)庫(kù)技術(shù)的日益發(fā)展,筆者開(kāi)始設(shè)想利用數(shù)據(jù)庫(kù)從事敦煌遺書(shū)編目。第一個(gè)數(shù)據(jù)庫(kù)開(kāi)發(fā)于20世紀(jì)90年代末,到2003年升級(jí)為4.2版本。版本雖然升到4.2,結(jié)構(gòu)與功能卻始終比較簡(jiǎn)單,只能從事一些簡(jiǎn)單的比較與查詢,嚴(yán)格地講,還不能算是一個(gè)真正的數(shù)據(jù)庫(kù),所以命名為“敦煌目錄索引程序”。2005年的敦煌知識(shí)庫(kù)國(guó)際學(xué)術(shù)研討會(huì)上,曾以《敦煌遺書(shū)編目所用數(shù)據(jù)庫(kù)及數(shù)據(jù)》為題進(jìn)行介紹,論文也已收入會(huì)議論文集。本文則擬介紹筆者近年開(kāi)發(fā)的第二個(gè)敦煌遺書(shū)數(shù)據(jù)庫(kù)。這個(gè)數(shù)據(jù)庫(kù)從2006年底開(kāi)始設(shè)計(jì),經(jīng)過(guò)一年的醞釀,2007年底正式啟動(dòng)?,F(xiàn)在已經(jīng)完成第一期工程。這個(gè)數(shù)據(jù)庫(kù)的功能比前一個(gè)數(shù)據(jù)庫(kù)大為增強(qiáng),包括按照各種條件輸入、加工、檢索、輸出敦煌遺書(shū)中的各種數(shù)據(jù)。由于它已經(jīng)基本具備數(shù)據(jù)庫(kù)的功能,故命名為“敦煌遺書(shū)數(shù)據(jù)庫(kù)”。目前正在完善第一期工程的數(shù)據(jù)建設(shè),規(guī)劃開(kāi)發(fā)第二期工程。計(jì)劃最終將這個(gè)數(shù)據(jù)庫(kù)建設(shè)成敦煌學(xué)研究的實(shí)用平臺(tái)。
本文簡(jiǎn)單介紹“敦煌遺書(shū)數(shù)據(jù)庫(kù)”已經(jīng)完成的第一期工程的現(xiàn)狀。包括它的各種工作界面、所容納的信息類(lèi)別、各種功能以及怎樣利用該數(shù)據(jù)庫(kù)加工、查閱、輸出相關(guān)數(shù)據(jù)等。
二、敦煌遺書(shū)數(shù)據(jù)庫(kù)簡(jiǎn)介
“敦煌遺書(shū)數(shù)據(jù)庫(kù)”分為兩期完成。第一期的開(kāi)發(fā)目的是為編纂《敦煌遺書(shū)總目錄》服務(wù)。所輸入與儲(chǔ)存的數(shù)據(jù)為從文物、文獻(xiàn)、文字等三個(gè)方面對(duì)敦煌遺書(shū)所作的各項(xiàng)著錄,編目時(shí)參考各種相關(guān)照片及研究資料??商峁└鞣N在庫(kù)數(shù)據(jù)的修訂、檢索、查詢功能。至于數(shù)據(jù)的輸出。目前默認(rèn)為編纂、出版大型圖錄《國(guó)家圖書(shū)館藏敦煌遺書(shū)》所需的條記目錄、卷首目錄、標(biāo)版目錄,以及編纂《敦煌遺書(shū)總目錄》所需的流水目錄、分類(lèi)解說(shuō)目錄及各種索引,但也可以根據(jù)需要輸出其他各種數(shù)據(jù)。第二期將擴(kuò)展為敦煌學(xué)研究平臺(tái),屆時(shí)擬進(jìn)一步完善圖片數(shù)據(jù)與文字?jǐn)?shù)據(jù)的鏈接、加入敦煌遺書(shū)研究數(shù)據(jù)、并開(kāi)發(fā)各種專(zhuān)題研究平臺(tái)乃至與研究者的互動(dòng)平臺(tái)等。
目前第一期中的數(shù)據(jù)庫(kù)架構(gòu)已基本完成,數(shù)據(jù)的完善還在進(jìn)行。已經(jīng)可以進(jìn)行敦煌遺書(shū)原始數(shù)據(jù)的導(dǎo)入、改錯(cuò)與刪除。可在數(shù)據(jù)庫(kù)中按照各種默認(rèn)條件查看數(shù)據(jù)及照片,進(jìn)行數(shù)據(jù)的修訂??梢栽O(shè)定各種條件并進(jìn)行資料的檢索、查詢??梢园凑疹A(yù)設(shè)要求自動(dòng)為各種文獻(xiàn)進(jìn)行加工,諸如加上分類(lèi)號(hào)并對(duì)文獻(xiàn)進(jìn)行分類(lèi)??砂凑疹A(yù)設(shè)要求采集各種詞語(yǔ)以制作索引,并可在各被索引詞語(yǔ)間建立起相互關(guān)系。可以進(jìn)行敦煌遺書(shū)綴殘的提示,并在人工綴殘的基礎(chǔ)上,進(jìn)一步進(jìn)行多號(hào)殘卷的綴殘??梢园凑詹煌囊螅瑢⒏黝?lèi)數(shù)據(jù)按照一定的格式輸出為滿足不同研究需要的文本式或表格式的word文件。
“敦煌遺書(shū)數(shù)據(jù)庫(kù)”主界面如下圖1:
主界面上邊列有主菜單,共有八項(xiàng):文件、數(shù)據(jù)導(dǎo)人、數(shù)據(jù)查看、綴殘?zhí)幚?、索引處理、相關(guān)數(shù)據(jù)、系統(tǒng)、退出。數(shù)據(jù)庫(kù)現(xiàn)有的各項(xiàng)功能均以主菜單為基礎(chǔ)展開(kāi)。
三、敦煌遺書(shū)數(shù)據(jù)庫(kù)的有關(guān)功能
(一)原始數(shù)據(jù)的導(dǎo)入、改錯(cuò)與刪除
所謂“原始數(shù)據(jù)”,分為基礎(chǔ)數(shù)據(jù)與補(bǔ)充數(shù)據(jù)等兩種形式。
基礎(chǔ)數(shù)據(jù)指按照規(guī)定格式編纂,以word文本存盤(pán),且未作內(nèi)容刪節(jié)的敦煌遺書(shū)條記目錄。按照目前的著錄體例,該條記目錄從1.1項(xiàng)到14.3項(xiàng),共設(shè)定為14個(gè)大項(xiàng)、37個(gè)小項(xiàng),全面著錄每件敦煌遺書(shū)的文物、文獻(xiàn)、文字等三個(gè)方面乃至流傳、研究的各種資料。實(shí)際著錄時(shí)采取有則著錄,無(wú)則空缺的原則,故每件遺書(shū)未必都具備37項(xiàng)。
補(bǔ)充數(shù)據(jù)指按照規(guī)定格式編纂,以word文本存盤(pán),僅包含部分特定項(xiàng)目的敦煌遺書(shū)條記目錄。
之所以產(chǎn)生上述兩種不同的原始數(shù)據(jù),原因在于現(xiàn)行的編目方式。目前的編目工作,有的依據(jù)原卷進(jìn)行,這時(shí)可以詳細(xì)著錄各種數(shù)據(jù),包括遺書(shū)的文物、文獻(xiàn)、文字等三方面數(shù)據(jù)。有的依據(jù)圖錄進(jìn)行。這時(shí)只能著錄遺書(shū)的文獻(xiàn)、文字?jǐn)?shù)據(jù)。有時(shí)限于各種條件,甚至只能著錄關(guān)于文獻(xiàn)、文字的部分?jǐn)?shù)據(jù)。這樣,不同的遺書(shū),有時(shí)存在數(shù)據(jù)缺失問(wèn)題。這些缺失的數(shù)據(jù),只能等將來(lái)有條件時(shí),再行補(bǔ)人。即使按照原卷進(jìn)行著錄的遺書(shū),有時(shí)候也需要將部分項(xiàng)目。比如錄文等暫且放一放,待另行完成后補(bǔ)入;或者先做一個(gè)草稿,待修訂以后重新輸入。由此產(chǎn)生較為完整的基礎(chǔ)數(shù)據(jù)與待后輸入的補(bǔ)充數(shù)據(jù)這樣兩種不同的原始數(shù)據(jù)。
基礎(chǔ)數(shù)據(jù)可以一次性輸入,補(bǔ)充數(shù)據(jù)則往往需要以后再輸入,乃至多次輸入。后期輸入的補(bǔ)充數(shù)據(jù)。不能沖擊已經(jīng)存于數(shù)據(jù)庫(kù)的基礎(chǔ)數(shù)據(jù),而應(yīng)與基礎(chǔ)數(shù)據(jù)合為一體。為了達(dá)到上述目的,設(shè)計(jì)了“全部條目導(dǎo)入”、“部分條目導(dǎo)人”兩種數(shù)據(jù)導(dǎo)入方式。
點(diǎn)擊主界面上“數(shù)據(jù)導(dǎo)入”,出現(xiàn)“全部條目導(dǎo)入”與“部分條目導(dǎo)入”兩個(gè)選項(xiàng)。下面是“原始著錄數(shù)據(jù)導(dǎo)人一全部條目”的界面,可以進(jìn)行基礎(chǔ)數(shù)據(jù)的導(dǎo)入、改錯(cuò)與刪除。
導(dǎo)入方法:在上述界面左邊的兩個(gè)窗口中,選擇需要導(dǎo)入的關(guān)聯(lián)word文件,點(diǎn)擊“增加”按鈕。這一文件便加入右邊窗口。然后點(diǎn)擊“數(shù)據(jù)整理”按鈕即可。
在這一界面所進(jìn)行的“改錯(cuò)”,實(shí)際并不涉及原始數(shù)據(jù)本身的對(duì)錯(cuò),而是指原始數(shù)據(jù)的格式不符合數(shù)據(jù)庫(kù)的輸入規(guī)范,需要修改。
1984年剛開(kāi)始從事敦煌遺書(shū)編目,我已經(jīng)意識(shí)到將來(lái)有利用計(jì)算機(jī)進(jìn)行數(shù)據(jù)加工的可能,因此在設(shè)計(jì)著錄體例時(shí),采用條記目錄的方式,并規(guī)定了必要的著錄格式。但隨著對(duì)敦煌遺書(shū)及其編且工作認(rèn)識(shí)的不斷深化,著錄體例也在不斷修訂。加之原始數(shù)據(jù)最初由人工完成,且多人常年參加編目,每個(gè)人、某個(gè)人的不同時(shí)間對(duì)體例的理解不一定完全正確與一致,原稿的體例就難免會(huì)有差異。手寫(xiě)原稿完成幾年后,才請(qǐng)人將之錄入計(jì)算機(jī),移錄過(guò)程中難免出現(xiàn)魚(yú)魯之訛。又過(guò)了幾年,才設(shè)計(jì)出數(shù)據(jù)庫(kù),并將計(jì)算機(jī)稿輸入數(shù)據(jù)庫(kù)。如此等等,現(xiàn)有的原始數(shù)據(jù)。頗有著錄格式不符合現(xiàn)有數(shù)據(jù)庫(kù)要求的情況。就數(shù)據(jù)庫(kù)而言。凡是格式不合要求的數(shù)據(jù),如果項(xiàng)號(hào)無(wú)誤,數(shù)據(jù)庫(kù)還可以識(shí)別并讀入;如果項(xiàng)號(hào)有誤,則數(shù)據(jù)庫(kù)無(wú)法識(shí)別并讀入。為了解決這一問(wèn)題,我們這樣設(shè)計(jì):無(wú)論數(shù)據(jù)庫(kù)能否識(shí)別該數(shù)據(jù)。如果格式有錯(cuò)誤,數(shù)據(jù)庫(kù)一律記錄下來(lái)。每一個(gè)關(guān)聯(lián)的word文件讀入以后,只要點(diǎn)擊“出錯(cuò)記錄”按鈕,數(shù)據(jù)庫(kù)將給出錯(cuò)誤提示。這樣。可以按照錯(cuò)誤提示逐一修訂,直到所有的原始數(shù)據(jù)都符合數(shù)據(jù)庫(kù)輸入規(guī)范。全部輸入數(shù)據(jù)庫(kù)為止。
敦煌遺書(shū)編目往往會(huì)遇到這種情況:某件遺書(shū)原來(lái)作為一號(hào)著錄,但后來(lái)經(jīng)過(guò)研究,發(fā)現(xiàn)該遺書(shū)實(shí)際包含兩個(gè)文獻(xiàn),應(yīng)該分作兩號(hào)?;蛘呦喾?,原來(lái)作為兩號(hào)著錄的遺書(shū),后來(lái)發(fā)現(xiàn)應(yīng)該歸并為一號(hào)。這時(shí),需要在數(shù)據(jù)庫(kù)中增加或刪除一號(hào)。為此設(shè)計(jì)了單獨(dú)增加某條數(shù)據(jù)或刪除某條數(shù)據(jù)的功能。這個(gè)功能在“數(shù)據(jù)查看”界面中實(shí)現(xiàn),這里不介紹。
所謂“刪除”,包括刪除提供原始數(shù)據(jù)的word文件與刪除數(shù)據(jù)庫(kù)中的數(shù)據(jù)兩種功能。
以前設(shè)計(jì)第一個(gè)數(shù)據(jù)庫(kù)時(shí)。編目工作以word文件為主。數(shù)據(jù)庫(kù)本身只起輔助功能。所以關(guān)聯(lián)的word文件不能隨便刪除,一旦刪除,數(shù)據(jù)庫(kù)無(wú)法運(yùn)作。不僅如此,關(guān)聯(lián)的word文件也不能隨便改動(dòng),略微有所改動(dòng),就需要將文件重新讀人數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)才能正常運(yùn)作。而第二個(gè)數(shù)據(jù)庫(kù)思路相反,編目工作以數(shù)據(jù)庫(kù)為主。數(shù)據(jù)庫(kù)可以隨時(shí)依據(jù)不同需要生成各種新的word文件。所以。作為提供原始數(shù)據(jù)的word文件一旦讀入數(shù)據(jù)庫(kù),除了備查之外,已經(jīng)喪失作用。隨時(shí)可以刪除。關(guān)聯(lián)word文件的刪除,不妨礙數(shù)據(jù)庫(kù)的正常運(yùn)行。
數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以批量刪除,也可以單條或單項(xiàng)刪除。
批量刪除的方法有兩種:
第一種,在上述界面右邊的窗口中,用光標(biāo)定義需要?jiǎng)h除的關(guān)聯(lián)word文件,點(diǎn)擊“刪除”按鈕,便可以將該文件所涉及卷號(hào)的所有數(shù)據(jù)一并刪除。亦即不僅將關(guān)聯(lián)的word文件提供的原始數(shù)據(jù)全部刪除,并將數(shù)據(jù)庫(kù)在這些原始數(shù)據(jù)基礎(chǔ)上所做的修訂一并刪除。
第二種,編纂新的關(guān)聯(lián)的word文件,文件名與路徑與原文件相同。即覆蓋原文件。在上述界面右邊的窗口中,用光標(biāo)定義該文件。然后點(diǎn)擊“數(shù)據(jù)整理”按鈕,此時(shí)數(shù)據(jù)庫(kù)重新讀入關(guān)聯(lián)的word文件,并用新數(shù)據(jù)覆蓋全部舊數(shù)據(jù)。
單條數(shù)據(jù)及單項(xiàng)數(shù)據(jù)的刪除,也在“數(shù)據(jù)查看”界面實(shí)現(xiàn),這里不介紹。
“原始著錄數(shù)據(jù)導(dǎo)入-部分條目”的界面,可以進(jìn)行補(bǔ)充數(shù)據(jù)的導(dǎo)入、改錯(cuò)與刪除。
補(bǔ)充數(shù)據(jù)導(dǎo)人、改錯(cuò)與刪除的操作方式與“原始著錄數(shù)據(jù)導(dǎo)入-全部條目”的基本相同。
(二)數(shù)據(jù)的查看與修訂
點(diǎn)擊主界面上“數(shù)據(jù)查看”按鈕,可進(jìn)入“查看源目錄數(shù)據(jù)”界面。
該界面上邊有16個(gè)按鈕:刷新、刪除、關(guān)閉、查看全部、條件查詢、查看修改、導(dǎo)出到word、條件導(dǎo)出、批量更新、現(xiàn)數(shù)據(jù)清回車(chē)、現(xiàn)首尾對(duì)照規(guī)范、現(xiàn)數(shù)據(jù)切分、全部數(shù)據(jù)切分、首尾對(duì)照錯(cuò)誤導(dǎo)出、現(xiàn)數(shù)據(jù)分類(lèi)號(hào)處理、看圖,此外。在“條件查詢”與“查看修改”按鈕之間,還有一個(gè)下拉式菜單,以上總計(jì)17項(xiàng),分別承擔(dān)各種功能。比如數(shù)據(jù)讀入之后,首先需要進(jìn)行“現(xiàn)數(shù)據(jù)清回車(chē)”、“現(xiàn)數(shù)據(jù)切分”、“現(xiàn)首尾對(duì)照規(guī)范”等三項(xiàng)預(yù)備性操作,才能正確地查看與修訂數(shù)據(jù)。
按鈕下為一長(zhǎng)條計(jì)數(shù)條。統(tǒng)計(jì)下面表格共列出多少條數(shù)據(jù),當(dāng)前為第幾條。
計(jì)數(shù)條下為每號(hào)敦煌遺書(shū)的表列數(shù)據(jù)。表列數(shù)據(jù)共有48項(xiàng):編號(hào)、分類(lèi)號(hào)、經(jīng)名卷本卷次、(卷次)、參考號(hào)l、參考號(hào)2、參考號(hào)3、參考號(hào)4、參考號(hào)5、總體數(shù)據(jù)、每紙數(shù)據(jù)、外觀性描述、(裝幀形式)、(首尾存況)、多主體著錄、多主體關(guān)系、首部文字對(duì)照、(首對(duì)照-存況)、(首對(duì)照-對(duì)照本)、(首對(duì)照-對(duì)照細(xì)節(jié))、尾部文字對(duì)照、(尾對(duì)照-存況)、(尾對(duì)照-對(duì)照本)、(尾對(duì)照-對(duì)照細(xì)節(jié))、錄文、說(shuō)明、首題、尾題、異同、首綴接、尾綴接、首集合、尾集合、題記、印章、雜寫(xiě)、護(hù)首扉頁(yè)、年代、二次加工、收藏鑒賞、圖版、揭裱互見(jiàn)、備注、格式、問(wèn)題、數(shù)據(jù)、更新時(shí)間。實(shí)際是上述14個(gè)大項(xiàng)、37個(gè)小項(xiàng)的擴(kuò)展。其中帶括號(hào)者為重復(fù)項(xiàng),供數(shù)據(jù)切分及檢索用。這48項(xiàng)數(shù)據(jù),均可順序或逆序進(jìn)行排序。框格的長(zhǎng)度、寬度都可以根據(jù)需要調(diào)節(jié)。
由于表列數(shù)據(jù)項(xiàng)目很多。一屏無(wú)法顯示。可利用滾動(dòng)條顯示。也可點(diǎn)擊左下小三角前的豎杠,把表格分為N個(gè)界面來(lái)回拖動(dòng),進(jìn)行數(shù)據(jù)的對(duì)照。
如果點(diǎn)擊“查看全部”??梢圆榭磾?shù)據(jù)庫(kù)中儲(chǔ)存的所有數(shù)據(jù)。也可以點(diǎn)擊“條件查詢”。按照設(shè)定查看自己需要的數(shù)據(jù)。下面是點(diǎn)擊“條件查詢”后出現(xiàn)的“設(shè)定查詢條件”界面。選項(xiàng)共有八種,可以單獨(dú)使用,也可以匹配使用;其中七種附有下拉式菜單,可利用下拉式菜單選擇,也可以自行填寫(xiě)。
(1)收藏單位:不選擇“收藏單位”,則默認(rèn)全部數(shù)據(jù)。
(2)編號(hào)范圍:前后兩個(gè)框,可以選擇某一段編號(hào),即查詢某一編號(hào)段的敦煌遺書(shū);也可以為同一個(gè)編號(hào),即查詢某一號(hào)敦煌遺書(shū)。如均不選擇,則默認(rèn)全部編號(hào)。
(3)分類(lèi)號(hào):前后兩個(gè)框,使用方法與編號(hào)同。
(4)文獻(xiàn)名:輸入文獻(xiàn)名后,可利用“包含”、“精確”、“排除”等選項(xiàng)進(jìn)行查找。如不選擇,則默認(rèn)全部文獻(xiàn)。
(5)年代:前后兩個(gè)框,使用方法與編號(hào)同。
(6)更新時(shí)間:更新時(shí)間指數(shù)據(jù)更新時(shí)間。前后兩個(gè)框,使用方法與編號(hào)同。
(7)參考號(hào):可通貫5個(gè)參考號(hào),模糊查找所需遺書(shū)。如果限定在某個(gè)參考號(hào),則應(yīng)該用“指定條目”。
(8)指定條目:是個(gè)用處最為廣泛的工具,所指定條目范圍涵蓋全部14個(gè)大項(xiàng)、37個(gè)小項(xiàng)。選定條目后,在下面的框中輸入檢索條件,并可利用“包含”、“精確”、“排除”等選項(xiàng),在指定的范圍內(nèi)進(jìn)行檢索、查詢。為了更好地發(fā)揮“指定條目”的檢索功能。設(shè)定l到8個(gè)復(fù)選框,可以匹配使用。
條件設(shè)定完畢,點(diǎn)擊“確認(rèn)查詢”,就可以查看所需數(shù)據(jù)。
在查詢某類(lèi)遺書(shū)后,如擬查看某號(hào)遺書(shū)的具體數(shù)據(jù),可將光標(biāo)指向該號(hào)遺書(shū),并確認(rèn)下拉式菜單處在“全部條目”的位置,然后點(diǎn)擊“查看修改”即可彈出界面。在界面點(diǎn)擊“編輯”,可以進(jìn)行數(shù)據(jù)的修訂、養(yǎng)護(hù)。為了方便修訂,其中大部分框格,均可雙擊放大。對(duì)于帶有普遍特征的錯(cuò)誤,則可以利用批量更新方法一次性修改。
數(shù)據(jù)庫(kù)中存放了一些照片,如果在“查看源目錄數(shù)據(jù)”界面光標(biāo)指向某條數(shù)據(jù)時(shí),“看圖”按鈕變紅,表示該號(hào)有照片存放。此時(shí)點(diǎn)擊“看圖”,會(huì)彈出照片窗口。并可以放大查看。
(三)敦煌遺書(shū)分類(lèi)
計(jì)劃中的《敦煌遺書(shū)總目錄》是一個(gè)分類(lèi)解說(shuō)目錄,分類(lèi)法在拙作《敦煌漢文遺書(shū)分類(lèi)法(草案)附說(shuō)明》設(shè)計(jì)的分類(lèi)法基礎(chǔ)上,吸收各方意見(jiàn)修訂而成。為了讓計(jì)算機(jī)自動(dòng)給不同文獻(xiàn)賦予相應(yīng)的分類(lèi)號(hào)。特意編制了輔助文件《諸經(jīng)起訖》。
在“查看源目錄數(shù)據(jù)”界面,點(diǎn)擊“現(xiàn)數(shù)據(jù)分類(lèi)號(hào)處理”,數(shù)據(jù)庫(kù)會(huì)按照《諸經(jīng)起訖》中的預(yù)先設(shè)定。對(duì)符合經(jīng)名卷本條件者給予分類(lèi)號(hào)或者更改錯(cuò)誤分類(lèi)號(hào),遇到《諸經(jīng)起訖》中沒(méi)有的經(jīng)名卷本,則納入《諸經(jīng)起訖》。這樣,通過(guò)不斷維護(hù)、更新《諸經(jīng)起訖》,可使所有的文獻(xiàn)都有一個(gè)與之相應(yīng)的分類(lèi)號(hào)。最終完成敦煌遺書(shū)的分類(lèi)。
(四)索引
翔實(shí)、便利的索引是一部學(xué)術(shù)性目錄的重要組成部分?!抖鼗瓦z書(shū)總目錄》計(jì)劃編纂十來(lái)個(gè)索引,為了完成這一任務(wù),必須先完成所索引詞語(yǔ)的采集。因此,除了可直接利用14個(gè)大項(xiàng)、37個(gè)小項(xiàng)完成的索引外,計(jì)劃從外觀、錄文、說(shuō)明、異同、題記、印章、雜寫(xiě)、護(hù)首、今人題跋、備注、格式、問(wèn)題、數(shù)據(jù)等諸項(xiàng)中采集可以成為索引對(duì)象的人名、地名(含寺院名)、職官名(含僧官名)、書(shū)名、年號(hào)、器物、糧油、藥材、牲畜、工藝、社會(huì)組織、服飾、術(shù)語(yǔ)、印章、非漢文、繪畫(huà)、神名等17種詞語(yǔ),編為索引。并努力在所索引的詞語(yǔ)中建立溝通相應(yīng)的關(guān)系,以期打破諸知識(shí)點(diǎn)之間傳統(tǒng)的平面關(guān)聯(lián),建立立體的網(wǎng)狀結(jié)構(gòu),以備將來(lái)的深入研究。
索引詞語(yǔ)的采集,采用半自動(dòng)方法。部分工作由數(shù)據(jù)庫(kù)自動(dòng)完成,主要工作還要靠人工進(jìn)行。但隨著采集量的增大,自動(dòng)化程度將越來(lái)越高。不過(guò)詞語(yǔ)之間相互聯(lián)系,依然要靠人工分析、建立。
詞語(yǔ)采集以后,點(diǎn)擊主界面“索引處理”中的“索引數(shù)據(jù)查詢”,可以得到如下界面:
點(diǎn)擊“全部數(shù)據(jù)”按鈕,得到已經(jīng)被采集的全部索引數(shù)據(jù);
點(diǎn)擊“條件查詢”按鈕,在新的窗口輸入自己需要的查詢信息。點(diǎn)擊“確認(rèn)查詢”,結(jié)果出現(xiàn)。點(diǎn)擊“導(dǎo)出到WORD”,可以將結(jié)果輸出為word文件。
考慮到數(shù)據(jù)庫(kù)中的數(shù)據(jù)正在不斷完善。所以設(shè)計(jì)“更新經(jīng)名年代”功能。如果遺書(shū)的名稱、年代有修訂,點(diǎn)擊“更新經(jīng)名年代”按鈕,索引界面中的所有遺書(shū)的經(jīng)名與年代,一律按照最新著錄,予以更新。
(五)數(shù)據(jù)輸出
如前所述,第一期工程的數(shù)據(jù)輸出首先設(shè)定為編纂《敦煌遺書(shū)總目錄》及編纂大型圖錄《國(guó)家圖書(shū)館藏敦煌遺書(shū)》的需要。
就《敦煌遺書(shū)總目錄》而言,需要輸出的數(shù)據(jù)為館藏流水目錄、分類(lèi)目錄與索引。
輸出館藏流水目錄、分類(lèi)目錄,點(diǎn)擊主菜單上“條件導(dǎo)出”按鈕,在彈出的界面即可完成。這個(gè)界面輸出功能比較強(qiáng)大。
如果在左邊第二豎欄上方選擇“全選”,可以輸出全部14個(gè)大項(xiàng)、37個(gè)小項(xiàng)的數(shù)據(jù)。舍去其中的“格式”、“問(wèn)題”、“數(shù)據(jù)”三項(xiàng),輸出以后即為《敦煌遺書(shū)總目錄》所需要的館藏流水目錄。如舍去其中的“分類(lèi)號(hào)”、“首集合”、“尾集合”、“格式”、“問(wèn)題”、“資料”等項(xiàng),輸出以后即為目前大型圖錄《國(guó)家圖書(shū)館藏敦煌遺書(shū)》所附的條記目錄。
如在小框中設(shè)定收藏單位、分類(lèi)號(hào)等,點(diǎn)擊“分類(lèi)目錄輸出”,即可以輸出分類(lèi)目錄。
此外,利用上述界面還可以輸出《國(guó)家圖書(shū)館藏敦煌遺書(shū)》所需要的卷首目錄(只包括編號(hào)與文獻(xiàn)名等)、標(biāo)版目錄,乃至各種專(zhuān)題目錄。此外。還可以在14個(gè)大項(xiàng)、37個(gè)小項(xiàng)中任意選擇所需要項(xiàng)目組合起來(lái),自由編排次序以后輸出。輸出的格式也可以自由設(shè)定。
索引輸出中,一般詞語(yǔ)的輸出,前面已經(jīng)介紹。此外,還可以點(diǎn)擊“索引處理”中的“典籍名稱索引”,在出現(xiàn)的界面輸入所要求的選項(xiàng),生成各種典籍名稱索引。
(六)敦煌遺書(shū)綴殘
敦煌遺書(shū)為敦煌古代寺院的棄藏,絕大多數(shù)均為殘卷?,F(xiàn)存五萬(wàn)八千多號(hào)漢文遺書(shū)中。約有一半為較小殘片。這些殘卷與殘片,不少相互可以綴接。敦煌遺書(shū)的綴接,以往是一件難度相當(dāng)高的工作,人們往往在諸多殘片、殘卷的檢索中無(wú)意得之?,F(xiàn)在,由于我們把敦煌遺書(shū)作為一個(gè)整體看待,基本掌握了綴殘的規(guī)律,亦即綴殘必然在相同文獻(xiàn)的相同位置進(jìn)行。且由于我們已經(jīng)為絕大多數(shù)文獻(xiàn)找到了相應(yīng)的對(duì)照本,在對(duì)照本中確定了敦煌遺書(shū)殘卷首尾相應(yīng)的位置,這樣,就可以讓數(shù)據(jù)庫(kù)按照上述規(guī)律自動(dòng)搜索有可能綴接的殘卷。為此,先編纂了一個(gè)輔助文件《綴殘參考文獻(xiàn)參數(shù)》,利用這個(gè)輔助文件與前述《諸經(jīng)起訖》,讓數(shù)據(jù)庫(kù)按照設(shè)定要求自動(dòng)搜索哪些殘卷有可能綴接,并作出提示。然后按照提示去查核原卷,看它們是否真的可以綴接。
具體的綴接結(jié)果輸入數(shù)據(jù)庫(kù)以后,可以點(diǎn)擊“綴殘生成查詢”,在如下界面查詢并輸出綴殘結(jié)果。
四、結(jié) 語(yǔ)
從1984年至今,筆者從事敦煌遺書(shū)編目已有20余年。目前,北京圖書(shū)館編目的定稿工作正在收尾;英國(guó)圖書(shū)館的編目的初稿已經(jīng)完成,尚待定稿;法國(guó)、俄國(guó)敦煌遺書(shū)的編目也已經(jīng)完成初稿,但缺失文物因素的著錄;散藏敦煌遺書(shū)的調(diào)查與編目也正在進(jìn)行。因此,雖然數(shù)據(jù)庫(kù)中已經(jīng)儲(chǔ)存6萬(wàn)多號(hào)數(shù)據(jù),實(shí)際并不完整。由于時(shí)間漫長(zhǎng),前后體例有修訂、選用對(duì)照本有變化等種種因素,使得庫(kù)中數(shù)據(jù)尚需大規(guī)模修訂,才能真正提供給學(xué)術(shù)界。包括本文列舉的上述數(shù)據(jù),都不是最后的定稿,僅供參考。因此,一個(gè)單位、一個(gè)單位地完成編目定稿,進(jìn)一步完善數(shù)據(jù)庫(kù)中的數(shù)據(jù),是近期努力的目標(biāo)。
此外,目前正在規(guī)劃數(shù)據(jù)庫(kù)的第二期工程。打算盡快將該數(shù)據(jù)庫(kù)由單機(jī)版提升為網(wǎng)絡(luò)版,盡快提供給敦煌學(xué)界,并力圖在與敦煌學(xué)界的互動(dòng)中,進(jìn)一步完善這個(gè)數(shù)據(jù)庫(kù),使它真正成為敦煌研究的高端平臺(tái)。
最后需要說(shuō)明的是,該《敦煌遺書(shū)數(shù)據(jù)庫(kù)》由方廣錩提出基本構(gòu)想與客戶需求,由新疆克拉瑪依石油學(xué)院網(wǎng)絡(luò)中心主任、重慶大學(xué)在讀博士研究生朱雷副教授編程,并經(jīng)兩人反復(fù)磨合、測(cè)試而成。
參考文獻(xiàn):
[1]釋禪叡,敦煌寶藏遺書(shū)索引[M],臺(tái)北:法鼓文化事業(yè)股份有限公司,1996
[2]方廣錩,敦煌漢文遺書(shū)分類(lèi)法(草案)附說(shuō)明[M],香港:中國(guó)佛教文化出版有限公司,1998