張 芳,趙 娜
(中國(guó)文字博物館,河南 安陽(yáng) 455000)
2019年11月,習(xí)近平總書記致甲骨文發(fā)現(xiàn)和研究120周年的賀信中指出,殷墟甲骨文的重大發(fā)現(xiàn)在中華文明乃至人類文明發(fā)展史上具有劃時(shí)代的意義。甲骨文是迄今為止中國(guó)發(fā)現(xiàn)的年代最早的成熟文字系統(tǒng),是漢字的源頭和中華優(yōu)秀傳統(tǒng)文化的根脈,值得倍加珍視、更好傳承發(fā)展。新形勢(shì)下,要確保甲骨文等古文字研究有人做、有傳承[1]。
甲骨文出土于河南安陽(yáng)殷墟,距今3000多年。發(fā)現(xiàn)甲骨文120年以來(lái),先后出土甲骨約15萬(wàn)片以上。經(jīng)過(guò)幾代甲骨學(xué)者的搜集、整理和研究,出版了一批工具書,內(nèi)容豐富、數(shù)量繁多?!盎ヂ?lián)網(wǎng)+”時(shí)代的到來(lái),對(duì)甲骨文數(shù)據(jù)庫(kù)的建設(shè)和利用提供了更多技術(shù)支持,也提出了更高的要求,一大批專家學(xué)者致力于將現(xiàn)有的甲骨學(xué)資料信息化處理,形成類似《說(shuō)文解字》的集大成者,方便學(xué)者快速查找資料、掌握學(xué)科發(fā)展動(dòng)向,從而為甲骨學(xué)研究提供便利,更好促進(jìn)漢字文化傳播。據(jù)《甲骨學(xué)一百年》記載,武漢大學(xué)于1985年著手將甲骨文輸入電子計(jì)算機(jī)。關(guān)于古文字信息系統(tǒng)處理的設(shè)計(jì)于1988年也取得了突破性的成果[2]。
甲骨文數(shù)據(jù)庫(kù),就是采用計(jì)算機(jī)技術(shù),將甲骨文字、與甲骨文研究相關(guān)的資料等轉(zhuǎn)化為數(shù)字化形式進(jìn)行存儲(chǔ)和組織的數(shù)據(jù)庫(kù)。目前,甲骨文的數(shù)字化主要包括以下幾個(gè)方面:(1)對(duì)甲骨拓片的圖像進(jìn)行去噪處理;(2)通過(guò)計(jì)算機(jī)技術(shù)復(fù)原甲骨拓片的字形;(3)將甲骨文點(diǎn)陣字形轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別和處理的輪廓字形;(4)實(shí)現(xiàn)甲骨文字的編碼輸入、手寫輸入和識(shí)別,使甲骨文字能夠在計(jì)算機(jī)屏幕上顯示出來(lái);(5)甲骨文的考釋和綴合;(6)甲骨文研究相關(guān)文獻(xiàn)資料的數(shù)字化。
梳理近幾十年的甲骨文數(shù)據(jù)庫(kù)建設(shè)成果,主要有三種類型。一是甲骨文字庫(kù),即甲骨文字形的數(shù)字化,包括甲骨文字的輸入、輸出及釋義;二是甲骨文資料庫(kù),即對(duì)現(xiàn)有甲骨資料如照片、圖片、摹本等的收集、錄入和檢索;三是甲骨文研究文獻(xiàn)數(shù)據(jù)庫(kù),即對(duì)甲骨文相關(guān)研究文獻(xiàn)的收錄、整理和利用。這些數(shù)據(jù)庫(kù)各有千秋,為促進(jìn)甲骨學(xué)研究和發(fā)展發(fā)揮了重要的作用。為了在“互聯(lián)網(wǎng)+”時(shí)代充分利用現(xiàn)代科學(xué)技術(shù)傳播傳承漢字文化,本文通過(guò)網(wǎng)絡(luò)調(diào)研和文獻(xiàn)調(diào)查,選取6種國(guó)內(nèi)甲骨文數(shù)據(jù)庫(kù),進(jìn)行比較研究,從而為甲骨文研究者提供使用參考,為數(shù)據(jù)庫(kù)的進(jìn)一步發(fā)展提出合理建議。
香港中文大學(xué)中國(guó)文化研究所古文獻(xiàn)數(shù)據(jù)庫(kù)中心從1996年開(kāi)始研發(fā)制作,全庫(kù)包括甲骨文資料庫(kù)、金文資料庫(kù)、竹簡(jiǎn)帛書資料庫(kù)、先秦兩漢資料庫(kù)、魏晉南北朝資料庫(kù)、中國(guó)傳統(tǒng)類書資料庫(kù)、中國(guó)古代詞匯資料庫(kù)[3]。
臺(tái)灣歷史語(yǔ)言研究所從2004年開(kāi)始建設(shè),主要收錄史語(yǔ)所收藏的甲骨文拓片,包括考古發(fā)掘甲骨拓片、購(gòu)藏所得甲骨拓片,共計(jì)4萬(wàn)余件[4]。
中國(guó)國(guó)家圖書館研制[5]。
華東師范大學(xué)中國(guó)文字研究與應(yīng)用中心研制。該系統(tǒng)收錄內(nèi)容為中國(guó)社會(huì)科學(xué)院考古研究所編著的《殷墟花園莊東地甲骨》(2003年版),提供全文檢索[6]。
由北京時(shí)代瀚堂科技有限公司開(kāi)發(fā)[7]。
是在中國(guó)社會(huì)科學(xué)院學(xué)部委員、甲骨學(xué)殷商史研究中心主任宋鎮(zhèn)豪指導(dǎo)下建立的一個(gè)甲骨文知識(shí)共享平臺(tái),包括“三庫(kù)一平臺(tái)”——甲骨字形庫(kù)、甲骨著錄庫(kù)、甲骨文獻(xiàn)庫(kù)、甲骨文知識(shí)服務(wù)平臺(tái)[8]。
臺(tái)灣成功大學(xué)“甲骨文全文檢索與全文影像系統(tǒng)”建構(gòu)計(jì)劃始于1995年,原計(jì)劃名為“世界甲骨學(xué)數(shù)據(jù)庫(kù)建構(gòu)計(jì)劃”,由文學(xué)系甲骨學(xué)研究室、圖書館、資訊工程研究所聯(lián)合執(zhí)行。該系統(tǒng)主要是將學(xué)習(xí)甲骨文與研究甲骨文的重要征引資料《甲骨文合集》(十三冊(cè))、《殷墟甲骨刻辭類纂》(上、中、下三冊(cè))及《殷墟甲骨刻辭摹釋總集》(上、下冊(cè))匯整輸入,進(jìn)行全文檢索與全文影像處理,以方便甲骨學(xué)界、其他學(xué)科領(lǐng)域以及初學(xué)者快速取得所需數(shù)據(jù),進(jìn)而推動(dòng)學(xué)術(shù)的向前發(fā)展。甲骨文全文影像數(shù)據(jù)庫(kù)收錄甲骨文書目及影像數(shù)據(jù)41 956條,可通過(guò)分類、關(guān)鍵詞及拓片影像等進(jìn)行檢索。目前,臺(tái)灣成功大學(xué)的甲骨文合集釋文庫(kù)和甲骨文獻(xiàn)集成電子數(shù)據(jù)庫(kù)都因缺少后期的管理和維護(hù)已經(jīng)停止更新和使用[9]。筆者在查找資料過(guò)程中發(fā)現(xiàn),臺(tái)灣成功大學(xué)甲骨文全文影像資料庫(kù)需要學(xué)校師生的賬號(hào)密碼通過(guò)成功大學(xué)圖書館進(jìn)入,因此無(wú)法訪問(wèn)。
由首都師范大學(xué)黃天樹(shù)教授與河南大學(xué)王蘊(yùn)智教授共同研制。收錄海內(nèi)外甲骨著錄與綴合材料32種,系統(tǒng)錄入甲骨原片近8萬(wàn)片,刻辭15.73萬(wàn)余條,原文和釋文共計(jì)約340萬(wàn)字,是大數(shù)據(jù)、云平臺(tái)支持下甲骨文字考釋研究的重要基礎(chǔ)[10]。
由安陽(yáng)師范學(xué)院韓江蘇教授課題組開(kāi)發(fā)建設(shè)。該數(shù)據(jù)庫(kù)由甲骨文圖片庫(kù)、釋文庫(kù)、原形文字庫(kù)三個(gè)數(shù)據(jù)庫(kù)組成,收錄《甲骨文合集》《英藏》《補(bǔ)編》等9種甲骨著錄,共計(jì)72264片甲骨[10]。
綜合考慮數(shù)據(jù)庫(kù)實(shí)際使用及訪問(wèn)情況,本文選擇上述前6種甲骨文數(shù)據(jù)庫(kù)進(jìn)行比較。
截止到2020年12月,對(duì)上述前6種數(shù)據(jù)庫(kù)的基本情況進(jìn)行統(tǒng)計(jì)比較,統(tǒng)計(jì)字段包括收錄數(shù)據(jù)類型、產(chǎn)品類型、收錄數(shù)量、更新情況、使用成本和移動(dòng)端應(yīng)用情況,具體如表1所示。
表1 國(guó)內(nèi)6種甲骨文數(shù)據(jù)庫(kù)的基本情況比較(數(shù)據(jù)截至2020年12月11日)
1.收錄數(shù)據(jù)類型
數(shù)據(jù)庫(kù)收錄的數(shù)據(jù)類型包括甲骨實(shí)物圖像、甲骨拓片圖像、甲骨著錄書籍和文獻(xiàn),其中超過(guò)半數(shù)以上的數(shù)據(jù)庫(kù)都收錄有甲骨拓片,而收錄甲骨實(shí)物圖像的數(shù)據(jù)庫(kù)較少。
2.產(chǎn)品類型
6種甲骨文數(shù)據(jù)庫(kù)中,有4種為圖像加釋文的資料庫(kù),可見(jiàn)這種類型的數(shù)據(jù)庫(kù)更受開(kāi)發(fā)者青睞,使用人群較為廣泛,而甲骨文字形庫(kù)只有一家,可見(jiàn)甲骨文字形的精準(zhǔn)數(shù)字化仍是一個(gè)難點(diǎn)。
3.收錄數(shù)量
收錄數(shù)量需要從甲骨片數(shù)和文獻(xiàn)數(shù)量?jī)蓚€(gè)維度進(jìn)行比較。根據(jù)數(shù)據(jù)庫(kù)公布的數(shù)據(jù),《殷契文淵》目前收錄的甲骨片數(shù)和文獻(xiàn)數(shù)量都是最多的,但是各數(shù)據(jù)收錄的內(nèi)容又均有其特色。
漢達(dá)甲骨文資料庫(kù)收錄九部甲骨著錄書籍,卜辭數(shù)量多至67 683片,包括《甲骨文合集》《甲骨文合集補(bǔ)編》《小屯南地甲骨》《蘇、德、美、日所藏甲骨》《懷特氏收藏甲骨文集》《殷墟花園莊東地甲骨》《東京大學(xué)東洋文化研究所藏甲骨文字》《英國(guó)所藏甲骨集》《天理大學(xué)附屬參考館甲骨文字》。
拓片典藏知識(shí)暨網(wǎng)絡(luò)應(yīng)用——甲骨文拓片數(shù)據(jù)庫(kù)從2004年開(kāi)始建設(shè)甲骨文拓片數(shù)字典藏,分為考古發(fā)掘甲骨拓片和購(gòu)藏甲骨拓片兩類,包括史語(yǔ)所收藏的甲骨文拓片、考古學(xué)門庫(kù)房收藏的9000余張《善齋藏契》拓片和史語(yǔ)所傅斯年圖書館收藏的18冊(cè)甲骨文拓片,總數(shù)超過(guò)45000張。
“甲骨世界”數(shù)據(jù)庫(kù)收錄的是中國(guó)國(guó)家圖書館館藏的甲骨,不僅收錄有甲骨拓片,更有高清甲骨照片,具有無(wú)可比擬的優(yōu)勢(shì)。
4.更新情況
從時(shí)間范圍來(lái)看,大部分?jǐn)?shù)據(jù)庫(kù)都能保持?jǐn)?shù)據(jù)持續(xù)更新,確保數(shù)據(jù)庫(kù)能夠正常運(yùn)行,花園莊東地甲骨檢索系統(tǒng)2008年5月之后沒(méi)有更新數(shù)據(jù)。
5.使用成本
在6種數(shù)據(jù)庫(kù)中,花園莊東地甲骨檢索系統(tǒng)、殷契文淵“甲骨世界”數(shù)據(jù)庫(kù)支持免費(fèi)使用,“甲骨世界”數(shù)據(jù)庫(kù)注冊(cè)后即可免費(fèi)查看高清大圖,香港漢達(dá)古籍?dāng)?shù)據(jù)庫(kù)檢索系統(tǒng)、拓片典藏知識(shí)暨網(wǎng)絡(luò)應(yīng)用可以免費(fèi)檢索信息,獲取信息則需要收費(fèi),這對(duì)個(gè)人用戶來(lái)說(shuō)還是非常友好的。瀚堂典藏?cái)?shù)據(jù)庫(kù)是典型的商業(yè)數(shù)據(jù)庫(kù),需要付費(fèi)使用。
6.移動(dòng)端
手機(jī)移動(dòng)網(wǎng)絡(luò)已成為目前獲取信息的一種主流方式,開(kāi)發(fā)移動(dòng)端可以突破IP及硬件的限制,支持用戶隨時(shí)隨地訪問(wèn),目前6種數(shù)據(jù)庫(kù)尚未開(kāi)發(fā)APP功能,有4種數(shù)據(jù)庫(kù)支持手機(jī)網(wǎng)頁(yè)版瀏覽,但功能不及電腦端豐富。
數(shù)據(jù)庫(kù)的初衷是為了用戶更便捷地查找信息,提高檢索效率,因此檢索功能是檢驗(yàn)數(shù)據(jù)庫(kù)功能的一個(gè)重要方面[11],本文從檢索方式、檢索字段和檢索結(jié)果顯示3個(gè)方面進(jìn)行比較。
1.檢索方式
國(guó)內(nèi)甲骨文數(shù)據(jù)庫(kù)的檢索方式比較詳見(jiàn)表2。(1)快速檢索??焖贆z索只有一個(gè)檢索框,不限定字段、詞位及詞頻,系統(tǒng)將在全文中進(jìn)行檢索匹配。在快速檢索框中輸入檢索詞,點(diǎn)擊“快速檢索”即可,體現(xiàn)智能檢索優(yōu)勢(shì),操作便捷,檢索結(jié)果兼顧檢全和檢準(zhǔn)。(2)高級(jí)檢索。高級(jí)檢索支持多字段邏輯組合,并可通過(guò)選擇精確或模糊的匹配方式、檢索控制等方法完成較復(fù)雜的檢索,得到符合需求的檢索結(jié)果,提高檢索效率。(3)專業(yè)檢索。專業(yè)檢索可以按照用戶實(shí)際需要選擇檢索字段,借助字段間關(guān)系運(yùn)算符和檢索值限定運(yùn)算符構(gòu)造復(fù)雜的檢索式[12]。這種方式可以有效提高檢準(zhǔn)率,但專業(yè)性較強(qiáng),一般用于圖書情報(bào)專業(yè)人員查新、信息分析等工作。本次參與比較的6種數(shù)據(jù)庫(kù)均不提供專業(yè)檢索。(4)二次檢索。二次檢索功能能有效提升檢索效率,提高檢準(zhǔn)率。
表2 國(guó)內(nèi)6種甲骨文數(shù)據(jù)庫(kù)的檢索方式比較
2.檢索字段
檢索字段是對(duì)收錄數(shù)據(jù)的特征進(jìn)行的描述。檢索字段越準(zhǔn)確、越豐富,則檢準(zhǔn)率和檢全率越高。6種甲骨文數(shù)據(jù)庫(kù)設(shè)置的檢索字段如表3所示,可以看出根據(jù)收錄的數(shù)據(jù)類型不同,甲骨拓片、甲骨實(shí)物、甲骨文獻(xiàn)所選取的檢索字段存在較大區(qū)別。
表3 國(guó)內(nèi)6種甲骨文數(shù)據(jù)庫(kù)的檢索字段比較
3.檢索結(jié)果
檢索結(jié)果的顯示和處理也是衡量數(shù)據(jù)庫(kù)檢索功能的一個(gè)重要指標(biāo)。本文從檢索結(jié)果顯示、檢索結(jié)果排序、檢索結(jié)果保存、檢索結(jié)果對(duì)比4個(gè)方面進(jìn)行比較,詳見(jiàn)表4。(1)檢索結(jié)果顯示。數(shù)據(jù)庫(kù)的檢索結(jié)果分為顯示內(nèi)容和顯示圖片兩個(gè)方面,顯示的內(nèi)容越豐富,用戶所獲得的信息越多,大部分?jǐn)?shù)據(jù)庫(kù)都能較為完整地設(shè)置字段,盡可能完整地揭示甲骨信息。經(jīng)過(guò)比較,大部分?jǐn)?shù)據(jù)庫(kù)收錄的是甲骨拓片和摹本圖片,少部分?jǐn)?shù)據(jù)庫(kù)有實(shí)物照片。(2)檢索結(jié)果排序。當(dāng)檢索結(jié)果較多的時(shí)候,從中找出所需數(shù)據(jù)也極其耗時(shí)耗力,通過(guò)結(jié)果排序和篩選功能可以有效提高用戶獲取所需資源的效率。從表4可以看出,“甲骨世界”數(shù)據(jù)庫(kù)、殷契文淵有排序功能,但排序字段較為單一。(3)檢索結(jié)果保存。檢索結(jié)果是否可以保存和下載直接關(guān)系到數(shù)據(jù)庫(kù)的利用效果,基本所有的數(shù)據(jù)庫(kù)均支持檢索數(shù)據(jù)的復(fù)制和圖片下載,香港漢達(dá)古籍?dāng)?shù)據(jù)庫(kù)檢索系統(tǒng)——甲骨文資料庫(kù)和拓片典藏知識(shí)暨網(wǎng)絡(luò)應(yīng)用——甲骨文拓片數(shù)據(jù)庫(kù)的部分輸出功能需要付費(fèi)使用。(4)檢索結(jié)果對(duì)比。檢索結(jié)果對(duì)比在開(kāi)展學(xué)術(shù)研究時(shí)更能提高工作效率,目前,僅拓片典藏知識(shí)暨網(wǎng)絡(luò)應(yīng)用——甲骨文拓片數(shù)據(jù)庫(kù)可選擇拓片和實(shí)物進(jìn)行影像比對(duì),其他5種數(shù)據(jù)庫(kù)均不具備此功能。
表4 國(guó)內(nèi)6種甲骨文數(shù)據(jù)庫(kù)的檢索結(jié)果顯示比較
通過(guò)對(duì)國(guó)內(nèi)6種甲骨文數(shù)據(jù)庫(kù)進(jìn)行比較研究,對(duì)我國(guó)甲骨文數(shù)據(jù)庫(kù)建設(shè)情況得出如下結(jié)論。
目前甲骨文數(shù)據(jù)庫(kù)的建設(shè)大都根據(jù)本機(jī)構(gòu)自有資源進(jìn)行建設(shè),如香港漢達(dá)古籍?dāng)?shù)據(jù)庫(kù)檢索系統(tǒng)——甲骨文資料庫(kù)、拓片典藏知識(shí)暨網(wǎng)絡(luò)應(yīng)用——甲骨文拓片數(shù)據(jù)庫(kù)、“甲骨世界”數(shù)據(jù)庫(kù)、花園莊東地甲骨檢索系統(tǒng),尚未形成完整的甲骨學(xué)數(shù)據(jù)規(guī)模,只有殷契文淵數(shù)據(jù)庫(kù)致力于將國(guó)內(nèi)現(xiàn)有甲骨文相關(guān)資料進(jìn)行全部收錄,但目前也只收錄了甲骨拓片的著錄資料,缺少甲骨實(shí)物圖片。
由于甲骨文數(shù)據(jù)庫(kù)建設(shè)初期各建設(shè)單位處于自建狀態(tài),缺乏溝通和協(xié)作,因而在收錄內(nèi)容上存在相同的部分,數(shù)字資源的重復(fù)建設(shè)造成了資源的浪費(fèi)。如漢達(dá)甲骨文資料庫(kù)和殷契文淵數(shù)據(jù)庫(kù)均收錄有《甲骨文合集》《小屯南地甲骨》《英國(guó)所藏甲骨集》《甲骨文合集補(bǔ)編》《懷特氏收藏甲骨文集》《天理大學(xué)附屬參考館甲骨文字》《殷墟花園莊東地甲骨》《蘇、德、美、日所藏甲骨》《東京大學(xué)東洋文化研究所藏甲骨文字》中的甲骨拓片。
這6種數(shù)據(jù)庫(kù)中只有2種數(shù)據(jù)庫(kù)提供二次檢索,沒(méi)有一種數(shù)據(jù)庫(kù)提供專業(yè)檢索。根據(jù)使用情況,檢索字段的設(shè)置還可以更豐富一些,檢索結(jié)果的顯示和篩選功能有待進(jìn)一步加強(qiáng)。
數(shù)據(jù)庫(kù)建成之后,維護(hù)和更新需要的人力、物力成本較高,特別是隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,數(shù)據(jù)庫(kù)的相應(yīng)技術(shù)也需要更新,但由于建設(shè)單位資源有限,大部分?jǐn)?shù)據(jù)庫(kù)在完成一期建設(shè)之后內(nèi)容更新過(guò)于緩慢,影響了數(shù)據(jù)庫(kù)的使用。
雖然各數(shù)據(jù)庫(kù)在建設(shè)過(guò)程中盡量追求學(xué)術(shù)的嚴(yán)謹(jǐn)性,但仍存在收錄資料權(quán)威性不被認(rèn)可的現(xiàn)象。一方面,由于甲骨文字的研究處在不斷地發(fā)展變化中,各專家之間對(duì)某些甲骨文字的認(rèn)識(shí)存在學(xué)術(shù)爭(zhēng)議;另一方面,信息技術(shù)的發(fā)展尚不能完美解決甲骨文字的信息化問(wèn)題,圖形化的甲骨文字與實(shí)物之間的差距還有待進(jìn)一步縮小。如沈建華認(rèn)為,漢達(dá)文庫(kù)的網(wǎng)站字表中缺失了372個(gè)甲骨字頭,直接影響到有關(guān)字條下的所有卜辭內(nèi)容,而原形和隸定字的轉(zhuǎn)換等問(wèn)題上也還存在錯(cuò)誤[13];門藝認(rèn)為,甲骨世界有些隸定字在網(wǎng)頁(yè)上顯示不出來(lái),只能利用代碼,而這些代碼則不見(jiàn)一個(gè)統(tǒng)一的說(shuō)明[9]。
理想的甲骨文數(shù)據(jù)庫(kù)是一個(gè)龐大的系統(tǒng),因此在建立之初,要做好調(diào)研和規(guī)劃,明確建設(shè)目標(biāo)。甲骨文數(shù)據(jù)庫(kù)的建設(shè),是為了適應(yīng)時(shí)代特征,彌補(bǔ)使用甲骨文工具書的不足,提高查找資料的效率,促進(jìn)甲骨文研究。因此,一個(gè)完整的甲骨文數(shù)據(jù)庫(kù)應(yīng)包括如下資料:(1)甲骨著錄資料,即出土甲骨文原始的材料,包括甲骨文拓片、照片、摹本等原始資料的數(shù)字化采集;(2)甲骨文研究文獻(xiàn)資料,如關(guān)于甲骨文研究的學(xué)術(shù)論文、著作、視頻資料等;(3)甲骨文字庫(kù),即對(duì)存世甲骨文字進(jìn)行立體掃描,采集三維數(shù)據(jù),進(jìn)行微痕分析,找出甲骨文字的數(shù)據(jù)規(guī)律;(4)甲骨文綴合資料庫(kù),對(duì)已有甲骨文字的字形進(jìn)行數(shù)據(jù)采集和計(jì)算,將海量數(shù)據(jù)進(jìn)行保存,分析規(guī)律,為甲骨文綴合和鑒定提供數(shù)據(jù)參考。
甲骨文研究資料繁多且分散,現(xiàn)有數(shù)據(jù)庫(kù)收錄內(nèi)容也存在同樣的問(wèn)題,在查找資料時(shí)往往需要查找多個(gè)數(shù)據(jù)庫(kù),因此,為了充分體現(xiàn)數(shù)據(jù)庫(kù)快速查找資料的特性,應(yīng)該將所有的甲骨文研究資料集合在一個(gè)平臺(tái)上,實(shí)現(xiàn)一站式查找,這就需要建設(shè)者站在全局高度,對(duì)現(xiàn)有的甲骨文研究資料進(jìn)行匯總,做好統(tǒng)籌規(guī)劃,合理進(jìn)行資源配置和分工??刹扇∫韵聝煞N開(kāi)發(fā)形式:(1)建立一個(gè)統(tǒng)一的數(shù)據(jù)庫(kù),所有內(nèi)容集中到一個(gè)數(shù)據(jù)庫(kù)進(jìn)行建設(shè),由專家組對(duì)內(nèi)容統(tǒng)一把關(guān),采用統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行建設(shè),這種方式的優(yōu)點(diǎn)是數(shù)據(jù)庫(kù)內(nèi)容整合性較好;缺點(diǎn)是數(shù)據(jù)量大,建設(shè)周期長(zhǎng)。(2)將數(shù)據(jù)庫(kù)分成多個(gè)子庫(kù)由擅長(zhǎng)的研究機(jī)構(gòu)進(jìn)行建設(shè),通過(guò)設(shè)立可兼容的數(shù)據(jù)標(biāo)準(zhǔn),待建成后兼容到一個(gè)數(shù)據(jù)平臺(tái),通過(guò)一個(gè)平臺(tái)同時(shí)檢索多個(gè)子庫(kù),并將檢索結(jié)果統(tǒng)一到一個(gè)界面顯示,通過(guò)連接跳轉(zhuǎn)到相應(yīng)子庫(kù)獲取詳細(xì)信息,這種方式的優(yōu)點(diǎn)是多個(gè)子庫(kù)可同時(shí)建設(shè),建設(shè)周期短;缺點(diǎn)是需要進(jìn)行后期數(shù)據(jù)整合,使用中需要訪問(wèn)多個(gè)數(shù)據(jù)庫(kù),影響檢索和使用速度。
為保證數(shù)據(jù)的統(tǒng)一性,避免數(shù)據(jù)庫(kù)重復(fù)建設(shè),在數(shù)據(jù)庫(kù)建設(shè)中應(yīng)實(shí)行標(biāo)準(zhǔn)化管理,將現(xiàn)有的數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行整合,制定出與國(guó)際數(shù)據(jù)標(biāo)準(zhǔn)接軌、符合甲骨文數(shù)據(jù)特點(diǎn)且具有前瞻性的統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),通過(guò)使用相同或可兼容的數(shù)據(jù)標(biāo)準(zhǔn)及信息處理、訪問(wèn)與傳輸技術(shù),從而實(shí)現(xiàn)數(shù)字資源的標(biāo)準(zhǔn)化,控制數(shù)字資源質(zhì)量,實(shí)現(xiàn)各數(shù)據(jù)庫(kù)之間的信息資源共享[9]。為充分利用現(xiàn)有成果,實(shí)現(xiàn)資源最大化利用,可在現(xiàn)有較為成熟的數(shù)據(jù)庫(kù)的基礎(chǔ)之上制定統(tǒng)一標(biāo)準(zhǔn),整合其他現(xiàn)有數(shù)據(jù)庫(kù)的資源,實(shí)現(xiàn)現(xiàn)有成果的最大化利用。例如,在建立甲骨拓片數(shù)據(jù)庫(kù)時(shí)可以參考臺(tái)灣歷史語(yǔ)言研究所“拓片資料庫(kù)管理系統(tǒng)”設(shè)計(jì)的拓片 Metadata[14],數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)具有層級(jí)性、擴(kuò)充性、整合性、互通性、國(guó)際性、便捷性特色。
1.層級(jí)性
將拓片基本資料分為拓片資料、原器資料、影像資料,層級(jí)分明便于資料分類、著錄等工作。
2.擴(kuò)充性
在設(shè)置元數(shù)據(jù)時(shí)應(yīng)設(shè)置有特殊字段,以便為了滿足日后擴(kuò)充的需要。
3.整合性
數(shù)據(jù)標(biāo)準(zhǔn)的設(shè)計(jì)應(yīng)考慮和圖書館、博物館和研究機(jī)構(gòu)資料庫(kù)的字段設(shè)計(jì),符合各類機(jī)構(gòu)的保存、編目、流通、出版、展示和研究等典藏目的。
4.互通性
數(shù)據(jù)標(biāo)準(zhǔn)的設(shè)計(jì)應(yīng)可以實(shí)現(xiàn)各研究機(jī)構(gòu)數(shù)據(jù)庫(kù)之間的數(shù)據(jù)互通,實(shí)現(xiàn)信息共享。
5.國(guó)際性
在數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)時(shí)應(yīng)考慮未來(lái)國(guó)際間資料庫(kù)之間交流數(shù)據(jù)的需要,盡量使采用的數(shù)據(jù)標(biāo)準(zhǔn)可以和國(guó)際性的元數(shù)據(jù)標(biāo)準(zhǔn)相兼容。
6.便捷性
數(shù)據(jù)標(biāo)準(zhǔn)的設(shè)計(jì)是為了日后檢索時(shí)更加快捷地檢索出所需信息,因此在設(shè)計(jì)時(shí)應(yīng)根據(jù)使用者的習(xí)慣充分考慮檢索字段的設(shè)置需求,幫助使用者更快更準(zhǔn)獲取信息。
1.注重?cái)?shù)據(jù)庫(kù)的權(quán)威性
甲骨文研究專業(yè)性強(qiáng),準(zhǔn)確性與權(quán)威性是數(shù)據(jù)庫(kù)的生命。因此,在數(shù)據(jù)庫(kù)建設(shè)過(guò)程中應(yīng)成立專家組,對(duì)資料的著錄、甲骨釋文等專業(yè)內(nèi)容進(jìn)行嚴(yán)格把關(guān),確保錄入數(shù)據(jù)的準(zhǔn)確性和權(quán)威性,高質(zhì)量完成數(shù)據(jù)庫(kù)建設(shè)。
2.把握數(shù)據(jù)庫(kù)建設(shè)的時(shí)效性
當(dāng)前國(guó)內(nèi)很多機(jī)構(gòu)都在進(jìn)行甲骨文數(shù)據(jù)庫(kù)的建設(shè),爭(zhēng)搶甲骨文字專家這個(gè)重要的資源已成為一個(gè)關(guān)鍵性的問(wèn)題,只有盡快與專家建立合作關(guān)系,建設(shè)成可投入使用的數(shù)據(jù)庫(kù),才能真正占領(lǐng)甲骨文數(shù)據(jù)庫(kù)的高地。
3.注重?cái)?shù)據(jù)庫(kù)的實(shí)用性
為了保證數(shù)據(jù)庫(kù)的建設(shè)更符合使用者的需求,在建設(shè)過(guò)程中,應(yīng)充分與專家學(xué)者溝通,了解研究需求和普及需求,有針對(duì)性地提供數(shù)據(jù)支持,如針對(duì)甲骨綴合工作提供相關(guān)軟件及數(shù)據(jù)支持,針對(duì)研究需要提供文獻(xiàn)引用分析等,充分發(fā)揮計(jì)算機(jī)技術(shù)對(duì)學(xué)科發(fā)展的促進(jìn)作用。
建立一個(gè)大而全的甲骨文數(shù)據(jù)庫(kù),必然涉及多家單位收藏的甲骨文資料,將這些資料數(shù)字化的過(guò)程中要做好收藏單位、建設(shè)單位、數(shù)據(jù)庫(kù)所有者之間的知識(shí)產(chǎn)權(quán)劃分以及由此產(chǎn)生的經(jīng)濟(jì)糾紛,并平衡好知識(shí)產(chǎn)權(quán)保護(hù)與用戶使用感受之間的關(guān)系。
取得版權(quán)有兩種方式:(1)和現(xiàn)有的數(shù)據(jù)庫(kù)內(nèi)容提供者協(xié)商一次性取得相應(yīng)數(shù)據(jù)的版權(quán),所有版權(quán)集中到一個(gè)數(shù)據(jù)庫(kù)出版商,整合到一個(gè)平臺(tái)提供給用戶使用;(2)版權(quán)仍屬于現(xiàn)有的數(shù)據(jù)庫(kù)內(nèi)容提供者,采用可兼容的數(shù)據(jù)標(biāo)準(zhǔn),通過(guò)一個(gè)平臺(tái)進(jìn)行檢索,在用戶使用數(shù)據(jù)時(shí)根據(jù)使用的數(shù)據(jù)庫(kù)內(nèi)容協(xié)商合理分配收入。
數(shù)據(jù)庫(kù)的建設(shè)是一個(gè)龐大的工程,后期的維護(hù)包括數(shù)據(jù)庫(kù)日常使用維護(hù)、數(shù)據(jù)庫(kù)技術(shù)與計(jì)算機(jī)技術(shù)同步升級(jí)、數(shù)據(jù)庫(kù)內(nèi)容定期更新、數(shù)據(jù)庫(kù)使用情況分析等,需要專人專門管理以及龐大的資金支持,確保數(shù)據(jù)庫(kù)的正常運(yùn)行和價(jià)值發(fā)揮:(1)在建設(shè)初期做好前期建設(shè)成本的預(yù)算,同時(shí)也要做好后續(xù)維護(hù)與管理費(fèi)用的預(yù)算,確保建設(shè)資金的穩(wěn)定投入;(2)為提高數(shù)據(jù)庫(kù)的時(shí)效性和使用效率,增強(qiáng)數(shù)據(jù)庫(kù)的競(jìng)爭(zhēng)力,要注重緊跟甲骨文研究成果發(fā)展步伐,密切關(guān)注搜集最新研究成果,對(duì)數(shù)據(jù)庫(kù)內(nèi)容及時(shí)補(bǔ)充和更新,使之更加全面和準(zhǔn)確。
為提高甲骨文數(shù)據(jù)庫(kù)的利用率,數(shù)據(jù)庫(kù)除了應(yīng)兼具專業(yè)研究及普及教育的雙重功能,既能滿足專業(yè)人員查找資料、科學(xué)研究之需要,又能為大眾提供權(quán)威的甲骨文入門資料,還應(yīng)適應(yīng)時(shí)代要求,做好宣傳和推介,應(yīng)從以下幾方面入手。
1.根據(jù)不同用戶需求制訂宣傳推介計(jì)劃
針對(duì)甲骨文專業(yè)研究人員,應(yīng)注重其科學(xué)研究方面的功能介紹;針對(duì)大眾,應(yīng)注重甲骨文識(shí)別、甲骨文輸入法等功能的介紹,引起大眾對(duì)甲骨文的學(xué)習(xí)興趣,提供一個(gè)甲骨文百科全書查閱平臺(tái)。
2.數(shù)據(jù)庫(kù)平臺(tái)應(yīng)設(shè)置互通板塊
甲骨文數(shù)據(jù)庫(kù)平臺(tái)可以打造一個(gè)讓專家學(xué)者足不出戶開(kāi)展學(xué)術(shù)交流的平臺(tái),通過(guò)互聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)頭腦風(fēng)暴,增進(jìn)學(xué)科間的交流。同時(shí),可以設(shè)置一個(gè)開(kāi)放文獻(xiàn)版塊,在保護(hù)作者的知識(shí)產(chǎn)權(quán)的前提下,將甲骨學(xué)最新研究成果通過(guò)網(wǎng)絡(luò)發(fā)布,與傳統(tǒng)出版渠道相比可大大縮短出版的時(shí)間,提高時(shí)效性,有效促進(jìn)學(xué)科交流。
3.豐富數(shù)據(jù)庫(kù)推介渠道
宣傳和推介數(shù)據(jù)庫(kù)的渠道包括各高等院校、甲骨收藏機(jī)構(gòu)、中小學(xué)以及網(wǎng)絡(luò)渠道等。目前,征集評(píng)選甲骨文釋讀優(yōu)秀成果已經(jīng)得到社會(huì)廣泛關(guān)注,甲骨文數(shù)據(jù)庫(kù)可以作為參考資料提供給社會(huì)公眾。
綜合以上研究,本文的不足之處有兩個(gè)方面:一是在進(jìn)行國(guó)內(nèi)甲骨文數(shù)據(jù)庫(kù)比較時(shí)選取的數(shù)據(jù)庫(kù)樣本較少,由于部分?jǐn)?shù)據(jù)庫(kù)尚未公開(kāi)使用,本文只選取了6種國(guó)內(nèi)甲骨文數(shù)據(jù)庫(kù),在反映目前甲骨文數(shù)據(jù)的建設(shè)情況方面相對(duì)來(lái)說(shuō)具有局限性;二是本文選取的比較指標(biāo)具有普遍性,缺乏針對(duì)甲骨文數(shù)據(jù)庫(kù)的特性進(jìn)行甲骨文專業(yè)研究功能方面的深入比較和研究。
甲骨文數(shù)據(jù)庫(kù)是甲骨學(xué)科在“互聯(lián)網(wǎng)+”時(shí)代的新發(fā)展,對(duì)整合現(xiàn)有甲骨學(xué)研究資料、促進(jìn)甲骨學(xué)科發(fā)展和漢字文化傳播具有積極的意義。在建設(shè)甲骨文數(shù)據(jù)庫(kù)的過(guò)程中許多研究機(jī)構(gòu)進(jìn)行了有意義的探索,如何緊跟時(shí)代發(fā)展步伐,將新技術(shù)運(yùn)用到甲骨文數(shù)據(jù)庫(kù)的建設(shè)中,建設(shè)一個(gè)學(xué)者信服、內(nèi)容齊全、使用方便的甲骨文數(shù)據(jù)庫(kù),促進(jìn)漢字文化繁榮發(fā)展,值得我們每一個(gè)漢字工作者深思。
漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào)2022年2期