[摘 要]以廣州圖書館所建《廣州大典》網(wǎng)絡(luò)服務(wù)平臺后臺用戶使用數(shù)據(jù)為來源,以描述性統(tǒng)計(jì)為基礎(chǔ),結(jié)合交叉分析和閾值分析,從登錄用戶特征、用戶檢索特征、資源使用特征、資源需求特征4個(gè)維度分析用戶地方古籍?dāng)?shù)據(jù)庫應(yīng)用特點(diǎn)。在確保入庫資源質(zhì)量的前提下,地方古籍?dāng)?shù)據(jù)庫具備長期的使用價(jià)值,按照用戶應(yīng)用特點(diǎn)對數(shù)據(jù)庫進(jìn)行細(xì)粒度優(yōu)化,能更好地滿足用戶古籍資源需求。
[關(guān)鍵詞]古籍 數(shù)字化 數(shù)據(jù)庫 《廣州大典》 地方文獻(xiàn)
[分類號]G258.2;G255.9
1 研究背景
《中華人民共和國公共圖書館法》第四十一條規(guī)定:“政府設(shè)立的公共圖書館應(yīng)當(dāng)加強(qiáng)館內(nèi)古籍的保護(hù),根據(jù)自身?xiàng)l件采用數(shù)字化、影印或者縮微技術(shù)等推進(jìn)古籍的整理、出版和研究利用?!笨梢?,古籍?dāng)?shù)字化和古籍?dāng)?shù)據(jù)庫建設(shè)已成為當(dāng)前古籍保護(hù)和古籍傳承的重要組成部分。近年來,一大批古籍?dāng)?shù)據(jù)庫得以問世,為專家、學(xué)者和社會各界提供了豐富的古籍資源,如廣州圖書館的《廣州大典》網(wǎng)絡(luò)服務(wù)平臺,首都圖書館的館藏古籍珍善本圖像數(shù)據(jù)庫,長春市圖書館的館藏國家珍貴古籍全文數(shù)據(jù)庫,廣東省立中山圖書館的特藏文獻(xiàn)全文數(shù)據(jù)庫,蘇州圖書館的古籍?dāng)?shù)據(jù)庫等。此外,《蘇州全書》編纂工作已于2022年立項(xiàng),以該書為基礎(chǔ)的數(shù)字資源平臺亦在規(guī)劃中[1]。這些古籍?dāng)?shù)據(jù)庫及服務(wù)平臺的建設(shè)不僅促進(jìn)了古籍的保護(hù)與傳播,更為傳承和弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化注入了活力。
2022年,中國國家圖書館副館長陳力就數(shù)字人文視角下古籍?dāng)?shù)字化和古籍?dāng)?shù)據(jù)庫建設(shè)涉及的問題進(jìn)行了討論[2]。張力元與王軍對國內(nèi)外常見的300種古籍?dāng)?shù)據(jù)庫進(jìn)行分面分析,為古籍?dāng)?shù)據(jù)庫構(gòu)建了一個(gè)分面分類體系[3]。李明杰等借助CiteSpace軟件對近十年國內(nèi)古籍?dāng)?shù)字化研究的作者、關(guān)鍵詞、國家社科基金項(xiàng)目等進(jìn)行分析,總結(jié)出我國近十年古籍?dāng)?shù)字化研究的特征[4]。武杰以寧夏入選《國家珍貴古籍名錄》古籍為樣本,就寧夏珍貴古籍?dāng)?shù)字化未來發(fā)展做出規(guī)劃[5]。張小燕以江西珍貴古籍?dāng)?shù)字資源庫為例,對江西省古籍文獻(xiàn)數(shù)字化和古籍?dāng)?shù)據(jù)庫建設(shè)進(jìn)行分析 [6]。中山大學(xué)圖書館建設(shè)了徽州文書數(shù)據(jù)庫,并圍繞徽州文書數(shù)字化和數(shù)據(jù)庫建設(shè)展開一系列研究[7-9]。徐丹則調(diào)研了用戶對古籍?dāng)?shù)據(jù)庫的功能需求[10]。
地方古籍?dāng)?shù)據(jù)庫兼具地方文獻(xiàn)與古籍?dāng)?shù)據(jù)庫雙重特性,是區(qū)域性圖書館圍繞本地產(chǎn)生的古籍而建,以保護(hù)和傳承地方文化遺產(chǎn)為宗旨。在數(shù)據(jù)庫建設(shè)過程中,本地圖書館得益于地利之便,不僅能獲得豐富的地方古籍資源,且能得到眾多地方文化專家的智力支持。為探討用戶對地方古籍?dāng)?shù)據(jù)庫的使用偏好與特點(diǎn),筆者以《廣州大典》網(wǎng)絡(luò)服務(wù)平臺后臺記錄的用戶數(shù)據(jù)為基礎(chǔ)展開分析,以期為各地圖書館地方古籍?dāng)?shù)據(jù)庫建設(shè)提供參考和借鑒。數(shù)字化古籍包括3種形式:圖像版、文本版、圖文版,《廣州大典》網(wǎng)絡(luò)服務(wù)平臺的數(shù)字化古籍具備圖文功能,但由于尚未建設(shè)文本資源,目前用戶可用的主要為圖像版古籍,因此筆者研究重點(diǎn)將聚焦于圖像版數(shù)字化古籍的用戶使用特點(diǎn)。
2 《廣州大典》網(wǎng)絡(luò)服務(wù)平臺與數(shù)據(jù)收集
《廣州大典》是由中共廣州市委宣傳部、廣東省文化廳策劃并組織研究編纂,旨在系統(tǒng)搜集整理和搶救保護(hù)廣州文獻(xiàn)典籍、傳播廣州歷史文化的大型地方文獻(xiàn)叢書,所收文獻(xiàn)時(shí)間下限為1911年,個(gè)別門類延至民國。該書于2015年4月完成出版(曲類于2019年出版),共收錄古籍文獻(xiàn)4064種?!稄V州大典》網(wǎng)絡(luò)服務(wù)平臺是由廣州圖書館主持建設(shè)的數(shù)字化服務(wù)平臺,以《廣州大典》紙質(zhì)版所收古籍為入藏對象,分經(jīng)、史、子、集、叢部,用戶可在該平臺查詢到三千余種授權(quán)古籍的圖像版原文,并可查閱全部書目信息。該平臺設(shè)計(jì)了導(dǎo)航、檢索等文獻(xiàn)獲取方式,用戶在閱讀中可對文獻(xiàn)執(zhí)行下載、打印等操作。為協(xié)助用戶使用,該平臺還提供了字典快查與紀(jì)年換算等功能。在用戶管理上,該平臺可供廣州圖書館認(rèn)證讀者使用,同時(shí)建立獨(dú)立的用戶注冊系統(tǒng),接受全球用戶注冊。
為便于分析,筆者僅收集與古籍資源使用相關(guān)的數(shù)據(jù)。數(shù)據(jù)統(tǒng)計(jì)時(shí)間為2023年2月,由于該庫于2016年完成授權(quán)資源入庫,因此截取2017—2022年共6年的數(shù)據(jù),以Excel表格導(dǎo)出后借助SPSS進(jìn)行分析。
3 《廣州大典》網(wǎng)絡(luò)服務(wù)平臺應(yīng)用特點(diǎn)分析
按照數(shù)據(jù)之間的邏輯,筆者從用戶特征、資源檢索、資源使用、資源需求4個(gè)方面對《廣州大典》網(wǎng)絡(luò)服務(wù)平臺中數(shù)字化古籍資源的應(yīng)用特點(diǎn)進(jìn)行分析。
3.1 登錄用戶特征分析
根據(jù)平臺使用要求,用戶須注冊和登錄方能查閱古籍全文。分別統(tǒng)計(jì)用戶登錄數(shù)和登錄次數(shù)并計(jì)算增長速度,其中年均增長速度采用累計(jì)法擬合。從表1可以看出,2017—2022年,盡管登錄用戶數(shù)在一些年份存在波動(dòng),但總體呈上升之勢,登錄次數(shù)也逐年遞增,兩者的年均增長速度分別達(dá)到19.69%和14.50%,這反映出用戶對古籍?dāng)?shù)據(jù)庫的持續(xù)關(guān)注?!稄V州大典》網(wǎng)絡(luò)服務(wù)平臺自2016年建成后到2022年底均未有新資源入庫(2023年啟動(dòng)了曲類和其余授權(quán)資源入庫計(jì)劃),但從上述用戶登錄情況和下文的使用趨勢看,均未出現(xiàn)因資源更新減少而導(dǎo)致使用量下降的現(xiàn)象,這說明如果能夠確保重點(diǎn)資源入藏,古籍?dāng)?shù)據(jù)庫可以長期保持使用價(jià)值和吸引力。
根據(jù)用戶性質(zhì),將登錄用戶按照圖書館讀者與獨(dú)立注冊的“大典用戶”區(qū)分,得到表2。從該表可知,2017—2022年,每年圖書館讀者占比均在50%以上,個(gè)別年份甚至達(dá)到70%以上。由于圖書館讀者須持本地戶籍或居住證明注冊,因此這一數(shù)據(jù)也說明本地居民和專家是地方古籍資源的主要用戶群體。然而,“大典用戶”在登錄用戶中亦占有一定比例,一些年份甚至逼近50%,說明古籍?dāng)?shù)據(jù)庫可吸引更廣泛的社會用戶利用(含外地用戶)。平臺上線不久后,亦收到境外用戶電話,咨詢數(shù)據(jù)庫查詢事宜,可知該庫在境外亦有使用者。
選取2017—2022年年登錄次數(shù)大于等于10次的圖書館注冊讀者作為常頻用戶(由于注冊信息不足,無法對“大典用戶”做進(jìn)一步分析),合并重復(fù)賬號,共得到223名用戶。根據(jù)后臺記錄,逐一核查用戶信息。統(tǒng)計(jì)顯示,有67名用戶注冊時(shí)提交了單位信息,其中51名來自高等教育機(jī)構(gòu),涵蓋教師、研究生和本科生,占比達(dá)76%,其他用戶則分散于圖書館、博物館等文化單位與少量公司和基層行政單位。統(tǒng)計(jì)用戶的出生年份(共查得222名用戶的出生信息),結(jié)合用戶數(shù)據(jù)庫登錄年數(shù)情況制成表3。從該表可知,1990—1999年出生的用戶最多,其次為1980—1989年,兩個(gè)年齡段的用戶合計(jì)達(dá)到163名,占全部用戶的73%,說明古籍資源的主要使用群體為20~40歲的中青年人。從該表還可以看出,152名用戶僅在一年內(nèi)登錄10次及以上,42名用戶在兩年內(nèi)分別登錄10次及以上,合計(jì)為194人,占全部用戶的87%,說明大部分用戶的使用時(shí)間集中在一到兩年間。由此可以推斷,《廣州大典》網(wǎng)絡(luò)服務(wù)平臺古籍資源的主要使用對象為高校教師和研究生群體。
3.2 數(shù)據(jù)庫檢索特征分析
從后臺提取歷年檢索記錄,剔除無意義的檢索詞和含義模糊的單字,根據(jù)檢索量對篩選的有效詞匯進(jìn)行排序,選擇前100個(gè)關(guān)鍵詞并按照性質(zhì)對關(guān)鍵詞進(jìn)行歸類,制成表4。從該表可以看出,書名和人名是最主要的檢索項(xiàng),其中書名以本地文獻(xiàn)為主,而人名則主要聚焦于本土文化名人,用戶可能希望查找這些人物所撰的文獻(xiàn),也可能是查找與這些人物有關(guān)的文獻(xiàn)。用戶最常搜索的21種圖書中,除了《道德經(jīng)》《易》兩種非本地文獻(xiàn)外,其余18種均能在數(shù)據(jù)庫中找到。以“作者”字段對表中26位文化名人進(jìn)行檢索,可以找到其中24位作者的著述。這一結(jié)果說明,《廣州大典》網(wǎng)絡(luò)服務(wù)平臺對本地文獻(xiàn)和本地文化名人具有較高的覆蓋度,基本能滿足學(xué)者本地文化研究的需要。除了書名和人名兩個(gè)主要詞類外,還出現(xiàn)了地區(qū)名稱、文獻(xiàn)類型、文化與文獻(xiàn)主題等詞類。地區(qū)名稱不僅涉及城市名稱,還涉及城市行政區(qū)劃,除廣州外,也延及周邊城市和地區(qū)。文獻(xiàn)類型方面的檢索詞包括“詩”“志”“曲類”“日記”“鈔”“譜”等具有古籍特色的文獻(xiàn)類別,而文化和文獻(xiàn)主題方面的檢索詞,則以傳統(tǒng)文化特別是本地文化為主,如“十三行”“粵劇/謳”“廣東鄉(xiāng)試”等。
3.3 資源應(yīng)用特征分析
平臺為用戶提供了瀏覽、下載及打印3種文獻(xiàn)使用方式,對2017—2022年的使用數(shù)據(jù)進(jìn)行統(tǒng)計(jì),制成表5。由于平臺規(guī)定每名用戶每天下載和打印的文獻(xiàn)總量不得超過10頁,因此表5將這兩項(xiàng)數(shù)據(jù)合并計(jì)算。從表中可以看出,盡管平臺收錄的古籍約三千種,但從瀏覽數(shù)據(jù)看,每年的使用率都超過了300%,個(gè)別年份如2020年甚至達(dá)到了500%,說明數(shù)字化古籍在傳承優(yōu)秀傳統(tǒng)文化、推動(dòng)古籍資源利用方面發(fā)揮了重要價(jià)值。從歷年瀏覽量變化趨勢看,雖然存在波動(dòng),但整體呈上升趨勢。在使用月份分布上,用戶對資源的需求貫穿全年,相對而言下半年的使用量略高于上半年,而下半年又以8月份使用量較多,這可能與高校暑假期間用戶使用較多有關(guān)。下載和打印量在2019年與2020年達(dá)到高峰,隨后出現(xiàn)下滑。對登錄用戶的賬號進(jìn)行分析發(fā)現(xiàn),一些用戶名存在明顯的重復(fù)注冊現(xiàn)象,如部分用戶采用“用戶名+數(shù)字”的方式連續(xù)注冊多個(gè)賬號,顯然是為了規(guī)避下載和打印數(shù)量的限制。據(jù)一些用戶反饋,由于打印和下載受限,他們有時(shí)會采用拷屏方式將文獻(xiàn)保存到個(gè)人電腦中,這反映出用戶對數(shù)字化古籍下載和打印功能的強(qiáng)烈需求,未來平臺可以考慮在保證版權(quán)的前提下適當(dāng)放寬下載和打印限制。
3.4 資源需求特征分析
基于文獻(xiàn)所屬部類,逐年統(tǒng)計(jì)各文獻(xiàn)瀏覽冊次,整理成表6和圖1。從統(tǒng)計(jì)數(shù)據(jù)可知,集部的利用率最高,史部緊隨其后。在四部分類中,集部主要收錄詩文詞總集和專集等,包括楚辭、別集、總集、詩文評、詞曲5個(gè)類別?!稄V州大典》集部主要包括別集、總集、詩文評、詞類等內(nèi)容,曲類在數(shù)據(jù)庫建設(shè)之時(shí)尚未出版。集部的使用率較高說明用戶對古籍中涉及文化藝術(shù)的著述有濃厚的興趣。史部包括方志類、地理類、政書類、傳記類、編年類、金石類、雜史類、詔令奏議類等內(nèi)容,其使用率較高說明用戶對歷史研究亦有較多關(guān)注,這與我國的史學(xué)傳統(tǒng)是一脈相承的。然而作為匯集儒家經(jīng)典著作的經(jīng)部,其使用情況并不理想,反映了今人與古人在學(xué)術(shù)旨趣和取向上的差異。
將歷年文獻(xiàn)依據(jù)瀏覽冊次排序,取年度瀏覽次數(shù)達(dá)到10次及以上的文獻(xiàn)列為年度常頻文獻(xiàn),進(jìn)一步統(tǒng)計(jì)這些常頻文獻(xiàn)在統(tǒng)計(jì)期間被使用的年數(shù),制成圖2。從圖2中可以看出,被使用一年及以上的文獻(xiàn)共有949種,約占全部文獻(xiàn)的三分之一,隨著使用年數(shù)的增加,文獻(xiàn)數(shù)量逐漸減少,其中最上層的46種文獻(xiàn)在統(tǒng)計(jì)期間每年都有10次以上的訪問量,屬于《廣州大典》的核心文獻(xiàn),可作為后續(xù)推廣和進(jìn)一步挖掘的重點(diǎn)對象。
4 結(jié)論與思考
研究表明,古籍?dāng)?shù)據(jù)庫的用戶群體以本地用戶為主,同時(shí)不乏非本地(含境外)用戶。在各類用戶中,高校師生為主要用戶群體,以20~40歲的中青年教師和研究生為主。用戶常用的檢索詞包括書名、人名、地名、文獻(xiàn)類型以及文化與文獻(xiàn)主題等。相較于實(shí)體古籍,數(shù)字化古籍顯著提高了資源的利用率。在使用方式上,瀏覽、下載和打印均是用戶利用數(shù)字化古籍的常見方式。在內(nèi)容需求上,用戶對集部和史部文獻(xiàn)的需求比較突出,這涉及地方文化藝術(shù)作品及歷史類文獻(xiàn)。根據(jù)上述分析,筆者就地方古籍?dāng)?shù)據(jù)庫的優(yōu)化提出一些建議。
第一,強(qiáng)化對重點(diǎn)文獻(xiàn)的遴選和入庫。根據(jù)上述數(shù)據(jù),以文化藝術(shù)為代表的集部文獻(xiàn)和反映地方歷史的史部文獻(xiàn)利用率較高。文化藝術(shù)與歷史類文獻(xiàn)蘊(yùn)含的文化價(jià)值具有較強(qiáng)的延續(xù)性,一些膾炙人口的文學(xué)和藝術(shù)佳品至今依舊能給人們帶來美的享受,而通志、地方志、日記等史類文獻(xiàn)則持續(xù)為現(xiàn)代人提供過去社會和文化等方面的信息,因此這兩類文獻(xiàn)應(yīng)作為重點(diǎn)文獻(xiàn)入藏。為提高入庫文獻(xiàn)對用戶的價(jià)值,可以采取以下措施:① 須廣泛征求專家意見確定優(yōu)先入庫和重點(diǎn)揭示的資源,避免以館員的主觀判斷代替專業(yè)意見。② 多渠道搜集精良版本。版本不僅關(guān)系到文獻(xiàn)質(zhì)量,更關(guān)系到讀者的閱讀體驗(yàn),除本館資源外,還可以從其他圖書館、古籍收藏機(jī)構(gòu)、私人藏書家、古籍書店以及國際交流渠道等途徑博觀約選。以《廣州大典》編纂為例,除從本地公共和高校圖書館征集文獻(xiàn)外,還分別從國內(nèi)55家、國外14家藏書單位及6位私人藏書家征集到大量文獻(xiàn)影像。③ 建庫后要借助用戶的使用和檢索行為,持續(xù)跟蹤用戶需求熱點(diǎn),發(fā)掘建庫盲點(diǎn),并及時(shí)補(bǔ)充和完善。
第二,拓寬用戶群體。免費(fèi)開放的古籍?dāng)?shù)據(jù)庫,一般包括注冊免費(fèi)使用和非注冊免費(fèi)使用兩種使用方式[11],目前國外古籍?dāng)?shù)據(jù)庫普遍采用非注冊免費(fèi)使用的方式提供服務(wù),但在國內(nèi)許多古籍?dāng)?shù)據(jù)庫的開放程度尚顯不足,一些珍善本數(shù)據(jù)庫僅限特定IP段內(nèi)訪問,或僅限本地用戶使用,網(wǎng)絡(luò)可見度低[12],無法實(shí)現(xiàn)跨地區(qū)遠(yuǎn)程訪問[13]。上述研究顯示,除本地用戶外,非本地用戶(含境外用戶)對地方古籍資源同樣存在需求,因此數(shù)據(jù)庫應(yīng)優(yōu)先考慮非注冊免費(fèi)使用,對于確需注冊使用的數(shù)據(jù)庫,也應(yīng)采取分級管理和服務(wù)策略,推動(dòng)資源在不同層面開放與利用。例如,江蘇師范大學(xué)圖書館在建設(shè)徐州地方文獻(xiàn)數(shù)據(jù)庫時(shí),將資源與用戶細(xì)分為不同類型,并通過開放服務(wù)、IP控制、賬號管理等多種手段,實(shí)現(xiàn)了資源與用戶的多維度匹配[14]。在資源管理方面,由于不同資源的權(quán)屬各異,可開放的范圍和程度不同,因此可從資源集體和資源個(gè)體兩個(gè)角度設(shè)置權(quán)限,如內(nèi)部使用、館內(nèi)閱覽、機(jī)構(gòu)內(nèi)/外閱覽、是否允許下載或打印等。在用戶方面,可根據(jù)用戶類別賦予不同權(quán)限,如本地/本機(jī)構(gòu)用戶、外地/機(jī)構(gòu)外用戶、開放用戶等,并建立用戶權(quán)限與資源權(quán)限的聯(lián)列矩陣,使用戶對個(gè)人權(quán)限一目了然,也便于圖書館對資源和用戶進(jìn)行管理。
第三,優(yōu)化數(shù)據(jù)庫功能與設(shè)計(jì),提升用戶體驗(yàn)。為方便用戶使用,數(shù)據(jù)庫應(yīng)在功能設(shè)計(jì)、用戶操作、體驗(yàn)管理等多個(gè)層面展開優(yōu)化。對于需要身份驗(yàn)證的資源訪問,除常規(guī)注冊流程外,還應(yīng)為無法接收手機(jī)短信的用戶提供郵箱驗(yàn)證作為備選驗(yàn)證方式,確保注冊過程順暢。在功能設(shè)計(jì)上,應(yīng)著重考慮用戶的實(shí)際需求和使用習(xí)慣。良好的導(dǎo)航設(shè)計(jì)、強(qiáng)大的檢索功能、方便易用的閱讀操作及各項(xiàng)支持功能均有助于提升用戶獲取和使用資源的體驗(yàn),而簡潔、一致和符合用戶認(rèn)知的設(shè)計(jì)能有效提升用戶的操作效率。其中,要注意書目數(shù)據(jù)與對象數(shù)據(jù)可能存在的表述差異。在構(gòu)建書目數(shù)據(jù)時(shí)應(yīng)遵循標(biāo)準(zhǔn)化原則,對對象數(shù)據(jù)中的非規(guī)范表述進(jìn)行適當(dāng)處理,以免影響檢索準(zhǔn)確性,如“梁啟超”的“啟”字存在兩種繁體形式——“啟”與“啓”,可在書目數(shù)據(jù)中采用統(tǒng)一的標(biāo)準(zhǔn)表述,而在對象數(shù)據(jù)中保留原表述即可。上述研究發(fā)現(xiàn),用戶對打印和下載功能有較高的需求,但目前國內(nèi)古籍?dāng)?shù)據(jù)庫對此限制頗多,如中國基本古籍庫一次只能復(fù)制200個(gè)漢字,《廣州大典》網(wǎng)絡(luò)服務(wù)平臺僅允許每個(gè)賬號每天下載或打印10頁,對此可在征得文獻(xiàn)所有者同意的前提下,適當(dāng)提高下載或打印上限,或?yàn)楦哳l用戶開通VIP權(quán)限。
第四,深度揭示和挖掘古籍資源。從上述研究可知,除書名外,讀者還傾向于從人名、地區(qū)、文獻(xiàn)類型、文化和文獻(xiàn)主題等角度檢索文獻(xiàn),因此在設(shè)置文獻(xiàn)描述元素時(shí),應(yīng)適當(dāng)增加描述標(biāo)簽,以實(shí)現(xiàn)對文獻(xiàn)的深層次揭示。其中,人名可以是作者的,也可以是文獻(xiàn)中涉及人物的,如傳記的傳主。因此在作者字段外,還可另設(shè)人名標(biāo)簽,詳細(xì)著錄文獻(xiàn)中的重要人物;在古籍文獻(xiàn)與地區(qū)的對應(yīng)關(guān)系中,包括內(nèi)容涉及的地區(qū),被創(chuàng)作的地區(qū)、或是被收藏的地區(qū),對于歷史類文獻(xiàn),如方志,第一種關(guān)系尤為重要,便于讀者從地區(qū)角度獲取文獻(xiàn),因此可設(shè)置一級標(biāo)簽“地區(qū)”,并在其下細(xì)分“內(nèi)容”“創(chuàng)作”“收藏”等二級標(biāo)簽。在文獻(xiàn)揭示的基礎(chǔ)上,系統(tǒng)可引入可視化、語義關(guān)聯(lián)、智慧服務(wù)等技術(shù),實(shí)現(xiàn)文獻(xiàn)的多途徑發(fā)現(xiàn)和獲取。對于地方史志類文獻(xiàn),可引入GIS工具進(jìn)行可視化呈現(xiàn),如上海圖書館建設(shè)的家譜知識服務(wù)平臺設(shè)置了“時(shí)空瀏覽”欄目,提供檢索定位、地圖劃圈瀏覽等便捷服務(wù)[15]。由哈佛大學(xué)費(fèi)正清中國研究中心、臺灣“中央研究院”歷史語言研究所、北京大學(xué)中國古代研究中心及中文在線聯(lián)合推出的“中國歷代人物傳記資料庫”,對歷史資料中與人物相關(guān)的數(shù)據(jù)進(jìn)行精準(zhǔn)標(biāo)引,并借助GIS為用戶提供多種發(fā)現(xiàn)體驗(yàn)[15]。此外,系統(tǒng)還可利用關(guān)聯(lián)數(shù)據(jù)技術(shù),從多個(gè)維度對文獻(xiàn)進(jìn)行知識關(guān)聯(lián)和整合,如由上海圖書館建設(shè)的中文古籍聯(lián)合目錄及循證平臺就借助關(guān)聯(lián)數(shù)據(jù)技術(shù)實(shí)現(xiàn)了古籍知識之間的多維度鏈接。在古籍庫建設(shè)中,文本是系統(tǒng)進(jìn)行知識服務(wù)的基礎(chǔ),但在不具備對全庫資源進(jìn)行文本建設(shè)的條件下,可采取“基于使用量”的文本化策略,即優(yōu)先對核心文獻(xiàn)進(jìn)行文本加工,并將生成的文本數(shù)據(jù)融入全文檢索、知識發(fā)現(xiàn)、AI問答等系統(tǒng),為古籍核心文獻(xiàn)提供增值服務(wù)。
第五,加強(qiáng)數(shù)據(jù)庫推廣和普及。研究表明,高校教師和研究生是古籍?dāng)?shù)據(jù)庫的重點(diǎn)用戶,因此數(shù)據(jù)庫建成后應(yīng)著重關(guān)注這兩類群體,深入了解其研究動(dòng)態(tài)和研究需求,通過嵌入式服務(wù)、主動(dòng)推送等措施提供精準(zhǔn)服務(wù)。在資源方面,應(yīng)根據(jù)用戶的使用頻率遴選數(shù)據(jù)庫核心資源,建立重點(diǎn)資源列表,并圍繞重點(diǎn)資源獲取相關(guān)研究成果,形成主題資源集,按用戶研究領(lǐng)域和研究方向進(jìn)行推送?!稄V州大典》網(wǎng)絡(luò)服務(wù)平臺擬于2024年改版,在首頁上設(shè)置“經(jīng)典文獻(xiàn)”欄目,以提高核心文獻(xiàn)的可見度和易獲取性。上述研究還表明,古籍由于存在使用門檻,用戶主要集中在專業(yè)領(lǐng)域,普通市民利用不足,因此應(yīng)積極拓展古籍資源的普及推廣渠道,吸引更多市民利用。蘇州圖書館為促進(jìn)古籍活化利用,于2022年舉辦了“吳門縹緗”系列活動(dòng),讓讀者近距離接觸古籍和傳統(tǒng)文化,并與上海圖書館合作推出“古今相映,樂創(chuàng)未來——非物質(zhì)文化遺產(chǎn)系列推廣活動(dòng)”,策劃實(shí)施“書版合璧——蘇州雕版特展”,提高了市民對古籍資源的知曉度[16]。
5 結(jié)語
筆者主要依據(jù)《廣州大典》網(wǎng)絡(luò)服務(wù)平臺所記錄的用戶數(shù)據(jù)展開分析,但由于該平臺在數(shù)據(jù)記錄方面存在一定局限,如數(shù)據(jù)不全、粒度較粗等,且筆者在界定常頻用戶與常頻文獻(xiàn)時(shí)所采用的標(biāo)準(zhǔn)帶有一定的主觀性,因此對研究分析結(jié)果的客觀性和準(zhǔn)確性造成一定影響。2024年,《廣州大典》研究中心擬對《廣州大典》網(wǎng)絡(luò)服務(wù)平臺進(jìn)行全面升級和完善,并將啟動(dòng)新一輪數(shù)據(jù)入庫計(jì)劃,其中后臺統(tǒng)計(jì)功能優(yōu)化是一個(gè)重要目標(biāo),隨著平臺功能優(yōu)化和更多細(xì)粒度數(shù)據(jù)被保留,未來可對古籍?dāng)?shù)據(jù)庫的應(yīng)用情況進(jìn)行更為全面和深入的分析。
參考文獻(xiàn):
[1] 蘇州新聞網(wǎng).全面梳理蘇州文脈資源 保存蘇州集體記憶《蘇州全書》編纂工程正式啟動(dòng)[EB/OL].[2024-02-03].http://www.subaonet.com/2022/szyw/0703/533254.shtml.
[2] 陳力.數(shù)字人文視域下的古籍?dāng)?shù)字化與古典知識庫建設(shè)問題[J].中國圖書館學(xué)報(bào),2022(2):36-46.
[3] 張力元,王軍.古籍?dāng)?shù)據(jù)庫分面分類體系設(shè)計(jì)研究[J].圖書館建設(shè),2021(3):56-61.
[4] 李明杰,張纖柯,陳夢石.古籍?dāng)?shù)字化研究進(jìn)展述評(2009—2019)[J].圖書情報(bào)工作,2020(6):130-137.
[5] 武杰.寧夏古籍?dāng)?shù)字化現(xiàn)狀分析與對策研究——以入選《國家珍貴古籍名錄》的古籍為調(diào)查樣本[J].圖書館理論與實(shí)踐,2022(4):131-136.
[6] 張小燕.江西省珍貴古籍?dāng)?shù)字化項(xiàng)目案例分析[J].圖書館,2018(12):98-103.
[7] 王蕾,等.民間歷史文獻(xiàn)數(shù)字人文圖書館構(gòu)建——以徽州文書數(shù)字人文圖書館實(shí)踐反思為例[J].圖書館論壇,2018(3):30-36.
[8] 馬翠嫦,王蕾.史學(xué)話語體系視角下徽州文書領(lǐng)域主題多維結(jié)構(gòu)研究[J].圖書館雜志,2022(7):119-127.
[9] 蘇日娜,王蕾,童翠萍.非遺語境下徽州文書搶救性保護(hù)的科學(xué)體系構(gòu)建[J].圖書館建設(shè),2022(1):15-21.
[10] 徐丹.基于KANO模型的人文學(xué)科研究需求對古籍?dāng)?shù)字化產(chǎn)品的功能調(diào)查[D].武漢:武漢大學(xué),2019.
[11] 吳玉靈.館藏古籍?dāng)?shù)字化保護(hù)問題與對策研究[J].圖書館學(xué)刊,2022(2):43-49.
[12] 史麗君.古籍圖像數(shù)據(jù)庫建設(shè)常見問題及對策研究——以首都圖書館館藏古籍珍善本圖像數(shù)據(jù)庫建設(shè)為例[J].圖書館工作與研究,2016(9):62-66.
[13] 李敏.南海特色古籍?dāng)?shù)據(jù)庫架構(gòu)研究[J].圖書館學(xué)研究,2016(9):34-40.
[14] 楊雪莉,曹志梅.徐州地方文獻(xiàn)數(shù)據(jù)庫建設(shè)的存在問題及對策研究[J].情報(bào)探索,2016(8):67-70.
[15] 朱本軍,聶華.跨界與融合:全球視野下的數(shù)字人文——首屆北京大學(xué)“數(shù)字人文論壇”會議綜述[J].大學(xué)圖書館學(xué)報(bào),2016(5):16-20.
[16] 蘇州圖書館2022年度蘇州圖書館年報(bào)[EB/OL].[2024-02-04].https://www.szlib.com/gwgk.html?articeid=50348.
付躍安 男,1974年生。博士,研究館員。研究方向:數(shù)字圖書館、閱讀推廣。
(收稿日期:2023-12-18;責(zé)編:劉清揚(yáng)。)