摘要:為獲取有效且可分析的數(shù)字資源使用數(shù)據(jù),解決當(dāng)前圖書館依賴數(shù)據(jù)庫商提供統(tǒng)計數(shù)據(jù)的困境,文章在分析數(shù)字資源統(tǒng)計系統(tǒng)實現(xiàn)原理與應(yīng)用、國內(nèi)外數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)的基礎(chǔ)上,結(jié)合首都師范大學(xué)圖書館館藏資源情況提出數(shù)字資源統(tǒng)計系統(tǒng)的指標(biāo)和功能需求,以此提出系統(tǒng)構(gòu)建的總體框架和功能模塊。
關(guān)鍵詞:數(shù)字資源;統(tǒng)計分析;COUNTER;HTTP/HTTPS傳輸協(xié)議
中圖分類號:G251.4" "文獻(xiàn)標(biāo)志碼:A
0引言
一方面,隨著計算機技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字資源逐漸成為文獻(xiàn)信息的主要表現(xiàn)形式,圖書館數(shù)字資源購置經(jīng)費的比例也逐年攀升。2020年, 中國高校圖書館基本統(tǒng)計數(shù)據(jù)報告揭示1 224所高校圖書館的紙質(zhì)資源購置費均值為206.9萬元(2019年是221.1萬元),比2019年減少了14.2萬元,且呈逐年下降的趨勢;1 141所高校圖書館提交的電子資源購置費均值為343.6萬元(2019年是323.3萬元),占館均文獻(xiàn)資源購置費率的56.8%,較2019年增長了2.2個百分點[1]。另一方面,隨著數(shù)據(jù)庫購買價格的上漲,圖書館經(jīng)費可購置的數(shù)字資源變少,反映資源使用情況的統(tǒng)計變得尤為重要。
圖書館對數(shù)字資料的使用數(shù)據(jù)一般由數(shù)據(jù)庫廠商提供,主要利用數(shù)據(jù)庫的統(tǒng)計平臺自動下載與整理數(shù)據(jù)報表,或是要求數(shù)據(jù)庫商提交統(tǒng)計數(shù)據(jù),但實際上部分?jǐn)?shù)據(jù)庫商所提供數(shù)據(jù)的準(zhǔn)確性還有待商榷。另外,對于中文數(shù)據(jù)庫而言,除中國知網(wǎng)遵循COUNTER標(biāo)準(zhǔn),其他數(shù)據(jù)庫遵循或參考的統(tǒng)計標(biāo)準(zhǔn)各不相同,統(tǒng)計數(shù)據(jù)的來源也有差異,不能客觀真實地反映數(shù)據(jù)庫使用情況[2]。在圖書購置經(jīng)費逐年減縮、數(shù)據(jù)庫購買價格逐年上漲的背景下,圖書館需要相對客觀、可信、持續(xù)、可對比的數(shù)據(jù)來引導(dǎo)數(shù)字資源配置的合理化、科學(xué)化,支持教師的科研工作,助推學(xué)?!半p一流”建設(shè)。
1數(shù)字資源統(tǒng)計系統(tǒng)調(diào)研分析
1.1數(shù)字資源統(tǒng)計系統(tǒng)的技術(shù)類型
圖書館界很早就對數(shù)字資源統(tǒng)計系統(tǒng)開展研究,在中國知網(wǎng)、維普期刊和萬方數(shù)據(jù)平臺以主題詞“數(shù)字資源”“電子資源統(tǒng)計”進(jìn)行檢索,在2003年就已經(jīng)有關(guān)于數(shù)字資源統(tǒng)計的相關(guān)文章。通過對已有文獻(xiàn)調(diào)查發(fā)現(xiàn),構(gòu)建數(shù)字資源統(tǒng)計系統(tǒng)的技術(shù)主要歸為以下3項。
1.1.1基于網(wǎng)關(guān)日志采集的分析模式
該分析模式應(yīng)用較早,圖書館的網(wǎng)關(guān)設(shè)備會對流經(jīng)網(wǎng)關(guān)的訪問數(shù)據(jù)進(jìn)行記錄并形成日志文件,通過開發(fā)日志采集與分析系統(tǒng)對日志文件進(jìn)行采集、過濾與分析,進(jìn)而生成數(shù)字資源使用統(tǒng)計報告。優(yōu)點是不會改變網(wǎng)絡(luò)拓?fù)浜驮黾有掠布O(shè)備,通過對網(wǎng)關(guān)設(shè)備已有的日志功能進(jìn)行分析產(chǎn)生使用統(tǒng)計報告;缺點是受日志文件生成頻次、采集分析系統(tǒng)的轉(zhuǎn)換性能等因素限制,統(tǒng)計報告難以做到實時生成,并且僅對部署在館內(nèi)的本地鏡像數(shù)字資源進(jìn)行日志分析,無法對遠(yuǎn)程訪問資源進(jìn)行分析[3]。
1.1.2基于旁路監(jiān)聽的分析模式
在本地已有網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的基礎(chǔ)上增加專門用于數(shù)據(jù)采集的服務(wù)器,將數(shù)據(jù)采集器與圖書館核心交換機相連,在網(wǎng)關(guān)設(shè)備上通過端口鏡像功能將數(shù)據(jù)包復(fù)制到數(shù)據(jù)采集器上,數(shù)據(jù)采集器完成對數(shù)據(jù)包的捕獲、過濾和分析[4]。優(yōu)點是無需改變已有的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),也不會影響用戶已形成的訪問行為,即可實時監(jiān)控數(shù)字資源的使用情況并對違規(guī)下載行為進(jìn)行預(yù)警;缺點是需要部署專門的服務(wù)器用于采集分析數(shù)據(jù),投入成本高,需專業(yè)網(wǎng)絡(luò)硬件設(shè)備支持,且數(shù)據(jù)包分析也相對復(fù)雜,不適宜在圖書館大范圍推廣。
1.1.3基于反向代理技術(shù)的分析模式
圖書館通過本地代理服務(wù)器收集用戶訪問請求并將請求轉(zhuǎn)換后發(fā)送到數(shù)據(jù)庫商服務(wù)器,通過對代理服務(wù)器上的訪問請求與響應(yīng)數(shù)據(jù)包進(jìn)行分析,獲取用戶訪問信息[5]。優(yōu)點是構(gòu)建相對簡單且無需購買服務(wù)器,并且能夠?qū)崿F(xiàn)用戶統(tǒng)一認(rèn)證登錄和數(shù)字資源管理;缺點是僅支持HTTP協(xié)議的數(shù)字資源。
1.2數(shù)字資源統(tǒng)計系統(tǒng)的應(yīng)用現(xiàn)狀
數(shù)字資源統(tǒng)計系統(tǒng)在圖書館的應(yīng)用主要包括引進(jìn)商用系統(tǒng)、自建系統(tǒng)、與第三方公司合作開發(fā)系統(tǒng)3種模式。國外商用系統(tǒng)主要是針對遵循COUNTER標(biāo)準(zhǔn)和采用SUSHI收割協(xié)議的數(shù)據(jù)庫進(jìn)行的數(shù)據(jù)統(tǒng)計,而我國圖書館數(shù)據(jù)資源除了外文資源,還有大量不支持COUNTER標(biāo)準(zhǔn)的中文數(shù)據(jù)庫,因此,本項目考察的商用系統(tǒng)對象不包括ProQuest公司的Intota和英國JISC采購聯(lián)盟開發(fā)的JUSP期刊統(tǒng)計平臺,而是本地化的商用系統(tǒng)。
在商用系統(tǒng)的實踐應(yīng)用上,西安交通大學(xué)、西安電子科技大學(xué)和北京交通大學(xué)部署了誠泰科技RGS1800圖書館電子資源利用與統(tǒng)計系統(tǒng),同濟大學(xué)、華東理工大學(xué)和上海圖書館部署泰和盛劍ERU圖書分析系統(tǒng),中國科技大學(xué)、上海外國語大學(xué)、華南師范大學(xué)部署了復(fù)旦華光ERU。RGS1800和ERU都是采用旁路監(jiān)聽的分析模式,在不改變用戶資源訪問習(xí)慣的基礎(chǔ)上對用戶訪問流量進(jìn)行實時捕獲和統(tǒng)計分析[6]。RGS1800系統(tǒng)的主要優(yōu)點是數(shù)據(jù)統(tǒng)計算法嚴(yán)格遵循COUNTER統(tǒng)計標(biāo)準(zhǔn),能夠統(tǒng)計各資源的檢索量、下載量、被拒絕請求量等數(shù)據(jù),并生成COUNTER格式的統(tǒng)計報表[7]。ERU系統(tǒng)的主要優(yōu)點是通過用戶Web訪問頁面進(jìn)行頁面仿真建模分析,可以實現(xiàn)基于“訪問內(nèi)容級”的統(tǒng)計分析和建模,深層次獲取圖書館知識發(fā)現(xiàn)和學(xué)科服務(wù)所需的數(shù)據(jù)集;同時,可以實現(xiàn)圖書館電子資源使用統(tǒng)計按照COUNTER標(biāo)準(zhǔn)進(jìn)行統(tǒng)計分析和對惡意下載行為的實時監(jiān)控[7-9]。
不少圖書館也投入大量精力自行開發(fā)數(shù)據(jù)資源統(tǒng)計系統(tǒng),例如:深圳大學(xué)圖書館2013年基于COUNTER使用統(tǒng)計數(shù)據(jù)研發(fā)的電子資源使用統(tǒng)計平臺USSER[10]用于收集分析經(jīng)SUSHI收割的使用數(shù)據(jù);南京曉莊學(xué)院圖書館在重新調(diào)整統(tǒng)計數(shù)據(jù)指標(biāo)的基礎(chǔ)上采用端口鏡像方式自建了數(shù)字資源統(tǒng)計系統(tǒng)[11];南京圖書館先后采用旁路監(jiān)聽模式和反向代理方式自建數(shù)字資源統(tǒng)計系統(tǒng),南京圖書館的應(yīng)用案例反映了反向代理方式比旁路監(jiān)聽模式更適合圖書館。
在自建和商用之外,也有圖書館尋求和第三方合作研發(fā)適合本館和國內(nèi)圖書館的統(tǒng)計系統(tǒng)。深圳圖書館與第三方合作開發(fā)了“電子資源利用統(tǒng)計系統(tǒng)”[12];上海交通大學(xué)與南京昆蟲軟件有限公司合作研發(fā)ERS;上海財經(jīng)大學(xué)圖書館將ERS應(yīng)用于外文電子期刊[13]的資源管理。
2數(shù)字資源的統(tǒng)計標(biāo)準(zhǔn)分析
2.1國內(nèi)外代表性數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)
國外圍繞數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)展開了眾多大型的研究項目,并形成了一些相對成熟的標(biāo)準(zhǔn)[14-15],例如:由國際標(biāo)準(zhǔn)化組織與國際圖書館協(xié)會聯(lián)合會為圖書館統(tǒng)計制定國際標(biāo)準(zhǔn)ISO 2789;由美國圖書館及其他類型組織機構(gòu)制定圖書館與信息服務(wù)機構(gòu)統(tǒng)計指標(biāo)NISO Z39.7;由英國圖書館界、出版界和中間商共同發(fā)起的網(wǎng)絡(luò)電子資源在線使用統(tǒng)計標(biāo)準(zhǔn)COUNTER。這些標(biāo)準(zhǔn)中COUNTER是目前影響力最大,也是使用最為廣泛的,其優(yōu)勢在于明確要求內(nèi)容提供商需滿足規(guī)范性要求,使圖書館能夠獲得一致、可信和可比較的使用統(tǒng)計數(shù)據(jù)。
國內(nèi)針對數(shù)字資源統(tǒng)計的研究起步較晚,近年來也出臺了一些標(biāo)準(zhǔn)規(guī)范,代表性的有教育部高校圖工委和CALIS管理中心牽頭出版的《高等學(xué)校圖書館數(shù)字資源計量指南》[16]、中科院國家科學(xué)圖書館負(fù)責(zé)制定的《信息與文獻(xiàn)圖書館統(tǒng)計》(GB/T 13191—2009)、國家圖書館數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范研究項目的項目成果《國家圖書館數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)和應(yīng)用指南》[17],以及由國家圖書館、文化和旅游部全國文化信息資源建設(shè)管理中心等起草的《圖書館數(shù)字資源統(tǒng)計規(guī)范》(WH/T 47—2012)[18]。國內(nèi)數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)在制定過程中以圖書館為主要對象,缺少對數(shù)據(jù)庫商的要求束縛,推行較為困難。
國外數(shù)字資源使用統(tǒng)計標(biāo)準(zhǔn)研究雖相對比較成熟,COUNTER標(biāo)準(zhǔn)在境外數(shù)據(jù)庫商中的認(rèn)可度也很高,但中文數(shù)據(jù)庫商對COUNTER的支持度并不高[19],各種基于COUNTER標(biāo)準(zhǔn)設(shè)計的數(shù)字資源使用統(tǒng)計平臺也無法適用于中文數(shù)據(jù)庫。中國知網(wǎng)遵循COUNTER標(biāo)準(zhǔn)提供統(tǒng)計數(shù)據(jù),其他中文數(shù)據(jù)庫采用或參考的標(biāo)準(zhǔn)協(xié)議也有較大差異。國內(nèi)外數(shù)字資源使用統(tǒng)計標(biāo)準(zhǔn)中制定的統(tǒng)計指標(biāo)雖不相同,但也存在一些共同點,如資源檢索次數(shù)、下載次數(shù)、訪問(會話)次數(shù)等。
2.2數(shù)字資源統(tǒng)計系統(tǒng)的統(tǒng)計指標(biāo)
根據(jù)統(tǒng)計數(shù)據(jù)和數(shù)字資源績效評價的需求,參考COUNTER標(biāo)準(zhǔn)和《圖書館數(shù)字資源統(tǒng)計規(guī)范》,本文本著客觀可行的原則、統(tǒng)計數(shù)據(jù)縱向?qū)Ρ鹊臍v史延續(xù)性以及未來應(yīng)用的可擴展性與前瞻性,確定并定義了本系統(tǒng)的統(tǒng)計指標(biāo)。
(1)瀏覽量:點入查看數(shù)據(jù)庫記錄詳細(xì)信息頁面的次數(shù)。對于一條記錄被多次點擊瀏覽的情況視為一次瀏覽行為。
(2)訪問量:用戶登錄系統(tǒng)且成功訪問30 s算一次訪問量。限定訪問時間是為了剔除誤操作產(chǎn)生的數(shù)據(jù)。
(3)下載量:全文或描述性內(nèi)容成功請求的次數(shù)。對于期刊、圖書數(shù)據(jù)庫指下載到本地和全文在線瀏覽數(shù)量之和,對于多媒體、平臺類數(shù)據(jù)庫指在線瀏覽內(nèi)容資源量。對于30 s內(nèi)的重復(fù)下載行為僅記錄一次,不重復(fù)計數(shù)。
(4)檢索量:用戶對資源內(nèi)容進(jìn)行檢索的次數(shù)。一次完整、標(biāo)準(zhǔn)的檢索行為應(yīng)包括用戶輸入檢索條件、數(shù)據(jù)庫服務(wù)器根據(jù)檢索請求返回檢索結(jié)果。
3數(shù)字資源統(tǒng)計系統(tǒng)總體框架及功能
3.1數(shù)字資源統(tǒng)計系統(tǒng)總體框架
作為數(shù)字資源績效考核的基礎(chǔ)和了解用戶使用情況的依據(jù),圖書館需要掌握數(shù)據(jù)庫的使用數(shù)據(jù)。目前,外文數(shù)據(jù)庫通過訪問數(shù)據(jù)庫統(tǒng)計平臺自行下載,對于沒有統(tǒng)計平臺數(shù)據(jù)庫的則由數(shù)據(jù)庫商直接提供。由于數(shù)據(jù)反映了數(shù)據(jù)庫的使用情況,對于訪問量小的數(shù)據(jù)庫,數(shù)據(jù)庫商提供數(shù)據(jù)的真實性有待商榷;并且數(shù)據(jù)庫商提供數(shù)據(jù)會有一定的延遲性,不能滿足臨時需要。因此,圖書館需要一款系統(tǒng)既可以整合存儲所有數(shù)據(jù)庫的使用數(shù)據(jù),還能提供挖掘分析功能用于支持圖書館工作。
圖書館訂購和試用數(shù)據(jù)庫共184個,對所有數(shù)據(jù)庫采用的傳輸協(xié)議、是否需要安裝客戶端、是否遵循COUNTER標(biāo)準(zhǔn)且支持SUSHI收割進(jìn)行統(tǒng)計。統(tǒng)計結(jié)果顯示,采用HTTP超文本傳輸協(xié)議的數(shù)據(jù)庫116個、采用HTTPS傳輸協(xié)議的數(shù)據(jù)庫66個、需安裝客戶端的數(shù)據(jù)庫2個,其中符合COUNTER標(biāo)準(zhǔn)且支持SUSHI收割的數(shù)據(jù)庫共有25個,且均為外文數(shù)據(jù)庫。
基于反向代理技術(shù)的分析模式不會改變網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、構(gòu)建簡單且無須購買專用服務(wù)器,可以實現(xiàn)數(shù)據(jù)實時統(tǒng)計,在圖書館設(shè)備采購經(jīng)費緊張的背景下是優(yōu)選方案。但是,基于反向代理技術(shù)的分析模式也有缺點,只能采集使用HTTP通信協(xié)議且無須安裝客戶端的數(shù)據(jù)庫,對于采用HTTPS通信協(xié)議和需安裝客戶端的資源無法采集使用數(shù)據(jù)。陳廣[20]提出采用支持中間人技術(shù)的代理程序解析HTTPS,但該技術(shù)需要用戶安裝SSL證書和網(wǎng)絡(luò)部門配合配置策略路由功能??紤]首都師范大學(xué)圖書館資源面向全校師生,用戶群體大,建議用戶在客戶端安裝SSL證書的難度較大,并且館藏資源中采用HTTPS通信協(xié)議的數(shù)據(jù)庫約占1/3,相對較少,故暫不考慮此種方式。綜上所述,從通信協(xié)議角度、統(tǒng)計數(shù)據(jù)準(zhǔn)確性角度,擬選擇反向代理方式為主自行獲取用戶使用數(shù)據(jù),輔以SUSHI收割數(shù)據(jù)和第三方數(shù)據(jù)導(dǎo)入的方式作為補充。
3.2數(shù)字資源統(tǒng)計系統(tǒng)功能模塊
建立在數(shù)據(jù)采集、統(tǒng)計分析基礎(chǔ)上的數(shù)字資源統(tǒng)計系統(tǒng)是圖書館掌握數(shù)字資源使用情況、評估數(shù)字資源績效指標(biāo)和指導(dǎo)學(xué)科館員服務(wù)院系科研工作的工具,由資源管理模塊、讀者管理模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)整合模塊、數(shù)據(jù)挖掘模塊、用戶管理模塊、圖形化展示模塊等組成。
(1)資源管理模塊。系統(tǒng)可根據(jù)學(xué)科類型、文獻(xiàn)類型添加/修改/刪除中外文數(shù)據(jù)庫(引進(jìn))、試用數(shù)據(jù)庫、OA開放獲取數(shù)據(jù)庫、教學(xué)教參等自建數(shù)據(jù)庫,支持批量導(dǎo)入和導(dǎo)出功能。
(2)讀者管理模塊。系統(tǒng)采用用戶統(tǒng)一身份認(rèn)證登錄,導(dǎo)入讀者信息并根據(jù)不同角色的讀者劃分不同的用戶組實現(xiàn)分組管理,便于后期分析讀者行為。
(3)數(shù)據(jù)采集模塊。使用數(shù)據(jù)自采模塊:基于反向代理方式采集HTTP通信協(xié)議數(shù)據(jù)資源的使用數(shù)據(jù),這部分?jǐn)?shù)據(jù)中不包含支持COUNTER標(biāo)準(zhǔn)的資源使用數(shù)據(jù)。SUSHI收割模塊:對于支持SUSHI收割的數(shù)據(jù)庫實現(xiàn)自動收割COUNTER數(shù)據(jù)。第三方數(shù)據(jù)導(dǎo)入模塊:對于反向代理方式無法采集到的資源使用數(shù)據(jù)及支持COUNTER標(biāo)準(zhǔn)的資源歷史使用數(shù)據(jù),可按照特定格式導(dǎo)入統(tǒng)計系統(tǒng)中。
(4)數(shù)據(jù)整合模塊。依據(jù)COUNTER標(biāo)準(zhǔn)和《圖書館數(shù)字資源統(tǒng)計規(guī)范》,將不同來源的使用統(tǒng)計數(shù)據(jù)規(guī)范化處理。
(5)數(shù)據(jù)挖掘模塊。資源使用分析模塊:采用大數(shù)據(jù)挖掘技術(shù)挖掘分析用戶使用數(shù)據(jù),可以實現(xiàn)對瀏覽量、訪問量、下載量、檢索量的統(tǒng)計和分析,支持?jǐn)?shù)據(jù)的橫向、縱向?qū)Ρ确治?。用戶行為分析模塊:對用戶的使用行為進(jìn)行分析,構(gòu)建用戶畫像,從而實現(xiàn)面向用戶的個性化資源推薦。統(tǒng)計報表模塊:根據(jù)制定的統(tǒng)計指標(biāo)產(chǎn)生統(tǒng)計報告,統(tǒng)計報告支持多種條件的篩選,支持EXCEL、PDF、XML格式導(dǎo)出。
(6)用戶管理模塊。系統(tǒng)提供用戶管理、權(quán)限管理和日志管理,在分級管理模式下方便學(xué)科館員查看本學(xué)科相關(guān)數(shù)據(jù)庫的訪問情況。
(7)圖形化展示模塊。統(tǒng)計結(jié)果及分析采用圖形化展示,可采用功能強大、使用簡單的ECharts圖表插件定制數(shù)據(jù)可視化圖表,滿足用戶對數(shù)據(jù)進(jìn)行挖掘整合的需求。
4數(shù)字資源統(tǒng)計系統(tǒng)的不足與展望
文章基于首都師范大學(xué)圖書館當(dāng)前數(shù)字資源采購情況及HTTP/HTTPS通信協(xié)議使用情況,在設(shè)備采購經(jīng)費緊縮的背景下提出的建設(shè)框架,能滿足多來源數(shù)據(jù)收集以及實時統(tǒng)計分析等方面的實際需求,但也存在一些現(xiàn)實問題。
圖書館網(wǎng)絡(luò)及相關(guān)設(shè)備的使用受限于學(xué)校網(wǎng)絡(luò)總體管控,數(shù)字資源統(tǒng)計系統(tǒng)的建設(shè)需要數(shù)字校園建設(shè)中心的配合,反向代理服務(wù)器安裝在圖書館后,需遵守學(xué)校網(wǎng)絡(luò)安全規(guī)定接受安全漏洞掃描,出現(xiàn)“高危漏洞”時需關(guān)閉服務(wù)器的對外訪問權(quán)限。
隨著數(shù)據(jù)庫商對網(wǎng)絡(luò)安全要求的加強,原有HTTP協(xié)議逐漸轉(zhuǎn)換到HTTPS協(xié)議,使得采用HTTPS通信協(xié)議的數(shù)據(jù)庫商占大多數(shù)時,使用反向代理方式采集使用數(shù)據(jù)的缺點就會更加凸顯。
無法兼顧移動圖書館場景下的用戶使用數(shù)據(jù)。隨著移動互聯(lián)網(wǎng)的不斷發(fā)展,部分?jǐn)?shù)據(jù)庫也推出了獨立的移動客戶端,如CNKI全球?qū)W術(shù)快報、超星數(shù)字圖書館。當(dāng)前,系統(tǒng)架構(gòu)主要適用于桌面訪問方式,未介入此類移動端訪問過程,無法實現(xiàn)此類數(shù)據(jù)的采集和有效統(tǒng)計。
上述問題是當(dāng)前數(shù)字資源統(tǒng)計系統(tǒng)架構(gòu)持續(xù)完善的動力。數(shù)字資源數(shù)量的增多使得圖書館需要一個系統(tǒng)整合揭示所有資源的使用數(shù)據(jù),實現(xiàn)數(shù)字資源的橫縱向使用對比,而受限于當(dāng)前技術(shù)水平、數(shù)據(jù)資源統(tǒng)計標(biāo)準(zhǔn)及數(shù)據(jù)庫使用方式,不能采用單一方式采集到所有數(shù)字資源的使用數(shù)據(jù),未來需要多種方式共同使用,甚至仍然需要一定的人工干預(yù)。此外,圖書館建議數(shù)據(jù)庫商遵循COUNTER標(biāo)準(zhǔn)的呼聲越來越高,數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)的日趨統(tǒng)一對數(shù)字資源統(tǒng)計系統(tǒng)的優(yōu)化也有積極的推動作用。
參考文獻(xiàn)
[1]吳漢華,王波.2020年中國高校圖書館基本統(tǒng)計數(shù)據(jù)分析[J].大學(xué)圖書館學(xué)報,2021(4):5-11.
[2]胡大琴.中文數(shù)字資源使用統(tǒng)計數(shù)據(jù)的調(diào)查研究[J].圖書情報工作,2017(15):104-110.
[3]閆曉弟,邵晶,周奇,等.電子資源利用統(tǒng)計網(wǎng)關(guān)系統(tǒng)的設(shè)計與實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2008(8):97-100.
[4]倪劼.基于SharpPcap的圖書館數(shù)字資源訪問統(tǒng)計系統(tǒng)設(shè)計與實現(xiàn)[J].圖書館工作與研究,2017(12):48-53.
[5]倪劼.圖書館數(shù)字資源訪問統(tǒng)計系統(tǒng)構(gòu)建研究——基于OpenResty平臺[J].圖書館工作與研究,2019(10):75-82.
[6]孫瑾.基于應(yīng)用層的高校圖書館數(shù)字資源統(tǒng)計系統(tǒng)[J].農(nóng)業(yè)圖書情報學(xué)刊,2018(6):43-47.
[7]佚名.誠泰科技圖書館電子資源利用與統(tǒng)計系統(tǒng)RSG1800[EB/OL].(2023-02-08)[2023-02-08].http://www.chengtaikj.com/mobile/product/rgs/.
[8]張計龍,殷沈琴,陳鐵.基于ERU的圖書館用戶信息行為數(shù)據(jù)采集方法研究——以復(fù)旦大學(xué)圖書館為例[J].圖書館雜志,2014(12):10-16.
[9]佚名.泰和盛創(chuàng)ERU圖書分析系統(tǒng)[EB/OL].(2014-10-04)[2023-02-08].http://thetech.com.cn/a/chanpinzhongxin/ERU/2014/0918/162.html.
[10]陳大慶,葉蘭,楊巍,等.電子資源使用統(tǒng)計平臺USSER的設(shè)計與實現(xiàn)[J].圖書情報工作,2015(1):106-112.
[11]陸康.高校圖書館數(shù)字資源統(tǒng)計系統(tǒng)建設(shè)研究[J].現(xiàn)代情報,2015(9):140-145.
[12]于淼.電子資源利用統(tǒng)計與分析——以深圳圖書館為例[J].公共圖書館,2017(4):18-21.
[13]李娜.電子資源管理與評估——以上海財經(jīng)大學(xué)圖書館的外文電子期刊為例[J].圖書情報工作,2018(15):60-64.
[14]彭康通.圖書館數(shù)字資源使用統(tǒng)計指標(biāo)構(gòu)建與思考[J].圖書館界,2016(4):25-30.
[15]劉蔚,王長宇.ISO2789、NISOZ39.7和E-METRICS數(shù)字資源評價標(biāo)準(zhǔn)比較[J].圖書館學(xué)刊,2010(8):102-105.
[16]劉葵波,章華云.《高等學(xué)校圖書館數(shù)字資源計量指南》評析及其實際應(yīng)用研究[J].圖書館建設(shè),2010(2):84-86.
[17]趙保穎,范雪.國內(nèi)外數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)比較分析[J].圖書與情報,2010(6):39-43.
[18]胡大琴.面向數(shù)據(jù)庫商的數(shù)字資源利用統(tǒng)計調(diào)查研究[J].圖書館雜志,2018(1):41-49.
[19]胡大琴.圖書館數(shù)字資源利用統(tǒng)計調(diào)查研究[J].圖書館建設(shè),2017(12):69-74.
[20]陳廣.本地化電子資源使用統(tǒng)計系統(tǒng)解析HTTPS訪問數(shù)據(jù)方法的對比研究[J].圖書情報工作,2019(14):36-42.
(編輯李春燕編輯)
Research on the construction of library digital resource statistics system
Zhang" Xiaojing, Yang" Xing, Mao" Chenyu, Xiao" Chan
(Library, Capital Normal University, Beijing 100089, China)
Abstract:" In order to obtain effective and analyzable data on the use of digital resources and solve the current dilemma of libraries relying on database providers to provide statistical data, this paper puts forward the indicators and functional requirement of the digital resources statistics system based on the analysis of the implementation principle and application of the digital resources statistics system and the statistical standards of digital resources at home and abroad, combined with the collection of resources in the library of Capital Normal University, based on this, the overall framework and functional modules for system construction are proposed.
Key words: digital resource; statistical analysis; COUNTER; HTTP/HTTPS transport protocol