鄭幸子
摘 要: 為了解決傳統(tǒng)數(shù)字圖書館在圖書分類系統(tǒng)設(shè)計上存在的問題,包括綜合服務(wù)功能不健全以及數(shù)字圖書資源檢索效率低等問題,設(shè)計了移動數(shù)字圖書館的圖書分類系統(tǒng),并對系統(tǒng)進(jìn)行總體架構(gòu)設(shè)計,設(shè)計了服務(wù)器后臺硬件系統(tǒng)、服務(wù)器前臺軟件的運(yùn)行環(huán)境、登錄操作以及檢索操作。系統(tǒng)軟件的設(shè)計包括系統(tǒng)編碼的設(shè)計流程和系統(tǒng)索引框架,系統(tǒng)以條形碼為基礎(chǔ)實現(xiàn)對圖書的分類,進(jìn)行功能測試和索引框架建立,提高電子圖書檢索水平。實驗結(jié)果說明所設(shè)計的圖書分類系統(tǒng)各項性能運(yùn)行良好,圖書分類效率提高了15%以上,具有較高的分類精確度。
關(guān)鍵詞: 數(shù)字圖書館; 圖書分類; 系統(tǒng)設(shè)計; 檢索; 分類效率; 分類精確度
中圖分類號: TN99?34; G250.76 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)07?0165?05
Design of book classification system for mobile digital library
ZHENG Xingzi
(Library of Jingchu University of Technology, Jingmen 448000, China)
Abstract: In order to solve the problems of imperfect comprehensive service function and low digital book resource retrieval efficiency existing in the book classification system design of the traditional digital library, a book classification system of mobile digital library was designed. The overall architecture of the system, background hardware system and foreground software operating environment of the server, login operation and retrieval operation are designed. The design of system software includes the design process of system encoding and system framework of index. On the basis of bar code, the system can realize the book classification. The function test and index framework establishment of the system are performed to improve the retrieval level of electronic books. The experimental results show that the book classification system has perfect performances, and its book classification efficiency is improved by more than 15%. It has high classification accuracy.
Keywords: digital library; book classification; system design; retrieval; classification efficiency; classification accuracy
隨著移動數(shù)字技術(shù)的發(fā)展,其在人們?nèi)粘I钪械膽?yīng)用逐漸加強(qiáng),人們對圖書信息的分類檢索需求速率也日益提升。為提高圖書的分類檢索速率,就要加強(qiáng)圖書分類系統(tǒng)的設(shè)計[1],通過對系統(tǒng)整體的需求分析、軟件和硬件系統(tǒng)的設(shè)計、系統(tǒng)編碼的設(shè)計和系統(tǒng)的測試來提高圖書的分類水平。傳統(tǒng)數(shù)字圖書館在圖書分類系統(tǒng)設(shè)計上存在綜合服務(wù)功能不健全、產(chǎn)生海量的無關(guān)信息和數(shù)字圖書資源檢索效率低等問題。為了解決傳統(tǒng)圖書分類系統(tǒng)存在的問題,本文設(shè)計了移動數(shù)字圖書館的圖書分類系統(tǒng),實現(xiàn)了圖書的高效分類。
1 數(shù)字圖書館的圖書分類系統(tǒng)設(shè)計
1.1 系統(tǒng)總體架構(gòu)設(shè)計
如圖1所示,本文圖書檢索系統(tǒng)總體分為服務(wù)器和終端兩大部分,其中服務(wù)器前臺主要包括前臺硬件系統(tǒng)和后臺的軟件系統(tǒng),硬件系統(tǒng)涵蓋了分類模塊、用戶個人信息管理模塊及推薦新書和圖書的點(diǎn)擊率模塊;服務(wù)器后臺主要負(fù)責(zé)整個服務(wù)器的安全運(yùn)行,其能夠?qū)τ脩舻卿?、檢索操作和閱讀資源、統(tǒng)計數(shù)據(jù)進(jìn)行管理。終端包括搜索模塊、用戶管理模塊、資源管理模塊等,用戶通過終端中的各種模塊實現(xiàn)圖書的分類檢索以及相關(guān)的管理。
1.2 服務(wù)器前臺硬件系統(tǒng)設(shè)計
服務(wù)器前臺硬件系統(tǒng)的高效配置是決定整個圖書分類系統(tǒng)正常和穩(wěn)定運(yùn)行的關(guān)鍵,服務(wù)器硬件設(shè)施滿足以下條件:服務(wù)器需滿足雙核以上的CPU中央處理系統(tǒng),機(jī)身內(nèi)存大于等于2 GB,硬盤的有效內(nèi)存大于120 GB,客戶機(jī)要選擇Windows 2000/XP或Linux系統(tǒng),內(nèi)存不小于512 MB,終端選擇Android SDK 2.2或以上的版本。
服務(wù)器前臺設(shè)計圖如圖2所示,前臺軟件功能模塊主要分為三大部分,主要有分類模塊、個人信息管理模塊及新書推薦和點(diǎn)擊排行。每個功能模塊下還有詳細(xì)的劃分,分類模塊下的語義分類還分為普通分類和高級分類,查找方式包括根據(jù)書名和書的編號兩種方式進(jìn)行查找[2];個人信息管理模塊包括可以修改和加密信息的基本信息管理、修改用戶姓名和住址等隱私的詳細(xì)信息管理,通過上傳和下載管理個人信息,查看和對實時評論進(jìn)行查看和刪減。
服務(wù)器前臺硬件系統(tǒng)還需同時具有登錄操作、檢索操作、圖書分類操作、用戶維護(hù)和數(shù)據(jù)維護(hù)等功能[3]。圖書檢索操作有簡單、復(fù)雜和對歷史數(shù)據(jù)進(jìn)行分類三種方式;數(shù)據(jù)維護(hù)的信息包括圖書信息維護(hù)和個人信息維護(hù)。
1.3 服務(wù)器后臺軟件系統(tǒng)設(shè)計
1.3.1 服務(wù)器后臺結(jié)構(gòu)設(shè)計
服務(wù)器后臺軟件系統(tǒng)采用Windows 2000/XP或者Linux操作系統(tǒng),Tomcat 5.5版本或以上版本,數(shù)據(jù)庫需使用MySQL數(shù)據(jù)庫系統(tǒng),服務(wù)器后臺結(jié)構(gòu)如圖3所示。
由圖3可知,服務(wù)器后臺系統(tǒng)包括五大功能模塊,其中電子書管理模塊對圖書類型進(jìn)行重新劃分,其中包含查找類型、添加類型、刪除類型和更新類型;用戶信息模塊通過對用戶信息的查找、添加、更新和刪除各種方式進(jìn)行信息收集;檢索模塊通過創(chuàng)建、更新和刪除索引對全文進(jìn)行檢索管理;統(tǒng)計方式可以按天統(tǒng)計、按月統(tǒng)計和按年統(tǒng)計。
1.3.2 實現(xiàn)用戶登錄和圖書分類檢索方法設(shè)計
用戶通過本文系統(tǒng)進(jìn)行登錄操作時,輸入個人基本信息進(jìn)行登錄操作,成功登錄后才可繼續(xù)進(jìn)行其他活動,否則只能瀏覽網(wǎng)頁。
檢索操作包括簡單檢索和復(fù)雜檢索,其中簡單檢索根據(jù)不同屬性進(jìn)行劃分,如書名、摘要和分類等。根據(jù)不同屬性進(jìn)行不同檢索,簡單檢索的功能模塊如圖4所示。
復(fù)雜檢索可以將復(fù)雜的檢索方式都綜合在一起,進(jìn)而可以快速高效地將自己所需的內(nèi)容搜尋出來。首先將不同內(nèi)容用字段的形式表示出來,然后對字段進(jìn)行檢索[4],連接方式用and或or表示。復(fù)雜檢索模塊如圖5所示。
搜索模塊的基本功能包括:全文檢索、語義檢索和查找功能,其流程圖用圖6描述。由圖6可知,三種基本功能是并列關(guān)系。用戶選擇好圖書信息的檢索方式后,輸入關(guān)鍵字,對關(guān)鍵字是否可識別進(jìn)行驗證[5],通過驗證后將結(jié)果傳遞到服務(wù)器,在限定時間內(nèi)完成其余流程,最后返回得到XML形式的圖書信息檢索結(jié)果,對XML形式的結(jié)果解析后進(jìn)行格式化處理,同時詢問用戶是否繼續(xù)。
2 系統(tǒng)軟件設(shè)計
2.1 圖書分類編碼的流程設(shè)計
系統(tǒng)進(jìn)行圖書分類編碼的制作就是條形碼的制作。判斷條形碼是否符合判斷規(guī)則,包括是否為13位碼及校驗是否正確等。制作過程如圖7所示。
圖書分類條形碼的制作基礎(chǔ)是數(shù)字代碼的編碼系統(tǒng),各種類型的編碼系統(tǒng)對數(shù)據(jù)格式、用途等都有不同的要求,所以編碼系統(tǒng)的選擇原則也不同。各種類型的圖書數(shù)據(jù)信息都需要不同的編碼方式進(jìn)行編碼,不同的編碼方式需要對此進(jìn)行標(biāo)準(zhǔn)的制定,從而得到需要的圖書信息分類結(jié)果,更加高效地進(jìn)行圖書信息分類編碼[6]。
圖書信息分類條形碼的解碼過程是圖書識別分類與檢索的關(guān)鍵步驟。在此過程中,首先對導(dǎo)入的圖書信息進(jìn)行解碼,然后進(jìn)行編碼的檢索,最后進(jìn)行圖書信息搜索。圖書信息條形碼的解碼流程圖如圖8所示。
2.2 系統(tǒng)實現(xiàn)索引和分類過程設(shè)計
索引系統(tǒng)結(jié)構(gòu)圖如圖9所示。由圖9可知,圖書索引系統(tǒng)由索引創(chuàng)建、索引更新和索引刪除三部分構(gòu)成,索引的創(chuàng)建是圖書分類的基礎(chǔ),建立的基礎(chǔ)來自對文本內(nèi)容的粗加工;不同類型的文章搜索關(guān)鍵字不同,就需要對索引進(jìn)行定期的更新,才能提高檢索分類的效率;索引刪除能夠減輕系統(tǒng)的壓力,加快檢索流程。
圖書分類模型結(jié)構(gòu)圖如圖10所示。通過分類器和文本數(shù)據(jù)庫的相互作用和系統(tǒng)應(yīng)用程序的技術(shù)支持實現(xiàn)對搜索命令的有效查詢[7],使結(jié)果滿足查詢要求。本文設(shè)計的檢索形式是單字倒排式結(jié)構(gòu),可對系統(tǒng)進(jìn)行動態(tài)維護(hù),加速系統(tǒng)分類升級。圖書分類模型的不同模塊可以同時工作,加快查詢結(jié)果的生成[8]。
3 實驗分析
3.1 系統(tǒng)軟件測試用例
為檢測本文的分類方法是否可行,對軟件進(jìn)行了實際功能測試。由于篇幅關(guān)系只對一些關(guān)鍵的功能模塊進(jìn)行測試,下面給出對本文系統(tǒng)進(jìn)行簡單分類檢索以及復(fù)雜分類檢索兩個測試案例,通過給出所測試模塊的名稱、測試環(huán)境和測試歷程,將預(yù)設(shè)的實驗結(jié)果與實際的結(jié)果進(jìn)行對比分析,分析本文系統(tǒng)進(jìn)行兩種圖書分類檢索的狀態(tài),結(jié)果分別用表1和表2描述。從中能夠看出,利用本文系統(tǒng)進(jìn)行圖書的簡單分類搜索和復(fù)雜分類搜索都可完成預(yù)期的實驗?zāi)繕?biāo),是一種有效的圖書分類方法。
3.2 系統(tǒng)功能測試
用戶界面是用戶打開系統(tǒng)的第一道門,界面的測試內(nèi)容有文字和提示測試、界面顯示和界面內(nèi)容三個模塊,對本文系統(tǒng)功能測試可從測試內(nèi)容、測試方法和測試結(jié)果與實際結(jié)果對比進(jìn)行分析[9]。實驗測試本文系統(tǒng)用戶界面結(jié)果用表3描述,能夠看出本文系統(tǒng)用戶界面各項測試結(jié)果都正常。
4 結(jié) 論
本文設(shè)計的移動數(shù)字圖書館的圖書分類系統(tǒng)可以提高圖書分類效率15%以上,解決了傳統(tǒng)分類系統(tǒng)難以跨越的分類率和召回率的困難問題,為圖書分類系統(tǒng)的發(fā)展提供經(jīng)驗,提高了圖書的檢索和管理水平。
參考文獻(xiàn)
[1] 王敬東.面向大數(shù)據(jù)的數(shù)字圖書館數(shù)據(jù)庫緩存模型設(shè)計[J].圖書情報工作,2014,58(22):95?99.
WANG Jingdong. Design of database caching model for large data of library [J]. Library and information work, 2014, 58(22): 95?99.
[2] 茹文,忻展紅.圖書館借閱數(shù)據(jù)分類信息的關(guān)聯(lián)性研究[J].北京郵電大學(xué)學(xué)報(社會科學(xué)版),2016,18(1):14?19.
RU Wen, XIN Zhanhong. Research on the relevance of library borrowing data classification information [J]. Journal of Beijing University of Posts and Telecommunications (social science edition), 2016, 18(1): 14?19.
[3] 趙楊.基于多維度多層次法的數(shù)字圖書館移動服務(wù)質(zhì)量評價模型構(gòu)建[J].情報理論與實踐,2014,37(4):86?92.
ZHAO Yang. Construction of mobile service quality evaluation model of digital library based on multi dimension and multilevel method [J]. Information theory and practice, 2014, 37(4): 86?92.
[4] 王晶晶.基于CSI的高校移動數(shù)字圖書館服務(wù)質(zhì)量評價研究[J].現(xiàn)代情報,2016,36(8):32?36.
WANG Jingjing. Research on service quality evaluation of mobile digital libraries in colleges and universities based on CSI [J]. Modern intelligence, 2016, 36(8): 32?36.
[5] 李湘東,霍亞勇,張嬌.基于LDA主題模型的圖書網(wǎng)頁書目信息提取研究[J].情報科學(xué),2016,34(1):34?37.
LI Xiangdong, HUO Yayong, ZHANG Jiao. Research on bib?liographic information extraction of books and web pages based on LDA theme model [J]. Information science, 2016, 34(1): 34?37.
[6] 賈俊杰,陳菲,閆國蕾,等.數(shù)字圖書館中圖編碼匿名方法[J].計算機(jī)工程與科學(xué),2016,38(11):2221?2226.
JIA Junjie, CHEN Fei, YAN Guolei, et al. Anonymous method of graph coding in digital library [J]. Computer engineering and science, 2016, 38(11): 2221?2226.
[7] 廖秋榮.基于用戶行為的數(shù)字圖書館服務(wù)組織研究[J].圖書情報導(dǎo)刊,2016,1(8):87?90.
LIAO Qiurong. Research on digital library service organization based on user′s behaviors [J]. Library and information science, 2016, 1(8): 87?90.
[8] 李湘東,胡逸泉,巴志超,等.數(shù)字圖書館多種類型文獻(xiàn)混合自動分類研究[J].圖書館雜志,2014,33(11):42?48.
LI Xiangdong, HU Yiquan, BA Zhichao, et al. Research on automatic classification of various types of documents in digital library [J]. Library magazine, 2014, 33(11): 42?48.
[9] 劉錦宏,余思慧,徐麗芳.移動數(shù)字圖書館用戶行為模型構(gòu)建研究[J].大學(xué)圖書館學(xué)報,2015,33(5):93?98.
LIU Jinhong, YU Sihui, XU Lifang. The construction of user behavior model in mobile digital library research [J]. Journal of university library, 2015, 33(5): 93?98.
[10] 李丕仕,王磊,劉霞,等.高校圖書館社會化信息服務(wù)風(fēng)險的分類及其控制[J].情報雜志,2016,35(11):179?182.
LI Pishi, WANG Lei, LIU Xia, et al. The classification and control of the risks of the social information service in the university library [J]. Information magazine, 2016, 35(11): 179?182.