彭 薇
(桂林電子科技大學(xué) 信息科技學(xué)院,廣西 桂林 541004)
圖書編目是圖書館管理圖書的重要工作環(huán)節(jié)之一,在大多數(shù)圖書館中,圖書館的業(yè)務(wù)管理工作是從文獻(xiàn)搜集開始的,以圖書被采購到圖書館的時(shí)間節(jié)點(diǎn)為起點(diǎn),相關(guān)的工作人員對采購的圖書信息進(jìn)行一一核對,并將采購的圖書信息錄入到圖書館的管理系統(tǒng)當(dāng)中,并標(biāo)注圖書的基本信息[1]。然而圖書館的日常運(yùn)行與管理存在流通管理繁雜、效率低下、圖書儲藏量大、盤點(diǎn)工作量繁重等問題,因此需要對圖書館中的所有圖書進(jìn)行編目處理,方便進(jìn)行圖書的管理與統(tǒng)計(jì)。
圖書編目就是對圖書館中的所有圖書以及文獻(xiàn)資料進(jìn)行分類,并編制成目錄,建立館藏目錄體系的過程。然而由于圖書館中的圖書數(shù)量較多,分類類型也較多,因此經(jīng)常會出現(xiàn)重復(fù)編目的情況,導(dǎo)致圖書的管理出現(xiàn)故障問題。因此在圖書編目完成后需要對其進(jìn)行查重處理。查重就是重復(fù)率的查詢,將當(dāng)前的圖書編目結(jié)果與已有圖書編目資源庫中的數(shù)據(jù)比對,得出兩者之間的相似比和重復(fù)率。圖書編目的查重關(guān)系到分編工作的質(zhì)量,可以避免出現(xiàn)同書異號的現(xiàn)象,從而保持圖書信息的一致性。查重功能能夠及時(shí)糾正編目過程中產(chǎn)生的錯(cuò)誤,以免產(chǎn)生遺留問題。此外通過查重系統(tǒng)可以為新書的分類起到參考和輔助的作用。
現(xiàn)階段圖書編目的查重系統(tǒng)包括基于檢索的查重系統(tǒng)、基于索引批量的查重系統(tǒng)等。然而上述傳統(tǒng)的查重系統(tǒng)存在查重時(shí)間長、多次查重結(jié)果不相同等問題,對于過于簡單的圖書名稱,查重檢索時(shí)會出現(xiàn)多條重復(fù)數(shù)據(jù),為圖書編目的查重工作帶來巨大的工作量[2]。為了解決上述傳統(tǒng)圖書編目自動(dòng)查重系統(tǒng)存在的一系列問題,引入RFID 技術(shù)。RFID 技術(shù)也就是射頻識別技術(shù),通過閱讀器與標(biāo)簽之間的非接觸式數(shù)據(jù)通信,從而達(dá)到識別的目的。通過該技術(shù)的應(yīng)用提升了圖書館的科學(xué)化管理程度,實(shí)現(xiàn)了圖書自動(dòng)分揀、排序的功能,同時(shí)也提升了圖書編目的自動(dòng)查重的精度和速度,進(jìn)而有效地提升圖書的流通與管理效率。
為了保證設(shè)計(jì)的圖書編目自動(dòng)查重系統(tǒng)功能的實(shí)現(xiàn)以及應(yīng)用性能的提升,需要分別從硬件、數(shù)據(jù)庫以及軟件功能三個(gè)部分進(jìn)行優(yōu)化設(shè)計(jì)。其中,硬件部分就是在原硬件設(shè)備的基礎(chǔ)上,為RFID 技術(shù)的運(yùn)行提供硬件支持,同時(shí)也作為自動(dòng)查重系統(tǒng)軟件功能實(shí)現(xiàn)的硬件支持。在此次圖書編目自動(dòng)查重的硬件系統(tǒng)中需要安裝的硬件設(shè)備包括RFID 讀寫標(biāo)簽、書籍閱讀器以及網(wǎng)絡(luò)通信設(shè)備,將網(wǎng)絡(luò)通信設(shè)備安裝在圖書館內(nèi),形成圖書館內(nèi)部的局域網(wǎng)絡(luò),并將書架、傳感器、RFID 讀寫標(biāo)簽以及書籍閱讀器等設(shè)備接入到網(wǎng)絡(luò)環(huán)境當(dāng)中,實(shí)現(xiàn)圖書編目數(shù)據(jù)信息的實(shí)時(shí)調(diào)取與傳輸。
RFID 技術(shù)是以射頻信號為載體進(jìn)行雙向通信并最終達(dá)到識別目標(biāo)對象的一種識別技術(shù),該技術(shù)在實(shí)現(xiàn)與運(yùn)行的過程中不需要對目標(biāo)對象產(chǎn)生接觸,燈光實(shí)現(xiàn)對目標(biāo)對象識別的自動(dòng)化[3]。RFID 硬件設(shè)備按照不同的應(yīng)用頻率可以分為低頻、高頻、超高頻以及微波等多種類型,其中,低頻表示RFID 硬件設(shè)備的頻率在135 kHz以下,射頻波段高于13.56 MHz 的設(shè)備為高頻設(shè)備,另外超高頻RFID 設(shè)備和微波RFID 設(shè)備的頻率分別為860~960 MHz 和2.4~5.8 GHz。除 了 上 述 分 類 方 式 之外,按照RFID 的能源供給方式可以將一個(gè)鍵設(shè)備分為無源RFID、有源RFID 和半有源RFID 三種類型,三種不同的能源供給方式對讀/寫的距離要求不同。然而無論哪種RFID 設(shè)備,其基本組成結(jié)構(gòu)均包括電子標(biāo)簽、閱讀器、天線、讀/寫應(yīng)答設(shè)備等,在此次圖書編目自動(dòng)查重系統(tǒng)中選擇的RFID 設(shè)備的組成結(jié)構(gòu)如圖1 所示。
圖1 RFID 硬件組成結(jié)構(gòu)圖
其中,RFID 的電子標(biāo)簽?zāi)K也就是射頻標(biāo)簽?zāi)K包括電子標(biāo)簽天線和射頻芯片兩個(gè)部分,具有唯一的電子標(biāo)號,在射頻芯片中可以存儲大量的相關(guān)信息。電子標(biāo)簽天線是RFID 電子標(biāo)簽的應(yīng)答器天線,屬于一種通信感應(yīng)天線。閱讀器的作用是讀取/寫入標(biāo)簽信息,此次設(shè)計(jì)的查重系統(tǒng)中選擇的閱讀器為書籍閱讀器,主要用來讀取圖書館中的圖書基本信息[4]。將RFID 硬件設(shè)備中的各個(gè)組成部分按照一定的規(guī)律連接在一起,保證該設(shè)備的正常運(yùn)行,當(dāng)電子標(biāo)簽進(jìn)入到磁場范圍后,書籍閱讀器發(fā)出相應(yīng)頻段的射頻信號,電子標(biāo)簽通過讀寫應(yīng)答設(shè)備所發(fā)出信號造成的感應(yīng)電流獲得所需能量,并將獲取結(jié)果發(fā)送并存儲到電子芯片當(dāng)中。當(dāng)書籍閱讀器獲得電子標(biāo)簽內(nèi)的信息后,進(jìn)行解碼,并以接收到的信息為基礎(chǔ)進(jìn)行解碼應(yīng)用。
網(wǎng)絡(luò)通信模塊由服務(wù)器、RFID 設(shè)備以及無線傳感器等設(shè)備組成。其中,系統(tǒng)網(wǎng)絡(luò)的核心服務(wù)器是兩臺型號為IBMX3850M2 的服務(wù)器作為雙機(jī)設(shè)備,通過配套的IBM SAN16B-2 存儲交換機(jī)采用4 GB 光纖通道連接IBM DS4700 陣列組成全冗余網(wǎng)絡(luò)結(jié)構(gòu)[5]。另外還需要添加兩臺型號為IBM X3250M2 的服務(wù)器作為局域范圍內(nèi)的中間服務(wù)器,具體網(wǎng)絡(luò)服務(wù)器的安裝數(shù)量、型號以及參數(shù)的設(shè)置情況如表1 所示。
通過服務(wù)器的連接形成基礎(chǔ)局域網(wǎng)絡(luò),分別將圖書館環(huán)境中的書架、RFID 等設(shè)備接入到該網(wǎng)絡(luò)當(dāng)中,規(guī)定網(wǎng)絡(luò)傳輸協(xié)議和規(guī)則,得到可以正常運(yùn)行的無線網(wǎng)絡(luò)環(huán)境[6]。
針對圖書編目自動(dòng)查重系統(tǒng)的設(shè)計(jì)目的,選擇的數(shù)據(jù)庫主要傾向于實(shí)用性強(qiáng)、數(shù)據(jù)庫與檢測系統(tǒng)交互速度快且易于實(shí)現(xiàn)的數(shù)據(jù)庫,因此選擇的數(shù)據(jù)庫平臺為MySQL。圖書編目自動(dòng)查重系統(tǒng)的數(shù)據(jù)庫管理整個(gè)圖書編目的相關(guān)數(shù)據(jù),并以數(shù)據(jù)庫中的信息為基礎(chǔ)作為判斷當(dāng)前編目是否重復(fù)的依據(jù)[7]。在此次設(shè)計(jì)的數(shù)據(jù)庫中除了圖書編目數(shù)據(jù)之外,還存儲了不同圖書編目數(shù)據(jù)對應(yīng)的電子標(biāo)簽信息以及系統(tǒng)用戶的基本信息等,因此系統(tǒng)數(shù)據(jù)庫的邏輯結(jié)構(gòu)如圖2 所示。
表1 系統(tǒng)網(wǎng)絡(luò)服務(wù)器安裝設(shè)置數(shù)據(jù)表
圖2 查重系統(tǒng)數(shù)據(jù)庫邏輯關(guān)系圖
以圖書館中的圖書標(biāo)簽主句為例,設(shè)置圖書編目標(biāo)簽的數(shù)據(jù)庫存儲列表,如表2 所示。同理可以根據(jù)數(shù)據(jù)庫的類型將相應(yīng)的數(shù)據(jù)信息按照對應(yīng)的規(guī)則編寫存儲格式,并存儲到數(shù)據(jù)庫空間當(dāng)中。
以連接完成的硬件設(shè)備和數(shù)據(jù)庫的基礎(chǔ)上,通過編寫相應(yīng)的查重邏輯和程序代碼,實(shí)現(xiàn)系統(tǒng)的圖書編目自動(dòng)查重軟件功能。軟件系統(tǒng)的自動(dòng)查重功能應(yīng)具有一次輸入、多次使用的能力,應(yīng)具備自動(dòng)校驗(yàn)ISBN 號的能力,應(yīng)具有先查主庫、后查源庫的能力,另外圖書編目自動(dòng)查重系統(tǒng)得出的查詢結(jié)果需要具有自動(dòng)排序和顯示的處理能力[8]。結(jié)合軟件功能的需求分析結(jié)果,確定軟件系統(tǒng)的邏輯層次架構(gòu)如圖3 所示。
表2 圖書編目標(biāo)簽存儲列表
圖3 圖書編目自動(dòng)查重軟件模塊架構(gòu)
圖書編目的自動(dòng)查重工作需要以圖書的編目工作為基礎(chǔ),具體的圖書編目工作流程如圖4 所示。
圖4 圖書編目流程圖
按照圖4 中的編目流程,使用書名或ISBN 號檢索圖書積累,使用硬件設(shè)備激活系統(tǒng)的RFID 電子標(biāo)簽,并形成圖書的RFID 電子標(biāo)號作為識別碼[9]。系統(tǒng)自動(dòng)產(chǎn)生對應(yīng)的數(shù)據(jù)存儲編號,再編制分類號,最終得出完整的圖書編目信息。
在控制書籍閱讀器向電子標(biāo)簽中寫入數(shù)據(jù)時(shí),必須要先對電子標(biāo)簽內(nèi)的數(shù)據(jù)存儲空間進(jìn)行初始化,放置存儲空間中原有數(shù)據(jù)對寫入圖書編目數(shù)據(jù)的干擾。向RFID 電子標(biāo)簽發(fā)送一個(gè)初始化數(shù)據(jù)幀,電子標(biāo)簽接收后對其中的存儲空間做清空處理[10]。這些將RFID 電子標(biāo)簽中的存儲空間劃分為保留區(qū)、TID 分區(qū)和EPC 分區(qū)。根據(jù)RFID 模塊中的讀/寫器接收信號強(qiáng)度,通過式(1)計(jì)算出電子標(biāo)簽和讀寫器之間的距離。
式中:d 和d0分別為RFID 讀寫天線的距離和參考距離;n 為環(huán)境參數(shù),該參數(shù)的取值與圖書館的實(shí)際情況以及內(nèi)部的布局因素有關(guān);Xσ為標(biāo)準(zhǔn)偏差為σ 的高斯隨機(jī)噪聲變量;PL( d )以及PL( d0)表示距離讀寫器d 和d0位置上的信號強(qiáng)度。通過式(1)的計(jì)算可以實(shí)現(xiàn)圖書的遠(yuǎn)距離定位和識別,接著利用閱讀器、天線和無線網(wǎng)絡(luò)將圖書編目的有關(guān)信息傳輸?shù)诫娮訕?biāo)簽中,并寫入到對應(yīng)的存儲分區(qū)空間中。在向電子標(biāo)簽寫入數(shù)據(jù)后,可以使用閱讀器讀取電子標(biāo)簽內(nèi)的數(shù)據(jù)信息,實(shí)現(xiàn)對圖書編目信息的收集。
對收集的圖書編目信息進(jìn)行同義詞轉(zhuǎn)換處理,并提取圖書編目數(shù)據(jù)信息的特征。利用相關(guān)系數(shù)算法通過計(jì)算提取的編目數(shù)據(jù)信息特征向量和數(shù)據(jù)庫中存儲信息特征向量的相關(guān)程度,來度量兩個(gè)特征向量之間的相似度[11]。圖書編目數(shù)據(jù)相關(guān)系數(shù)的相似度計(jì)算公式為:
式中:x 和y 分別為提取的和數(shù)據(jù)庫中原有的圖書編目數(shù)據(jù)特征向量;而xˉ和yˉ分別為兩個(gè)程序各自特征向量中元素的平均值[12]。設(shè)置圖書編目相似度的閾值為η,若式(2)的計(jì)算結(jié)果大于η,表示在當(dāng)前的圖書編目數(shù)據(jù)庫中存在至少一個(gè)與提取編目相似的數(shù)據(jù),則判定該圖書編目數(shù)據(jù)重復(fù),否則認(rèn)定為不重復(fù)。
設(shè)計(jì)系統(tǒng)的人機(jī)交互功能,通過上述RFID 技術(shù)的應(yīng)用以及圖書編目自動(dòng)相似度的計(jì)算[13],得出最終的查重結(jié)果,并通過人工交互界面輸出,輸出界面如圖5所示。
圖5 圖書編目自動(dòng)查重結(jié)果輸出界面
以測試設(shè)計(jì)的基于RFID 技術(shù)的圖書編目自動(dòng)查重系統(tǒng)的查重功能為目的,設(shè)計(jì)系統(tǒng)測試實(shí)驗(yàn)。選擇Python 語言作為系統(tǒng)的開發(fā)語言[8],該語言的版本主要有Python 2.X 和Python 3.X,兩者之間不能完全兼容。為了保證基于RFID 技術(shù)的圖書編目自動(dòng)查重系統(tǒng)的設(shè)計(jì)能夠調(diào)用Python 語言的第三方數(shù)據(jù)庫,選用Python 2.7 版本作為開發(fā)語言。在此次的系統(tǒng)測試實(shí)驗(yàn)中構(gòu)建的實(shí)驗(yàn)環(huán)境結(jié)果如圖6 所示。
圖6 系統(tǒng)測試環(huán)境
為了避免單一實(shí)驗(yàn)對實(shí)驗(yàn)結(jié)果造成的誤差,在測試過程中選擇多次實(shí)驗(yàn)取平均值的方式來提升實(shí)驗(yàn)結(jié)果數(shù)據(jù)的可信度。另外為形成實(shí)驗(yàn)對比,除了設(shè)計(jì)的基于RFID 技術(shù)的圖書編目自動(dòng)查重系統(tǒng)之外,還需要以相同的語言開發(fā)環(huán)境和方式得出傳統(tǒng)圖書編目查重系統(tǒng),并作為系統(tǒng)測試實(shí)驗(yàn)的對比系統(tǒng)。經(jīng)過6 次實(shí)驗(yàn)分別統(tǒng)計(jì)兩個(gè)系統(tǒng)得出的查重結(jié)果以及在查重運(yùn)算過程中消耗的時(shí)間,統(tǒng)計(jì)與對比結(jié)果如表3 所示。
從表中的測試結(jié)果對比中可以看出,傳統(tǒng)查重系統(tǒng)的平均消耗時(shí)長為30.5 s,而基于RFID 技術(shù)的圖書編目自動(dòng)查重系統(tǒng)的平均查重時(shí)長為22.5 s,相比之下查重速度提高了8 s 左右。而在查重精度方面,傳統(tǒng)查重結(jié)果的精度為小數(shù)點(diǎn)后一位,而本文設(shè)計(jì)系統(tǒng)的精確度保留到了小數(shù)點(diǎn)后兩位,由此可以證明本文設(shè)計(jì)的基于RFID 技術(shù)的圖書編目自動(dòng)查重系統(tǒng)的查重精度更高。
表3 系統(tǒng)測試結(jié)果對比數(shù)據(jù)表
為了解決傳統(tǒng)圖書編目查重系統(tǒng)中存在的查重時(shí)間長、查重精度低的問題,基于RFID 的技術(shù)特點(diǎn),研究圖書編目自動(dòng)查重系統(tǒng)徹底摒棄了傳統(tǒng)的人工查重方法。通過確定圖書編目查重的工作內(nèi)容、RFID 標(biāo)識的加工處理和檢測圖書編目相似度等步驟,得出圖書編目自動(dòng)查重結(jié)果,并通過人工交互界面輸出。通過系統(tǒng)測試實(shí)驗(yàn)得出結(jié)論:設(shè)計(jì)的自動(dòng)查重系統(tǒng)比傳統(tǒng)系統(tǒng)的查重精度更高,且查重速度約提高8 s,實(shí)現(xiàn)了圖書查重的自動(dòng)化和高效化。