孫 寶,張竣淞
(1.華北科技學(xué)院圖書館,北京東燕郊 101601;2.華北科技學(xué)院信息檢索教研室,北京東燕郊 101601)
迫于本科院校評估中對圖書館藏書量的要求[1][2],高校圖書館每天都在購進(jìn)大量新書,但是庫容架位有限,只得不斷剔除陳舊破損的過時圖書,為新書上架騰出空間。同時,出于提高藏書利用率的目的[3][4],高校圖書館剔除的理論與實(shí)踐研究正在受到越來越多的關(guān)注。本文試圖引入模糊控制理論,從客觀的、定量化的角度研究探討一種新的圖書剔除方法。
圖書剔除,一般稱為圖書剔舊,二者差別不大。在中國知網(wǎng)中檢索圖書剔舊文獻(xiàn),有17篇論述了客觀定量化的圖書剔舊方法,大多選擇基于出版年的書齡和借閱率作為剔舊標(biāo)準(zhǔn)[5][6]。徐敏綜合考察了出版年、圖書利用率等十一個因素,建立了神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)圖書剔舊模型及軟件系統(tǒng)[7][8][9]。張琳對書齡、流通率等影響因素進(jìn)行了分析和排序,根據(jù)重要性程度構(gòu)建并驗(yàn)證了等級藏書剔舊模型[2]。鄭磊計(jì)算出圖書半衰期和利用率(即本文中之借閱率),建立了圖書剔舊輔助決策系統(tǒng)模型及軟件系統(tǒng)[10]。張惠玲構(gòu)建了圖書平均借閱次數(shù)和書齡之間的回歸模型,計(jì)算出各類圖書剔舊書齡[11]。信丹丹為時間因素、流通因素等賦以不同指標(biāo)權(quán)重,生成了圖書剔舊指數(shù)[12]。蔡璐計(jì)算了環(huán)境科學(xué)類圖書半衰期,統(tǒng)計(jì)分析了流通頻次,確立了圖書剔舊方案[13]。汪躍春對圖書借閱頻次與書齡進(jìn)行回歸,計(jì)算出各類書老化半衰期,應(yīng)用于圖書剔舊[14]。谷永清和夏明順統(tǒng)計(jì)分析了借閱頻次與圖書老化的規(guī)律,確定了各類圖書剔舊年限[15]。胡敏對出版時間、流通頻次等量化指標(biāo)賦以權(quán)值后求和,輸出剔舊清單[16]。魏俊貂設(shè)計(jì)出文獻(xiàn)剔舊計(jì)算機(jī)輔助程序,根據(jù)圖書出版年、文獻(xiàn)利用率(本文中稱為借閱率)確定剔舊清單[17]。王萬起根據(jù)借閱量計(jì)算出圖書半衰期,指導(dǎo)圖書剔舊[18]。葉林根據(jù)利用率(即借閱率)、半衰期等圖書老化指標(biāo),開展藏書剔舊工作[19]。譚忠頂指出圖書被借概率隨時間作倍速遞減原理,并給出了將其應(yīng)用于圖書剔舊時的估值[20]。陶然、王樹文、張亮建構(gòu)了圖書文獻(xiàn)“采購、流通、剔舊”系統(tǒng)灰色預(yù)測模型,輸出了未來三年的剔舊文獻(xiàn)量[21]。
模糊控制是一種先進(jìn)的智能控制技術(shù),以模糊集合理論和模糊推理為基礎(chǔ),模擬人腦的模糊思維方法,把基于豐富操作實(shí)踐總結(jié)出的、用自然語言表述的控制策略或者通過大量實(shí)際操作數(shù)據(jù)歸納總結(jié)出的控制經(jīng)驗(yàn),通過模糊理論轉(zhuǎn)換為用語言變量描述的控制規(guī)則,用邏輯推理去處理各種模糊性的信息,獲得對被控量的控制,用計(jì)算機(jī)予以實(shí)現(xiàn)的自動控制[22]。模糊控制器的實(shí)現(xiàn)主要由以下三個過程組成。
1)精確變量的模糊化:目標(biāo)是將輸入的“精確”變量轉(zhuǎn)化為如“正大”、“正中”、“正小”等“模糊”變量。在這個過程中利用到了已經(jīng)建立好的模糊規(guī)則庫(查隸屬度賦值表),通過比較判斷,將精確的輸入信號歸類入其中一個模糊子集,從而獲得對該精確變量的模糊描述,即模糊變量。
2)對模糊變量的推理:選用一種模糊推理方法(取舍歸類的原則),由已經(jīng)獲得的模糊變量和建好的控制規(guī)則庫進(jìn)行推理,從而得到一個模糊輸出量集合,即模糊化輸出。
3)輸出的精確化計(jì)算:因?yàn)榭刂破鞯妮敵霰仨毷蔷_的控制量,所以需要將最能代表模糊推理結(jié)果的一個精確值(模糊子集中的)作為輸出量[23]。
總結(jié)華北科技學(xué)院圖書館圖書剔除經(jīng)驗(yàn)和下架規(guī)則,選取每種圖書的出版年和各復(fù)本平均借閱頻次(此處稱為種次借閱率)作為圖書剔除模糊控制模型的兩個輸入控制變量,構(gòu)建相應(yīng)模糊集,得出館藏書目庫中正在流通借閱的每種圖書的剔除系數(shù),輸出剔除冊數(shù)。
圖書剔除模糊控制模型主要由種次借閱率和出版年模糊化、構(gòu)建模糊規(guī)則進(jìn)行模糊推理、解模糊器、輸出剔除冊數(shù)四個部分組成(見圖1)。
圖1 圖書剔除模糊控制模型結(jié)構(gòu)示意圖
種次借閱率用p表示,用以衡量每一種圖書被讀者借閱的頻繁程度,計(jì)算公式為:
公式中i為下標(biāo)變量;N為某種圖書的復(fù)本量,即圖書館采購該種圖書的冊數(shù);Li為該種圖書每個復(fù)本被讀者借閱的次數(shù),可以通過查閱流通日志庫中該種圖書的借閱歷史而獲知。
在本館技術(shù)人員協(xié)助下,統(tǒng)計(jì)了剔除到超級庫的65535種圖書的種次借閱率,并導(dǎo)出到Excel中對種次借閱率進(jìn)行了頻數(shù)分布分析,繪制了直方圖(見表1和圖2)。
圖2 剔除超級庫種次借閱率直方圖
表1 剔除超級庫種次借閱率頻數(shù)分布
圖書剔除模糊控制模型中有兩個模糊輸入變量,種次借閱率是其中之一。根據(jù)剔除超級庫65535種圖書的平均借閱頻次統(tǒng)計(jì)分布情況,把種次借閱率模糊化為3個模糊集:很少借閱(用P1表示)、借閱頻次低(用 P2表示)、頻繁借閱(用P3表示,3個模糊集隸屬函數(shù)示意圖見圖3)。
很少借閱模糊集P1的隸屬度函數(shù)為:
借閱頻次低模糊集P2的隸屬度函數(shù)為:
圖3 種次借閱率模糊集示意圖
頻繁借閱模糊集P3的隸屬度函數(shù)為:
這里的3個種次借閱率模糊子集隸屬度函數(shù)公式中,μ為隸屬度,p為該種圖書種次借閱率。
根據(jù)華北科技學(xué)院圖書館圖書剔除規(guī)則及慣例,把圖書剔除模糊控制模型中另一個模糊輸入變量——出版年模糊化為3個模糊集:很舊(用Y1表示)、較舊(用 Y2表示)、很新(用 Y3表示,3個模糊集隸屬函數(shù)示意圖見圖4)。
圖4 出版年模糊集示意圖
很舊模糊集Y1隸屬度函數(shù)為:
較舊模糊集Y2隸屬度函數(shù)為:
很新模糊集Y3隸屬度函數(shù)為:
這里的由出版年確定圖書新舊程度的3個模糊子集隸屬度函數(shù)公式中,μ為隸屬度,y為該種圖書出版年。
根據(jù)本館圖書剔除實(shí)際經(jīng)驗(yàn),參照有關(guān)參考文獻(xiàn),把圖書剔除模糊控制模型中模糊輸出變量——剔除系數(shù)模糊化為4個模糊集:不剔除(用W1表示)、半數(shù)剔除(用 W2表示)、大部分剔除(用W3表示)、幾乎全部剔除(用W4表示,4個模糊集隸屬函數(shù)示意圖見圖5)。
不剔除模糊集W1隸屬度函數(shù)為:
圖5 剔除模糊集示意圖
半數(shù)剔除模糊集W2隸屬度函數(shù)為:
大部分剔除模糊集W3隸屬度函數(shù)為:
幾乎全部剔除模糊集W4隸屬度函數(shù)為:
這里的4個剔除模糊子集隸屬度函數(shù)公式中,μ為隸屬度,w為剔除系數(shù),即剔除圖書冊數(shù)占該種圖書復(fù)本量的百分比。
在實(shí)現(xiàn)模糊控制的過程中,如何確定模糊控制規(guī)則庫是至關(guān)重要的一環(huán),通常是將操作人員、專家的經(jīng)驗(yàn)整合到計(jì)算機(jī)之中而得到[23]。完備的模糊規(guī)則庫是傳統(tǒng)模糊控制的出發(fā)點(diǎn),它涵蓋了足夠豐富的人工經(jīng)驗(yàn)或?qū)<抑R,形成了從控制輸入到控制輸出的映射關(guān)系[24]。模糊控制規(guī)則庫的設(shè)計(jì)原則:當(dāng)偏差較大時,控制量的變化應(yīng)盡量使偏差減少;當(dāng)偏差較小時,除了要消除誤差外,還要考慮系統(tǒng)的穩(wěn)定性,防止系統(tǒng)產(chǎn)生不必要的超調(diào),甚至震蕩[25]。
由于種次借閱率和圖書出版年分別被模糊化為三個模糊集,故需為圖書剔除模糊控制模型制定九條模糊控制規(guī)則:
規(guī)則l1:如果頻繁借閱P3而且很新Y3,則不剔除W1;
規(guī)則l2:如果頻繁借閱P3而且較舊Y2,則不剔除W1;
規(guī)則l3:如果頻繁借閱P3而且很舊Y1,則半數(shù)剔除W2;
規(guī)則l4:如果借閱頻次低P2而且很新Y3,則不剔除W1;
規(guī)則l5:如果借閱頻次低P2而且較舊Y2,則半數(shù)剔除W2;
規(guī)則l6:如果借閱頻次低P2而且很舊Y1,則大部分剔除W3;
規(guī)則l7:如果很少借閱P1而且很新Y3,則不剔除W1;
規(guī)則l8:如果很少借閱P1而且較舊Y2,則大部分剔除W3;
規(guī)則l9:如果很少借閱P1而且很舊Y1,則幾乎全部剔除W4;
將前述模糊控制規(guī)則庫的九條規(guī)則整理成模糊控制規(guī)則表,以便于計(jì)算機(jī)系統(tǒng)在運(yùn)行過程中檢索、識別、處理(見表2)。
表2 圖書剔除模糊控制模型控制規(guī)則表
中心平均解模糊器,又叫重心解模糊器、加權(quán)平均解模糊器[26],是在模糊系統(tǒng)與模糊控制中最常用的解模糊器。它計(jì)算簡便,直觀合理,克服了最大隸屬度法、中位數(shù)法等其它解模糊器的缺陷[27][28]。圖書剔除模糊控制模型采用中心平均解模糊器,由每種書的種次借閱率和出版年信息直接計(jì)算出剔除模糊集的剔除系數(shù),其與該種圖書復(fù)本量的相乘之積可以作為該種圖書的剔除冊數(shù)。剔除系數(shù)計(jì)算公式為:
因?yàn)榉N次借閱率模糊集和出版年模糊集采用了全交疊三角形模糊化處理,前述剔除系數(shù)計(jì)算公式中分母為1,故可簡化為:
下面以本館收藏的一種索書號為“H319.4/744=3”、國際文化出版公司出版的大學(xué)英語閱讀理解學(xué)習(xí)參考書為例,演示一下獲得該種圖書剔除冊數(shù)的過程。
步驟一、種次借閱率模糊化。該種圖書累積借閱量為128冊次,復(fù)本量為5本,種次借閱率為p=128/5,激活了很少借閱和借閱頻次低兩個模糊集,隸屬度分別為:
步驟二、出版年模糊化。該種圖書第1版出版于2002年9月,第3版出版于2004年2月,此處討論分析的是第3版,故而激活了很舊和較舊兩個模糊集,隸屬度分別為:
步驟三、選擇模糊控制規(guī)則。查對控制規(guī)則庫和控制規(guī)則表,得知激活了四條規(guī)則 l5、l6、l8、l9。
步驟四、計(jì)算剔除系數(shù)。根據(jù)中心平均解模糊器原理,計(jì)算得出該種圖書剔除系數(shù):
步驟五、輸出剔除冊數(shù)。將前述計(jì)算得出的剔除系數(shù)與該種圖書復(fù)本量相乘的乘積即為剔除冊數(shù):
從計(jì)算結(jié)果來看,輸出的剔除冊數(shù)一般會是一個小數(shù),對其四舍五入,可知該種圖書最好剔除4冊,僅需保留1冊。
華北科技學(xué)院圖書館金盤管理系統(tǒng)選用的是Oracle 10g數(shù)據(jù)庫系統(tǒng),只需從客戶端登錄數(shù)據(jù)庫服務(wù)器,執(zhí)行若干條SQL查詢和計(jì)算語句,就可輸出剔除的書名、著者、出版社、索書號、剔除冊數(shù)等重要信息,也可導(dǎo)出成Excel數(shù)據(jù)表文件。為了不影響本館日常采編、借閱業(yè)務(wù),本人今年七月在一臺個人筆記本電腦中安裝了Oracle 11g數(shù)據(jù)庫管理系統(tǒng),把金盤系統(tǒng)中的數(shù)據(jù)庫導(dǎo)入到其中,在技術(shù)人員協(xié)助下執(zhí)行SQL查詢語句,以入館收藏年份近似代替出版年,輸出了全部37類圖書剔除冊數(shù)及占該類圖書總冊數(shù)的百分比(見表3)。若輸出剔除冊數(shù)為小數(shù),均已進(jìn)行了四舍五入處理。
表3 全部37類圖書剔除冊數(shù)及百分比
借閱率(有時也被稱為流通率、利用率)和圖書出版年通常被視為圖書剔除中首選的、重要的影響因素,本文建立的圖書剔除模糊控制模型以借閱率和出版年為系統(tǒng)輸入變量,輸出了所有37類圖書的剔除清單、冊數(shù),可以指導(dǎo)圖書館員據(jù)此清單在書庫中選擇剔除一些陳舊過時、利用率低的圖書,在圖書剔除的理論和實(shí)踐上進(jìn)行了有益的嘗試和創(chuàng)新。
一直以來,圖書剔除研究都非?;钴S,鑒于主觀方法的隨意性,普遍呼吁客觀量化方法的研究和探討。但是,客觀方法也會產(chǎn)生一些缺陷,會遺漏本該剔除的、破損嚴(yán)重的圖書,剔除清單中也會列入不該剔除的、有重要價值的圖書。因此,在剔除實(shí)踐中不能盲從客觀方法給出的剔除清單,需要專業(yè)人員根據(jù)實(shí)際情況加以補(bǔ)充和選擇。
本文討論的剔除理論與實(shí)踐沒有深入分析不同類別圖書在借閱率和出版年剔除標(biāo)準(zhǔn)上的差異,最好對不同類別圖書采取不同的模糊化方法,盡管這有可能增加輸出剔除清單的復(fù)雜性和繁瑣性。由于技術(shù)和安全的原因,本文僅提出圖書剔除模型及理論,未能直接利用鑫盤系統(tǒng)的實(shí)時流通和館藏數(shù)據(jù)輸出剔除清單,未能設(shè)計(jì)出實(shí)踐性更強(qiáng)的圖書剔除子功能。
[1] 劉萍.藏書剔除誤區(qū)辨析[J].洛陽大學(xué)學(xué)報,2007,22(3):121-123.
[2] 張琳.數(shù)字環(huán)境下高校圖書館紙質(zhì)圖書等級剔舊模式研究一一以西南大學(xué)圖書館為例[D].重慶:西南大學(xué),2011:1-2,14,16 -19.
[3] 楊劍平.高校圖書館館藏圖書建設(shè)與剔除[J].農(nóng)業(yè)圖書情報學(xué)刊,2014,26(5):30 -32.
[4] 劉玲.淺談圖書館圖書剔舊工作[J].中國報業(yè),2012(3)下:191-192.
[5] 胡東.對開架圖書剔舊工作的思考[J].圖書館建設(shè),2008(9):72-74.
[6] 孫瑩瑩.RFID技術(shù)環(huán)境下的藏書剔除工作——以國家圖書館中文圖書閱覽區(qū)剔除工作為例[J].圖書館建設(shè),2011(11):49-51.
[7] 徐敏.基于神經(jīng)網(wǎng)絡(luò)集成的圖書剔舊專家系統(tǒng)的研究[D].鎮(zhèn)江:江蘇大學(xué),2006:2-4,35 -48.
[8] 徐敏.神經(jīng)網(wǎng)絡(luò)集成在圖書剔舊分類中的應(yīng)用[J].計(jì)算機(jī)工程,2006,32(20):210 -212.
[9] 徐敏.基于神經(jīng)網(wǎng)絡(luò)集成的專家系統(tǒng)模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(7):1216 -1219.
[10] 鄭磊.圖書剔舊輔助決策系統(tǒng)模型研究[D].威海:山東大學(xué)威海分校,2012:12-13.
[11] 張惠玲.基于書齡分析的圖書剔舊實(shí)證研究[J].圖書館論壇,2013,33(4):126 -129.
[12] 信丹丹.公共圖書館圖書剔舊指數(shù)指標(biāo)體系構(gòu)建研究[J]. 圖書館論壇,2013,33(3):122 -125.
[13] 蔡璐.論圖書剔舊的標(biāo)準(zhǔn)——以環(huán)境科學(xué)類圖書為例[J]. 圖書情報工作,2010,54(3):15 -18.
[14] 汪躍春.館藏圖書老化規(guī)律的實(shí)證及應(yīng)用[J].情報雜志,2009,28(3):50 -53.
[15] 谷永清,夏明順.論高校院系資料室的“剔舊”問題——以南京大學(xué)歷史系資料室為例[J].圖書情報知識,2008(11):80-83.
[16] 胡敏.科技類圖書剔舊標(biāo)準(zhǔn)量化探討[J].情報探索,2008(3):112 -113,127.
[17] 魏俊貂.館藏文獻(xiàn)剔舊計(jì)算機(jī)程序設(shè)計(jì)與實(shí)現(xiàn)[J].廣東廣播電視大學(xué)學(xué)報,2007,16(2):106-108.
[18] 王萬起.基于館藏利用率統(tǒng)計(jì)的圖書老化實(shí)證研究[J].新世紀(jì)圖書館,2014(6):52-56.
[19] 葉林.利用文獻(xiàn)老化理論指導(dǎo)圖書館剔舊工作的研究[J]. 農(nóng)業(yè)圖書情報學(xué)刊,2010,22(11):157 -159.
[20] 譚忠頂.圖書被借概率隨時間遞減倍速原理及其在圖書剔舊的應(yīng)用[J].廣西師范學(xué)院學(xué)報(自然科學(xué)版),2011,28(3):98-101.
[21] 陶然,王樹文,張亮.圖書館文獻(xiàn)“采購——流通——剔舊”系統(tǒng)灰預(yù)測模型的建構(gòu)[J].現(xiàn)代情報,2011,31(6):42-45.
[22] 張健.基于PLC的模糊神經(jīng)網(wǎng)絡(luò)控制策略的應(yīng)用[J].山西電子技術(shù),2014(3):45-47.
[23] 張慧.MATLAB與PLC相結(jié)合的模糊控制系統(tǒng)在加熱爐溫度控制中的應(yīng)用[J].遼寧化工,2014,43(6):757-758,767.
[24] 楊文光,張昆龍.模糊插值控制器的控制精度分析[J].安徽大學(xué)學(xué)報(自然科學(xué)版),2013(2):36-40.
[25] 梁月云,崔天時,何亞非.溫室節(jié)水灌溉系統(tǒng)模糊控制器設(shè)計(jì)及MATLAB仿真[J].農(nóng)機(jī)化研究,2014(6):202-205,209.
[26] 向虹霖.基于PLC的模糊控制應(yīng)用研究[D].成都:西南石油大學(xué),2010:32-38.
[27] 陳建良.蟻群算法在模糊控制器優(yōu)化設(shè)計(jì)中的應(yīng)用[D].鎮(zhèn)江:江蘇大學(xué)電氣信息工程學(xué)院,2006:28-34.
[28] 徐開軍.基于數(shù)據(jù)挖掘的模糊控制器的設(shè)計(jì)研究[D].鎮(zhèn)江:江蘇大學(xué),2006:8-13.