于芳
摘? 要: 原始信息整合系統(tǒng)存在整合時間長、信息推薦精準度低的問題,已經無法滿足用戶需求,為了避免原始系統(tǒng)帶來的弊端,設計了基于用戶需求驅動的個性化圖書信息智能整合系統(tǒng)。調用檢索子系統(tǒng)Index函數,獲取個性化圖書文檔集合,在動態(tài)數據維護機制上,設計處理子系統(tǒng),監(jiān)管數據更新狀態(tài)。通過以MICRF007芯片為核心手機端查詢接口電路,改善整合時間過長的問題,利用電腦端查詢接口電路,恢復休眠文件。依據個性化整合流程,采用二進制數據轉換方法檢索信息。利用組合邏輯延時計算映射文件生成時間,完成信息整合,選擇Windows 2000 Server系統(tǒng),發(fā)布整合結果。由實驗可知,所提系統(tǒng)信息推薦精準度最高可達到95%,最短整合時間可達到21 s,滿足用戶高效查詢圖書信息的要求。
關鍵詞: 圖書信息智能整合系統(tǒng); 圖書文檔集合獲取; 數據監(jiān)管; 接口電路查詢; 二進制數據轉換; 信息檢索
中圖分類號: TN02?34; TP391? ? ? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)11?0158?05
Design of user demand?driven personalized book information
intelligent integration system
YU Fang
(Harbin Institute of Technology (Weihai), Weihai 264209, China)
Abstract: The original information integration system takes much time for integration and the accuracy of information recommendation is low. Therefore, it can no longer meet the needs of users. For fear of the above disadvantages of the original system, a user demand?driven personalized book information intelligent integration system is designed. The Index function of the retrieval subsystem is called to obtain the set of personalized book document. On the basis of dynamic data maintenance mechanism, the processing subsystem is designed to supervise the data update status. The problem that it takes too much time for integration is improved by taking chip MICRF007 as the query interface circuit of core mobile terminal, while the sleeping files can be restored by query interface circuit of computer terminal. According to the personalized integration process, the binary data conversion method is used to retrieve information. The combination logic delay is used to calculate the generation time of mapping file to complete information integration. The Windows 2000 Server system is selected to publish integration results. The experiment shows that the accuracy of information recommendation of the system can reach up to 95% and the shortest integration time can reach 21s. Therefore, it meets user′ requirements of efficient book information query.
Keywords: book information intelligent integration system; book document set acquisition; data supervision; interface circuit query; binary data conversion; information retrieval
0? 引? 言
隨著互聯網技術的迅猛發(fā)展,信息資源優(yōu)化配置與用戶信息需求效率之間的矛盾日益強烈,人們對于傳統(tǒng)互聯網服務模式已經缺乏新鮮感,被動接受網站服務模式已經無法滿足網絡消費者需求。目前仍有不少圖書館按照傳統(tǒng)方式開展個性化服務,這種服務模式無法保證圖書館和用戶需求之間緊密聯系,互動性較差,制約信息資源深入研發(fā)[1]。數據量極速增長給數據庫帶來了檢索效率低下的問題,為了滿足用戶不斷增長的信息需求,開展了信息資源整合項目研究?,F在可應用的信息智能整合系統(tǒng)主要是以TRS網絡信息雷達為基礎的整合系統(tǒng)和以網絡蜘蛛軟件為基礎的整合系統(tǒng),這些系統(tǒng)架構基本相似,但信息搜索精準度較低,價格昂貴,不少圖書館對此望而止步[2]?;诖?,本文設計了基于用戶需求驅動的個性化圖書信息智能整合系統(tǒng)。
圖書信息個性化服務是在用戶需求驅動下提出的理念,通過對大數據信息整合,摒除無序信息,有效提高了信息資源價值度,進而降低系統(tǒng)設計成本。
1? 智能整合系統(tǒng)設計
圖書信息智能整合遵循一定原則,將圖書館范圍內的資源以多種載體、種類、分散異構形式有機結合在一起,實現圖書所有資源采集、分編、融合等工作,使讀者能夠在統(tǒng)一界面內完成對不同圖書信息的檢索[3]?;谟脩粜枨篁寗拥膫€性化圖書信息智能整合就是根據用戶身份、年齡、興趣愛好的不同,其信息需求也存在較大差異,了解并分析用戶需求發(fā)展變化規(guī)律是系統(tǒng)有效開展個性化服務的前提。
1.1? 系統(tǒng)結構
基于用戶需求驅動個性化圖書信息智能整合系統(tǒng),主要是由信息檢索子系統(tǒng)、處理子系統(tǒng)、全文檢索子系統(tǒng)、統(tǒng)一服務平臺、資源發(fā)布端和各種接口組成,其結構如圖1所示。
依據圖1可知,該系統(tǒng)采用不公開接口方式,使用實體和虛擬相結合體系結構。其中,實體方法是在供應商系統(tǒng)二次開發(fā)時降低工作量,有利于信息及時更新;而虛擬方法是對原系統(tǒng)調用,信息自動保持同步,避免重復存儲占用大量空間,也避免IP地址變換造成不便[4]。
1.1.1? 檢索子系統(tǒng)
信息檢索主要是按照用戶提交關鍵詞或字,從數據庫中搜索相關信息,獲取匹配結果,并將結果通過計算機顯示給用戶[5]。檢索子系統(tǒng)是智能整合系統(tǒng)的核心,其性能直接影響到信息檢索結果的精準度,其結構如圖2所示。
該子系統(tǒng)主要是由用戶接口、負載均衡、檢索模塊和索引數據庫組成。其中,用戶接口用于接收用戶請求信息,在接收信息后,輸入查詢字符串,并對字符串本身不進行任何處理,只將這些信息封裝在大字符串中輸出;負載均衡負責用戶檢索行為的調度,一旦接收到用戶接口傳來的信息,需先檢查檢索節(jié)點負載情況,再選擇一個最適檢索節(jié)點分配任務;檢索模塊在接收到分配任務后,從傳送過來的字符串中提取用戶想要檢索的相關關鍵詞或字,獲取一個詞語集合[6?8]。調用Index索引函數提供的接口獲取相關文檔集合,經過排序處理,將數據返回給負載均衡模塊,最終通過用戶接口顯示出來[9]。
1.1.2? 處理子系統(tǒng)
信息處理子系統(tǒng)負責與檢索子系統(tǒng)溝通聯系,保證用戶對各種圖書信息需求,通過創(chuàng)建采集任務,配置數據采集方式,將智能整合系統(tǒng)中全部數據集成,在動態(tài)數據維護機制上,實現對全部數據集中處理[10]。
采用B/S架構分布式資源平臺,通過瀏覽器可實現對已經部署好的數據庫數據資源采集,信息處理子系統(tǒng)總體架構如圖3所示。
依據用戶需求驅動創(chuàng)建數據源,設置具體數據庫中采集與輸出目標[11]。在下次采集時,以某一時間字段為增量時間標識,以時間分割點為采集間斷標準,通過流水號方式進行數據采集。信息資源集成平臺會根據用戶定義數據處理方式判斷子系統(tǒng)中數據傳輸情況,調用不同數據庫驅動,結合字段映射機制構建不同SQL語句,并執(zhí)行相應數據庫查詢、更新與刪除等操作[12]。
1.1.3? 查詢接口
在智能整合系統(tǒng)中,不同用戶對圖書信息需求不同,能查詢的權限也不同,因此,分別設計手機端和電腦端不同應用接口。
1) 手機端
手機端具有中央處理器,通過遠程輸出端對手機發(fā)送相關信號,其運行程序是由設備編制后下載到手持終端的,具有質量輕的優(yōu)勢。用戶可通過手機掃描圖書信息查詢相關二維碼,了解所需圖書具體信息。
手機端信息查詢接口電路設計如圖4所示。
由圖4可知:以MICRF007導通?關斷鍵接收芯片為核心,采用SOP(M)?8進行封裝,芯片內部電路包含變換器、解調器和基準控制,該控制需要2個外接電容器和1個晶振以及電源去耦電容構成一個接收器,經過MICRF007芯片子帶的窄RF內部調諧,完成無線輸入?數據輸出。引腳5表示數據輸出,引腳6負責控制接收器,引腳4負責為比較器提供基準閾值,引腳7與外接電容[C2]連接可增加信息輸入動態(tài)范圍,形成一個點對點、一點對多點無線串行數據傳輸方式,縮短信息整合時間。
2) 電腦端
用戶通過電腦端可結合某些歷史記錄信息檢索相關圖書信息,還可對休眠文件進行恢復處理,具有檢索信息更加可靠的優(yōu)勢。電腦端信息查詢接口電路設計如圖5所示。
電腦端采用觸發(fā)接口電路查詢方式,承載負載能力較強,對于觸發(fā)接口驅動電流保持在90 mA左右,一旦主控單元接收到用戶檢索信息的觸發(fā)信號,那么FPGA程序就會采用自我檢測狀態(tài)機對觸發(fā)信號進行檢測,防止檢索信息不精準現象發(fā)生。
1.2? 系統(tǒng)整合技術路線
相對個性化智能整合模式來說,需對數據庫中的數據進行挖掘分析,進而得到不同用戶興趣愛好、檢索資源種類、借閱頻率等信息,方便為用戶推薦符合自身信息的個性化頁面。
以用戶需求驅動為根本,個性化整合流程如圖6所示。
圖書信息個性化智能整合主要包括用戶個性化興趣模型、圖書使用模型,其背景是圖書個性化服務,面對的用戶種類繁多,系統(tǒng)需提供友好搜索界面,用戶選擇分類,輸入相關關鍵詞信息。依據整合流程,解決信息資源檢索、整合、發(fā)布等技術性問題。
1.2.1? 信息資源檢索
依據某一用戶特定需求,采集相關信息,將這些信息加以處理,供用戶查詢,而信息資源檢索是整合的前提,深入剖析數據庫高級檢索功能,增加數據庫存儲空間。利用二進制數據轉換方法對提取出來的信息資源進行匹配,具體匹配流程如下所示:
1) 通過相鄰點之間二進制序列,確定相鄰點間凸增長或凹增長關系;
2) 采用趨勢比例數據歸約方法,將確定關系相鄰點間候選序列與模式均歸約到同一區(qū)間內;
3) 計算同一區(qū)間內序列相似度,以此區(qū)分不同變化幅度凸增長或凹增長之間震幅,按照震幅大小,獲取各子序列集合,即為模式匹配結果。
為進一步提高檢索精準度,需采用機器學習理論對子序列集合相似度進行過濾匹配。如果大數據集合[S]中間數據總特征數量大于參考集合[Sn]中間數據總特征數量,那么可直接斷定集合[S]與[Sn]沒有相似信息;反之,則說明有相似信息,由此完成信息資源檢索。
1.2.2? 信息資源整合
檢索后的信息具有離散、異構、多元的特點,容易造成數據冗余,出現信息孤島問題,因此,需要對信息資源進行整合。
采用數據庫連接池技術集成異構數據,連接池是連接對象的存儲池,通過內部連接機制控制信息數量,利用系統(tǒng)結構中的查詢接口提供連接渠道。通過JDBC上的API函數與異構數據庫連接,可有效將查詢語句完全轉換到具體數據庫中,獲取異構數據庫各種信息,生成映射文件。為了提高文件映射效率,需減小延遲,保證電腦端觸發(fā)接口和手機端接口電路內部達到最高傳輸效率,組合邏輯延時情況如圖7所示。
圖7中:[N1]表示映射結束時間;[N2]表示網絡延遲;[N4]表示時序邏輯建立時間;[N5]表示映射信號出現偏斜。
每映射一次,文件周期為:
[N=N1+N2+N3+N4+N5] (1)
式中[N5=T2-T1]。映射信號出現偏斜時,網絡也出現了延遲,此時最小映射周期為:
[N=N1+N2+N4] (2)
由此獲取映射文件生成的最小周期,提高了文件映射效率。充分結合個性化服務模式,方便用戶使用,需將相關專業(yè)有機結合在一起,放在不同文件夾中,形成整合文件。
1.2.3? 信息整合后發(fā)布
為了能夠給讀者提供集成、統(tǒng)一信息檢索服務,需將整合的信息通過Web發(fā)布到網站上,并提供分類導航功能。針對發(fā)布的信息,用戶可查閱本地數據庫,也可查找原鏈接網頁。選擇Windows 2000 Server作為發(fā)布支撐系統(tǒng),可直接進行數據庫訪問,該整合系統(tǒng)可支持自動和人工發(fā)布兩種形式,為用戶快速查詢圖書信息提供便利。
2? 實? 驗
系統(tǒng)的實現是在對硬件結構設計和軟件技術使用基礎上進行的,其性能好壞直接影響著用戶使用效率,因此,驗證基于用戶需求驅動的個性化圖書信息智能整合系統(tǒng)信息檢索精準度和整合時間是很有必要的。
2.1? 數據準備
對于實驗數據,需分析圖書館系統(tǒng)中部分圖書信息、想要借閱圖書個人信息、已借閱圖書個人信息,分別如表1~表3所示。
根據上述數據準備結果進行實驗分析。
2.2? 實驗結果與分析
2.2.1? 信息檢索精準度
針對信息檢索是否精準的問題,需將原始以TRS網絡信息雷達為基礎的整合系統(tǒng)、以網絡蜘蛛軟件為基礎的整合系統(tǒng)和基于用戶需求驅動整合系統(tǒng)進行對比分析,結果如圖8所示。
以網絡蜘蛛軟件為基礎的整合系統(tǒng):最初檢索精準度為68%,隨著用戶人數增加,檢索精準度持續(xù)下降,最終檢索精準度為50%。以TRS網絡信息雷達為基礎的整合系統(tǒng):最初檢索精準度為55%,在用戶人數為25個時,檢索精準度為36%;在用戶人數為30個時,檢索精準度為48%;在用戶人數為35個時,檢索精準度達到最低為29%。
基于用戶需求驅動整合系統(tǒng):最初檢索精準度為94%,當用戶人數為15人時,檢索精準度達到最高為95%;當用戶人數為10人時,檢索精準度達到最低為87%。
因此,基于用戶需求驅動整合系統(tǒng)比原始系統(tǒng)檢索精準度要高。
2.2.2? 整合時間
將表1~表3中的圖書館系統(tǒng)中部分圖書信息、想要借閱圖書個人信息、已借閱圖書個人信息整理所耗費時間設為[T1],[T2],[T3],將這三個時間加在一起即為整合時間[T]。針對整合時間驗證分析,同樣將這三種系統(tǒng)進行對比,對比結果如表4所示。
由表4可知:TRS整合系統(tǒng)和網絡蜘蛛軟件整合系統(tǒng)的圖書信息整合所耗費時間過長,而基于用戶需求驅動整合系統(tǒng)的圖書信息整合所耗費時間最長也少于30 s,因此,基于用戶需求驅動整合系統(tǒng)比原始系統(tǒng)整合時間要短。
3? 結? 語
由于信息資源建設快速發(fā)展,圖書信息分布性和異構性問題越來越嚴重,采用以往信息整合系統(tǒng)存在精準度低的問題,無法滿足用戶需求,為此本文設計以用戶需求驅動為根本的個性化圖書信息智能整合系統(tǒng),并通過實驗驗證該系統(tǒng)具有精準信息搜索性能。
系統(tǒng)中的用戶需求驅動是根據用戶感興趣信息進行信息源搜索的,彌補了現有整合系統(tǒng)出現的問題,提高了用戶獲取信息的質量。
參考文獻
[1] 程新剛,李花維.基于用戶需求驅動的知識生態(tài)系統(tǒng)建設策略[J].信息記錄材料,2018,19(5):12?15.
[2] 張鼐.基于智能圖書館的知識服務創(chuàng)新研究[J].內蒙古科技與經濟,2018(10):102?105.
[3] ZHOU Yuyan, LI Hongyan, CHENG Kemin, et al. Research on personalized service of university libraries in Anhui pro?vince based on user needs [J]. University journal of library and information science, 2017, 35(4): 80?89.
[4] 劉愛琴,李永清.基于SOM神經網絡的高校圖書館個性化需求挖掘系統(tǒng)研究[J].數字圖書館論壇,2017,25(10):32?38.
[5] 雷天鋒.圖書館用戶需求服務系統(tǒng)研究[J].中國中醫(yī)藥圖書情報雜志,2017,41(1):50?53.
[6] 張曉東,解金蘭.“互聯網+”驅動的圖書館服務生態(tài)系統(tǒng)演進與發(fā)展策略研究[J].圖書館研究,2017,25(6):86?91.
[7] ZHANG Yao. A brief discussion on the individualized service of the library of chemical vocational college based on the new needs of users [J]. Inner Mongolia petrochemical industry, 2018, 340(4): 78?79.
[8] 劉菊霞.用戶需求驅動下信息資源建設的多維決策[J].大學圖書情報學刊,2017,35(1):21?25.
[9] 化秀玲.高校圖書館資源整合與個性化用戶檔案管理[J].檔案管理,2018(4):93?94.
[10] 張麗娜,范興豐,李珂靈.大數據下圖書館信息采集編撰整合研究[J].無線互聯科技,2018,22(6):81?84.
[11] 秦代輝,劉枚.圖書館圖書信息自動整合檢索仿真研究[J].計算機仿真,2018,35(11):409?412.
[12] 袁曉戎.圖書館信息服務平臺模型的分層設計與實現[J].電子設計工程,2017,25(9):59?61.