王朝揚 夏松
摘 ?要:智能知識庫實現(xiàn)了知識的自動獲取,經(jīng)過人工處理將形成專業(yè)的知識庫,為各類智庫、科研機構(gòu)提供了決策支持和數(shù)據(jù)支撐。良好的智能知識庫設(shè)計是智能知識庫成功建設(shè)的保障,文章分析了智能知識庫的設(shè)計思路、建設(shè)原則,提出了一種智能知識庫系統(tǒng)設(shè)計的結(jié)構(gòu)示意圖和技術(shù)框架圖,并將其應用在李冰特色資源庫建設(shè)中,實踐表明,該系統(tǒng)設(shè)計可行性較好,具有較高的實用價值。
關(guān)鍵詞:智能知識庫;李冰特色資源庫;系統(tǒng)設(shè)計
中圖分類號:TP391.3;TP182 ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)12-0016-04
Abstract:The intelligent knowledge base realizes the automatic acquisition of knowledge and forms a professional knowledge base after manual processing,which provides decision support and data support for various think tanks and scientific research institutions. A good design of intelligent knowledge base is the guarantee of the successful construction of intelligent knowledge base. This paper analyzes the design ideas and construction principles of intelligent knowledge base,and puts forward a kind of structure diagram and technical framework diagram of the system design of intelligent knowledge base,and applies it to the construction of Li Bing characteristic resource database. The practice shows that the system design is feasible and has good practical value.
Keywords:intelligent knowledge base;LI Bings characteristic resource library;system design
0 ?引 ?言
智能知識庫是一種使用智能技術(shù),按照一定主題對某一學科或某一專題的多元化信息進行收集、分析、評價、處理、存儲,并根據(jù)一定標準和規(guī)范快速構(gòu)建特色資源庫系統(tǒng),能夠滿足多元化用戶的個性化需求[1]。有效地進行智能知識庫的設(shè)計,才能保障其功能合理、運行穩(wěn)定。智能知識庫是作者承擔的賽爾網(wǎng)絡下一代互聯(lián)網(wǎng)技術(shù)創(chuàng)新項目的研究內(nèi)容,本文在之前的研究基礎(chǔ)上[1,2],分析智能知識庫的設(shè)計思路和系統(tǒng)設(shè)計,并將其在西華大學李冰特色資源庫建設(shè)中進行了應用。
1 ?智能知識庫系統(tǒng)的設(shè)計原則
1.1 ?設(shè)計思路
智能知識庫系統(tǒng)的設(shè)計思路是:建立一個可智能化管理、開放式、易擴展的平臺,實現(xiàn)系統(tǒng)內(nèi)集中統(tǒng)一管理特色資源,使得各類資源的數(shù)據(jù)格式按照國家標準、行業(yè)標準或系統(tǒng)的標準進行統(tǒng)一的數(shù)據(jù)編碼、用戶展示界面或風格要相對統(tǒng)一;達到系統(tǒng)內(nèi)各類資源能夠得到安全可靠的存儲和最大限度地授權(quán)共享利用。
特別是在用戶查詢欄目的設(shè)計上,要依據(jù)特色資源庫的實際情況來進行設(shè)計,提供按照不同的資源類型、責任者、作者、機構(gòu)、發(fā)表媒體、發(fā)表年度等分類進行一站式的檢索服務,同時要注重各個專題或主題資源之間的有機聯(lián)系,全方位、立體式地向用戶呈現(xiàn)形態(tài)多樣的信息。
1.2 ?建設(shè)原則
特色性原則。智能知識庫構(gòu)建的是專業(yè)的、具有特色的資源數(shù)據(jù)庫,要做到人無我有,人有我全,人全我強的目標。人無我有是要做特色的、獨具一格的數(shù)據(jù)庫,如江西萍鄉(xiāng)高等??茖W校的萍鄉(xiāng)儺文化特色資源庫是研究當?shù)氐膬幕⒏=ǜV蓍}江學院的三坊七巷特色數(shù)據(jù)庫是當?shù)厝黄呦锞包c為研究點、淮陰師范學院的周恩來研究專題數(shù)據(jù)庫是以周恩來的故鄉(xiāng)為切入點。人有我全是要做出小而精或大而全的專題特色資源庫,一個專題資源庫要集成該專題的全部的、各類文獻資源,如曲阜師范大學的儒學文獻特色數(shù)據(jù)庫是孔子故里進行的以儒學古籍文獻和儒學研究成果,以及本地儒家文化資源的集成。人全我強是要有資源的快速更新、資源的便捷獲取和引用等,做到較好的用戶體驗,實現(xiàn)數(shù)據(jù)的最大化共享,進而吸引研究者或使用者。
共享性原則。資源庫的建成不是一蹴而就的,而是需要長期的建設(shè)和更新,同時建設(shè)會受到人、財、物和資源等多方面的影響,因此資源庫建設(shè)建議共建共享。共建是指各方共同建設(shè),以某一個主體牽頭,其余單位共同投入人、財、物和資源進行建設(shè)和數(shù)據(jù)的更新,如寶雞民俗文化資源庫的建設(shè)由寶雞文理學院牽頭,寶雞市圖書館、寶雞民俗博物館、寶雞文化館、青銅器博物館等多家單位共同參與,協(xié)助完成[3]。這樣建設(shè)的資源庫的數(shù)據(jù)更新具有可持續(xù)性,同時也有一定的用戶群體。共享是指資源庫數(shù)據(jù)的共享、互操作或復用。共享實現(xiàn)的方式主要是采用標準化和規(guī)范化的建設(shè),資源的描述要采用國際、國內(nèi)和行業(yè)標準,沒有標準的要依據(jù)相關(guān)標準的構(gòu)建自己的標準,以實現(xiàn)元數(shù)據(jù)的分類、編碼、描述、著錄、標引等規(guī)范控制,以便數(shù)據(jù)的查詢及不同系統(tǒng)之間數(shù)據(jù)的互操作或復用。
持續(xù)性原則。特色資源庫的維護和更新必須是可持續(xù)的,如果只重建設(shè)輕維護,這樣的資源庫是沒有生命力的,很快會被淘汰。應該建立數(shù)據(jù)維護和更新的長效機制,定時更新最新的數(shù)據(jù)并對數(shù)據(jù)進行備份,保證數(shù)據(jù)的時效性和可靠性,同時要結(jié)合用戶的反饋信息進行改進。
移動化原則。2020年4月28日中國互聯(lián)網(wǎng)絡信息中心(CNNIC)發(fā)布的第45次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示:中國網(wǎng)民規(guī)模超9億,99.3%使用手機上網(wǎng)[4]。因此系統(tǒng)開發(fā)要適應移動端的要求,在有需求的時候可采用H5技術(shù)對系統(tǒng)進行封裝,以適應不同的移動終端,而不必采用原生開發(fā)APP的方式;也可以采用小程序的方式實現(xiàn)。
2 ?智能知識庫系統(tǒng)設(shè)計
2.1 ?結(jié)構(gòu)示意圖
智能知識庫的結(jié)構(gòu)示意圖如圖1所示。
用戶查詢的實現(xiàn)過程是:用戶在使用該系統(tǒng)進行信息查詢時,用戶接口接收用戶輸入的查詢信息,將查詢信息的各種形式的指令并轉(zhuǎn)化為系統(tǒng)可以識別的內(nèi)部查詢方式傳遞給轉(zhuǎn)換查詢模塊;轉(zhuǎn)換查詢模塊將信息轉(zhuǎn)換為具體的存儲查詢方式,并傳遞給數(shù)據(jù)存儲模塊;數(shù)據(jù)存儲模塊按查詢條件查詢出所需的信息,并以信息輸出的方式回傳給用戶接口模塊[5]。
評價反饋時,用戶對所查得的信息給出評價,數(shù)據(jù)存儲模塊記錄該信息的評價,以便后期信息的刪減或更新。
信息錄入與查詢時相同,如果查詢到此信息已存儲于知識庫中則可對該信息繼續(xù)進行編輯處理;若未查詢到該信息,系統(tǒng)則會進行創(chuàng)建操作。
通過三個模塊實現(xiàn)的資源的查詢,資源的評價以及資源的修改、添加。三個模塊需要進行權(quán)限的分級授權(quán),合理分配訪問權(quán)限,實現(xiàn)資源的合理利用。
2.2 ?技術(shù)框架圖
一個良好的智能知識庫系統(tǒng)技術(shù)框架如圖2所示。系統(tǒng)分四層從下到上依次為數(shù)據(jù)層、管控層、應用層、展示層。數(shù)據(jù)層的功能是對各類資源、數(shù)據(jù)的整合;管控層的功能是采用統(tǒng)一身份認證的方式對用戶以及權(quán)限的控制、數(shù)據(jù)轉(zhuǎn)換為元數(shù)據(jù)、前后臺操作日志統(tǒng)計等的管理;應用層的功能是各類應用的服務發(fā)布(如數(shù)據(jù)采集服務提供數(shù)據(jù)采集的接口配置、字段的定義等)以及后臺業(yè)務自動化的調(diào)度;展示層是提供個性化統(tǒng)一服務門戶,按照用戶的特征進行信息的呈現(xiàn)。
3 ?李冰特色資源庫系統(tǒng)設(shè)計
使用上述智能知識庫的設(shè)計原則和系統(tǒng)的結(jié)構(gòu)、框架設(shè)計,項目組完成了李冰特色資源庫建設(shè)并上線運行中,系統(tǒng)的建設(shè)還在要持續(xù)完善之中。
3.1 ?李冰特色資源庫系統(tǒng)建設(shè)的必要性
李冰這位2017年首批入選四川省歷史名人文化傳承創(chuàng)新工程的十大歷史名人之一,締造的都江堰水利工程,創(chuàng)世界水利工程之最,至今惠澤于民。李冰承載著中華民族優(yōu)秀的精神品格,閃爍著四川人民獨特的氣質(zhì)風范,在中華歷史文化長河中占有獨特而重要的地位,他所建設(shè)的都江堰水利工程是四川發(fā)展的寶貴資源和突出優(yōu)勢[6]?;诖?,西華大學依托四川省社會科學重點研究基地——李冰研究中心的研究,建設(shè)了李冰特色資源庫,集成了李冰相關(guān)的各類文獻。
李冰特色資源庫的建設(shè)及時挖掘了各類文獻,對文化的傳承起到了良好的保護作用,并體現(xiàn)了地方名人文獻的獨特價值。依托現(xiàn)代信息技術(shù),對地方名人文獻資源進行收集整理、分類加工及二次開發(fā),精心構(gòu)建具有地域文化特色的地方名人數(shù)據(jù)庫,將散見于學術(shù)期刊、網(wǎng)絡百科、報紙、年鑒、古籍等媒介,以文本、視頻、圖像等形式展現(xiàn)的相關(guān)名人資料、文獻等進行分類整理,不僅便于用戶檢索,同時也可以擴大地方名人影響力、彰顯地域文化特色、延續(xù)中華優(yōu)秀傳統(tǒng)文化的巴蜀脈絡,推動中華優(yōu)秀傳統(tǒng)文化傳承創(chuàng)新,提高人民群眾文化素養(yǎng),增強四川文化軟實力、影響力、競爭力,具有重大的現(xiàn)實意義,并對優(yōu)秀傳統(tǒng)文化的傳承產(chǎn)生深遠的影響[6]。
3.2 ?李冰特色資源庫系統(tǒng)功能設(shè)計
李冰特色資源庫中最主要的功能是各類資源的整合,并進行資源的合理分類以及元數(shù)據(jù)標記,尤其是資源的分類,在這里做一個簡單的說明。
李冰特色資源庫建設(shè)中李冰和都江堰市無法分離的,因此按照李冰和都江堰兩個主線進行。李冰相關(guān)資源主要分類有治水、治蜀、李冰與都江堰、李冰文化;都江堰相關(guān)資源主要分類有都江堰學、都江堰文化資源、都江堰文化遺產(chǎn)、都江堰與水利工程、都江堰與河道治理、都江堰與灌溉供水、都江堰與工程管理、都江堰與生態(tài)治理、都江堰與社會發(fā)展、都江堰與水文化、都江堰與李冰等。
按用戶的不同需求,收集圖書、論文(期刊、學位、會議、報紙等)、報告、網(wǎng)頁資源、圖像、音頻和視頻等資源,選編目錄索引、摘要、全文和知識單元;按主要文獻類型建立了圖書、論文、新聞、網(wǎng)源、圖像等資源庫的內(nèi)容查詢。該庫采用共建共享的建設(shè)形式,若發(fā)現(xiàn)新的資源,經(jīng)過相關(guān)人員遴選后進行數(shù)據(jù)更新。
3.3 ?界面設(shè)計
李冰特色資源庫是嵌入在李冰研究中心網(wǎng)站中的,也就是將該資源庫作為一個單獨的模塊融入了網(wǎng)站中。界面如圖3所示。
為了更好地提供數(shù)據(jù)資源,對資源進行了描述,屬性主要有11個,具體如圖4所示。
4 ?結(jié) ?論
智能知識庫系統(tǒng)的設(shè)計是一個個性化的過程,對應不同的知識和用戶的類型則需要在設(shè)計過程中有所差異,文章提出了一種通用的設(shè)計思路,并依據(jù)該思路對系統(tǒng)結(jié)構(gòu)進行設(shè)計,最后結(jié)合實際的智能知識庫進行了應用。雖然基于該設(shè)計思路系統(tǒng)已經(jīng)上線使用,但功能還在不斷完善之中。知識庫的設(shè)計一定要以服務為導向,滿足各類用戶的需求,具備多樣化的資源呈現(xiàn),便捷的信息獲取;要以內(nèi)容為中心,全方位集成信息,根據(jù)用戶的評價對資源進行優(yōu)化,按照最新研究成果對內(nèi)容進行及時更新;遵循合作建設(shè)的原則,與建設(shè)對象合作、與相關(guān)建設(shè)機構(gòu)合作、與使用者合作等,才能設(shè)計和建設(shè)出符合用戶的、可持續(xù)發(fā)展的智能知識庫。
參考文獻:
[1] 肖博淳,王朝揚,趙成芳.智能知識庫建設(shè)技術(shù)探討 [J].信息與電腦(理論版),2020,32(6):138-140
[2] 夏松,王朝揚,李兆延.智能知識庫系統(tǒng)建設(shè)研究——基于CiteSpace的可視化分析 [J].信息與電腦(理論版),2020,32 (4):140-142.
[3] 江娜.民俗文化特色資源庫建設(shè)研究——以寶雞地區(qū)為例 [J].圖書館學刊,2017,39(6):42-46.
[4] 中國互聯(lián)網(wǎng)絡信息中心.第45次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》 [EB/OL].(2020-04-28).http://www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/202004/P020200428596599037028.pdf.
[5] 王歡.智能知識庫工程模型淺析 [J].數(shù)字技術(shù)與應用,2018,36(10):205-206.
[6] 微信公眾號“川報觀察”.四川公布首批本省歷史名人名單,大禹、李冰等10人入選 [EB/OL].[2020-05-01].http://www.thepaper.cn/baidu.jsp?contid=1730911.
作者簡介:王朝揚(1999.11—),男,漢族,四川成都人,本科在讀,研究方向:信息安全、計算機應用。