楊 敬
淺析智能搜索引擎技術(shù)及其在數(shù)字圖書館個(gè)性化信息服務(wù)中的應(yīng)用
楊 敬
隨著職能信息技術(shù)的不斷發(fā)展與成熟,職能搜索引擎技術(shù)和數(shù)字圖書館的個(gè)性化信息服務(wù)業(yè)逐漸趨于完善。職能信息檢索的本質(zhì)就是使其職能搜素引擎能夠得到不斷的改進(jìn)與發(fā)展,而以該技術(shù)為基礎(chǔ)的構(gòu)建數(shù)字化的圖書館個(gè)性化的服務(wù)系統(tǒng),為數(shù)字圖書館的發(fā)展需要。本文以職能搜索引擎技術(shù)和其在圖書館的應(yīng)用為基礎(chǔ),分析個(gè)性化發(fā)信息服務(wù)中職能搜索引擎的應(yīng)用于發(fā)展。
智能搜索引擎 數(shù)字圖書館 個(gè)性化信息服務(wù)
對(duì)于使用者而言,搜索引擎的主要作用實(shí)際上就是為了幫助因特網(wǎng)操作者查詢信息,該搜索技術(shù)是建立在一定方法中的因特網(wǎng)搜索、發(fā)現(xiàn)信息。對(duì)信息實(shí)施處理、理解以及提取的過程,同時(shí)最終提供給使用者,也就是信息導(dǎo)航。而從不同的角度來看,搜索引擎也有很多種類。比如特殊性型、通用型以及專業(yè)型,另外還有分布式、集中式等系統(tǒng)。
(一)系統(tǒng)互交性較低
因?yàn)槿鄙僮钣行У牟樵兘涌?,很多使用者往往不能有效的描述自己的相關(guān)查詢要求,而很多搜索引擎往往都沒有一邊查詢的同時(shí)一邊修正關(guān)鍵詞的能力,操作者往往不能利用不斷細(xì)化或者精確的查詢?cè)~來表述自己信息需要的目的。另外,系統(tǒng)往往也只能負(fù)責(zé)返回結(jié)果給使用者,但是不會(huì)對(duì)結(jié)果實(shí)施評(píng)價(jià)甚至有效選取,不能利用反饋來深入熟悉系統(tǒng)的性能[1]。
(二)缺少適應(yīng)信息源的動(dòng)態(tài)變化要求
很多網(wǎng)絡(luò)的信息更新、自身的開放性以及動(dòng)態(tài)性等要求,直接導(dǎo)致搜索要求更新以及維護(hù)很難真正意義上的跟上信息源的改變,致使死鏈接出現(xiàn)網(wǎng)絡(luò)滯后。所以,使用科學(xué)有效的管理以及技術(shù)體系,使得搜索要求能夠有效地反應(yīng)信息源為搜索引擎必須面臨的話題之一。
(三)個(gè)性化能力不足
實(shí)際上,搜索引擎對(duì)所有的操作者而言均為單一的模式,查詢有關(guān)的,所得到的結(jié)果往往也千差萬別,不能有效的參考操作者的背景知識(shí)以及興趣特征,也不存在對(duì)單個(gè)使用瀏覽模式以及瀏覽行為實(shí)施分析的功能,因此在某種程度上說也不具備提取用戶興趣以及適應(yīng)操作者習(xí)慣的能力[2]。
職能搜索引擎的本質(zhì)就是搜索引擎有效融合先進(jìn)的人工職能技術(shù),該種機(jī)制以一定的知識(shí)庫為基本技術(shù)基礎(chǔ),具備較高的自然語言能力和知識(shí)處理的能力,可以有效地分析與理解使用者自然形式出現(xiàn)的基本知識(shí)或者概念查詢等問題,最終有效的突破一般搜索引擎要求必須借助較為精確的關(guān)鍵詞實(shí)施檢索的要求,能夠有效實(shí)現(xiàn)自然語言的檢索,最終突出其較強(qiáng)的個(gè)性化和智能化的特點(diǎn)。
職能搜索引擎后端往往是由多臺(tái)的分布式的服務(wù)器組合而成,客戶端往往以專業(yè)的瀏覽器或者插件構(gòu)成智能化人工接機(jī)口。另外能夠利用網(wǎng)絡(luò)蜘蛛等相關(guān)智能化信息調(diào)度相關(guān)程序?qū)嵤┬畔⒃吹挠行阉鳎瑫r(shí)借助邏輯推理機(jī)制能夠有效地明確操作者的檢索目的,在搜索之前就能夠有效的識(shí)別不同操作者的不同興趣,最終達(dá)到過濾以及推薦的目的。
(一)數(shù)字圖書館的個(gè)性化服務(wù)
所謂個(gè)性化服務(wù)實(shí)際上就是以操作者為中心,在分析操作者專業(yè)、行為以及愛好等基礎(chǔ)上,依據(jù)操作者的個(gè)性化需要開展相關(guān)信息服務(wù),它本身具備較強(qiáng)的針對(duì)性、安全性、主動(dòng)性以及知識(shí)性,可以有效地提升操作者對(duì)數(shù)字圖書館的信息服務(wù)要求。依據(jù)不同的技術(shù)要求,數(shù)字圖書館的個(gè)性化的服務(wù)主要具備下面幾個(gè)形式:首先是個(gè)性化的定制以及推送服務(wù),也就是操作者的興趣愛好,使用定制的Web頁面的信息頻道、信息源,將郵箱發(fā)送出現(xiàn),使得有特色型的界面以及信息能夠完全地展示在具備特定需要的操作者計(jì)算機(jī)中,同時(shí)個(gè)性化推薦和報(bào)道服務(wù),也就是利用智能化的推薦與主動(dòng)報(bào)道的途徑,深入的研究操作者的專業(yè)特點(diǎn),以及研究興趣等,最終主動(dòng)的向用戶推薦其需要的相關(guān)信息。另外是個(gè)性化的知識(shí)決策服務(wù),此種服務(wù)的大背景下充分強(qiáng)調(diào)使用信息挖掘、知識(shí)發(fā)現(xiàn)以及語義網(wǎng)絡(luò),對(duì)有效的信息內(nèi)容實(shí)施深層次的挖掘和分析,向操作者提供可以用于合理分析、決策知識(shí)以及智能查詢的要求[3]。
(二)智能搜索引擎應(yīng)用于數(shù)字圖書館個(gè)性化中
如果搜索引擎具備智能化要求,則其高度的智能化功能以及突出的個(gè)性化服務(wù)則為其存在的必要基礎(chǔ),其在數(shù)字圖書館的個(gè)性化服務(wù)系統(tǒng)的構(gòu)成過程中,有著決定性的作用,而智能搜索引擎的內(nèi)部往往是由語義理解、智能過濾以及訪問登記等組成,同時(shí)與指令組織、信息加工以及頁面定制等配合完成任務(wù),在智能化的基礎(chǔ)上,其以較好的自然語言理解以及知識(shí)邏輯推理,來探討、判斷相關(guān)信息行為,對(duì)其發(fā)揮著信息挖掘以及知識(shí)發(fā)現(xiàn)的效果。
以職能搜索引擎為要求的數(shù)字圖書館的個(gè)性化服務(wù)系統(tǒng),不但可以有效地體現(xiàn)出前者的系統(tǒng)優(yōu)勢(shì),同時(shí)還能夠節(jié)約系統(tǒng)甚至簡化系統(tǒng),當(dāng)然需要特別注意的是,知識(shí)庫為搜索引擎的核心以及根本,其也是在數(shù)字圖書館的信息資源庫中提煉而成的,是對(duì)數(shù)字圖書館信息資源的概括、判斷以及提取[4]。
(三)職能搜索引擎技術(shù)改進(jìn)要求
現(xiàn)階段,職能搜索引擎的技術(shù)應(yīng)用于數(shù)字圖書館的個(gè)性化服務(wù)中還僅僅是初始階段,還有很多的技術(shù)問題以及客觀問題。伴隨著計(jì)算機(jī)的發(fā)展,網(wǎng)絡(luò)搜索等相關(guān)IT技術(shù)的應(yīng)用研究與快速發(fā)展,此技術(shù)必須滿足個(gè)性化的服務(wù)要求。提升知識(shí)本體論層面的研究和判斷能力,職能化的大背景下搜索引擎對(duì)知識(shí)語言層面以及常識(shí)層面的理解往往較為全面,同時(shí)也更加精確,所以需要不斷地改善知識(shí)本體論層面的功能,提升對(duì)知識(shí)概念復(fù)雜語義關(guān)系的能力。
隨著我國數(shù)字資源的不斷增長以及網(wǎng)絡(luò)數(shù)據(jù)的海量增加,搜索引擎所暴露的問題也越來越多,急需人工的職能技術(shù)介入。而作為計(jì)算機(jī)大背景下的產(chǎn)物,職能搜索引擎自身所具備的優(yōu)越性也更為突出,個(gè)性化的服務(wù)作為整個(gè)的數(shù)字圖書館對(duì)其所發(fā)揮的意義越來越大。
[1]孟瑞玲.個(gè)性化PageRank算法在圖書館智能搜索引擎中的實(shí)現(xiàn)[J].現(xiàn)代情報(bào),2010,30(7):93~96.
[2]成博.多Agent智能搜索引擎及其在圖書館中的應(yīng)用研究[D].湘潭大學(xué),2008.
[3]代金晶,紀(jì)希禹.基于語義網(wǎng)的智能搜索引擎在數(shù)字圖書館中的應(yīng)用[J].圖書館學(xué)研究,2008(9):52~54.
[4]馬崴.多Agent智能搜索引擎在圖書館信息服務(wù)工作中的應(yīng)用研究[J].情報(bào)探索,2011(2):96~99.
(作者單位:西安政治學(xué)院)