曹 亮,李湘麗*,劉雙印,徐龍琴,尹 航,鄭建華
(1.仲愷農(nóng)業(yè)工程學(xué)院,廣東 廣州 510225;2.廣東省高校智慧農(nóng)業(yè)工程技術(shù)研究中心/廣州市農(nóng)產(chǎn)品質(zhì)量安全溯源信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510225)
高校圖書館是學(xué)校文獻(xiàn)信息資源中心,是師生教學(xué)、科研和創(chuàng)新的“動(dòng)力池”,具有組織、存儲(chǔ)和傳遞教學(xué)科研文獻(xiàn)資源的重要作用,是校園與社會(huì)的文化樞紐,是推動(dòng)圖書館全民閱讀推廣工作的有效手段。隨著信息技術(shù)快速發(fā)展,圖書館經(jīng)歷了從傳統(tǒng)手工操作方式→數(shù)字化分布式信息系統(tǒng)→信息流與物質(zhì)流并存復(fù)合圖書館→智慧圖書館模式[1]。然而,融合了現(xiàn)代信息技術(shù)和物聯(lián)網(wǎng)技術(shù)的智慧圖書館,雖然館藏信息資源量日益劇增,積累了大量的、形式復(fù)雜多樣的信息數(shù)據(jù),但讀者和數(shù)據(jù)之間、不同類型數(shù)據(jù)之間的關(guān)聯(lián)也存在著模糊地帶,海量的信息數(shù)據(jù)與用戶需求之間存在不確定性,延緩了智慧圖書館的建設(shè)進(jìn)度。
知識(shí)圖譜是一種知識(shí)管理技術(shù),能讓海量的信息數(shù)據(jù)有效組合和應(yīng)用,可根據(jù)用戶需求提供個(gè)性化服務(wù),與現(xiàn)代高校圖書館建設(shè)需求不謀而合。因此,將知識(shí)圖譜技術(shù)運(yùn)用到圖書館建設(shè)中,不僅可以滿足用戶個(gè)性化、多元化和主動(dòng)性的信息服務(wù)需求,而且能讓讀者快速、有效從海量的文獻(xiàn)資源中搜索到高質(zhì)量的信息,快速提升圖書館的服務(wù)及管理水平。
知識(shí)圖譜是一種輻射狀的圖形,揭示各領(lǐng)域?qū)嶓w之間關(guān)系的網(wǎng)絡(luò)圖形。知識(shí)圖譜有四大特征:知識(shí)抽取、知識(shí)表示、知識(shí)融合和知識(shí)推理。其中,知識(shí)抽取是對(duì)大規(guī)模的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行實(shí)體抽取、數(shù)據(jù)關(guān)系抽取和數(shù)據(jù)屬性抽取[2];知識(shí)表示是把知識(shí)客體中的知識(shí)因子和知識(shí)通過(guò)各種模型關(guān)聯(lián)起來(lái),如距離模型、矩陣分解模型、復(fù)雜關(guān)系模型等;知識(shí)融合是把來(lái)自于不同知識(shí)源的知識(shí)通過(guò)整合、去歧、關(guān)聯(lián)、驗(yàn)證、更新等達(dá)到與人的思維相融合的特需型知識(shí)庫(kù);知識(shí)推理就是在原有知識(shí)庫(kù)中挖掘類似于人類思維的知識(shí)對(duì)象之間的層次關(guān)系。
高校智慧圖書館是伴隨智慧城市、智慧農(nóng)業(yè)和智慧校園等發(fā)展起來(lái)的,具有多樣性特征,最主要特點(diǎn)是全面感知[3],即感知知識(shí)、感知需求和感知存在。其中,感知知識(shí)表示知識(shí)的廣度和寬度,感知到知識(shí)的存在并讓知識(shí)有機(jī)的匯聚起來(lái);感知需求表示知識(shí)的需求與被需求之間可以通過(guò)某種方式快速建立鏈接,進(jìn)而達(dá)到各方需求;感知存在就是通過(guò)微博、微信、移動(dòng)圖書館等大數(shù)據(jù)讓你感知圖書館無(wú)處不在。高校智慧圖書館的“三感”特點(diǎn),正契合了知識(shí)圖譜的技術(shù)優(yōu)勢(shì):挖掘用戶行為數(shù)據(jù)間潛在關(guān)聯(lián),主動(dòng)推薦高價(jià)值信息,為讀者提供精準(zhǔn)服務(wù)。
高校智慧圖書館知識(shí)抽取包括信息實(shí)體抽取、關(guān)系抽取和屬性抽?。ㄒ妶D1)。(1)信息實(shí)體抽取即結(jié)構(gòu)化數(shù)據(jù)實(shí)體抽取,主要是對(duì)圖書館文獻(xiàn)中的文獻(xiàn)名、姓名、地名、機(jī)構(gòu)名、時(shí)間、關(guān)鍵詞等信息實(shí)體進(jìn)行抽取,采用迭代方式對(duì)實(shí)體進(jìn)行聚類算法,抽取新的命名實(shí)體。(2)關(guān)系抽取即把實(shí)體間存在的顯式和隱式關(guān)系進(jìn)行抽取,再組織、定義。在高校智慧圖書館館藏資源中,文獻(xiàn)名和作者之間就是顯式關(guān)系,同一作者的文獻(xiàn)名之間的關(guān)系就是隱式關(guān)系,關(guān)系抽取采用馬爾可夫邏輯網(wǎng)聯(lián)合推理關(guān)系抽取方法。(3)屬性抽取即把實(shí)體本身的屬性、實(shí)體屬性與屬性之間、開放域數(shù)據(jù)集中屬性進(jìn)行提取,形成屬性對(duì)應(yīng)關(guān)系,再進(jìn)行抽取。
圖1 高校智慧圖書館知識(shí)抽取關(guān)系
基于知識(shí)圖譜的智慧圖書館就是從不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行抽取,形成數(shù)據(jù)知識(shí)存入到知識(shí)圖譜庫(kù)中[4]。
知識(shí)表示有分布式表示、三元組表示、復(fù)雜關(guān)系表示。通常是以三元組方式進(jìn)行知識(shí)表示,可以直接表示實(shí)體、關(guān)系和其之間的復(fù)雜語(yǔ)義關(guān)聯(lián)。高校智慧圖書館中,實(shí)體之間的關(guān)系、關(guān)系之間的關(guān)系存在著復(fù)雜的交叉關(guān)系,例如:作者之間、讀者之間、文章之間、作者和文章之間、讀者和文章之間的關(guān)系等,都存在著交叉關(guān)系。
通過(guò)知識(shí)圖譜的知識(shí)表示,就可有效把高校智慧圖書館多源信息表示出來(lái),給人以清晰和明確的認(rèn)識(shí)和理解。
知識(shí)圖譜中的知識(shí)融合可讓高校智慧圖書館中多樣性、多源性和重復(fù)性的知識(shí)數(shù)據(jù)有效聚合。通過(guò)在同一規(guī)范下進(jìn)行實(shí)體對(duì)齊、實(shí)體鏈接和關(guān)系推演等操作,把不同來(lái)源的知識(shí)進(jìn)行融合。高校智慧圖書館知識(shí)融合技術(shù)流程如圖2所示。
圖2 高校智慧圖書館知識(shí)融合技術(shù)流程
首先,對(duì)目標(biāo)讀者和所需數(shù)據(jù)進(jìn)行預(yù)處理,剔除無(wú)用信息后用Hash函數(shù)進(jìn)行分塊處理;其次,把原數(shù)據(jù)信息和目標(biāo)數(shù)據(jù)信息相對(duì)應(yīng),根據(jù)對(duì)應(yīng)的復(fù)雜度確定是否進(jìn)行四層負(fù)載均衡處理;再次,把原數(shù)據(jù)信息和目標(biāo)數(shù)據(jù)信息進(jìn)行屬性相似度和實(shí)體相似度計(jì)算,并給出相對(duì)應(yīng)鏈接;最后,對(duì)知識(shí)融合的結(jié)果進(jìn)行反饋評(píng)估參數(shù)校正,最終輸出正確結(jié)果或反饋原因。
通過(guò)知識(shí)圖譜的知識(shí)融合將智慧圖書館中數(shù)量龐大、種類繁多和關(guān)系復(fù)雜的資源數(shù)據(jù)進(jìn)行深度融合處理,揭示館藏資源的潛在知識(shí)關(guān)聯(lián)規(guī)律,為研究數(shù)據(jù)價(jià)值提供參考。
高校智慧圖書館中的知識(shí)推理就是將館藏資源實(shí)體知識(shí)經(jīng)過(guò)推理,挖掘出隱含的關(guān)聯(lián)信息和知識(shí)點(diǎn)。其中,實(shí)體知識(shí)包括實(shí)體及其屬性,已知或是推理出的實(shí)體間關(guān)系可以再次作為新實(shí)體知識(shí)被推理,如此循環(huán)可反復(fù)挖掘出有價(jià)值信息。知識(shí)推理方法主要有基于邏輯的推理和基于圖的推理,邏輯推理最基本的架構(gòu)為:A通過(guò)關(guān)系a推出B,B通過(guò)關(guān)系a推出C,由此可推理出A通過(guò)關(guān)系a推出C?;趫D的推理相對(duì)復(fù)雜些,一般用圖來(lái)表示,可以方便地表示結(jié)點(diǎn)與結(jié)點(diǎn)間多重關(guān)系路徑,體現(xiàn)出關(guān)系的多樣性,得到更多信息,推理的范圍更加廣泛。
高校智慧圖書館海量的、復(fù)雜的館藏資源,采用知識(shí)推理可以有效挖掘和推理出潛在的關(guān)系信息,通過(guò)提供接近“專、精、深”的搜索查詢功能,為用戶提供“懂需求”的智能服務(wù),達(dá)到精準(zhǔn)推送。
知識(shí)圖譜在高校智慧圖書館建設(shè)中提供精準(zhǔn)的上傳下達(dá)服務(wù),為知識(shí)的大數(shù)據(jù)化合理利用提供優(yōu)質(zhì)路徑,為讀者與高校智慧圖書館之間建立起了網(wǎng)絡(luò)紐帶。預(yù)期在不久將來(lái),基于知識(shí)圖譜的高校智慧圖書館結(jié)合人工智能技術(shù),將會(huì)把書、人、時(shí)間和空間有效融合為一個(gè)知識(shí)生態(tài)有機(jī)體,通過(guò)對(duì)讀者各種行為數(shù)據(jù)分析,主動(dòng)推薦圖書、推送資源,構(gòu)建“會(huì)猜想、懂(你)心思”的現(xiàn)代智慧圖書館,實(shí)現(xiàn)無(wú)障礙、橫跨時(shí)空的資源共享,資源利用的最大化,為讀者帶來(lái)便捷、生動(dòng)、有趣和智能的閱讀體會(huì)。