楊金峰 陶以政 梁燕 李龔亮 唐定勇
摘要:近年來,隨著互聯(lián)網(wǎng)數(shù)字經(jīng)濟(jì)的飛速發(fā)展,企事業(yè)單位為了降本增效和擴(kuò)大市場(chǎng)占有率,紛紛向數(shù)字化轉(zhuǎn)型。傳統(tǒng)信息系統(tǒng)已不能滿足數(shù)字化轉(zhuǎn)型要求,以傳統(tǒng)信息管理系統(tǒng)為基礎(chǔ),面向知識(shí)管理系統(tǒng)(KMS)轉(zhuǎn)型成為一種趨勢(shì)。然而,組織中各種高價(jià)值專業(yè)知識(shí)如何被需要的員工高效利用,已成為組織面臨的主要問題之一。知識(shí)推薦是解決知識(shí)有效利用的最有效方法。本文首先對(duì)知識(shí)管理系統(tǒng)和推薦算法的相關(guān)研究進(jìn)行介紹;然后對(duì)知識(shí)管理中的推薦算法進(jìn)行分析討論和比較,最后探討了知識(shí)推薦算法的發(fā)展方向。
關(guān)鍵詞:知識(shí)管理;推薦算法;個(gè)性化服務(wù)
中圖分類號(hào):TP391? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)26-0217-04
Abstract:In recent years, with the rapid development of the Internet digital economy, enterprises and institutions have turned to digitalization to reduce costs and increase efficiency and expand market share. Traditional information systems can no longer meet the requirements of digital transformation. Based on traditional information management systems, the transformation of knowledge management systems (KMS) has become a trend. However, how to effectively utilize various high-value expertise in the organization to the employees who need it has become one of the main problems facing the organization. Knowledge recommendation is the most effective way to solve the effective use of knowledge. This paper first introduces the related research of knowledge management systems and recommendation algorithms; then analyzes, discusses, and compares the recommendation algorithms in knowledge management, and finally discusses the development direction of knowledge recommendation algorithms.
Key words:knowledge management;recommendation algorithm;personalized service
1引言
近年來,隨著互聯(lián)網(wǎng)業(yè)務(wù)復(fù)雜度的提高,企業(yè)與科研單位產(chǎn)生的信息量呈指數(shù)化增長(zhǎng)。因此,我們的需求已經(jīng)不能局限于將實(shí)體數(shù)據(jù)信息化,而是將信息化的數(shù)據(jù)知識(shí)化,形成易于管理、存儲(chǔ)、應(yīng)用的知識(shí)。鑒于此需要一個(gè)平臺(tái)對(duì)知識(shí)進(jìn)行操作管理,知識(shí)管理(KM)就應(yīng)運(yùn)而生。KM是收集、處理、分享一個(gè)組織內(nèi)全部知識(shí)的方式,利用軟件平臺(tái)和開發(fā)技術(shù)對(duì)某一組織內(nèi)大量有價(jià)值的方案、策劃、成果、經(jīng)驗(yàn)等知識(shí)進(jìn)行分類存儲(chǔ)和管理,積累知識(shí)資產(chǎn),發(fā)揮其深層次的作用。主要功能集中在實(shí)現(xiàn)有效的知識(shí)存儲(chǔ),高效的知識(shí)發(fā)現(xiàn)、流轉(zhuǎn)和共享。鑒于KM中的知識(shí)錯(cuò)綜復(fù)雜,將需求知識(shí)通過檢索技術(shù)呈現(xiàn)給用戶復(fù)雜且耗時(shí)。如何在海量知識(shí)資源中,將恰當(dāng)?shù)闹R(shí)在恰當(dāng)?shù)臅r(shí)間以恰當(dāng)?shù)姆绞匠尸F(xiàn)給恰當(dāng)?shù)娜?,從而做出恰?dāng)?shù)臎Q策,成為關(guān)注熱點(diǎn)[1]。為解決此問題相關(guān)工作者提出將合適的推薦算法應(yīng)用到KMS中,與此同時(shí)取得了顯著成果。本文就近幾年關(guān)于面向知識(shí)管理的推薦算法的相關(guān)研究分析、總結(jié)、對(duì)比和展望。
2知識(shí)管理
知識(shí)管理是一個(gè)較早提出的管理學(xué)概念,已二十年有余。隨著信息化的發(fā)展,KM從模型走向應(yīng)用,已有許多IT從業(yè)者對(duì)其進(jìn)行研究和實(shí)現(xiàn),研發(fā)了如Kmaster、WCP等產(chǎn)品。本章主要討論KM的含義和常見模型。KM主要利用系統(tǒng)內(nèi)的群體智慧來提高系統(tǒng)的可用性和創(chuàng)造性,為企業(yè)實(shí)現(xiàn)隱性知識(shí)顯性化、顯性知識(shí)共享化的功能。KM是一個(gè)在大量數(shù)據(jù)中挖掘、管理、應(yīng)用知識(shí)的動(dòng)態(tài)系統(tǒng),包括知識(shí)采集和加工、存儲(chǔ)和管理、應(yīng)用和創(chuàng)新等模塊。具體使用的技術(shù)有搜索引擎、專家系統(tǒng)、知識(shí)庫、人工智能算法等。
陳蘭杰[2]對(duì)國內(nèi)現(xiàn)存知識(shí)管理模型做了綜述,從管理學(xué)的角度對(duì)常用的知識(shí)管理模型做了介紹和分析。具體包括基于知識(shí)、基于知識(shí)管理工具等六種模型;其中架構(gòu)合理、易于實(shí)現(xiàn)、應(yīng)用廣泛的是基于知識(shí)管理工具的KM模型。關(guān)于此姜丹[3]提出一種基于本體的知識(shí)管理模型(OBKM模型)、王昊等人[4]提出一種本體驅(qū)動(dòng)的知識(shí)管理模型,在工程中得到了較好的使用。上述OBKM模型按如圖1所示方式組織知識(shí)管理。 賈琨鈺[5]提出針對(duì)大型企業(yè)知識(shí)管理的設(shè)計(jì),在知識(shí)采集、管理、應(yīng)用的模型上增加了知識(shí)評(píng)價(jià),系統(tǒng)通過用戶對(duì)知識(shí)的評(píng)價(jià)數(shù)據(jù)預(yù)估知識(shí)質(zhì)量,從而對(duì)其做出優(yōu)化和改進(jìn)。
通過趙蓉英[6]總結(jié)關(guān)于知識(shí)管理近十年國內(nèi)外的發(fā)展,發(fā)現(xiàn)國內(nèi)偏重管理學(xué)科研究,國外更注重于信息技術(shù)。而隨著近幾年KMS的持續(xù)發(fā)展,國內(nèi)研究重視計(jì)算機(jī)技術(shù)的引入,如機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)應(yīng)用于知識(shí)采集發(fā)現(xiàn)和知識(shí)應(yīng)用等。因此關(guān)于KMS的發(fā)展趨勢(shì)應(yīng)是大數(shù)據(jù)相關(guān)處理計(jì)算、機(jī)器學(xué)習(xí)算法的創(chuàng)新與應(yīng)用。
3推薦算法
在當(dāng)前數(shù)據(jù)量爆炸增長(zhǎng)的環(huán)境下,信息過濾技術(shù)已經(jīng)成為每一個(gè)系統(tǒng)必不可少的成分,而信息過濾主要有分類檢索和搜索引擎技術(shù)與推薦算法。如果信息分類不夠明確或者用戶檢索關(guān)鍵詞過少,則會(huì)增加檢索時(shí)間以及影響到檢索效果。而個(gè)性化推薦算法為推薦的精準(zhǔn)性采集不同維度的信息、深入分析用戶偏好?,F(xiàn)如今,推薦算法已經(jīng)分布在各行各業(yè),例如電子商務(wù)、新聞、電影、旅游、教育等。
推薦系統(tǒng)作為推薦算法的載體,主要包括用戶建模、推薦對(duì)象建模、推薦算法三個(gè)模塊。常見的推薦系統(tǒng)流程[7]如圖2所示,推薦算法作為橋梁連接用戶和推薦對(duì)象,通過相似度計(jì)算,將合適的對(duì)象推薦給合適的用戶。常用的推薦算法有基于內(nèi)容的推薦、基于協(xié)同過濾的推薦、基于知識(shí)的推薦、基于社交網(wǎng)絡(luò)的推薦以及混合推薦算法。下面對(duì)各類常用的推薦算法進(jìn)行討論。
3.1 基于內(nèi)容的推薦
基于內(nèi)容的推薦基本思想[8]:系統(tǒng)為給定的目標(biāo)用戶推薦與其喜歡或?yàn)g覽對(duì)象相似的對(duì)象。它無須用戶評(píng)分只需要根據(jù)用戶記錄學(xué)習(xí)并抽取用戶興趣偏好,最后將與用戶興趣相似度較大的項(xiàng)目推薦給用戶即可。該算法的重心在于用戶興趣偏好和項(xiàng)目特征的相似性計(jì)算,式(1)為計(jì)算相似性的函數(shù)。
3.2基于協(xié)同過濾的推薦
協(xié)同過濾算法是1992年由Glodberg等[9]提出的,是當(dāng)前個(gè)性化推薦算法中研究和使用最廣泛的算法之一。它只需利用用戶與項(xiàng)目之間的評(píng)分?jǐn)?shù)據(jù),通過相似度分析對(duì)用戶做出推薦。該算法主要分為基于用戶和基于項(xiàng)目?jī)煞N。
基于用戶的算法依據(jù)為用戶項(xiàng)目評(píng)分,尋找目標(biāo)用戶的近鄰集為目標(biāo)做出推薦。針對(duì)用戶數(shù)量劇增上述算法耗時(shí)呈線性增加的問題,Sarwr[10]為改善前者提出基于項(xiàng)目的協(xié)同過濾算法,該算法將相似度改為根據(jù)評(píng)分計(jì)算項(xiàng)目間相似度。
3.3基于知識(shí)的推薦
基于知識(shí)的推薦算法是在傳統(tǒng)推薦算法中加入專家知識(shí)庫,適用于特定領(lǐng)域的推薦,因此推薦的精度也相對(duì)較高。該算法主要依賴用戶需求和產(chǎn)品間相似度或特定規(guī)則做出推薦?;谒惴ㄖ幸雽<抑R(shí)庫的緣由對(duì)產(chǎn)品特征進(jìn)行語義擴(kuò)展,據(jù)此做出推薦,因此可以看作是基于內(nèi)容的推薦算法的擴(kuò)展。本算法作為基于內(nèi)容的擴(kuò)展,不需要用戶評(píng)分做支撐,所以不存在冷啟動(dòng)問題。陳潔敏[11]提出該算法可以分為3類:基于約束的推薦、基于實(shí)例的推薦和基于知識(shí)推理的推薦。
3.4基于社交網(wǎng)絡(luò)的推薦
基于社交網(wǎng)絡(luò)的推薦主要是依托近年來社交網(wǎng)絡(luò)的迅速發(fā)展,將社交網(wǎng)絡(luò)分析理論應(yīng)用在推薦上的一類方法。它主要依據(jù)匯集的不同層次、領(lǐng)域、年齡、地域的人,積累的用戶興趣知識(shí)來產(chǎn)生推薦。因此將社交網(wǎng)絡(luò)分析技術(shù)應(yīng)用在推薦領(lǐng)域成為當(dāng)前研究熱點(diǎn)之一。而基于社交網(wǎng)絡(luò)的推薦可以分為:基于鄰域的社交化推薦和基于網(wǎng)絡(luò)結(jié)構(gòu)的社交化推薦。
3.5混合推薦
單一的推薦算法在實(shí)際應(yīng)用中的效果總是略顯不足,為了取長(zhǎng)補(bǔ)短則需要采用混合的手段來設(shè)計(jì)推薦算法,因此提出混合推薦(Hybrid Recommendation)的方法?;旌系脑瓌t是混合后提升性能,增強(qiáng)推薦效果。在混合推薦算法的組合方式上,Robin[12]指出以下常用組合思路:加權(quán)式、切換式、混雜式、特征組合式、層疊式、特征補(bǔ)充、級(jí)聯(lián)式。雖然理論上可以將任意推薦算法進(jìn)行混合,但是由于應(yīng)用場(chǎng)景以及結(jié)果的相互影響,常見形式如下。
(1)結(jié)果融合:該方式針對(duì)多種單一推薦算法的結(jié)果進(jìn)行融合匯總,然后推薦給用戶。
(2)過程融合:該方式切入點(diǎn)在于算法內(nèi)部,以某種推薦算法為依托框架,將另一種或多種推薦算法運(yùn)用在這個(gè)框架上以提高推薦策略的效果。
由于單一推薦算法應(yīng)用場(chǎng)景有限,效率有很大提升空間,因此關(guān)于混合推薦算法仍是推薦算法中的重點(diǎn)研究對(duì)象。
4知識(shí)推薦算法
4.1 KMS中的知識(shí)推薦算法
隨著許多企業(yè)和科研機(jī)構(gòu)知識(shí)的累積,KMS已經(jīng)初步形成。由于知識(shí)結(jié)構(gòu)復(fù)雜、數(shù)量龐大,造成用戶檢索時(shí)間加長(zhǎng)、檢索效果不理想等問題。為了使知識(shí)得到有效的傳播利用,用戶得到個(gè)性化的體驗(yàn),并且隨著數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)技術(shù)的成熟與應(yīng)用,不少學(xué)者開始將推薦算法應(yīng)用在KMS中,使知識(shí)得到了廣泛傳播,發(fā)揮了其價(jià)值。但相對(duì)電子商務(wù)、新聞、電影或音樂等推薦場(chǎng)景,知識(shí)推薦的研究起步較晚,KMS中的推薦算法多為一些傳統(tǒng)推薦算法,表1就近幾年應(yīng)用在KMS中的推薦算法實(shí)例進(jìn)行討論。
時(shí)間 應(yīng)用場(chǎng)景 核心算法 優(yōu)點(diǎn) 缺點(diǎn) 基于關(guān)聯(lián)規(guī)則的推薦 雷雪[13](2014) 文獻(xiàn)知識(shí)推薦 運(yùn)用Apriori算法挖掘文獻(xiàn)關(guān)鍵詞,通過關(guān)鍵詞的關(guān)聯(lián)進(jìn)行文獻(xiàn)推薦 自變量少、易于實(shí)現(xiàn) 局限于關(guān)鍵字,影響推薦效果 基于內(nèi)容的推薦 許冠中[14]
(2014) 特定領(lǐng)域知識(shí)(供電局) 通過全文構(gòu)建知識(shí)和記錄構(gòu)建用戶模型,
計(jì)算相似度做出推薦 結(jié)果直觀、無冷啟動(dòng)問題、結(jié)合性強(qiáng) 只針對(duì)特征易抽取的信息、推薦結(jié)果時(shí)效性差 基于協(xié)同過濾的推薦 朱耀磷[15]
(2017) 網(wǎng)絡(luò)課程知識(shí)推薦 建立用戶評(píng)分向量,根據(jù)協(xié)同過濾尋找相似用戶,挖掘相似課程知識(shí)做出推薦 適用于非結(jié)構(gòu)化數(shù)據(jù)、推薦效果與用戶數(shù)成正比、推送新穎知識(shí) 冷啟動(dòng)問題、數(shù)據(jù)量越大稀疏性問題越嚴(yán)重 馬彩娟[16]
(2013) Java課程知識(shí)推薦 將用戶聚類,根據(jù)協(xié)同過濾將聚簇內(nèi)用戶的知識(shí)進(jìn)行相似性計(jì)算做出推薦 混合推薦 李瑞金[17]
(2016) 高校知識(shí)庫推薦 結(jié)合基于內(nèi)容和基于協(xié)同過濾的推薦算法,采用切換式混合思路 解決冷啟動(dòng)和數(shù)據(jù)稀疏性問題 未考慮語義層面相似度 基于社交網(wǎng)絡(luò)的推薦 Fan? B[18]
(2008) KMS中的知識(shí)推薦 引入基于社交網(wǎng)絡(luò)理論的集中化分析和內(nèi)聚子組分析,集中分析找到關(guān)聯(lián)節(jié)點(diǎn)成組,然后尋找組內(nèi)相似度高的節(jié)點(diǎn)進(jìn)行推薦 推薦效果與用戶數(shù)成正比、推送新感興趣的內(nèi)容 冷啟動(dòng)問題 基于Markov鏈思想的推薦 李承浩[19]
(2016) 企業(yè)知識(shí)推薦 通過Markov預(yù)測(cè)模型得到用戶-項(xiàng)目轉(zhuǎn)移矩陣,計(jì)算用戶相似性矩陣,得到近鄰的歷史記錄進(jìn)行推薦 降低數(shù)據(jù)稀疏性、提高推薦質(zhì)量 冷啟動(dòng)問題 基于上下文模型的推薦 Yan Y[20]
(2016) KMS中的知識(shí)推薦 用上下文知識(shí)建立知識(shí)和用戶模型:包括組織、人員、活動(dòng)和物理環(huán)境等,根據(jù)上下文相似性進(jìn)行推薦 考慮知識(shí)應(yīng)用上下文 缺少用戶
上表從知識(shí)推薦實(shí)例的維度對(duì)知識(shí)推薦算法通過應(yīng)用領(lǐng)域、算法實(shí)現(xiàn)及其優(yōu)缺點(diǎn)進(jìn)行詳細(xì)對(duì)比,發(fā)現(xiàn)領(lǐng)域知識(shí)特點(diǎn)鮮明,算法思路差異化大,優(yōu)缺點(diǎn)參差不齊;但是在知識(shí)推薦算法的優(yōu)缺點(diǎn)分析上未定位到具體的性能指標(biāo)。因此,表2從算法類別的角度進(jìn)一步對(duì)各類知識(shí)推薦算法在性能指標(biāo)上定性分析,通過抽取各類知識(shí)推薦算法的優(yōu)勢(shì),查找避免知識(shí)推薦算法的劣勢(shì),有利于進(jìn)一步尋找知識(shí)推薦算法改進(jìn)之處。
4.2知識(shí)推薦算法的改進(jìn)方向
分析現(xiàn)有推薦算法在KMS中的應(yīng)用,雖然產(chǎn)生一定的推薦效果,但也存在諸如冷啟動(dòng)、未兼顧知識(shí)屬性和用戶的操作行為、未考慮到知識(shí)應(yīng)用場(chǎng)景等問題。針對(duì)此提出兩個(gè)關(guān)于知識(shí)推薦算法的改進(jìn)方向。
4.2.1 多維度自變量
自變量的維度一定程度上決定了知識(shí)推薦算法的精度。單一推薦算法大多僅考慮單一的用戶輸入,例如基于內(nèi)容的推薦只考慮知識(shí)本身的屬性,基于協(xié)同過濾的推薦只考慮用戶操作。對(duì)于知識(shí)而言,知識(shí)應(yīng)用是整個(gè)流程中的重中之重,而知識(shí)應(yīng)用的上下文一定程度上影響了知識(shí)推薦的效果。因此為了在海量知識(shí)中得到較高精度的推薦可以融合諸如知識(shí)內(nèi)容、知識(shí)應(yīng)用情境及知識(shí)評(píng)分等多維度自變量。
4.2.2多種推薦算法的混合
在當(dāng)前知識(shí)推薦的應(yīng)用中,面臨的知識(shí)量往往都是巨大的,并且不同領(lǐng)域的知識(shí)差異化較大,單一推薦算法處理能力就顯得吃力。因此,可以根據(jù)領(lǐng)域知識(shí)的特性和推薦算法的優(yōu)缺點(diǎn),選擇多種推薦算法進(jìn)行混合,得到提高知識(shí)推薦精準(zhǔn)度的目的。
5結(jié)束語
隨著互聯(lián)網(wǎng)業(yè)務(wù)的復(fù)雜化以及技術(shù)的發(fā)展,企事業(yè)信息系統(tǒng)逐漸走向知識(shí)化應(yīng)用平臺(tái)。由于知識(shí)量的增長(zhǎng)和推薦算法的普及,推薦算法被引入到KMS當(dāng)中且得到了廣泛研究應(yīng)用。本文通過對(duì)KMS的體系結(jié)構(gòu)和常見推薦算法的介紹,以及對(duì)當(dāng)前應(yīng)用在KMS中的推薦算法的分析,發(fā)現(xiàn)針對(duì)知識(shí)的推薦存在諸如冷啟動(dòng)、未考慮知識(shí)應(yīng)用情境的問題。最后提出兩個(gè)可改進(jìn)的方向,如何通過分析結(jié)果得到具體算法并提升推薦精度需要進(jìn)一步的研究和學(xué)習(xí)。
參考文獻(xiàn):
[1] 王震威.企業(yè)知識(shí)管理系統(tǒng)[J].計(jì)算機(jī)工程,2005,31(z1):162-164,166.
[2] 陳蘭杰.國內(nèi)知識(shí)管理模型研究綜述[J].科學(xué)與管理,2010,30(1):9-15.
[3] 姜丹.基于本體的知識(shí)管理模型研究[D].西安:西安電子科技大學(xué),2008.
[4] 王昊,谷俊,蘇新寧.本體驅(qū)動(dòng)的知識(shí)管理系統(tǒng)模型及其應(yīng)用研究[J].中國圖書館學(xué)報(bào),2013,39(2):98-110.
[5] 賈琨鈺.大型企業(yè)的知識(shí)管理系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)與網(wǎng)絡(luò),2018,44(4):60-62.
[6] 趙蓉英,余慧妍,李新來.國內(nèi)外知識(shí)管理系統(tǒng)研究態(tài)勢(shì)(2009-2018)[J].圖書館論壇,2020,40(1):78-86.
[7] 許海玲.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009,20(2): 350-362.
[8] BalabanovicM,ShohamY.Fab:content-based,collaborative recommendation[J].Communications of the ACM,1997,40(3):66-72.
[9] GoldbergD,NicholsD,Oki BM,etal.Using collaborative filtering to weave an information tapestry[J].Communications of the ACM,1992,35(12):61-70.
[10] SarwarB,KarypisG,KonstanJ,etal.Item-based collaborative filtering recommendation algorithms[C]//Proceedings of the tenth international conference on World Wide Web - WWW '01.May 1-5,2001.Hong Kong,China.NewYork:ACM Press,2001:285-295.
[11] 陳潔敏,湯庸,李建國,等.個(gè)性化推薦算法研究[J].華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,46(5):8-15.
[12] Robin B. Hybrid recommender systems: Survey and experiments[R]. Fullerton: California State University,2003.
[13] 雷雪,侯人華,曾建勛.關(guān)聯(lián)規(guī)則在領(lǐng)域知識(shí)推薦中的應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2014,37(12):67-70,66.
[14] 許冠中,寧柏鋒,邱海楓,等.基于內(nèi)容的智能推薦在知識(shí)管理中的應(yīng)用研究[J].電力信息與通信技術(shù), 2014, 12(12):54-47.
[15] 朱耀磷,蔡延光.知識(shí)推薦的協(xié)同過濾算法[J].軟件,2017,38(8):50-53.
[16] 馬彩娟, 曹林芬. 協(xié)同過濾在知識(shí)推薦中的應(yīng)用[J]. 輕工學(xué)報(bào), 2013, 28(5):50-53.
[17] 李瑞金.高校機(jī)構(gòu)知識(shí)庫個(gè)性化文本信息推薦方法研究[D].大連:大連海事大學(xué),2016.
[18] Fan B , Liu L , Li M , et al. Knowledge Recommendation Based on Social Network Theory[C]// Advanced Management of Information for Globalized Enterprises, 2008. AMIGE 2008.IEEE Symposium on.IEEE, 2008.
[19] 李承浩.企業(yè)知識(shí)個(gè)性化推薦方法研究與應(yīng)用[D].濟(jì)南:齊魯工業(yè)大學(xué),2016.
[20] Yan Y , Yang N , Hao J , et al. A Context Modeling Method of Knowledge Recommendation forDesigners[C]// 2016 International Conference on Information System and Artificial Intelligence (ISAI). IEEE, 2016.
【通聯(lián)編輯:唐一東】