劉慧琳 劉敬儀 黃健
摘要:企業(yè)文檔資源不斷豐富,對(duì)企業(yè)檔案部門的工作提出了新的挑戰(zhàn),然而,目前的傳統(tǒng)文檔利用方式較為簡(jiǎn)單,文檔中蘊(yùn)含的知識(shí)資源無(wú)法給企業(yè)的發(fā)展帶來(lái)實(shí)際效益。基于此,文章提出基于知識(shí)庫(kù)的企業(yè)文檔智能服務(wù)模式,通過(guò)知識(shí)庫(kù)實(shí)現(xiàn)從文獻(xiàn)傳遞到知識(shí)服務(wù)的轉(zhuǎn)型,為企業(yè)檔案部門進(jìn)行知識(shí)服務(wù)提供幫助。具體步驟包括原始文件到知識(shí)單元的轉(zhuǎn)化、知識(shí)單元關(guān)聯(lián)形成知識(shí)圖譜、知識(shí)圖譜應(yīng)用實(shí)現(xiàn)知識(shí)問答,以及最終不同形式的文檔智能服務(wù)。
關(guān)鍵詞:智能服務(wù) 智能技術(shù) 知識(shí)服務(wù) 知識(shí)庫(kù) 企業(yè)文檔
Abstract: The continuous enrichment of corpo? rate document resources poses new challenges to the work of corporate archives departments. Howev? er, the current use of traditional documents is rela? tively simple, and the knowledge resources con? tained in the documents cannot bring actual benefits to the development of the enterprise. Based on this, the article proposes a knowledge- based enterprise document intelligent service model. Through the knowledge base, the transformation from document delivery to knowledge service is realized, which helps the enterprise archives department to carry out knowledge service.The specific steps include: the conversion of original documents to knowledge units, the association of knowledge units to form a knowledgegraph,theapplicationofknowledge graphs to implement knowledge questions and an? swers, and different forms of document intelligent services.
Keywords: Intelligent service; Intelligent technol? ogy; Knowledge service; Knowledge base; Enterprise document
文檔是企業(yè)知識(shí)的重要體現(xiàn),結(jié)構(gòu)化與非結(jié)構(gòu)化的各類企業(yè)文檔量不斷攀升,大量的數(shù)據(jù)給企業(yè)文檔管理工作帶來(lái)新挑戰(zhàn),同時(shí)技術(shù)在企業(yè)文檔管理中的運(yùn)用也帶來(lái)了新機(jī)遇。傳統(tǒng)的企業(yè)文檔服務(wù)無(wú)法滿足用戶日益增長(zhǎng)的知識(shí)需求,如何用技術(shù)改善文檔利用現(xiàn)狀、滿足用戶知識(shí)需求成為企業(yè)文檔管理工作的重要問題,知識(shí)庫(kù)為此提供了解決方案。
知識(shí)庫(kù)以各類檔案資源為對(duì)象,細(xì)化文檔粒度,實(shí)現(xiàn)知識(shí)關(guān)聯(lián),進(jìn)行內(nèi)容可視化,借助計(jì)算機(jī)技術(shù)完成檔案知識(shí)獲取、知識(shí)表示及知識(shí)應(yīng)用等實(shí)際任務(wù),提供面向用戶的檔案知識(shí)服務(wù)。檔案部門構(gòu)建檔案知識(shí)庫(kù)為檔案用戶提供檔案知識(shí)服務(wù)不僅有助于深化對(duì)檔案信息資源的開發(fā)與利用,而且是檔案部門實(shí)現(xiàn)自身轉(zhuǎn)型、獲得社會(huì)地位和影響力的必然選擇和趨勢(shì)[1]。為了幫助企業(yè)檔案部門更好地完成工作發(fā)揮作用,文章提出一種基于知識(shí)庫(kù)的企業(yè)文檔智能服務(wù)模式。
企業(yè)文檔是對(duì)企業(yè)文件、檔案的統(tǒng)稱,它是企業(yè)生產(chǎn)、經(jīng)營(yíng)活動(dòng)的真實(shí)歷史記錄,凝聚著企業(yè)管理、專業(yè)研究、業(yè)務(wù)狀況等各方面的經(jīng)驗(yàn)。相較于傳統(tǒng)企業(yè)、事業(yè)單位中的一般文檔管理,目前中國(guó)的核電企業(yè)中文檔管理工作的地位更加重要與突出[2],因此選取核電行業(yè)部分企業(yè)的公司文檔作為樣本進(jìn)行分析,得出表1所示企業(yè)文檔的主要類型。
企業(yè)文檔智能服務(wù)不僅是企業(yè)文檔部門的關(guān)注點(diǎn),也是圖情檔領(lǐng)域?qū)W者的研究?jī)?nèi)容之一。有學(xué)者認(rèn)為知識(shí)服務(wù)模式是由眾多要素綜合而成的[3];張淑雅、杜恩龍[4]提出知識(shí)檢索平臺(tái)、知識(shí)學(xué)習(xí)平臺(tái)、知識(shí)問答平臺(tái)以及知識(shí)訂閱平臺(tái)四種模式的知識(shí)服務(wù);鄭慧萍[5]、李超[6]提出參考咨詢服務(wù)、網(wǎng)絡(luò)型服務(wù)、集成化服務(wù)、個(gè)性化服務(wù)以及用戶自助服務(wù)的知識(shí)服務(wù)模式。針對(duì)文檔而言,裘麗[7]認(rèn)為后保管時(shí)代的檔案知識(shí)服務(wù)模式應(yīng)有用戶自助服務(wù)、個(gè)性化定制服務(wù)以及個(gè)人數(shù)字檔案館等。關(guān)于文檔知識(shí)服務(wù)的研究,較早見于政府文件,例如,劉宇[8]分別從以政府為主導(dǎo)和以龍頭企業(yè)為主導(dǎo)的方向介紹了知識(shí)服務(wù)的模式;牛力、王為久[9]等提出面向政府決策的檔案知識(shí)服務(wù)旨在充分發(fā)掘出檔案的價(jià)值,為政府決策提供全面支持。
信息技術(shù)的飛速發(fā)展、管理階段的不斷更新、檔案人員的自身訴求[10]為文檔管理與服務(wù)模式帶來(lái)新的思考與可能。新的技術(shù)能夠解析文檔資源中的語(yǔ)義知識(shí)并可視化知識(shí)之間的關(guān)聯(lián)關(guān)系,打破以往企業(yè)文檔服務(wù)的粗粒度組織模式,實(shí)現(xiàn)以知識(shí)為導(dǎo)向的企業(yè)文檔智能服務(wù)。根據(jù)文獻(xiàn)調(diào)研和企業(yè)生產(chǎn)活動(dòng)中的實(shí)踐,發(fā)現(xiàn)信息時(shí)代下企業(yè)文檔服務(wù)的需求表現(xiàn)出多元化與個(gè)性化、全面性和有效性等特點(diǎn),結(jié)合需求特點(diǎn)和知識(shí)服務(wù)的思想,本文認(rèn)為企業(yè)文檔智能服務(wù)是以智能技術(shù)為中介、企業(yè)文檔為基礎(chǔ),向用戶提供知識(shí)的一種高級(jí)服務(wù),與單純梳理及論證知識(shí)服務(wù)的概念不同,本研究重在探討一種以知識(shí)庫(kù)為核心、依靠智能技術(shù)提供知識(shí)服務(wù)的方式方法。
企業(yè)文檔智能服務(wù)是企業(yè)文化適應(yīng)知識(shí)經(jīng)濟(jì)發(fā)展的需求而產(chǎn)生的,是企業(yè)文化管理和核心技術(shù)管理縱深發(fā)展的結(jié)果,是伴隨著企業(yè)對(duì)資源認(rèn)識(shí)的不斷深化、智能技術(shù)的不斷推廣以及企業(yè)自身管理能力的不斷提高而發(fā)展起來(lái)的。
(一)知識(shí)庫(kù):從文獻(xiàn)傳遞到知識(shí)服務(wù)
傳統(tǒng)的文檔服務(wù)常采用文獻(xiàn)傳遞等方式,這種方式以物理文件的粒度為單元進(jìn)行查找,查詢結(jié)果限制在個(gè)體文檔層面,只能提供文獻(xiàn)級(jí)別的服務(wù),很難反饋資源之間的關(guān)聯(lián)。然而,用戶真正需求通常是分散在不同文獻(xiàn)中的知識(shí)片段,文獻(xiàn)傳遞造成知識(shí)孤島等問題,用戶獲取的知識(shí)內(nèi)容不夠深入,文檔蘊(yùn)含的知識(shí)價(jià)值發(fā)揮不完全。知識(shí)庫(kù)運(yùn)用科學(xué)的方法對(duì)不同來(lái)源、不同層次、不同結(jié)構(gòu)、不同內(nèi)容的知識(shí)進(jìn)行綜合和集成,使單一知識(shí)、零散知識(shí)、新舊知識(shí)、顯性知識(shí)和隱性知識(shí)經(jīng)過(guò)整合形成新的知識(shí)體系。知識(shí)庫(kù)不再是簡(jiǎn)單的文獻(xiàn)存儲(chǔ)數(shù)據(jù)庫(kù),而是深入文獻(xiàn)內(nèi)容的知識(shí)單元、知識(shí)關(guān)聯(lián)等的集合,是從文獻(xiàn)傳遞到知識(shí)服務(wù)的重要支撐。信息時(shí)代下檔案等文化富集性資源需要進(jìn)行知識(shí)服務(wù)的轉(zhuǎn)型,來(lái)更好地勝任輔助決策的智庫(kù)角色。以知識(shí)庫(kù)為核心的新型檔案服務(wù)平臺(tái)建設(shè)與發(fā)展比以往任何時(shí)刻都更為重要[11],其構(gòu)建需要以技術(shù)、管理和內(nèi)容為重點(diǎn)支撐,這要求檔案管理主體必須根據(jù)信息資源的知識(shí)屬性特征[12],應(yīng)用各種手段對(duì)其進(jìn)行編研。針對(duì)企業(yè)文檔構(gòu)建知識(shí)庫(kù)的實(shí)質(zhì)是對(duì)企業(yè)文檔知識(shí)進(jìn)行管理,將“文檔庫(kù)”提升為“知識(shí)庫(kù)”,可以從信息集聚地提升為知識(shí)集聚地,最終使文檔的內(nèi)容轉(zhuǎn)變?yōu)橐环N知識(shí)資產(chǎn),使企業(yè)的核心文檔在收集、加工、存儲(chǔ)、傳遞和應(yīng)用的流轉(zhuǎn)過(guò)程中不斷增值。
(二)模式框架:知識(shí)發(fā)現(xiàn)、組織、可視與服務(wù)
依托知識(shí)庫(kù),企業(yè)文檔對(duì)于計(jì)算機(jī)不再是一串串沒有意義的字符,而是互聯(lián)互通、有重點(diǎn)、可理解的數(shù)據(jù)網(wǎng)。企業(yè)文檔智能服務(wù)能夠借助從數(shù)字技術(shù)到智能技術(shù)的一系列技術(shù)手段,完成知識(shí)發(fā)現(xiàn)、知識(shí)組織、知識(shí)可視、知識(shí)服務(wù)等工作,實(shí)現(xiàn)從物理文件到電子文件,再到知識(shí)單元和知識(shí)圖譜,最后成為面向用戶的知識(shí)問答的系列轉(zhuǎn)型,具體如圖1所示。
具體而言,諸如文件掃描、構(gòu)建信息系統(tǒng)等簡(jiǎn)單的數(shù)字技術(shù)在很多大型企業(yè)中已經(jīng)得到非常成熟的應(yīng)用,在此基礎(chǔ)上加入OCR、NLP、對(duì)象檢測(cè)、關(guān)系抽取等初步智能技術(shù),可以將傳統(tǒng)的物理文件轉(zhuǎn)化為計(jì)算機(jī)存儲(chǔ)格式的、能夠直接在數(shù)字環(huán)境中加工處理的、帶有關(guān)鍵詞標(biāo)識(shí)的電子文件,這一過(guò)程可以稱之為“知識(shí)發(fā)現(xiàn)”的過(guò)程。知識(shí)發(fā)現(xiàn)主要是讓計(jì)算機(jī)發(fā)現(xiàn)并存儲(chǔ)文件的關(guān)鍵知識(shí),但此時(shí)的數(shù)據(jù)只是被OCR識(shí)別的文件,或被NLP標(biāo)記后的關(guān)鍵詞,或被對(duì)象檢測(cè)出的目標(biāo)圖片等,這些離散的數(shù)據(jù)點(diǎn)如何關(guān)聯(lián)還有待進(jìn)一步加工,需要借助諸如知識(shí)聚合、相似度計(jì)算、關(guān)聯(lián)數(shù)據(jù)等知識(shí)組織方面的智能技術(shù)。知識(shí)組織后電子文件就不再是離散存儲(chǔ)的一個(gè)個(gè)單獨(dú)文檔,而是相互關(guān)聯(lián)的知識(shí)單元,經(jīng)過(guò)可視化技術(shù)可以呈現(xiàn)為知識(shí)圖譜或其他形式的圖表。知識(shí)圖譜的效果可以為我們提供有益參考,但這種參考更多是數(shù)據(jù)分析方面,最終還需要轉(zhuǎn)化為面向用戶的文檔智能服務(wù)。文檔智能服務(wù)的實(shí)現(xiàn)需要考慮不同的應(yīng)用場(chǎng)景、不同的用戶需求,以及不同的問題種類,面對(duì)不同情況有針對(duì)性地采取不同的知識(shí)服務(wù)方式。
技術(shù)手段的運(yùn)用是決定企業(yè)文檔智能服務(wù)與傳統(tǒng)的參考咨詢服務(wù)及信息檢索服務(wù)不同的最關(guān)鍵要素。在知識(shí)發(fā)現(xiàn)與知識(shí)組織階段,用命名實(shí)體識(shí)別、人臉識(shí)別對(duì)文字、圖片進(jìn)行標(biāo)注,其速度、準(zhǔn)確性、全面性相比過(guò)去的人工標(biāo)注都能獲得提升;用知識(shí)圖譜、圖數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)信息進(jìn)行存儲(chǔ)和可視,其規(guī)范程度、關(guān)聯(lián)程度等都有一定程度的進(jìn)步;用更加智能的問答、推薦等方式呈現(xiàn)文檔知識(shí),其友好性、共享性大大加強(qiáng)。
總體而言,從物理文件到電子文件的基礎(chǔ)轉(zhuǎn)換,再到知識(shí)單元和知識(shí)圖譜的關(guān)鍵過(guò)程,最后呈現(xiàn)多樣化的預(yù)期效果這一方式方法,共同構(gòu)成了企業(yè)文檔智能服務(wù)的核心框架,其中涉及眾多集成在知識(shí)庫(kù)中的數(shù)字技術(shù)和智能技術(shù)。
技術(shù)環(huán)境變遷直接導(dǎo)致了檔案管理對(duì)象及其管理空間的變化,有學(xué)者[13]認(rèn)為至少可以分三類技術(shù)環(huán)境,即傳統(tǒng)的模擬技術(shù)環(huán)境、基于數(shù)字信號(hào)的數(shù)字技術(shù)環(huán)境和以數(shù)據(jù)驅(qū)動(dòng)為核心特征的數(shù)據(jù)環(huán)境(新技術(shù)環(huán)境),分別簡(jiǎn)稱為模擬態(tài)、數(shù)字態(tài)和數(shù)據(jù)態(tài)檔案對(duì)象管理空間。新技術(shù)環(huán)境下,信息的處理由相對(duì)冗余和龐雜的文件粒度開始降維到更容易解析和處理的知識(shí)單元粒度,越來(lái)越多的智能技術(shù)廣泛應(yīng)用到知識(shí)服務(wù)中并發(fā)揮起重要作用來(lái)。
(一)企業(yè)文檔內(nèi)容的知識(shí)發(fā)現(xiàn)
以企業(yè)文檔為研究對(duì)象的知識(shí)發(fā)現(xiàn)主要用到的智能技術(shù)包括實(shí)體識(shí)別、對(duì)象檢測(cè)、關(guān)系抽取等。企業(yè)文檔中的實(shí)體不同于傳統(tǒng)檔案中的命名實(shí)體,諸如人名、地名等,對(duì)于企業(yè)業(yè)務(wù)而言也非主要數(shù)據(jù),而部門、崗位、業(yè)務(wù)、產(chǎn)品等專有名詞則是企業(yè)生產(chǎn)活動(dòng)中更關(guān)心的問題。對(duì)象檢測(cè)是指利用圖像處理與模式識(shí)別等方法,檢測(cè)出目標(biāo)對(duì)象并標(biāo)定其位置。企業(yè)的大量知識(shí)內(nèi)容凝聚在各類文檔的圖表中,且圖表在很多情況下比文字更易被用戶關(guān)注,因此借助對(duì)象檢測(cè)的方式把企業(yè)文檔中以“.pdf”“.tiff”“.jpg”“.jpeg”等形式存在的圖表知識(shí)專門“挖”出來(lái)能夠補(bǔ)充和完善企業(yè)文檔知識(shí)庫(kù)。關(guān)系抽取是指抽取實(shí)體間語(yǔ)義關(guān)系的任務(wù),實(shí)體間的關(guān)系可被形式化描述為關(guān)系三元組
(二)智能技術(shù)推動(dòng)的知識(shí)組織
智能技術(shù)推動(dòng)了以本體、語(yǔ)義網(wǎng)與知識(shí)圖譜為代表的新型知識(shí)組織方式,這種組織方式以結(jié)構(gòu)化形式將現(xiàn)實(shí)世界的事物及關(guān)系予以表示并存儲(chǔ),再通過(guò)結(jié)合實(shí)體識(shí)別、關(guān)系解析等信息自動(dòng)理解過(guò)程,實(shí)現(xiàn)知識(shí)關(guān)聯(lián)推理,預(yù)測(cè)可能存在的隱性知識(shí)或未來(lái)趨勢(shì)。知識(shí)圖譜在本質(zhì)上就是一種語(yǔ)義網(wǎng)絡(luò)(Semantic network)的知識(shí)庫(kù),即一種基于圖的數(shù)據(jù)結(jié)構(gòu),這種組織方式對(duì)于用戶的搜索請(qǐng)求不再局限于傳統(tǒng)的關(guān)鍵詞檢索,而是通過(guò)分析用戶的查詢意圖對(duì)問題進(jìn)行理解,在知識(shí)圖譜上推理、匹配和查詢以獲取更加簡(jiǎn)潔而準(zhǔn)確的答案。利用語(yǔ)義網(wǎng)和知識(shí)圖譜技術(shù)可以實(shí)現(xiàn)文檔知識(shí)的細(xì)粒度挖掘,從篇章級(jí)文檔數(shù)據(jù)內(nèi)容轉(zhuǎn)變?yōu)槿M知識(shí)單元級(jí)知識(shí)內(nèi)涵,通過(guò)各種關(guān)聯(lián)關(guān)系形成企業(yè)智慧大腦。
(三)智能化的知識(shí)可視及服務(wù)
可視化分析是一種高效的數(shù)據(jù)分析方法,可以清晰直觀、用戶友好地展現(xiàn)文本特征規(guī)律,是知識(shí)服務(wù)當(dāng)中重要的技術(shù)設(shè)施之一,基于可視化技術(shù)分析文本背后蘊(yùn)藏的隱性知識(shí),發(fā)現(xiàn)個(gè)體單元、文獻(xiàn)單元或知識(shí)單元之間的相關(guān)性,能夠拓寬文本分析的深度和廣度。知識(shí)服務(wù)順應(yīng)時(shí)代要求向自動(dòng)化轉(zhuǎn)變,積極利用機(jī)器學(xué)習(xí)技術(shù)可以提高文本分類、實(shí)體消歧、關(guān)鍵詞標(biāo)引、主體演化分析、用戶情感分析等各環(huán)節(jié)的工作效率和質(zhì)量。早期學(xué)者們多采用基于規(guī)則的工程化方法,現(xiàn)在多將規(guī)則和機(jī)器學(xué)習(xí)結(jié)合起來(lái),通過(guò)機(jī)器學(xué)習(xí)挖掘海量數(shù)據(jù)的顯隱性特征,利用專業(yè)知識(shí)規(guī)則改進(jìn)機(jī)器學(xué)習(xí)模型、輔助數(shù)據(jù)預(yù)處理或后驗(yàn)矯正。深度學(xué)習(xí)技術(shù)近兩年也取得了巨大的進(jìn)步,模型的強(qiáng)大特征和語(yǔ)義理解能力為知識(shí)服務(wù)帶來(lái)新的變革與成效,促進(jìn)了學(xué)科知識(shí)服務(wù)、知識(shí)分享與學(xué)術(shù)交流。
知識(shí)分為隱性知識(shí)和顯性知識(shí)[14],用戶能夠進(jìn)行明確提問的屬于顯性知識(shí)需求,還有沒有形成具體問題、甚至用戶本身還沒有意識(shí)到問題,但存在并且用戶也有偏好去尋求答案的需求屬于隱性知識(shí)需求。企業(yè)智能文檔服務(wù)不僅優(yōu)化對(duì)于顯性知識(shí)需求的滿足程度,也能進(jìn)一步發(fā)現(xiàn)和匹配用戶的隱性知識(shí)需求,從多方面提升服務(wù)質(zhì)量,改善用戶體驗(yàn)。
(一)面向顯性知識(shí)需求的智能服務(wù)
顯性知識(shí)需求可以由檢索反饋或智能問答等智能服務(wù)方式進(jìn)行滿足。常用的搜索服務(wù)是基于字符匹配,而基于知識(shí)庫(kù)的高級(jí)檢索服務(wù)模式是通過(guò)對(duì)用戶問題的關(guān)鍵詞進(jìn)行選取,將用戶的檢索詞上升到基于實(shí)體和關(guān)系的檢索上,找到對(duì)應(yīng)實(shí)體或概念,利用知識(shí)單元之間的概念層次結(jié)構(gòu)展開分析和知識(shí)推理的操作,搜索出滿足客戶需求的知識(shí)內(nèi)容。例如,用戶輸入發(fā)電機(jī),可以根據(jù)系統(tǒng)知識(shí)庫(kù)中存儲(chǔ)的企業(yè)文檔反饋出發(fā)電機(jī)氫氣冷卻系統(tǒng)、柴油發(fā)電機(jī)工藝水系統(tǒng)、汽輪發(fā)電機(jī)等內(nèi)容,相較傳統(tǒng)的字符匹配,在語(yǔ)義上具有更好的全面性。
此外近年來(lái)有很多智能問答式產(chǎn)品的成功引起了大家對(duì)于問答技術(shù)應(yīng)用的關(guān)注,例如,亞馬遜率先推出智能語(yǔ)音音響,用戶可以在任何空間和時(shí)間與智能硬件進(jìn)行對(duì)話,基于底層知識(shí)庫(kù)回答用戶在開放領(lǐng)域和封閉領(lǐng)域的問題。企業(yè)智能問答服務(wù)可以借鑒這些已有通用問答系統(tǒng)的技術(shù)基礎(chǔ),再結(jié)合企業(yè)具體的業(yè)務(wù)場(chǎng)景,捕捉一些特有的關(guān)鍵詞,從而創(chuàng)新文檔知識(shí)服務(wù)模式,優(yōu)化企業(yè)文檔知識(shí)服務(wù)內(nèi)容。
(二)面向隱性知識(shí)需求的智能服務(wù)
隱性知識(shí)需求可以通過(guò)個(gè)性化服務(wù)、專業(yè)化定制、智能化導(dǎo)航等智能服務(wù)方式進(jìn)行滿足。個(gè)性化服務(wù)致力于理解用戶背景和用戶興趣,構(gòu)建向用戶進(jìn)行精準(zhǔn)推薦所需要的知識(shí)庫(kù),幫助其篩選信息、發(fā)現(xiàn)可用知識(shí),從而提高用戶從海量信息中獲取有用知識(shí)的效率。根據(jù)用戶信息可以構(gòu)建用戶畫像,用戶信息一般包括用戶的基礎(chǔ)信息,如年齡、地域、職業(yè)、學(xué)歷、偏好等,以及用戶產(chǎn)出的行為數(shù)據(jù),如瀏覽、收藏、評(píng)論等。抽取這些信息再進(jìn)行數(shù)據(jù)融合,可以準(zhǔn)確定位用戶特征,發(fā)現(xiàn)用戶潛在需求。個(gè)性化推薦能加強(qiáng)文檔知識(shí)被接受的概率,有利于企業(yè)文檔價(jià)值的發(fā)揮和體現(xiàn),還可以解決部分用戶沒有表達(dá)出來(lái)的潛在需求,緩解一些用戶在系統(tǒng)使用上的學(xué)習(xí)負(fù)擔(dān)。
專業(yè)化定制可以關(guān)聯(lián)文檔中一些存在隱性關(guān)系的知識(shí)資源,例如當(dāng)企業(yè)用戶的知識(shí)需求不是單份固定的文檔,而是關(guān)于業(yè)務(wù)解決方案、業(yè)務(wù)活動(dòng)經(jīng)驗(yàn)等相關(guān)知識(shí)的合集時(shí),借助知識(shí)庫(kù)可以將知識(shí)內(nèi)容整合分析,有效集成企業(yè)文檔中的知識(shí)資源,使物理分散的知識(shí)內(nèi)容整合在一起,從而得出戰(zhàn)略性知識(shí)。借助知識(shí)地圖的直觀呈現(xiàn),可將企業(yè)文檔中蘊(yùn)含的相關(guān)知識(shí)資源的分布位置全部呈現(xiàn),用戶可以快速遍歷相關(guān)內(nèi)容,從一個(gè)節(jié)點(diǎn)跳轉(zhuǎn)到另一個(gè)節(jié)點(diǎn)進(jìn)行瀏覽和知識(shí)獲取,同時(shí)獲取多個(gè)維度的知識(shí)內(nèi)容。
智能化導(dǎo)航是結(jié)合知識(shí)庫(kù)和用戶畫像動(dòng)態(tài)更新導(dǎo)航系統(tǒng)的知識(shí)服務(wù)方式。信息時(shí)代,數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng)的態(tài)勢(shì),廣泛的數(shù)據(jù)來(lái)源、多樣的數(shù)據(jù)形式、高速的數(shù)據(jù)產(chǎn)生速度在為知識(shí)服務(wù)提供便利的同時(shí)也帶來(lái)了新的挑戰(zhàn),建設(shè)能夠支撐大體量信息存儲(chǔ)分析的智能化知識(shí)導(dǎo)航系統(tǒng),對(duì)知識(shí)資源進(jìn)行科學(xué)合理分類是提供高效知識(shí)服務(wù)的基礎(chǔ)。搭建可以智能導(dǎo)航的搜索引擎,呈現(xiàn)量身定做的導(dǎo)航欄,可以更好地展示各類特色資源。
以基于知識(shí)庫(kù)的企業(yè)文檔智能服務(wù)模式研究為目的,本文首先對(duì)企業(yè)文檔服務(wù)的現(xiàn)狀進(jìn)行了調(diào)研,其次借鑒知識(shí)庫(kù)、知識(shí)圖譜方面的理論和模型提出了企業(yè)文檔智能服務(wù)的核心框架。具體分析模式內(nèi)容和模式效用后,研究認(rèn)為基于知識(shí)庫(kù)從企業(yè)原始文件到知識(shí)單元、再到知識(shí)圖譜、知識(shí)問答的組織模式能夠較好地發(fā)現(xiàn)和利用企業(yè)文檔中蘊(yùn)含的知識(shí),基于知識(shí)圖譜完成的知識(shí)問答能夠提高用戶主導(dǎo)和企業(yè)文檔持有方主導(dǎo)的不同知識(shí)服務(wù)效果。整體模式的應(yīng)用能夠提高企業(yè)文檔的管理水平,進(jìn)一步落實(shí)企業(yè)文檔工作對(duì)智能技術(shù)的應(yīng)用和推廣,推動(dòng)企業(yè)文檔的智能服務(wù)進(jìn)程。
*本文系國(guó)家檔案局科技項(xiàng)目“核電文檔AI中臺(tái)建設(shè)研究”(項(xiàng)目編號(hào):2020-X-044)的研究成果之一。
注釋及參考文獻(xiàn):
[1]張斌,郝琦,魏扣.基于檔案知識(shí)庫(kù)的檔案知識(shí)服務(wù)研究[J].檔案學(xué)通訊,2016(3):51-58.
[2]韓季紅.核電文檔管理的地位與特點(diǎn)研究[J].北京檔案,2010(5):33-34.
[3]古志文,陳春,吳新年.支撐企業(yè)技術(shù)創(chuàng)新的知識(shí)服務(wù)模式研究:知識(shí)服務(wù)與信息服務(wù)融合發(fā)展的視角[J].科技進(jìn)步與對(duì)策,2014,31(7):131-135.
[4]張淑雅,杜恩龍.關(guān)于出版企業(yè)知識(shí)服務(wù)模式的思考[J].出版廣角,2017(14):13-15.
[5]鄭慧萍.數(shù)字檔案館知識(shí)服務(wù)模式探究[J].蘭臺(tái)內(nèi)外,2009(2):19.
[6]李超,徐震.檔案知識(shí)服務(wù)研究[J].山東檔案,2009(1):23-25.
[7]裘麗.后保管時(shí)代下構(gòu)建檔案知識(shí)服務(wù)模式探索[J].云南檔案,2015(9):52-55.
[8]劉曉妮,劉宇.產(chǎn)業(yè)集群內(nèi)知識(shí)服務(wù)模式研究[J].情報(bào)理論與實(shí)踐,2013,36(1):25-28.
[9]牛力,王為久,黃蕊,等.面向政府決策的檔案知識(shí)庫(kù)構(gòu)建研究[J].檔案學(xué)通訊,2015(4):56-60.
[10]郝琦,魏扣.檔案內(nèi)容管理及其對(duì)現(xiàn)代檔案工作的啟示[J].北京檔案,2016(5):17-20.
[11]牛力,高晨翔,韓小汀.模式與機(jī)制:知識(shí)工程視點(diǎn)下的檔案知識(shí)服務(wù)研究[J].檔案學(xué)研究,2021(2):96-103.
[12]田兵兵.從知識(shí)管理出發(fā)創(chuàng)新檔案信息資源管理策略[J].北京檔案,2021(5):36-38.
[13]錢毅.技術(shù)變遷環(huán)境下檔案對(duì)象管理空間演化初探[J].檔案學(xué)通訊,2018(2):10-14.
[14] NONAKA I.A Dynamic Theory of Organization? al Knowledge Creation[J]. Organization Science, 1994,5(1):14-37.
作者單位:1.中國(guó)人民大學(xué)信息資源管理學(xué)院2.福建福清核電有限公司信息文檔處