董彥卓
【摘要】本篇文章主要是思考了在數(shù)字檔案中如何做到在檔案中發(fā)現(xiàn)知識(shí)而且利用知識(shí)服務(wù)社會(huì),眾所周知,檔案是信息資源,無(wú)論是傳統(tǒng)的檔案還是數(shù)字化檔案,都有著豐富的信息資源,而人們要做的就是能夠充分的利用檔案中的資源,為自己或者是為社會(huì)服務(wù)。但是人們利用檔案信息的現(xiàn)狀是,還不能發(fā)現(xiàn)檔案信息現(xiàn)存的知識(shí),也不能做好知識(shí)服務(wù)。下面我國(guó)就檔案中的知識(shí)發(fā)現(xiàn)以及知識(shí)服務(wù)進(jìn)行探討。
【關(guān)鍵詞】數(shù)字化檔案;知識(shí)發(fā)現(xiàn);知識(shí)服務(wù)
現(xiàn)階段,我國(guó)正在開展檔案信息化建設(shè),而建設(shè)是在我國(guó)現(xiàn)有的檔案基礎(chǔ)上進(jìn)行的,其特點(diǎn)是擁有大量的信息資源。因?yàn)閲?guó)家進(jìn)行檔案信息建設(shè),因此人們對(duì)于檔案的管理以及服務(wù)的方式都增多。整個(gè)社會(huì)在建設(shè)檔案的時(shí)候,都是為了能夠?qū)崿F(xiàn)信息資源共享這個(gè)目標(biāo),而在這個(gè)目標(biāo)的指引下,建設(shè)進(jìn)程一直在進(jìn)行,并且不斷的在實(shí)現(xiàn)目標(biāo)。
一、知識(shí)服務(wù)是數(shù)字檔案信息服務(wù)的瓶頸
檔案信息化建設(shè)對(duì)檔案信息的廣泛利用提供了強(qiáng)有力的管理和服務(wù)手段,用戶利用網(wǎng)絡(luò)信息查詢技術(shù)可以比較快速和準(zhǔn)確的得到所需要的有價(jià)值的檔案信息,數(shù)字檔案信息資源的海量性和用戶利用檔案的專題性的矛盾得到一定程度的緩解。但是,用戶若要根據(jù)自身的工作性質(zhì)和信息需求,從浩如煙海的數(shù)字檔案信息資源中,獲取所需要的基于內(nèi)容和解決方案的知識(shí)服務(wù)則缺乏相應(yīng)的技術(shù)支持。用戶得到的信息還存在冗余性和離散性,數(shù)字檔案信息利用結(jié)果并不能完全滿足用戶的最終需求。換句話說,面對(duì)不斷增加如潮水般的數(shù)字信息,人們將不再滿足于數(shù)據(jù)庫(kù)的查詢功能,而是需要的是從數(shù)字檔案中得到有用的信息或者知識(shí)為決策服務(wù)。
二、知識(shí)發(fā)現(xiàn)與知識(shí)服務(wù)的相關(guān)概念分析
(一)知識(shí)發(fā)現(xiàn) 最早出現(xiàn)信息發(fā)信這一詞是在1989年,那年在美國(guó)底特律有一個(gè)國(guó)際學(xué)術(shù),而知識(shí)發(fā)現(xiàn)就是在這個(gè)會(huì)議上提出的。六年后,在加拿大也有個(gè)相同的會(huì)議,對(duì)這個(gè)概念做出進(jìn)一步的闡釋。但是人們普遍認(rèn)為知識(shí)發(fā)現(xiàn)這個(gè)概念是由學(xué)者Fayyad提出的,提出時(shí)間是1996年。很多人都覺得知識(shí)發(fā)現(xiàn)就是從檔案中找到可利用的知識(shí),而檔案中的知識(shí)有基本都是數(shù)據(jù),因此要將數(shù)據(jù)轉(zhuǎn)化成知識(shí),然后從中找到有價(jià)值的,可以被人們利用的知識(shí)。其實(shí)知識(shí)發(fā)信就是一個(gè)轉(zhuǎn)化的過程,就是將數(shù)據(jù)變?yōu)槿藗冃枰闹R(shí),然后利用知識(shí)為人們提供決策?,F(xiàn)在知識(shí)發(fā)現(xiàn)以及數(shù)據(jù)挖掘共有三種關(guān)系可以供人參考,一種是挖掘是發(fā)現(xiàn)的前提,只是一個(gè)步驟,而這一過程還有七個(gè)小步驟,包括對(duì)數(shù)據(jù)的清理、綜合、挑選以及轉(zhuǎn)換等等,這種觀點(diǎn)完全的將知識(shí)發(fā)現(xiàn)以及服務(wù)分開,而且認(rèn)為挖掘只是發(fā)現(xiàn)過程中的一部分。第二種認(rèn)為兩者的關(guān)系的相同的,任何時(shí)間都可以將兩者混為一體。第三種關(guān)系是說,發(fā)現(xiàn)知識(shí)是挖掘數(shù)據(jù)的延續(xù)。
(二)知識(shí)服務(wù) 知識(shí)服務(wù)這一觀念的提出要比發(fā)現(xiàn)知識(shí)要晚,是在1999年一篇論文中提出的,論文的作者是任俊為。知識(shí)服務(wù)的重點(diǎn)是服務(wù),而且是利用信息服務(wù),在開展服務(wù)的前提就是能夠豐富的信息資源去支持服務(wù),而且在服務(wù)的時(shí)候,也要使用一定的技術(shù),包括智能技術(shù),這樣可以幫助人們?cè)诒姸嗟男畔①Y源中,找到有效的信息。從這種觀念中,我們可以看出來(lái),知識(shí)服務(wù)是信息服務(wù)的發(fā)展。但是,現(xiàn)階段,人們對(duì)知識(shí)服務(wù)的觀念有不同的看法,一部分人認(rèn)為,知識(shí)服務(wù)是為需要的人提供有用的信息資源,將信息提取、重組任何開發(fā)服務(wù)。就是按照知識(shí)的內(nèi)容而服務(wù)。而另外一部分人認(rèn)為,知識(shí)服務(wù)是利用知識(shí)應(yīng)用,然后創(chuàng)新的過程。
三、數(shù)字檔案管理中的知識(shí)發(fā)現(xiàn)與知識(shí)服務(wù)的一般模式
(一)數(shù)字檔案信息空間 開展數(shù)字檔案管理中的知識(shí)服務(wù),首先要明確數(shù)字檔案信息空間的概念。數(shù)字檔案信息空間是宏觀信息空間中的子空間,是由數(shù)字檔案數(shù)據(jù)空間、軟件空間、硬件空間、時(shí)間空間、技術(shù)空間、網(wǎng)絡(luò)空間和服務(wù)空間等構(gòu)成的空間集合。信息空間概念的運(yùn)用始于對(duì)計(jì)算機(jī)應(yīng)用系統(tǒng)的描述。對(duì)計(jì)算機(jī)應(yīng)用系統(tǒng)而言,信息是對(duì)客觀事物運(yùn)動(dòng)過程的描述,數(shù)據(jù)則是對(duì)信息的編碼。應(yīng)用系統(tǒng)運(yùn)行過程中,系統(tǒng)的功能和信息管理是通過對(duì)數(shù)據(jù)的加工和處理來(lái)完成的。這時(shí),包括硬件、軟件和數(shù)據(jù)在內(nèi)的計(jì)算機(jī)系統(tǒng)構(gòu)成一個(gè)完整的信息空間。
(二)數(shù)字檔案信息空間組織模式 數(shù)字檔案信息空間的組織模式是指系統(tǒng)的運(yùn)行環(huán)境、內(nèi)部結(jié)構(gòu)以及相互間的關(guān)系模式。數(shù)字檔案信息空間的構(gòu)建應(yīng)當(dāng)結(jié)合數(shù)字檔案與知識(shí)服務(wù)的特點(diǎn),構(gòu)建網(wǎng)絡(luò)體系、數(shù)據(jù)管理體系、應(yīng)用和服務(wù)體系、標(biāo)準(zhǔn)體系和安全體系等,從而構(gòu)成一個(gè)高效運(yùn)行的有機(jī)整體。一般說來(lái),數(shù)字檔案信息空間應(yīng)當(dāng)包括數(shù)據(jù)管理空間、網(wǎng)絡(luò)應(yīng)用空間、知識(shí)服務(wù)空間三個(gè)組成部分。
(三)基于數(shù)字檔案信息空間的知識(shí)服務(wù)系統(tǒng) ⒈數(shù)字化管理。數(shù)字信息轉(zhuǎn)換的主要功能是將經(jīng)過加工處理的各類非結(jié)構(gòu)化數(shù)字信息轉(zhuǎn)換成能被數(shù)據(jù)庫(kù)管理系統(tǒng)進(jìn)行處理的結(jié)構(gòu)化數(shù)字信息。這個(gè)功能主要是由數(shù)字檔案管理系統(tǒng)的數(shù)字檔案信息導(dǎo)入功能加以實(shí)現(xiàn)的。數(shù)字信息存取的主要功能是建立數(shù)字檔案信息數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和相關(guān)鏈接,建立檔案信息資源組織體系,實(shí)現(xiàn)檔案信息資源的集成、組織、存儲(chǔ)、更新與管理。⒉知識(shí)服務(wù)。知識(shí)服務(wù)需要在數(shù)字管理上進(jìn)行,而且數(shù)字檔案可以按照自身的種類該分類,并且知道用戶需要的信息,在分類的時(shí)候,為用戶提供服務(wù)。數(shù)字化檔案的體系可以有以下4種分類,一種是資源分類;第二種是為用戶建立模型;第三種是處理反饋信息;第四種是知識(shí)推薦。資源分類是將整體的信息資源分成若干個(gè)部分,每個(gè)部分要有順序以保證能夠提供更多的信息,使其成為信息建設(shè)的基礎(chǔ)。建立模型,主要是以用戶的喜好為主,這樣可以保證能夠方便開展知識(shí)服務(wù)。反饋處理,主要是處理用戶在接受服務(wù)所反饋的信息,包括評(píng)價(jià)等等。然后根據(jù)反饋信息重新改正,以保證為用戶推送的信息都能夠滿足用戶需要。知識(shí)服務(wù)中需要包括三個(gè)部分,一個(gè)是系統(tǒng)管理;一個(gè)是對(duì)信息的數(shù)字化管理;還有一個(gè)就是知識(shí)服務(wù)。這三個(gè)部分是相互支撐的,共同發(fā)展的關(guān)系。
四、結(jié)束語(yǔ)
本篇文章主要是研究了數(shù)字檔案中的知識(shí)發(fā)現(xiàn)與服務(wù),是眾多同類型研究的一部分,由于資料有限,本次的研究還有不足,而且還有一些問題沒有解決,例如技術(shù)方面的缺陷等。但是我國(guó)的計(jì)算機(jī)技術(shù)水平在不斷的進(jìn)步,而對(duì)數(shù)字檔案的研究也會(huì)加深。檔案中有著豐富的資源對(duì)其進(jìn)行研究,可以使一些隱藏的資源被發(fā)現(xiàn),而且還能成為促進(jìn)社會(huì)發(fā)展的動(dòng)力,因此為了能夠挖掘更多的資源,希望大家重視數(shù)字檔案的研究,提高知識(shí)服務(wù)水平,開創(chuàng)新的服務(wù)模式。
參考文獻(xiàn)
[1]沈雙潔.數(shù)字檔案館項(xiàng)目風(fēng)險(xiǎn)識(shí)別和分析研究[D].南京大學(xué),2013年
[2]溫獻(xiàn)英.數(shù)字檔案館信息資源國(guó)家控制力研究[D].湘潭大學(xué),2011年
[3]張佳麗.數(shù)字檔案館建設(shè)對(duì)檔案工作的影響及其調(diào)試對(duì)策研究[D].黑龍江大學(xué),2011年
[4]姚紅葉.信息生態(tài)視閾下數(shù)字檔案館信息服務(wù)研究[D].南昌大學(xué),2012年