楊國玲
(煙臺市技術(shù)監(jiān)督信息研究所,山東 煙臺 264000)
隨著科技不斷發(fā)展,計算機(jī)網(wǎng)絡(luò)技術(shù)日趨成熟,但檔案管理對象也在逐步增加,因此要建立完善的檔案管理系統(tǒng)。檔案信息是大數(shù)據(jù)信息,要使檔案管理信息系統(tǒng)建設(shè)的更加完善,最重要的一點(diǎn)就是對大數(shù)據(jù)進(jìn)行處理與挖掘,利用計算機(jī)數(shù)據(jù)能夠有效落實(shí)此項任務(wù),使檔案管理實(shí)現(xiàn)數(shù)據(jù)優(yōu)化,進(jìn)而能夠在協(xié)同工作服務(wù)器與文件共享系統(tǒng)設(shè)計中得到良好應(yīng)用。因此對基于大數(shù)據(jù)的計算機(jī)數(shù)據(jù)挖掘技術(shù)進(jìn)行深入研究,對檔案管理系統(tǒng)提高處理能力與檢索能力有積極促進(jìn)作用。
以大數(shù)據(jù)為基礎(chǔ)實(shí)現(xiàn)的計算機(jī)數(shù)據(jù)挖掘技術(shù)是目前最新研發(fā)的數(shù)據(jù)處理技術(shù),能夠在海量的數(shù)據(jù)中甄別相關(guān)數(shù)據(jù)。而且對計算機(jī)數(shù)據(jù)進(jìn)行挖掘是一個復(fù)雜過程,需要循環(huán)往復(fù)、周而復(fù)始,如果在海量的數(shù)據(jù)中沒有找到相關(guān)數(shù)據(jù),那么計算機(jī)數(shù)據(jù)挖掘處理系統(tǒng)就會重新進(jìn)行搜索,直到相關(guān)數(shù)據(jù)被找到。通過對目標(biāo)進(jìn)行細(xì)化,能夠滿足檔案管理系統(tǒng)對于數(shù)據(jù)的實(shí)際需求。
檔案分為很多種,包括圖片檔案、文字檔案等等,需要對這些資料進(jìn)行有效保護(hù),而且檔案越珍貴,相關(guān)人員就越要引起重視,要對其進(jìn)行妥善保存。隨著時間推移,檔案所具備的價值屬性也會不斷增加,檔案價值越高,越是容易被頻繁查詢。但查詢也要有一個度,如果過于頻繁,不但會對檔案資料造成損壞,還會減少其使用周期,對保存工作來說必然會增加難度。不僅如此,一些檔案屬于機(jī)密文件,如果在查詢時沒有進(jìn)行嚴(yán)格監(jiān)管,那么就會導(dǎo)致相關(guān)信息出現(xiàn)泄露等問題?;诖耍瑢n案進(jìn)行保存和使用都要遵循安全原則,將大數(shù)據(jù)的計算機(jī)數(shù)據(jù)挖掘技術(shù)與檔案管理系統(tǒng)相結(jié)合,能夠?qū)n案進(jìn)行完整保護(hù),而且不會對使用造成任何影響,使檔案信息更加安全。
將基于大數(shù)據(jù)的計算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用到檔案管理系統(tǒng)中,能夠避免過去檔案管理存在的弊端,通過此項技術(shù)的應(yīng)用,可以讓工作人員在處理信息時更加便捷、更加高效,而且會縮短時間成本。在檔案管理中,鑒定檔案是一項重要工作,在過去一般是以工作人員實(shí)際工作經(jīng)驗為基礎(chǔ)對檔案進(jìn)行相關(guān)鑒定,如果在工作中出現(xiàn)偏差會造成檔案價值大打折扣。通過應(yīng)用大數(shù)據(jù)計算機(jī)數(shù)據(jù)挖掘技術(shù),工作人員可以通過計算機(jī)系統(tǒng)對檔案進(jìn)行分析并了解相關(guān)保存情況,這樣會使鑒定工作更加科學(xué)、更加準(zhǔn)確。
在對檔案進(jìn)行管理時,最基礎(chǔ)的工作就是要對不同的檔案進(jìn)行分門別類。在過去對檔案進(jìn)行分類時,不但會消耗一定人力、物力以及時間成本,工作效率難以提升。但通過應(yīng)用大數(shù)據(jù)計算機(jī)數(shù)據(jù)挖掘技術(shù),能夠在一定時間區(qū)域內(nèi)根據(jù)相關(guān)規(guī)則對不同數(shù)據(jù)進(jìn)行整理與分類,使工作效率得到顯著提高,基于大數(shù)據(jù)的計算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案分類管理中工作流程如下:
在海量數(shù)據(jù)中,根據(jù)實(shí)際需求對相關(guān)數(shù)據(jù)進(jìn)行整合,使之成為訓(xùn)練集,并將其與沒有甄別的檔案數(shù)據(jù)進(jìn)行歸納,這樣能夠讓管理人員根據(jù)數(shù)據(jù)查詢?nèi)藛T對檔案信息實(shí)際需求進(jìn)行檔案分類,而且還能夠根據(jù)以往閱讀數(shù)據(jù)提供相應(yīng)的檔案信息,這樣會使數(shù)據(jù)分析更具針對性,能夠縮短查詢?nèi)藛T獲取檔案時間,使檔案數(shù)據(jù)能夠得到充分利用,使其價值得到充分顯現(xiàn)。
基于大數(shù)據(jù)的計算機(jī)數(shù)據(jù)挖掘技術(shù)能夠以檔案管理中內(nèi)部數(shù)據(jù)庫為基礎(chǔ)對信息數(shù)據(jù)進(jìn)行準(zhǔn)確掃描,并構(gòu)建與之匹配的數(shù)據(jù)模型。通過對數(shù)據(jù)模型和計算機(jī)數(shù)據(jù)樣本進(jìn)行比對,能夠找出二者間的差異,若數(shù)據(jù)模型能夠與計算機(jī)數(shù)據(jù)樣本相吻合,那么檔案管理人員就要以測試樣本模型為基礎(chǔ)對檔案信息實(shí)施分類。要想讓計算機(jī)數(shù)據(jù)挖掘技術(shù)能夠在檔案管理系統(tǒng)中有更好應(yīng)用,就要對檔案數(shù)據(jù)信息進(jìn)行全面、細(xì)致的分析,對已經(jīng)分析過的數(shù)據(jù)進(jìn)行概念模型描述,將概念模型和測試樣本進(jìn)行比對,若其中一個模型能夠通過測試,那么就表示檔案管理系統(tǒng)中所有數(shù)據(jù)信息能夠在檔案收集管理中得到良好應(yīng)用。
綜上所述,隨著我國經(jīng)濟(jì)不斷發(fā)展,科學(xué)技術(shù)水平較之前也有較大提升,在新時期下,將基于大數(shù)據(jù)的計算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用到檔案管理系統(tǒng)中,是科技發(fā)展必然趨勢,不但能夠讓檔案信息管理工作效率得到顯著提升,還能讓檔案管理得到更廣闊的發(fā)展空間。除了可以在檔案管理系統(tǒng)中對相關(guān)數(shù)據(jù)進(jìn)行查詢,并使數(shù)據(jù)信息得到保存,還能夠?qū)τ嬎銠C(jī)數(shù)據(jù)挖掘技術(shù)進(jìn)行整合,讓不同檔案管理服務(wù)數(shù)據(jù)形成聯(lián)動機(jī)制,使檔案信息管理為相關(guān)工作人員提供更為優(yōu)質(zhì)的查詢服務(wù)。