邢蕾
(遼寧公安司法管理干部學(xué)院(遼寧政法職業(yè)學(xué)院),遼寧 沈陽(yáng) 110161)
“大數(shù)據(jù)技術(shù)”意味著在當(dāng)前這個(gè)信息化的時(shí)代,人們的工作和生活被各種網(wǎng)絡(luò)信息和資源信息包圍著,人們的生活因此發(fā)生了巨大的變化,而這樣的變化在一定程度上促進(jìn)了社會(huì)的進(jìn)步和發(fā)展。檔案數(shù)據(jù)挖掘作為大數(shù)據(jù)技術(shù)的重要部分,在對(duì)檔案數(shù)據(jù)的管理上發(fā)揮著重要作用,在信息化管理的影響下,對(duì)檔案的管理更加的精準(zhǔn)有序,數(shù)據(jù)檢索更加全面、具體,搜索結(jié)果更加優(yōu)質(zhì),實(shí)現(xiàn)智能化的數(shù)據(jù)挖掘成為了發(fā)展的目標(biāo)和可能。
隨著社會(huì)的不斷發(fā)展,互聯(lián)網(wǎng)時(shí)代悄然來(lái)臨,信息技術(shù)隨著人們需求的增加越來(lái)越多的被應(yīng)用在人們的工作和生活中,給人們的生活帶來(lái)了極大的便利。而隨著互聯(lián)網(wǎng)技術(shù)的不斷更新和發(fā)展,人們對(duì)其也產(chǎn)生了越來(lái)越多的依賴(lài),互聯(lián)網(wǎng)技術(shù)從在工作中的應(yīng)用到學(xué)習(xí)上的應(yīng)用,逐漸發(fā)展為生活閑暇中的“樂(lè)趣”。網(wǎng)絡(luò)技術(shù)似乎越來(lái)越好的融入在人們的生活中,成為了人們生活不可缺少的一部分。
在大數(shù)據(jù)技術(shù)的發(fā)展下,也展現(xiàn)著其專(zhuān)有的基本特征:其有龐大的數(shù)據(jù)庫(kù),在當(dāng)前信息化的管理下,越來(lái)越豐富的信息被收集并按照不同的類(lèi)別被整理和存放在相應(yīng)的系統(tǒng)中;同時(shí),在信息技術(shù)發(fā)展的當(dāng)下,呈現(xiàn)出的信息內(nèi)容也是多種多樣的,在生活的不同領(lǐng)域的各種信息都逐漸被收集和保存在數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)數(shù)據(jù)信息的多樣化;隨著信息技術(shù)的發(fā)展,不同行業(yè)的人們的生活和工作以信息數(shù)據(jù)的形式被保存在數(shù)據(jù)庫(kù)中,使關(guān)于這些信息內(nèi)容的收集和處理更加方便,大數(shù)據(jù)技術(shù)在一定程度上實(shí)現(xiàn)了其較高的的價(jià)值;大數(shù)據(jù)技術(shù)的高效性是最直觀(guān)的發(fā)展特征,它使人們?cè)谶M(jìn)行數(shù)據(jù)檢索時(shí)更加高效的找到滿(mǎn)足自己需求的內(nèi)容。
檔案數(shù)據(jù)挖掘技術(shù)是從事數(shù)據(jù)管理工作時(shí)的一項(xiàng)十分重要的數(shù)據(jù)處理方式,這種技術(shù)區(qū)別于以往的檢索技術(shù),在時(shí)間和精力的投入上得到了一定程度的減少,工作人員在進(jìn)行檔案管理工作時(shí)可以更快的得到最合適的數(shù)據(jù)內(nèi)容。在當(dāng)前這個(gè)信息化的時(shí)代,網(wǎng)絡(luò)資源和網(wǎng)絡(luò)信息被普遍應(yīng)用在檔案管理工作上,給人們帶來(lái)了更多的樂(lè)趣的同時(shí)給工作人員的工作也帶來(lái)了極大的便利,很大程度上得到了工作效率的提高。
就目前的情況來(lái)看,雖然信息挖掘技術(shù)在檔案數(shù)據(jù)檢索工作中起到了很大的效用,解決掉了工作中出現(xiàn)的許多困難,但總的來(lái)說(shuō)信息挖掘技術(shù)是十分繁瑣和復(fù)雜的,建立合適的數(shù)學(xué)模型是十分必要的。只有建立起合適的數(shù)學(xué)模型,工作人員才能夠?qū)⒐ぷ黜樌倪M(jìn)行下去,對(duì)數(shù)據(jù)做到合適的處理。同時(shí),由于檔案數(shù)據(jù)庫(kù)在數(shù)據(jù)挖掘技術(shù)的作用下越來(lái)越龐大,數(shù)據(jù)檢索中可能出現(xiàn)小問(wèn)題的可能性就越來(lái)越高,所以說(shuō)數(shù)據(jù)挖掘技術(shù)不能保證做到盡善盡美。從給用戶(hù)帶來(lái)便利的角度看,檔案數(shù)據(jù)挖掘相比于傳統(tǒng)的數(shù)據(jù)管理更加注重用戶(hù)的體驗(yàn)感,在一定程度上提高了對(duì)用戶(hù)需求的關(guān)注。
在信息化的時(shí)代,大數(shù)據(jù)技術(shù)的應(yīng)用與人們的生活越來(lái)越密不可分。它不僅可以根據(jù)用戶(hù)提出的要求自動(dòng)的在數(shù)據(jù)庫(kù)中挑選最合適的數(shù)據(jù),幫助用戶(hù)最大程度地解決問(wèn)題,同時(shí)在日常的檢索工作中,它可以按照不同用戶(hù)提出的檢索需求進(jìn)行統(tǒng)計(jì)和分類(lèi),合理分析用戶(hù)工作的同時(shí)還可以分析用戶(hù)之間的聯(lián)系,并根據(jù)聯(lián)系給出需求推出最符合需求的信息內(nèi)容。同時(shí),在進(jìn)行檢索工作的“日積月累”中,系統(tǒng)會(huì)對(duì)用戶(hù)檢索過(guò)的或提出的信息進(jìn)行保存,并根據(jù)實(shí)際內(nèi)容進(jìn)行系統(tǒng)的分類(lèi),這樣的方式不僅使系統(tǒng)信息更加清晰有序,還能在一定程度上提高工作效率
大數(shù)據(jù)的檔案數(shù)據(jù)挖掘系統(tǒng)主要包括關(guān)聯(lián)規(guī)則挖掘、分類(lèi)和聚類(lèi)三部分:
就關(guān)聯(lián)規(guī)則來(lái)看,其實(shí)主要就是對(duì)用戶(hù)信息進(jìn)行系統(tǒng)的處理和整合,并根據(jù)已得到的用戶(hù)信息分析用戶(hù)的個(gè)人情況,對(duì)數(shù)據(jù)庫(kù)的管理和工作的高效進(jìn)行都有著一定的作用。關(guān)聯(lián)規(guī)則挖掘?qū)τ谄髽I(yè)的一大幫助在于它可以根據(jù)對(duì)潛在用戶(hù)的情況結(jié)合以往的檢索經(jīng)驗(yàn)分析,更加準(zhǔn)確的掌握用戶(hù)的需求,從而為客戶(hù)提供更好的服務(wù),為客戶(hù)最佳的體驗(yàn)。
與以往的檔案管理系統(tǒng)不同的是,檔案數(shù)據(jù)挖掘技術(shù)可以根據(jù)用戶(hù)的需求對(duì)使用群眾進(jìn)行一定的劃分,通過(guò)以往的檢索歷史和使用人群的檢索條件的不同更加精確將用戶(hù)分為不同的類(lèi)別。通過(guò)對(duì)檢索客戶(hù)的分類(lèi),在進(jìn)行檔案管理工作時(shí),工作人員可以更加清晰準(zhǔn)確的了解客戶(hù)的情況和數(shù)據(jù),并根據(jù)這些信息進(jìn)行一定的處理和整合,為之后工作人員的使用和用戶(hù)的體驗(yàn)都帶來(lái)極大的便利。
除了關(guān)聯(lián)規(guī)則挖掘和分類(lèi)之外,聚類(lèi)數(shù)據(jù)挖掘技術(shù)也是常常應(yīng)用在檔案管理工作中的一項(xiàng)技術(shù)。其因?yàn)檩^高的準(zhǔn)確度深受工作人員的喜愛(ài),被廣泛應(yīng)用在檔案管理工作中。就當(dāng)前的應(yīng)用現(xiàn)狀來(lái)看,分層聚類(lèi)算法在原本分割聚類(lèi)算法的基礎(chǔ)上做了一定的改善工作,留存了其一定的優(yōu)勢(shì)的同時(shí)也有效的解決了分割聚類(lèi)的一些不足之處,對(duì)檔案管理工作和人們的使用帶來(lái)了雙向的便利。
就大數(shù)據(jù)庫(kù)的應(yīng)用現(xiàn)狀來(lái)看,檔案數(shù)據(jù)挖掘技術(shù)主要分為庫(kù)存管理檔案數(shù)據(jù)挖掘和空間檔案數(shù)據(jù)挖掘:
由于相較于傳統(tǒng)的檔案管理技術(shù)來(lái)看,庫(kù)存管理檔案數(shù)據(jù)挖掘技術(shù)自身有著簡(jiǎn)便、細(xì)致的工作特點(diǎn),不僅可以高效完成清點(diǎn)數(shù)據(jù)信息和統(tǒng)計(jì)信息的工作,還可以在一定程度上提高工作的精準(zhǔn)度,被許多檔案管理工作者所使用。同時(shí)庫(kù)存管理技術(shù)還可以將檢索的數(shù)據(jù)信息自動(dòng)地保存在系統(tǒng)中,對(duì)之后的使用也帶來(lái)很大便利。
相較于庫(kù)存管理檔案數(shù)據(jù)挖掘來(lái)說(shuō),空間檔案數(shù)據(jù)挖掘技術(shù)還是一項(xiàng)“年輕”的技術(shù),由于剛開(kāi)發(fā)不久,技術(shù)本身系統(tǒng)還不成熟,所以并沒(méi)有庫(kù)存管理檔案數(shù)據(jù)挖掘技術(shù)應(yīng)用廣泛,但是其自身的獨(dú)特性可以幫助用戶(hù)處理空間信息,對(duì)出現(xiàn)的問(wèn)題進(jìn)行有效解決。然而正因?yàn)槠洫?dú)特性,它需要更多的外在條件進(jìn)行依附,包括大數(shù)據(jù)庫(kù)和空間可視地圖,所以對(duì)其技術(shù)本身有著更高的要求。從另一方面看,空間檔案數(shù)據(jù)挖掘的發(fā)展和應(yīng)用前景是非常不錯(cuò)的,在一定的進(jìn)步和改善后必將被廣泛應(yīng)用于工作和工作中。
在檔案管理工作中對(duì)檔案數(shù)據(jù)進(jìn)行采集是工作任務(wù)的第一步,要想減少在管理工作中出現(xiàn)錯(cuò)誤的可能性,有效采集檔案數(shù)據(jù)是必不可少的。而就當(dāng)前的發(fā)展現(xiàn)狀來(lái)看,大數(shù)據(jù)技術(shù)是實(shí)現(xiàn)這個(gè)先決條件的唯一技術(shù),它不僅可以挖掘出檔案背后的所有隱藏信息,還能夠通過(guò)用戶(hù)的需求進(jìn)行采取,從而使篩選結(jié)果更加精確。
采集之后就是整理工作了,由于數(shù)據(jù)信息繁雜又相似的特點(diǎn),檔案整理工作人員的工作壓力是十分重大的,大數(shù)據(jù)技術(shù)在一定程度上解決了這個(gè)問(wèn)題。其在檔案整理工作中的應(yīng)用不僅可以讓工作處理更加方便高效,還能對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化保存,在極大程度上改善了工作中的數(shù)據(jù)丟失問(wèn)題,實(shí)現(xiàn)了數(shù)據(jù)管理層的優(yōu)化管理。
不同的檔案數(shù)據(jù)有著不同的內(nèi)容和特點(diǎn),有相似之處但又不同,保存其獨(dú)特性的同時(shí)又有著必要的聯(lián)系,所以在從事檔案管理工作時(shí)對(duì)檔案數(shù)據(jù)的分析是必不可少的,但同時(shí)分析起來(lái)又是十分困難的。就數(shù)據(jù)的表面現(xiàn)象來(lái)看,可能發(fā)現(xiàn)并分析檔案之間的聯(lián)系是一件很難的事,大數(shù)據(jù)技術(shù)的應(yīng)用可以幫助系統(tǒng)檢索檔案更加精確的信息,從而發(fā)現(xiàn)數(shù)據(jù)的相關(guān)聯(lián)系,發(fā)揮數(shù)據(jù)信息的最大效用,進(jìn)行更加具體的分析,讓這些分析出的信息得到最好的利用。
檔案數(shù)據(jù)的展示階段是將數(shù)據(jù)信息直接展示給用戶(hù)的階段,也是發(fā)揮其效用最直接的階段,所以對(duì)整個(gè)檔案管理工作都是十分重要的。將大數(shù)據(jù)技術(shù)應(yīng)用在管理層可以實(shí)現(xiàn)更加完善的管理系統(tǒng),從而完成良好的檔案管理任務(wù)和工作。大數(shù)據(jù)技術(shù)的應(yīng)用不僅可以使用戶(hù)在使用時(shí)更加快速得檢索自己所需得信息內(nèi)容,還在一定程度上減小出現(xiàn)問(wèn)題的可能,為人們的生活帶來(lái)極大便利。
總的來(lái)說(shuō),在信息化時(shí)代的發(fā)展下,大數(shù)據(jù)時(shí)代迎來(lái)了更多的發(fā)展,給人們的生活帶來(lái)了許多歡樂(lè),給人們的工作帶來(lái)了極大便利,大數(shù)據(jù)技術(shù)下的檔案數(shù)據(jù)挖掘技術(shù)在工作和生活的應(yīng)用中越來(lái)越貼合人們的需求。不管是大數(shù)據(jù)技術(shù)還是檔案數(shù)據(jù)挖掘技術(shù)都已經(jīng)成為了人們生活工作中不可或缺的一部分。在之后的生產(chǎn)工作中要更多地對(duì)其進(jìn)行發(fā)展和改善,從而為人們提供更好的服務(wù)。