方錫惠
(池州市國(guó)土資源規(guī)劃勘測(cè)院,安徽 池州 247000)
當(dāng)前階段我國(guó)大力發(fā)展數(shù)據(jù)資源庫(kù),人們采用先進(jìn)的技術(shù)手段和方法獲得更多的數(shù)據(jù)資源,這使得數(shù)據(jù)的挖掘工作更加的高效準(zhǔn)確。由此數(shù)據(jù)挖據(jù)這一概念應(yīng)運(yùn)而生,數(shù)據(jù)挖據(jù)技術(shù)是一種科學(xué)化利用的分析技術(shù)手段,以某種規(guī)律化的形式將巨大的數(shù)據(jù)資源進(jìn)行分析處理,讓使用者更快速實(shí)現(xiàn)自己的需求。數(shù)據(jù)挖掘技術(shù)將多種學(xué)科理論知識(shí)進(jìn)行了結(jié)合,相互關(guān)聯(lián)的分析了數(shù)據(jù)庫(kù)中的信息,只要通過(guò)一個(gè)關(guān)鍵詞的搜索就能夠關(guān)聯(lián)出與關(guān)鍵詞相關(guān)的一系列相關(guān)的概念,這使得相關(guān)數(shù)據(jù)的挖掘更加的快捷高效。近年來(lái),數(shù)據(jù)挖掘技術(shù)在我國(guó)的發(fā)展的已經(jīng)初見(jiàn)成效,并且經(jīng)歷了從理論到實(shí)踐的整個(gè)過(guò)程,有效化的數(shù)據(jù)挖掘通過(guò)運(yùn)用科學(xué)技術(shù)得以實(shí)現(xiàn)。
常見(jiàn)的數(shù)據(jù)挖掘方法主要有以下幾種,分類分析、回歸數(shù)據(jù)挖掘,在國(guó)土資源信息化中應(yīng)用數(shù)據(jù)挖掘技術(shù)需要建立龐大的數(shù)據(jù)庫(kù)作為前提的,并且分析方法要采用專業(yè)的技術(shù)進(jìn)行分析挖掘數(shù)據(jù)。在龐大的數(shù)據(jù)庫(kù)中,有非常多的隱藏重要數(shù)據(jù)概念和規(guī)律,這就需要對(duì)這些數(shù)據(jù)進(jìn)行研究總結(jié)。進(jìn)行國(guó)土資源信息化需要有更龐大的數(shù)據(jù)庫(kù)的支撐,將相關(guān)的國(guó)土信息領(lǐng)域從大型的數(shù)據(jù)庫(kù)中挖掘出來(lái)。主要的分析方法有分析模型、分析時(shí)間、分析聚類、分析關(guān)聯(lián)和分析序列。這些分析方法都是有嚴(yán)謹(jǐn)?shù)目茖W(xué)理論知識(shí)進(jìn)行指導(dǎo)的,總結(jié)歸納出來(lái)具體的數(shù)據(jù)挖掘情況。分類分析法是找出大量數(shù)據(jù)本身具有的共同屬性進(jìn)行分類,表現(xiàn)形式通常可以通過(guò)結(jié)構(gòu)圖和決策樹(shù)進(jìn)行表現(xiàn)?;貧w模型分析以分類分析方法為基礎(chǔ),通過(guò)提供的連續(xù)預(yù)測(cè)值進(jìn)行分析數(shù)據(jù)。時(shí)間序列模式是按照時(shí)間的先后順序來(lái)進(jìn)行數(shù)據(jù)分類,根據(jù)生成數(shù)據(jù)的時(shí)間進(jìn)行排列,通過(guò)對(duì)過(guò)去連續(xù)的數(shù)據(jù)進(jìn)行科學(xué)分析,能夠更加科學(xué)的推測(cè)出未來(lái)發(fā)展的數(shù)據(jù)。聚類分析是按照固定的模式把豐富的數(shù)據(jù)進(jìn)行聚類,形成科學(xué)的數(shù)據(jù)組,并且保證每組數(shù)據(jù)都是進(jìn)行理論劃分的,從而幫助使用者更有效的獲取數(shù)據(jù)。
關(guān)于國(guó)土資源數(shù)據(jù)化綜合分析與決策系統(tǒng)(簡(jiǎn)稱決策系統(tǒng)) 的主要設(shè)計(jì)內(nèi)容由需求分析系統(tǒng)、設(shè)計(jì)系統(tǒng)、開(kāi)發(fā)實(shí)現(xiàn)系統(tǒng)、集成與測(cè)試系統(tǒng)等部分組成。 每一個(gè)部分都有各自相應(yīng)工作內(nèi)容。
系統(tǒng)分析:系統(tǒng)的需求分析必須要將相關(guān)部門對(duì)現(xiàn)有資源的管理充分的考慮進(jìn)去以及通過(guò)本系統(tǒng)的應(yīng)用。在充分調(diào)研系統(tǒng)用戶需求的基礎(chǔ)上,再對(duì)系統(tǒng)進(jìn)行需求分析。具體的系統(tǒng)分析主要包括以下幾個(gè)方面:l) 分析管理用戶業(yè)務(wù);2)用戶對(duì)系統(tǒng)功能的需求;3) 調(diào)查與分析數(shù)據(jù)源;4) 對(duì)業(yè)務(wù)流程進(jìn)行分析與建模;5) 分析系統(tǒng)界面。
設(shè)計(jì)系統(tǒng)架構(gòu)和網(wǎng)絡(luò)結(jié)構(gòu):整個(gè)信息系統(tǒng)的骨架就稱作為系統(tǒng)架構(gòu), 系統(tǒng)架構(gòu)決定了系統(tǒng)中各個(gè)邏輯組成部分,而其中的重要部分是網(wǎng)絡(luò)結(jié)構(gòu)。設(shè)計(jì)系統(tǒng)架構(gòu)要以系統(tǒng)組織的層次與組成部分的關(guān)系為基礎(chǔ), 系統(tǒng)的架構(gòu)要具備實(shí)用、靈活、可擴(kuò)展性。
子系統(tǒng)功能的設(shè)計(jì):系統(tǒng)的特點(diǎn)功能較多,必須深入分析各個(gè)部分的具體功能、并進(jìn)行規(guī)范與分類,將功能子系統(tǒng)進(jìn)行建立, 在各個(gè)功能子系統(tǒng)中融入具體功能點(diǎn),才能使用戶使用起來(lái)方便快捷。
整合數(shù)據(jù)與集成設(shè)計(jì):由于國(guó)土資源數(shù)據(jù)的特點(diǎn)是多源性、多格式,因此,在系統(tǒng)建設(shè)中整合和集成這些大數(shù)量、多樣、同時(shí)具備定量和定性特點(diǎn)的數(shù)據(jù)是十分重要的內(nèi)容。在將數(shù)據(jù)庫(kù)的概念體系結(jié)構(gòu)進(jìn)行確定之后, 整合和集成數(shù)據(jù)的設(shè)計(jì)過(guò)程成為了大型數(shù)據(jù)庫(kù)構(gòu)建中最難的內(nèi)容。在具體設(shè)計(jì)過(guò)程中會(huì)遇到諸多的技術(shù)難點(diǎn),必須將這些問(wèn)題通過(guò)科學(xué)的集成方法和技術(shù)解決好。
組織數(shù)據(jù)與設(shè)計(jì)管理:國(guó)土資源數(shù)據(jù)的特點(diǎn)是非常復(fù)雜十分龐大數(shù)據(jù),因此,國(guó)土資源數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)是非常有必要的。通過(guò)建設(shè)的流程與方法,針對(duì)國(guó)土資源數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)采用設(shè)計(jì)概念、設(shè)計(jì)邏輯和物理設(shè)計(jì)共同完成設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)。
可視化分析表達(dá)設(shè)計(jì):利用最新的可視化表達(dá)技術(shù),針對(duì)數(shù)據(jù)七個(gè)主題中的特點(diǎn),進(jìn)行可視化分析和表達(dá)方式的設(shè)計(jì),最終展現(xiàn)給用戶的是以文字、圖表、地圖、報(bào)表等多種形式的內(nèi)容,從而更好的為管理決策部門提供科學(xué)的決策功能。
通過(guò)系統(tǒng)分析國(guó)土資源數(shù)據(jù),從整體上對(duì)國(guó)土資源的有效性及數(shù)據(jù)挖掘的程度進(jìn)行把握,從總體角度出發(fā)進(jìn)行系統(tǒng)需求分析,通過(guò)對(duì)數(shù)據(jù)進(jìn)行不同流程設(shè)計(jì)以及綜合歸納將系統(tǒng)設(shè)計(jì)出來(lái)。由于國(guó)土資源系統(tǒng)的數(shù)據(jù)比較龐大,就需要將子系統(tǒng)建立起來(lái),將數(shù)據(jù)的分類進(jìn)行細(xì)化,從而更有效的利用數(shù)據(jù)系統(tǒng)。國(guó)土資源數(shù)據(jù)需要進(jìn)行綜合性的整合分析,在分析有規(guī)律數(shù)據(jù)的基礎(chǔ)上,才能將數(shù)據(jù)資源從綜合形態(tài)上利用好,將有效資源挖掘出來(lái),進(jìn)而建立綜合性強(qiáng)的國(guó)土資源信息化系統(tǒng)。要從不同的應(yīng)用形式進(jìn)行綜合分析,提供的系統(tǒng)要有每一種形式對(duì)應(yīng)的數(shù)據(jù),才能將國(guó)土資源信息化有效發(fā)展起來(lái)。
綜上所述,歷經(jīng)了數(shù)十年數(shù)據(jù)挖掘技術(shù)的發(fā)展,主要技術(shù)涉及到數(shù)據(jù)、人工智能、決策樹(shù)、統(tǒng)計(jì)分析等,在大型數(shù)據(jù)倉(cāng)庫(kù)和OLAP 系統(tǒng)中已經(jīng)集成了這些技術(shù)。未來(lái)還要繼續(xù)在國(guó)土資源信息化中應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù), 這樣才能更加深入的推進(jìn)國(guó)土資源信息化發(fā)展。