姜丹
數(shù)據(jù)挖掘主要是致力于數(shù)據(jù)分析理解方面,根據(jù)數(shù)據(jù)內(nèi)部本身所隱藏的技術(shù)性相關(guān)知識來探索未來科技的發(fā)展。經(jīng)過我國科學技術(shù)的發(fā)展和數(shù)十年來的不懈努力,數(shù)據(jù)挖掘形成了很多的不同概念,同時概念上的明確也令它朝更深的方向發(fā)展。本文主要通過研究數(shù)據(jù)挖掘在智慧園區(qū)中的應用,更加具體的分析我國在數(shù)據(jù)挖掘和智慧園方面的發(fā)展。
前言:數(shù)據(jù)挖掘是一個多種學科交叉的研究領(lǐng)域,它融合了技術(shù)、方法、統(tǒng)計、信息等多種方面的研究成果。結(jié)合智慧園區(qū)的發(fā)展,對數(shù)據(jù)挖掘在智慧園區(qū)中的實際應用進行了詳細的分析。同時通過結(jié)合數(shù)據(jù)挖掘的理論和智慧園發(fā)展的情況,進一步分析闡述數(shù)據(jù)源在智慧園區(qū)中的應用和發(fā)展。
一、對數(shù)據(jù)挖掘
(一)什么是數(shù)據(jù)挖掘
所謂數(shù)據(jù)挖掘,主要是指通過某種技術(shù)手段,對已有信息進行快速處理,并從大量的信息當中挖掘出有用信息的過程。從另一個角度來講,數(shù)據(jù)挖掘就是指從繁雜的數(shù)據(jù)庫當中,提取對人們生活最有用的信息。我國經(jīng)濟快速發(fā)展帶動科學技術(shù)的進步,目前信息化時代已經(jīng)來臨,為了使各個領(lǐng)域都朝著信息化的方向發(fā)展,我國大力發(fā)展信息資訊,并通過數(shù)據(jù)挖掘這一手段,讓我國無論是經(jīng)濟上或是科技上都得以飛速發(fā)展。
(二)數(shù)據(jù)挖掘的內(nèi)容
分類分析法:所謂分類分析法主要是指對數(shù)據(jù)進行分類處理的方法,通過對信息的分類,可以更方便快速的找出人們所需要的信息,從而實現(xiàn)對未來數(shù)據(jù)發(fā)展的預測??梢酝ㄟ^結(jié)合相應模型的方式進行分類,當前我國最普遍的分類方法正式通過模型進行分類的,所依靠的模型主要是樸素貝葉斯模型和決策樹模型兩類。
關(guān)聯(lián)分析法:所謂關(guān)聯(lián)分析法主要是利用兩個或多個數(shù)據(jù)相結(jié)合的方法進行分類,通過對一個或多個數(shù)據(jù)的分析,得出對更多數(shù)據(jù)的預測。關(guān)聯(lián)分析法主要在于對數(shù)據(jù)之間的相互關(guān)系進行整理,以減少所分析的數(shù)據(jù)量,達到高效的目的。數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,可以按照一定的指標來進行度量,在數(shù)據(jù)可以通過依靠其可信度或引入其它參數(shù)的方法進行分析,以保證數(shù)據(jù)的真實性和可靠性。
聚類分析:所謂聚類分析是指通過與分類分析相對應的方法進行對比研究,主要是從沒有相關(guān)數(shù)據(jù)的前提下,通過相同或相近的原則,找到數(shù)據(jù)之間的相似性進行分析整理的過程。在分類整理時,必須保證具有很高的相似性,在相似性較低的情況下,要通過對類似信息綜合整理的方法加以區(qū)分。從另一個角度來講,聚類分析是一種可以確認數(shù)據(jù)間規(guī)律,并且在信息中發(fā)現(xiàn)相互關(guān)系的方法。
時間序列分析:指將已有數(shù)據(jù)按照時間順序進行排列,并加以分析的一種分類方法,通過對數(shù)據(jù)的分析演算,排除重復率較高的信息,再結(jié)合已有數(shù)據(jù)對未知數(shù)據(jù)進行推算的方法,但這種分類的最大缺點在于對數(shù)據(jù)間的依賴程度很高,在數(shù)據(jù)缺乏時將無法進行合理推算。
二、數(shù)據(jù)挖掘在智慧園區(qū)中的應用
(一)智慧園區(qū)的概念
智慧園區(qū)是指由政府規(guī)劃建設的,各種配套設施建設完善、布局合理的且能夠滿足從事某種特定行業(yè)生產(chǎn)和科學實驗需要的標準化建筑群體。對于園區(qū)的建設也是多方面的,一般來說智慧園區(qū)的規(guī)模都比較大,其園區(qū)還可以分為工業(yè)、產(chǎn)業(yè)、科技、物流、創(chuàng)業(yè)園區(qū)等,利用不同的園區(qū)創(chuàng)造出不同的價值。
(二)園區(qū)內(nèi)部的管理系統(tǒng)
1.智能化系統(tǒng)
園區(qū)的智能化系統(tǒng)主要對登記、消費管理、考勤、資產(chǎn)等方面進行管理,擁有遠距離自我感知系統(tǒng),用于園區(qū)內(nèi)部建設,當識別卡靠近感應系統(tǒng)時,智能化感知系統(tǒng)將自動識別并對其做出相應處理。
2.綠色管理系統(tǒng)
據(jù)可靠調(diào)查顯示,我國建筑消耗占總能耗的三分之一,有效的解決園區(qū)建設上的浪費,對我國能耗管理有著至關(guān)重要的作用。因此園區(qū)內(nèi)部可以通過智能化照明管理系統(tǒng)、自動化節(jié)能控制系統(tǒng)來減少能耗損失,同時也可以為我國的經(jīng)濟發(fā)展做出重大貢獻。
(三)如何建立園區(qū)內(nèi)的數(shù)據(jù)模型
在保證數(shù)據(jù)信息的前提下,針對園區(qū)內(nèi)部建設所需的數(shù)據(jù)建立起相應的數(shù)據(jù)模型。智慧園區(qū)內(nèi)部管理平臺可以對園區(qū)內(nèi)部進行更方便的管理,通常情況下,對園區(qū)內(nèi)部的管理需要幾個步驟,首先要進行數(shù)據(jù)信息的獲取,了解園區(qū)內(nèi)部從建設到發(fā)展的一切資料信息,并對其進行分析整理。其次根據(jù)數(shù)據(jù)提出相關(guān)意見,并對綜合整理出的數(shù)據(jù)進行分析,最后確定信息的可靠性、安全性,從而提出管理決策。
(四)數(shù)據(jù)挖掘處理對園區(qū)的作用
園區(qū)內(nèi)能否正常運轉(zhuǎn),除了要依靠本身的發(fā)展之外,也要對園區(qū)內(nèi)以往的建設、應用、處理、運作進行詳細的分析處理,運用相應的處理方法對信息進行綜合整理,并相互對比,最后對園區(qū)內(nèi)部綜合發(fā)展情況進行預測,提出相應的改制意見,找出更好發(fā)展地最優(yōu)途徑,實現(xiàn)智慧園區(qū)內(nèi)的科技進步。
三、對園區(qū)內(nèi)數(shù)據(jù)的處理
無論是人工輸入又或是自動檢測收集,對園區(qū)的內(nèi)部數(shù)據(jù)的錄入都將存在一定的誤差,雖然數(shù)據(jù)誤差的錯誤率很低,但是對準確度而言,會影響信息的可靠性。為了保證數(shù)據(jù)的準確性,在處理大量信息時,都應將對其進行排錯處理,再進行分類,進而完成篩選預測。
結(jié)論:運用數(shù)據(jù)分析對智慧園區(qū)進行管理規(guī)劃,保持園區(qū)內(nèi)的穩(wěn)定發(fā)展。使得數(shù)據(jù)挖掘技術(shù)在智慧園區(qū)中得以應用,從而解決了園區(qū)內(nèi)部發(fā)展所帶來的問題。對園區(qū)數(shù)據(jù)進行有效挖掘,在保證數(shù)據(jù)的準確性、可靠性的前提并且在數(shù)據(jù)挖掘技術(shù)的指導下,使智慧園區(qū)得以更好的發(fā)展,從而帶動我國的科技進步。
參考文獻
[1]蘭軍芳,黃伯虎.飛鄰物聯(lián)智能系統(tǒng)關(guān)鍵技術(shù)在智慧園區(qū)中的應用[J].物聯(lián)網(wǎng)技術(shù),2013,07:77-80.
[2]張曉輝.云理論和數(shù)據(jù)挖掘在水上安全分析中的應用[D].大連海事大學,011.
[3]李小明,孫金城.數(shù)據(jù)挖掘在漢語語音合成中的應用[A].中國體視學學會圖像分析專業(yè)分會、中國體視學學會仿真與虛擬現(xiàn)實專業(yè)分會、中國計算機用戶協(xié)會圖像專業(yè)分會、中國航空學會信號與信息處理專業(yè)分會.圖像、仿真、信息技術(shù)——第二屆聯(lián)合學術(shù)會議論文集[C].中國體視學學會圖像分析專業(yè)分會、中國體視學學會仿真與虛擬現(xiàn)實專業(yè)分會、中國計算機用戶協(xié)會圖像專業(yè)分會、中國航空學會信號與信息處理專業(yè)分會,2002:3.
[4]劉莉.數(shù)據(jù)挖掘在企業(yè)信息服務中的應用[J].現(xiàn)代情報,2006,06:188-189+191.
[5]王艷.數(shù)據(jù)挖掘在數(shù)字圖書館中的應用[J].現(xiàn)代圖書情報技術(shù),2002,05:8-10+7.
(作者單位:上海市浦東軟件園匯智軟件發(fā)展有限公司)