廖飛
(重慶市信息通信咨詢設(shè)計(jì)院有限公司,重慶 400041)
在科學(xué)和技術(shù)水平高度發(fā)達(dá)的今天,各行企業(yè)都已經(jīng)逐漸地進(jìn)入到一個(gè)電子和信息化的辦公時(shí)期。對于一些政府機(jī)構(gòu)而言,電子信息技術(shù)把傳統(tǒng)意義上的事務(wù)性辦公方式轉(zhuǎn)變?yōu)橐环N更加符合新時(shí)期潮流的有效性辦公方式。既方便了人民和廣大群眾,又有利于優(yōu)化組織結(jié)構(gòu),同時(shí)也調(diào)動(dòng)了政務(wù)機(jī)關(guān)的積極性。政府承載著領(lǐng)導(dǎo)和管理整個(gè)社會(huì)的重要責(zé)任,它處置的問題及其解決問題的能力與否直接關(guān)系到每個(gè)公民的切身利益。尤其是在移動(dòng)互聯(lián)網(wǎng)的今天,大多數(shù)部門的資料都是通過網(wǎng)絡(luò)進(jìn)行傳播與存儲(chǔ)。所以我們想要做到更好的處理這些信息,就一定需要進(jìn)行政府機(jī)構(gòu)的電子辦公化。然后在此基礎(chǔ)上,大力發(fā)展與其相關(guān)的技術(shù),從而進(jìn)一步實(shí)現(xiàn)經(jīng)濟(jì)社會(huì)全局的信息化。本文主要是通過探究如何在電子政務(wù)中應(yīng)用的數(shù)據(jù)分析挖掘等技術(shù),尋找更加便捷的途徑,為構(gòu)建和諧信息社會(huì)奠定良好的基礎(chǔ)。
數(shù)據(jù)挖掘技術(shù)也可以稱為數(shù)據(jù)采集或者是數(shù)據(jù)開發(fā),它主要指的就是一種泛指從各種類型的大型數(shù)據(jù)庫中收集得到的信息和數(shù)據(jù),并且提供給了人們所需要和感興趣的信息,而這些信息和知識(shí)都實(shí)際上是一種隱藏著事前不為人知和潛在有用資料。原始數(shù)據(jù)大多是一種結(jié)構(gòu)性的,比如文字、圖形和影像等數(shù)據(jù),甚至還包括了各種不同的分布式網(wǎng)絡(luò)中的異構(gòu)化數(shù)據(jù)。發(fā)現(xiàn)其知識(shí)的途徑和方法既可以是數(shù)學(xué)的,也或者是其他的;它既可能被演繹出來,也可能被歸納出來。發(fā)現(xiàn)出來的所掌握的知識(shí)既可以應(yīng)用于資料管理、查詢和優(yōu)化、決策支撐過程控制等,又可以應(yīng)用于資料自身。因此,它匯聚了不同行業(yè)和領(lǐng)域的研究,特別是在數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)等各個(gè)方面的學(xué)者和專家的研究資料。數(shù)據(jù)挖掘法就是可以從一些實(shí)例的數(shù)據(jù)中直接引入導(dǎo)出法則,用來建立一個(gè)知識(shí)庫;也就是可在數(shù)據(jù)庫中針對已經(jīng)存在的規(guī)則性信息進(jìn)行驗(yàn)證,因此對于知識(shí)庫的維護(hù)和更新是有必要的。
大量研發(fā)數(shù)據(jù)需求依靠的是人工智能。它也可以說是充分運(yùn)用了目前在現(xiàn)代人工智能中一些已經(jīng)成熟的算法和科學(xué)技術(shù),例如:人工神經(jīng)網(wǎng)絡(luò)、決策樹、相鄰搜索方法、規(guī)律推理、模糊邏輯等。它與現(xiàn)代人工智能相比,具有很小的復(fù)雜性。在數(shù)據(jù)挖掘系統(tǒng)中所需要利用到的技術(shù)量就越大,所得到的結(jié)果精確程度也就越高。數(shù)據(jù)挖掘系統(tǒng)中所利用的技術(shù)量越大,所獲得的結(jié)果準(zhǔn)確度也越高。這主要是由于一個(gè)問題的類型以及其中大量數(shù)據(jù)的各種類型和規(guī)模不同,而導(dǎo)致的無論是采用何種技術(shù)手段來實(shí)現(xiàn)所需要的任務(wù),從其功能上都可以把對數(shù)據(jù)進(jìn)行挖掘的分析,大致方法劃分為以下3 種:
基于關(guān)聯(lián)性的分析:關(guān)聯(lián)分析的主要目標(biāo)之一就是通過對隱含數(shù)據(jù)之間的挖掘和分析來分析這些信息中的相互關(guān)系。分類記錄分析:采用分類記錄分析法的數(shù)據(jù)輸入集就是一組數(shù)據(jù)記錄的集合和幾個(gè)標(biāo)記,首先給每一個(gè)數(shù)據(jù)記錄賦予一個(gè)標(biāo)記,然后按照所標(biāo)記的數(shù)據(jù)進(jìn)行分類和記錄,最后通過檢查此標(biāo)記的數(shù)據(jù)描述來找出這次記錄的特點(diǎn)。聚類分析:聚類分析:聚類分析法的主要特點(diǎn)是輸入集通常都是一組不被標(biāo)記的數(shù)據(jù)和信息,即這時(shí)對于該數(shù)據(jù)和信息所做出的記錄尚沒有被用來做出任何的分類。它的目的主要在于根據(jù)某種特殊的規(guī)律,合理地劃分每一個(gè)記錄的數(shù)量和集合,并以一種顯式或者隱性的形式將其排列到不同的類別中,而所需要依賴和遵循的這些方法與規(guī)律都是由通過集成聚類分析工具來決定的[1]。
電子政務(wù)系統(tǒng)是近年來隨著互聯(lián)網(wǎng)和電子信息技術(shù)的廣泛傳播而逐漸興起的一個(gè)新名詞,其基本含義主要是指各級政府部門充分運(yùn)用先進(jìn)的網(wǎng)絡(luò)信息技術(shù)對各個(gè)部門重新地進(jìn)行了規(guī)劃和歸集分類,利用先進(jìn)的電子通信將它們相互地連接,并將它們共同地納入一個(gè)網(wǎng)絡(luò)的管理之內(nèi),利用先進(jìn)的計(jì)算機(jī)和電子通信將它們相互連接,并將它們共同地納入一個(gè)互聯(lián)網(wǎng)的經(jīng)營管理之內(nèi),通過先進(jìn)的互聯(lián)網(wǎng)技術(shù)有效地對企業(yè)進(jìn)行流暢、透明地經(jīng)營和管理,實(shí)現(xiàn)對各級地方政府部門資源優(yōu)化與資產(chǎn)重組。電子政務(wù)能夠很好地緩解因?yàn)闀r(shí)間、空間所給我們帶來的障礙,實(shí)現(xiàn)了各個(gè)單位之間毫不隔閡的聯(lián)系,共同為社會(huì)、人民群眾一個(gè)最好質(zhì)量的服務(wù)。此時(shí)采取傳統(tǒng)處理方法已經(jīng)遠(yuǎn)遠(yuǎn)無法很好地解決問題,需要運(yùn)用一些新的處理技術(shù)。數(shù)據(jù)挖掘,正是一種符合這一要求的技術(shù),它不但可以準(zhǔn)確處理海量的信息,還可以將有效的信息從中獲取出來,使大量的信息資源和數(shù)據(jù)都得到了維護(hù),從而大大提高了政府的辦公工作效率。因此,在電子政務(wù)中對于數(shù)據(jù)挖掘等新技術(shù)的研究和運(yùn)用,是非常值得各級政府部門深入學(xué)習(xí)和大力推動(dòng)的。
電子政務(wù)大數(shù)據(jù)挖掘主要目的就是把有用的大數(shù)據(jù)進(jìn)行挖掘直接地折射給各級政府部門,使得各級政府部門的內(nèi)部資料和外部信息與外部資料之間能夠進(jìn)行有效的整合和分析,這樣政府部門才能夠更好、較有效地將自己的資料發(fā)布出去,向最想要得到他們的社會(huì)公眾公布。另外,由于各級政府部門自動(dòng)化的實(shí)施產(chǎn)生了大量的統(tǒng)計(jì)資料,對這些統(tǒng)計(jì)資料進(jìn)行了收集分析,可以及時(shí)地獲得一些直接影響到政府部門管理工作的重要性和關(guān)鍵因素,從而有效地為各級政府部門管理人員的決策工作提供了依據(jù),幫助各級政府部門提升政府信息化的能力和水平,促進(jìn)整個(gè)經(jīng)濟(jì)社會(huì)發(fā)展。數(shù)據(jù)挖掘技術(shù)在電子政務(wù)領(lǐng)域的應(yīng)用有很多特點(diǎn),這些技術(shù)主要表現(xiàn)在以下幾個(gè)層次[2]。
電子政務(wù)體系的構(gòu)建所帶來的直接經(jīng)濟(jì)效益,就是它徹底地打破了各級人民政府之間的文件傳輸信息的繁雜化,用最快捷的手段和電子服務(wù)方式向各級人民政府上下級之間傳輸信息,這不但大大降低了人民政府的辦公生活用品和其他相關(guān)費(fèi)用的開銷,而且在無形中也為人民政府減少了巨大的額外開銷。通過對數(shù)據(jù)的挖掘能夠掌握各個(gè)單位的費(fèi)用和開支情況,并為客戶提出可行的降低成本和有效控制的解決方案。
電子政務(wù)大數(shù)據(jù)挖掘技術(shù)可以將各級政務(wù)機(jī)構(gòu)在系統(tǒng)的大數(shù)據(jù)中所收集到的海量信息綜合地進(jìn)行開采、挖掘和綜合分析,從中準(zhǔn)確地識(shí)別、抽取它們所蘊(yùn)含的信息,并充分利用這些信息能夠?yàn)楦骷壵块T和機(jī)關(guān)重大的決策、法規(guī)制定工作提供有效的決策依據(jù)。例如,通過對各地方政府、社會(huì)公共網(wǎng)站的數(shù)據(jù)資料進(jìn)行搜索和收集,然后采用數(shù)據(jù)挖掘的方法對其他網(wǎng)站進(jìn)行挖掘,從中獲取出對于提高各類政府工作效率有益的基礎(chǔ)知識(shí),從而給各類政府機(jī)構(gòu)及相關(guān)工作人員提供一種科學(xué)、實(shí)用的幫助以及決策支撐。
政府部門需要做到充分發(fā)揮自身的職能,對各單位進(jìn)行有效的監(jiān)控與管理,同時(shí)也是為了提高民眾和政府之間交流與溝通的準(zhǔn)確度,及時(shí)掌握有效信息,就必須建立一個(gè)能夠有效地對收集、監(jiān)督和分析獲取的大量資料進(jìn)行整合的系統(tǒng)[3]。
為了能夠更好地分析和發(fā)現(xiàn)在我國的政務(wù)系統(tǒng)中網(wǎng)站和瀏覽器對于用戶的各種訪問模式和其行為方向,就需要我們可以通過使用大量的數(shù)據(jù)挖掘技術(shù),來針對網(wǎng)站和瀏覽器上的服務(wù)器和網(wǎng)站日志中所記錄的大量信息和數(shù)據(jù)進(jìn)行分析挖掘處理,從中收集得到的信息并有針對性地加以分析。例如,通過對于使用者在某頁面停留的時(shí)間,就能夠準(zhǔn)確地判斷得出使用者對于這些信息資源有什么特殊的興趣,從而開始進(jìn)行一種個(gè)性化的服務(wù)。
為了有效地組織和整合收集政府網(wǎng)站中的信息,我們可以考慮通過對政府網(wǎng)站中的文字資源進(jìn)行挖掘,主要就是通過對政府網(wǎng)站中的各種文字資源內(nèi)容。例如,我們就能夠使用聚類技術(shù)自動(dòng)將一個(gè)網(wǎng)站中所有的文本內(nèi)容都由其他信息進(jìn)行了一個(gè)自動(dòng)的分類和劃定相應(yīng)的類型,從而使我們能夠很好地實(shí)現(xiàn)對一個(gè)網(wǎng)站中所有信息的多維度、層次化的組織和方式,便于我們對這些文本內(nèi)容的搜索進(jìn)行分類、瀏覽和檢索;同時(shí),還使我們可以充分地結(jié)合對于一些網(wǎng)絡(luò)上用戶所需要訪問的日志記錄資料信息等數(shù)據(jù)進(jìn)行挖掘,把握好了用戶的需求,從而積極地開展一些個(gè)性化的信息服務(wù)和具有針對性的電子政務(wù)等活動(dòng),進(jìn)而吸引人們到更多的注意力。
創(chuàng)新涉及政府制訂發(fā)展戰(zhàn)略的實(shí)施和公眾政策方面的創(chuàng)新。電子政務(wù)大數(shù)據(jù)的挖掘,增強(qiáng)了我國政府部門應(yīng)對各種突發(fā)事件的迅猛反應(yīng)能力,提高了我國政府部門工作的自主創(chuàng)新能力和專業(yè)技術(shù)人才素質(zhì)。例如,在災(zāi)害預(yù)警系統(tǒng)中運(yùn)用了數(shù)據(jù)挖掘的關(guān)聯(lián)分析和回歸預(yù)測等技術(shù),對于歷史資料的分析進(jìn)行分析,可以準(zhǔn)確地預(yù)測到與災(zāi)害有關(guān)的影響因素、災(zāi)害所處地區(qū)發(fā)生的變化趨勢,并為其制定緊急救援措施[4]。
對過去從事行政管理工作中獲取的數(shù)據(jù)資源進(jìn)行分析挖掘可以獲取到許多未知的行政管理經(jīng)歷和知識(shí),這就是電子政務(wù)大數(shù)據(jù)挖掘的強(qiáng)大魅力。但是,目前關(guān)于數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)研究并不是很成熟,距離實(shí)踐中的應(yīng)用仍然存在一些差距,主要體現(xiàn)在以下幾個(gè)方面:
第一,知識(shí)的表達(dá)和解釋機(jī)制,對于挖掘得到的知識(shí)如何以一種用戶可能接受和理解的方式將其表達(dá)得出來,這就要求我們對于知識(shí)的表述不能僅僅停留在數(shù)字或者符號(hào)上,而是應(yīng)該以一種比較容易被人理解的手段。第二,挖掘的對象規(guī)模大而復(fù)雜,政府?dāng)?shù)據(jù)采集和管理的變革使得數(shù)據(jù)開發(fā)面臨著更多的數(shù)據(jù)庫、更多的維度以及各種屬性之間的繁瑣關(guān)系,所處理的數(shù)據(jù)量變得更加龐大了,從而直接導(dǎo)致了組合式的爆炸[5]。目前,主要是通過綜合地利用先進(jìn)的并行技術(shù)或者抽取等方式處理各種大規(guī)模數(shù)據(jù),以此為基礎(chǔ)來達(dá)到較高的挖掘效率。第三,證實(shí)技術(shù)的局限,主要表現(xiàn)在兩個(gè)重要的方面:一個(gè)就是對所研究出來的知識(shí)進(jìn)行證實(shí);二是對所有參與挖掘的來源數(shù)據(jù)進(jìn)行抽取挖掘,選擇算法本身等是否正確地進(jìn)行證實(shí)。
實(shí)施電子政務(wù)系統(tǒng)是現(xiàn)代信息科學(xué)技術(shù)進(jìn)步的必然產(chǎn)物。在當(dāng)前全球經(jīng)濟(jì)一體化的背景下,應(yīng)當(dāng)進(jìn)一步加強(qiáng)對于網(wǎng)絡(luò)安全的立法以及網(wǎng)絡(luò)的監(jiān)管,積極推動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)資源的構(gòu)建。充分發(fā)揮政府的獨(dú)特資源優(yōu)勢,促進(jìn)管理的革命性創(chuàng)新和科學(xué)技術(shù)的創(chuàng)新,使得政府能夠運(yùn)用電子政務(wù)更好地為人民服務(wù)。