曾慶峰 梁岳
摘要:目前,污染源數(shù)據(jù)的智能審核系統(tǒng)仍舊以簡單數(shù)學計算為基礎(chǔ),也有主要通過人工審核方式實現(xiàn)的技術(shù)系統(tǒng)。本次研究以數(shù)據(jù)挖掘為基礎(chǔ),分析了污染源智能監(jiān)測的數(shù)據(jù)現(xiàn)場信息管理軟件,并基本實現(xiàn)了數(shù)據(jù)預(yù)測的功能。因此本系統(tǒng)能夠為環(huán)境保護等部門提供必要的參考數(shù)據(jù)。
關(guān)鍵詞:數(shù)據(jù)挖掘;環(huán)境污染數(shù)據(jù);智能審核
中圖分類號:X502 文獻標識碼:A 文章編號:2095-672X(2018)06-0080-02
DOI:10.16647/j.cnki.cn15-1369/X.2018.06.048
Abstract: At present, the intelligent audit system for pollution source data is still based on simple mathematical calculations, and there are also technical systems that are mainly implemented through manual auditing. Based on data mining, this study analyzed the data on-site information management software for intelligent monitoring of pollution sources, and basically realized the function of data prediction. Therefore, this system can provide necessary reference data for environmental protection departments.
Keywords: Data mining; Environmental pollution data; Smart audit
近年來,我國經(jīng)濟的快速發(fā)展,取得了顯著成績,但與此同時,也導(dǎo)致越來越嚴重的污染,因此,需要更科學地針對污染治理項目制定詳細高效的方案,實現(xiàn)污染監(jiān)督管理的現(xiàn)代化。隨著各項環(huán)保工作的開展,我國也逐漸建立起監(jiān)測環(huán)境污染數(shù)據(jù)的相關(guān)體系及執(zhí)法流程。也建立起一套以智能化污染源監(jiān)測為基礎(chǔ)的系統(tǒng),該系統(tǒng)正在我國各地發(fā)揮作用,并取得了較好成績。通過智能監(jiān)測數(shù)據(jù)所得到的考核數(shù)據(jù)已經(jīng)逐步成為評估企業(yè)污染排放量是否達標的重要依據(jù)。但環(huán)境檢測系統(tǒng)也存在一定的局限性,容易受到客觀環(huán)境的影響,使得相關(guān)數(shù)據(jù)可能存在一定的異常甚至丟失,因此會在一定程度上影響環(huán)境監(jiān)管部門的判斷。
1 系統(tǒng)需求
這一系統(tǒng)總共包含了以下5個模塊,其中,數(shù)據(jù)編輯模塊的主要功能為更新并刪除數(shù)據(jù)庫中的相關(guān)數(shù)據(jù),用戶管理模塊則主要實現(xiàn)了用戶注冊和用戶登錄的功能,而智能審核模塊則主要含有對數(shù)據(jù)補缺和對異常數(shù)據(jù)進行檢測的功能[1]。
1.1 用戶管理模塊
為了確保系統(tǒng)安全性,避免非工作人員對數(shù)據(jù)進行篡改和盜用,用戶模塊實現(xiàn)了對登入網(wǎng)絡(luò)用戶進行身份驗證的功能。用戶管理模塊主要的項目有用戶注冊和登錄兩種,新用戶需要在注冊時通過身份驗證,而原有用戶則需要輸入正確的用戶名和密碼才能進入并訪問系統(tǒng)并操作。
1.2 數(shù)據(jù)采集模塊
數(shù)據(jù)采集模塊主要功能為采集污染數(shù)據(jù),并將采集到的數(shù)據(jù)保存至數(shù)據(jù)庫。當用戶于操作頁面輸入了污染源的有關(guān)數(shù)據(jù)信息后,信息就能被自動保存至相對應(yīng)的數(shù)據(jù)庫系統(tǒng)中,進而完成儲存污染源信息數(shù)據(jù)的工作。
1.3 數(shù)據(jù)編輯模塊
數(shù)據(jù)編輯模塊的主要功能為修改污染數(shù)據(jù),通過編輯的方式對數(shù)據(jù)進行相應(yīng)處理,主要的處理項目包括數(shù)據(jù)更新和數(shù)據(jù)刪除。污染源數(shù)據(jù)通常會大量占用存儲空間,并且條目眾多,因此操作者需要通過搜索關(guān)鍵詞的方式找到具體數(shù)據(jù)信息并修改,同時可將過期的數(shù)據(jù)通過數(shù)據(jù)編輯模塊刪除[2]。
1.4 數(shù)據(jù)查詢模塊
數(shù)據(jù)調(diào)查模塊的主要功能為查詢污染源相關(guān)數(shù)據(jù)資料,通過條件查詢的方式,數(shù)據(jù)調(diào)查模塊能夠?qū)崿F(xiàn)高效定位,操作者可以在相應(yīng)欄目輸入污染代碼、日期等關(guān)鍵條件,并以此進行關(guān)鍵信息的查找,將關(guān)聯(lián)數(shù)據(jù)導(dǎo)出并制圖,以供操作者直觀地了解數(shù)據(jù)信息??梢赃x擇將采集數(shù)據(jù)生成為折線圖,而操作者可以根據(jù)圖中信息發(fā)現(xiàn)污染源數(shù)據(jù)的變化規(guī)律[3]。
1.5 智能審核模塊
智能審核模塊是最重要的系統(tǒng)模塊之一。該模塊是基于數(shù)據(jù)挖掘智能審核技術(shù)的前提和基礎(chǔ)條件,能夠?qū)ο蛄坑嬎惴ǖ臄?shù)據(jù)予以補缺,實現(xiàn)以模糊聚類算法為基礎(chǔ)的數(shù)據(jù)異常檢測功能,并實現(xiàn)以BP神經(jīng)網(wǎng)絡(luò)算法為基礎(chǔ)的數(shù)據(jù)預(yù)測功能[4]。上述所有功能都共同起到了對污染源數(shù)據(jù)進行查漏補缺的效果,準確監(jiān)測污染源異常數(shù)據(jù),從而對未來數(shù)天內(nèi)的污染源數(shù)據(jù)予以預(yù)測。
2 系統(tǒng)設(shè)計
2.1 系統(tǒng)架構(gòu)
首先是模型層:該層主要用于實現(xiàn)對系統(tǒng)數(shù)據(jù)的審核,通過控制層用戶的請求,將對應(yīng)數(shù)據(jù)調(diào)用后,通過數(shù)據(jù)挖掘的算法與污染源數(shù)據(jù)處理的方式,將所得數(shù)據(jù)信息通過折線圖的形式展示,并呈現(xiàn)在用戶界面以供讀取和分析。
其次是視圖層:視圖層的核心內(nèi)容為用戶界面,用戶注冊、登錄和查找數(shù)據(jù)信息功能均在這一界面中,除此之外還包括數(shù)據(jù)編輯功能、智能審核功能兩個主要頁面。視圖層的主要作用為傳遞表單參數(shù)給用戶,以便用戶填寫相關(guān)資料信息,并對用戶搜索的結(jié)果予以顯示[5]。
最后是視圖層:對于來自視圖層的用戶請求,可以實現(xiàn)對模型層的調(diào)用,以實現(xiàn)相應(yīng)的算法及功能,并且將污染源數(shù)據(jù)所處理得到的結(jié)果向視圖層傳遞,并向用戶展現(xiàn)。
2.2 數(shù)據(jù)庫設(shè)計
在開發(fā)Web程序的過程中,常常會應(yīng)用到JDBC系統(tǒng),以幫助完成Web系統(tǒng)的數(shù)據(jù)庫操作,同時JDBC技術(shù)需要以MVC架構(gòu)為基礎(chǔ),以保證其可擴展性。數(shù)據(jù)表是用戶注冊的基礎(chǔ),主要用來將用戶注冊信息進行儲存。而污水廠的排污量數(shù)據(jù)主要通過小時數(shù)據(jù)表實現(xiàn),記錄每時段的污染排放量[6]。
2.3 數(shù)據(jù)挖掘理論
首先是BP神經(jīng)網(wǎng)絡(luò)算法:人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)為數(shù)學模型,其建立在現(xiàn)代化的科研成果之上,主要原理類似于人類大腦對于數(shù)據(jù)信息的處理過程,并且和大腦特征也比較類似。具體算法為:①神經(jīng)元之間能夠傳遞信息,并對龐大數(shù)據(jù)進行處理;②容錯性及健壯性強,如果出現(xiàn)少量的數(shù)據(jù)缺失,能夠很好應(yīng)對,并具有較好抗噪能力;③學習性及適應(yīng)性,網(wǎng)絡(luò)計算方法可以被簡化為“輸入-輸出”或者“問題-答案”形式。關(guān)于BP神經(jīng)網(wǎng)絡(luò),基本原理為:設(shè)定神經(jīng)網(wǎng)絡(luò)的輸入樣本,并將層節(jié)點數(shù)隱藏或輸出。在隱含層將信號激活并放大,與此同時反向傳輸與期望信號的誤差,通過誤差信號對網(wǎng)格連接權(quán)值進行調(diào)整。最后在輸出層將期望信號輸出,并繼續(xù)進行數(shù)據(jù)的預(yù)測處理。
2.4 系統(tǒng)模塊設(shè)計
首先是公共模塊的設(shè)計:在對軟件進行開發(fā)的過程中,通常需要對公共模塊予以應(yīng)用,包括對于數(shù)據(jù)庫的連接和對數(shù)據(jù)庫的操作等等。編寫數(shù)據(jù)庫連接與操作類的主要方法包括連接數(shù)據(jù)庫、查詢關(guān)鍵詞、更新內(nèi)容、關(guān)閉數(shù)據(jù)庫連接等等。其次是用戶模塊設(shè)計:應(yīng)創(chuàng)建數(shù)據(jù)庫,并相應(yīng)分類,配置Servlet的名稱等屬性,在算法中實現(xiàn)對數(shù)據(jù)庫的連接獲準。只要用戶能夠正確填寫信息并完成“注冊”,則注冊信息就能夠被保存至數(shù)據(jù)庫,用戶即可完成注冊。最后是數(shù)據(jù)庫查詢模塊:在此模塊下,工作人員能夠?qū)崿F(xiàn)對數(shù)據(jù)的查詢,并尋找不同歷史時期的數(shù)據(jù)變化趨勢,并將其以折線圖的方式生成,使歷史數(shù)據(jù)的走向被更直觀地表現(xiàn)出來。
3 系統(tǒng)實現(xiàn)
3.1 系統(tǒng)開發(fā)環(huán)境
本系統(tǒng)的開發(fā)是以數(shù)據(jù)挖掘環(huán)境的污染源數(shù)據(jù)智能審核技術(shù)為背景的,針對這一對象開展相關(guān)設(shè)計思路,以Web的B/S系統(tǒng)為基礎(chǔ),通過MVC模式框架實現(xiàn)。系統(tǒng)主要采用的是Java語言以及Tomcat服務(wù)器,數(shù)據(jù)庫采用Server數(shù)據(jù)庫,并使用了JavaScript相關(guān)技術(shù)。
3.2 系統(tǒng)模塊功能
首先是用戶管理模塊:包括用戶注冊功能和用戶登錄功能、系統(tǒng)主頁面等。用戶注冊需要用戶填寫用戶名并輸入登錄密碼,然后完成基本信息的填寫;用戶登錄需要填寫注冊時的賬號及密碼,登錄到系統(tǒng)頁面后進行操作,如果用戶忘記登錄密碼,可以通過密保手段或聯(lián)系系統(tǒng)管理員解鎖并重置密碼;系統(tǒng)主頁面包括數(shù)據(jù)編輯、數(shù)據(jù)查詢、數(shù)據(jù)收集等功能,不同功能具有不同的作用,實現(xiàn)不同操作。系統(tǒng)還可以擴展如“友情鏈接”“最新動態(tài)”等功能。
4 結(jié)束語
對于污染源智能審核系統(tǒng)的設(shè)計,基本能夠?qū)崿F(xiàn)以數(shù)據(jù)挖掘為基礎(chǔ)的智能審核技術(shù)補缺和異常檢測,其中補缺功能的誤差率控制在3%以內(nèi),而數(shù)據(jù)預(yù)測最大誤差也能被控制在3%以內(nèi),極好的證明了這一系統(tǒng)的科學性及可靠性。
參考文獻
[1]賀青.基于模糊聚類與BP神經(jīng)網(wǎng)絡(luò)的環(huán)境污染源數(shù)據(jù)的異常檢測研究[D].銀川:寧夏大學,2016.
[2]潘景全,李若玲,靳秀英等.河北省排污申報智能監(jiān)管信息系統(tǒng)[Z].河北省環(huán)境信息中心,2013.
[3]陜西省危險廢物管理信息系統(tǒng)[Z].陜西省固體廢物管理中心,2011.
[4]鈕卿,程琳.基于環(huán)境保護大數(shù)據(jù)的監(jiān)測與智能診斷研究[J].環(huán)境科學與管理,2018,(1):167-170.
[5]何為.中國石油污染源在線監(jiān)測系統(tǒng)發(fā)展的探究[J].油氣田環(huán)境保護,2017,(4):44-45,48.
[6]曹科研,欒方軍,孫煥良等.不確定數(shù)據(jù)基于密度的局部異常點檢測[J].計算機學報,2017,(10):2231-2244.
收稿日期:2018-04-26
作者簡介:曾慶峰(1985-),男,研究生,助理工程師,研究方向為環(huán)境信息化相關(guān)工作。