董君 陶紅蕾 亓靚
山東省青島生態(tài)環(huán)境監(jiān)測中心 山東青島 266000
環(huán)境監(jiān)測網(wǎng)絡(luò)不斷發(fā)展完善,生態(tài)環(huán)境中各個要素的監(jiān)測覆蓋影響面也在不斷擴大,促使監(jiān)測方法朝著標準和規(guī)范化方向發(fā)展。在環(huán)境監(jiān)測系統(tǒng)完善的情況下,環(huán)境監(jiān)測數(shù)量增加。但目前沒有充分開發(fā)和利用環(huán)境監(jiān)測數(shù)據(jù),因此很多數(shù)據(jù)封存于報告和檔案之中,沒有體現(xiàn)出其應(yīng)有的價值和作用。此外,環(huán)保部門掌握的環(huán)境質(zhì)量數(shù)據(jù)不精確,導(dǎo)致各類數(shù)據(jù)碎片化,相互關(guān)聯(lián)分析不夠,因此很難言明環(huán)境質(zhì)量的變化狀況和潛在的風險。
地表水環(huán)境質(zhì)量大數(shù)據(jù)呈現(xiàn)出與環(huán)境因素相關(guān)的變化。這項數(shù)據(jù)和其他領(lǐng)域的數(shù)據(jù)一樣,具有“4V”特征。這項數(shù)據(jù)特征指的是海量的數(shù)據(jù)規(guī)模、多樣化的數(shù)據(jù)模型、巨大的數(shù)據(jù)價值以及快速的數(shù)據(jù)流動等。地表水環(huán)境質(zhì)量的數(shù)據(jù)來自于環(huán)境監(jiān)測、水文、氣象、農(nóng)業(yè)等多個領(lǐng)域和科研院校的組織結(jié)構(gòu),根據(jù)各自的工作需求展開地表水環(huán)境質(zhì)量監(jiān)測和管理工作,得到的數(shù)據(jù)供相關(guān)單位參考和使用[1]。數(shù)據(jù)監(jiān)測和管理的過程中,所應(yīng)用的管理模式是各自為政,依據(jù)自身監(jiān)測獲得使用數(shù)據(jù),規(guī)定數(shù)據(jù)的所有權(quán)和使用權(quán)歸監(jiān)測單位所有,不會無償共享數(shù)據(jù)信息資源。因此,各類數(shù)據(jù)使用者受到業(yè)務(wù)領(lǐng)域和數(shù)據(jù)獲取成本的限制,會采取協(xié)作方式獲取其他結(jié)構(gòu)的數(shù)據(jù)信息。對比地表水環(huán)境質(zhì)量數(shù)據(jù)分析的要求,不同的數(shù)據(jù)使用者所掌握的數(shù)據(jù)是獨立的,缺少與水環(huán)境質(zhì)量相關(guān)的其他類別數(shù)據(jù),只能從一個狹窄的角度了解地表水環(huán)境質(zhì)量的局部情況,應(yīng)用價值不高。
針對地表水環(huán)境質(zhì)量進行大數(shù)據(jù)分析的過程中,要運用全新的工作思維和技術(shù)方式,選擇和整理關(guān)聯(lián)的海量數(shù)據(jù)信息,將不同類型的數(shù)據(jù)有機融合在一起,從中發(fā)現(xiàn)對地表水環(huán)境狀況產(chǎn)生重要影響的因素和變化規(guī)律,從而得到科學(xué)有效的改善地表水環(huán)境質(zhì)量的優(yōu)化方案。
①因素識別。在初步分析階段,首先要了解對地表水環(huán)境質(zhì)量產(chǎn)生影響的因素,才能確定采集數(shù)據(jù)的方向和途徑。事實上,地表水環(huán)境是開放的生態(tài)系統(tǒng),與其他環(huán)境因素也進行了物質(zhì)、能量交換,因此環(huán)境的復(fù)雜性是尤其明顯的。地表水環(huán)境系統(tǒng)的復(fù)雜內(nèi)部因素和大量外部因素共同決定了其質(zhì)量狀況。要對地表水環(huán)境質(zhì)量進行大數(shù)據(jù)分析,必須首先確定這些影響因素。以湖泊水環(huán)境為例,在收集環(huán)境質(zhì)量信息的過程中,要采集水文、氣象、污染源以及經(jīng)濟、人口產(chǎn)業(yè)布局等內(nèi)容,在綜合多項影響因素的基礎(chǔ)上建立科學(xué)的生態(tài)防護措施,提升地表水環(huán)境質(zhì)量。②數(shù)據(jù)選擇。對地表水環(huán)境質(zhì)量進行分析的過程中,要先了解對其產(chǎn)生主要影響因素的狀況,反映出指標水平高低、大小和數(shù)量的參數(shù)就是我們所需要的參數(shù)信息。基于當前因子識別的結(jié)果,要在掌握現(xiàn)有知識和經(jīng)驗的基礎(chǔ)上科學(xué)選擇反映地表水環(huán)境質(zhì)量的數(shù)據(jù)。在數(shù)據(jù)分析的過程中,根據(jù)實際情況和分析的可行性確定監(jiān)控方法,同時要達到較高的準確度和精準度技術(shù)要求。數(shù)據(jù)選擇要盡量控制參數(shù)范圍和數(shù)量,如果數(shù)據(jù)較為龐大可能會產(chǎn)生不相關(guān)的信息干擾,如果數(shù)據(jù)太小則不能提供足夠的原始材料。③數(shù)據(jù)收集。根據(jù)地表水環(huán)境質(zhì)量監(jiān)測的需求和技術(shù)性要求,要精確收集數(shù)據(jù)信息,為大數(shù)據(jù)分析提供參考的依據(jù)。地表水環(huán)境質(zhì)量數(shù)據(jù)信息和政府、企業(yè)、學(xué)校等組織相關(guān),因此采集的方式也是不斷變化的,呈現(xiàn)出多樣性特點[2]。④數(shù)據(jù)整理。政府部門、企業(yè)、學(xué)校和社會組織收集的數(shù)據(jù)信息格式和生成方式是截然不同的,因此要采取一定措施轉(zhuǎn)化為統(tǒng)一的數(shù)字化表達方式,便于管理和使用?;诘乇硭h(huán)境質(zhì)量的數(shù)據(jù)信息不僅僅是普通的電子水環(huán)境數(shù)據(jù)信息,因此要在合理存儲和即時檢索的情況下進行管理和相應(yīng)應(yīng)用。收集的紙質(zhì)報告信息轉(zhuǎn)化成電子文檔后,也無法應(yīng)用于大數(shù)據(jù)分析。要想科學(xué)應(yīng)用,需要轉(zhuǎn)化為軟件系統(tǒng)檢索、計數(shù)和分析的數(shù)字信息。對于地表水環(huán)境質(zhì)量數(shù)據(jù),匯總編制數(shù)據(jù)內(nèi)容的過程中要關(guān)注到監(jiān)測方式和質(zhì)量控制等方面的問題,了解不同技術(shù)應(yīng)用間存在的差異,才能在數(shù)據(jù)分析的基礎(chǔ)上更改出現(xiàn)的錯誤此外,對于不符合技術(shù)要求的數(shù)據(jù)以及帶有系統(tǒng)偏差的數(shù)據(jù)進行合理校正,能夠為數(shù)據(jù)分析功能提供真實有效的參數(shù),發(fā)揮其基本作用。⑤關(guān)聯(lián)分析。獲取的數(shù)據(jù)信息經(jīng)過排序后,部分內(nèi)容仍是松散的,因此要通過數(shù)據(jù)關(guān)聯(lián)分析的方式確定這些數(shù)據(jù)信息的使用途徑。在關(guān)聯(lián)分析的偶成中,一般會采用人工智能的方式,比如數(shù)據(jù)挖掘、自然語言處理、統(tǒng)計分析等技術(shù)方式,目的在于最大程度的還原地表水環(huán)境質(zhì)量的情況。在收集數(shù)據(jù)時,結(jié)合多種生物模型能夠讓分析結(jié)果更為精確。此外,也可以通過反映地表水環(huán)境質(zhì)量的零散信息構(gòu)建數(shù)據(jù)模型,計算其他因素對地表水環(huán)境質(zhì)量的影響情況,逐步實現(xiàn)數(shù)據(jù)系統(tǒng)化管理。系統(tǒng)的預(yù)測和-判斷功能能夠讓我們在數(shù)據(jù)分析的過程中發(fā)現(xiàn)問題,掌握事物變化的基本規(guī)律,才能合理有效的解決地表水環(huán)境問題[3]。
由上文可知,地表水環(huán)境質(zhì)量數(shù)據(jù)分析是一門系統(tǒng)和綜合性的學(xué)科,涉及到計算機技術(shù)、信息技術(shù)以及水文氣象等多個學(xué)科領(lǐng)域。地表水環(huán)境質(zhì)量大數(shù)據(jù)呈現(xiàn)出與環(huán)境因素相關(guān)的變化。這項數(shù)據(jù)和其他領(lǐng)域的數(shù)據(jù)一樣,具有“4V”特征。從推動地表水環(huán)境質(zhì)量分析的角度出發(fā),要集中培養(yǎng)具備學(xué)科知識能力和技術(shù)能力的綜合型人才。高等院校中應(yīng)該建立相關(guān)學(xué)科,展開大數(shù)據(jù)分析專業(yè)教育,為大數(shù)據(jù)分析輸送專業(yè)的對口人才。