陳璐璐,陳富媛,楊鵬輝,黃艷紅,陳夢倩
(1.安徽財(cái)經(jīng)大學(xué)金融學(xué)院,安徽 蚌埠 233030;2.安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
基于BP神經(jīng)網(wǎng)絡(luò)對城市空氣污染數(shù)據(jù)真實(shí)性的判別
陳璐璐1,陳富媛2,楊鵬輝2,黃艷紅2,陳夢倩2
(1.安徽財(cái)經(jīng)大學(xué)金融學(xué)院,安徽 蚌埠 233030;2.安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
目的 針對城市空氣污染數(shù)據(jù)的真實(shí)性,收集并處理京津冀、長三角和珠三角地區(qū)的空氣質(zhì)量數(shù)據(jù),判別數(shù)據(jù)的真實(shí)性,并給出提高空氣污染數(shù)據(jù)真實(shí)性的建議。方法 使用因子分析、多元統(tǒng)計(jì)等方法構(gòu)建BP神經(jīng)網(wǎng)絡(luò)和多元線性回歸模型,利用MATLAB、SPSS和excel等軟件,分析空氣質(zhì)量數(shù)據(jù)的波動性,得到各個城市空氣污染物數(shù)據(jù)的真實(shí)性結(jié)果。結(jié)果 天津、滄州、上海、東莞等城市的空氣污染數(shù)據(jù)較為真實(shí),而保定、邢臺、鎮(zhèn)江、揚(yáng)州、舟山,珠海等城市空氣污染數(shù)據(jù)的不真實(shí)性嚴(yán)重。結(jié)論 應(yīng)當(dāng)注重基層環(huán)境統(tǒng)計(jì)工作,加強(qiáng)基層和媒體對統(tǒng)計(jì)數(shù)據(jù)的關(guān)注,完善軟件技術(shù)設(shè)施。
空氣質(zhì)量;BP神經(jīng)網(wǎng)絡(luò);MATLAB
空氣質(zhì)量始終是政府、環(huán)境保護(hù)部門和人民關(guān)注的熱點(diǎn)問題。近期頻繁爆發(fā)的霧霾危機(jī)也使得人們?nèi)找骊P(guān)注有關(guān)監(jiān)測部門發(fā)布的空氣質(zhì)量指標(biāo)情況。去年“兩會”代表和委員紛紛指責(zé)中國部分城市偽造空氣監(jiān)測數(shù)據(jù),治霾政策的制定受到來自利益相關(guān)者的阻力[1]。2016年的兩會上,全國政協(xié)常委、環(huán)境保護(hù)部副部長吳曉青表示,很高興在今年的“十三五”規(guī)劃草案中看到增加了環(huán)境質(zhì)量的考核指標(biāo)。自中國提出空氣質(zhì)量數(shù)據(jù)監(jiān)測以后,部分地方政府頻繁曝出監(jiān)測數(shù)據(jù)在改善,而環(huán)境質(zhì)量卻在持續(xù)惡化的新聞。地方政府大氣監(jiān)測數(shù)據(jù)真實(shí)性的問題逐漸受到人們的關(guān)注。
張錫穎等[2]從空氣質(zhì)量與氣候的關(guān)系角度研究了這個問題。首先搜集京津冀、長三角、珠三角各個地區(qū)的氣候和空氣質(zhì)量數(shù)據(jù),然后對各個影響因素進(jìn)行歸一化處理,最后得出判別中國地方政府上報(bào)監(jiān)測數(shù)據(jù)真實(shí)性的方法,并且得出數(shù)據(jù)真實(shí)性的不同類型。王妮妮[3]以空氣污染類型為切入點(diǎn),首先搜集上海市國控子站的日監(jiān)測數(shù)據(jù),其次對上海市空氣質(zhì)量進(jìn)行綜合評價(jià),然后利用虹橋機(jī)場氣象監(jiān)測站數(shù)據(jù)對上海市的氣象情況進(jìn)行綜合評價(jià),最后得出上海市空氣質(zhì)量狀況良好,并且得出了以單點(diǎn)位、單因子為主,多點(diǎn)位、單因子為輔的空氣質(zhì)量異常數(shù)據(jù)聯(lián)合篩選體系。
數(shù)據(jù)來源于中國氣象局網(wǎng)站[4],為了便于解決問題,提出以下假設(shè):(1)城市空氣質(zhì)量數(shù)據(jù)的真實(shí)性具有連續(xù)性,即這個時間段數(shù)據(jù)真實(shí),則下個時間段數(shù)據(jù)也真實(shí);(2)多元線性回歸中隨機(jī)誤差項(xiàng)ε是一個平均值或期望值為零的隨機(jī)變量;(3)解釋變量的所有觀測值,隨機(jī)誤差項(xiàng)的方差都是相同的;(4)忽略除了空氣污染物含量外其他影響AQI的因素;(5)不考慮極端天氣對空氣污染物含量的影響。
3.1 研究思路
以京津冀、長三角和珠三角地區(qū)代表城市不同時間的PM10、CO、NO2、SO2的4個指標(biāo)作為輸入數(shù)據(jù),PM2.5作為輸出數(shù)據(jù)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型;接著將該地區(qū)其他城市的PM10、CO、NO2、SO24個指標(biāo)輸入到前面構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)模型中,得到這些城市PM2.5的預(yù)測數(shù)值,通過這些預(yù)測PM2.5的數(shù)值與代表城市PM2.5真實(shí)數(shù)據(jù)比較,最后篩選出該地區(qū)空氣質(zhì)量數(shù)據(jù)比較真實(shí)的城市。
3.2 研究方法
BP神經(jīng)網(wǎng)絡(luò)是一種多層前反饋神經(jīng)網(wǎng)絡(luò),一般存在等于或者大于三層神經(jīng)元。BP神經(jīng)網(wǎng)絡(luò)主要包括輸入層、中間層和輸出層三部分,上、下層之間是全鏈接,而同一層的相互之間沒有鏈接。標(biāo)準(zhǔn)的BP神經(jīng)網(wǎng)絡(luò)算法核心是“負(fù)梯度下降原理”,即BP神經(jīng)網(wǎng)絡(luò)的誤差總是沿著誤差降落最迅速的目標(biāo)進(jìn)行調(diào)整。建立空氣質(zhì)量污染指標(biāo)數(shù)據(jù)的BP神經(jīng)網(wǎng)絡(luò)模型(圖1)。
圖1 空氣質(zhì)量污染指標(biāo)數(shù)據(jù)的BP神經(jīng)網(wǎng)絡(luò)模型
3.3 結(jié)果分析
(1)分析求解京津冀地區(qū)BP神經(jīng)網(wǎng)絡(luò)模型
以唐山的空氣質(zhì)量數(shù)據(jù)為實(shí)際依據(jù),將京津冀地區(qū)其他城市的空氣質(zhì)量污染指標(biāo)數(shù)據(jù)輸入到BP神經(jīng)網(wǎng)絡(luò)模型中,然后得到該地區(qū)不同城市PM2.5的預(yù)測數(shù)值,最后通過比較預(yù)測的PM2.5指標(biāo)數(shù)據(jù)和實(shí)際的PM2.5指標(biāo)數(shù)據(jù),判斷該城市空氣質(zhì)量數(shù)據(jù)的真實(shí)性。以石家莊為例,分析其數(shù)據(jù)的真實(shí)性。將數(shù)據(jù)輸入到MATLAB中,可以得到石家莊空氣中PM2.5指標(biāo)的預(yù)測值,并繪出石家莊空氣中PM2.5指標(biāo)的預(yù)測值與實(shí)際值的變化趨勢(圖2)。
圖2 石家莊空氣中PM2.5指標(biāo)預(yù)測值與實(shí)際值變化趨勢的對比圖
從圖2可以看出,兩條曲線的變化趨勢大體相同,前面一段時間真實(shí)性較低,接著后面一段時間數(shù)據(jù)真實(shí)性提高,再后來真實(shí)性又降低了,通過BP神經(jīng)網(wǎng)絡(luò)計(jì)算所得的石家莊空氣質(zhì)量數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的誤差平方和為264 794。同理將京津冀地區(qū)其他城市的空氣質(zhì)量數(shù)據(jù)輸入到已構(gòu)建好的BP神經(jīng)網(wǎng)絡(luò)模型中,得到每個城市空氣質(zhì)量數(shù)據(jù)與真實(shí)數(shù)據(jù)的誤差平方和(表1)。
表1 京津冀地區(qū)各個城市誤差平方和(error)
從表1可以看出,京津冀地區(qū)保定、邢臺、張家口的空氣質(zhì)量數(shù)據(jù)與實(shí)際值的誤差平方和過大,即空氣質(zhì)量數(shù)據(jù)明顯不真實(shí)。北京、石家莊、廊坊、秦皇島、衡水、邯鄲和承德的空氣質(zhì)量數(shù)據(jù)較為真實(shí)。天津和滄州這兩個城市的誤差平方和較小,因此這兩個城市的空氣質(zhì)量數(shù)據(jù)是真實(shí)的。
(2)求解長三角地區(qū)BP神經(jīng)網(wǎng)絡(luò)模型
以南通的空氣質(zhì)量數(shù)據(jù)為參照數(shù)據(jù),將長三角地區(qū)其他城市的空氣質(zhì)量污染指標(biāo)數(shù)據(jù)輸入到BP神經(jīng)網(wǎng)絡(luò)模型中,然后得到該地區(qū)不同城市PM2.5的預(yù)測數(shù)值,最后通過比較預(yù)測的PM2.5指標(biāo)數(shù)據(jù)和實(shí)際的PM2.5指標(biāo)數(shù)據(jù),判斷該城市空氣質(zhì)量數(shù)據(jù)的真實(shí)性。以嘉興為例,分析其數(shù)據(jù)的真實(shí)性。將數(shù)據(jù)輸入到MATLAB中,可以得到長三角地區(qū)嘉興空氣中PM2.5指標(biāo)的預(yù)測值,并繪出嘉興空氣中PM2.5指標(biāo)的預(yù)測值與實(shí)際值的變化趨勢(圖3)。
圖3可以看出兩條曲線的變化趨勢大體相同,前面一段時間真實(shí)性較高,中間一段時間數(shù)據(jù)真實(shí)性降低,再后來真實(shí)性又提高了,通過BP神經(jīng)網(wǎng)絡(luò)計(jì)算所得的嘉興空氣質(zhì)量數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的誤差平方和為11 806。同理將長三角地區(qū)其他城市的空氣質(zhì)量數(shù)據(jù)輸入到已構(gòu)建好的BP神經(jīng)網(wǎng)絡(luò)模型中,得到每個城市空氣質(zhì)量數(shù)據(jù)與真實(shí)數(shù)據(jù)的誤差平方和(表2)。
圖3 嘉興空氣中PM2.5指標(biāo)預(yù)測值與實(shí)際值變化趨勢的對比圖
表2 長三角地區(qū)各個城市誤差平方和(error)
由表2看出,長三角地區(qū)舟山的空氣質(zhì)量數(shù)據(jù)與實(shí)際值的誤差平方和較大,即空氣質(zhì)量數(shù)據(jù)明顯不真實(shí)。上海、南京、杭州、蘇州、無錫等城市的空氣質(zhì)量數(shù)據(jù)與真實(shí)值之間的誤差平方和較小,即這些地區(qū)的空氣質(zhì)量數(shù)據(jù)可認(rèn)為是真實(shí)的。
(3)分析求解珠三角地區(qū)BP神經(jīng)網(wǎng)絡(luò)模型
圖4 珠海空氣中PM2.5指標(biāo)預(yù)測值與實(shí)際值變化趨勢的對比圖
以珠海的空氣質(zhì)量數(shù)據(jù)為參照數(shù)據(jù),將珠三角地區(qū)其他城市的空氣質(zhì)量污染指標(biāo)數(shù)據(jù)輸入到BP神經(jīng)網(wǎng)絡(luò)模型中,然后得到該地區(qū)不同城市PM2.5的預(yù)測數(shù)值,最后通過比較預(yù)測的PM2.5指標(biāo)數(shù)據(jù)和實(shí)際的PM2.5指標(biāo)數(shù)據(jù),判斷該城市空氣質(zhì)量數(shù)據(jù)的真實(shí)性。以珠海為例,分析其數(shù)據(jù)的真實(shí)性,具體數(shù)據(jù)輸入到MATLAB中,可以得到珠三角地區(qū)珠??諝庵蠵M2.5指標(biāo)的預(yù)測值,并繪出珠海空氣中PM2.5指標(biāo)的預(yù)測值與實(shí)際值得變化趨勢(圖4)。
表3 珠三角地區(qū)各個城市誤差平方和(error)
從圖4可以看出,兩條曲線的變化趨勢基本相同,前面一段時間真實(shí)性較高,中間一段時間數(shù)據(jù)真實(shí)性降低,再后來真實(shí)性又提高了,最后一段時間數(shù)據(jù)的真實(shí)性又降低,通過BP神經(jīng)網(wǎng)絡(luò)計(jì)算所得的嘉興空氣質(zhì)量數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的誤差平方和為24 956。同理將珠三角地區(qū)其他城市的空氣質(zhì)量數(shù)據(jù)輸入到已構(gòu)建好的BP神經(jīng)網(wǎng)絡(luò)模型中,得到每個城市空氣質(zhì)量數(shù)據(jù)與真實(shí)數(shù)據(jù)的誤差平方和(表3)。
從表3可以看出,珠三角地區(qū)深圳、珠海、江門、肇慶的空氣質(zhì)量數(shù)據(jù)與實(shí)際值的誤差平方和較大,即空氣質(zhì)量數(shù)據(jù)較為不真實(shí)?;葜?、中山、佛門和江門的空氣質(zhì)量數(shù)據(jù)與真實(shí)值之間的誤差平方和較小,即這些地區(qū)的空氣質(zhì)量數(shù)據(jù)可認(rèn)為較為真實(shí)。東莞的誤差平方最小,即東莞的空氣質(zhì)量數(shù)據(jù)是真實(shí)的。
4.1 研究思路
用SPSS進(jìn)行因子分析,利用污染物之間的相關(guān)性減少污染物變量的個數(shù),進(jìn)行降維處理,然后建立多元線性回歸模型,對各個城市的AQI指數(shù)進(jìn)行預(yù)測,最后進(jìn)行誤差分析及擬合優(yōu)度檢驗(yàn),比較確定空氣質(zhì)量數(shù)據(jù)的真實(shí)性。
4.2 研究方法
因子分析是指研究從變量群中提取公共因子的統(tǒng)計(jì)技術(shù),可以在許多變量中找出隱藏的、具有代表性的因子,還可以用來檢驗(yàn)變量間關(guān)系的假設(shè)。因子分析是一種十分實(shí)用的降低變量維數(shù)的方法。因子分析的主要步驟有:①確認(rèn)待分析的原始變量是否適合作因子分析;②構(gòu)造因子變量;③利用旋轉(zhuǎn)方法使因子變量具有可解釋性;④計(jì)算每個樣本的因子變量得分。
因子分析模型中,假定每個原始變量由兩部分組成:共同因子和唯一因子。共同因子是各個原始變量所共有的因子,解釋變量之間的相關(guān)關(guān)系。唯一因子是每個原始變量所特有的因子,表示該變量不能被共同因子解釋的部分。原始變量與因子分析時抽出的共同因子的相關(guān)關(guān)系用因子負(fù)荷表示。
因子分析最常用的理論模式如下:
Zj=aj1F1+aj2F2+aj3F3+…+ajmFm+Uj(j=1,2,3,…,n,n為原始變量總數(shù))
可以用矩陣的形式表示為Z=AF+U。 其中F稱為因子, 由于它們出現(xiàn)在每個原始變量的線性表達(dá)式中(原始變量可以用Xj表示, 這里模型中實(shí)際上是以F線性表示各個原始變量的標(biāo)準(zhǔn)化分?jǐn)?shù)Zj), 因此又稱為公共因子。 因子可理解為高維空間中互相垂直的m個坐標(biāo)軸,A稱為因子載荷矩陣,aji(j=1,2,3,…,n,i=1,2,3,…,m)稱為因子載荷, 是第j個原始變量在第i個因子上的負(fù)荷。 如果把變量Zj看成m維因子空間中的一個向量, 則aji表示Zj在坐標(biāo)軸Fi上的投影, 相當(dāng)于多元線性回歸模型中的標(biāo)準(zhǔn)化回歸系數(shù);U稱為特殊因子, 表示原有變量不能被因子解釋的部分, 其均值為0, 相當(dāng)于多元線性回歸模型中的殘差[6]。 其中, ①Zj為第j個變量的標(biāo)準(zhǔn)化分?jǐn)?shù); ②Fi(i=1,2,…,m)為共同因素; ③m為所有變量共同因素的數(shù)目; ④Uj為變量Zj的唯一因素; ⑤aji為因素負(fù)荷量。
4.3 結(jié)果分析
表4 因子負(fù)荷矩陣
將數(shù)據(jù)導(dǎo)入SPSS中,得到這5個變量的因子負(fù)荷矩陣(表4),將因子負(fù)荷矩陣旋轉(zhuǎn),得到旋轉(zhuǎn)后因子負(fù)荷散點(diǎn)圖,如圖5所示。從因子負(fù)荷散點(diǎn)圖中可以直觀地看出,決定各因子的變量,在散點(diǎn)圖中,如果變量對應(yīng)的點(diǎn)正好落在某坐標(biāo)軸上,則說明該變量值在該坐標(biāo)軸對應(yīng)的因子上有負(fù)荷;如果該點(diǎn)落在圓點(diǎn)附近,則說明因子負(fù)荷較??;如果該點(diǎn)落在坐標(biāo)軸頂端,則說明因子負(fù)荷較大。由圖5可以得出,第一個因子的變量為SO2,第二個因子的變量為PM2.5。
求解出京津冀、長三角、珠三角3個地域空氣污染數(shù)據(jù)真實(shí)性較強(qiáng)的3個城市分別為唐山、嘉興、廣州,根據(jù)因子分析結(jié)果,選取污染物SO2、PM2.5和AQI指數(shù),用Excel篩選出3個城市從2014年10月1日到2014年11月30日的滿足條件的數(shù)據(jù),建立多元線性回歸模型。對京津冀、長三角、珠三角3個地域空氣污染數(shù)據(jù)真實(shí)性較強(qiáng)的3個城市唐山、嘉興、廣州的數(shù)據(jù)用MATLAB進(jìn)行多元線性回歸,得到3個城市的AQI與PM2.5、SO2的多元線性回歸方程:
y1=25.0182+1.1280x1-0.0031x2
y2=18.3732+1.1455x1+0.0035x2
y3=10.3960+1.2133x1+0.1371x2
圖5 旋轉(zhuǎn)后的因子負(fù)荷散點(diǎn)圖
圖6 三個區(qū)域各個城市誤差平方和
由圖6可以看出,京津冀地區(qū)的誤差平方和最大,故北方地區(qū)的空氣污染物數(shù)據(jù)的真實(shí)性較差,長三角地區(qū)和珠三角地區(qū)誤差相對差別不大,因此南方這兩個地區(qū)的空氣污染物數(shù)據(jù)真實(shí)性較好。
從圖6可以看出,京津冀地區(qū)的保定、邢臺兩個城市的數(shù)據(jù)不真實(shí)性較本地區(qū)嚴(yán)重,長三角地區(qū)的鎮(zhèn)江、揚(yáng)州、舟山3個城市的數(shù)據(jù)較本地區(qū)不真實(shí)性嚴(yán)重,珠三角地區(qū)珠海的數(shù)據(jù)較本地區(qū)不真實(shí)性嚴(yán)重。
根據(jù)城市空氣污染數(shù)據(jù)的真實(shí)性判別分析結(jié)果,針對空氣污染數(shù)據(jù)真實(shí)性問題,提出以下建議。
1)重視基層環(huán)境統(tǒng)計(jì)工作,強(qiáng)化人員配置,提高統(tǒng)計(jì)人員的思想意識,把統(tǒng)計(jì)工作放在首要位置,認(rèn)真對待,耐心負(fù)責(zé),同時設(shè)置專職統(tǒng)計(jì)的各項(xiàng)崗位,挑選業(yè)務(wù)能力強(qiáng)、掌握統(tǒng)計(jì)學(xué)相關(guān)知識的專業(yè)人才擔(dān)任統(tǒng)計(jì)相關(guān)工作,加強(qiáng)對統(tǒng)計(jì)人員專業(yè)知識和職業(yè)道德的教育,努力提高基層統(tǒng)計(jì)人員的綜合素質(zhì)和能力。
2)加強(qiáng)基層和媒體對統(tǒng)計(jì)數(shù)據(jù)的監(jiān)測,隨著社會的發(fā)展和人民群眾監(jiān)督意識的加強(qiáng),公眾參與統(tǒng)計(jì)工作的訴求也越來越強(qiáng),對加大環(huán)境信息公開的范圍和力度都有所上升。政府通過鼓勵各大門戶網(wǎng)站或者地方媒體對各級政府公布的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行監(jiān)督檢驗(yàn),來提高統(tǒng)計(jì)數(shù)據(jù)的真實(shí)性。要加強(qiáng)基層環(huán)保監(jiān)測能力,使統(tǒng)計(jì)數(shù)據(jù)能夠反映真實(shí)的情況,建立統(tǒng)計(jì)各部門的溝通機(jī)制,有序高效的將統(tǒng)計(jì)數(shù)據(jù)分配給各部門,每個部門互相監(jiān)督,避免“越位”現(xiàn)象發(fā)生。
3)完善軟件技術(shù)設(shè)施,定期培訓(xùn)和檢測,要進(jìn)一步完善軟件建設(shè),加強(qiáng)統(tǒng)計(jì)人員統(tǒng)計(jì)軟件技術(shù)的培訓(xùn)和學(xué)習(xí)教育,并定期對軟件的正確性進(jìn)行檢測和維修,使統(tǒng)計(jì)人員工作效率得以提高,統(tǒng)計(jì)的真實(shí)性得以加強(qiáng)。
[1]百度百科.空氣污染數(shù)據(jù)判別[EB/OL].[2016-10-02].http://www.docin.com/p-1549177813.html.
[2]張錫穎,曲紅偉.城市空氣污染數(shù)據(jù)的真實(shí)性判別及分析研究[J].科技經(jīng)濟(jì)導(dǎo)刊,2016(11):123-124.
[3]王妮妮.上海市空氣質(zhì)量監(jiān)測數(shù)據(jù)的規(guī)律研究及在數(shù)據(jù)審核中的應(yīng)用[D].上海:東華大學(xué),2010.
[4]司守奎,孫璽菁.數(shù)學(xué)建模算法與應(yīng)用[M].北京:國防工業(yè)出版社,2015.
[5]姜啟源,謝金星,葉俊.數(shù)學(xué)模型[M].北京:高等教育出版社,2015.
[6]楊桂元,朱家明.數(shù)學(xué)建模競賽優(yōu)秀論文評析[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2014:1-70.
[7]卓金武.MATLAB在數(shù)學(xué)建模中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2014:20-54.
[8]趙家剛,李世友.多元線性回歸模型的研究與應(yīng)用[J].科技信息,2009(16):61-62.
[9]王豐效,周偉萍.灰色多元線性回歸方法的改進(jìn)及應(yīng)用[J].重慶理工大學(xué)學(xué)報(bào),2012,26(08):113-116.
[10]蘇變萍,曹艷平.基于灰色系統(tǒng)理論的多元線性回歸分析[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2006,36(08):219-222.
[11]馬健,盛魁.基于遺傳BP神經(jīng)網(wǎng)絡(luò)組合模型的中藥銷售預(yù)測研究[J].河北北方學(xué)院(自然科學(xué)版),2013,29(04):15-20.
[12]潘婷,楊鵬輝,張依一,等.京津冀地區(qū)空氣污染的分析與評價(jià)[J].河北北方學(xué)院(自然科學(xué)版),2016,32(07):31-37.
[13]劉權(quán),楊鵬輝,劉潤茜,等.蚌埠市空氣中PM2.5形成與擴(kuò)散的研究[J].河北北方學(xué)院(自然科學(xué)版),2016,32(07):35-42.
[責(zé)任編輯:王榮榮 英文編輯:劉彥哲]
Discrimination of Authenticity of Urban Air Pollution Data Based on BP Neural Network
CHEN Lu-lu1,CHEN Fu-yuan2,YANG Peng-hui2,HUANG Yan-hong2,CHEN Meng-qian2
(1.School of Finance,Anhui University of Finance and Economics,Bengbu,Anhui 233030,China; 2.School of Statistics and Applied mathematics,Bengbu,Anhui 233030,China)
Objective For the truthfulness of urban air pollution data collected and processed in Beijing-Tianjin-Hebei,Yangtze river delta and Pearl river delta,the authenticity of the data was judged,and some suggestions were given for the improvement of air pollution data authenticity.Method The factor analysis and multivariate statistical methods were used to construct the BP neural network and multivariate linear regression model.MATLAB,SPSS and EXCEL softwares were used to analyze the volatility of air quality data,obtaining the authenticity of the urban air pollution data results.Results The data of Tianjin,Cangzhou,Shanghai,Dongguan and other cities air pollution were real,but the air pollution data of Baoding,Xingtai,Zhenjiang,Yangzhou,Zhoushan,Zhuhai and other cities had serious inauthenticity.Conclusion Attention should be paid to the basic environment statistical work,the grass-roots and the media focus on statistics,and software technology facilities should be improved.
air quality;the BP neural network;MATLAB
國家自然科學(xué)基金項(xiàng)目:“3-流猜想,F(xiàn)ulkerson-覆蓋及相關(guān)問題”(11601001)
陳璐璐(1996-),女,安徽安慶人,安徽財(cái)經(jīng)大學(xué)金融學(xué)院在讀學(xué)生,研究方向:金融學(xué)。
楊鵬輝(1981-),女,安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用學(xué)院講師,碩士,研究方向:應(yīng)用數(shù)學(xué)與數(shù)學(xué)建模。
Q 948.116
A
10.3969/j.issn.1673-1492.2017.07.008
來稿日期:2016-11-03