董家驊 李 晨 司正方圓
為了研究催化轉(zhuǎn)化器對高速公路周圍環(huán)境質(zhì)量的影響,環(huán)境保護(hù)局在洛杉磯圣地亞哥高速公路邊建立了若干空氣監(jiān)測站并收集了相關(guān)數(shù)據(jù)。本文基于此數(shù)據(jù)進(jìn)行分析,具體闡述了CO濃度與交通密度以及風(fēng)速的關(guān)系。
一、問題相關(guān)數(shù)據(jù)
交通和風(fēng)向量是影響環(huán)境CO濃度的兩個主要因素??諝鈾z測站A位于圣地亞哥高速公路北緯145度方向約25英尺處。它的位置使得風(fēng)從145到325度將高速公路的CO排放物輸送到測量站。檢測站每天每小時記錄聚集測量值與風(fēng)向、風(fēng)速。此外,每條行車道的平均交通速度與每小時的車流量也被記錄。
交通包括交通速度與交通數(shù)量兩個部分。根據(jù)參考論文(1),交通速度與交通數(shù)量并未直接反映出CO濃度的大小,因此他們建議考慮交通密度[TD],即交通流量與交通速度的比率。
風(fēng)向[WD]是影響CO濃度的一個重要因素,因為它控制著污染物的運(yùn)輸方向。風(fēng)速[WS]也同樣重要,因為在更高的風(fēng)速下,更多的CO將被擴(kuò)散。根據(jù)參考文獻(xiàn)(2),風(fēng)矢量可分解為兩個組成部分,一個垂直[ ]和另一個平行[ ]到高速公路:
因為空氣監(jiān)測站A與馬路呈垂直方向,所以僅 與CO濃度密切相關(guān),因此后面將 記做WS。
下圖顯示了夏季工作日的交通密度數(shù)據(jù)、風(fēng)向量數(shù)據(jù)以及CO濃度平均值的晝夜變化數(shù)據(jù)。
圖1 夏季工作日數(shù)據(jù)展示
從圖中可以看出,夏季工作日交通密度單日具有兩個峰值,分別在9點與18點;從午夜到上午9點WS幾乎為零,在午后時分WS達(dá)到峰值;CO的工作日晝夜模式表現(xiàn)出對應(yīng)于早晨和下午高峰時段交通的兩個峰值。
二、模型的建立與求解
2.1 模型的建立
根據(jù)參考文獻(xiàn)(3),我們可以得到以下幾點結(jié)論:
· CO濃度與交通密度幾乎呈線性關(guān)系。
· 由于風(fēng)的擴(kuò)散效應(yīng)和傳輸效應(yīng),CO與風(fēng)速間具有二次依賴性。
· CO濃度趨勢有非正常的日常趨勢,因此可以使用sin和cos諧波來適應(yīng)周期性趨勢。
基于此,我們可構(gòu)建CO濃度和交通密度與風(fēng)速之間的回歸模型如下:
其中,CO為平均CO濃度,TD為平均交通密度,WS為平均垂直分量風(fēng)速,t為時間(以小時為單位,從午夜至午夜)。
2.2 模型的求解
對上述變換過的變量的數(shù)據(jù)用R語言進(jìn)行回歸建模以及變量篩選,得到結(jié)果如下。
通過觀察,回歸方程中WS、Sin(2πt/24)、Cos(2πt/24) 與Sin(4πt/24) 的系數(shù)都沒有通過顯著性試驗,其P值均大于0.05。因此,運(yùn)用逐步回歸的優(yōu)化方法,對模型進(jìn)行一定的調(diào)整。
由于去除Sin(2πt/24) 可以使得AIC達(dá)到最小值,因此R會自動去掉Sin(2πt/24) ;以此類推,最終去除Sin(2πt/24) 與Sin(4πt/24) 后可得最優(yōu)的回歸方程。
此時,所有的系數(shù)檢驗均為顯著。同時,檢驗回歸模型的三個統(tǒng)計量分別為:相關(guān)系數(shù)R2=0.9889 ,F(xiàn)=412.2 ,與F對應(yīng)的概率p<2.2e-16 。相關(guān)系數(shù)接近于1,p值趨近于0,說明模型回歸暫時較為理想。
三、結(jié)果分析
最終可得CO濃度的回歸模型為:
模型型估計結(jié)果說明,在假定其它變量不變的情況下,當(dāng)交通密度每增加一個單位時,CO濃度增加1.7×10-16% ;平均垂直風(fēng)向量為4時,CO濃度位于最大狀態(tài)。
將原數(shù)據(jù)與擬合值進(jìn)行比較(如圖5),結(jié)果顯示,預(yù)測值與真實值能夠較好地吻合,點和線幾乎重合。