吳千鵬,尹 立,李興榮,孫 羽,黃開龍,蘇春芳,王式功*
(1.成都信息工程大學(xué)大氣科學(xué)學(xué)院/環(huán)境氣象與健康研究院,四川 成都610225;2.攀枝花市中心醫(yī)院氣象醫(yī)學(xué)研究中心,四川 攀枝花617000;3.深圳市氣象局,廣東 深圳518040;4.海南省第二人民醫(yī)院氣候醫(yī)學(xué)研究中心,海南 五指山572299;5.汕頭市氣象局,廣東 汕頭515041)
呼吸系統(tǒng)疾病是人體最常見、多發(fā)的疾病之一,因其對天氣氣候變化有著較高的敏感度,致使人體極易患病影響健康,故又被叫做氣象敏感性疾病。隨著全球氣候變化對人類健康產(chǎn)生的影響進(jìn)一步加劇,呼吸系統(tǒng)等相關(guān)氣候敏感性疾病發(fā)病率增加[1-3]。聯(lián)合國政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)第六次評估報告指出,天氣氣候變化導(dǎo)致熱浪、干旱和洪水等極端氣候事件增多、天氣驟變加劇,相關(guān)氣象敏感性疾?。ê粑到y(tǒng)疾病等)發(fā)病率、死亡率逐年增加[4]。在氣候異常變化這一大背景下,天氣氣候因素很可能會對我國氣候敏感人群特別是老人、兒童或患有呼吸系統(tǒng)疾病等人群構(gòu)成巨大威脅。
天氣氣候變化是誘發(fā)呼吸系統(tǒng)疾病的主要原因之一,即呼吸系統(tǒng)疾病等氣象敏感性疾病的發(fā)生發(fā)展與天氣氣候有著非常密切的關(guān)系[5-11]。在溫度、濕度、風(fēng)速等氣象要素相對適宜的情況下呼吸系統(tǒng)疾病發(fā)病或死亡人數(shù)最少,超出舒適范圍人體均有不同程度的不良反應(yīng)[11-17]。另外,大氣污染狀況及其變化也會對呼吸系統(tǒng)疾病的發(fā)病率及死亡率產(chǎn)生影響[17-21]?;跉庀蠛铜h(huán)境數(shù)據(jù)與呼吸系統(tǒng)疾病數(shù)據(jù)間的密切相關(guān)性,如何利用這些數(shù)據(jù)構(gòu)建較優(yōu)的呼吸系統(tǒng)疾病預(yù)測模型,為呼吸系統(tǒng)疾病醫(yī)療氣象服務(wù)提供一定的科學(xué)指導(dǎo),非常重要。以往研究者傾向于使用回歸分析來反映氣象要素和敏感性疾病之間的關(guān)系[5,22-33],其中被廣泛使用的是多元回歸和逐步回歸??紤]到氣象環(huán)境條件變化和人體疾病發(fā)病間的非線性關(guān)系,且存在著一定的滯后效應(yīng),被最常應(yīng)用的模型是廣義相加模型(GAM)和分布滯后非線性模型(DLNM)[24-31]。隨著科技的進(jìn)步,機器學(xué)習(xí)廣泛應(yīng)用于氣象領(lǐng)域,目前主要應(yīng)用于氣象觀測、數(shù)值天氣預(yù)報、強對流天氣識別預(yù)警以及衛(wèi)星資料應(yīng)用等方面[34-38],同時也應(yīng)用于對醫(yī)療就診人數(shù)的預(yù)測[9,10,45]。
深圳作為我國發(fā)展最快的一線城市,地處典型的東亞季風(fēng)氣候區(qū),在一年之中,季風(fēng)在每年4 和9月轉(zhuǎn)換方向[39],季風(fēng)預(yù)示著相關(guān)地區(qū)氣候狀況的大轉(zhuǎn)折,對當(dāng)?shù)毓まr(nóng)業(yè)生產(chǎn)和人民群眾的日常生活產(chǎn)生重要影響。季風(fēng)轉(zhuǎn)換會對居民健康產(chǎn)生何種影響?目前尚未見到國內(nèi)外相關(guān)報道。因而這是非常值得研究的問題。健康氣象服務(wù)作為未來氣象服務(wù)領(lǐng)域拓展的重點方向之一,已將其列入2021 年11 月發(fā)布的我國氣象事業(yè)發(fā)展“十四五”規(guī)劃中,提出要建立疾病發(fā)生發(fā)展風(fēng)險預(yù)測模型。基于貫徹落實國家大健康政策及廣大民眾疾病預(yù)防的現(xiàn)實需求,研究構(gòu)建呼吸系統(tǒng)疾病等氣象敏感性疾病預(yù)測模型顯得尤為迫切。開展季風(fēng)轉(zhuǎn)換對呼吸系統(tǒng)疾病的影響研究,既是踐行國家全民大健康戰(zhàn)略實施的具體行動,又有重要科學(xué)價值,意義非凡。本文利用深圳地區(qū)風(fēng)向風(fēng)速等資料研究季風(fēng)及其轉(zhuǎn)換對呼吸系統(tǒng)疾病的影響,基于不同季風(fēng)影響期間內(nèi),下呼吸道感染疾病均對氣象和環(huán)境條件敏感性更強,利用BP 人工神經(jīng)網(wǎng)絡(luò)和LSTM 網(wǎng)絡(luò)方法嘗試建立當(dāng)?shù)叵潞粑栏腥炯膊“l(fā)病風(fēng)險預(yù)測模型,以期為深圳市呼吸系統(tǒng)疾病預(yù)防提供科學(xué)依據(jù)和技術(shù)支持,同時也可豐富季風(fēng)及其轉(zhuǎn)換背景下的醫(yī)學(xué)氣象學(xué)理論內(nèi)涵。
呼吸系統(tǒng)疾病日就診資料來源于深圳市龍華區(qū)觀瀾中心醫(yī)院2015 年1 月1 日—2016 年12 月31日每日就診記錄,該院為深圳市三級甲等醫(yī)院,位于中心城區(qū),具有一定的代表性。氣象數(shù)據(jù)來自中國氣象科學(xué)數(shù)據(jù)共享平臺提供的國家基準(zhǔn)站常規(guī)氣象數(shù)據(jù),包括氣溫、氣壓、相對濕度、水汽壓等;污染數(shù)據(jù)來自中國監(jiān)測網(wǎng)(https://www.aqistudy.cn),包括PM2.5、PM10、CO、SO2、NO2等污染物質(zhì)量濃度。
1.2.1 相關(guān)分析
不同環(huán)境要素和當(dāng)?shù)睾粑到y(tǒng)疾病的就診人數(shù)之間有明確的相關(guān)性,描述變量間的相關(guān)程度,最常用的是Spearman 秩相關(guān)系數(shù)rs,本文利用Spearman相關(guān)分析環(huán)境因子與當(dāng)?shù)蒯t(yī)院就診人數(shù)之間的相關(guān)程度。計算方法為:
式中,rs為Spearman 秩相關(guān)系數(shù),n 為樣本量個數(shù),其中假定原始數(shù)據(jù)xi(環(huán)境因子)、Yi(疾病就診人數(shù))已按時間順序進(jìn)行排列,記為原數(shù)據(jù)xi、Yi在排列后數(shù)據(jù)所在位置的秩次之差
1.2.2 長短期記憶網(wǎng)絡(luò)(LSTM 網(wǎng)絡(luò))
氣象要素對呼吸系統(tǒng)疾病發(fā)生的影響具有一定的滯后性[24-31,40-44],大多數(shù)氣象要素的滯后為1~3 d。LSTM 網(wǎng)絡(luò)(Long-Short Term Memory)由于其獨特的設(shè)計結(jié)構(gòu),適合處理和預(yù)測時間序列。
LSTM 網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一個變體,可以有效地解決簡單循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的梯度爆炸或消失問題[45-46]。這種網(wǎng)絡(luò)由輸入層、輸出層和之間若干層(一層或多層)隱含層構(gòu)成,主要改進(jìn)在2 個方面:一是引入一個新的內(nèi)部狀態(tài)專門進(jìn)行線性的循環(huán)信息傳遞,同時(非線性地)輸出信息給隱藏層的外部狀態(tài)。二是引入門控機制(Gating Mechanism)控制信息傳遞的路徑,總共有三個“門”:輸入門(控制當(dāng)前時刻的候選狀態(tài)有多少信息需要保存)、遺忘門(控制上一個時刻的內(nèi)部狀態(tài)需要遺忘多少信息)和輸出門(控制當(dāng)前時刻的內(nèi)部狀態(tài)有多少信息需要輸出給外部狀態(tài))。
1.2.2.1 歸一化處理
樣本數(shù)據(jù)量綱、單位往往不同,進(jìn)而會影響數(shù)據(jù)分析的結(jié)果。為消除樣本數(shù)據(jù)之間的量綱影響、消除奇異樣本數(shù)據(jù)導(dǎo)致的不良影響,且為滿足節(jié)點函數(shù)要求,提高網(wǎng)絡(luò)訓(xùn)練速度和收斂性,歸一化處理公式為:
式中:xij為歸一化后的值,Xij為原始值,ximin為自變量Xi中的最小值,ximax為自變量Xi中的最大值;i、j分別為自變量序號和樣本序號。
1.2.2.2 隱藏層中的節(jié)點個數(shù)
由于學(xué)術(shù)界到目前為止沒有明確的理論規(guī)定隱藏層中的節(jié)點個數(shù),通常情況下使用以下公式確定節(jié)點個數(shù):
式中:m 為隱藏層節(jié)點數(shù),n 為輸入層節(jié)點數(shù),l 為輸出層節(jié)點數(shù);α 為調(diào)節(jié)常數(shù),為1~10。根據(jù)文中所選變量的個數(shù),可以知道輸入節(jié)點為11 ,輸出節(jié)點為1,公式(3)可知隱藏節(jié)點為4~14。運用1 層LSTM模型,試驗并確定從4~14 個節(jié)點所對應(yīng)的誤差率及誤差平方和,并以此來判斷模型的偏離程度。進(jìn)而選取合適的隱藏層節(jié)點個數(shù)。
1.2.2.3 網(wǎng)絡(luò)結(jié)構(gòu)
學(xué)習(xí)率設(shè)置成0.001,權(quán)重W*、U*與偏移向量b*,以上參數(shù)全部實現(xiàn)初始化隨機應(yīng)用。為了更新權(quán)重與偏差度,需要不斷的訓(xùn)練序列來實現(xiàn)。選用平均絕對誤差(MSE)表示所用LSTM 模型中損失函數(shù)的修正誤差,并使用Adam 優(yōu)化器,促使網(wǎng)絡(luò)實現(xiàn)最優(yōu)化學(xué)習(xí)。
1.2.3 試預(yù)報模型的評價
在構(gòu)建呼吸系統(tǒng)疾病預(yù)測模型、進(jìn)行預(yù)測模型優(yōu)度檢驗時,主要使用平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)和預(yù)測準(zhǔn)確度(P)等指標(biāo)對預(yù)測模型的效果進(jìn)行評價,其中Yi是實際值,yi是預(yù)測值,n 是樣本數(shù),計算方法如下:
通過整理深圳地區(qū)2015 年1 月1 日—2016 年12 月31 日呼吸系統(tǒng)疾病數(shù)據(jù)資料,發(fā)現(xiàn)每年2 月深圳地區(qū)呼吸系統(tǒng)疾病就診人數(shù)最少,這與春節(jié)期間深圳務(wù)工人員返鄉(xiāng)、外流人口較多有關(guān)聯(lián)。因此在分析深圳地區(qū)呼吸系統(tǒng)疾病就診人數(shù)的逐月分布時,剔除了2 月原始呼吸系統(tǒng)疾病數(shù)據(jù),利用2 月前后2 個月的呼吸系統(tǒng)疾病數(shù)據(jù)對2 月的疾病數(shù)據(jù)進(jìn)行訂正。圖1a 為訂正后2015—2016 年深圳地區(qū)呼吸系統(tǒng)疾病就診人數(shù)的年內(nèi)逐月變化。深圳總呼吸系統(tǒng)疾病日均就診人數(shù)3 月最多,為288 人/d,總呼吸系統(tǒng)疾病日均就診人數(shù)8 月最少(187 人/d),3 月下呼吸道感染就診人數(shù)最多,6 月上呼吸道感染就診人數(shù)最多。雖然各類呼吸系統(tǒng)疾病就診人數(shù)呈現(xiàn)一定的波動性,但也有相同之處:即2—3 月總呼吸系統(tǒng)(ICD10 編碼J00-J99)、上呼吸道感染(簡稱“上感”,ICD10 編碼J00-J04,J06)和下呼吸道感染(簡稱“下感”,ICD10 編碼J10,J12,J15,J16 等)就診人數(shù)有明顯的增多,可能與冬季風(fēng)持續(xù)影響及其累積效應(yīng)有關(guān),季節(jié)交替就診人數(shù)明顯增加,由于季節(jié)變換時氣溫、濕度等氣象條件出現(xiàn)突變,也可能是春節(jié)后深圳市人口增多的緣故。圖1b 中填色部分對應(yīng)月(冬季1 月、秋季11 月、春季3 月)分別為遼寧北票、北京和深圳呼吸系統(tǒng)疾病高發(fā)月,北票和北京對呼吸系統(tǒng)疾病為冷效應(yīng),深圳為熱效應(yīng),2—3 月北票和北京在季風(fēng)轉(zhuǎn)換前升溫快,而深圳升溫慢,回暖弱,所以北票和北京在秋、冬季呼吸系統(tǒng)疾病有峰值,深圳冬季風(fēng)向夏季風(fēng)轉(zhuǎn)換前呼吸系統(tǒng)疾病發(fā)病出現(xiàn)峰值。
圖1 深圳地區(qū)呼吸系統(tǒng)疾病日均就診人數(shù)和升溫率的逐月變化
深圳地處東亞季風(fēng)氣候區(qū),其風(fēng)向會隨著冬季風(fēng)、夏季風(fēng)的控制及其轉(zhuǎn)換而變化。其中,由冬季風(fēng)轉(zhuǎn)換為夏季風(fēng)的過渡期一般發(fā)生在4 月,夏季風(fēng)轉(zhuǎn)換為冬季風(fēng)的過渡期一般發(fā)生在9 月[39]。
本文綜合2015—2016 年各月深圳平均10 min風(fēng)速風(fēng)向特征和各月主導(dǎo)風(fēng)控制天數(shù)(表1)研究發(fā)現(xiàn),2015—2016 年深圳地區(qū)季節(jié)轉(zhuǎn)換月分別出現(xiàn)在4 和9 月,其中,5—8 月主要受夏季風(fēng)(偏南風(fēng))控制,10 月—次年3 月主要受冬季風(fēng)(偏北風(fēng))控制。對照圖1 可看出,夏季風(fēng)控制期間深圳地區(qū)總呼吸系統(tǒng)疾病就診人數(shù)一直減少,反映出中醫(yī)理論闡述的“春夏為陽”的養(yǎng)生氣候特征;相反,冬季風(fēng)控制期間深圳地區(qū)總呼吸系統(tǒng)疾病就診人數(shù)一直在增加,反映出中醫(yī)理論中論述的“秋冬為陰”的氣候特征,此時需加強疾病預(yù)防。另外,上感與下感對季節(jié)轉(zhuǎn)換的響應(yīng)略有差異。
表1 深圳地區(qū)2015—2016 年各月主導(dǎo)風(fēng)控制天數(shù)占比
綜合圖1 和表1 可知:(1)每年9 月開始的冬季風(fēng)對當(dāng)?shù)鼐用竦睦涿{迫效應(yīng)會使相關(guān)人群總呼吸系統(tǒng)疾病發(fā)病人數(shù)波動式增加,直至次年冬季風(fēng)為夏季風(fēng)轉(zhuǎn)換前的3 月發(fā)病人數(shù)達(dá)到峰值。(2)每年4 月冬季風(fēng)開始轉(zhuǎn)換為夏季風(fēng),整個夏季風(fēng)控制期間對當(dāng)?shù)鼐用竦臏責(zé)嵝?yīng)使相關(guān)人群總呼吸系統(tǒng)疾病發(fā)病人數(shù)呈波動式減少態(tài)勢,直至夏季風(fēng)轉(zhuǎn)換為冬季風(fēng)之前的8 月發(fā)病人數(shù)達(dá)到谷值,比峰值減少35%。(3)去掉季風(fēng)風(fēng)向轉(zhuǎn)換月(4 和9 月),深圳地區(qū)夏季風(fēng)主導(dǎo)期間總呼吸系統(tǒng)疾病日均就診人數(shù)比冬季風(fēng)主導(dǎo)期間多7.26%。但上感與下感又有差異,其中夏季風(fēng)主導(dǎo)期間上感日均就診人數(shù)比冬季風(fēng)主導(dǎo)期間多22.93%,下感就診人數(shù)夏季風(fēng)主導(dǎo)期間比冬季風(fēng)主導(dǎo)期間少5.58%。
深圳地區(qū)3 月就診人數(shù)表現(xiàn)出較為明顯的階段性爆發(fā),圖2 為2016 年3—4 月深圳地區(qū)24 h 變溫與呼吸系統(tǒng)疾病就診人數(shù)逐日變化。深圳地區(qū)24 h變溫與總呼吸系統(tǒng)疾病就診人數(shù)逐日變化關(guān)系密切,相鄰2 d 內(nèi)氣溫變化趨勢相反(第一天升溫第二天降溫或第一天降溫第二天升溫)呼吸系統(tǒng)疾病就診人數(shù)都會增加。
圖2 2016 年3—4 月深圳地區(qū)冬季風(fēng)向夏季風(fēng)轉(zhuǎn)換期間24 h 變溫與呼吸系統(tǒng)疾病就診人數(shù)逐日變化
表2 列出了2015—2016 年不同季風(fēng)影響期間深圳地區(qū)呼吸系統(tǒng)就診人數(shù)與各氣象環(huán)境因子變量之間的相關(guān)系數(shù)。氣象要素對呼吸系統(tǒng)疾病的發(fā)生有較為顯著的影響,整體來看,下感就診人數(shù)與氣象環(huán)境因子變量間的相關(guān)性更強。氣壓和氣溫與下感患病人數(shù)的相關(guān)性最好,水汽壓與下感患病人數(shù)相關(guān)性次之。下感就診人數(shù)與氣壓呈顯著正相關(guān),與氣溫、水汽壓和風(fēng)速呈顯著負(fù)相關(guān)。下感發(fā)病人數(shù)還與各污染物濃度呈顯著正相關(guān)。
表2 深圳地區(qū)呼吸系統(tǒng)發(fā)病人數(shù)與主要環(huán)境因子的Spearman 相關(guān)
因研究區(qū)域下感就診人數(shù)與環(huán)境氣象要素間的相關(guān)性更強,即下感發(fā)病對氣象和環(huán)境條件更敏感,且已有較多新的方法構(gòu)建過上感風(fēng)險預(yù)測模型[10,26],所以本文著重研究下感風(fēng)險預(yù)測模型。夏季風(fēng)控制期間內(nèi)下感就診人數(shù)預(yù)報方程使用的氣象和環(huán)境要素為:平均氣溫、平均最高氣溫、平均最低氣溫、平均氣壓、平均最高氣壓、平均最低氣壓、水汽壓、最大風(fēng)速、極大風(fēng)速、PM2.5、PM10、SO2,冬季風(fēng)控制期間內(nèi)下感疾病就診人數(shù)預(yù)報方程使用的氣象和環(huán)境要素為:平均氣溫、平均最高氣溫、平均最低氣溫、平均氣壓、平均最高氣壓、平均最低氣壓、水汽壓、最大風(fēng)速、PM2.5、PM10、SO2、NO2、CO。氣象要素對呼吸系統(tǒng)疾病發(fā)生的影響具有一定的滯后性[28,31-33],大多數(shù)氣象要素滯后為1~3 d,對疾病數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行滑動平均處理,因空氣污染因子對呼吸系統(tǒng)疾病發(fā)生的影響是即時效應(yīng)[15],所以未對污染數(shù)據(jù)作平滑處理。
深圳地區(qū)季風(fēng)風(fēng)向由冬季風(fēng)(偏北風(fēng))轉(zhuǎn)為夏季風(fēng)(偏南風(fēng))后,深圳地區(qū)受夏季風(fēng)(偏南風(fēng))影響期間下感就診人數(shù)大體上隨時間一直減少,深圳地區(qū)季風(fēng)風(fēng)向夏季風(fēng)(偏南風(fēng))轉(zhuǎn)為冬季風(fēng)(偏北風(fēng))后,深圳地區(qū)受冬季風(fēng)(偏北風(fēng))影響期間(剔除2 月的數(shù)據(jù))的下感就診人數(shù)隨時間推移一直增多,因此本文構(gòu)建下呼吸道疾病感染風(fēng)險預(yù)測模型時,大致劃分為2 個時間段:夏季風(fēng)影響期間(4—8 月)和冬季風(fēng)影響期間(9—12 月、1 和3 月)。每年2 月呼吸系統(tǒng)疾病就診人數(shù)為最小值,這很可能與春節(jié)期間外來人口返鄉(xiāng)、加之流動人口也大幅度減少等有關(guān),因此后續(xù)在構(gòu)建預(yù)測模型時將2 月相關(guān)數(shù)據(jù)剔除,以便更好地排除其他人為因素干擾,抓取典型的自然氣候影響特征分析主要趨勢,利于提高模型的學(xué)習(xí)效果、改善其預(yù)報準(zhǔn)確度。
2.3.1 夏季風(fēng)影響期間下感風(fēng)險預(yù)測模型
2.3.1.1 BP 人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型
將總樣本歸一化處理后的80%作為輸入、對應(yīng)的就診人數(shù)作為輸出建立BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型,輸入層神經(jīng)元個數(shù)為12,輸出層神經(jīng)元個數(shù)為1,傳遞函數(shù)選擇Purelin。隱含層為1 層,通過經(jīng)驗公式和試湊法等確定隱含層神經(jīng)元數(shù)目為6,傳遞函數(shù)為Logsig。深圳下感疾病就診人數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測模型結(jié)構(gòu)為12-6-1,訓(xùn)練精度為0.001。此時網(wǎng)絡(luò)穩(wěn)定性達(dá)到最好,試預(yù)報和擬合效果也較好。經(jīng)BP 神經(jīng)網(wǎng)絡(luò)算法進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練,建立下感人數(shù)與空氣污染物濃度的關(guān)系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)輸入層中,對驗證樣本進(jìn)行仿真驗證。對仿真結(jié)果進(jìn)行反歸一化,得到下感就診人數(shù)驗證樣本的仿真值(圖3)。對試預(yù)報結(jié)果進(jìn)行統(tǒng)計分析,檢驗試預(yù)報方程效果:平均絕對誤差MAE 為14.72,平均絕對百分比誤差MAPE 為12.04%,均方根誤差RMSE 為21.93,預(yù)測準(zhǔn)確率P 為87.89%。
圖3 深圳地區(qū)夏季風(fēng)影響期間下感疾病就診人數(shù)的模擬值與實際值擬合曲線(BP 網(wǎng)絡(luò))
2.3.1.2 LSTM 網(wǎng)絡(luò)(長短時記憶神經(jīng)網(wǎng)絡(luò))
將總樣本歸一化處理后的80%作為輸入、對應(yīng)的就診人數(shù)作為輸出建立LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測模型,夏季風(fēng)期間輸入層神經(jīng)元個數(shù)為12,輸出層神經(jīng)元個數(shù)為1,隱含層為1 層,運用1 層LSTM 模型,試驗并確定從4~14 個節(jié)點所對應(yīng)的誤差率及誤差平方和,并以此判斷模型的偏離程度,進(jìn)而確定隱藏層節(jié)點個數(shù)為9。經(jīng)LSTM 神經(jīng)網(wǎng)絡(luò)算法進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練,建立下感疾病就診人數(shù)與環(huán)境要素的關(guān)系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)輸入層中,對驗證樣本進(jìn)行仿真驗證。對仿真結(jié)果進(jìn)行反歸一化,得到下感疾病就診人數(shù)驗證樣本的仿真值(圖4)。對試預(yù)報結(jié)果進(jìn)行統(tǒng)計分析,檢驗試預(yù)報方程效果為:平均絕對誤差MAE 為10.27,平均絕對百分比誤差MAPE 為8.47%,均方根誤差RMSE 為13.21,預(yù)測準(zhǔn)確率P 為91.56%。
圖4 深圳地區(qū)夏季風(fēng)影響期間下感疾病就診人數(shù)的模擬值與實際值擬合曲線(LSTM 網(wǎng)絡(luò))
2.3.2 冬季風(fēng)影響期間下感風(fēng)險預(yù)測模型
2.3.2.1 BP 人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型
輸入層神經(jīng)元個數(shù)為13,輸出層神經(jīng)元個數(shù)為1,傳遞函數(shù)選擇Tansig。隱含層為1 層,通過經(jīng)驗公式和試湊法等確定隱含層神經(jīng)元數(shù)目為6,傳遞函數(shù)為Logsig。深圳下感疾病就診人數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測模型結(jié)構(gòu)為13-6-1,訓(xùn)練精度為時0.001。此時網(wǎng)絡(luò)達(dá)到最好,試預(yù)報和擬合效果也較好。經(jīng)BP 神經(jīng)網(wǎng)絡(luò)算法進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練,建立下感人數(shù)與環(huán)境要素的關(guān)系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)輸入層中,對驗證樣本進(jìn)行仿真驗證。對仿真結(jié)果進(jìn)行反歸一化,得到下感就診人數(shù)驗證樣本的仿真值(圖5)。對試預(yù)報結(jié)果進(jìn)行統(tǒng)計分析,檢驗試預(yù)報方程效果為:平均絕對誤差MAE 為20.55,平均絕對百分比誤差MAPE 為16.36%,均方根誤差RMSE 為29.84,預(yù)測準(zhǔn)確率P 為82.33%。
圖5 深圳地區(qū)冬季風(fēng)影響期間下感疾病就診人數(shù)的模擬值與實際值擬合曲線(BP 神經(jīng)網(wǎng)絡(luò))
2.3.2.2 LSTM 網(wǎng)絡(luò)(長短時記憶神經(jīng)網(wǎng)絡(luò))
將總樣本歸一化處理后的80%作為輸入、對應(yīng)的就診人數(shù)作為輸出建立LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測模型,輸入層神經(jīng)元個數(shù)為13,輸出層神經(jīng)元個數(shù)為1,隱含層為1 層,運用1 層LSTM 模型,試驗并確定從4~14 個節(jié)點所對應(yīng)的誤差率及誤差平方和,并以此來判斷模型的偏離程度,進(jìn)而確定隱藏層節(jié)點個數(shù)為6 個。經(jīng)LSTM 神經(jīng)網(wǎng)絡(luò)算法進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練,建立下感疾病就診人數(shù)與環(huán)境要素的關(guān)系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)輸入層中,對驗證樣本進(jìn)行仿真驗證。對仿真結(jié)果進(jìn)行反歸一化,得到下感就診人數(shù)驗證樣本的仿真值(圖6)。對試預(yù)報結(jié)果進(jìn)行統(tǒng)計分析,檢驗試預(yù)報方程效果為:平均絕對誤差MAE 為17.87,平均絕對百分比誤差M APE 為16.22%,均方根誤差RMSE 為24.31,預(yù)測準(zhǔn)確率P為84.64%。
圖6 冬季風(fēng)影響期間下感疾病就診人數(shù)的模擬值與實際值擬合曲線(LSTM 網(wǎng)絡(luò))
深圳地區(qū)受夏季風(fēng)控制期間2 種預(yù)報模型的預(yù)報結(jié)果均好于受冬季風(fēng)控制時段,這與冬季風(fēng)控制時氣象因子和就診人數(shù)變化幅度較大有關(guān)。
2.3.3 兩種模型的對比與評價
為客觀評價2 種模型對深圳地區(qū)下感疾病就診人數(shù)的預(yù)測能力,將兩種模型的預(yù)報效果進(jìn)行比較(表3),與BP 神經(jīng)網(wǎng)絡(luò)對比,LSTM 網(wǎng)絡(luò)的平均絕對誤差和平均絕對百分比誤差更小,預(yù)測準(zhǔn)確度更高,預(yù)測模型精度略勝一籌,總體上LSTM 網(wǎng)絡(luò)預(yù)測模型表現(xiàn)更優(yōu)。
表3 2 種預(yù)測模型對比
(1)2015—2016 年深圳總呼吸系統(tǒng)疾病日均就診人數(shù)3 月最多(288 人/d),8 月最少(187 人/d),3月下感就診人數(shù)最多,6 月上感就診人數(shù)最多。深圳地區(qū)春、夏季為呼吸系統(tǒng)疾病發(fā)病高峰期;春季(特別是冬季風(fēng)向夏季風(fēng)轉(zhuǎn)換之前的3 月)發(fā)病人數(shù)最多,初秋時段發(fā)病人數(shù)最少。上感和下感疾病發(fā)病第一高峰期在春季,上感疾病因夏季天氣炎熱導(dǎo)致高發(fā)也不可忽視。
(2)每年9 月開始的冬季風(fēng)對當(dāng)?shù)鼐用竦睦涿{迫效應(yīng)使相關(guān)人群總呼吸系統(tǒng)疾病發(fā)病人數(shù)波動式增加,直至次年冬季風(fēng)向夏季風(fēng)轉(zhuǎn)換之前的3 月發(fā)病人數(shù)到達(dá)峰值;整個夏季風(fēng)控制期間對當(dāng)?shù)鼐用竦臒崦{迫效應(yīng)使相關(guān)人群總呼吸系統(tǒng)疾病發(fā)病人數(shù)呈波動式減少態(tài)勢,直至轉(zhuǎn)換為冬季風(fēng)主導(dǎo)前的8月發(fā)病人數(shù)達(dá)到谷值,比峰值減少35%。深圳地區(qū)夏季風(fēng)主導(dǎo)期間總呼吸系統(tǒng)疾病日均就診人數(shù)比冬季風(fēng)主導(dǎo)期間多7.26%,但是上感與下感有差異,其中夏季風(fēng)主導(dǎo)期間上感日均就診人數(shù)比冬季風(fēng)主導(dǎo)期間多22.93%,下感日均就診人數(shù)在夏季風(fēng)主導(dǎo)期間比冬季風(fēng)主導(dǎo)時段少5.58%。已有研究表明,3 月我國北方地區(qū)城市如北京、遼寧北票氣溫回暖快,發(fā)病人數(shù)減少得快;本研究表明,深圳3 月氣溫升溫慢且在冬季風(fēng)向夏季風(fēng)轉(zhuǎn)換之期,當(dāng)?shù)匕l(fā)病人數(shù)達(dá)到峰值,之后開始下降,此現(xiàn)象與北方城市明顯不一樣,值得對更多南方城市呼吸系統(tǒng)疾病發(fā)病情況的年變化進(jìn)行研究。
(3)下感與氣溫及水汽壓呈負(fù)相關(guān)關(guān)系,與氣壓呈正相關(guān)關(guān)系,與氣溫相關(guān)性最好,與氣壓、水汽壓相關(guān)性次之,還與污染要素呈顯著正相關(guān)。與BP 神經(jīng)網(wǎng)絡(luò)模型對比,LSTM 網(wǎng)絡(luò)模型表現(xiàn)更為出色,具有更高的預(yù)測精度和泛化能力,對呼吸系統(tǒng)疾病就診人數(shù)預(yù)測的準(zhǔn)確性更好,可以作為一種新的實用方法為呼吸道疾病發(fā)病風(fēng)險預(yù)測提供技術(shù)支持。