王 超,張明宇,王錫銘,吳傳德
(天津大學(xué)天津市建筑物理環(huán)境與生態(tài)技術(shù)重點實驗室,天津 300072)
現(xiàn)階段我國城市智慧照明規(guī)劃尚處在摸索階段,各地區(qū)基礎(chǔ)建設(shè)與智慧化發(fā)展程度均不盡相同,判斷出一個非樣本城市(或者城市片區(qū))的智慧照明發(fā)展基礎(chǔ)的分級尤為重要[1]。隨著大數(shù)據(jù)的發(fā)展及計算機(jī)優(yōu)化算法的利用技術(shù)成熟,龐大的城市數(shù)據(jù)更依賴于一個成熟的算法優(yōu)化方案,而BP神經(jīng)網(wǎng)絡(luò)在處理城市數(shù)據(jù)方面的優(yōu)勢十分顯著,城市智慧照明分級作為一個非線性分類問題,契合BP神經(jīng)網(wǎng)絡(luò)的工作特點。
本文選取的評價對象來自三部分:
1)基于國家前三批智慧城市試點:2012年12月,國務(wù)院發(fā)布了《關(guān)于開展國家智慧城市試點工作的通知》[2],選擇了90個城市作為國家首批智慧城市試點。2013年8月至2014年4月,我國陸續(xù)公布了國家智慧城市第二批、第三批試點,隨后更多的城市(區(qū)、縣)陸續(xù)開展智慧城市建設(shè);
2)基于中國信息化研究與促進(jìn)網(wǎng)發(fā)布,由互聯(lián)網(wǎng)權(quán)威機(jī)構(gòu)太昊國際互聯(lián)網(wǎng)大數(shù)據(jù)評級機(jī)構(gòu)(簡稱Tahaoo指數(shù))給出的“2018-2019中國新型智慧城市建設(shè)與發(fā)展綜合影響力”評估結(jié)果中各個分值段的代表性城市[3];
3)基于杭州G20峰會后,全國各個主要城市均相繼開始編制新一版本的城市照明規(guī)劃導(dǎo)則,其中大多數(shù)導(dǎo)則均在不同程度上對智慧城市予以了配合與輔助,在研究城市中有比例地加入一部分完成了新一版城市照明規(guī)劃導(dǎo)則的城市,有助于增加整個指標(biāo)評價體系的全面性。具體城市名單詳見表1。
表1 智慧照明規(guī)劃基礎(chǔ)指標(biāo)分級神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分組表
為了數(shù)據(jù)的均勻度與驗證的準(zhǔn)確性,每六組數(shù)據(jù)中隨機(jī)抽取一個數(shù)據(jù)作為評價組,共取10組數(shù)據(jù),并且這10組數(shù)據(jù)全程不參與神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,其余50組作為實驗數(shù)據(jù)。為了防止神經(jīng)網(wǎng)絡(luò)發(fā)生過擬合,本文將這50組數(shù)據(jù)分為training(訓(xùn)練)、validation(驗證)、test(測試)三組,其比例以70%、15%、15%為宜。
在從城市智慧照明指標(biāo)體系中選擇用以確定照明分級的基礎(chǔ)類指標(biāo)時,有以下幾類原則:
1)指標(biāo)的基礎(chǔ)性
考慮到基礎(chǔ)類指標(biāo)取值主體差異較大,有城市有地區(qū),發(fā)展情況行政建制,以及是否有編制城市照明規(guī)劃均有所差異。同時基礎(chǔ)指標(biāo)主要考察的是研究主體的綜合發(fā)展水平,以便有針對性地確定城市智慧照明規(guī)劃的編制基礎(chǔ)以及編制目標(biāo)。
2)指標(biāo)的可操作性
可操作性體現(xiàn)在三方面:一是指標(biāo)的代表性和簡潔性,首先基礎(chǔ)類指標(biāo)本身不宜過多,從指標(biāo)體系中篩選具有代表性的指標(biāo),選取的指標(biāo)務(wù)必要展示評價內(nèi)容的整體,其次基礎(chǔ)類指標(biāo)系要不繁雜,選取的指標(biāo)要簡潔明了,應(yīng)選取與研究內(nèi)容最貼合的指標(biāo);二是要求該指標(biāo)易得且準(zhǔn)確,可從國家或國家主管當(dāng)局或官方統(tǒng)計數(shù)據(jù)中獲得。三是可對比性,指標(biāo)的選取應(yīng)基于相同維度,如盡量選取人均指標(biāo)或者占比情況作為基本指標(biāo)[4]。
3)指標(biāo)的全面性
目前城市智慧照明指標(biāo)體系包含八個方面:網(wǎng)絡(luò)與信息能力、綜合創(chuàng)新能力、行政管理能力、基礎(chǔ)設(shè)施評價、惠民服務(wù)評價、城市夜經(jīng)濟(jì)、交通輔助類評價、照明空間結(jié)構(gòu)優(yōu)化。這八個方面均需要有指標(biāo)被選擇為基礎(chǔ)性指標(biāo),才能使得BP神經(jīng)網(wǎng)絡(luò)模型具有足夠的全面性和代表性。根據(jù)以上三點原則在城市智慧照明指標(biāo)體系中進(jìn)行篩選,得到城市智慧照明分級指標(biāo)體系表(表2)。
本文數(shù)據(jù)大部分來自于《2019年中國信息社會發(fā)展報告》(國家信息中心發(fā)布)、各市的《2019年信息化發(fā)展報告》、各市的《2019年信息化年鑒》、各市的《2019年統(tǒng)計年鑒》、各市的《2019年國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》、各市政府通過官網(wǎng)發(fā)布的政務(wù)信息公共年度報告、各市路燈管理局公布的相關(guān)統(tǒng)計數(shù)據(jù)等,其中也有部分?jǐn)?shù)據(jù)來源于網(wǎng)絡(luò)或其他途徑搜集,在查詢大量前述數(shù)據(jù)基礎(chǔ)上得到原始數(shù)據(jù)。將部分?jǐn)?shù)據(jù)展示于表3。
考慮到我國現(xiàn)階段的城市智慧照明規(guī)劃尚處在摸索階段,各地區(qū)基礎(chǔ)設(shè)施建設(shè)基礎(chǔ)與智慧度均不盡相同,所以在現(xiàn)有條件下,所有的城市均使用同一套評價指標(biāo)體系是不合理的,因此本文提出的城市智慧照明評價指標(biāo)體系在構(gòu)建之初便根據(jù)智慧城市基礎(chǔ)指標(biāo)發(fā)展程度的不同,將子指標(biāo)分為了三類,即:基礎(chǔ)類指標(biāo)、提升類指標(biāo)、優(yōu)選類指標(biāo),對應(yīng)評價智慧城市建設(shè)基礎(chǔ)較差的城市(一星級城市)、智慧城市建設(shè)基礎(chǔ)一般的城市(二星級城市)與智慧城市建設(shè)基礎(chǔ)較好的城市(三星級城市)。其具體對應(yīng)關(guān)系見表4。
表2 城市智慧照明分級指標(biāo)體系表
表3 城市智慧照明分級指標(biāo)數(shù)據(jù)表(樣表)
表4 城市評級與適用指標(biāo)對應(yīng)表
BP神經(jīng)網(wǎng)絡(luò),就是其在模擬人的大腦,把每一個節(jié)點當(dāng)作一個神經(jīng)元,這些“神經(jīng)元”組成的網(wǎng)絡(luò)就是神經(jīng)網(wǎng)絡(luò)。由于計算機(jī)出色的計算能力和細(xì)節(jié)把握能力,在城市數(shù)據(jù)統(tǒng)計這樣的大數(shù)據(jù)的基礎(chǔ)上,神經(jīng)網(wǎng)絡(luò)往往有比人更出色的表現(xiàn)[5]。只需明確輸入、輸出,系統(tǒng)即可學(xué)到輸入與輸出的函數(shù)關(guān)系。神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ)之一是三層的神經(jīng)網(wǎng)絡(luò),可以逼近任意的函數(shù),所以理論上,只要數(shù)據(jù)量夠大,“箱子容量”夠大(神經(jīng)元數(shù)量),便可以對任何和歸類性數(shù)學(xué)問題進(jìn)行分析[6]。城市數(shù)據(jù)的統(tǒng)計分析紛繁復(fù)雜,利用機(jī)器學(xué)習(xí)進(jìn)行城市照明的分區(qū)與分級,可以極大節(jié)約規(guī)劃設(shè)計師分析理解數(shù)據(jù)的時間成本。城市智慧照明分級作為一個非線性分類問題,契合BP神經(jīng)網(wǎng)絡(luò)的工作特點。完成學(xué)習(xí)訓(xùn)練后的系統(tǒng)就可以快速判斷出一個非樣本城市(或者城市片區(qū))的智慧照明發(fā)展基礎(chǔ)的分級,從而提供一套在智慧城市背景下的城市照明分區(qū)以及分級的方法。
1)數(shù)據(jù)歸一化處理
選擇2019年北京、沈陽、大連、哈爾濱、石家莊等60個城市的互聯(lián)網(wǎng)普及率、寬帶互聯(lián)網(wǎng)用戶占比、信息產(chǎn)業(yè)GDP占比等15個指標(biāo)的具體數(shù)據(jù)進(jìn)行歸一化處理,預(yù)測數(shù)據(jù)再根據(jù)反歸一化處理得出與實際輸出值比較。
2)設(shè)計網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
根據(jù)城市智慧照明分級的問題特點,選用具有隱含層的LM-BP神經(jīng)網(wǎng)絡(luò)。在這個網(wǎng)絡(luò)中,顯示參數(shù)的輸入數(shù)15,可以根據(jù)colmogorov定律定義的隱藏層數(shù),一般設(shè)置為輸入層的2n+1,即31;輸出層數(shù)對應(yīng)于分類一星級城市、二星級城市、三星級城市,因此輸出層數(shù)為3。
3)網(wǎng)絡(luò)主要參數(shù)的確定
網(wǎng)絡(luò)的初始權(quán)闊值設(shè)范圍在(-1,1)之間,LM學(xué)習(xí)方法作為網(wǎng)絡(luò)學(xué)習(xí)方法的代表方式,網(wǎng)絡(luò)訓(xùn)練誤差不設(shè)下限,以梯度指標(biāo)作為訓(xùn)練限定,設(shè)為1e-7,學(xué)習(xí)率取0.001。網(wǎng)絡(luò)訓(xùn)練結(jié)果采用均方誤差(MSE)進(jìn)行衡量,即網(wǎng)絡(luò)訓(xùn)練誤差。
圖1 LM-BP神經(jīng)網(wǎng)絡(luò)工作流程Fig.1 LM-BP neural network workflow
4)數(shù)據(jù)分組及防止過擬合
為了使訓(xùn)練數(shù)據(jù)與訓(xùn)練標(biāo)簽一致,而對模型過度訓(xùn)練,從而使得模型出現(xiàn)過擬合(over-fitting)現(xiàn)象。具體表現(xiàn)為,訓(xùn)練后的模型在訓(xùn)練集中正確率很高,但是在測試集中的變現(xiàn)與訓(xùn)練集相差懸殊,也可以叫做模型的泛化能力差。
如前文所述本研究將實驗組數(shù)據(jù)分為三組,training、validation、test,其比例分別為70%、15%、15%,以此方法對應(yīng)MATLAB防止過擬合的方法。只有training數(shù)據(jù)參加訓(xùn)練,其他兩組數(shù)據(jù)不參加訓(xùn)練,用于檢驗[7]。
對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,各參數(shù)設(shè)定如圖2所示,對設(shè)定各個參數(shù)進(jìn)行解析:
圖2 LM-BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)定圖Fig.2 LM-BP neural network parameter setting diagram
1)Neural Network神經(jīng)網(wǎng)絡(luò)
圖2顯示了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖,神經(jīng)網(wǎng)絡(luò)有一層隱含的輸出架構(gòu),前文有述,此處不詳細(xì)展開。
2)Algorithms訓(xùn)練算法
第二部分顯示的是訓(xùn)練算法,這里為LM-BP算法;誤差指標(biāo)為mse即采用均方誤差計算法計算誤差。
3)Progress訓(xùn)練進(jìn)度
Epoch:數(shù)量的訓(xùn)練;右邊顯示可以設(shè)置的最大訓(xùn)練量,圖2顯示了實際訓(xùn)練的數(shù)量,實際上是6。
Time:訓(xùn)練時間,也就是本次訓(xùn)練中使用的時間。
Gradient:該網(wǎng)絡(luò)的最大梯度為1.91,閾值梯度為1e-71e^{-7}1e-7,實際梯度為0.033??稍赑lots中的Training State中詳細(xì)查看。
Mu:該網(wǎng)絡(luò)所使用Levenberg-Marquardt算法中的阻尼因子最小值為0.001,閾值為1e101e^{10}1e10,實際值為1e-61e^{-6}1e-6,Mu值越大意味著算法收斂效果越好。可在Plots中的Training State中詳細(xì)查看。
Validation Checks:該網(wǎng)絡(luò)的泛化能力檢查標(biāo)準(zhǔn),實際值為0表示在訓(xùn)練過程中誤差在持續(xù)降低,若連續(xù)6次訓(xùn)練誤差無法降低,則結(jié)束訓(xùn)練任務(wù)。可在Plots中的Training State中詳細(xì)查看。
4)Plots看板
Performance:該網(wǎng)絡(luò)訓(xùn)練過程中的誤差變換可視化。
Training State:該網(wǎng)絡(luò)訓(xùn)練過程中的梯度、Mu因子和泛化能力變換等信息的可視化。
Regression:該網(wǎng)絡(luò)訓(xùn)練集、驗證集、測試集的回歸能力可視化。
Plot Interval:圖中橫坐標(biāo)的刻度[8]。
以上參數(shù)對城市智慧照明基礎(chǔ)指標(biāo)分級BP神經(jīng)網(wǎng)絡(luò)進(jìn)行6次訓(xùn)練,其結(jié)果如下:
圖3 城市智慧照明基礎(chǔ)指標(biāo)分級BP神經(jīng)網(wǎng)絡(luò)性能圖Fig.3 Classification of BP neural network performance graph of basic indicators of urban smart lighting
圖3中給出了城市智慧照明基礎(chǔ)指分級BP神經(jīng)網(wǎng)絡(luò)性能,圖中Train表示網(wǎng)絡(luò)訓(xùn)練的性能狀態(tài),Validation表示用于驗證樣本的性能狀態(tài),Test表示用于測試樣本的性能狀態(tài),BEST表示網(wǎng)絡(luò)實際達(dá)到的性能,使用網(wǎng)絡(luò)的均方誤差(Mean Squared Error,MSE)來衡量網(wǎng)絡(luò)的性能水平。由圖3可得訓(xùn)練曲線的誤差已經(jīng)降至10-19以下。受筆者精力有限,導(dǎo)致城市基礎(chǔ)指標(biāo)總樣本量有限,以至于用于驗證組與測試組的樣本量不足,紅線與綠線未顯示出明顯的誤差下降,但考慮到這兩條曲線亦沒有明顯上升,同時影響神經(jīng)網(wǎng)絡(luò)真實準(zhǔn)確度的是網(wǎng)絡(luò)訓(xùn)練時表現(xiàn)出的性能,故而系統(tǒng)整體表現(xiàn)出的性能是在研究可接受范圍內(nèi)的。
圖4為LM-BP的網(wǎng)絡(luò)訓(xùn)練狀態(tài)圖,由圖可見取得了較好的訓(xùn)練效果Gradient為梯度下降法的函數(shù),Mu指的是LM算法中的調(diào)整參數(shù),二者均在6次訓(xùn)練后取得了較低的誤差。
圖4 城市智慧照明基礎(chǔ)指標(biāo)分級網(wǎng)絡(luò)訓(xùn)練狀態(tài)圖Fig.4 Network training status diagram of urban smart lighting basic indicators classification
圖5為LM-BP算法的網(wǎng)絡(luò)線性回歸圖,其中左上方是訓(xùn)練,右上方是驗證,左下方為測試,右下方為總體,該圖表示期望輸出和實際輸出的擬合同時顯示了兩者的相關(guān)系數(shù)[9],觀察圖像可得訓(xùn)練部分的相關(guān)系數(shù)為1,擬合結(jié)果為輸出=輸入+2.1e-11。為避免發(fā)生過擬合,訓(xùn)練時系統(tǒng)將全部數(shù)據(jù)分為三個部分,即訓(xùn)練、驗證及測試,其中僅訓(xùn)練部分進(jìn)行訓(xùn)練,其他用以對網(wǎng)絡(luò)性能進(jìn)行評估。訓(xùn)練時訓(xùn)練部分與目標(biāo)的誤差會降低,測試和驗證兩部分與目標(biāo)的誤差也會降低。隨著訓(xùn)練的進(jìn)行,測試部分與目標(biāo)的誤差降低,但驗證部分與目標(biāo)的誤差反而會提高。當(dāng)驗證部分誤差連續(xù)增大指定次數(shù)時,網(wǎng)絡(luò)訓(xùn)練中止,因此時可能擬合不正確,發(fā)生過擬合問題,從而提前終止訓(xùn)練。線性回歸可判斷是否發(fā)生過擬合,并可分析神經(jīng)網(wǎng)絡(luò)的擬合情況[10]。相關(guān)系數(shù)越接近于1,網(wǎng)絡(luò)訓(xùn)練結(jié)果擬合越好。由圖可知訓(xùn)練組的相關(guān)系數(shù)接近于1,而驗證和測試由于前文提過的樣布量不足的關(guān)系面板數(shù)值不夠理想,但鑒于其向1收斂的趨勢隨著訓(xùn)練的進(jìn)行一直沒有變化,可得沒有發(fā)生過擬合現(xiàn)象,同時也表明隨著今后智慧照明數(shù)據(jù)統(tǒng)計工作的開展,訓(xùn)練與驗證的樣本量增加后,系統(tǒng)誤差有進(jìn)一步降低的趨勢。
圖5 城市智慧照明基礎(chǔ)指標(biāo)分級網(wǎng)絡(luò)線型回歸圖Fig.5 Linear regression graph of urban smart lighting basic indicators classification network
訓(xùn)練完成后需要進(jìn)行實證測試,本文選取從未參與測試的十個城市:天津、青島、無錫、西安、昆明、蘇州、泉州、溫州、呼和浩特、中山,將這十個城市的15項指標(biāo)輸入系統(tǒng)中,由于本文是間隔六個城市取得一個城市作為評價組,這十組數(shù)據(jù)也同時涵蓋了一星級、二星級、三星級這三個評級,保證了數(shù)據(jù)的隨機(jī)性與代表性,將系統(tǒng)通過之前的學(xué)習(xí)積累的經(jīng)驗值評級與本文預(yù)先對這些城市進(jìn)行的評級進(jìn)行對應(yīng),結(jié)果如圖6所示。
圖6 BP神經(jīng)網(wǎng)絡(luò)預(yù)測輸出結(jié)果Fig.6 BP neural network prediction output results
從圖6看出,預(yù)測數(shù)據(jù)結(jié)果與期望輸出結(jié)果完全對應(yīng),就這10組數(shù)據(jù)而言,預(yù)測準(zhǔn)確性達(dá)到100%,符合預(yù)先神經(jīng)網(wǎng)絡(luò)的設(shè)計要求,該結(jié)果表明此次城市智慧照明分級體神經(jīng)網(wǎng)絡(luò)構(gòu)建基本完成。由此將其他城市或地區(qū)的15項基礎(chǔ)指標(biāo)輸入城市智慧照明分析BP神經(jīng)網(wǎng)絡(luò)后,可以快速準(zhǔn)確地得到與此前分級要求一致的預(yù)測輸出值。
本文通過梳理城市智慧照明指標(biāo),利用BP神經(jīng)網(wǎng)絡(luò)對指標(biāo)的數(shù)據(jù)及其評級結(jié)果進(jìn)行機(jī)器學(xué)習(xí),對10組未進(jìn)行學(xué)習(xí)的數(shù)據(jù)進(jìn)行預(yù)測,準(zhǔn)確率達(dá)到100%。完成訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)系統(tǒng)便可以進(jìn)行城市智慧照明等級的劃分,便于快速匹配與城市基礎(chǔ)現(xiàn)狀特點相對應(yīng)的評價體系進(jìn)行指導(dǎo)建設(shè)。
研究成果對于城市智慧照明基礎(chǔ)分級理論研究方法具有重大意義,本系統(tǒng)可具備對城市智慧照明建設(shè)進(jìn)行基礎(chǔ)信息判斷和發(fā)展階段預(yù)判,可實現(xiàn)與待研究城市當(dāng)前階段城市的發(fā)展階段進(jìn)行匹配,為進(jìn)一步提出城市智慧照明規(guī)劃的發(fā)展目標(biāo)與實現(xiàn)途徑提供基礎(chǔ)研究手段。如在將來對于基礎(chǔ)指標(biāo)或者分級的顆粒度進(jìn)行調(diào)整,仍可利用本文的數(shù)據(jù)分析以及神經(jīng)網(wǎng)絡(luò)構(gòu)建的方法進(jìn)行推導(dǎo)。