曾華燕 鄭瓊芳 蔡銘洲
(1.深圳大學,深圳 518052;2.佛山市自然資源局順德分局,佛山 528333)
在預測研究中,研究目標一般會被視為因變量,例如一個城市的年度公共交通客運量(包括公共汽車客運量和軌道交通客運量,不包括出租車客運量)。在現(xiàn)實生活中,公共交通客運量的影響因素一般包括該城市的人口情況、交通管理政策、居民出行習慣、公共交通服務水平,以及公共衛(wèi)生條件、司乘人員的健康情況等。分析現(xiàn)實因素對因變量的影響,一般被稱為因果分析或相關分析法。如果因變量影響因素的變化規(guī)律隨時間的發(fā)展而保持大體一致,那么可以將在以往年份的因變量數(shù)值列成一個序列,將影響因素看成時間,采用預測函數(shù)來模擬因變量的變化規(guī)律,這種方法一般被稱為時間序列預測方法[1-2]。
相對于因果分析法而言,時間序列預測法不需要采集很多現(xiàn)實數(shù)據(jù),使用起來較為方便,能夠迅速預測未來的客運量情況;但時間序列預測法無法一一辨別影響因素對因變量的影響程度,因此非常依賴于現(xiàn)實因素是否一直保持大體一致的變化規(guī)律。在一般情況下,人們可以利用以往若干年的數(shù)據(jù),模擬得出一條時間序列曲線,如果預測值與真實數(shù)值的相對誤差和標準差在可接受范圍內(nèi),則認為此時能采用時間序列法來預測因變量在未來若干年的變化,以輔助管理者進行決策;在這種情況下,時間序列法是一種較為簡便的、具有一定實用性的預測方法[1-2]。
(1)一般情況下,建議采用以下3 種函數(shù)來模擬時間序列的變化規(guī)律[1-2]:直線、指數(shù)曲線和二次曲線,曲線的參數(shù)可以采用最小二乘法來計算。
(2)計算出3 種曲線的預測方程之后,代入預測方程,可計算出往年的預測值。
(3)再計算出歷年預測值和真實值之間的相對誤差、以及誤差平方和,來作為篩選預測曲線的指標之一;直線函數(shù)還可以采用相關系數(shù)來分析預測方程的準確性。
利用Excel 可以快速計算出預測曲線的各個參數(shù);而如果需要手算的話,可以通過對時間單位進行簡化,來快速提高手算速度,其預測準確度和使用軟件計算原自然年份下的時間序列的準確度是相同的。
由于時間序列法的應用前提是假定因變量的影響因素隨時間變化而保持大體一致,因此在理論上,當自變量采用線性變化時,也即時間年份發(fā)生線性變化時,相當于因變量在時間橫軸上左右移動,因變量的具體數(shù)值不受影響,而時間數(shù)值的改變可以簡化參數(shù)的求解過程。
本文利用直線方程來說明簡化算法。用最小二乘法確定的直線預測方程的參數(shù)方程組為:
上述方程組中,在求解參數(shù)a 和b 時,如果對t 進行線性變換,即令T = t- k,并使得盡可能小,或使則能大大簡化計算[1]。
在本文中,因變量為一個城市的公共交通客運量(包括公共汽車客運量和軌道交通客運量,不包括出租車客運量)。例如,根據(jù)深圳市統(tǒng)計年鑒數(shù)據(jù)[3],深圳市的公共交通客運量在2009-2018 年的變化情況如表1、圖1 所示。
設:公共交通客運量為因變量y,年份為自變量t,則該序列是一個為期10 年的序列。y 和t 都可以加上下標來表示年份之間的差別,客運量為yi,時間為ti,i 為正整數(shù)(1、2、3……10)。
表1 深圳市公共交通客運量表
圖1 自然年份下深圳市公共交通客運量的散點圖
(1)使年份之和歸零的簡化方法
如前文1.2 節(jié)所述,若令T = t - k(k 為年份的平均值),使得可簡化手算求解參數(shù)方程組的過程。
本例中,年份ti為自然正整數(shù),是一個等差數(shù)列,其前n 項之和為:
此時,數(shù)據(jù)列表和折線圖如表2、圖2 所示。
由表2 可方便地計算得出式(2)各參數(shù)項的數(shù)據(jù)(表3)。
表2 年份簡化后的深圳市公共交通客運量表(1)
圖2 第1 種年份簡化法得到的客運量散點圖
表3 年份簡化后的預測曲線參數(shù)
把表3 數(shù)據(jù)代入式(2),計算得出直線預測方程的參數(shù)項a,b。
這種簡化方法使得相鄰2 個時間數(shù)值的間隔仍是一年,上述表格中的數(shù)據(jù)序列是10 年,是偶數(shù)值,簡化后的年份數(shù)據(jù)帶有小數(shù)點;如果數(shù)據(jù)序列是奇數(shù)值,則年份數(shù)據(jù)可以關于縱軸對稱,年份數(shù)據(jù)可以簡化為正整數(shù)。
(2)使年份從1 開始的簡化方法
也有將自然年份簡化為從1 開始的方法,同樣可以明顯簡化手算過程[1]。此時,令W = t - 2008,則數(shù)據(jù)列表和折線圖如表4,圖3 所示。
表4 年份簡化后的深圳市公共汽車客運量表(2)
圖3 第2 種年份簡化方法得到的客運量散點圖
采用第2 種簡化方法后,關于簡化年份數(shù)據(jù)W2的運算可以保持在百位數(shù)以內(nèi),比原來自然年份的千位數(shù)運算要簡單,也能大大提高手算速度。接下來可以驗算年份簡化后所獲得的預測數(shù)據(jù),與用原自然年份計算獲得的預測數(shù)據(jù)可以保持同樣的準確度。
可以采用Excel 中的linest 函數(shù)計算預測結(jié)果,來驗算分別使用原自然年份和兩種簡化方法所求得的預測數(shù)據(jù)。計算3 種年份數(shù)據(jù)的預測數(shù)據(jù)[1]如表5 所示。
將式(1)自然年份、簡化年份T 和簡化年份W 對應的3 組參數(shù)分別標記為a1 和b1、a2 和b2、a3 和b3,利用linest 函數(shù)計算出3 組參數(shù)(表6)。
由表6 中可以看出,3 條直線的斜率b 是一樣的,區(qū)別在于年份在橫軸上有了變化,使得直線在縱軸上的截距a 有所差別。
利用3 個直線方程代入3 種年份數(shù)據(jù),可計算得到3 組相同的預測數(shù)值(表7)。其中,預測值與真實值相對誤差 = (預測值-真實值) / 真實值。
從表7 中第一至第五列的數(shù)據(jù)可以看出,年份進行簡化后,得到的預測數(shù)值是一樣的。從第六列數(shù)據(jù)可以看出,直線方程預測值與真實值相對誤差較小(〈±9%),在-7.83%~8.09%之間。
這意味著深圳市在2009 年至2018 年這十年間公共交通客運量發(fā)展趨勢有較好的一致性,使用時間序列法預測公共交通客運量具有一定的準確度,其預測結(jié)果可以輔助管理者進行公共交通規(guī)劃方面的決策[2]。當需要更高預測準確度、特別是當需要考慮實際因素來人為地調(diào)整公共交通客運量的發(fā)展變化時,需要使用相關分析法來進行分析和預測[1-2]。
表5 自然年份和兩種年份簡化方法的數(shù)據(jù)表
表6 自然年份和2 種年份簡化方法對應的預測參數(shù)表
表7 自然年份和2 種年份簡化方法得到的預測數(shù)據(jù)計算表
在滿足一定的前提下,時間序列法是一種較為簡便的預測方法,可以用于預測公共交通客運量的變化,以輔助管理者進行公共交通規(guī)劃方面的決策;在使用最小二乘法來求解時間序列預測方程時,可以采用兩種簡化年份的做法來簡化計算過程[1],能夠得到同樣的預測結(jié)果,有助于使用者更快地完成計算過程,并更好地理解時間序列預測法的本質(zhì)含義。