段洪濤,曾繁聲,李景春
(國(guó)家無(wú)線電監(jiān)測(cè)中心,北京100037)
無(wú)線電頻譜資源是稀缺資源,頻譜占用度測(cè)量數(shù)據(jù)對(duì)于無(wú)線電管理工作至關(guān)重要。在國(guó)際電聯(lián)(ITU)出版的文獻(xiàn)中,頻譜占用度的作用可以歸納為:反映頻段內(nèi)的頻率使用情況;為頻率的分配和指配提供參考依據(jù);反映一個(gè)地區(qū)特定頻段的頻率使用變化趨勢(shì)。自2007年開始,無(wú)線電管理部門重點(diǎn)開展了頻譜占用度監(jiān)測(cè)月報(bào)工作,對(duì)測(cè)試方法和統(tǒng)計(jì)方法都進(jìn)行了規(guī)范,上報(bào)數(shù)據(jù)的分析和挖掘工作也凸顯重要性。
目前對(duì)于頻譜占用情況的掌握都是直接采用測(cè)量結(jié)果,這種測(cè)量一般都是根據(jù)實(shí)際工作目標(biāo)的短期測(cè)量行為,實(shí)際上是將測(cè)量結(jié)果作為現(xiàn)在和未來(lái)一段時(shí)間內(nèi)的頻譜占用情況,前提是認(rèn)為頻譜占用度情況平穩(wěn)變化[1,2]。如果長(zhǎng)期開展測(cè)量工作,則可以得到更為精確的預(yù)測(cè)結(jié)果和變化趨勢(shì)。
信道占用度:使用監(jiān)測(cè)接收機(jī)或頻譜分析儀對(duì)特定的信道進(jìn)行測(cè)量,信號(hào)大于某一門限電平值的時(shí)間與總測(cè)量時(shí)間的百分比。
頻段占用度:在測(cè)量時(shí)間內(nèi),用監(jiān)測(cè)接收機(jī)或頻譜分析儀對(duì)某一頻段用固定步長(zhǎng)(信道)進(jìn)行順序測(cè)量,大于某一門限電平值的信道數(shù)與總信道數(shù)的百分比[3]。
在頻譜占用度測(cè)量工作中有2個(gè)方面的問(wèn)題需要深入研究:①測(cè)量本身的問(wèn)題,即如何測(cè)量頻譜占用度,在此方面應(yīng)保證測(cè)試過(guò)程的合理性、測(cè)試數(shù)據(jù)的真實(shí)性,測(cè)量結(jié)果的準(zhǔn)確性和可靠性,涉及信號(hào)檢測(cè)、儀器原理以及統(tǒng)計(jì)學(xué)的相關(guān)知識(shí);②頻段占用度數(shù)據(jù)分析的問(wèn)題,即怎樣分析這些占用度數(shù)據(jù),能得到什么結(jié)果,這個(gè)方面涉及數(shù)據(jù)分析和挖掘的相關(guān)知識(shí)。
占用度數(shù)據(jù)的第1個(gè)作用通過(guò)測(cè)量本身體現(xiàn),第2個(gè)和第3個(gè)作用從嚴(yán)格意義上來(lái)講,都屬于占用度的預(yù)測(cè)和分析范疇。舉個(gè)例子:為了在某個(gè)頻段指配若干個(gè)頻率,進(jìn)行了一段時(shí)間的專項(xiàng)監(jiān)測(cè),得到了頻段占用度數(shù)據(jù),然后根據(jù)占用度數(shù)據(jù)進(jìn)行了頻率指配。要知道占用度數(shù)據(jù)僅是針對(duì)過(guò)去特定時(shí)間的統(tǒng)計(jì)值,如果根據(jù)其進(jìn)行頻率指配,則隱含了預(yù)測(cè)分析的內(nèi)容。
頻率占用度測(cè)量的一般過(guò)程是:用接收機(jī)順序掃描頻段內(nèi)的若干個(gè)信道,在大量掃描后對(duì)每個(gè)信道都有一組測(cè)試數(shù)據(jù)作為分析基礎(chǔ)數(shù)據(jù),通常情況下這些測(cè)試數(shù)據(jù)在時(shí)間上都是等間隔分布的。這些基礎(chǔ)數(shù)據(jù)經(jīng)過(guò)統(tǒng)計(jì)分析形成了每個(gè)信道以及整個(gè)頻段的占用度數(shù)據(jù),這些占用度數(shù)據(jù)可以是測(cè)試時(shí)間內(nèi)的,通常是一天的;也可以是每周的,或者是每月的占用度統(tǒng)計(jì)數(shù)據(jù)[4]。
時(shí)間序列是按時(shí)間次序排列的隨機(jī)變量序列。在實(shí)際問(wèn)題中所能得到的數(shù)據(jù)只是時(shí)間序列的有限樣本。時(shí)間序列分析的主要任務(wù)就是根據(jù)觀測(cè)數(shù)據(jù)的特點(diǎn)為數(shù)據(jù)建立盡可能合理的統(tǒng)計(jì)模型,然后利用模型的統(tǒng)計(jì)特性去解釋數(shù)據(jù)的統(tǒng)計(jì)規(guī)律,以期達(dá)到控制或預(yù)報(bào)目的。
在頻率占用度的測(cè)量中,無(wú)論從基礎(chǔ)數(shù)據(jù)獲得的微觀時(shí)間角度,還是從每月上報(bào)數(shù)據(jù)的宏觀時(shí)間角度,這些占用度數(shù)據(jù)都自然構(gòu)成了時(shí)間序列[5]。需要說(shuō)明的是時(shí)間序列分析對(duì)數(shù)據(jù)也有一定的要求,具體地說(shuō)就是數(shù)據(jù)的數(shù)量和質(zhì)量,數(shù)據(jù)數(shù)量太少則不能完全反映數(shù)據(jù)之間的聯(lián)系,一般來(lái)說(shuō)常見的時(shí)間序列分析數(shù)據(jù)數(shù)量都在20個(gè)以上。數(shù)據(jù)的質(zhì)量指的是數(shù)據(jù)的獲得應(yīng)該在同一條件下。對(duì)于頻譜占用度的時(shí)序分析來(lái)說(shuō),這一點(diǎn)尤其重要,因?yàn)闇y(cè)試數(shù)據(jù)由于測(cè)試設(shè)備、門限電平、統(tǒng)計(jì)方法、甚至是測(cè)試人員的不同而有較大的變化。計(jì)算所使用的占用度數(shù)據(jù)是在連續(xù)的一段時(shí)間按內(nèi)由同一位測(cè)試人員使用同一套設(shè)備獲得的,基本可以認(rèn)為測(cè)試條件相同。2009年北京某站上報(bào)的針對(duì)450~470MHz測(cè)試的頻段占用度上報(bào)數(shù)據(jù)如表1所示。
表1 450~470 MHz頻段占用度數(shù)據(jù)
任何時(shí)間序列經(jīng)過(guò)合理的函數(shù)變換后都可以認(rèn)為是由3個(gè)部分疊加而成,這3個(gè)部分是趨勢(shì)項(xiàng)部分、周期項(xiàng)部分和隨機(jī)噪聲項(xiàng)部分,表示為:
式中,{Tt}為趨勢(shì)項(xiàng);{St}為季節(jié)項(xiàng);{Rt}為隨機(jī)項(xiàng)。時(shí)間序列{Xt}是這3項(xiàng)的疊加。時(shí)間序列分析的首要任務(wù)是通過(guò)對(duì)觀測(cè)樣本的觀察分析,把時(shí)間序列的趨勢(shì)項(xiàng)、季節(jié)項(xiàng)和隨機(jī)項(xiàng)分解出來(lái)。對(duì)于趨勢(shì)項(xiàng)和季節(jié)項(xiàng),一般可以用非隨機(jī)的函數(shù)進(jìn)行刻畫,比較簡(jiǎn)單。當(dāng)時(shí)間序列在適當(dāng)?shù)娜サ糈厔?shì)項(xiàng)和季節(jié)項(xiàng)后,剩下的隨機(jī)部分通常會(huì)有某種平穩(wěn)性,而平穩(wěn)時(shí)間序列的歷史X1,X2,…Xn中往往含有Xn+1的信息,這就使得利用歷史樣本X1,X2,…Xn預(yù)測(cè)將來(lái)Xn+1成為可能,這也是時(shí)間序列進(jìn)行預(yù)測(cè)的本質(zhì)[5]。
ARIMA模型有3種基本類型:自回歸(AR)模型、移動(dòng)平均(MA)模型和自回歸移動(dòng)平均(ARIMA)模型。
如果時(shí)間序列yt是它的前期值和隨機(jī)項(xiàng)的線性函數(shù),即可表示為:
則稱該時(shí)間序列是自回歸序列,p為自回歸模型的階數(shù),記為AR(p),隨機(jī)項(xiàng)ut是相互獨(dú)立的白噪聲序列,記 Bk為k步滯后算子,即
則模型可以表示為:
令
模型可以簡(jiǎn)寫為:
AR(p)過(guò)程平穩(wěn)的條件是滯后多項(xiàng)式 φ(B)的根均在單位圓外,即 φ(B)=0的根大于1。
如果時(shí)間序列 yt是它的當(dāng)期和前期的隨機(jī)誤差項(xiàng)的線性函數(shù),即可表示為:
則稱該時(shí)間序列是移動(dòng)平均序列,q為移動(dòng)平均模型的階數(shù),記作MA(q)。
引入滯后算子,并令
yt可以簡(jiǎn)寫為:
移動(dòng)平均過(guò)程無(wú)條件平穩(wěn)要求,但通常希望AR過(guò)程與MA過(guò)程能相互表出,即為可逆過(guò)程。因此要求滯后多項(xiàng)式θ(B)的根都在單位圓外。
如果時(shí)間序列yt是它的當(dāng)期和前期的隨機(jī)誤差項(xiàng)以及前期值的線性函數(shù),即可表示為:
則稱該時(shí)間序列是自回歸移動(dòng)平均序列,記作ARIMA(p,q),該模型是由博克思(Box)和詹金斯(Jenkins)于20世紀(jì)70年代初提出的一著名時(shí)間序列預(yù)測(cè)方法,所以又稱為box-jenkins模型、博克思-詹金斯法。這種方法具有較高的預(yù)測(cè)精度,適用于短期預(yù)測(cè)。其中ARIMA(p,d,q)稱為差分自回歸移動(dòng)平均模型,AR為自回歸,p為自回歸項(xiàng);MA為移動(dòng)平均,q為移動(dòng)平均項(xiàng)數(shù),d為時(shí)間序列成為平穩(wěn)時(shí)所做的差分次數(shù)[6]。
下面將分成以下幾個(gè)步驟對(duì)上面所提模型進(jìn)行性能分析:①時(shí)間序列的平穩(wěn)性識(shí)別;②對(duì)非平穩(wěn)的時(shí)間序列數(shù)據(jù)進(jìn)行平穩(wěn)化處理;③選取適用的模型及參數(shù);④模型檢驗(yàn);⑤利用已通過(guò)檢驗(yàn)的模型進(jìn)行預(yù)測(cè)。
為了檢驗(yàn)預(yù)測(cè)效果,將第10個(gè)觀測(cè)值留出,作為評(píng)價(jià)預(yù)測(cè)精度的參照對(duì)象。建模的樣本期為2009年3月—2009年11月,在具體應(yīng)用模型過(guò)程中可以使用EViews軟件幫助計(jì)算和分析。
平穩(wěn)時(shí)間序列的一般概念是時(shí)間序列的統(tǒng)計(jì)特征不隨時(shí)間變化而變化,寬平穩(wěn)的定義是:序列的均值和方差都是與時(shí)間 t無(wú)關(guān)的常數(shù),協(xié)方差僅與時(shí)間間隔有關(guān),與t無(wú)關(guān)。關(guān)于頻譜占用度的預(yù)測(cè)問(wèn)題首先要從判定時(shí)間序列的平穩(wěn)性開始,單從定義來(lái)看序列的平穩(wěn)性比較抽象,不容易判斷,其實(shí)在實(shí)際工作中時(shí)間序列的平穩(wěn)性有完備的判斷理論和簡(jiǎn)單方法。
最簡(jiǎn)單的方法是通過(guò)時(shí)間序列的時(shí)序圖來(lái)判斷時(shí)間序列是否存在周期性或趨勢(shì)性。這種方法的優(yōu)點(diǎn)是簡(jiǎn)單直觀,對(duì)于那些明顯是非平穩(wěn)的時(shí)間序列很容易判斷。缺點(diǎn)是對(duì)于一般的時(shí)間序列,特別是不帶有明顯特征的時(shí)間序列,不容易判斷準(zhǔn)確。占用度隨時(shí)間變換的時(shí)序圖如圖1所示。
從圖1可以明顯看出占用度呈現(xiàn)緩慢上升的趨勢(shì),應(yīng)該不是平穩(wěn)序列。
圖1 時(shí)序圖
判斷時(shí)間序列平穩(wěn)性比較理論化的方法是單位根檢驗(yàn)(Unit Root Test,或稱為迪基——福勒檢驗(yàn))。這種方法在實(shí)際中比較常用,但是數(shù)據(jù)計(jì)算量較大??梢岳脮r(shí)間序列分析中常用的分析軟件(Eviews)對(duì)表1的數(shù)據(jù)進(jìn)行單位根的計(jì)算。
經(jīng)過(guò)計(jì)算:時(shí)間序列檢驗(yàn)統(tǒng)計(jì)值為-0.983 937,大于顯著水平為10%的臨界值-2.801 384,所以不能拒絕原假設(shè),序列存在單位根,是非平穩(wěn)的。
通過(guò)時(shí)序圖和單位根檢驗(yàn),基本可判斷原序列不平穩(wěn),下面就是對(duì)序列進(jìn)行平穩(wěn)化處理。在時(shí)間序列分析中,如果一個(gè)時(shí)間序列是非平穩(wěn)的,更一般的方法是通過(guò)取差分的方法而形成平穩(wěn)序列。
經(jīng)過(guò)計(jì)算:一階差分后的時(shí)間序列在1%的顯著水平下拒絕原假設(shè),即99%的置信水平下不存在單位根,該序列是平穩(wěn)的。
所謂隨機(jī)時(shí)間序列模型的識(shí)別,就是對(duì)于一個(gè)平穩(wěn)的隨機(jī)時(shí)間序列,找出生成它的合適的隨機(jī)過(guò)程或模型,即判斷該時(shí)間序列是遵循一純AR過(guò)程、還是遵循一純MA過(guò)程或ARIMA過(guò)程。
所使用的工具主要是時(shí)間序列的自相關(guān)函數(shù)(Autocorrelation Function,ACF)及偏自相關(guān)函數(shù)(Partial Autocorrelation Function,PACF)。ARIMA(p,q)的自相關(guān)函數(shù)可以看作MA(q)的自相關(guān)函數(shù)和AR(p)的自相關(guān)函數(shù)的混合物。
當(dāng)p=0時(shí),具有截尾性質(zhì);
當(dāng)q=0時(shí),具有拖尾性質(zhì);
當(dāng)p、q都不為0時(shí),具有拖尾性質(zhì)。
從識(shí)別上看,通常ARIMA(p,q)過(guò)程的偏自相關(guān)函數(shù)(PACF)可能在p階滯后前有幾項(xiàng)明顯的尖柱(spikes),但從 p階滯后項(xiàng)開始逐漸趨向于零;而它的自相關(guān)函數(shù)(ACF)則是在q階滯后前有幾項(xiàng)明顯的尖柱,從q階滯后項(xiàng)開始逐漸趨向于零。一階差分后的時(shí)間序列自相關(guān)與偏相關(guān)計(jì)算結(jié)果如表2所示。
表2 一階差分時(shí)間序列相關(guān)性計(jì)算結(jié)果
模型的參數(shù)估計(jì)和檢驗(yàn)結(jié)果如表3所示。由表3可以看出自相關(guān)函數(shù)在滯后2期和3期都明顯不為零,之后逐漸表現(xiàn)為拖尾性,偏相關(guān)函數(shù)也在滯后2期后表現(xiàn)為拖尾特性。所以對(duì)于差分后的時(shí)間序列可初步選用 ARIMA(2,1)、ARIMA(2,2)、ARIMA(3,1)和ARIMA(3,2)模型。
表3 模型的參數(shù)估計(jì)和檢驗(yàn)結(jié)果
從表3可以看出,ARIMA(3,1)模型的多項(xiàng)式倒數(shù)根都落在單位圓內(nèi),滿足過(guò)程平穩(wěn)的基本要求,其他模型的倒數(shù)跟都出現(xiàn)了在單位圓外的情況,所以可以認(rèn)為ARIMA(3,1)模型是合適的。
模型檢驗(yàn)主要是指對(duì)模型的合適性進(jìn)行驗(yàn)證,通常是對(duì)模型的殘差序列et進(jìn)行白噪聲檢驗(yàn)。若殘差序列不是白噪聲序列,意味著殘差序列還存在有用信息沒(méi)被提取,還需要進(jìn)一步改進(jìn)模型。通常側(cè)重于檢驗(yàn)殘差序列的隨機(jī)性。殘差序列樣本的自相關(guān)系數(shù)應(yīng)該近似為零。殘差自相關(guān)檢驗(yàn)結(jié)果如表4所示。表4表明殘差近于白噪聲,模型已經(jīng)提取了有規(guī)律的信息,模型的擬合效果較好。
表4 殘差自相關(guān)檢驗(yàn)結(jié)果
根據(jù)ARIMA(3,1)模型對(duì)頻段占用度進(jìn)行預(yù)測(cè)結(jié)果如圖2所示。實(shí)線表示預(yù)測(cè)值,虛線表示預(yù)測(cè)值2倍標(biāo)準(zhǔn)誤差帶。經(jīng)過(guò)計(jì)算,均方根誤差為0.188 120,平均絕對(duì)誤差為0.162 667,平均絕對(duì)百分誤差為59.639 49,表明預(yù)測(cè)精度較好。預(yù)測(cè)的12月份頻段占用度為14.094 276,而實(shí)際的測(cè)試值為14.13,可以看出預(yù)測(cè)值很準(zhǔn)確。
圖2 占用度預(yù)測(cè)圖
通過(guò)實(shí)際運(yùn)用可以看出:對(duì)于頻段占用度測(cè)量工作,測(cè)試及統(tǒng)計(jì)條件的一致性能是后續(xù)分析的基礎(chǔ),也是發(fā)現(xiàn)頻段占用度精確變化規(guī)律的前提條件,沒(méi)有準(zhǔn)確的采集數(shù)據(jù)也就沒(méi)有后續(xù)的有價(jià)值的分析。就拿本例來(lái)說(shuō),該站后來(lái)更換了靈敏度更高的設(shè)備,450~470MHz頻段的占用度測(cè)量結(jié)果大幅度增加到50%左右,這種變化不是由于頻率使用量激增的結(jié)果,而是由于能夠更精確地區(qū)分小信號(hào)和噪聲的結(jié)果。
長(zhǎng)時(shí)間積累數(shù)據(jù)很有價(jià)值。對(duì)于本例的分析,原想找到更多的數(shù)據(jù)進(jìn)行分析,因?yàn)檎加枚葴y(cè)量工作具有一定的階段性,每次任務(wù)時(shí)間一般是幾個(gè)月到半年,數(shù)據(jù)樣本點(diǎn)比較少,通常間隔一段時(shí)間后占用度數(shù)據(jù)還會(huì)有比較明顯的變化,經(jīng)過(guò)咨詢多數(shù)情況是測(cè)試人員變化造成的,因?yàn)殚T限電平設(shè)置、信道被占用判斷都是根據(jù)經(jīng)驗(yàn),可以考慮用軟件固定設(shè)置值解決此類問(wèn)題。
利用EViews分析軟件對(duì)監(jiān)測(cè)站上報(bào)的頻段占用度監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析,重點(diǎn)介紹了ARIMA模型在分析和預(yù)測(cè)頻段占用度數(shù)據(jù)方面的應(yīng)用過(guò)程。關(guān)于頻率占用度數(shù)據(jù)的分析、挖掘有很多東西需要研究,特別是結(jié)合頻段劃分和業(yè)務(wù)劃分的研究,如果有可能結(jié)合臺(tái)站數(shù)據(jù)庫(kù)進(jìn)行分析比對(duì)可以更好地預(yù)測(cè)占用度變化情況,體現(xiàn)日常監(jiān)測(cè)工作的價(jià)值,對(duì)無(wú)線電管理工作發(fā)揮更大的作用。
[1]MCHENRY MD.ROBERSON M,D,MACDONALDJ.Chicago Spectrum Occupancy Measurements[R].Report for the WIL of IIT,2006.
[2]ELLINGSON S W.Spectral occupancy at VHF:Implication for Frequency-agile Cognitive Radios[C].In Proc.of IEEE Vehicular Technology Conference(VTC),2005:1397-1382.
[3]SPAULDING A D,HAGN,G H.On the Definition and Estimation of Spectrum Occupancy[J].IEEE Trans.on EMC,1977,19(3):269-280.
[4]CEPT/ERC Recommendation 01-10 E.Frequency Channel Occupancy Measurements[S],2000.
[5]朱照宣.關(guān)于時(shí)間序列分析[J].力學(xué)實(shí)踐,1989,11(1):22-26.
[6]何書元.應(yīng)用時(shí)間序列分析[M].北京:北京大學(xué)出版社,2009.