[摘 要]在經(jīng)濟學領域時間序列是一種十分重要的方法,通過這種方法可以有效的描述出數(shù)據(jù)在一段時間內的具體變化規(guī)律,這對研究經(jīng)濟發(fā)展問題、醫(yī)學發(fā)展、工程建設等都是十分重要的。而對非平穩(wěn)時間序列數(shù)據(jù)的相似性研究對于各個領域的發(fā)展所起到的作用也是十分重要的。所以接下來在本文中我們就來詳細的分析一下非平穩(wěn)時間序列數(shù)據(jù)所存在的相似性,以及具體的研究方法。
[關鍵詞]非平穩(wěn)時間序列 相似性 研究方法
一、引言
時間序列在經(jīng)濟學、醫(yī)學、工程建設研究過程中起到的作用是十分重要的,通過使用這種方法可以提高數(shù)據(jù)分析的準確性。時間序列具體指的就是在一個隨機的過程中,如果隨著時間變化隨機過程的特征不發(fā)生變化,就是平穩(wěn)的時間序列,如果隨著時間的變化隨機過程特征也發(fā)生變化,就稱為非平穩(wěn)的時間序列。在解決實際問題過程中,序列是我們經(jīng)常遇見的,尤其是那些反映經(jīng)濟現(xiàn)象或者是社會問題的序列,這些序列通常情況下都是不平穩(wěn)的,具有周期性和趨勢性。
二、非平穩(wěn)時間序列的預測方法
1.回歸方法,該方法是G.U.Yule在1920年提出的,但是這種方法在進行數(shù)據(jù)預測時并沒有起到太大的影響。所以在實際研究過程中并沒有得到廣泛的應用。
2.ARIMA模型,70年代以后提出了ARIMA模型出現(xiàn)了,該模型在國際上產(chǎn)生了極大的影響,是現(xiàn)在世界上理論最為完善的預測方式。隨著計算機技術的快速發(fā)展,該方法也得到了進一步的發(fā)展,所以該方法得到了廣泛的關注。
三、時間序列相似性研究
1.時間序列分段算法
目前在計算非平穩(wěn)時間序列數(shù)據(jù)的相似性方法時最常用的方法就是分段計算。主要包括三個方面,即累計殘差、平均殘差以及最大偏差。
2.改進算法
隨著社會的快速發(fā)展,傳統(tǒng)的分段算法已經(jīng)不能準確的反映時間序列的發(fā)展狀況,產(chǎn)生的結果也不能滿足各領域的發(fā)展需要。目前主要存在兩個問題,一個是這種方法不能在短時間之內有效的分析出數(shù)據(jù)的變化趨勢;二是采用平均誤差分段算法不能在長時間內做好數(shù)據(jù)的分界工作,還會出現(xiàn)很大的偏差。
現(xiàn)在存在的分段線性算法都存在著很大的缺陷,通過分析我們可以發(fā)現(xiàn)以下兩個問題:
①過擬合:在分析整個分段時,我們可以將其分成兩段,這樣就可以獲得更好的效果。
②欠擬合:在短時間內,因為存在積累殘差這樣就可能出現(xiàn)數(shù)據(jù)的大波動,這是由數(shù)據(jù)的不敏感性造成的。
3.子序列線性度
一般我們采用子序列線性度來衡量子序列的擬合程度,該方法是在累積殘差的基礎上進行的。如果線性度越高,與原始數(shù)據(jù)之間的距離越近。
4.雙誤差閥值算法
累計殘差在計算數(shù)據(jù)序列時沒有考慮子序列平均殘差的狀況,所以能夠有效的覆蓋數(shù)據(jù)波動的狀況。但是在實際分段過程中會存在較大的誤差。這也會影響計算的準確性。
四、相似性分析方法的優(yōu)劣
在本文中我們詳細的介紹了有關時間序列數(shù)據(jù)相似性分析的方法,通過對這些方法進行分析和總結發(fā)現(xiàn)主要有以下三個問題:
第一,在選擇分析相似性的度量標準時,存在以下幾個問題:
1.在度量時間距離相似性時,如果選擇歐式幾何距離作為標準會存在很多問題,盡管通過研究我們已經(jīng)提出了一些具體的改進措施,但是仍然不能完全彌補這些問題。
2.在提出相似性的概念時存在一定的主觀性,也就是說相似性只存在在某些約束條件之下才能進行。研究非平穩(wěn)時間序列數(shù)據(jù)相似問題就是探討函數(shù)之間的關系。
第二,在計算序列數(shù)據(jù)相似性時最主要的就是要研究時間的復雜程度以及特征。所以在比較相似性時通常采取以下幾種方法,即分段累計近似、離散傅里葉變換、離散小波變換、界標模型等等。這些方法在研究相似性問題時主要有兩個基本思路,即處理分段特征以及處理正交變換。
第三,這些方法在雖然仍然存在一些問題,但是在實際應用過程中仍然發(fā)揮了極大的作用。
五、需要研究的問題
對于非平穩(wěn)時間序列數(shù)據(jù)的相似性問題已經(jīng)得到了一定的發(fā)展,但是在研究過程中仍然存在很多難點,比如相似性的定義,具體的算法,以及復雜程度的衡量等等。
六、總結
隨著社會與經(jīng)濟的快速發(fā)展,對經(jīng)濟的研究也越來越多,這就需要我們加強對經(jīng)濟發(fā)展中各種數(shù)據(jù)的研究,這樣才能獲取更多有用的信息,才能進一步掌握經(jīng)濟發(fā)展的規(guī)律,制定適當?shù)陌l(fā)展計劃。而非平穩(wěn)時間序列數(shù)據(jù)的分析就是一種極其重要的方法,在未來該方法會起到極其重要的作用,我們應該加強對這種方式的研究。
參考文獻:
[1]毛國君.段麗娟等,數(shù)據(jù)挖掘原理與算法.[M].清華大學出版社.2005
[2]張軍.基于時間序列相似性的數(shù)據(jù)挖掘方法研究.[D].南京.東南大學.2004
[3]王露珊.對時間序列相似性查詢的最優(yōu)小波誤差估計.[J].計算機應用.2007