陳昭陽,楊德智,馬 薇,高 虹,彭 燕
國家知識產權局專利審查協作中心,北京 100084
基于小波包分析的組合模型的專利申請量預測
陳昭陽,楊德智,馬 薇,高 虹,彭 燕
國家知識產權局專利審查協作中心,北京 100084
運用小波包多分辨分解和重構技術,將專利申請量時間序列分解為同尺度的趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項等四項內在規(guī)律項,再把分解后的四項進行單支重構,針對重構各項的統計特征分別采用ARIMA和ARMA不同模型進行建模預測,最后根據各項預測結果計算出專利申請量的預測值。通過對分類號為A61B專利申請量的分析和驗證,表明基于小波包分析的組合預測模型比傳統單一預測模型的預測精度更高。
小波包分析;專利申請量;ARIMA模型;ARMA模型;時間序列;預測
對各國家專利局而言,準確預測和估計專利申請量對審查能力規(guī)劃決策至關重要。歐美的專利局長期把握著該項預測工作的關鍵技術和發(fā)展脈絡[1,2],這些局大多采用了傳統的專利申請量的數理統計模型預測方法,包括自回歸模型(AR)、滑動平均模型(MA)、自回歸滑動平均模型(ARMA)以及整合自回歸滑動平均模型(ARIMA),這些方法大多采用單一模型對專利申請量進行預測,不考慮專利申請量的時間序列內在的變化情況,通常會丟失重要的趨勢項信息,因此,無法取得高精度的預測結果[1-5]。作為一種典型的時間序列,專利申請量基本運動變化是由趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項疊加構成。而且,趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項描述了專利申請量的時間序列按不同時間和頻率運動變化的本質。因此,要全面掌握和預測專利申請量的動態(tài)變化,獲得專利申請量時間序列的基本運動成分是關鍵。
小波包分析作為一種自適應的時-頻局部分析理論,采用多分辨分解與重構將時間序列分解到同尺度下的不同頻率上,從而聚焦專利申請量的動態(tài)發(fā)展變化的各細節(jié)。采用小波包分析將專利申請量分解為趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項,然后根據各項的統計特征分別采用ARIMA和ARMA組合建模方法,能夠獲得較為準確的專利申請量的預測模型。這樣將小波包分析與經典的時間序列預測建模方法結合起來,從而為專利申請量的建模與預測提供了一種新的方法,可提高預測精度。
對于專利申請量的時間序列,將其進行i=2層小波包分解為趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項四項,然后進行重建為如下四項:
對于專利申請量的時間序列,采用小波包分解為2層,獲得同尺度下的趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項等4個內在規(guī)律項,然后進行單支重構,對重構的各項分別采用ARIMA和ARMA模型進行預測建模,建立起專利申請量的小波包分析組合預測模型,如下圖所示:
專利申請量時間序列的小波包預測組合模型圖
首先,按月統計從1985年4月1日至2008年12月間的(一共282個月)、分類號為A61B的發(fā)明專利申請量,如圖1所示。
采用‘db4’小波函數對上述分類號為A61B的專利申請量進行小波包分解,分解2層后獲得專利申請量的趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項,如圖2所示。
圖1 A61B發(fā)明專利申請的時間序列圖
圖2 專利申請量的小波包分解圖
然后對小波包分解后的各項進行小波包單支重構,如圖3所示:
圖3 專利申請量的小波包重構圖
圖4 對趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項的預測值
將專利申請量的小波包分解重構的趨勢項進行平穩(wěn)性校驗,由該序列的校驗特征顯示該趨勢項為非平穩(wěn)序列,則采用ARIMA進行12個月的專利申請量預測;對小波包分解重構的季節(jié)項、循環(huán)項和不規(guī)則項進行平穩(wěn)性校驗,結果均為平穩(wěn)序列,則采用ARMA進行12個月專利申請量的預測。
最后累加上述四項預測值就獲得A61B領域的2009年度的12個月的發(fā)明專利申請量的預測值,各項由282個月的專利申請量對后12個月的預測值如圖4所示。
采用單一的ARIMA模型和基于小波包分析的組合模型預測分別對A61B領域的2009年度12個月的專利申請量進行預測,并與實際值進行比較,計算相對誤差,如表1所示:
表1 兩種模型的專利申請量預測值與實際值的比較
由計算出的相對誤差,得出兩種預測方法的各月的平均相對誤差分別是:17.13%和13.1%,可見基于小波包分析的組合模型對專利申請量的預測更為準確。
本文針對專利申請量的時間序列預測問題,提出了基于小波包分析的組合模型,對專利申請的時間序列進行小波包分解,獲得申請量的同尺度下的趨勢項、季節(jié)項、循環(huán)項和不規(guī)則項,針對四項不同的統計特征匹配不同的預測模型,建立了與歐美專利不同的專利申請量預測方法,由以上實證研究表明:基于小波包分析的組合模型的預測方法的預測精度要遠高于單一的ARIMA模型預測的精度,為我國專利申請量預測方法提供了更多的參考,同時,也為我國專利局規(guī)劃和布局資源提供了必要的支持。
[1]P.Hingley and M.Nicolas.Methods for forecasting numbers of patent applications at the european patent office.World Patent Information[J],2004,3(26):191-204.
[2]彼得·欣利,馬可·尼古拉斯.創(chuàng)新力預測:專利申請量預測方法研究[M].知識產權出版社,2010,1.
[3]Sheng XU,Tao QI,Liping ZHENG.Forecasting the Patent Applications Based on the Wavelet Transform and Potential Support Vector Machines.Journal of Computational Information Systems[J],2010,Vol.6(11):3633-3641.
[4]梁津娣,馬歡,等.中國專利申請量預測體系的初步研究[M].國家知識產權局學術委員會一般課題(Y060201),2007,3.
[5]陳小霞.專利申請量預測與實際申請量存在較大誤差[J].中國發(fā)明與專利,2008(1):85-86.
[6]王卓群,孫志國.一種小波分解回聲狀態(tài)網絡時間序列預測方法[J].電子測量與儀器學報,2010,24(10):947-952.
TP39
A
1674-6708(2011)50-0227-02