何曉斐,夏志杰(上海工程技術大學 管理學院,上海 201620)
技術戰(zhàn)略對國家提高科技創(chuàng)新綜合實力至關重要,且技術戰(zhàn)略的制定離不開對技術當前發(fā)展狀態(tài)及未來發(fā)展趨勢的準確把握與判斷,而技術生命周期是反映技術發(fā)展趨勢的重要指標[1]。技術生命周期的科學判斷不僅可以幫助國家快速把握國內外技術的發(fā)展態(tài)勢,幫助企業(yè)宏觀了解技術發(fā)展現(xiàn)狀。因此,技術生命周期的準確判斷對國家和企業(yè)的發(fā)展規(guī)劃和前瞻性管理都有至關重要的作用。
識別技術生命周期的方法集中在以下三個方面:第一種為模型化方法,即使用曲線或者已構建模型對技術生命周期進行識別判斷,如S 曲線[2]、Fish-pry 模型法[3]和系統(tǒng)動力學方法[4];第二種為計量法,即使用文獻計量和數(shù)據(jù)挖掘的方法對技術生命周期進行識別和判斷,如專利指標分析法[5]、TCT 計算法[6]和多指標測量法[7];第三種為描述法,即偏向于主觀評估度量,如基于TRL 的技術成熟度分析方法[5]與德爾菲法。其中模型化方法和計量法無法深入技術生命周期內部探索其技術演化的內在特征。隨著技術生命周期發(fā)展判斷的研究逐漸增多,運用多指標識別技術生命周期分界時間線被越來越多的研究者采用[7],但面對演化時間長且發(fā)展曲折的技術會忽視技術內部的客觀演化規(guī)律,導致劃分效果具有較大的隨機性。故擬融合模型法和計量法構造技術生命周期預測模型,深入探討技術的發(fā)展演變情況。
結合多指標模型和隱馬爾可夫模型構建多指標隱馬爾可夫模型,從專利申請數(shù)量、技術開發(fā)人員數(shù)量和審查過程持續(xù)時間三個指標優(yōu)化隱馬爾可夫模型,更準確地識別技術生命周期。具體的研究包括:提取相關專利指標的數(shù)據(jù)處理成時間序列數(shù)據(jù);然后,利用BIC 判斷技術生命周期的階段數(shù),再運用Baum-Welch 模型來估計模型參數(shù),Viterbi 算法獲得最可能的狀態(tài)序列;最后將多指標隱馬爾可夫模型同技術生命周期的經典S 曲線和多指標技術生命周期判斷體系相比較,驗證其有效性及精確度。
本文基于數(shù)據(jù)源和預測方法進行改進,以智能手表技術為例,提出一種技術預測和改進模型。首先,對數(shù)據(jù)指標進行重構,豐富數(shù)據(jù)指標,提供更為可靠的結果;其次,利用雙隨機過程的隱馬爾可夫模型確定技術生命周期的階段數(shù)及每個年份所對應的技術生命周期階段,并給出每個技術生命周期階段的轉移概率;最后,利用主成分分析法分析每個指標的貢獻率,構造技術生命周期指數(shù),對隱馬爾可夫模型所判斷的技術生命周期階段進行對比和驗證。
提取技術生命周期的時間序列專利指標需考慮以下問題:首先,專利指標可以捕獲決定技術生命周期階段的因素—技術影響,并分析這些指標的動態(tài)行為是否可用于技術生命周期分析。其次,選擇的專利指標可表明不同生命周期階段之間存在的顯著差異,以提高準確性和可靠性。最后,在數(shù)據(jù)可獲取性方面,從公共數(shù)據(jù)庫中提取的指標提高了所提方法的可行性?;谶@些考慮,選擇了以下3 個時間序列專利指標。
(1)專利數(shù)量(PNt):該指標是分析技術生命周期最常用的指標之一。在分析技術生命周期時,該指標的增減可以被解釋為研發(fā)活動水平和變化情況。根據(jù)以往文獻表明,一項技術的專利數(shù)量會一直增加直至生命周期的成熟期,然后開始逐漸下降,達到飽和??紤]到這些因素,本文將此指標定義為時刻t 某技術領域發(fā)布專利數(shù)量的時間序列數(shù)據(jù)。
(2)技術開發(fā)人員數(shù)量(TDt):在技術生命周期的初始階段,有許多開發(fā)者試圖進入該領域,但隨著技術的逐漸成熟,少數(shù)技術開發(fā)人員仍然留在該領域。基于此,本文將此指標定義為時刻t 某技術領域中技術開發(fā)人員數(shù)量的時間序列數(shù)據(jù)。
(3)審查過程持續(xù)時間(DE Pt):專利審查過程的持續(xù)時間和技術價值之間存在重要關系。因為審查者缺乏新技術的經驗,對先前技術數(shù)量進行嚴格檢查,故專利審查持續(xù)時間受到技術生命周期階段的影響。因此,本文將此指標定義為時刻t 某項技術相關專利從申請日到授予日之間平均時間的時間序列數(shù)據(jù)。
隱馬爾可夫模型是一種基于雙隨機過程的機器學習技術,在雙隨機過程中,潛在的隨機過程不能直接觀察到,但可以通過第二組隨機過程觀察到。隱馬爾可夫模型由初始概率分布、狀態(tài)轉移概率分布及觀測概率分布確定,可表示為λ=(I,O,A,B,π),I 是長度為T 的狀態(tài)序列I=(i1,i2,i3,…,iT),O 是對應的觀測序列O=(o1,o2,o3,…,oT),A 是狀態(tài)轉移序列A=[aij]N×N,其中:
是在時刻t 處于狀態(tài)qi的條件下在時刻t+1 轉移到狀態(tài)qj的概率。其中it是t 時刻的一種狀態(tài),N 是可能的狀態(tài)數(shù),可以通過定性分析或貝葉斯信息準則等定量工具根據(jù)情況確定最佳狀態(tài)數(shù)N。B 是觀測概率矩陣B=[bj(k)]N×M,其中:
是在時刻t 處于狀態(tài)qi的條件下生成觀測vk的概率。π 是初始狀態(tài)概率向量π=(πi),其中:
是在時刻t=1 處于狀態(tài)qi的概率。
對于連續(xù)的隱馬爾可夫模型,需要確定觀測向量的狀態(tài)概率密度函數(shù)分布來估計模型參數(shù)。本文假設專利指標遵循均值為μj,協(xié)方差矩陣為Σj的多元高斯分布,不同技術之間的均值和協(xié)方差不同,相同技術在不同生命周期階段的均值和協(xié)方差也不同。公式如下所示:
其中:第j 個分量是混合參數(shù)φj的多元高斯分布,平均值為μj,協(xié)方差矩陣為Σj。
然后利用貝葉斯信息度量(BIC)確定技術生命周期的階段數(shù)。BIC 準則解決時間序列數(shù)據(jù)定階問題時,在大樣本的情況下表現(xiàn)優(yōu)于AIC 準則,BIC 使用貝葉斯因子方法來選擇模型,不需要考慮參數(shù)的先驗概率。通過選擇BIC 最小值對應的擬合模型來確定貝葉斯后驗概率最高的模型。其公式如下所示:
其中:f(y|θk)為模型的極大似然函數(shù),K 為模型參數(shù)個數(shù),n 為樣本數(shù)。
接下來利用Baum-Welch 模型來估計模型參數(shù),它的參數(shù)學習可以用EM 算法來實現(xiàn)。輸入相應的觀測序列即可學習隱馬爾可夫模型λ=(A,B,)π 的參數(shù);再利用Viterbi 算法獲得最可能的狀態(tài)序列。最后,得到了技術生命周期進程的各個階段,以及狀態(tài)轉移概率矩陣、觀測概率密度矩陣和初始狀態(tài)概率向量。
一般情況下多指標測度體系用于技術生命周期判斷時,需要構建技術生命周期指數(shù)模型,目的是將多個指標綜合起來,通過主成分分析法獲取主成分個數(shù)及特征因子權重,然后通過指數(shù)綜合模型來計算綜合評價值,觀察技術生命周期演化曲線發(fā)展趨勢判斷技術所處發(fā)展階段。其中,主成分所表現(xiàn)出的信息貢獻率是有差異的,為了更好地反映出指標重要性的差異性,本文采取主成分的方差貢獻率與累計方差貢獻率的比值作為主成分權重賦予的依據(jù),保證加權的客觀性,體現(xiàn)出指標構建的科學性。目前關于多指標體系綜合指數(shù)模型構建已有大量相關研究工作,本文在參考了相關研究資料后所構建的技術生命周期指數(shù)模型為:
公式中I 代表技術生命周期指數(shù),ωi代表第i 個主成分的權重,F(xiàn)i為第i 個主成分。利用構造的技術生命周期指數(shù)對隱馬爾可夫模型判斷的階段數(shù)進行排列,得出技術生命周期的狀態(tài)序列。
為驗證構建的技術生命周期多指標測度體系的優(yōu)越性,選擇技術生命周期判斷方法中最為常用的基于累計專利申請量的S曲線和多指標技術生命周期識別模型與其進行對比分析,判斷多指標隱馬爾可夫模型識別技術生命周期的有效性及靈敏度。
本文以智能手表專利技術為例,對模型進行實證分析。數(shù)據(jù)來源于專利分析與檢索網站(https://pss-system.cponline.cnipa.gov.cn/),檢索“智能手表”獲取2013 年至2021 年的智能手表專利數(shù)據(jù)。根據(jù)IPC 專利號將智能手表分類成若干子類,因某些子類專利數(shù)較少仍處于生命周期的早期階段,故選取子類專利數(shù)較多的子類進行技術生命周期的討論分析。選取9 個子類共6 530 條專利數(shù)據(jù),專利子類分別為A44、A61、G01、G04、G06、G08、H01、H02、H04。為減少短期波動,將9 個子類共6 530 條專利數(shù)據(jù)按照指標PNt、TDt和DEPt處理成以年為單位的時間序列數(shù)據(jù)。
將處理后的時間序列數(shù)據(jù)集用多變量高斯混合模型與時間序列專利指標擬合后,根據(jù)BIC 擬合模型階段數(shù),擬合結果如圖1 所示,由圖1 可得將類別設置為4 時,BIC 的值最小,這意味著分子擴增診斷技術的生命周期最好由4 個不同階段來解釋。
圖1 BIC 劃分技術生命周期階段數(shù)
運用Python 中實現(xiàn)的“hmm”包,通過Baum-Welch 和Viterbi 算法估計模型的相關參數(shù)均值及各階段狀態(tài)轉移矩陣,但由于計算機輸出的技術生命周期階段的階段順序不確定,故引入技術生命周期指數(shù)。運用SPSS 軟件中的主成分分析法,確定各特征因子權重,得到技術生命周期指數(shù)的表達式為:
其中:Fi設定為各指標在每個階段的均值。根據(jù)技術生命周期指數(shù)確定技術生命周期階段順序,各指標所處階段狀態(tài)轉移概率矩陣分別如表1 所示。最后,推導出智能手表的子技術生命周期序列如圖2 所示。
圖2 智能手表子技術生命周期預測
表1 狀態(tài)轉移概率矩陣
由隱馬爾可夫模型預測的智能手表子技術的技術生命周期所處階段不一,大多數(shù)子技術處于技術生命周期的第二階段,但是子技術G06 和H04 發(fā)展較快,已發(fā)展到技術生命周期的第四階段。
為驗證隱馬爾可夫模型預測技術生命周期階段劃分的準確性,選擇技術生命周期判斷方法中最為常用的基于專利累計申請量的S 曲線和多指標技術生命周期指數(shù)方法與多指標隱馬爾可夫模型進行對比分析來驗證所構建的技術生命周期多指標測度體系的有效性。本節(jié)選取的技術生命周期指數(shù)表達式為公式(7)。
圖3 中的長虛線表示S 曲線和多指標技術生命周期指數(shù)方法曲線所判斷的技術生命周期階段劃分的結果,兩種方法所判斷的結果相同;圖中短虛線所表示的是本文所構建的隱馬爾可夫模型所判斷的技術生命周期階段劃分的結果??芍[馬爾可夫模型所判斷的萌芽期和成長期的分界時間點和成長期與成熟期的分界時間點與S 曲線和多指標技術生命周期指數(shù)方法所判斷的相差不大;但是隱馬爾可夫模型判斷成熟期與衰退期的分界時間點要早于S 曲線和多指標技術生命周期方法所判斷的分解時間點,這兩種方法所表現(xiàn)的較為延遲。
圖3 H04 技術三種技術生命周期階段判斷技術對比
針對所選取的智能手表的子技術而言,多指標隱馬爾可夫模型與S 曲線和多指標技術生命周期模型相較,多指標隱馬爾可夫模型在技術生命周期不同發(fā)展階段分界線方面更加符合實際,更加精準。
本文融合多指標模型與隱馬爾可夫模型構建多指標隱馬爾可夫模型,采用智能手表專利技術進行實證研究并對模型的有效性和精確度進行驗證。首先,從“多指標測度體系與隱馬爾可夫模型相結合”這一研究視角出發(fā),利用技術生命周期多指標測度體系與隱馬爾可夫模型相結合,判斷技術生命周期階段的分界線。然后,選擇智能手表產品為例,對其技術生命周期進行預測。最后,將多指標隱馬爾可夫模型與S 曲線模型和多指標技術生命周期指數(shù)測度體系對比,驗證其有效性和精確度。結果表明多指標隱馬爾可夫模型在劃分技術發(fā)展階段分界點方面更加準確、更加符合實際情況,為技術生命周期不同發(fā)展階段的研判提供了一個新的研究視角。所構建的多指標隱馬爾可夫模型也存在一定的局限性,模型中所需要的指標體系還未得到全面考慮,指標體系中未加入專利文獻指標;或可進一步考慮較難量化的技術性能指標的量化與計算,將有利于獲得更加全面及科學的技術生命周期研判結果。