張振剛,羅泰曄
(1.華南理工大學(xué)工商管理學(xué)院,廣州510640;2.廣州數(shù)字創(chuàng)新研究中心,廣州510640;3.廣東省科技革命與技術(shù)預(yù)見智庫,廣州510640)
技術(shù)機(jī)會(huì)識(shí)別,是發(fā)現(xiàn)特定技術(shù)領(lǐng)域內(nèi)具有潛在價(jià)值的技術(shù)應(yīng)用機(jī)會(huì)的過程。在科技發(fā)展日新月異的背景下,準(zhǔn)確識(shí)別領(lǐng)域內(nèi)的技術(shù)機(jī)會(huì),對(duì)于研發(fā)組織的可持續(xù)發(fā)展具有重要的意義。識(shí)別技術(shù)機(jī)會(huì)的方法分為定性分析和定量分析兩類。在定性分析方法方面,德爾菲法和情景分析法是兩種主要的方法[1]。定性分析方法主要依靠專家的意見,存在程序復(fù)雜、耗時(shí)長(zhǎng)、社會(huì)成本高、專家意見的差異性不易處理等問題[2]。因此,大多數(shù)研究者都采用定量的方法來識(shí)別技術(shù)機(jī)會(huì)。在進(jìn)行定量分析時(shí),專利數(shù)據(jù)是常用的素材。專利是創(chuàng)新成果的一種表現(xiàn)形式,其本質(zhì)在于包含在其中的知識(shí),一個(gè)專利所含有的知識(shí)可以看成是若干知識(shí)元素的集合[3-4]。根據(jù)知識(shí)基礎(chǔ)觀(knowledge-based view),知識(shí)是創(chuàng)新投入和價(jià)值創(chuàng)造的主要來源[5]。因此,有學(xué)者提出了知識(shí)組合理論,其認(rèn)為創(chuàng)新在本質(zhì)上是研發(fā)或?qū)嶒?yàn)中對(duì)知識(shí)元素進(jìn)行組合的過程[6-8]。這個(gè)過程既包括探索新的知識(shí)元素組合,又包括對(duì)已有知識(shí)元素組合的重用(reuse)[6]。在對(duì)知識(shí)元素進(jìn)行組合的過程中,不同的知識(shí)元素出現(xiàn)的時(shí)間、頻率及組合能力各不相同。因此,本研究利用知識(shí)元素的這些特征來識(shí)別特定領(lǐng)域的技術(shù)機(jī)會(huì),提出一種基于專利分析的技術(shù)機(jī)會(huì)識(shí)別新方法。
目前,技術(shù)機(jī)會(huì)識(shí)別主要有三個(gè)研究方向。第一個(gè)研究方向是研究技術(shù)融合。技術(shù)融合是指兩個(gè)或多個(gè)技術(shù)領(lǐng)域?qū)崿F(xiàn)知識(shí)的共享和交叉應(yīng)用[9]。例如,Park等[10]以生物和信息領(lǐng)域的專利為分析對(duì)象,基于專利引用網(wǎng)絡(luò)來預(yù)測(cè)兩個(gè)領(lǐng)域間的知識(shí)流動(dòng),進(jìn)而發(fā)現(xiàn)技術(shù)融合的機(jī)會(huì)。Han等[11]通過關(guān)聯(lián)規(guī)則對(duì)專利分類號(hào)進(jìn)行分析,發(fā)現(xiàn)了信息通信領(lǐng)域與其他技術(shù)領(lǐng)域的技術(shù)融合機(jī)會(huì)。第二個(gè)研究方向是研究技術(shù)空缺,即識(shí)別能夠滿足某領(lǐng)域技術(shù)需求的機(jī)會(huì)[12]。例如,Choi等[13]使用貝葉斯模型對(duì)專利進(jìn)行聚類,進(jìn)而發(fā)現(xiàn)領(lǐng)域內(nèi)的技術(shù)空缺。Son等[14]以光刻技術(shù)的專利為例,利用生成式拓?fù)溆成洌℅TM)來開發(fā)專利地圖,并發(fā)現(xiàn)地圖中的空白區(qū)域,通過空白區(qū)域與原始關(guān)鍵詞向量的逆映射來解釋每個(gè)空白的含義,最終發(fā)現(xiàn)了空缺的技術(shù)機(jī)會(huì)。第三個(gè)研究方向是研究新興技術(shù),即具有高增速、高新穎度、高不確定性以及高市場(chǎng)潛力的技術(shù)[15]。例如,Joung等[16]構(gòu)建了專利關(guān)鍵詞矩陣,使用層次聚類的方法來發(fā)現(xiàn)葡萄糖生物傳感器領(lǐng)域的新興技術(shù)。Moehrle等[17]以影像技術(shù)的專利為素材,通過專利語義分析來識(shí)別領(lǐng)域內(nèi)的新興技術(shù)。
RFM模型是市場(chǎng)營銷領(lǐng)域識(shí)別客戶價(jià)值的經(jīng)典模型,用于在觀測(cè)點(diǎn)對(duì)觀測(cè)期(觀測(cè)點(diǎn)之前的一段時(shí)間)內(nèi)顧客消費(fèi)的情況進(jìn)行分析,從而識(shí)別出重要價(jià)值客戶[18]。R(recency)是指顧客消費(fèi)的臨近性,常用最近一次消費(fèi)距離觀測(cè)點(diǎn)的時(shí)間長(zhǎng)度來衡量;F(frequency)是指觀測(cè)期內(nèi)顧客消費(fèi)的頻率;M(monetary)是指顧客的消費(fèi)能力,常用觀測(cè)期內(nèi)顧客消費(fèi)的金額來衡量?;赗FM模型,Cheng等[18]分析了一家臺(tái)灣電子產(chǎn)業(yè)公司的顧客的忠誠度;Yan等[19]通過分析財(cái)產(chǎn)保險(xiǎn)公司的客戶的終身價(jià)值來評(píng)估客戶風(fēng)險(xiǎn);Seymen[20]研究了英國連鎖超市顧客流失的情況,并進(jìn)行顧客細(xì)分;馬寶龍等[21]提出了一種對(duì)未來顧客價(jià)值進(jìn)行識(shí)別的方法,并用一家購物中心的顧客交易數(shù)據(jù)進(jìn)行了實(shí)證分析。
隨機(jī)行動(dòng)者導(dǎo)向模型(stochastic actor-oriented models,SAO模型)是基于縱向數(shù)據(jù)來分析網(wǎng)絡(luò)動(dòng)態(tài)演化的模型,可同時(shí)分析網(wǎng)絡(luò)的演化和網(wǎng)絡(luò)節(jié)點(diǎn)行為的變化,是近年來社會(huì)網(wǎng)絡(luò)分析領(lǐng)域興起的從動(dòng)態(tài)視角分析社會(huì)網(wǎng)絡(luò)的有力工具。在SAO模型中,網(wǎng)絡(luò)演化的過程被稱作社會(huì)選擇(social selec‐tion),而網(wǎng)絡(luò)節(jié)點(diǎn)行為變化則是社會(huì)影響(social influence)的過程。SAO模型把網(wǎng)絡(luò)的演化視為網(wǎng)絡(luò)中的節(jié)點(diǎn)建立、維持或終止與其他節(jié)點(diǎn)之間連接的過程。網(wǎng)絡(luò)節(jié)點(diǎn)的連邊選擇受如下目標(biāo)函數(shù)控制[22]:
其中,snet表示影響節(jié)點(diǎn)連邊選擇的各種效應(yīng);βnet表示效應(yīng)的參數(shù)估計(jì)。
類似地,網(wǎng)絡(luò)節(jié)點(diǎn)在不同時(shí)期的行為變化受如下目標(biāo)函數(shù)控制:
其中,sbeh表示影響節(jié)點(diǎn)行為變化的各種效應(yīng);βbeh表示效應(yīng)的參數(shù)估計(jì)。
基于SAO模型,Cao等[23]分析了基于建筑信息建模的工程中合作網(wǎng)絡(luò)的演化。吳江等[24]研究了在線醫(yī)療社區(qū)用戶關(guān)系網(wǎng)絡(luò)的動(dòng)態(tài)演化。Finger等[25]探討了驅(qū)動(dòng)銀行間貨幣市場(chǎng)網(wǎng)絡(luò)形成的因素。在分析網(wǎng)絡(luò)成員行為的演化方面,Mohrenberg[26]分析了貿(mào)易開放政策在不同國家間的擴(kuò)散情況。Kavaler等[27]研究了開源軟件社區(qū)軟件開發(fā)者的代碼所有權(quán)和開發(fā)效率的變化。
在技術(shù)機(jī)會(huì)識(shí)別方面,現(xiàn)有基于專利數(shù)據(jù)的定量分析方法大多停留在專利的外部指標(biāo)層面,如專利關(guān)鍵詞分析、引用情況分析等,對(duì)專利的知識(shí)本質(zhì)還缺乏充分利用。RFM模型主要用于客戶關(guān)系管理領(lǐng)域,但其通過關(guān)鍵指標(biāo)聚類來識(shí)別重要價(jià)值對(duì)象的思想可以為其他領(lǐng)域的研究提供借鑒。在SAO模型的使用上,現(xiàn)有研究主要集中在分析社會(huì)網(wǎng)絡(luò)的演化和網(wǎng)絡(luò)節(jié)點(diǎn)行為的變化,而鮮有用于知識(shí)網(wǎng)絡(luò)的分析。本文基于專利的知識(shí)本質(zhì)和知識(shí)組合理論,借鑒RFM模型的思想來評(píng)價(jià)特定領(lǐng)域的知識(shí)元素,使用SAO模型來分析知識(shí)網(wǎng)絡(luò)的演化和知識(shí)元素的組合特征,并在此基礎(chǔ)上提出識(shí)別特定領(lǐng)域技術(shù)機(jī)會(huì)的新方法。
由于一個(gè)技術(shù)領(lǐng)域內(nèi)的知識(shí)元素眾多,不同知識(shí)元素的利用價(jià)值各有不同,本研究需要識(shí)別能反映領(lǐng)域內(nèi)技術(shù)發(fā)展趨勢(shì)的知識(shí)元素,并探索這些知識(shí)元素進(jìn)行組合的新機(jī)會(huì)。因此,本文采用三個(gè)步驟進(jìn)行分析:第一步,提出識(shí)別趨勢(shì)性知識(shí)元素的方法;第二步,分析知識(shí)元素的組合規(guī)律,并提出識(shí)別技術(shù)機(jī)會(huì)的方法;第三步,根據(jù)所提出的方法,預(yù)測(cè)趨勢(shì)性知識(shí)元素的組合機(jī)會(huì),并檢驗(yàn)預(yù)測(cè)的準(zhǔn)確性。其中,第二步要以特定技術(shù)領(lǐng)域的專利數(shù)據(jù)為素材,本研究以人工智能領(lǐng)域?yàn)槔?,在分析前進(jìn)行數(shù)據(jù)的收集。選擇人工智能作為目標(biāo)分析對(duì)象的原因有三方面:第一,從領(lǐng)域知識(shí)特性上看,人工智能領(lǐng)域的知識(shí)具有多學(xué)科交叉性,覆蓋了電子、計(jì)算機(jī)、生物醫(yī)學(xué)等多個(gè)知識(shí)領(lǐng)域。分析人工智能領(lǐng)域的技術(shù)創(chuàng)新,實(shí)質(zhì)上是分析多個(gè)領(lǐng)域的技術(shù)創(chuàng)新。因此,與單一領(lǐng)域相比,選擇人工智能領(lǐng)域作為分析對(duì)象更具普遍性和代表性。第二,從統(tǒng)計(jì)學(xué)特性上看,人工智能領(lǐng)域的專利成果較多,能夠提供大樣本的分析素材,使分析結(jié)果更具可靠性。第三,從實(shí)踐性上看,目前,世界上許多國家和地區(qū)都把人工智能作為戰(zhàn)略性新興產(chǎn)業(yè)。因此,挖掘人工智能領(lǐng)域的技術(shù)機(jī)會(huì),具有重要的實(shí)踐參考價(jià)值。
本研究借鑒文獻(xiàn)[28]使用的檢索式,用從德溫特專利數(shù)據(jù)庫檢索了2013—2018年人工智能領(lǐng)域的專利數(shù)據(jù),共12579條記錄。參考已有研究的做法[4,29],本文用專利的國際分類號(hào)(IPC)來表示專利所含有的知識(shí)元素。專利的國際分類號(hào)采用等級(jí)形式,分為部—大類—小類—大組—小組等五個(gè)等級(jí)。已有的大部分研究都是采用分類號(hào)的前四位(即小類級(jí))來代表知識(shí)元素。但小類級(jí)的代碼包含的技術(shù)范圍過于寬泛,不能準(zhǔn)確描述專利所具有的知識(shí)元素。而分類號(hào)到大組級(jí)能夠較好地反映專利所代表的產(chǎn)品、技術(shù)過程和機(jī)制[30]。因此,本文用大組級(jí)的分類號(hào)來代表專利所具有的知識(shí)元素。
根據(jù)知識(shí)組合理論的觀點(diǎn),專利發(fā)明是對(duì)相關(guān)知識(shí)元素進(jìn)行組合的結(jié)果,不同的知識(shí)元素的組合能力不盡相同[31]。在一個(gè)觀測(cè)期內(nèi),不同的知識(shí)元素出現(xiàn)的頻率和出現(xiàn)的時(shí)間也存在差異。知識(shí)元素的這些特征與市場(chǎng)營銷領(lǐng)域顧客的消費(fèi)行為特征存在相似性。因此,借鑒RFM模型的思路,本研究使用三個(gè)指標(biāo)對(duì)知識(shí)元素進(jìn)行評(píng)價(jià),識(shí)別出領(lǐng)域內(nèi)的重要知識(shí)元素。其中,R代表知識(shí)元素出現(xiàn)的時(shí)間特征,F(xiàn)表示知識(shí)元素出現(xiàn)的頻率,M則代表知識(shí)元素的組合能力。根據(jù)相關(guān)研究,一個(gè)知識(shí)元素的組合能力越強(qiáng),則該元素與其他知識(shí)元素的相關(guān)性越強(qiáng),能夠與之進(jìn)行組合的知識(shí)元素越多,其應(yīng)用越具有多樣性,其應(yīng)用潛力和應(yīng)用價(jià)值也就越大[7,29,31]。本文對(duì)三個(gè)指標(biāo)的計(jì)算方法如表1所示。
表1 知識(shí)元素評(píng)價(jià)指標(biāo)
表1 中提到的知識(shí)網(wǎng)絡(luò)由知識(shí)元素組成,知識(shí)網(wǎng)絡(luò)中的節(jié)點(diǎn)代表知識(shí)元素,兩個(gè)知識(shí)元素在同一個(gè)專利中出現(xiàn),代表了一種組合,在網(wǎng)絡(luò)中將代表這兩個(gè)元素的節(jié)點(diǎn)相連?;谏鲜鋈齻€(gè)指標(biāo),本研究通過聚類的方法來發(fā)現(xiàn)領(lǐng)域內(nèi)的重要知識(shí)元素。這類知識(shí)元素具有三個(gè)特點(diǎn):一是出現(xiàn)的時(shí)間離觀測(cè)點(diǎn)較近,具有一定的時(shí)效性,代表了新近的應(yīng)用方向;二是出現(xiàn)頻率高,代表了領(lǐng)域內(nèi)的熱門技術(shù)應(yīng)用;三是與較多的知識(shí)元素進(jìn)行過組合,具有較強(qiáng)的組合能力。對(duì)具有這三個(gè)特征的知識(shí)元素進(jìn)行研究和應(yīng)用,在一定程度上代表了未來領(lǐng)域內(nèi)技術(shù)的發(fā)展趨勢(shì)[12]。因此,本文把這類知識(shí)元素稱為領(lǐng)域內(nèi)的趨勢(shì)性知識(shí)元素。
在識(shí)別出趨勢(shì)性知識(shí)元素后,本研究需要對(duì)這些知識(shí)元素未來的組合機(jī)會(huì)進(jìn)行預(yù)測(cè)。為得出知識(shí)元素間進(jìn)行組合的特征和規(guī)律,使用SAO模型來分析知識(shí)網(wǎng)絡(luò)的演化。本研究以2013—2015年每年都出現(xiàn)的知識(shí)元素為對(duì)象,以一年作為一個(gè)觀測(cè)期,共三期,相應(yīng)地構(gòu)建三個(gè)知識(shí)網(wǎng)絡(luò),用于SAO模型的分析。SAO模型的參數(shù)估計(jì)和模型檢驗(yàn)使用R語言中的RSiena程序包編寫代碼,采用馬爾科夫鏈-蒙特卡洛估計(jì)法(MCMC)來進(jìn)行研究。表2中列出了影響知識(shí)元素間進(jìn)行組合的常見效應(yīng)及其參數(shù)估計(jì)的情況。
表2 SAO模型檢驗(yàn)
從表2可以看出,模型的總體最大收斂率(over‐all maximum convergence ratio)為0.0623,小 于0.25,這說明模型整體收斂度較好,各種效應(yīng)檢驗(yàn)可靠。Rate parameter period 1表示從第一個(gè)觀測(cè)期(2013年)到第二個(gè)觀測(cè)期(2014年)之間知識(shí)網(wǎng)絡(luò)中節(jié)點(diǎn)的連邊改變的平均程度;Rate parameter period 2表示從第二個(gè)觀測(cè)期(2014年)到第三個(gè)觀測(cè)期(2015年)之間知識(shí)網(wǎng)絡(luò)中的連接改變的平均程度。degree(density)的系數(shù)為負(fù),說明所構(gòu)建的網(wǎng)絡(luò)密度較低。transitive triads的系數(shù)為正且效應(yīng)顯著,表明知識(shí)網(wǎng)絡(luò)在演化過程中存在明顯的傳遞性效應(yīng),即具有共同鄰近節(jié)點(diǎn)的知識(shí)元素間有建立連接的趨勢(shì)。degree act+pop效應(yīng)反映的是程度中心度高的節(jié)點(diǎn)在網(wǎng)絡(luò)演化過程中建立更多連接的趨勢(shì),該效應(yīng)的系數(shù)為正且顯著,說明知識(shí)網(wǎng)絡(luò)中程度中心度高的知識(shí)元素在網(wǎng)絡(luò)演化過程中能夠與更多的知識(shí)元素進(jìn)行組合。
因此,一個(gè)知識(shí)元素的中心度、與焦點(diǎn)知識(shí)元素的共同好友數(shù)可以作為判斷這個(gè)知識(shí)元素與焦點(diǎn)知識(shí)元素進(jìn)行組合的可能性的指標(biāo)。這兩個(gè)變量及其交互作用能在一定程度上反映兩個(gè)知識(shí)元素間的組合趨勢(shì)。此外,兩個(gè)知識(shí)元素在知識(shí)網(wǎng)絡(luò)中的距離也會(huì)在一定程度上影響兩者進(jìn)行組合的可能性[32]。基于上述分析,本文提出組合值的概念,用來衡量知識(shí)元素間的新組合機(jī)會(huì),焦點(diǎn)知識(shí)元素i與知識(shí)元素j的組合值用如下公式計(jì)算:
其中,degreej表示知識(shí)元素j在知識(shí)網(wǎng)絡(luò)中的程度中心度,即網(wǎng)絡(luò)中與j直接相連的節(jié)點(diǎn)數(shù);mfij表示知識(shí)元素i和j在網(wǎng)絡(luò)中的共同鄰居節(jié)點(diǎn)數(shù);distan‐ceij表示知識(shí)元素i與j在知識(shí)網(wǎng)絡(luò)中的距離。兩個(gè)知識(shí)元素的組合值越大,意味著兩者間進(jìn)行組合的可能性越大。
本研究將檢索到的專利數(shù)據(jù)分為兩段:2013—2015年為一個(gè)時(shí)間段,2016—2018年為另一個(gè)時(shí)間段。基于2013—2015年的數(shù)據(jù),利用本研究提出的方法來識(shí)別趨勢(shì)性知識(shí)元素,并預(yù)測(cè)趨勢(shì)性知識(shí)元素可能出現(xiàn)的新組合,即新的技術(shù)機(jī)會(huì),然后利用2016—2018年的專利數(shù)據(jù)來檢驗(yàn)預(yù)測(cè)的準(zhǔn)確性。
由于第3.2節(jié)中的公式(3)包含了知識(shí)元素在知識(shí)網(wǎng)絡(luò)中的中心度,本研究根據(jù)2013—2015年間的所有知識(shí)元素在專利中的共現(xiàn)情況構(gòu)建一個(gè)整體知識(shí)網(wǎng)絡(luò),如圖1所示。圖1中各節(jié)點(diǎn)旁邊的代碼為IPC分類號(hào),代表知識(shí)元素的名稱,整個(gè)網(wǎng)絡(luò)中有696個(gè)節(jié)點(diǎn)。
圖1 知識(shí)網(wǎng)絡(luò)
為識(shí)別出人工智能領(lǐng)域的趨勢(shì)性知識(shí)元素,本文采用K均值聚類的方法,基于RFM模型的3個(gè)指標(biāo),將696個(gè)知識(shí)元素劃分到不同類別。由于指標(biāo)數(shù)為3,理論上最多可以把知識(shí)元素分為8類。本研究首先采用輪廓系數(shù)來確定最合適的類數(shù)[2]。圖2顯示了不同聚類數(shù)對(duì)應(yīng)的輪廓系數(shù)。
圖2 輪廓系數(shù)
從圖2可以看出,聚類數(shù)為4時(shí),輪廓系數(shù)最大,故本文把知識(shí)元素聚為4類。由于部分聚類指標(biāo)有較大的方差,在聚類前先對(duì)各指標(biāo)數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化處理。聚類結(jié)果如圖3所示。
從圖3中可以看出,696個(gè)知識(shí)元素被劃分為了4類,知識(shí)元素?cái)?shù)量分別為439、53、200、4。各類的聚類指標(biāo)均值如表3所示。
圖3 聚類結(jié)果
表3 聚類指標(biāo)均值
從表3可以看出,第4類的4個(gè)知識(shí)元素平均出現(xiàn)時(shí)間短、頻率高、組合能力強(qiáng),故本研究認(rèn)為這4個(gè)知識(shí)元素是人工智能領(lǐng)域的趨勢(shì)性知識(shí)元素,這4個(gè)知識(shí)元素的具體內(nèi)容如表4所示。
從表4可以看出,人工智能領(lǐng)域的趨勢(shì)性知識(shí)元素可以分成三類:電數(shù)字?jǐn)?shù)據(jù)的處理(包括處理方法和處理裝置)、圖像識(shí)別和語音識(shí)別??梢哉J(rèn)為,這三類知識(shí)代表了人工智能領(lǐng)域的應(yīng)用趨勢(shì)。因此,本文需要對(duì)這三個(gè)具體方向的新技術(shù)機(jī)會(huì)進(jìn)行識(shí)別。
為分析表4中的4個(gè)趨勢(shì)性知識(shí)元素的新技術(shù)機(jī)會(huì),本研究基于公式(3),計(jì)算在2013—2015年未與這4個(gè)知識(shí)元素組合過的知識(shí)元素與其組合值,并將組合值最大的10個(gè)知識(shí)元素視為趨勢(shì)性知識(shí)元素潛在的新技術(shù)機(jī)會(huì),具體結(jié)果如表5所示。
為了檢驗(yàn)上文提出的方法的有效性,本文統(tǒng)計(jì)了2016—2018年每個(gè)趨勢(shì)性知識(shí)元素與表5中的10個(gè)知識(shí)元素進(jìn)行組合的實(shí)際情況,結(jié)果如表6所示。
結(jié)合表5和表6可以看出,對(duì)于趨勢(shì)性知識(shí)元素G06F017來講,組合值最大的10個(gè)知識(shí)元素中有5個(gè)在2016—2018年間與之進(jìn)行了組合。例如,知識(shí)元素G01N021與G06F017之間的組合出現(xiàn)了3次,知識(shí)元素G07C009與G06F017之間的組合出現(xiàn)了1次。技術(shù)機(jī)會(huì)識(shí)別的準(zhǔn)確率為50%。類似地,對(duì)于趨勢(shì)性知識(shí)元素G06K009、G06F003和G10L015來講,技術(shù)機(jī)會(huì)識(shí)別的準(zhǔn)確率分別為90%、70%、60%??傮w而言,本研究預(yù)測(cè)的40個(gè)新技術(shù)機(jī)會(huì)中有27個(gè)在2016—2018年間出現(xiàn),總體預(yù)測(cè)精度為67.5%。因此,本研究提出的方法能夠以一定的準(zhǔn)確率識(shí)別出趨勢(shì)性知識(shí)元素新的技術(shù)機(jī)會(huì)。
表4 趨勢(shì)性知識(shí)元素及其描述
表5 趨勢(shì)性知識(shí)元素的新技術(shù)機(jī)會(huì)
表6 趨勢(shì)性知識(shí)元素新技術(shù)機(jī)會(huì)驗(yàn)證
從知識(shí)元素的具體內(nèi)容上看,人工智能技術(shù)的應(yīng)用范圍非常廣泛,包括:醫(yī)學(xué)診斷(A61B003)、立體電視系統(tǒng)(H04N013)、光學(xué)計(jì)量(G01B011)、支付系統(tǒng)(G06Q020),等等。這在一定程度上增加了研發(fā)人員確定研發(fā)對(duì)象的難度,而本文提出的方法能夠在研發(fā)方向上給予研發(fā)人員一定指引和啟發(fā)。
為檢驗(yàn)上文所提出的方法的穩(wěn)健性,本研究從德溫特?cái)?shù)據(jù)庫檢索了3D打印領(lǐng)域2014—2018年間的17272條專利數(shù)據(jù)進(jìn)行分析。3D打印于2013年左右興起,涉及材料、信息、電子、機(jī)械等多個(gè)技術(shù)領(lǐng)域,具有多學(xué)科、多領(lǐng)域交叉融合的特征,因此具有一定的代表性?;?014—2016年的專利數(shù)據(jù),本研究進(jìn)行趨勢(shì)性知識(shí)元素的識(shí)別和技術(shù)機(jī)會(huì)的預(yù)測(cè),再用2017—2018年的數(shù)據(jù)進(jìn)行檢驗(yàn)。知識(shí)元素聚類結(jié)果如圖4所示。
圖4 3D打印領(lǐng)域知識(shí)元素聚類
表7 3D打印領(lǐng)域技術(shù)機(jī)會(huì)識(shí)別
從圖4可以看出,知識(shí)元素被聚為5類。其中,聚類5里的8個(gè)知識(shí)元素為3D打印領(lǐng)域的趨勢(shì)性知識(shí)元素。根據(jù)本研究提出的方法對(duì)這8個(gè)知識(shí)元素的組合機(jī)會(huì)進(jìn)行預(yù)測(cè),結(jié)果如表7所示。從表7可以看出,本研究預(yù)測(cè)的80個(gè)技術(shù)機(jī)會(huì)中,有51個(gè)在2017—2018年出現(xiàn),預(yù)測(cè)準(zhǔn)確率為63.75%。這再次證明了本研究所提出的方法能夠以一定的準(zhǔn)確率預(yù)測(cè)特定領(lǐng)域的技術(shù)機(jī)會(huì)。
本文基于知識(shí)組合理論,以人工智能領(lǐng)域2013—2015年的專利數(shù)據(jù)為素材,首先,通過RFM模型的三個(gè)指標(biāo)對(duì)知識(shí)元素進(jìn)行聚類,進(jìn)而識(shí)別出領(lǐng)域內(nèi)的四個(gè)趨勢(shì)性知識(shí)元素。其次,使用SAO模型對(duì)知識(shí)網(wǎng)絡(luò)的演化過程進(jìn)行分析,發(fā)現(xiàn)了知識(shí)元素間進(jìn)行組合的規(guī)律,并基于此提出了評(píng)估知識(shí)元素間進(jìn)行組合的可能性的公式。最后,使用所提出的公式對(duì)四個(gè)趨勢(shì)性知識(shí)元素的新組合機(jī)會(huì)進(jìn)行預(yù)測(cè),并使用2016—2018年間的專利數(shù)據(jù)驗(yàn)證了所提出的方法的有效性。同時(shí),本研究也用3D打印領(lǐng)域的專利數(shù)據(jù)驗(yàn)證了所提出的方法的穩(wěn)健性。
本研究具有一定的理論和實(shí)踐意義。第一,本研究借鑒RFM模型中三個(gè)指標(biāo)的具體內(nèi)涵,提出了評(píng)價(jià)一個(gè)技術(shù)領(lǐng)域內(nèi)知識(shí)元素重要性的方法。該方法能夠識(shí)別出領(lǐng)域內(nèi)的趨勢(shì)性知識(shí)元素。第二,本研究使用SAO模型對(duì)知識(shí)網(wǎng)絡(luò)的動(dòng)態(tài)演化過程進(jìn)行了分析,揭示了知識(shí)元素間進(jìn)行組合的軌跡和趨勢(shì),發(fā)現(xiàn)與社會(huì)化網(wǎng)絡(luò)相似,知識(shí)網(wǎng)絡(luò)中也存在傳遞性效應(yīng)和中心度效應(yīng)。因此,本研究通過知識(shí)元素在知識(shí)網(wǎng)絡(luò)中的位置特征來發(fā)現(xiàn)新的技術(shù)機(jī)會(huì)。第三,本研究提出了一種識(shí)別技術(shù)機(jī)會(huì)的新方法,豐富了利用專利數(shù)據(jù)進(jìn)行技術(shù)機(jī)會(huì)發(fā)現(xiàn)的方法庫。專利數(shù)據(jù)是可以通過公開渠道獲得的數(shù)據(jù)。因此,本研究為研發(fā)組織發(fā)現(xiàn)技術(shù)機(jī)會(huì)和確定研發(fā)方向提供了一種可行的方案。
本研究也存在一定的局限性:首先,本研究以人工智能和3D打印領(lǐng)域的專利數(shù)據(jù)為對(duì)象進(jìn)行分析,但不同技術(shù)領(lǐng)域的知識(shí)可能有不同的特點(diǎn),其知識(shí)元素組合的方式也可能有所區(qū)別。因此,未來的研究可以對(duì)更多技術(shù)領(lǐng)域的專利進(jìn)行分析,以進(jìn)一步檢驗(yàn)本研究所提出的方法的可靠性。其次,本研究所提出的方法預(yù)測(cè)技術(shù)機(jī)會(huì)的準(zhǔn)確率在60%~70%,還有進(jìn)一步提升的空間。本研究使用的知識(shí)元素中心度、共同鄰近知識(shí)元素?cái)?shù)、知識(shí)元素距離等均是描述知識(shí)元素特征及知識(shí)元素間關(guān)系的直觀指標(biāo),能夠?qū)蓚€(gè)知識(shí)元素間潛在的組合關(guān)系進(jìn)行基本地刻畫,但不能進(jìn)行全面地反映,解釋力還可以進(jìn)一步加強(qiáng)。
因此,未來的研究可以對(duì)本研究提出的公式進(jìn)行優(yōu)化。例如,在知識(shí)元素的網(wǎng)絡(luò)位置特征方面,除了直接反映組合能力的程度中心度外,可以嘗試反映中介性的中介中心度、反映連接緊密性的緊密中心度、反映網(wǎng)絡(luò)冗余性的結(jié)構(gòu)洞等變量。共同鄰近節(jié)點(diǎn)數(shù)是節(jié)點(diǎn)相關(guān)性的一種體現(xiàn),未來的研究也可思考出現(xiàn)時(shí)間等其他維度的相關(guān)性或相似性。