丁坤明,張潔逸,丁晟春*
(1.泰州市姜堰區(qū)科學(xué)技術(shù)局,江蘇 泰州 225500;2.南京理工大學(xué),江蘇 南京 210094)
專利是技術(shù)創(chuàng)新的載體,而核心專利代表著產(chǎn)業(yè)領(lǐng)域內(nèi)最關(guān)鍵的技術(shù)。維持并提高產(chǎn)業(yè)競爭優(yōu)勢的關(guān)鍵在于是否掌握以核心專利為導(dǎo)向的產(chǎn)業(yè)核心技術(shù)。2006年《國家知識產(chǎn)權(quán)戰(zhàn)略綱要》中指出:通過在生物醫(yī)藥、信息、新材料和先進制造等技術(shù)領(lǐng)域超前部署,掌握一批核心技術(shù)的專利來支撐我國高技術(shù)產(chǎn)業(yè)與新興產(chǎn)業(yè)的發(fā)展[1]。因此,利用專利數(shù)據(jù)在海量專利中識別出核心專利,了解產(chǎn)業(yè)領(lǐng)域技術(shù)發(fā)展規(guī)律與趨勢,尋找技術(shù)發(fā)展空位[2],對于創(chuàng)新主體提升核心競爭力至關(guān)重要。據(jù)世界知識產(chǎn)權(quán)組織統(tǒng)計,專利文獻可以代表大部分的技術(shù)研究,且有相當部分發(fā)明專利所代表的核心技術(shù)只存在于專利文獻中。產(chǎn)業(yè)領(lǐng)域往往由多個不同的細分領(lǐng)域組成,同一細分領(lǐng)域內(nèi)的專利技術(shù)相似度高,不同細分領(lǐng)域間的專利技術(shù)相似度低[3]。但目前很少有學(xué)者遵循“同類評價”的原則,從產(chǎn)業(yè)領(lǐng)域細分視角進行核心專利的識別,因此本文從產(chǎn)業(yè)領(lǐng)域細分視角構(gòu)建了基于熵權(quán)TOPSIS法的核心專利識別模型,能夠更細粒度地識別出產(chǎn)業(yè)領(lǐng)域核心專利,為核心專利的識別提供新思路。
國外學(xué)者很少使用核心專利這一概念,他們主要針對專利價值或質(zhì)量評估開展研究。國內(nèi)學(xué)者對核心專利的定義較多:韓志華[4]認為核心專利是指在某一技術(shù)領(lǐng)域中處于關(guān)鍵地位,對技術(shù)發(fā)展有著重大影響且具有高經(jīng)濟價值的專利。范月蕾等[5]認為核心專利具有先進的和不可替代的技術(shù)水平,具有持續(xù)的技術(shù)影響力,且能帶來可觀市場價值與經(jīng)濟收益。馬永濤等[6]認為核心專利因其原理設(shè)計、實施過程科學(xué)優(yōu)化以及技術(shù)領(lǐng)域涉及廣而無法被繞開,且具有巨大經(jīng)濟效益和戰(zhàn)略意義。謝萍[7]認為同時具備技術(shù)、經(jīng)濟、法律特性的才是核心專利。
目前,針對核心專利識別主要采用3種指標識別法。(1)單一指標識別法,即使用單個指標進行核心專利識別。Harhoff等[8]發(fā)現(xiàn)專利被引頻次可以作為識別核心專利的指標,專利被引頻次越高,專利價值也就越高。權(quán)利要求數(shù)量能夠同時反映專利的技術(shù)保護范圍和技術(shù)創(chuàng)新水平[9],是識別核心專利的有效指標。Lanjouw等[10]認為同族專利數(shù)也能反映專利技術(shù)的重要性。(2)指標組合識別法,即將多種單一指標識別方法簡單加以組合得到最終的核心專利。沈君等[11]對頻數(shù)、中介中心性、Burst指數(shù)和Σ指數(shù)4個指標進行分析,識別移動通信技術(shù)領(lǐng)域不同時段的關(guān)鍵技術(shù)。孫濤濤等[12]分別基于被引頻次、權(quán)利要求數(shù)和同族專利數(shù)綜合識別核心專利。(3)指標體系識別法,即構(gòu)建多級指標體系并確定各級指標權(quán)重。羅天雨[13]基于專利特征建立核心專利判別指標體系,將專家打分和層次分析法結(jié)合對指標進行賦權(quán)。袁潤等[14]基于粗糙集理論通過計算核心專利綜合指數(shù)(CICP)來識別通信領(lǐng)域核心專利。
對指標賦權(quán)相關(guān)研究,如李治東等[15]基于熵權(quán)層次分析法對核心專利識別模型的指標進行賦值。劉嘉龍等[16]基于熵權(quán)法與灰色關(guān)聯(lián)分析法對產(chǎn)業(yè)領(lǐng)域前沿專利指標體系賦權(quán)。王天歌等[17]基于TOPSIS方法確定核心專利識別指標權(quán)重。
本文將核心專利定義為:在特定時間階段和技術(shù)領(lǐng)域內(nèi),占據(jù)難以規(guī)避且不可替代的關(guān)鍵地位,并具有較高技術(shù)價值和經(jīng)濟價值的原創(chuàng)性專利。本文從領(lǐng)域細分視角構(gòu)建基于專利特征的指標識別法,并用熵權(quán)TOPSIS法進行專利評價,從而識別出核心專利。
本文具體研究框架如圖1所示。首先,基于太赫茲領(lǐng)域?qū)@麛?shù)據(jù),進行相關(guān)專利數(shù)據(jù)項的提取,并根據(jù)K-means算法進行產(chǎn)業(yè)領(lǐng)域細分。其次,從專利的技術(shù)特征(技術(shù)寬度、科學(xué)關(guān)聯(lián)度、被引頻次)、經(jīng)濟特征(同族專利數(shù)、權(quán)利要求數(shù))、法律特征(專利狀態(tài))6個指標,構(gòu)建核心專利識別指標體系。最后,基于熵權(quán)TOPSIS法識別方法,對識別出的前沿專利技術(shù)進行分析。
圖1 研究框架
本文采用K-Means算法對產(chǎn)業(yè)領(lǐng)域?qū)@奈谋緝?nèi)容(標題和摘要)進行聚類分析,通過人工識別和命名聚類結(jié)果實現(xiàn)對產(chǎn)業(yè)領(lǐng)域的細分。
K-Means算法是一種基于質(zhì)心的聚類模型。K-Means算法將具有N個樣本的數(shù)據(jù)集X劃分成K個不相交的分離聚類Ck,每個聚類均可以被聚類的質(zhì)心μk描述,從而最小化慣量或聚類內(nèi)平方和。
專利本身蘊含技術(shù)、經(jīng)濟和法律3種特征[16]。專利是發(fā)明創(chuàng)造中技術(shù)信息的有效載體,專利的IPC分類號、引證和被引證等內(nèi)容反映了其技術(shù)特征。專利的經(jīng)濟特征主要通過專利家族數(shù)量和權(quán)利要求數(shù)量體現(xiàn)技術(shù)的市場占有能力。專利的法律特征可以由專利狀態(tài)體現(xiàn),授權(quán)后的專利可能會因為種種原因失效,從而不再受到法律保護。本文基于專利特征構(gòu)建核心專利識別指標體系,如表1所示。
表1 核心專利識別指標體系
熵權(quán)TOPSIS法是對傳統(tǒng)TOPSIS法的改進,該方法同時結(jié)合熵權(quán)法的客觀賦權(quán)與TOPSIS法的多屬性決策排序的優(yōu)勢,幫助決策者進行科學(xué)評價。熵權(quán)TOPSIS法的計算步驟如下:
(1)構(gòu)建判斷矩陣。設(shè)有p個評價指標;q個待評價對象;Xij是第i個評價指標下第j個待評價對象的值。
(1)
(2)指標歸一化處理。本文選取的核心專利識別指標都是正向指標(越大越好),所以進行以下處理來解決指標的量綱及其單位不統(tǒng)一問題。
(2)
歸一化處理后的結(jié)果:
(3)
(3)第i項評價指標中第j個待評價對象所占比重(Pij)。
(4)
(4)第i項評價指標的熵值(ei)。
j=1,2,…,q)
(5)
(5)基于熵權(quán)法確定指標權(quán)重(wi)。
(6)
(6)構(gòu)建評價矩陣(V)。
(7)
(7)根據(jù)指標最值確定正負理想解。
(8)
(9)
(8)計算待評價對象到正、負理想解的歐氏距離。
(10)
(11)
(9)計算待評價對象與理想解的相對接近度(Cj)。Cj的值越大,則待評價對象越優(yōu)。
(12)
(10)核心專利的劃分。根據(jù)步驟(9)的排序結(jié)果,選取排名靠前的專利為核心專利,具體數(shù)量根據(jù)實際需求而定。
太赫茲(Terahertz,THz)科學(xué)作為一門跨學(xué)科的新興交叉學(xué)科,銜接了經(jīng)典宏觀電磁波理論與微觀量子理論。太赫茲由于其比微波高1~4個數(shù)量的帶寬特性和比光波高的能量轉(zhuǎn)換效率,在超高速率空間通信、醫(yī)學(xué)成像、物質(zhì)太赫茲光譜特征分析、材料檢測等領(lǐng)域具有重要的研究價值和廣泛的應(yīng)用前景。
本文制定德溫特專利數(shù)據(jù)庫的太赫茲產(chǎn)業(yè)領(lǐng)域?qū)@麢z索式:TID=(“terahertz”) OR TIT=(“terahertz”) OR ABD=(“terahertz”),檢索了1984—2021年全球范圍內(nèi)太赫茲領(lǐng)域的專利,清洗去重后得到太赫茲領(lǐng)域的專利記錄共8 856條。
本文通過Python編程實現(xiàn)K-Means算法對專利文本內(nèi)容(標題和摘要)的聚類分析,從而進行太赫茲產(chǎn)業(yè)領(lǐng)域的細分。采用手肘法獲取最佳聚類簇數(shù),從圖2可以看出:在K=5時,折線發(fā)生明顯的轉(zhuǎn)折;當K>5時,SSE變化幅度明顯放緩。拐點處的位置為K=5,即最佳聚類簇數(shù)為5。
圖2 手肘法折線圖
對聚類結(jié)果進行分析,通過人工識別命名得到5個太赫茲細分領(lǐng)域,如表2所示。
表2 太赫茲細分領(lǐng)域聚類結(jié)果
圖3為太赫茲不同細分領(lǐng)域下的專利申請數(shù)量,其中,太赫茲探測領(lǐng)域的專利申請數(shù)量最多,約占總申請量的39%;太赫茲器件領(lǐng)域的專利申請數(shù)量最少,只有707件。
圖3 太赫茲不同細分領(lǐng)域的專利申請數(shù)量
首先,利用熵權(quán)法確定太赫茲各細分領(lǐng)域核心專利識別指標的權(quán)重;其次,進行TOPSIS分析;最后對太赫茲細分領(lǐng)域評價排序前10的核心專利進行分析。
表3為對太赫茲細分領(lǐng)域核心專利識別指標權(quán)重進行計算后的結(jié)果,可以發(fā)現(xiàn),器件領(lǐng)域技術(shù)寬度的權(quán)重值最高,被引頻次和同族專利數(shù)的權(quán)重值較高,權(quán)利要求數(shù)的權(quán)重值最低。成像領(lǐng)域技術(shù)寬度、被引頻次和同族專利數(shù)的權(quán)重值較高,權(quán)利要求數(shù)的權(quán)重值最低。通信領(lǐng)域技術(shù)寬度的權(quán)重值最高,同族專利數(shù)和專利狀態(tài)的權(quán)重值較高,權(quán)利要求數(shù)的權(quán)重值最低。探測領(lǐng)域技術(shù)寬度和同族專利數(shù)的權(quán)重值最高,權(quán)利要求數(shù)的權(quán)重值最低。材料領(lǐng)域技術(shù)寬度、被引頻次和同族專利數(shù)的權(quán)重值最高,權(quán)利要求數(shù)的權(quán)重值最低。
表4為進行TOPSIS分析加權(quán)評價后排序前10的核心專利信息。其中,器件領(lǐng)域排名第一的核心專利是英國科技集團于1998年申請的專利WO1998053351A2,主要研究一種光學(xué)裝置及其制造方法,可用作例如波分復(fù)用器、單頻激光器或化學(xué)傳感器的組件。成像領(lǐng)域排名第一的核心專利是美國加州理工學(xué)院于2013年申請的專利US20140118529A1,主要研究一種傅里葉氣相色譜成像(FPI)設(shè)備,可用于半導(dǎo)體晶片檢查和醫(yī)學(xué)顯微成像。通信領(lǐng)域排名第一和第三的核心專利都由美國德州儀器公司于2015年申請,主要研究的是太赫茲通信系統(tǒng)中的組成部件。探測領(lǐng)域排名第一的核心專利是美國法如科技公司于2013年申請的專利US20140063489A1,主要研究一種用于光學(xué)掃描和測量環(huán)境的激光掃描儀。材料領(lǐng)域排名第一的核心專利是日本京都第一科學(xué)株式會社和日本山形大學(xué)于2015年共同申請的專利EP2960239A1,主要研究用于光源裝置和太赫茲生成裝置的噻唑鎓衍生物和非線性光學(xué)材料。
表4 太赫茲細分領(lǐng)域的核心專利信息(Top10)
本文首先從領(lǐng)域細分視角構(gòu)建基于熵權(quán)TOPSIS法的核心專利識別模型,識別出產(chǎn)業(yè)全領(lǐng)域和細分領(lǐng)域的核心專利;對全球太赫茲產(chǎn)業(yè)領(lǐng)域1984—2021年的專利數(shù)據(jù)進行實證研究,得出結(jié)論如下:
(1)基于K-Means算法的產(chǎn)業(yè)領(lǐng)域細分方法,能有效對產(chǎn)業(yè)領(lǐng)域內(nèi)專利進行技術(shù)的劃分。通過對專利文本(標題和摘要)的聚類分析將太赫茲產(chǎn)業(yè)領(lǐng)域細分為器件、成像、通信、探測、材料共5個細分領(lǐng)域,這切合目前太赫茲產(chǎn)業(yè)領(lǐng)域的范疇。
(2)構(gòu)建的包括技術(shù)特征(技術(shù)寬度、科學(xué)關(guān)聯(lián)度、被引頻次)、經(jīng)濟特征(同族專利數(shù)、權(quán)利要求數(shù))、法律特征(專利狀態(tài))6個指標的核心專利識別體系,能夠從專利本身價值以及產(chǎn)業(yè)賦予專利的價值兩個維度來確定專利的核心性。
(3)實證發(fā)現(xiàn)全球太赫茲產(chǎn)業(yè)領(lǐng)域核心專利的專利權(quán)人大多屬于太赫茲產(chǎn)業(yè)領(lǐng)域的龍頭企業(yè),涉及的主要細分領(lǐng)域基本涵蓋了太赫茲領(lǐng)域目前的熱點技術(shù),這也進一步驗證了本文提出的核心專利識別模型的有效性。
本文研究仍然存在以下局限性:(1)本文基于專利技術(shù)、經(jīng)濟和法律特征構(gòu)建核心專利指標識別體系,但無法定量確保每個指標都能準確表征核心專利。為了明確各指標對核心專利識別的效果,后續(xù)可以組織領(lǐng)域?qū)<覍W(xué)者識別一批核心專利作為范本,為相關(guān)核心專利識別指標的研究提供借鑒。(2)本文基于熵權(quán)TOPSIS法進行產(chǎn)業(yè)領(lǐng)域核心專利識別,將熵權(quán)法的客觀賦權(quán)與TOPSIS法的多屬性決策排序相結(jié)合對專利進行打分,主要采用的是客觀評價法,后續(xù)可以與專家的主觀評議結(jié)合起來,進一步提高識別結(jié)果的準確性。