高道斌 吳 紅 張 彪 崔 哲 李劍飛
(山東理工大學(xué)信息管理研究院 淄博 255049)
伴隨人工智能等新興技術(shù)領(lǐng)域的出現(xiàn),技術(shù)更迭周期顯著縮短,領(lǐng)域競(jìng)爭(zhēng)日益激烈,企業(yè)經(jīng)營(yíng)環(huán)境愈發(fā)復(fù)雜和難以預(yù)料。在日新月異的市場(chǎng)競(jìng)爭(zhēng)中,每個(gè)企業(yè)都不具備絕對(duì)優(yōu)勢(shì),都有著不同的競(jìng)爭(zhēng)對(duì)手和競(jìng)爭(zhēng)方式。企業(yè)要想在激烈的市場(chǎng)競(jìng)爭(zhēng)中占有一席之地,就必須對(duì)市場(chǎng)競(jìng)爭(zhēng)態(tài)勢(shì)進(jìn)行分析,辨別競(jìng)爭(zhēng)對(duì)手,采取差異性戰(zhàn)略,做到知己知彼,方可百戰(zhàn)不殆。否則即便領(lǐng)軍企業(yè),若不能準(zhǔn)確前瞻、研判局面,不有效關(guān)注、辨別競(jìng)爭(zhēng)對(duì)手并采取有力措施,也會(huì)被競(jìng)爭(zhēng)對(duì)手趕超甚至淘汰出局,如博客網(wǎng)—從引領(lǐng)Web2.0的先驅(qū)成為無(wú)人問(wèn)津的棄兒。競(jìng)爭(zhēng)對(duì)手有多種分類,馬天旗將競(jìng)爭(zhēng)對(duì)手依據(jù)所提供產(chǎn)品與服務(wù)的相似性依次劃分為核心、中間、外圍及潛在競(jìng)爭(zhēng)對(duì)手,并明確指出,針對(duì)不同類型的競(jìng)爭(zhēng)對(duì)手,目標(biāo)企業(yè)應(yīng)制定不同的競(jìng)爭(zhēng)策略以鞏固競(jìng)爭(zhēng)優(yōu)勢(shì),如進(jìn)攻、回避、聯(lián)合、兼并等[1]。因此,辨別競(jìng)爭(zhēng)對(duì)手并對(duì)其進(jìn)行精準(zhǔn)分類,就成為目標(biāo)企業(yè)制定差異化競(jìng)爭(zhēng)策略、在競(jìng)爭(zhēng)中立于不敗之地的現(xiàn)實(shí)所求。
企業(yè)間競(jìng)爭(zhēng)表面上表現(xiàn)為市場(chǎng)中所流通產(chǎn)品或服務(wù)的替代關(guān)系,內(nèi)在因素卻是技術(shù)競(jìng)爭(zhēng)[2]。為鞏固競(jìng)爭(zhēng)優(yōu)勢(shì),企業(yè)通常會(huì)將其視為命脈的核心技術(shù)進(jìn)行科學(xué)、縝密的專利保護(hù),所以專利文獻(xiàn)是展示企業(yè)核心技術(shù)最為清楚、完整的數(shù)據(jù)源。目前已有眾多學(xué)者以企業(yè)專利為數(shù)據(jù)源、以技術(shù)相似度為依據(jù),從IPC相似性、文本內(nèi)容相似性以及兩者結(jié)合角度對(duì)競(jìng)爭(zhēng)對(duì)手的分析、辨別進(jìn)行了深入研究。
Lee等以企業(yè)間專利IPC分類號(hào)的共現(xiàn)強(qiáng)度表示技術(shù)相似性,實(shí)現(xiàn)了對(duì)具有相似創(chuàng)新模式競(jìng)爭(zhēng)對(duì)手的辨別[3];劉高勇等通過(guò)IPC分類號(hào)對(duì)產(chǎn)業(yè)技術(shù)結(jié)構(gòu)進(jìn)行分析,并以IPC相似性度量專利關(guān)聯(lián)性與企業(yè)間技術(shù)相似性,實(shí)現(xiàn)了對(duì)產(chǎn)業(yè)內(nèi)競(jìng)爭(zhēng)格局的分析,為競(jìng)爭(zhēng)對(duì)手辨別提供參考[4];溫芳芳等以IPC分類號(hào)為媒介,構(gòu)建專利耦合網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)潛在競(jìng)爭(zhēng)對(duì)手/合作伙伴的有效識(shí)別[5];Mun等以IPC分類號(hào)表示專利技術(shù)層次,在對(duì)其進(jìn)行技術(shù)分解與層次聚類的基礎(chǔ)上,對(duì)太陽(yáng)能光伏技術(shù)領(lǐng)域的子領(lǐng)域進(jìn)行詳細(xì)劃分,實(shí)現(xiàn)企業(yè)競(jìng)爭(zhēng)對(duì)手辨別[6]。
考慮到專利文獻(xiàn)內(nèi)部特征所蘊(yùn)含技術(shù)信息的重要性,部分學(xué)者通過(guò)專利文本內(nèi)容反映技術(shù)相似性。Geum提出技術(shù)關(guān)聯(lián)值概念,其核心觀點(diǎn)為技術(shù)關(guān)聯(lián)值越大的企業(yè),成為競(jìng)爭(zhēng)對(duì)手的可能性越高,并通過(guò)企業(yè)專利文本相似性進(jìn)行了實(shí)證[7];Kim、Wang等通過(guò)對(duì)專利文本中SAO結(jié)構(gòu)的分析,為企業(yè)辨別技術(shù)競(jìng)爭(zhēng)趨勢(shì)提供了參考[8-9];張杰等通過(guò)計(jì)算獨(dú)立權(quán)利要求文本的SAO結(jié)構(gòu)相似度對(duì)企業(yè)間相似專利進(jìn)行識(shí)別,以此為企業(yè)競(jìng)爭(zhēng)對(duì)手辨別提供依據(jù)[10];史敏等基于語(yǔ)義將說(shuō)明書(shū)文本進(jìn)一步劃分為技術(shù)背景與解決方案,通過(guò)比對(duì)兩者間的相似性實(shí)現(xiàn)了競(jìng)爭(zhēng)對(duì)手的辨別[11]。
為提升競(jìng)爭(zhēng)對(duì)手辨別效果,少數(shù)研究結(jié)合IPC分類號(hào)與文本內(nèi)容對(duì)企業(yè)間技術(shù)相似度進(jìn)行測(cè)算。吳菲菲等綜合考慮競(jìng)爭(zhēng)對(duì)手技術(shù)應(yīng)用領(lǐng)域相似度與技術(shù)內(nèi)容相似度,實(shí)現(xiàn)了對(duì)OLED領(lǐng)域競(jìng)爭(zhēng)對(duì)手的辨別[2];向姝璇等基于改進(jìn)Jaccard 算法所得的IPC組合相似度及獨(dú)立權(quán)利要求文本相似度,對(duì)企業(yè)所擁有的專利文獻(xiàn)整體相似度進(jìn)行計(jì)算,實(shí)現(xiàn)了競(jìng)爭(zhēng)對(duì)手的辨別[12];Park等基于專利地圖對(duì)企業(yè)專利文本進(jìn)行挖掘,同時(shí)結(jié)合IPC等信息實(shí)現(xiàn)了對(duì)企業(yè)間技術(shù)相似性的度量,為企業(yè)辨別競(jìng)爭(zhēng)對(duì)手提供依據(jù)[13]。
綜上,以技術(shù)相似度為依據(jù)辨別競(jìng)爭(zhēng)對(duì)手已成為業(yè)界共識(shí),但還存在以下不足:僅通過(guò)IPC辨別會(huì)遺漏專利文獻(xiàn)中的技術(shù)信息,導(dǎo)致辨別粒度較粗;在融入文本內(nèi)容的研究中,基于權(quán)利要求書(shū)的對(duì)比視角較為單一,基于說(shuō)明書(shū)的對(duì)比忽略了說(shuō)明書(shū)中不同標(biāo)題內(nèi)容(技術(shù)領(lǐng)域、背景技術(shù)、發(fā)明內(nèi)容等)重要性的主次,降低了辨別結(jié)果的準(zhǔn)確性;另,企業(yè)間技術(shù)相似度對(duì)比除考慮技術(shù)內(nèi)容本身,專利質(zhì)量和市場(chǎng)領(lǐng)域也發(fā)揮了重要作用,但現(xiàn)有研究均未顧及,對(duì)比過(guò)于理想?;诖耍疚脑诩夹g(shù)相似度計(jì)算中融入了專利說(shuō)明書(shū)中標(biāo)題內(nèi)容權(quán)重、市場(chǎng)相似性和專利質(zhì)量情境,以期更為細(xì)膩、準(zhǔn)確的對(duì)競(jìng)爭(zhēng)對(duì)手進(jìn)行辨別和分類,為企業(yè)制定發(fā)展戰(zhàn)略提供決策支持。
從企業(yè)視角出發(fā),競(jìng)爭(zhēng)對(duì)手是指競(jìng)爭(zhēng)環(huán)境中具有相似產(chǎn)品或技術(shù)的經(jīng)營(yíng)者,技術(shù)相似度作為度量企業(yè)間技術(shù)相似性的量化方法,能夠有效辨別企業(yè)間的競(jìng)爭(zhēng)關(guān)系。在專利文獻(xiàn)中,說(shuō)明書(shū)包括技術(shù)領(lǐng)域、背景技術(shù)、發(fā)明內(nèi)容、有益效果等內(nèi)容,相比于權(quán)利要求書(shū)、說(shuō)明書(shū)摘要等,對(duì)技術(shù)內(nèi)容的描述更為清楚、完整。為更加細(xì)膩、準(zhǔn)確的辨別競(jìng)爭(zhēng)對(duì)手,本文對(duì)技術(shù)相似度辨別模型進(jìn)行了優(yōu)化:首先從說(shuō)明書(shū)中提取技術(shù)背景(背景技術(shù))、技術(shù)方案(發(fā)明內(nèi)容)、技術(shù)功效(有益效果)文本,采用AHP-熵權(quán)法[14]按照其對(duì)技術(shù)內(nèi)容描述的地位主次賦予不同權(quán)重,計(jì)算目標(biāo)-對(duì)手企業(yè)單件專利間的個(gè)體技術(shù)相似度;然后將各企業(yè)的專利依質(zhì)量進(jìn)行分類,分別依據(jù)目標(biāo)-對(duì)手企業(yè)相同類別專利集合間不同維度的技術(shù)相似度計(jì)算整體技術(shù)相似度;最后從整體技術(shù)相似度、專利平均質(zhì)量?jī)蓚€(gè)維度構(gòu)建戰(zhàn)略坐標(biāo),通過(guò)設(shè)置閾值將目標(biāo)企業(yè)競(jìng)爭(zhēng)對(duì)手進(jìn)行細(xì)粒度分類。
單件專利是計(jì)算企業(yè)間技術(shù)相似度的基本單位,每件專利的技術(shù)內(nèi)容由技術(shù)背景、技術(shù)方案、技術(shù)功效組成:技術(shù)背景闡述了與本發(fā)明具有關(guān)聯(lián)的現(xiàn)有技術(shù)及該技術(shù)領(lǐng)域尚未解決的技術(shù)問(wèn)題,以突出本發(fā)明的技術(shù)必要性;技術(shù)方案包含解決該技術(shù)問(wèn)題、實(shí)現(xiàn)技術(shù)目的的具體技術(shù),是本發(fā)明的實(shí)現(xiàn)途徑;另,技術(shù)方案還涵蓋了對(duì)本發(fā)明有益效果的闡述,表明了該發(fā)明的技術(shù)功效。技術(shù)背景、技術(shù)方案、技術(shù)功效在表達(dá)順序上前后相承,在語(yǔ)義上形成“技術(shù)研發(fā)必要性—技術(shù)研發(fā)內(nèi)容—技術(shù)有益效果”的表述閉環(huán)。在專利技術(shù)內(nèi)容的表達(dá)上,雖然兩件或多件發(fā)明的技術(shù)背景與技術(shù)功效可以高度重合甚至完全一致,但專利法對(duì)創(chuàng)造性與新穎性的要求,使得每項(xiàng)發(fā)明的技術(shù)方案必須具有唯一性,所以技術(shù)方案對(duì)展示技術(shù)內(nèi)容的重要性要大于技術(shù)背景與技術(shù)功效,在計(jì)算個(gè)體技術(shù)相似度時(shí)應(yīng)設(shè)置不同權(quán)重?;诖?,個(gè)體技術(shù)相似度計(jì)算模型如圖1所示。
圖1 個(gè)體技術(shù)相似度計(jì)算模型
圖中,專利A與專利B分別表示目標(biāo)企業(yè)與對(duì)手企業(yè)的單件專利,sim1-3分別表示技術(shù)背景、技術(shù)方案、技術(shù)功效文本兩兩之間的余弦相似度。本文通過(guò)AHP-熵權(quán)法對(duì)個(gè)體技術(shù)相似度、整體技術(shù)相似度、專利質(zhì)量評(píng)價(jià)指標(biāo)體系中各指標(biāo)(構(gòu)成部分)進(jìn)行組合賦權(quán),這樣既可以取兩者之長(zhǎng),又可以克服AHP法主觀隨意性強(qiáng)和熵權(quán)法僅憑數(shù)據(jù)判斷具有機(jī)械性的缺點(diǎn),使賦權(quán)結(jié)果更加符合實(shí)際。組合賦權(quán)方式具體為:
ωi=αωi1+βωi2(α+β=1)
(1)
ɑ、β為AHP法、熵權(quán)法占組合權(quán)重的比重。本研究認(rèn)為主觀經(jīng)驗(yàn)判斷與客觀數(shù)據(jù)分析對(duì)評(píng)價(jià)對(duì)象權(quán)重賦予同樣重要,所以將兩者比重均設(shè)置為0.5。ωi1、ωi2表示AHP法、熵權(quán)法所得權(quán)重,其中,AHP法權(quán)重賦予步驟為:首先確定指標(biāo)集合,構(gòu)建重要性毗鄰判斷矩陣,之后通過(guò)公式(2)對(duì)各指標(biāo)進(jìn)行歸一化,然后通過(guò)公式(3)獲得指標(biāo)權(quán)重:
(2)
(3)
熵權(quán)法權(quán)重賦予步驟為:首先構(gòu)建對(duì)象評(píng)價(jià)矩陣,對(duì)指標(biāo)數(shù)值通過(guò)min-max法進(jìn)行標(biāo)準(zhǔn)化,之后通過(guò)信息熵公式得到如公式(4)所示指標(biāo)熵值,最后基于熵值通過(guò)公式(5)得到指標(biāo)熵權(quán):
(4)
(5)
結(jié)合文本余弦相似度與組合權(quán)重最終得到個(gè)體技術(shù)相似度:
V1=ω1sim1(TBA,TBB)+ω2sim2(TSA,TSB)+ω3sim3(TEA,TEB)
(6)
ω1、ω2、ω3分別表示技術(shù)背景相似度、技術(shù)方案相似度與技術(shù)功效相似度在個(gè)體技術(shù)相似度中的組合權(quán)重。
個(gè)體技術(shù)相似度雖能表示目標(biāo)-對(duì)手企業(yè)單件專利間技術(shù)內(nèi)容的相似性,卻難以反映企業(yè)間整體的技術(shù)相似性及映射競(jìng)爭(zhēng)關(guān)系,另,在企業(yè)間整體技術(shù)相似性的比較中,技術(shù)領(lǐng)域、技術(shù)市場(chǎng)和專利質(zhì)量都發(fā)揮了不同的作用?;诖?,本文提出了整體技術(shù)相似度計(jì)算模型,該模型將企業(yè)所有專利視作一個(gè)集合,計(jì)算目標(biāo)-對(duì)手企業(yè)整體技術(shù)相似性。具體為:將專利集合分為核心、重點(diǎn)、一般三類,整體技術(shù)相似度為目標(biāo)-對(duì)手企業(yè)三類專利集合技術(shù)相似度的加權(quán)總和,每類專利集合的技術(shù)相似度又由技術(shù)內(nèi)容相似度、技術(shù)領(lǐng)域相似度、技術(shù)市場(chǎng)相似度的加權(quán)總和構(gòu)成,技術(shù)內(nèi)容相似度由目標(biāo)-對(duì)手企業(yè)相同類別專利集合中個(gè)體技術(shù)相似度總和的均值表示,由此將個(gè)體技術(shù)相似度融入到整體相似度的計(jì)算過(guò)程中。整體技術(shù)相似度計(jì)算模型如圖2所示。
圖2 整體技術(shù)相似度計(jì)算模型
眾多研究以專利質(zhì)量作為企業(yè)專利分類劃分的依據(jù),總體觀點(diǎn)為高質(zhì)量專利對(duì)企業(yè)保持競(jìng)爭(zhēng)優(yōu)勢(shì)、進(jìn)行專利布局產(chǎn)生更重要的作用[15-16]?;诖耍疚耐ㄟ^(guò)專利質(zhì)量對(duì)專利進(jìn)行類別劃分:依據(jù)“二八法則”,將排名前20%專利視為核心專利,將排名20%~50%專利視為重點(diǎn)專利,其余為一般專利。為確保三類專利在整體技術(shù)相似度中所占權(quán)重的普適性和反映在計(jì)算過(guò)程中的易理解性,研究采用專家9分制評(píng)分法(權(quán)重總值為9)賦予不同類別專利在計(jì)算整體技術(shù)相似度中的權(quán)重,具體如表1所示。
表1 專利劃分方式與含義
從表1可知,由于核心、重點(diǎn)、一般專利對(duì)企業(yè)間競(jìng)爭(zhēng)態(tài)勢(shì)影響情況依次遞減且競(jìng)爭(zhēng)強(qiáng)度依次降低,同時(shí)結(jié)合“高質(zhì)量專利對(duì)企業(yè)保持競(jìng)爭(zhēng)優(yōu)勢(shì)、進(jìn)行專利布局產(chǎn)生更重要作用”的觀點(diǎn),因此,將三者在整體技術(shù)相似度中的權(quán)重分別設(shè)置為5/9、3/9、1/9,由此鮮明反映三類專利在辨別企業(yè)間競(jìng)爭(zhēng)關(guān)系的不同重要性。經(jīng)過(guò)加權(quán)的整體技術(shù)相似度為:
V2=αSIM1+βSIM2+λSIM3
(7)
ɑ、β、λ分別為目標(biāo)-對(duì)手企業(yè)三類專利集合在整體技術(shù)相似度中的權(quán)重(與表1對(duì)應(yīng))。SIM1、SIM2、SIM3為目標(biāo)-對(duì)手企業(yè)三類專利集合的技術(shù)相似度:
V3=aTCS+bTMS+cTFS
(8)
a、b、c分別表示TCS、TMS、TFS在同類別專利集合技術(shù)相似度中的權(quán)重,其賦予方式與個(gè)體技術(shù)相似度相同。TCS為技術(shù)內(nèi)容相似度(Technical Content Similarity),具體計(jì)算方式為:
(9)
V1表示目標(biāo)-對(duì)手企業(yè)同類別專利集合中單件專利間的個(gè)體技術(shù)相似度,n表示目標(biāo)-對(duì)手企業(yè)相同專利集合中單件專利間構(gòu)成的專利對(duì)數(shù)量。
TMS為技術(shù)市場(chǎng)相似度(Technical Market Similarity)。占據(jù)市場(chǎng)是企業(yè)申請(qǐng)專利的目的之一,企業(yè)在獲得發(fā)明授權(quán)后,需要將其轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力以實(shí)現(xiàn)收益,因此對(duì)專利間市場(chǎng)競(jìng)爭(zhēng)關(guān)系的分析十分重要?!秶?guó)民經(jīng)濟(jì)行業(yè)分類號(hào)》規(guī)定了全社會(huì)經(jīng)濟(jì)活動(dòng)的分類及代碼,據(jù)此可對(duì)企業(yè)的經(jīng)濟(jì)活動(dòng)進(jìn)行分類。每件專利都與國(guó)民經(jīng)濟(jì)行業(yè)分類號(hào)(簡(jiǎn)稱行業(yè)分類號(hào))相關(guān)聯(lián),可以視作專利的經(jīng)濟(jì)活動(dòng)領(lǐng)域與市場(chǎng)取向?;诖?,本文使用基于Jaccard系數(shù)的行業(yè)分類號(hào)共現(xiàn)強(qiáng)度表示TMS:
(10)
(ICN)Am為目標(biāo)企業(yè)第m件專利國(guó)民經(jīng)濟(jì)行業(yè)分類號(hào),(ICN)Bk為對(duì)手企業(yè)第k件專利國(guó)民經(jīng)濟(jì)行業(yè)分類號(hào),h表示目標(biāo)-對(duì)手企業(yè)存在技術(shù)市場(chǎng)相似度的專利對(duì)數(shù),屬于h的專利對(duì)表示為:
coupleAm,Bk≠0∈(quantity_h)∪coupleAm,Bk=0?(quantity_h)
TFS為技術(shù)領(lǐng)域相似度(Technical Field Similarity)。每件專利包含若干IPC號(hào),由本技術(shù)領(lǐng)域?qū)彶閱T依據(jù)發(fā)明內(nèi)容劃分,代表專利應(yīng)用領(lǐng)域,兩件專利相同IPC號(hào)越多,表明應(yīng)用領(lǐng)域競(jìng)爭(zhēng)強(qiáng)度越大,分別擁有該專利的企業(yè)間競(jìng)爭(zhēng)關(guān)系越強(qiáng)烈。本文借鑒吳菲菲等[2]的研究,將技術(shù)領(lǐng)域相似度表示為:
(11)
(IPC)Am為目標(biāo)企業(yè)第m件專利IPC號(hào),(IPC)Bk為對(duì)手企業(yè)第k件專利IPC號(hào),l表示目標(biāo)-對(duì)手企業(yè)存在技術(shù)領(lǐng)域相似度的專利對(duì)數(shù),屬于l的專利對(duì)表示為:
coupleAm,Bk≠0∈(quantity_l)∪coupleAm,Bk=0?(quantity_l)
通過(guò)目標(biāo)-對(duì)手企業(yè)整體技術(shù)相似度計(jì)算,可識(shí)別出存在高度技術(shù)相似性的競(jìng)爭(zhēng)對(duì)手,但技術(shù)相似度只是表征競(jìng)爭(zhēng)關(guān)系的一個(gè)維度,需要更加立體的評(píng)判標(biāo)準(zhǔn)對(duì)競(jìng)爭(zhēng)對(duì)手進(jìn)行更加細(xì)化的辨別。專利質(zhì)量是企業(yè)技術(shù)競(jìng)爭(zhēng)強(qiáng)度的體現(xiàn),專利平均質(zhì)量高的企業(yè),代表著技術(shù)基礎(chǔ)、研發(fā)實(shí)力更加雄厚,在市場(chǎng)競(jìng)爭(zhēng)中更有可能取得競(jìng)爭(zhēng)優(yōu)勢(shì),對(duì)目標(biāo)企業(yè)產(chǎn)生威脅[15]?;诖耍ㄟ^(guò)整體技術(shù)相似度-專利平均質(zhì)量二維戰(zhàn)略坐標(biāo)將競(jìng)爭(zhēng)對(duì)手劃分為核心、潛在、外圍、候選四類,如圖3所示。
圖3 整體技術(shù)相似度-專利平均質(zhì)量戰(zhàn)略坐標(biāo)
在該戰(zhàn)略坐標(biāo)圖中,縱軸代表目標(biāo)-對(duì)手企業(yè)整體技術(shù)相似度,由公式(7)計(jì)算而得,該值越大表明兩企業(yè)技術(shù)越相似,競(jìng)爭(zhēng)關(guān)系越強(qiáng)烈;橫軸代表企業(yè)專利平均質(zhì)量,由下文中公式(13)計(jì)算而得,該值越大表示企業(yè)技術(shù)競(jìng)爭(zhēng)力越強(qiáng),對(duì)目標(biāo)企業(yè)產(chǎn)生更大威脅。關(guān)于專利質(zhì)量的評(píng)價(jià),本文借鑒劉云、馮仁濤等[17-18]的觀點(diǎn),從技術(shù)性(技術(shù)質(zhì)量)、法律性(法律質(zhì)量)、市場(chǎng)性(經(jīng)濟(jì)質(zhì)量)三方面進(jìn)行??紤]到指標(biāo)的權(quán)威性與易計(jì)算性,指標(biāo)選取以國(guó)家知識(shí)產(chǎn)權(quán)局《專利價(jià)值
表2 專利質(zhì)量評(píng)價(jià)指標(biāo)體系
分析指標(biāo)體系操作手冊(cè)》為基礎(chǔ),同時(shí)結(jié)合文獻(xiàn)調(diào)研與專家智慧,選取結(jié)果如表2所示。
為消除量綱影響,使用min-max法獲得單件專利各項(xiàng)指標(biāo)標(biāo)準(zhǔn)化數(shù)值xi,結(jié)合指標(biāo)組合權(quán)重wi后,單件專利質(zhì)量P_Q的評(píng)價(jià)方式為:
P_Q=w1x1+w2x2+w3x3+w4x4+w5x5+w6x6+w7x7+w8x8
(12)
各企業(yè)專利平均質(zhì)量A_P_Q評(píng)價(jià)方式為(m代表企業(yè)專利數(shù)量):
(13)
依據(jù)整體技術(shù)相似度-專利平均質(zhì)量二維戰(zhàn)略坐標(biāo),各類型競(jìng)爭(zhēng)對(duì)手辨別的方式與具體含義如表3所示。
表3 各類競(jìng)爭(zhēng)對(duì)手含義及辨別依據(jù)
人工智能是引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù),是國(guó)際競(jìng)爭(zhēng)的新焦點(diǎn)。我國(guó)為搶抓人工智能發(fā)展重大戰(zhàn)略機(jī)遇,于2017年制定了《新一代人工智能發(fā)展規(guī)劃》,提出了面向2030年我國(guó)新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點(diǎn)任務(wù)和保障措施?;诖?,研究以我國(guó)人工智能為行業(yè)領(lǐng)域、以領(lǐng)頭羊百度公司為目標(biāo)企業(yè),對(duì)其競(jìng)爭(zhēng)對(duì)手進(jìn)行辨別。
人工智能涉及領(lǐng)域非常廣泛,考慮到百度公司的業(yè)務(wù)范圍,本文更認(rèn)同《人工智能技術(shù)專利深度分析報(bào)告》(以下簡(jiǎn)稱報(bào)告,由我國(guó)專利保護(hù)協(xié)會(huì)聯(lián)合人工智能領(lǐng)域業(yè)內(nèi)技術(shù)專家和專利分析專家合作完成)對(duì)人工智能的解析:應(yīng)著重強(qiáng)調(diào)核心算法及相關(guān)的應(yīng)用場(chǎng)景,人工智能的核心問(wèn)題為建構(gòu)能夠跟人類相似甚至超越的推理、知識(shí)、規(guī)劃、學(xué)習(xí)、交流、感知、移動(dòng)和操作物體的能力等,尤其以軟件、算法相關(guān)的技術(shù)為代表。
專利數(shù)據(jù)以智慧芽數(shù)據(jù)庫(kù)為數(shù)據(jù)源,該數(shù)據(jù)庫(kù)具有更新及時(shí)、收錄全面、格式規(guī)范的特點(diǎn),能保證數(shù)據(jù)的權(quán)威性。檢索詞以《報(bào)告》劃定的人工智能領(lǐng)域分支為主,同時(shí)結(jié)合文獻(xiàn)調(diào)研與專家智慧,最終確定關(guān)鍵詞為:人工智能、機(jī)器學(xué)習(xí)、基礎(chǔ)算法、智能搜索、智能推薦、語(yǔ)音識(shí)別、自然語(yǔ)言處理、自動(dòng)駕駛、計(jì)算機(jī)視覺(jué)、圖像識(shí)別、深度學(xué)習(xí)、手勢(shì)控制、智能機(jī)器人、視頻識(shí)別。由于上述關(guān)鍵詞有相當(dāng)部分體現(xiàn)的是技術(shù)功能,說(shuō)明書(shū)摘要結(jié)構(gòu)為發(fā)明名稱+技術(shù)方案+技術(shù)功效,包含了最能體現(xiàn)技術(shù)功能的上述關(guān)鍵詞,所以檢索字段設(shè)定為發(fā)明名稱與摘要,這樣既克服了眾多IPC分類號(hào)帶來(lái)的不確定性,又確保了檢索結(jié)果的全面性和準(zhǔn)確性。專利類型設(shè)置為授權(quán)發(fā)明,法律狀態(tài)設(shè)置為有效,受理局設(shè)置為中國(guó),專利權(quán)人類型設(shè)置為公司,檢索日期為2021年6月20日,共獲取專利10 374件,專利權(quán)人4 573個(gè)。通過(guò)瀏覽專利權(quán)人,發(fā)現(xiàn)數(shù)量排名20以后的公司專利數(shù)據(jù)較少,比較零散,難以對(duì)百度構(gòu)成競(jìng)爭(zhēng)威脅,故選擇數(shù)量排名前20的企業(yè)(包含百度)為辨別對(duì)象,刪除重復(fù)與噪音數(shù)據(jù)后共獲得有效專利2 438件,進(jìn)一步剔除數(shù)據(jù)缺失專利后,剩余2 422件。
3.2.1指標(biāo)權(quán)重賦予
邀請(qǐng)5位高校領(lǐng)域教師、3位企業(yè)技術(shù)骨干組成評(píng)審小組,將專利質(zhì)量評(píng)價(jià)指標(biāo)作為目標(biāo)因素,構(gòu)建兩兩重要性比較矩陣,通過(guò)公式(2)-(3)獲得各指標(biāo)AHP法權(quán)重;對(duì)專利指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,通過(guò)公式(4)-(5)獲得熵權(quán)法權(quán)重;通過(guò)公式(1)獲得組合權(quán)重,如表4所示。
表4 專利質(zhì)量評(píng)價(jià)指標(biāo)權(quán)重賦予結(jié)果
3.2.2前20位公司專利平均質(zhì)量計(jì)算
首先通過(guò)公式(12)計(jì)算各企業(yè)的單件專利質(zhì)量;其次通過(guò)公式(13)計(jì)算各企業(yè)專利平均質(zhì)量,具體結(jié)果如表5所示。
表5 企業(yè)專利平均質(zhì)量(降序)
其中,微軟公司專利平均質(zhì)量最高,為0.1478,平安國(guó)際最低,為0.0385,究其原因:微軟作為互聯(lián)網(wǎng)行業(yè)巨頭擁有著豐富的技術(shù)積累,在人工智能領(lǐng)域技術(shù)研發(fā)中具有巨大優(yōu)勢(shì),且其產(chǎn)品面向國(guó)際市場(chǎng),因此更加注重專利質(zhì)量;平安國(guó)際成立年限較短,企業(yè)仍處于發(fā)展期,自身技術(shù)資源積累量較少,涉獵人工智能領(lǐng)域時(shí)間較短,因此其專利質(zhì)量較低。
3.3.1專利文本內(nèi)容提取
通過(guò)3.2部分得到單件專利質(zhì)量后,首先,依據(jù)表1專利類別劃分方式,將所有專利劃分為核心、重點(diǎn)、一般專利,由此得到每個(gè)企業(yè)上述三類專利集合;然后在人工閱讀說(shuō)明書(shū)的基礎(chǔ)上,基于線索句/詞與段落表述規(guī)律,利用python的re模塊編寫(xiě)正則表達(dá)式,通過(guò)內(nèi)置的findall函數(shù)提取說(shuō)明書(shū)中技術(shù)背景、技術(shù)方案與技術(shù)功效內(nèi)容,結(jié)合Excel菜單欄功能進(jìn)行輔助提取,步驟詳情見(jiàn)表6;最后以專利權(quán)人為單位,通過(guò)Excel表格進(jìn)行分列存儲(chǔ),并對(duì)其進(jìn)行編號(hào),每個(gè)企業(yè)分別有核心、重點(diǎn)、一般專利集合所對(duì)應(yīng)的上述數(shù)據(jù),如表7所示。
表6 單件專利技術(shù)背景、方案、功效提取步驟詳情
表7 技術(shù)背景、技術(shù)方案、技術(shù)功效文本提取結(jié)果(百度公司部分核心專利)
3.3.2專利文本內(nèi)容清洗
使用Excel“替換”功能將原始語(yǔ)料中標(biāo)點(diǎn)剔除。由于說(shuō)明書(shū)中有多個(gè)無(wú)意義詞匯,如“本發(fā)明”“提供”“實(shí)現(xiàn)”“實(shí)施例”等,會(huì)影響文本相似度計(jì)算結(jié)果的準(zhǔn)確性,因此,通過(guò)建立停用詞表將其剔除。另,由于人工智能領(lǐng)域?qū)@膶S忻~較多,通過(guò)建立專有名詞詞表以提升分詞效果,部分停用詞與專有名詞如表8所示。
表8 停用詞與人工智能領(lǐng)域?qū)S忻~(部分)
3.3.3百度-對(duì)手企業(yè)個(gè)體技術(shù)相似度計(jì)算
通過(guò)停用詞與自建人工智能領(lǐng)域?qū)S忻~表對(duì)語(yǔ)料進(jìn)行清洗后,使用Python中jieba庫(kù)進(jìn)行分詞,使用gensim庫(kù)中Word2vec模型對(duì)語(yǔ)料進(jìn)行訓(xùn)練,之后通過(guò)余弦相似度計(jì)算目標(biāo)-對(duì)手企業(yè)單件專利對(duì)經(jīng)向量表示后的技術(shù)背景、技術(shù)方案、技術(shù)功效文本相似度,將其作為公式(1)中三者熵權(quán)權(quán)重分析數(shù)據(jù)源;將技術(shù)背景、技術(shù)方案、技術(shù)功效作為AHP法目標(biāo)因素,通過(guò)公式(2)-(5)結(jié)合公式(1),確定三者在計(jì)算個(gè)體技術(shù)相似度中的權(quán)重分別為:0.2454、0.4351、0.3196,該結(jié)果與前文中所提出“技術(shù)方案重要性大于技術(shù)背景與技術(shù)功效”的觀點(diǎn)保持一致。在對(duì)百度與對(duì)手企業(yè)的單件專利進(jìn)行編碼后,通過(guò)公式(6)對(duì)個(gè)體技術(shù)相似度進(jìn)行計(jì)算并構(gòu)建相似度矩陣,如表9所示。
表9 百度-華為核心專利集合個(gè)體技術(shù)相似度矩陣(部分)
3.3.4百度-對(duì)手企業(yè)整體技術(shù)相似度計(jì)算
通過(guò)公式(9)-(11)分別計(jì)算百度-對(duì)手企業(yè)的技術(shù)內(nèi)容、技術(shù)市場(chǎng)、技術(shù)領(lǐng)域相似度,將其作為公式(1)中三者熵權(quán)權(quán)重分析數(shù)據(jù)源;將技術(shù)內(nèi)容、技術(shù)市場(chǎng)、技術(shù)領(lǐng)域作為AHP法目標(biāo)因素,通過(guò)公式(2)-(5)結(jié)合公式(1),確定三者在計(jì)算整體技術(shù)相似度中的權(quán)重分別為:0.3491、0.2858、0.3201。最后,通過(guò)公式(7)-(8)得到百度與所有對(duì)手企業(yè)的整體技術(shù)相似度,如表10所示。
表10 整體技術(shù)相似度計(jì)算結(jié)果—以百度為目標(biāo)企業(yè)(降序)
表10中,聯(lián)想、阿里巴巴的整體技術(shù)相似度顯著高于其他對(duì)手企業(yè),為0.6273、0.6029,說(shuō)明兩企業(yè)與百度的核心、重點(diǎn)專利技術(shù)相似性高,展露了與百度的直接競(jìng)爭(zhēng)關(guān)系。進(jìn)一步的,專利質(zhì)量整體較高的企業(yè)競(jìng)爭(zhēng)力更強(qiáng),作為競(jìng)爭(zhēng)對(duì)手對(duì)目標(biāo)企業(yè)威脅程度更高,因此需結(jié)合專利質(zhì)量分析競(jìng)爭(zhēng)對(duì)手的威脅程度,細(xì)化競(jìng)爭(zhēng)對(duì)手所處競(jìng)爭(zhēng)地位。
依據(jù)表3將所有對(duì)手企業(yè)劃分為核心、潛在、外圍、候選競(jìng)爭(zhēng)對(duì)手4類,各類型競(jìng)爭(zhēng)對(duì)手對(duì)目標(biāo)企業(yè)的競(jìng)爭(zhēng)威脅程度依次遞減,如圖4所示。
3.4.1核心競(jìng)爭(zhēng)對(duì)手
阿里巴巴、聯(lián)想、華為、微軟、通用、三星、訊飛、三菱、奇虎為核心競(jìng)爭(zhēng)對(duì)手。天眼查數(shù)據(jù)顯示,除訊飛、三菱外,其余企業(yè)均與百度經(jīng)營(yíng)范圍存在多處重合,包括計(jì)算機(jī)軟硬件、通信設(shè)備、電子產(chǎn)品、信息系統(tǒng)集成服務(wù)等,與百度存在直接競(jìng)爭(zhēng)關(guān)系。訊飛主營(yíng)范圍是以自然語(yǔ)言處理、機(jī)器學(xué)習(xí)為主的人工智能產(chǎn)品,技術(shù)關(guān)注度高,擁有多件核心專利;百度近幾年申請(qǐng)了多件自然語(yǔ)言處理、機(jī)器學(xué)習(xí)領(lǐng)域的核心專利,如公開(kāi)號(hào)為CN108062246B的“用于深度學(xué)習(xí)框架的資源調(diào)度方法和裝置”、公開(kāi)號(hào)為CN107241260B的“基于人工智能的新聞推送的方法和裝置”等,均與訊飛核心專利的技術(shù)領(lǐng)域與技術(shù)內(nèi)容保持高度相似;訊飛“AIUI開(kāi)放平臺(tái)”與百度“AI開(kāi)放平臺(tái)”的服務(wù)內(nèi)容與服務(wù)目標(biāo)高度一致,都是對(duì)人工智能服務(wù)的延伸,兩者在技術(shù)、產(chǎn)品、服務(wù)策略方面的高度相似展露了高強(qiáng)度競(jìng)爭(zhēng)關(guān)系。三菱近幾年注重對(duì)自動(dòng)駕駛領(lǐng)域的技術(shù)研發(fā),申請(qǐng)了多件核心專利,如公開(kāi)號(hào)為CN106200631B的“自動(dòng)駕駛控制裝置及自動(dòng)駕駛控制方法”、公開(kāi)號(hào)為CN108137059B的“駕駛輔助裝置”等,以及多件關(guān)于語(yǔ)音識(shí)別的核心專利,百度近幾年同樣開(kāi)始關(guān)注自動(dòng)駕駛領(lǐng)域,不僅申請(qǐng)了多件核心專利且推出了“阿波羅自動(dòng)駕駛平臺(tái)”,旨在向開(kāi)發(fā)者提供開(kāi)放、完整的自動(dòng)駕駛策略,上述產(chǎn)品與專利申請(qǐng)態(tài)勢(shì)展露了百度正在不斷拓寬自動(dòng)駕駛領(lǐng)域的技術(shù)市場(chǎng)與技術(shù)研發(fā)范圍,與三菱在市場(chǎng)主營(yíng)范圍、專利申請(qǐng)技術(shù)領(lǐng)域方面存在直接沖突。上述企業(yè)整體技術(shù)實(shí)力雄厚,專利質(zhì)量高,技術(shù)內(nèi)容與百度高度相似,與百度相比,處于競(jìng)爭(zhēng)優(yōu)勢(shì),因此為核心競(jìng)爭(zhēng)對(duì)手。
圖4 競(jìng)爭(zhēng)對(duì)手辨別結(jié)果—以百度為目標(biāo)企業(yè)
3.4.2潛在競(jìng)爭(zhēng)對(duì)手
本田、豐田、吉利、發(fā)那科、OPPO、國(guó)網(wǎng)為潛在競(jìng)爭(zhēng)對(duì)手。上述企業(yè)雖與百度在經(jīng)營(yíng)范圍方面未呈現(xiàn)直接沖突,整體技術(shù)相似性較低,但本田、豐田、吉利近幾年均在申請(qǐng)百度目前正在拓展的自動(dòng)駕駛領(lǐng)域相關(guān)專利,且整體專利質(zhì)量較高。國(guó)網(wǎng)、OPPO在圖像識(shí)別領(lǐng)域保持著專利申請(qǐng)質(zhì)量與數(shù)量的領(lǐng)先。發(fā)那科專注智能機(jī)器人領(lǐng)域并有多件機(jī)器學(xué)習(xí)、智能機(jī)器人領(lǐng)域的核心專利,技術(shù)基礎(chǔ)雄厚;百度近幾年不斷增加圖像識(shí)別、機(jī)器學(xué)習(xí)、智能機(jī)器人領(lǐng)域的專利申請(qǐng)量,且在提升產(chǎn)品市場(chǎng)轉(zhuǎn)化效率。上述企業(yè)擁有著高質(zhì)量專利,在未來(lái),若轉(zhuǎn)變專利市場(chǎng)布局取向,有可能成為百度核心競(jìng)爭(zhēng)對(duì)手。
3.4.3外圍競(jìng)爭(zhēng)對(duì)手
騰訊、平安國(guó)際為外圍競(jìng)爭(zhēng)對(duì)手。騰訊雖整體專利擁有量顯著高于其他企業(yè),且與百度經(jīng)營(yíng)范圍、專利技術(shù)領(lǐng)域保持高度相似,但核心專利占比與專利平均質(zhì)量均較低,整體專利競(jìng)爭(zhēng)實(shí)力較弱。平安國(guó)際為新興企業(yè),專注智慧城市、人工智能技術(shù)、信息技術(shù)的產(chǎn)品與服務(wù),并在上述領(lǐng)域不斷增加專利申請(qǐng)量,其專利技術(shù)領(lǐng)域、產(chǎn)品及服務(wù)與百度保持高度相似,但由于缺乏技術(shù)積累導(dǎo)致整體專利質(zhì)量較低,與百度相比處在競(jìng)爭(zhēng)劣勢(shì)地位。上述企業(yè)雖經(jīng)營(yíng)范圍、產(chǎn)品、服務(wù)、專利技術(shù)領(lǐng)域與百度高度相似,但由于整體專利質(zhì)量較低,與百度相比,處于競(jìng)爭(zhēng)劣勢(shì),因此為外圍競(jìng)爭(zhēng)對(duì)手。
3.4.4候選競(jìng)爭(zhēng)對(duì)手
格力、光年無(wú)限為候選競(jìng)爭(zhēng)對(duì)手。格力的主營(yíng)范圍為家電,包括冰箱、電視、熱水器等,近幾年開(kāi)始拓展智能機(jī)器人市場(chǎng),專利申請(qǐng)量不斷增加,但由于與主營(yíng)業(yè)務(wù)研發(fā)方向不匹配,導(dǎo)致研發(fā)投入較低,整體以智能機(jī)器人為主的人工智能領(lǐng)域?qū)@|(zhì)量較低且研發(fā)方向分散。光年無(wú)限雖與百度經(jīng)營(yíng)范圍保持多方相似,但技術(shù)研發(fā)重點(diǎn)為智能機(jī)器人,核心專利較少且整體上與百度在該技術(shù)領(lǐng)域的專利相似度較低。上述企業(yè)與百度的經(jīng)營(yíng)范圍或?qū)@夹g(shù)內(nèi)容相似度低,且人工智能領(lǐng)域?qū)@|(zhì)量低、研發(fā)方向分散,因此為候選競(jìng)爭(zhēng)對(duì)手。
辨別競(jìng)爭(zhēng)對(duì)手類型、知彼知己,是企業(yè)制定差異化競(jìng)爭(zhēng)策略的前提與鞏固自身競(jìng)爭(zhēng)優(yōu)勢(shì)的保障。本文針對(duì)現(xiàn)有研究存在的辨別粒度較粗、準(zhǔn)確性低的問(wèn)題,對(duì)技術(shù)相似度辨別模型進(jìn)行了優(yōu)化。首先,以專利說(shuō)明書(shū)為研究樣本,提取其中的技術(shù)背景、技術(shù)方案和技術(shù)功效,并按照其對(duì)技術(shù)內(nèi)容描述的地位主次分別賦予不同權(quán)重,細(xì)粒度計(jì)算目標(biāo)-對(duì)手企業(yè)單件專利間的個(gè)體技術(shù)相似度;其次,結(jié)合文獻(xiàn)調(diào)研與專家智慧,將各企業(yè)專利依質(zhì)量劃分為核心、重點(diǎn)、一般3個(gè)類別,并從技術(shù)內(nèi)容、技術(shù)市場(chǎng)(行業(yè)分類號(hào))、技術(shù)領(lǐng)域(IPC分類號(hào))3個(gè)維度,分別計(jì)算目標(biāo)-對(duì)手企業(yè)相同類別專利集合間的技術(shù)相似度,然后按照專利質(zhì)量對(duì)每類專利集合的技術(shù)相似度賦予權(quán)重,獲得每個(gè)競(jìng)爭(zhēng)對(duì)手的整體技術(shù)相似度;再次,依據(jù)整體技術(shù)相似度和專利平均質(zhì)量?jī)蓚€(gè)維度構(gòu)建戰(zhàn)略坐標(biāo),通過(guò)設(shè)置閾值將競(jìng)爭(zhēng)對(duì)手細(xì)粒度劃分為核心、潛在、外圍、候選4類;最后以人工智能領(lǐng)域?yàn)槔?,以中?guó)有效專利數(shù)量排名前20企業(yè)為研究對(duì)象,以百度為目標(biāo)企業(yè),對(duì)本方法進(jìn)行了實(shí)證,結(jié)合企業(yè)專利、產(chǎn)品、商業(yè)等多維信息驗(yàn)證了本方法的準(zhǔn)確性與有效性。
本文創(chuàng)新之處在于:在個(gè)體技術(shù)相似度和整體技術(shù)相似度計(jì)算中,融入說(shuō)明書(shū)中不同標(biāo)題內(nèi)容權(quán)重、市場(chǎng)相似性和專利質(zhì)量等情境,更加細(xì)膩、準(zhǔn)確的對(duì)競(jìng)爭(zhēng)對(duì)手進(jìn)行辨別和分類,為企業(yè)科學(xué)制定差異化競(jìng)爭(zhēng)策略提供有力的決策支持;不足之處在于:對(duì)專利質(zhì)量進(jìn)行評(píng)價(jià)時(shí)沒(méi)有考慮技術(shù)領(lǐng)域、市場(chǎng)大小等因素,辨別準(zhǔn)確性有待進(jìn)一步提高。