嚴(yán) 俊,余軍合,徐 斌,吳 宇
(寧波大學(xué) 機(jī)械工程與力學(xué)學(xué)院,浙江 寧波 315211)
產(chǎn)業(yè)集群能夠帶來競爭優(yōu)勢,如何在激烈競爭的國內(nèi)和國際環(huán)境下保持競爭優(yōu)勢和可持續(xù)發(fā)展是目前很多產(chǎn)業(yè)集群面臨的問題。隨著《中國制造2025》國家戰(zhàn)略的出臺,創(chuàng)新是引領(lǐng)發(fā)展的第一動力,培育一批以技術(shù)優(yōu)勢為核心競爭力的產(chǎn)業(yè)集群成為制造強(qiáng)國的戰(zhàn)略方針之一。因而,集群核心競爭力的重要性越來越突出,尤其基于技術(shù)優(yōu)勢的核心競爭力成為產(chǎn)業(yè)集群長遠(yuǎn)發(fā)展的重要條件。
受限于經(jīng)濟(jì)狀況,大多數(shù)中小型集群成員因為硬件設(shè)備及研究能力不足,不能全面地投入整個產(chǎn)品的創(chuàng)新研發(fā),而是專注于產(chǎn)品某個零部件進(jìn)行優(yōu)化研究。為了打造以技術(shù)優(yōu)勢為核心競爭力的產(chǎn)業(yè)集群,尤其是以中小型集群成員為主的產(chǎn)業(yè)集群則需在技術(shù)創(chuàng)新研發(fā)中做到分工明確、資源合理利用、產(chǎn)業(yè)協(xié)同。做到以上幾點,就必須提高集群各主體對技術(shù)創(chuàng)新的認(rèn)識與理解,了解各主體的技術(shù)優(yōu)勢,從技術(shù)角度對產(chǎn)業(yè)集群各主體進(jìn)行劃分,從而引導(dǎo)產(chǎn)業(yè)集群轉(zhuǎn)型升級,提高可持續(xù)創(chuàng)新力。專利是創(chuàng)新成果的載體,通過專利技術(shù)的相似性建立集群內(nèi)部各主體之間的關(guān)聯(lián)性,從而對產(chǎn)業(yè)集群各主體進(jìn)行技術(shù)劃分具有可行性。
專利的相似關(guān)聯(lián)性是基于專利內(nèi)容的相似程度建立的,其主要的方法包括共引分析法、共類分析法和文本挖掘的方法。
專利共引分析法的核心思想表現(xiàn)為:專利在進(jìn)行創(chuàng)新設(shè)計時不可避免地會參考前人的專利設(shè)計,同樣未來的專利在進(jìn)行創(chuàng)新設(shè)計時也會參考現(xiàn)在的專利,這樣就形成專利引用網(wǎng)絡(luò),通過專利引用網(wǎng)絡(luò)就能建立專利之間的關(guān)聯(lián)關(guān)系。卞志昕(2011)[1]考慮了共鏈分析法與共引分析法的差異,將兩者相結(jié)合分別對專利公司與學(xué)術(shù)機(jī)構(gòu)進(jìn)行專利耦合分析,表明專利共引分析能夠反應(yīng)行業(yè)的專利分布情況。劉云等(2013)[2]將專利共引分析法應(yīng)用到電動汽車行業(yè)中,挖掘電動汽車核心專利之間的關(guān)聯(lián)關(guān)系,并研究了電動汽車核心技術(shù)的演化過程。宋超和劉海濱(2016)[3]在專利共引可視化方面引入拉力算法,并在生物質(zhì)能領(lǐng)域進(jìn)行了實證分析,能夠進(jìn)行專利技術(shù)的預(yù)見研究。共引分析法對于某個技術(shù)領(lǐng)域的專利關(guān)聯(lián)性分析較為合適,但是由于共引分析需要大量的專利文獻(xiàn),而產(chǎn)業(yè)集群的專利相對于整個行業(yè)的專利較少,很難將產(chǎn)業(yè)集群所有專利通過共引分析法建立關(guān)聯(lián)關(guān)系,所以其對于產(chǎn)業(yè)集群的專利相似關(guān)聯(lián)性建立并不完全適用。
專利共類分析法強(qiáng)調(diào)同屬一類的專利具有相似關(guān)聯(lián)性。常見的專利分類有基于國際分類號(IPC)和德溫特分類。國際分類號(IPC)是從專利功能和應(yīng)用角度,采用部-分部-大類-小類-大組-小組等級的形式描述技術(shù)類別;德溫特分類則把專利按學(xué)科劃分為20 個大類,每個大類用字母表示,跟隨的兩位數(shù)字表示專利所屬學(xué)科領(lǐng)域。兩者都是通過對專利進(jìn)行編碼從而實現(xiàn)對專利進(jìn)行分類。基于分類號對專利進(jìn)行分析,相關(guān)研究也層出不窮。張憲義(2013)[4]通過對德溫特創(chuàng)新索引數(shù)據(jù)庫1991—2010年所有專利進(jìn)行共類專利耦合分析,能夠揭示出相關(guān)聯(lián)的技術(shù)、識別關(guān)鍵基礎(chǔ)技術(shù)以及技術(shù)演化過程。溫芳芳(2017)[5]基于德溫特分類號耦合的分析方法,對29 家樣本企業(yè)的技術(shù)相關(guān)性特征進(jìn)行分析,揭示企業(yè)之間潛在的競爭與合作關(guān)系。周磊和楊威(2016)[6]提出一種基于專利共類耦合矩陣建立知識網(wǎng)絡(luò)流的方法,挖掘了4G 技術(shù)知識網(wǎng)絡(luò)。共類分析利用專利的分類號來區(qū)分專利的內(nèi)容,在一定程度上很難區(qū)分相同分類號間專利內(nèi)容之間差異。由于產(chǎn)業(yè)集群生產(chǎn)的產(chǎn)品相似,專利的IPC 分類號集中,如果僅從IPC 分類號對產(chǎn)業(yè)集群進(jìn)行分析,很難識別產(chǎn)業(yè)集群各主體之間技術(shù)的差異性。
文本挖掘的方法為專利內(nèi)容的分析提供了新的方法。通過文本挖掘技術(shù)能夠挖掘?qū)@脑~語或者主題,利用詞語和主題來描述專利的內(nèi)容,對比詞語和主題的差異就能建立專利之間的相似關(guān)聯(lián)性。文本關(guān)鍵詞提取方法的研究不斷涌現(xiàn),Luhn(1957)[7]提出基于詞頻統(tǒng)計的方法篩選出關(guān)鍵詞。Salton 和Yang(1973)[8]提出通過詞頻和文檔概率相結(jié)合的方法(TF-IDF 算法)來篩選關(guān)鍵字。Blei 等(2003)[9]提出了基于主題模型關(guān)鍵詞抽取算法LDA,能夠建立“文檔-關(guān)鍵詞-主題”之間的概率關(guān)系。MIHALCEA R 和TARAU P(2004)[10]提出基于圖模型的TextRank 關(guān)鍵詞抽取算法。在專利主題挖掘方面,楊超等(2017)[11]等利用LDA主題模型對專利中的SAO 三元組結(jié)構(gòu)進(jìn)行主題挖掘,提高了主題的辨識度。許海云等(2016)[12]總結(jié)了目前專利文本技術(shù)主題識別中的關(guān)鍵技術(shù)不足之處,提出了專利文本技術(shù)主題識別關(guān)鍵技術(shù)的發(fā)展趨勢。姜春濤(2015)[13]提出利用圖結(jié)構(gòu)的表示法挖掘中文專利文本的語義信息,為專利智能分析提供語義支持。侯婷等(2015)[14]等利用文本挖掘技術(shù)抽取技術(shù)主題和規(guī)范化主題,為技術(shù)主題分析提供基礎(chǔ)工作。從現(xiàn)有研究來看,對于專利信息的抽取與標(biāo)注大多都是由關(guān)鍵詞和主題來完成且方法較為成熟。利用詞和主題來表達(dá)專利內(nèi)容具有可行性。一方面,同一產(chǎn)業(yè)集群內(nèi)集群成員的專利設(shè)計都是圍繞著優(yōu)化同類產(chǎn)品而展開的,集群成員間專利設(shè)計內(nèi)容上具有相似性,其相似性可以由同一主題表達(dá);另一方面,專利設(shè)計具有一定的創(chuàng)新性,集群成員間專利設(shè)計內(nèi)容上的差異性可以由不同主題來表達(dá)。
共引分析法和共類分析法都是依據(jù)專利自身指標(biāo)來構(gòu)建專利間的關(guān)聯(lián)關(guān)系,不需要對專利內(nèi)容信息進(jìn)行抽取。但是都需要對大量專利數(shù)據(jù)進(jìn)行分析,來構(gòu)建關(guān)聯(lián)性,不適用于產(chǎn)業(yè)集群專利的分析。本文將采用文本挖掘的方法抽取專利內(nèi)容信息,用不同主題來表達(dá)專利內(nèi)容上的不同。基于集群成員擁有的專利在主題分布的不同,計算集群成員間專利耦合強(qiáng)度,從而識別專利相似的集群成員。
在進(jìn)行專利主題耦合分析之前,需要建立“主題-專利文本-集群成員”的映射關(guān)系。LDA 作為一種文檔主題生成模型,其本質(zhì)為一個三層貝葉斯概率模型,包含詞、主題和文檔三層結(jié)構(gòu)。生成模型就是通過主題和文檔的對應(yīng)概率關(guān)系來確定文本的主題,同是由于專利文檔和主題并不是一一對應(yīng),一個專利可能有一個或多個主題。專利摘要是對專利內(nèi)容的概括,其能夠體現(xiàn)專利的主要內(nèi)容,可以從專利摘要中抽取專利主題。集群成員與專利文本的關(guān)系是確定的,可以通過LDA 從專利摘要中抽取主題,建立集群成員和主題的映射關(guān)系,其關(guān)系圖如圖1 所示。
圖1 產(chǎn)業(yè)集群成員A 與成員B 專利主題耦合關(guān)系示意圖
專利主題耦合分析是通過比較專利主題在專利中的共現(xiàn)關(guān)系來實現(xiàn)的,體現(xiàn)了不同專利之間的相似性。兩個專利間的主題耦合關(guān)系越明顯則表明其相似程度越強(qiáng)。產(chǎn)業(yè)集群中兩個成員的專利主題共現(xiàn)情況可以反映兩個集群成員的技術(shù)相似性。專利耦合一般通過專利共引關(guān)系來測算,對于主題共現(xiàn)關(guān)系的專利主題耦合強(qiáng)度還沒有??梢韵葘⒓撼蓡T專利集基于主題進(jìn)行向量化,借助于向量的距離來表示集群成員專利集技術(shù)耦合強(qiáng)度。
本文基于集群成員專利集在不同主題上的分布數(shù)量對集群成員專利進(jìn)行向量化,其向量表達(dá)式為Cj=(b1j,b2j,…,bkj,…,bnj),其中bkj表示集群成員j 所有專利中涉及專利主題k 的專利個數(shù),n為產(chǎn)業(yè)集群專利主題數(shù)目。若將圖1 中成員A 和成員B 的專利進(jìn)行量化,由于成員A 的專利在主題A、主題B、主題C……主題H 分布的數(shù)量分別為2、1、1、1、1、1、0、0,則成員A 專利向量CA=(2,1,1,1,1,1,0,0),成員B 專利向量CB=(0,0,0,1,1,1,1,1)。測算向量距離的方法有以下幾種:
(1)歐式距離是測算向量距離的經(jīng)典指標(biāo)之一,其物理含義就是講向量坐標(biāo)投射成多維空間的點,計算兩點之間的距離。若有兩個n 維變量C1(b11,b21,…,bk1,…,bn1)與C2(b12,b22,…,bk2,…,bn2),則歐式距離的定義如公式1 所示:
若C1、C2表示集群成員專利向量,則其歐式距離的含義表示集群成員的專利集在主題分布數(shù)量的差異,當(dāng)兩個集群成員專利集在主題分布一致時距離為0,其耦合強(qiáng)度最大;當(dāng)兩個集群成員專利集在主題分布數(shù)量差異越大則其歐式距離越大,專利耦合強(qiáng)度越小。根據(jù)公式1 可以計算出成員A 與成員B 專利耦合強(qiáng)度為2.828,歐式距離能夠很好地表示兩個集群成員專利集在主題分布數(shù)量的不同,但是其受制于專利集中專利數(shù)量大小的影響,并不能表示集群成員在主題投入的偏向。
(2)為了消除專利集自身大小的影響,更能體現(xiàn)出集群成員對于專利主題的偏向差異可以借助正弦距離來表示集群成員專利技術(shù)差異性。正弦距離是用兩個向量的夾角表示兩個向量的距離,若有兩個n 維變量C1(b11,b21,…,bk1,…,bn1)與C2(b12,b22,…,bk2,…,bn2),則正弦距離如公式2所示。
若C1、C2表示集群成員專利向量,則其正弦距離的含義表示集群成員的專利集在主題分布比例的差異,當(dāng)兩個集群成員專利集在主題分布比例一致時距離為0,耦合強(qiáng)度越大;當(dāng)兩個集群成員專利在主題分布比例差異越大,則其正弦距離越大,耦合強(qiáng)度越小。根據(jù)公式2 可以計算出成員A 與成員B 專利耦合強(qiáng)度為0.528,正弦距離能夠更好地表示兩個集群成員專利集在主題分布比例的不同,表示出集群成員在主題投入的偏向。
(3)為了體現(xiàn)出集群成員間的技術(shù)競爭關(guān)系,借助杰卡德距離表示集群成員專利技術(shù)差異性。杰卡德距離表示兩個集合A 和B 不相同元素占兩個集合總元素的百分比,杰卡德距離衡量的是集合A 與集合B 的區(qū)分度,其計算如公式3所示:
若C1、C2表示集群成員專利向量,則其杰卡德距離的含義表示集群成員的專利集在主題分布的區(qū)分度,當(dāng)兩個集群成員專利集在主題分布一致時距離為0,耦合強(qiáng)度越大;當(dāng)兩個集群成員專利集在主題分布差異越大,則其杰卡德距離越大,耦合強(qiáng)度越小。根據(jù)公式3 可以計算出成員A與成員B 專利耦合強(qiáng)度為0.667,杰卡德距離能夠表示兩個集群成員專利在主題分布的區(qū)分度,能展示出產(chǎn)業(yè)集群成員間技術(shù)競爭程度。
為了直觀地將專利耦合分析結(jié)果應(yīng)用于產(chǎn)業(yè)集群技術(shù)情報分析,需要將專利耦合分析、多維尺度分析和數(shù)據(jù)處理等方法相結(jié)合,構(gòu)建出可視化的集群成員專利耦合關(guān)系圖譜。產(chǎn)業(yè)集群成員間技術(shù)相似性可視化與應(yīng)用分析框架如圖2 所示。
圖2 技術(shù)相關(guān)性可視化與應(yīng)用分析流程框架
產(chǎn)業(yè)集群成員間技術(shù)相關(guān)性可視化分析與應(yīng)用流程包括五個階段:
1.數(shù)據(jù)準(zhǔn)備。建立合適的能反映產(chǎn)業(yè)集群專利概況的數(shù)據(jù)庫,按照一定檢索策略檢索出產(chǎn)業(yè)集群技術(shù)領(lǐng)域原始專利數(shù)據(jù);圍繞著目標(biāo)集,將數(shù)據(jù)進(jìn)行清洗、合并及轉(zhuǎn)換處理,構(gòu)建該產(chǎn)業(yè)集群專利權(quán)人數(shù)據(jù)備選集;按照專利權(quán)人的專利數(shù)量從備選集中選定該產(chǎn)業(yè)集群主要專利權(quán)人作為分析對象。
2.主題挖掘。將專利摘要文本進(jìn)行清洗,包括分詞、去停用詞、詞性標(biāo)注等。將清洗過后的專利摘要文本利用IF-IDF(term frequency-inverse document frequency)算法篩選出專利關(guān)鍵詞。將關(guān)鍵詞集利用LDA(Latent Dirichlet Allocation)文檔主題模型生成專利主題,并經(jīng)過多次調(diào)試最終確定主題個數(shù)形成產(chǎn)業(yè)集群專利主題。
3.主題耦合分析。根據(jù)專利“專利文本-關(guān)鍵詞-主題”映射關(guān)系將專利文本主題進(jìn)行標(biāo)注。根據(jù)產(chǎn)業(yè)集群成員(專利權(quán)人)的專利所涉及主題的情況建立集群成員專利向量,根據(jù)向量距離定義計算所有集群成員間的兩兩耦合強(qiáng)度指數(shù),建立產(chǎn)業(yè)集群技術(shù)相似矩陣。
4.可視化分析。集群成員聚類分析是根據(jù)集群成員間的技術(shù)相似程度將技術(shù)相近的企業(yè)劃分為同一類,多維尺度(MDS:multi-di-mensional scaling)分析方法能將高維度空間數(shù)據(jù)映射到二維空間并保持?jǐn)?shù)據(jù)之間的全局結(jié)構(gòu)[15],在符合相關(guān)擬和指標(biāo)前提下,將兩者結(jié)合可以把集群成員專利向量投射到二維平面,標(biāo)出相同聚類集群成員團(tuán)體,從而構(gòu)建產(chǎn)業(yè)集群成員專利耦合關(guān)系圖譜。
5.應(yīng)用分析。產(chǎn)業(yè)集群成員專利耦合圖譜直觀地反映了所分析的產(chǎn)業(yè)集群技術(shù)領(lǐng)域主要成員之間的技術(shù)相似性,從而可以作為產(chǎn)業(yè)集群技術(shù)分布格局、潛在競爭對手與備選合作伙伴的重要依據(jù),具體應(yīng)用思路將結(jié)合注塑機(jī)產(chǎn)業(yè)集群的實例分析說明。
1.數(shù)據(jù)源。本文基于中國專利檢索系統(tǒng)(http://www.pss-system.gov.cn)及潤桐專利數(shù)據(jù)庫(https://www.rainpat.com)檢索所需專利數(shù)據(jù)。
2.檢索策略。采用注塑機(jī)行業(yè)主要結(jié)構(gòu)名稱等18 個不同形式的關(guān)鍵詞用以檢索專利數(shù)據(jù),共計檢索出專利信息22 513 條。
3.數(shù)據(jù)清洗。將檢索到的注塑機(jī)行業(yè)專利按照地址篩選出浙江省和廣東省產(chǎn)業(yè)集群注塑機(jī)專利,分別為4 783 條和4 894 條。由于許多企業(yè)以子公司、分公司名稱申請專利,所以需要將其進(jìn)行合并??梢愿鶕?jù)地址、申請人名稱進(jìn)行相似度對比以及結(jié)合該產(chǎn)業(yè)集群成員信息為參考進(jìn)行合并。
4.分析對象確定。由于外觀專利其技術(shù)特征都是利用設(shè)計圖來展示,并沒有在摘要中描述,所以本文選取發(fā)明專利和實用新型專利作為分析數(shù)據(jù)。本文的目的是通過集群成員間的技術(shù)偏向不同識別潛在的競爭與合作對象,分析的應(yīng)該是產(chǎn)業(yè)集群主要成員的技術(shù)相似性。所以選取浙江省和廣東省注塑機(jī)集群專利量前50 名的成員作為分析對象,專利量分別占總體的70.12%和67.12%,可以確定所選取的分析對象為產(chǎn)業(yè)集群主要技術(shù)研發(fā)成員。
5.專利主題挖掘。將專利摘要文本利用NLPIRICTCLAS 漢語分詞系統(tǒng)進(jìn)行分、去停用詞、詞性標(biāo)注處理。利用TF-IDF 算法選取專利關(guān)鍵詞,利用LDA 主題模型對關(guān)鍵詞進(jìn)行聚類,經(jīng)過多次調(diào)試確定聚類個數(shù)為6 最為合適,最后形成專利主題-主題詞表,如表1 所示。
從表1 可以看出,第一類主要描述的是油路系統(tǒng)、第二類為電機(jī)控制系統(tǒng)、第三類為調(diào)模系統(tǒng)、第四類為注射系統(tǒng)、第五類為加料系統(tǒng)、第六類為注塑機(jī)外部結(jié)構(gòu)。
表1 注塑機(jī)產(chǎn)業(yè)集群專利主題詞分布(局部)
1.耦合強(qiáng)度矩陣構(gòu)建。通過主題詞分布表,根據(jù)專利摘要中關(guān)鍵詞與主題詞對應(yīng)關(guān)系將專利內(nèi)容利用主題進(jìn)行標(biāo)注。根據(jù)集群成員專利的主題分布數(shù)量建立成員專利向量。本文主要目的是研究集群成員技術(shù)的偏向性從而對產(chǎn)業(yè)集群進(jìn)行分析。所以將集群成員進(jìn)行兩兩配對,利用正弦距離計算集群成員間的專利耦合強(qiáng)度,最后建立耦合強(qiáng)度矩陣,如表2、表3 所示。其中浙江省注塑機(jī)成員用Z1、Z2、Z3,…,Z50表示,廣東省注塑機(jī)成員用G1、G2、G3,…,G50表示。
表2 浙江省注塑機(jī)產(chǎn)業(yè)集群成員專利耦合強(qiáng)度矩陣(局部)
表3 廣東省注塑機(jī)產(chǎn)業(yè)集群成員專利耦合強(qiáng)度矩陣(局部)
2.集群成員聚類。基于建立好的專利耦合強(qiáng)度矩陣可以構(gòu)建層次聚類圖,如圖3、圖4 所示。
分析圖3 可知,若按照橫軸20 刻度線對浙江注塑機(jī)產(chǎn)業(yè)集群成員進(jìn)行劃分可以將其分為三類,成員個數(shù)分別為35、9 和6。若按照橫軸15 刻度線對其進(jìn)行劃分,則可將其分為五類,成員個數(shù)分別為20、15、9、4 和2。
在圖4 中若按照橫軸20 刻度線對廣東注塑機(jī)產(chǎn)業(yè)集群成員進(jìn)行劃分可以將其分為兩類,成員個數(shù)分別為41、9。若按照橫軸15 刻度線對其進(jìn)行劃分,則可將其分為三類,成員個數(shù)分別為41、5 和4。
圖3 浙江注塑機(jī)集群成員 層次聚類
圖4 廣東注塑機(jī)集群成員 層次聚類
3.集群成員專利耦合關(guān)系圖譜構(gòu)建。將表2、表3 中的產(chǎn)業(yè)集群專利耦合強(qiáng)度矩陣導(dǎo)入SPSS中,將其轉(zhuǎn)化為皮爾森相關(guān)系數(shù)。以相關(guān)系數(shù)數(shù)據(jù)為基礎(chǔ)展開多維尺度分析(本次分析Stress 值分別為0.072 13 和0.082 13,表明分析結(jié)果較好、符合要求),輸出了浙江注塑機(jī)產(chǎn)業(yè)集群和廣東注塑機(jī)產(chǎn)業(yè)集群主要成員的專利耦合關(guān)系圖譜,如圖5、圖6 所示。按照上述層次聚類圖橫軸刻度15 所劃分的類別對圖譜進(jìn)行標(biāo)注,將浙江和廣東集群分別劃分為5 個和3 個組群。產(chǎn)業(yè)集群專利耦合關(guān)系圖譜可視化地展現(xiàn)了產(chǎn)業(yè)集群主要成員間的專利耦合關(guān)系。圖譜中每個點代表一個集群成員,兩者之間的距離代表兩個集群成員間的耦合關(guān)系強(qiáng)度。
在圖3 和圖5 中展示出浙江注塑機(jī)產(chǎn)業(yè)集群主要成員的耦合關(guān)系可以分為5 個類別,從類別內(nèi)部看,位置越靠近的集群成員之間耦合強(qiáng)度越高,表明它們之間的技術(shù)相似性越強(qiáng)。
圖5 浙江注塑機(jī)產(chǎn)業(yè)集群主要成員專利耦合關(guān)系圖譜
圖6 廣東注塑機(jī)產(chǎn)業(yè)集群主要成員專利耦合關(guān)系圖譜
產(chǎn)業(yè)集群專利耦合關(guān)系圖譜可以明確該產(chǎn)業(yè)集群的技術(shù)分布情況。浙江注塑機(jī)產(chǎn)業(yè)集群類別Ⅰ包括20 個集群成員,其范圍較大、點比較分散,在該區(qū)域的集群成員技術(shù)優(yōu)勢涵蓋較廣,包括油路系統(tǒng)、調(diào)模系統(tǒng)和注射系統(tǒng)。類別Ⅱ包括15 個集群成員,其范圍也比較大,且位置處于圖譜中心,其技術(shù)較為均衡。類別Ⅲ包括9 個集群成員,其范圍相對于類別Ⅰ和類別Ⅱ較小,在該區(qū)域的集群成員技術(shù)優(yōu)勢在于電機(jī)控制系統(tǒng)。類別Ⅳ包括4 個集群成員,其范圍較小,在該區(qū)域的集群成員優(yōu)勢在于加料系統(tǒng)。類別V 僅含有2個集群成員,其技術(shù)優(yōu)勢在于注塑機(jī)外部結(jié)構(gòu)。
產(chǎn)業(yè)集群專利耦合關(guān)系圖譜可以識別集群成員間的技術(shù)競爭與合作對象。在產(chǎn)業(yè)集群專利耦合圖譜中,處于同一類別的集群成員具有一定程度的技術(shù)相似性,都可能是潛在的競爭對手。在圖譜中的位置越近,說明兩個集群成員技術(shù)相似度越高,存在的潛在競爭越直接。對于技術(shù)合作對象的選擇,包括兩個方面。一方面是為了聚集研發(fā)能力解決共同面臨的技術(shù)難題,可以選擇同類別且距離較近的集群成員進(jìn)行合作;另一方面是為了解決產(chǎn)業(yè)技術(shù)鏈不同環(huán)節(jié)之間的有效融合問題,例如類別Ⅲ和類別Ⅳ中的企業(yè),分別為電機(jī)控制和加料系統(tǒng)。電機(jī)控制主要研究的是電機(jī)控制的精確度等問題,而加料系統(tǒng)則研究的是注塑機(jī)加料的零部件和機(jī)械結(jié)構(gòu),兩者都是服務(wù)于“加料”這一生產(chǎn)過程。所以這兩個類別的企業(yè)可以選擇跨類別合作,有利于技術(shù)的集成。
圖4 和圖6 展示出廣東注塑機(jī)產(chǎn)業(yè)集群可以分為3 類。類別Ⅰ包括41 個集群成員,其范圍較大、點比較分散,在該區(qū)域的集群成員技術(shù)優(yōu)勢涵蓋較廣,包括油路系統(tǒng)、調(diào)模系統(tǒng)和注射系統(tǒng)。類別Ⅱ包括5 個集群成員,其范圍較小,位于該區(qū)域的集群成員技術(shù)優(yōu)勢在于電機(jī)控制系統(tǒng),類別Ⅲ包括4 個集群成員,但是其范圍比類別Ⅱ略大,在該區(qū)域的集群成員技術(shù)優(yōu)勢在于加料和注塑機(jī)外部結(jié)構(gòu)。
對比圖5 和圖6 可以看出,浙江省和廣東省注塑機(jī)產(chǎn)業(yè)集群具有一些共性和特性。其共性在于,位于范圍較大的類別的集群成員技術(shù)優(yōu)勢都是注射系統(tǒng)、油路系統(tǒng)和調(diào)模系統(tǒng)。注塑機(jī)的主要作用就是注塑成型,而注射系統(tǒng)、油路系統(tǒng)和調(diào)模系統(tǒng)都直接關(guān)系到注塑效果的好壞,所以該領(lǐng)域的專利都集中在這三部分。浙江省注塑機(jī)產(chǎn)業(yè)集群成員類別比廣東省注塑機(jī)成員類別要多,其成員技術(shù)分布也比廣東省較為分散。這是因為浙江省注塑機(jī)產(chǎn)業(yè)集群更為成熟,其中浙江省有海天、海太、雙馬等全國聞名的注塑機(jī)企業(yè)。
1.與共引耦合分析的對比。共引耦合分析是通過專利共引來計算專利權(quán)人之間的技術(shù)相似性的。但是對于產(chǎn)業(yè)集群的專利耦合分析并不合適。其一是因為專利引用并不好獲取,有些專利的引文需要單獨進(jìn)行抽??;其二是因為專利共引需要建立專利的引用網(wǎng)絡(luò),產(chǎn)業(yè)集群的專利有限,集群成員間很難利用專利共引建立耦合關(guān)系。而對于整個行業(yè)的分析,行業(yè)內(nèi)的主要成員專利數(shù)量較大,可以通過專利共引建立耦合關(guān)系。
2.與共類耦合分析的對比。共類耦合分析是通過專利權(quán)人共有分類號的多少來計算專利權(quán)人之間的技術(shù)相似性的。其對于產(chǎn)業(yè)集群耦合分析也不適合。由于整個行業(yè)的技術(shù)差異性較大,其專利分類號差異性也較大,所以適合利用分類號對整個行業(yè)進(jìn)行耦合分析。但是產(chǎn)業(yè)集群是對于某個地區(qū)產(chǎn)業(yè)的分析,其技術(shù)相似性較高,所以其IPC 分類號較集中,如果基于IPC 分類號對產(chǎn)業(yè)集群進(jìn)行專利耦合分析會造成難以識別集群成員技術(shù)差異性。本文對于這一點進(jìn)行了對比分析,以浙江省注塑機(jī)產(chǎn)業(yè)集群為例,利用IPC 分類號作出產(chǎn)業(yè)集群耦合關(guān)系圖譜,如圖7 所示。
圖7 基于IPC 分類號的產(chǎn)業(yè)集群專利耦合關(guān)系圖譜
由圖7 可以看出基于IPC 分類號并不適合產(chǎn)業(yè)集群,圖中大部分的點都集中到一個很小的區(qū)域,并不能從圖中看出各集群成員間技術(shù)的差異性。其原因是浙江省注塑機(jī)產(chǎn)業(yè)集群IPC 分類號都集中在B29C45,其數(shù)量占專利總數(shù)量的78.21%。B29C45 則表示專利內(nèi)容為注塑成型,對于注塑產(chǎn)業(yè)集群分析而言,粒度過大,不能展示出技術(shù)發(fā)展的細(xì)節(jié)特征。
集群成員間的技術(shù)相關(guān)性分析是對產(chǎn)業(yè)集群技術(shù)分布、集群成員競爭對手識別與合作對象選擇的重要依據(jù)。本文對目前專利分析方法進(jìn)行了分析,說明了基于專利耦合分析能夠更為準(zhǔn)確地體現(xiàn)集群成員間的技術(shù)相似程度。對比了共類耦合分析、共引耦合分析和主題耦合分析的適用對象,可以看出共類耦合分析、共引耦合分析更加適用于整個行業(yè)的分析,而對于產(chǎn)業(yè)集群的分析則需要利用主題耦合分析。本文將挖掘與專利耦合分析相結(jié)合,利用文本挖掘技術(shù)挖掘產(chǎn)業(yè)集群專利主題,基于專利主題對專利進(jìn)行向量化,利用向量距離計算公式計算集群成員間的專利耦合強(qiáng)度。利用多維尺度分析,展示了集群成員的技術(shù)相關(guān)性,并結(jié)合圖譜分析了浙江省注塑機(jī)產(chǎn)業(yè)集群技術(shù)分布,說明了集群成員競爭對手識別和合作對象的選擇方法。最后對比了浙江省和廣東省注塑機(jī)產(chǎn)業(yè)集群技術(shù)分布的不同,驗證了該方法的普遍性。
本研究僅選取了注塑機(jī)產(chǎn)業(yè)集群主要成員作為分析對象,在反映產(chǎn)業(yè)集群技術(shù)情況上具有局限性。此外,本文計算專利耦合強(qiáng)度利用的是向量之間正弦值進(jìn)行的,沒有對比正弦距離、歐氏距離和杰克德距離差異性,若是為了精確地對比集群成員的技術(shù)相似性,則需要多次對比驗證專利耦合強(qiáng)度計算公式的差異性。