摘要: 為研究創(chuàng)新聯(lián)合體構(gòu)建過程中如何合理有效地挑選潛在合作伙伴,充分發(fā)揮創(chuàng)新聯(lián)合體在實(shí)現(xiàn)高水平科技自立自強(qiáng)中的戰(zhàn)略作用,構(gòu)建了基于專利異構(gòu)網(wǎng)絡(luò)和SimRank算法的創(chuàng)新主體技術(shù)背景相似度計(jì)算方法,借助可視化方法展現(xiàn)潛在合作關(guān)系網(wǎng)絡(luò),結(jié)合譜聚類算法劃分創(chuàng)新聯(lián)合體潛在合作伙伴。在高分子材料領(lǐng)域進(jìn)行實(shí)證分析,實(shí)證結(jié)果較好地展示了該領(lǐng)域創(chuàng)新主體的潛在合作關(guān)系和技術(shù)背景高度相似的創(chuàng)新主體聚類結(jié)果,證實(shí)了研究理論和方法的有效性,為創(chuàng)新聯(lián)合體伙伴選擇提供參考。
關(guān)鍵詞: 創(chuàng)新聯(lián)合體;專利信息;異構(gòu)網(wǎng)絡(luò);技術(shù)背景相似度;潛在合作伙伴
中圖分類號(hào):F273.7;N94文獻(xiàn)標(biāo)識(shí)碼: A
Research on the Selection of Potential Partners of Innovation Consortium
WU Jie, XIE Xiaodong, SHENG Yongxiang, GUI Liang
(School of Economics and Management, Jiangsu University of Science and Technology, Zhenjiang 212003, China)
Abstract:To explore how to reasonably and effectively select potential partners in the process of constructing innovation consortia, maximizing the strategic role of innovation consortia in achieving high-level scientific and technoligical self-reliance and strength, this paper introduces a method for computing the technical background similarity of innovative entities based on patent heterogeneity networks and the SimRank algorithm. By using visualization techniques, we display potential collaboration networks and leverage the spectral clustering algorithm to categorize potential partners for the innovation consortium. Through empirical analysis in the field of polymer materials, the results effectively showcase potential collaborative relationships and clusters of innovative entities with highly similar technical backgrounds in this field. This confirms the validity of our theoretical approach and methodology, offering guidance for the selection of partners in innovation consortiums.
Keywords: innovation consortium; patent information; heterogeneous network; similarity of technical background; potential partners
0 引言
隨著科技產(chǎn)業(yè)的加速變革和國(guó)際形勢(shì)的日趨復(fù)雜,龍頭企業(yè)憑借敏銳的市場(chǎng)嗅覺在很多影響行業(yè)發(fā)展的重大創(chuàng)新中起到突出作用,但對(duì)于新形勢(shì)下關(guān)鍵核心技術(shù)“卡脖子”問題的解決,其需要肩負(fù)更重要的責(zé)任[1]。習(xí)近平總書記在2021年兩院院士大會(huì)和全國(guó)科協(xié)代表大會(huì)上發(fā)表重要講話時(shí)指出,要“發(fā)揮企業(yè)出題者作用,推進(jìn)重點(diǎn)項(xiàng)目協(xié)同和研發(fā)活動(dòng)一體化,加快構(gòu)建龍頭企業(yè)牽頭、高校院所支撐、各創(chuàng)新主體相互協(xié)同的創(chuàng)新聯(lián)合體”[2]。創(chuàng)新聯(lián)合體是以龍頭企業(yè)為主體,整合大學(xué)、科研院所的研發(fā)力量進(jìn)行協(xié)作創(chuàng)新的新型組織形式,有利于以市場(chǎng)需求為主導(dǎo)進(jìn)行核心技術(shù)攻關(guān),有利于激發(fā)創(chuàng)新主體潛力推動(dòng)技術(shù)變革,有利于實(shí)現(xiàn)中國(guó)高水平科技自立自強(qiáng)[3]。
國(guó)內(nèi)關(guān)于創(chuàng)新聯(lián)合體的研究目前主要集中于創(chuàng)新聯(lián)合體的內(nèi)涵與意義[45]、運(yùn)行機(jī)制[67]、動(dòng)力機(jī)制[7]等,對(duì)于如何尋找潛在合作伙伴構(gòu)建創(chuàng)新聯(lián)合體的研究相對(duì)較少。尋找潛在合作伙伴是組建創(chuàng)新聯(lián)合體的起點(diǎn),是決定創(chuàng)新聯(lián)合體成敗的關(guān)鍵因素,選擇高效的合作伙伴對(duì)于創(chuàng)新聯(lián)合體的構(gòu)建可以起到事半功倍的效果。通過研究挖掘潛在合作伙伴組建創(chuàng)新聯(lián)合體,對(duì)提高創(chuàng)新效率、降低科研成本、制定戰(zhàn)略規(guī)劃等方面都有積極意義?,F(xiàn)有關(guān)于合作伙伴的研究大多基于傳統(tǒng)視角的匹配模型[89]或者技術(shù)相似性,采用共詞分析、共引分析和耦合分析等科學(xué)計(jì)量方法[1015],尚未從專利IPC分類號(hào)分布的網(wǎng)絡(luò)結(jié)構(gòu)特征中進(jìn)一步挖掘技術(shù)背景相似度信息,無法有效反映技術(shù)研究的方向,測(cè)度的準(zhǔn)確性也有待提高。
本文利用企業(yè)、高校和科研院所等創(chuàng)新主體現(xiàn)有專利與IPC分類號(hào)之間的內(nèi)在聯(lián)系,構(gòu)建創(chuàng)新主體IPC異構(gòu)性網(wǎng)絡(luò),選取SimRank算法計(jì)算創(chuàng)新主體之間的技術(shù)背景相似度。通過可視化方法展現(xiàn)創(chuàng)新主體之間的潛在合作關(guān)系網(wǎng)絡(luò),借助譜聚類算法將具有潛在合作關(guān)系的創(chuàng)新主體進(jìn)行聚類分析,探索能夠構(gòu)建創(chuàng)新聯(lián)合體的創(chuàng)新主體以及未來的合作趨勢(shì)。相較于現(xiàn)有文獻(xiàn)單一依靠相似度大小判定伙伴關(guān)系,本文基于SimRank算法從技術(shù)背景相似性的角度深入挖掘伙伴相似度信息,借助譜聚類算法劃分潛在合作伙伴,可以更準(zhǔn)確、更廣泛、更快速地尋找創(chuàng)新聯(lián)合體潛在合作伙伴,也可以更便捷地為企業(yè)尋找合作伙伴縮小查找范圍、節(jié)約發(fā)展成本、判定合作可能性。
1 相關(guān)研究
早期已有學(xué)者對(duì)產(chǎn)學(xué)研聯(lián)盟進(jìn)行過相關(guān)研究,但創(chuàng)新聯(lián)合體是在實(shí)踐中提出的新概念,其內(nèi)涵特征與早期的產(chǎn)學(xué)研聯(lián)盟有較大的差別。對(duì)于創(chuàng)新聯(lián)合體的概念,李亞兵等[16]認(rèn)為創(chuàng)新聯(lián)合體是在大企業(yè)牽頭組織下,中小企業(yè)、科研院所、高等院校等創(chuàng)新主體積極參與的致力于同一創(chuàng)新目標(biāo)的產(chǎn)學(xué)研融合的新型組織形式;白京羽等[7]認(rèn)為創(chuàng)新聯(lián)合體有別于傳統(tǒng)意義的產(chǎn)學(xué)研聯(lián)盟,區(qū)別在于創(chuàng)新聯(lián)合體具有實(shí)體組織或機(jī)構(gòu)且創(chuàng)新聯(lián)合體應(yīng)由行業(yè)內(nèi)的龍頭企業(yè)主動(dòng)整合創(chuàng)新資源進(jìn)行共同研發(fā),從而實(shí)現(xiàn)成果共享;劉戒驕等[17]認(rèn)為新形勢(shì)下關(guān)鍵核心技術(shù)“卡脖子”問題的解決不同于傳統(tǒng)意義的科研,需要具有號(hào)召力的科技創(chuàng)新主體牽頭組織、整合資源,以創(chuàng)新聯(lián)合體的形式進(jìn)行協(xié)同攻關(guān)。由此,本文認(rèn)為創(chuàng)新聯(lián)合體有以下特點(diǎn):1)創(chuàng)新聯(lián)合體有別于傳統(tǒng)松散的產(chǎn)學(xué)研聯(lián)盟,是責(zé)任歸屬明確、市場(chǎng)化驅(qū)動(dòng)、經(jīng)濟(jì)利益導(dǎo)向的緊密聯(lián)系的實(shí)體組織;2)創(chuàng)新聯(lián)合體是以龍頭企業(yè)為主導(dǎo),聯(lián)合高校、科研院所等創(chuàng)新主體協(xié)同攻關(guān)的新型組織形式。
現(xiàn)有文獻(xiàn)主要關(guān)注創(chuàng)新聯(lián)合體的內(nèi)涵與意義、組織模式、運(yùn)行機(jī)制、能力提升路徑等,但是對(duì)于創(chuàng)新聯(lián)合體潛在合作伙伴的尋找研究較少,因此本文聚焦于該方面的研究?jī)?nèi)容,試圖豐富該主題的研究框架。根據(jù)創(chuàng)新聯(lián)合體的特點(diǎn)可知,創(chuàng)新聯(lián)合體潛在合作伙伴的尋找打破了以往伙伴尋找的邊界,創(chuàng)新聯(lián)合體成員需要由不同主體構(gòu)成,且成員間聯(lián)系緊密,需要高度相似的技術(shù)背景等。
現(xiàn)有關(guān)于合作伙伴尋找的研究大致分為兩類,一類是構(gòu)建匹配模型對(duì)現(xiàn)有合作目標(biāo)進(jìn)行精準(zhǔn)匹配,如張?jiān)7€(wěn)[8]將灰靶決策與前景理論相結(jié)合,構(gòu)建以整體匹配效益最大化為目標(biāo)的雙邊匹配模型來尋找聯(lián)盟合作伙伴;丁榮貴[9]等在研究協(xié)同創(chuàng)新項(xiàng)目社會(huì)網(wǎng)絡(luò)參與方選擇決策時(shí)基于結(jié)構(gòu)熵權(quán)法和三角模糊評(píng)價(jià)法構(gòu)建匹配度測(cè)算模型。這一類合作伙伴選擇模型往往需要事先選定潛在的合作伙伴,且選取的合作伙伴范圍有限,合作主體也較為固定,一般局限于企業(yè)與高校之間的匹配合作。隨著機(jī)器學(xué)習(xí)算法的流行,另一類從技術(shù)相似度角度挖掘潛在合作伙伴的方法興起,如李冰[12]在研究企業(yè)潛在競(jìng)合對(duì)象時(shí)以二部圖理論為基礎(chǔ)構(gòu)建了基于專利引用關(guān)系的異構(gòu)網(wǎng)絡(luò),采用鏈路預(yù)測(cè)算法計(jì)算企業(yè)之間的鏈接可能性,進(jìn)而用表示學(xué)習(xí)的方法判別競(jìng)合關(guān)系;溫亮[15]在識(shí)別企業(yè)潛在技術(shù)合作伙伴時(shí),通過對(duì)企業(yè)技術(shù)愿景和知識(shí)庫(kù)分析構(gòu)建技術(shù)合作網(wǎng)絡(luò),再利用相似度分析判別網(wǎng)絡(luò)內(nèi)重要子領(lǐng)域企業(yè)的潛在技術(shù)合作伙伴。這一類方法拓寬了潛在合作伙伴的選擇范圍,不再局限于事先選定的合作對(duì)象,且合作伙伴的選擇標(biāo)準(zhǔn)也較為客觀,合作伙伴的判別效率大大提高。
以上兩類合作伙伴選擇的研究大多適用于傳統(tǒng)產(chǎn)學(xué)研聯(lián)盟中高校和企業(yè)之間合作伙伴的匹配選擇或者針對(duì)目標(biāo)企業(yè)的潛在競(jìng)合對(duì)象的判斷,但是創(chuàng)新聯(lián)合體是新時(shí)代下的新型組織形式,因此需要構(gòu)建一種符合其特點(diǎn)的合作伙伴選擇模型?;谝陨虾献骰锇榈难芯砍晒疚某浞挚紤]創(chuàng)新聯(lián)合體所需合作伙伴之間的技術(shù)緊密關(guān)聯(lián)性等特點(diǎn),利用異構(gòu)網(wǎng)絡(luò)結(jié)構(gòu)特征增強(qiáng)技術(shù)背景相似性計(jì)算效果的基礎(chǔ)上融入譜聚類算法進(jìn)行網(wǎng)絡(luò)聚類分析,相較于以往單一依據(jù)相似度絕對(duì)值大小判斷合作伙伴潛力的方法,本文在提高伙伴劃分準(zhǔn)確性的同時(shí)克服了目前伙伴劃分賦權(quán)困難、矩陣構(gòu)建質(zhì)量難以保證等問題,為創(chuàng)新聯(lián)合體潛在合作伙伴尋找提供科學(xué)依據(jù)。本文進(jìn)一步完善了以專利信息為依據(jù)對(duì)創(chuàng)新聯(lián)合體潛在合作伙伴挖掘的主題研究,更為企業(yè)發(fā)展中尋找潛在合作對(duì)象提供新的思路,縮小查找范圍,節(jié)約企業(yè)發(fā)展成本。
2 研究設(shè)計(jì)
本文利用各類創(chuàng)新主體現(xiàn)有專利的專利權(quán)人(即創(chuàng)新主體名稱)和IPC分類號(hào)信息構(gòu)建二部圖異構(gòu)網(wǎng)絡(luò),利用SimRank算法計(jì)算創(chuàng)新主體之間的技術(shù)背景相似度,進(jìn)而用可視化和譜聚類的方法深入挖掘可構(gòu)成創(chuàng)新聯(lián)合體的潛在合作伙伴。如圖1所示,創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)的兩類節(jié)點(diǎn)分別是專利權(quán)人和IPC分類號(hào),根據(jù)各創(chuàng)新主體專利IPC分類號(hào)的分布頻次為異構(gòu)網(wǎng)絡(luò)之間的連邊賦予權(quán)重,基于該異構(gòu)網(wǎng)絡(luò)的結(jié)構(gòu)特征采用SimRank算法計(jì)算創(chuàng)新主體之間的技術(shù)背景相似度,從而得到創(chuàng)新主體之間的技術(shù)背景相似度矩陣。利用可視化的方法對(duì)相似度矩陣初步分析,探索創(chuàng)新主體之間的潛在合作關(guān)系網(wǎng)絡(luò),進(jìn)而利用譜聚類的方法將具有潛在合作關(guān)系的創(chuàng)新主體進(jìn)行聚類,挖掘出該領(lǐng)域內(nèi)構(gòu)建創(chuàng)新聯(lián)合體的潛在合作伙伴與潛在合作關(guān)系。
2.1 基于二部圖的創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)構(gòu)建
二部圖是圖論中一種特殊的模型,其特點(diǎn)是由兩類異質(zhì)性節(jié)點(diǎn)構(gòu)成,且圖中僅有異質(zhì)性節(jié)點(diǎn)之間會(huì)產(chǎn)生連邊,同質(zhì)性節(jié)點(diǎn)之間沒有連邊。因此本文基于二部圖異構(gòu)網(wǎng)絡(luò)的理念,將創(chuàng)新主體看作用戶,IPC分類號(hào)看作商品,創(chuàng)新主體專利中涉及的IPC分類號(hào)看作用戶選擇的具體商品,涉及的頻次看作選擇的權(quán)重,以此構(gòu)建創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò),具體結(jié)構(gòu)如圖2所示[12]。
如圖2所示,該異構(gòu)性網(wǎng)絡(luò)以創(chuàng)新主體和IPC分類號(hào)為節(jié)點(diǎn),節(jié)點(diǎn)集合V=VA∪VB,其中VA為創(chuàng)新主體集合,VA=A1,A2,…,An,VB為IPC分類號(hào)集合,VB=B1,B2,…,Bm。若企業(yè)Ai專利中所含IPC分類號(hào)Bj的頻次為ω,則對(duì)應(yīng)邊的權(quán)重wAi,Bj=ω。
2.2 基于SimRank的創(chuàng)新主體技術(shù)背景相似度計(jì)算
在構(gòu)建創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)的基礎(chǔ)上,本文選用SimRank算法[1820]計(jì)算創(chuàng)新主體技術(shù)背景相似度。SimRank算法利用網(wǎng)絡(luò)的結(jié)構(gòu)特征計(jì)算創(chuàng)新主體之間的技術(shù)背景相似度,增強(qiáng)了相似度的計(jì)算效果,可以挖掘出存在相似技術(shù)背景的創(chuàng)新主體,為下一步尋找具有潛在合作關(guān)系的創(chuàng)新主體提供支撐。選用SimRank算法的原因有兩點(diǎn):1)SimRank算法的計(jì)算思想跟本文所構(gòu)建的創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)較為契合;2)SimRank算法的計(jì)算穩(wěn)定性較高,受網(wǎng)絡(luò)結(jié)構(gòu)變化造成的影響較小。
SimRank相似度計(jì)算的基本假設(shè)是:與相似實(shí)體相連的實(shí)體是相似的。該假設(shè)是對(duì)共引分析和耦合分析的結(jié)合,不再局限于指向同一實(shí)體或者被同一實(shí)體指向。SimRank相似度的計(jì)算是一個(gè)基于網(wǎng)絡(luò)結(jié)構(gòu)的遞歸運(yùn)算過程,初始認(rèn)定節(jié)點(diǎn)與自身的相似度最大為1,不同節(jié)點(diǎn)間相似度為0[21],具體見式(1)。
S0a,b=1,a=b0,a≠b(1)
創(chuàng)新主體之間的技術(shù)背景相似度計(jì)算見式(2)。
Sk+1Ai,Aj=COAiOAj∑OAis=1∑OAjt=1SkOsAi,OtAj,i≠j1,i=j(2)
其中,OAi為創(chuàng)新主體Ai的出鏈鄰居節(jié)點(diǎn)集合,即創(chuàng)新主體Ai專利中所包含的IPC分類號(hào)集合,OsAi為集合OAi的一個(gè)元素,即其中一個(gè)IPC分類號(hào)。
IPC分類號(hào)之間的相似度見公式(3)。
Sk+1Bi,Bj=CIBiIBj∑IBis=1∑IBjt=1SkIsBi,ItBj,i≠j1,i=j(3)
其中,IBi為IPC節(jié)點(diǎn)Bi的入鏈鄰居節(jié)點(diǎn)集合,即包含IPC分類號(hào)Bi的創(chuàng)新主體集合,IsBi為集合IBi的一個(gè)元素。式(2)和式(3)中常數(shù)C為相似度“擴(kuò)散”衰減系數(shù),一般取0.8[22]。
通過計(jì)算得到任意兩家創(chuàng)新主體之間的技術(shù)背景相似度,構(gòu)成對(duì)稱的相似度矩陣W。
W=SkA1,A1…SkA1,AnSkAn,A1…SkAn,An(4)
其中,SkAi,Aj為經(jīng)過k次迭代得到的創(chuàng)新主體Ai和創(chuàng)新主體Aj之間的技術(shù)背景相似度,該相似度絕對(duì)值越大,表明兩個(gè)創(chuàng)新主體之間的技術(shù)背景越相似,這兩個(gè)創(chuàng)新主體所側(cè)重的研發(fā)方向越相似,其合作的可能性也越大。
2.3 基于可視化和譜聚類的潛在合作伙伴挖掘
考慮到所構(gòu)建的創(chuàng)新主體技術(shù)背景相似度矩陣W數(shù)據(jù)量較大,不便于觀察,本文使用譜聚類算法對(duì)相似度矩陣W進(jìn)行降維??紤]使用譜聚類算法有兩個(gè)原因:1)譜聚類算法在處理高維數(shù)據(jù)時(shí)的運(yùn)算速度及效果遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)聚類算法,2)譜聚類算法在聚類時(shí)只需要數(shù)據(jù)之間的相似度矩陣,避免了傳統(tǒng)聚類算法對(duì)過程數(shù)據(jù)矩陣假設(shè)要求過多的問題(如K-means要求數(shù)據(jù)為凸集)。
首先,通過可視化手段,利用Gephi等軟件構(gòu)建網(wǎng)絡(luò)關(guān)系圖,探索創(chuàng)新主體技術(shù)背景相似度矩陣的內(nèi)部連邊關(guān)系,剔除孤立點(diǎn),即那些與其他創(chuàng)新主體相似度較低的創(chuàng)新主體、研究技術(shù)背景比較獨(dú)特的創(chuàng)新主體,為下一步將具有潛在合作關(guān)系的創(chuàng)新主體聚類做支撐。其次,可以利用可視化手段進(jìn)一步挖掘出相似度較高,潛在合作機(jī)會(huì)較大的相關(guān)創(chuàng)新主體。最后,利用譜聚類的方法將技術(shù)背景相似度較高的創(chuàng)新主體進(jìn)行聚類,即將那些具有潛在合作關(guān)系的創(chuàng)新主體進(jìn)行聚類[23],最終得到的聚類結(jié)果即為有可能組建創(chuàng)新聯(lián)合體的潛在對(duì)象,具體聚類步驟如下。
根據(jù)創(chuàng)新主體技術(shù)背景相似度矩陣W,可以計(jì)算出上文所構(gòu)架的創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)的拉普拉斯矩陣L:
L=D-W(5)
其中,D是對(duì)稱矩陣,D=diagd1,…,dn,di=∑jWij,di表示矩陣W中第i行所有元素的和。將矩陣L進(jìn)行歸一化譜分解,得到其前k個(gè)最小特征值所對(duì)應(yīng)的特征向量,并將其組成一個(gè)k*n的矩陣P,然后對(duì)矩陣P進(jìn)行k-means聚類得到向量F。顯然,相似度矩陣中每一列對(duì)象所屬的類別分別對(duì)應(yīng)于n維向量F,從而獲得最后的聚類結(jié)果[24]。
3 實(shí)證分析
3.1 數(shù)據(jù)預(yù)處理和創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)構(gòu)建
本文實(shí)證研究采用高分子材料領(lǐng)域的中國(guó)專利,選用IncoPat專利數(shù)據(jù)庫(kù)作為本文的數(shù)據(jù)來源,該數(shù)據(jù)庫(kù)涵蓋了全球120個(gè)國(guó)家的專利著作數(shù)據(jù),其數(shù)據(jù)來源準(zhǔn)確,且更新速度較快。本文對(duì)中國(guó)地區(qū)的高分子材料專利進(jìn)行檢索,選取具有代表性的企業(yè)、大專院校以及研究所進(jìn)行分析,數(shù)據(jù)下載時(shí)間為2022年8月,合并同族后獲得16 479個(gè)專利族作為本文的源數(shù)據(jù)。抽取所有專利的申請(qǐng)人和IPC分類號(hào)用作構(gòu)建創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)。
本文對(duì)樣本數(shù)據(jù)的處理主要包含幾個(gè)部分:
第1步:對(duì)于部分發(fā)明專利的專利權(quán)人超過一人的情況,將專利權(quán)人進(jìn)行拆分處理,同時(shí)保留這部分專利權(quán)人的信息作為專利權(quán)人實(shí)際合作信息,用作后續(xù)驗(yàn)證模型有效性。
第2步:為便于計(jì)算以及可視化觀察,僅保留IPC分類號(hào)和大類信息。
第3步:由于該領(lǐng)域內(nèi)專利權(quán)人較多,綜合考慮專利權(quán)人專利數(shù)量和可視化效果,本文僅選取擁有專利數(shù)量在50件以上的58家創(chuàng)新主體和對(duì)應(yīng)的94個(gè)IPC分類號(hào)作為節(jié)點(diǎn)構(gòu)建創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò),具體網(wǎng)絡(luò)如圖3所示。
圖3為152個(gè)節(jié)點(diǎn)(58家創(chuàng)新主體,94個(gè)IPC分類號(hào))和668條連邊構(gòu)成的創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò),圖中連邊的粗細(xì)代表了邊的權(quán)重,即該創(chuàng)新主體專利中所含IPC分類號(hào)的頻次大小。由圖3可以看出,C07(有機(jī)化學(xué))、C08(有機(jī)高分子化合物;其制備或化學(xué)加工;以其為基料的組合物)、B29(塑料的加工;一般處于塑性狀態(tài)物質(zhì)的加工)等IPC分類號(hào)處于該異構(gòu)性網(wǎng)絡(luò)的中心區(qū)域,且連線較多較粗,說明此類IPC分類號(hào)所代表的具體小領(lǐng)域是高分子材料領(lǐng)域內(nèi)研究的重點(diǎn)方向。同時(shí),吉林大學(xué)、中國(guó)石油化工股份有限公司和江南大學(xué)與C08的連線較粗,說明這三家創(chuàng)新主體是C08分類號(hào)所代表小領(lǐng)域(有機(jī)高分子化合物;其制備或化學(xué)加工;以其為基料的組合物)內(nèi)的主要研發(fā)力量。
3.2 創(chuàng)新主體技術(shù)背景相似度計(jì)算
在本文所構(gòu)建創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)的基礎(chǔ)上,選用SimRank算法計(jì)算創(chuàng)新主體之間的技術(shù)背景相似度,
該相似度的絕對(duì)值表明了兩家創(chuàng)新主體之間技術(shù)背景相似性的大小。
在實(shí)證之前,本文對(duì)模型進(jìn)行有效性檢驗(yàn),檢驗(yàn)方式為將計(jì)算相似度與實(shí)際合作次數(shù)進(jìn)行對(duì)比[12]。將所得計(jì)算相似度與企業(yè)之間實(shí)際合作次數(shù)的前100對(duì)合作關(guān)系進(jìn)行對(duì)比,檢驗(yàn)其相關(guān)性?;貧w分析結(jié)果如表1所示。
由表1可知,R為0.764,表明計(jì)算所得相似度與實(shí)際值之間有較強(qiáng)的相關(guān)性,該模型是可行的。
通過Python軟件計(jì)算,創(chuàng)新主體之間的技術(shù)背景相似度計(jì)算結(jié)果如表2所示。
表2中的數(shù)據(jù)為創(chuàng)新主體之間的技術(shù)背景相似度,根據(jù)SimRank算法相關(guān)原理,若該相似度的值大于0.05,則說明這兩家創(chuàng)新主體之間存在潛在的相關(guān)關(guān)系,由于該數(shù)據(jù)是一個(gè)58×58的對(duì)稱矩陣,不便于觀察,因此可以通過可視化的方法將其轉(zhuǎn)化成創(chuàng)新主體潛在合作關(guān)系網(wǎng)絡(luò)圖(圖4),從而便于比較分析。
圖4是由58個(gè)節(jié)點(diǎn)(58家創(chuàng)新主體)和365條連邊構(gòu)成的網(wǎng)絡(luò)圖,其中連邊代表了創(chuàng)新主體之間存在潛在的相關(guān)關(guān)系,連邊的顏色越深,表示節(jié)點(diǎn)對(duì)之間的技術(shù)背景相似度越高。圖4可以看出,復(fù)旦大學(xué)、深圳光啟創(chuàng)新技術(shù)有限公司、同濟(jì)大學(xué)和華南理工大學(xué)未和其他創(chuàng)新主體產(chǎn)生連邊,說明這四家創(chuàng)新主體的技術(shù)背景較為特殊,研究方向比較獨(dú)特。其他節(jié)點(diǎn)構(gòu)成了兩個(gè)比較明顯的聚類團(tuán),一類是以蘭州科天水性高分子材料有限公司和江蘇寶澤高分子材料有限公司為中心的較為稀疏的聚類團(tuán),反映了該聚類內(nèi)企業(yè)的技術(shù)背景有一定聯(lián)系,但是研究方向較為分散;另一類聚類團(tuán)是東南大學(xué)、北京理工大學(xué)和電子科技大學(xué)為中心的較為密集的聚類,該聚類包含節(jié)點(diǎn)較多,且中心節(jié)點(diǎn)較為密集,連線較多,說明該聚類內(nèi)中心節(jié)點(diǎn)潛在合作機(jī)會(huì)較大,方向較為接近,該聚類外圍節(jié)點(diǎn)也較為分散,此類節(jié)點(diǎn)是中心節(jié)點(diǎn)的擴(kuò)散,與中心節(jié)點(diǎn)存在聯(lián)系,但研究方向有所區(qū)別。
3.3 潛在合作伙伴挖掘
圖4的創(chuàng)新主體潛在合作網(wǎng)絡(luò)關(guān)系圖的網(wǎng)絡(luò)整體密度達(dá)到0.239 8,圖中節(jié)點(diǎn)連邊較多,不能較為清楚地展現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)。為獲得更好的可視化效果,可以考慮利用邊的強(qiáng)弱關(guān)系(即相似性的大?。┻M(jìn)行過濾,保留下強(qiáng)度較高的連邊。
如圖5所示,過濾掉連邊強(qiáng)度小于0.1的節(jié)點(diǎn)和連邊后,得到由11個(gè)節(jié)點(diǎn)和35條連邊構(gòu)成的網(wǎng)絡(luò)圖。該網(wǎng)絡(luò)圖中節(jié)點(diǎn)之間的距離越近,連邊越粗表明兩個(gè)節(jié)點(diǎn)代表的創(chuàng)新主體的技術(shù)背景越相似,其潛在合作機(jī)會(huì)越大??梢钥闯?,這11家創(chuàng)新主體之間技術(shù)背景極為相似,單從研發(fā)方向和技術(shù)背景角度考慮,這11家創(chuàng)新主體之間組建創(chuàng)新聯(lián)合體進(jìn)行合作攻關(guān)的成功概率較大。雖然現(xiàn)實(shí)中這11家創(chuàng)新主體之間展開的合作較少,但是由于其存在高度相似的技術(shù)背景,在未來合作的可能性還是較大的。由于上述可視化網(wǎng)絡(luò)僅能將潛在合作關(guān)系較強(qiáng)的創(chuàng)新主體之間產(chǎn)生聚類效果,考慮到還有很多具有潛在合作關(guān)系的創(chuàng)新主體之間未產(chǎn)生明顯的聚類效果,因此在剔除潛在合作網(wǎng)絡(luò)中的4個(gè)孤立點(diǎn)(復(fù)旦大學(xué)、深圳光啟創(chuàng)新技術(shù)有限公司、同濟(jì)大學(xué)和華南理工大學(xué))后可以進(jìn)一步將在潛在合作網(wǎng)絡(luò)關(guān)系中的54家創(chuàng)新主體進(jìn)行譜聚類,將上文計(jì)算的技術(shù)背景相似度矩陣數(shù)據(jù)進(jìn)行壓縮,方便分析的同時(shí)挖掘其中的隱含信息。聚類之后的結(jié)果,可以方便快捷地找出存在潛在合作機(jī)會(huì)的創(chuàng)新主體。譜聚類的結(jié)果如表3所示。
由表3聚類結(jié)果可以觀察到,聚類序號(hào)為1的17家創(chuàng)新主體包含了上述11家具有較強(qiáng)潛在合作關(guān)系創(chuàng)新主體中的10家(除合肥市再德高分子材料有限公司),可以看出該聚類的結(jié)果與前文分析一致,聚類效果較好。表3所示54家創(chuàng)新主體在高分子材料領(lǐng)域科技創(chuàng)新能力較為突出,但是其側(cè)重的產(chǎn)品特性、功能有所差異,通過聚類可以有效地將54家創(chuàng)新主體的技術(shù)背景相似性,即潛在合作可能性有效區(qū)分,相同聚類序號(hào)中的創(chuàng)新主體之間不僅技術(shù)背景相似度較高,而且所側(cè)重的研究方向較為相似,因此相同聚類序號(hào)中的創(chuàng)新主體便是潛在的合作伙伴。如聚類序號(hào)為1的創(chuàng)新主體中即可組成龍頭企業(yè)牽頭(中國(guó)石油化工股份有限公司)、高校院所支撐(吉林大學(xué)、四川大學(xué)、清華大學(xué)等雙一流高校)、各創(chuàng)新主體相互協(xié)同(合肥杰事杰新材料股份有限公司、蘭州科天水性高分子材料有限公司、江蘇寶澤高分子材料有限公司等中小企業(yè))的創(chuàng)新聯(lián)合體,其余聚類號(hào)組建創(chuàng)新聯(lián)合體過程與聚類號(hào)1過程相仿,在此不再贅述。創(chuàng)新聯(lián)合體的組建可以集聚創(chuàng)新資源,推動(dòng)產(chǎn)業(yè)實(shí)現(xiàn)重大技術(shù)突破,解決產(chǎn)業(yè)發(fā)展的關(guān)鍵和共性技術(shù)問題,形成產(chǎn)業(yè)核心技術(shù)標(biāo)準(zhǔn)和技術(shù)創(chuàng)新鏈,提升產(chǎn)業(yè)核心競(jìng)爭(zhēng)力,促進(jìn)產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級(jí)。但鑒于上文所構(gòu)建的創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)中所包含的企業(yè)專利信息量過少,因此表3所示聚類結(jié)果僅是粗略的潛在合作伙伴劃分,現(xiàn)實(shí)研究中還要考慮創(chuàng)新聯(lián)合體實(shí)際合作中所涉及到的資金、人才、實(shí)驗(yàn)設(shè)置等因素,從而提高創(chuàng)新聯(lián)合體合作效率。
4 結(jié)論
創(chuàng)新聯(lián)合體是新時(shí)代下的新產(chǎn)物,相較于以往學(xué)者研究合作伙伴時(shí)選擇構(gòu)建匹配模型進(jìn)行精準(zhǔn)匹配或者從目標(biāo)企業(yè)的視角利用機(jī)器學(xué)習(xí)算法判別競(jìng)合伙伴,創(chuàng)新聯(lián)合體潛在合作伙伴的選擇需要結(jié)合其組織成員多樣、聯(lián)系緊密、技術(shù)背景高度相似等特點(diǎn)進(jìn)行分析。因此本文在充分考慮創(chuàng)新聯(lián)合體特點(diǎn)的基礎(chǔ)上提出了基于專利異構(gòu)網(wǎng)絡(luò)和SimRank算法的創(chuàng)新主體技術(shù)背景相似度計(jì)算方法以及結(jié)合譜聚類算法的伙伴選擇方法。而且,與傳統(tǒng)伙伴選擇模型相比,該方法可以更精確、更廣泛、更快速、更便捷地尋找潛在合作伙伴,可以實(shí)時(shí)根據(jù)行業(yè)專利信息為伙伴選擇提供導(dǎo)航,同時(shí)也可充分預(yù)測(cè)未來的創(chuàng)新聯(lián)合體發(fā)展趨勢(shì),為該領(lǐng)域的戰(zhàn)略規(guī)劃和科技政策的制定提供建議。
本文的貢獻(xiàn)有:
1)更精確地計(jì)算創(chuàng)新主體之間的相似度。本文提出的基于專利異構(gòu)網(wǎng)絡(luò)和SimRank算法的創(chuàng)新主體技術(shù)背景相似度計(jì)算方法能夠充分利用專利信息中專利權(quán)人和IPC分類號(hào)分布之間的結(jié)構(gòu)特征,使得對(duì)網(wǎng)絡(luò)信息獲取和挖掘分析的結(jié)果更加準(zhǔn)確。相較于以往單一依靠相似度絕對(duì)值大小尋找合作伙伴的方法(如借助余弦相似度計(jì)算創(chuàng)新主體之間的技術(shù)相似度),能夠更為準(zhǔn)確地挖掘出潛在合作伙伴。
2)更廣泛地在全球范圍內(nèi)尋找潛在合作伙伴。本文借助專利數(shù)據(jù)構(gòu)建的創(chuàng)新聯(lián)合體潛在合作伙伴選擇模型,可以在全球范圍內(nèi)選擇恰當(dāng)?shù)膶@麛?shù)據(jù)進(jìn)行分析,相較于傳統(tǒng)伙伴選擇模型(如雙邊匹配等),可以擴(kuò)大伙伴選擇的范圍,豐富合作伙伴的類型,為實(shí)際企業(yè)發(fā)展中尋找潛在合作伙伴提供了新的思路。
3)更快速地進(jìn)行潛在合作伙伴劃分。本文利用譜聚類算法為技術(shù)背景相似度矩陣降維分析,避開了傳統(tǒng)聚類算法對(duì)過程數(shù)據(jù)矩陣要求過多的問題(如K-means要求數(shù)據(jù)為凸集),且在處理高維數(shù)據(jù)時(shí)的運(yùn)算速度及效果遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)聚類算法,譜聚類的劃分結(jié)果可以簡(jiǎn)單快速地為創(chuàng)新聯(lián)合體的潛在合作伙伴選擇起到參考作用。
4)更便捷地為企業(yè)判別合作可能性提供建議。本文基于創(chuàng)新主體IPC異構(gòu)網(wǎng)絡(luò)而建立的潛在合作網(wǎng)絡(luò)可以借助技術(shù)背景相似度指標(biāo)考察任意兩個(gè)節(jié)點(diǎn)之間技術(shù)背景的相似性,進(jìn)而評(píng)估合作可能性。因此現(xiàn)實(shí)情況中企業(yè)可以依據(jù)潛在合作網(wǎng)絡(luò)衡量與其他企業(yè)的合作可能性,更便捷地為企業(yè)伙伴選擇提供建議。
本文的不足之處在于,僅僅考慮創(chuàng)新主體的專利信息,而忽略了創(chuàng)新主體的論文信息等,下一步可以考慮構(gòu)建專利、論文等多重信息的多層網(wǎng)絡(luò)結(jié)構(gòu),從而更精確地預(yù)測(cè)創(chuàng)新主體之間的潛在合作關(guān)系。
參考文獻(xiàn):
[1]孫喜, 李明, 徐珂欣. 從產(chǎn)業(yè)升級(jí)中的龍頭企業(yè)角色理解創(chuàng)新的非線性特征 [J]. 科學(xué)學(xué)與科學(xué)技術(shù)管理, 2022, 43(1): 107123.
SUN X, LI M, XU K X. Understanding the nonlinear characteristics of innovation from the role of leading enterprises in industrial upgrading [J]. Science of Science and Management of Science and Technology, 2022, 43(1): 107123.
[2]尹西明, 陳泰倫, 陳勁, 等. 面向科技自立自強(qiáng)的高能級(jí)創(chuàng)新聯(lián)合體建設(shè) [J]. 陜西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2022, 51(2): 5160.
YIN X M, CHEN T L, CHEN J, et al. Construction of high-energy level innovation consortia for self-reliance and self-improvement in science and technology [J]. Journal of Shaanxi Normal University (Philosophy and Social Sciences), 2022, 51(2): 5160.
[3]郭菊娥, 王夢(mèng)迪, 冷奧琳. 企業(yè)布局搭建創(chuàng)新聯(lián)合體重塑創(chuàng)新生態(tài)的機(jī)理與路徑研究 [J]. 西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2022, 42(1): 7684.
GUO J E, WANG M D, LENG A L. Research on the mechanism and path of enterprise layout, building a new consortium and rebuilding a new state [J]. Journal of Xi′an Jiaotong University (Social Science Edition), 2022, 42(1): 7684.
[4]王崢, 龔軼. 創(chuàng)新共同體:概念、框架與模式 [J]. 科學(xué)學(xué)研究, 2018, 36(1): 140148,175.
WANG Z, GONG Y. Innovation community: concept, framework and model [J]. Science of Science Research, 2018, 36(1): 140148,175.
[5]李寧, 王玉婧, 陳星. 創(chuàng)新共同體與學(xué)科內(nèi)涵式建設(shè)互動(dòng)研究 [J]. 中國(guó)高??萍?, 2018(9): 4446.
LI N, WANG Y J, CHEN X. Research on the interaction between innovation community and discipline connotative construction [J]. Chinese University Science and Technology, 2108(9): 4446.
[6]王福, 劉俊華, 王建國(guó). 產(chǎn)學(xué)研共同體信息共享的形成機(jī)理及實(shí)現(xiàn)路徑 [J]. 現(xiàn)代情報(bào), 2020, 40(12): 7483.
WANG F, LIU J H, WANG J G. Formation mechanism and realization path of industry-university-research community information sharing [J]. Modern Information, 2020, 40(12): 7483.
[7]白京羽, 劉中全, 王穎婕. 基于博弈論的創(chuàng)新聯(lián)合體動(dòng)力機(jī)制研究 [J]. 科研管理, 2020, 41(10): 105113.
BAI J Y, LIU Z Q, WANG Y J. Research on the dynamic mechanism of innovation consortia based on game theory [J]. Scientific Research Management, 2020, 41(10): 105113.
[8]張?jiān)7€(wěn), 陳萬(wàn)明, 吳潔, 等. 基于行為視角的聯(lián)盟合作伙伴選擇 [J]. 系統(tǒng)工程, 2018, 36(6): 143148.
ZHANG Y W, CHEN W M, WU J, et al. Alliance partner selection based on behavioral perspective [J]. Systems Engineering, 2018, 36(6): 143148.
[9]丁榮貴, 高少?zèng)_, 孫濤, 等. 匹配視角下協(xié)同創(chuàng)新項(xiàng)目社會(huì)網(wǎng)絡(luò)參與方選擇決策 [J]. 軟科學(xué), 2018, 32(4): 16.
DING R G, GAO S C, SUN T. Selection and decision-making of social network participants in collaborative innovation projects from the perspective of matching [J]. Soft Science, 2018, 32(4): 16.
[10] DANIEL H Z, HEMPEL D J, SRINIVASAN N. A model of value assessment in collaborative Ramp;D programs [J]. Industrial Marketing Management, 2002, 31(8): 653664.
[11] BROUTHERS K D, BROUTHERS L E, WILKINSON T J. Strategic alliances: choose your partners [J]. Long range planning, 1995, 28(3): 225.
[12] 李冰, 丁堃, 孫曉玲. 企業(yè)潛在技術(shù)合作伙伴及競(jìng)爭(zhēng)者預(yù)測(cè)研究——以燃料電池技術(shù)為例 [J]. 情報(bào)學(xué)報(bào), 2021, 40(10): 10431051.
LI B, DING K, SUN X L. Research on forecasting potential technology partners and competitors of enterprises—taking fuel cell technology as an example [J]. Journal of Information Science, 2021, 40(10): 10431051.
[13] LOZANO S. Using DEA to find the best partner for a horizontal cooperation [J]. Computers amp; Industrial Engineering, 2013, 66(2): 286292.
[14] ANGUE K, AYERBE C, MITKOVA L. A method using two dimensions of the patent classification for measuring the technological proximity: an application in identifying a potential Ramp;D partner in biotechnology [J]. The Journal of Technology Transfer, 2014, 39(5): 716747.
[15] 溫亮, 邱鵬君, 馬萍萍, 等. 基于SAO語(yǔ)義分析的潛在技術(shù)合作伙伴識(shí)別 [J]. 北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2017, 19(4): 9196.
WEN L, QIU P J, MA P P, et al. Identification of potential technology partners based on SAO semantic analysis [J]. Journal of Beijing Institute of Technology (Social Science Edition), 2107, 19(4): 9196.
[16] 李亞兵, 游肖迪, 趙振. 創(chuàng)新聯(lián)合體關(guān)系嵌入對(duì)中小企業(yè)創(chuàng)新能力的影響 [J]. 華東經(jīng)濟(jì)管理, 2022, 36(10): 120128.
LI Y B, YOU X D, ZHAO Z. The impact of innovation consortium relationship embedding on the innovation capability of small and medium enterprises [J]. East China Economic Management, 2022, 36(10): 120128.
[17] 劉戒驕, 方瑩瑩, 王文娜. 科技創(chuàng)新新型舉國(guó)體制:實(shí)踐邏輯與關(guān)鍵要義 [J]. 北京工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2021, 21(5): 89101.
LIU J J, FANG Y Y, WANG W N. A new nation-wide system of scientific and technological innovation: practical logic and key essentials [J]. Journal of Beijing University of Technology (Social Science Edition), 2021, 21(5): 89101.
[18] JEH G, WIDOM J. SimRank: a measure of structural-context similarity [C]∥Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Edmonton, Alberta, Canada: Association for Computing Machinery, 2002: 538543.
[19] FOGARAS D, R CZ B. Scaling link-based similarity search [C]∥Proceedings of the 14th International Conference on World Wide Web. Chiba, Japan: Association for Computing Machinery, 2005: 641650.
[20] LI C, HAN J, HE G, et al. Fast computation of SimRank for static and dynamic information networks [C]∥Proceedings of the 13th International Conference on Extending Database Technology. Lausanne, Switzerland: Association for Computing Machinery, 2010: 465476.
[21] 劉萍, 黃純?nèi)f. 基于SimRank的作者相似度計(jì)算 [J]. 情報(bào)理論與實(shí)踐, 2015, 38(6): 109114.
LIU P, HUANG C W. Author similarity calculation based on simRank [J]. Information Theory and Practice, 2015, 38(6): 109114.
[22] ZHAO P, HAN J, SUN Y. P-Rank: a comprehensive structural similarity measure over information networks [C]∥Proceedings of the 18th ACM Conference on Information and Knowledge Management. Hong Kong, China: Association for Computing Machinery, 2009: 553562.
[23] 劉紫涵, 吳鵬海, 吳艷蘭. 三種譜聚類算法及其應(yīng)用研究 [J]. 計(jì)算機(jī)應(yīng)用研究, 2017, 34(4): 10261031.
LIU Z H, WU P H, WU Y L. Three spectral clustering algorithms and their applications [J]. Computer Application Research, 2017, 34(4): 10261031.
[24] 李鵬清, 李揚(yáng)定, 鄧雪蓮, 等. 一種基于SimRank得分的譜聚類算法 [J]. 計(jì)算機(jī)科學(xué), 2018, 45(S2): 458461,467.
LI P Q, LI Y D, DENG X L, et al. A spectral clustering algorithm based on SimRank score [J]. Computer Science, 2018, 45(S2): 458461,467.
(責(zé)任編輯 耿金花)