宋凱,冉從敬
知識(shí)經(jīng)濟(jì)時(shí)代,具備技術(shù)、經(jīng)濟(jì)、法律屬性的專利在區(qū)域產(chǎn)業(yè)和企業(yè)發(fā)展中發(fā)揮著關(guān)鍵作用。面對(duì)全球經(jīng)濟(jì)增長(zhǎng)乏力、“一帶一路”建設(shè)深化、國(guó)內(nèi)動(dòng)能轉(zhuǎn)換陣痛期,企業(yè)存在提升產(chǎn)品質(zhì)量、增強(qiáng)產(chǎn)品競(jìng)爭(zhēng)力、推進(jìn)產(chǎn)品“走出去”的現(xiàn)實(shí)需求,因此,依靠并大力發(fā)展知識(shí)產(chǎn)權(quán)才能贏得新一輪生產(chǎn)力布局調(diào)整的主動(dòng)權(quán)。高校集聚大批具有重要技術(shù)價(jià)值的專利資源和雄厚的人才資源,能夠?yàn)閲?guó)家科技發(fā)展和企業(yè)技術(shù)創(chuàng)新提供重要支持。但依據(jù)《2020年中國(guó)專利調(diào)查報(bào)告》,高校專利產(chǎn)業(yè)化率為3.8%、許可率為4.4%、轉(zhuǎn)讓率為3.6%[1],表明高校專利應(yīng)用比例偏低,造成了大量科技浪費(fèi)與閑置。《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和二O三五年遠(yuǎn)景目標(biāo)綱要》提出要改革國(guó)有知識(shí)產(chǎn)權(quán)歸屬和權(quán)益分配機(jī)制,擴(kuò)大科研機(jī)構(gòu)和高等院校知識(shí)產(chǎn)權(quán)處置自主權(quán)?!丁笆奈濉眹?guó)家知識(shí)產(chǎn)權(quán)保護(hù)和運(yùn)用規(guī)劃》,提出要支持高校和科研院所加強(qiáng)市場(chǎng)化知識(shí)產(chǎn)權(quán)運(yùn)營(yíng)機(jī)構(gòu)建設(shè),提升知識(shí)產(chǎn)權(quán)轉(zhuǎn)化能力。拓寬專利技術(shù)供給渠道,推進(jìn)專利技術(shù)供需對(duì)接,促進(jìn)專利技術(shù)轉(zhuǎn)化實(shí)施。一系列政策頒布表明高校專利轉(zhuǎn)移轉(zhuǎn)化是國(guó)家持續(xù)關(guān)注的領(lǐng)域。政策實(shí)施旨在促進(jìn)專利創(chuàng)造運(yùn)用,提升高校專利轉(zhuǎn)移轉(zhuǎn)化效率,以實(shí)現(xiàn)技術(shù)價(jià)值轉(zhuǎn)化為產(chǎn)業(yè)價(jià)值,推動(dòng)實(shí)現(xiàn)創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略。
目前存在多個(gè)高校專利運(yùn)營(yíng)平臺(tái),如國(guó)家知識(shí)產(chǎn)權(quán)運(yùn)營(yíng)公共服務(wù)平臺(tái)、科易網(wǎng)、匯桔網(wǎng)等均提供高校專利對(duì)外展示窗口,為企業(yè)選擇高校專利開(kāi)展技術(shù)交易提供系統(tǒng)支持。然而,隨著高校專利授權(quán)數(shù)量的快速增長(zhǎng),信息過(guò)載問(wèn)題也隨之而來(lái)。信息量的不斷增加讓情報(bào)機(jī)構(gòu)遭受信息超載的困境[2]。在使用已有高校專利運(yùn)營(yíng)平臺(tái)過(guò)程中,面對(duì)海量高校專利,企業(yè)需要花費(fèi)大量時(shí)間成本和人力成本進(jìn)行專利篩選,在確定符合技術(shù)需求的專利過(guò)程中面臨較大困境,較難快速高效地鎖定相關(guān)高校專利。因此,如何構(gòu)建提升企業(yè)專利查找效率的推薦機(jī)制尤為必要。
已有高校專利運(yùn)營(yíng)平臺(tái)聚焦于業(yè)務(wù)功能和服務(wù)模式等問(wèn)題,缺乏個(gè)性化推薦機(jī)制,導(dǎo)致企業(yè)不能快速定位符合需求的專利,高校專利仍束之高閣。20世紀(jì)90年代以來(lái),推薦系統(tǒng)受到廣泛關(guān)注,在學(xué)術(shù)資源推薦[3]、圖書(shū)館個(gè)性化服務(wù)[4]、用戶個(gè)性化教育[5]、虛擬社區(qū)知識(shí)推薦[6]等場(chǎng)景中進(jìn)行探索應(yīng)用,極大提升了用戶服務(wù)滿意度。此外,學(xué)者也將推薦方法應(yīng)用到專利技術(shù)交易和合作研發(fā)中,通過(guò)結(jié)合推薦主體特征,設(shè)計(jì)應(yīng)用場(chǎng)景,實(shí)現(xiàn)對(duì)技術(shù)需求者的專利推薦和合作推薦。Trappey等[7]提出融合機(jī)器學(xué)習(xí)和自然語(yǔ)言處理的專利推薦模型;Du等[8]設(shè)計(jì)基于語(yǔ)義增強(qiáng)的高質(zhì)量專利推薦系統(tǒng);Chung等[9]提出基于社會(huì)網(wǎng)絡(luò)分析和文本挖掘的合作伙伴識(shí)別方法;Kang等[10]構(gòu)建基于主題模型的合作團(tuán)隊(duì)選擇方法;張金柱等[11]設(shè)計(jì)基于表示學(xué)習(xí)的無(wú)監(jiān)督跨語(yǔ)言專利推薦方法;何喜軍等[12]構(gòu)建基于異構(gòu)信息網(wǎng)絡(luò)嵌入的專利技術(shù)主體間交易推薦模型;翟東升等[13]提出基于TRIZ理論的企業(yè)潛在研發(fā)伙伴的推薦方法;陳浩等[14]提出融合主題模型與決策數(shù)的跨地區(qū)專利合作關(guān)系發(fā)現(xiàn)與推薦方法。
綜上,個(gè)性化推薦目前已廣泛應(yīng)用于多個(gè)平臺(tái)場(chǎng)景,通過(guò)基于內(nèi)容或基于協(xié)同過(guò)濾的傳統(tǒng)推薦方法為用戶提供個(gè)性化服務(wù),緩解了信息過(guò)載問(wèn)題。同時(shí),個(gè)性化推薦在專利技術(shù)交易和合作研發(fā)中的應(yīng)用也為本文研究提供了理論和實(shí)踐參考。從企業(yè)視角出發(fā),將高校專利精準(zhǔn)推送給企業(yè),對(duì)建立產(chǎn)學(xué)研深度融合的技術(shù)創(chuàng)新體系,實(shí)現(xiàn)高校優(yōu)質(zhì)專利在經(jīng)濟(jì)社會(huì)中的高效配置具有重要意義。已有高校專利運(yùn)營(yíng)平臺(tái)均缺乏必要的個(gè)性化推薦機(jī)制,導(dǎo)致企業(yè)不能快速定位符合需求的專利,陷入信息超載困境;而相關(guān)專利推薦研究較少綜合考慮企業(yè)畫(huà)像和專利技術(shù)影響力,導(dǎo)致推薦結(jié)果的匹配度有待進(jìn)一步提升。因此,本文從技術(shù)研發(fā)屬性和競(jìng)爭(zhēng)對(duì)手屬性兩個(gè)維度描述企業(yè)畫(huà)像,并結(jié)合基于內(nèi)容推薦和基于協(xié)同過(guò)濾推薦的思想,制定高校專利個(gè)性化推薦策略,為企業(yè)選擇高校專利開(kāi)展技術(shù)交易提供決策支持。
基于企業(yè)畫(huà)像的高校專利個(gè)性化推薦模型見(jiàn)圖1,推薦模型主要涵蓋五個(gè)流程:數(shù)據(jù)檢索與預(yù)處理、技術(shù)主題提取與專利聚類、基于目標(biāo)企業(yè)技術(shù)研發(fā)屬性的專利推薦、基于目標(biāo)企業(yè)競(jìng)爭(zhēng)對(duì)手屬性的專利推薦、基于企業(yè)畫(huà)像的高校專利個(gè)性化推薦列表。
圖1 基于企業(yè)畫(huà)像的高校專利個(gè)性化推薦模型圖
從企業(yè)視角出發(fā),選取目標(biāo)企業(yè),基于目標(biāo)企業(yè)重點(diǎn)關(guān)注的技術(shù)研究方向,確定技術(shù)領(lǐng)域;然后以技術(shù)領(lǐng)域作為關(guān)鍵詞在數(shù)據(jù)庫(kù)中進(jìn)行檢索,獲取技術(shù)領(lǐng)域下包含目標(biāo)企業(yè)的企業(yè)專利數(shù)據(jù)和高校專利數(shù)據(jù);進(jìn)一步對(duì)專利數(shù)據(jù)進(jìn)行清洗,獲取專利標(biāo)題和專利摘要,借助學(xué)術(shù)論文和專利技術(shù)功效詞形成技術(shù)領(lǐng)域?qū)I(yè)詞典,應(yīng)用R語(yǔ)言的jiebaR包進(jìn)行專利文本自然語(yǔ)言處理,最后獲得實(shí)驗(yàn)語(yǔ)料集。
應(yīng)用R語(yǔ)言中的lda包對(duì)實(shí)驗(yàn)語(yǔ)料集進(jìn)行主題抽取,借助LDAvis模型確定最優(yōu)主題數(shù)目;通過(guò)設(shè)置主題數(shù)目,調(diào)整α和β兩個(gè)隱含參數(shù),形成最優(yōu)主題模型,分別得到每個(gè)技術(shù)主題下的相關(guān)技術(shù)語(yǔ)義詞和“專利-主題”概率矩陣,用于對(duì)技術(shù)主題名稱進(jìn)行總結(jié),并結(jié)合K-means算法進(jìn)行專利聚類[15]。
企業(yè)受市場(chǎng)競(jìng)爭(zhēng)、研發(fā)戰(zhàn)略、人力資源等影響,不能在一個(gè)技術(shù)領(lǐng)域的各個(gè)技術(shù)主題中同時(shí)發(fā)力,決定了在一個(gè)技術(shù)領(lǐng)域中企業(yè)會(huì)存在技術(shù)研發(fā)重點(diǎn)主題和技術(shù)研發(fā)薄弱主題,可從技術(shù)研發(fā)屬性維度描述企業(yè)畫(huà)像。依據(jù)專利文本聚類結(jié)果,統(tǒng)計(jì)目標(biāo)企業(yè)的專利布局情況,根據(jù)目標(biāo)企業(yè)的專利授權(quán)數(shù)量及申請(qǐng)人排名,通過(guò)閾值設(shè)定,確定企業(yè)的技術(shù)研發(fā)重點(diǎn)主題,從而結(jié)合基于內(nèi)容推薦的思想為企業(yè)進(jìn)行高校專利推薦。基于目標(biāo)企業(yè)技術(shù)研發(fā)屬性的專利推薦過(guò)程如下。
(1)對(duì)目標(biāo)企業(yè)技術(shù)研發(fā)重點(diǎn)主題下的專利進(jìn)行匯總,形成目標(biāo)企業(yè)專利集合Etarget={PE1:(S1,S2,…,Sn),PE2:(S1,S2,…,Sn),…,PEm:(S1,S2,…,Sn)},其 中P表示特定技術(shù)主題下目標(biāo)企業(yè)的專利,S表示應(yīng)用LDA模型獲取的目標(biāo)企業(yè)專利主題支持度,n表示主題數(shù)量,支持度范圍在0→1之間,越接近于1表明目標(biāo)企業(yè)專利與相應(yīng)技術(shù)主題越相關(guān)。
(2)匯總此技術(shù)主題下的高校專利,形成高校專利集合Uall={PU1:(S1,S2,…,Sn),PU2:(S1,S2,…,Sn),…,PUw:(S1,S2,…,Sn)}。
(3)在向企業(yè)推薦高校專利過(guò)程中,除要求推薦的精準(zhǔn)性,還要保證推薦質(zhì)量。在探析企業(yè)自身技術(shù)研發(fā)屬性外,還需要考慮高校專利技術(shù)影響力,將具備高影響力的專利推薦給企業(yè)。專利被引證次數(shù)能夠反映專利技術(shù)重要程度,被引證次數(shù)越多,越能夠體現(xiàn)對(duì)該方向上的其他專利技術(shù)創(chuàng)新產(chǎn)生重要的導(dǎo)向作用。但僅依賴被引證次數(shù)進(jìn)行專利技術(shù)影響力評(píng)價(jià)存在兩個(gè)不足:一是沒(méi)有考慮專利主題因素,在學(xué)術(shù)文獻(xiàn)評(píng)價(jià)中,已有研究指出文獻(xiàn)影響力與學(xué)科領(lǐng)域、研究主題密切相關(guān),將主題因素納入文獻(xiàn)影響力評(píng)價(jià)是合理且必要的[16]。此外,專利被引證次數(shù)具有時(shí)滯性,因此,對(duì)不同階段授權(quán)的專利,在應(yīng)用被引證次數(shù)進(jìn)行影響力評(píng)價(jià)時(shí)需要考慮時(shí)間因素。例如,2015年授權(quán)的一件發(fā)明專利被引證次數(shù)為10次,而2019年授權(quán)一件發(fā)明專利被引證次數(shù)也為10次,如果按照被引證次數(shù)評(píng)價(jià)兩件專利的技術(shù)創(chuàng)新性及影響力,則不分伯仲,但2015年專利歷經(jīng)5年被引證次數(shù)才達(dá)到10次,而2019年授權(quán)專利僅1年就達(dá)到同樣量級(jí),證明其創(chuàng)新性更高,時(shí)效性更強(qiáng),技術(shù)研究更前沿。綜合以上分析,在進(jìn)行專利技術(shù)影響力評(píng)價(jià)過(guò)程中,需要綜合考慮企業(yè)技術(shù)研發(fā)重點(diǎn)主題因素及專利授權(quán)時(shí)間因素,具體計(jì)算過(guò)程如下。
①對(duì)任意一件高校專利PUi,確定PUi的被引證次數(shù),記為UCi,將專利被引次數(shù)與授權(quán)時(shí)間融合,計(jì)算融合時(shí)間因子后的被引證次數(shù)WC,計(jì)算公式為:
其中,t為數(shù)值常量,以專利授權(quán)時(shí)間為2012-2020年為例,2020年授權(quán)專利的t值為1,而2012年授權(quán)專利的t值為9,通過(guò)這種方式,凸顯授權(quán)時(shí)間較晚,被引證次數(shù)較高的專利重要性。為避免被引證次數(shù)為0的情況,將分子和分母分別做加1處理[17]。
②對(duì)任意一個(gè)技術(shù)研發(fā)重點(diǎn)主題Ti,確定Ti對(duì)PUi的支持度,記為PUSi,將融合時(shí)間因素后的專利被引證次數(shù)與技術(shù)主題支持度融合,作為高校專利的技術(shù)影響力指數(shù)(Patent Technology Influence Index,PTII),計(jì)算公式為:
(4)計(jì)算得到高校專利Pi與技術(shù)研發(fā)重點(diǎn)主題下目標(biāo)企業(yè)所有專利的平均Cosine相似度Sim_Pi[18],并進(jìn)一步與技術(shù)影響力指數(shù)融合,形成高校專利匹配度(Patent Matching Degree,PMD),其中W1和W2為指標(biāo)權(quán)重,分別取值0.5。根據(jù)技術(shù)研發(fā)重點(diǎn)主題下每件高校專利匹配度進(jìn)行排名,形成基于企業(yè)技術(shù)研發(fā)屬性的高校專利推薦列表。
競(jìng)爭(zhēng)對(duì)手屬性是描述企業(yè)在技術(shù)領(lǐng)域的最大技術(shù)競(jìng)爭(zhēng)者,特別針對(duì)的是企業(yè)的技術(shù)研發(fā)薄弱主題。在此類主題中,結(jié)合基于協(xié)同過(guò)濾的推薦思想為企業(yè)進(jìn)行高校專利推薦。因此,在分析目標(biāo)企業(yè)技術(shù)研發(fā)屬性的基礎(chǔ)上,探尋出目標(biāo)企業(yè)的技術(shù)研發(fā)薄弱主題,并發(fā)掘目標(biāo)企業(yè)競(jìng)爭(zhēng)對(duì)手,以實(shí)現(xiàn)專利推薦?;谀繕?biāo)企業(yè)競(jìng)爭(zhēng)對(duì)手屬性的專利推薦過(guò)程如下。
(1)針對(duì)目標(biāo)企業(yè)的技術(shù)研發(fā)薄弱主題,對(duì)其他企業(yè)申請(qǐng)人進(jìn)行專利數(shù)量統(tǒng)計(jì)和排序,排名第一的企業(yè)申請(qǐng)人視為目標(biāo)企業(yè)的最大技術(shù)競(jìng)爭(zhēng)者。
(2)對(duì)技術(shù)研發(fā)薄弱主題下的技術(shù)競(jìng)爭(zhēng)者專利數(shù)量進(jìn)行統(tǒng)計(jì),形成技術(shù)競(jìng)爭(zhēng)企業(yè)專利集合Ecompetitors={Ec1:(P1,P2,…,Pa),Ec2:(P1,P2,…,Pb),…,Ecn:(P1,P2,…,Pz)}。
(3)參考流程三中(3)的計(jì)算過(guò)程,計(jì)算目標(biāo)企業(yè)技術(shù)研發(fā)薄弱主題下每件高校專利的技術(shù)影響力。
(4)計(jì)算目標(biāo)企業(yè)技術(shù)研發(fā)薄弱主題下,每件高校專利與目標(biāo)企業(yè)技術(shù)競(jìng)爭(zhēng)者專利的平均Cosine相似度,并結(jié)合高校專利技術(shù)影響力,計(jì)算高校專利匹配度-PMD。
(5)依據(jù)專利匹配度對(duì)目標(biāo)企業(yè)技術(shù)研發(fā)薄弱主題下的高校專利進(jìn)行排名,形成基于目標(biāo)企業(yè)競(jìng)爭(zhēng)對(duì)手屬性的專利推薦列表。
從技術(shù)研發(fā)屬性和競(jìng)爭(zhēng)對(duì)手屬性兩個(gè)維度描述企業(yè)畫(huà)像,結(jié)合基于內(nèi)容推薦和基于協(xié)同過(guò)濾推薦思想制定推薦策略,并依托專利匹配度指標(biāo)進(jìn)行高校專利排名,通過(guò)對(duì)以上兩種不同推薦策略得到的推薦結(jié)果進(jìn)行結(jié)合,形成高校專利個(gè)性化推薦列表?;诩夹g(shù)研發(fā)屬性的高校專利推薦,聚焦企業(yè)技術(shù)研發(fā)重點(diǎn)主題,通過(guò)轉(zhuǎn)讓高校專利,實(shí)現(xiàn)“強(qiáng)上加強(qiáng)”,圍繞城墻式布局、地毯式布局等構(gòu)建專利保護(hù)網(wǎng),形成對(duì)企業(yè)占據(jù)競(jìng)爭(zhēng)優(yōu)勢(shì)的專利組合?;诟?jìng)爭(zhēng)對(duì)手屬性的高校專利推薦,聚焦企業(yè)技術(shù)研發(fā)薄弱主題,通過(guò)借助高校技術(shù)力量,一方面可以快速提升在薄弱主題的技術(shù)實(shí)力,節(jié)約研發(fā)成本,實(shí)現(xiàn)彎道超車;另一方面為在薄弱主題開(kāi)展專利布局積累基礎(chǔ),防止被競(jìng)爭(zhēng)對(duì)手遏制,提起專利訴訟。
本文數(shù)據(jù)來(lái)源于IncoPat專利數(shù)據(jù)庫(kù),選擇分析的技術(shù)領(lǐng)域?yàn)椤霸朴?jì)算”。在數(shù)據(jù)檢索過(guò)程中,專利來(lái)源選擇為中國(guó)發(fā)明授權(quán)專利和實(shí)用新型專利,檢索式設(shè)置為標(biāo)題/摘要=(“云計(jì)算”or“云平臺(tái)”or“云存儲(chǔ)”or“云數(shù)據(jù)中心”or“數(shù)據(jù)云”or“醫(yī)療云”or“云計(jì)算中心”or“云計(jì)算系統(tǒng)”or“大數(shù)據(jù)云”or“云計(jì)算技術(shù)”),時(shí)間截至2020年12月31日,共檢索到9,975件專利。對(duì)校企合作專利數(shù)據(jù)進(jìn)行剔除,僅保留由高?;蚱髽I(yè)獨(dú)立申請(qǐng)的專利,剩余專利數(shù)據(jù)7,650件,其中高校數(shù)據(jù)1,520條、企業(yè)數(shù)據(jù)6,130條。
數(shù)據(jù)收集完成后,需要選擇一個(gè)目標(biāo)企業(yè)設(shè)計(jì)實(shí)證場(chǎng)景,遵循財(cái)政部、國(guó)家知識(shí)產(chǎn)權(quán)局聯(lián)合印發(fā)《關(guān)于實(shí)施專利轉(zhuǎn)化專項(xiàng)計(jì)劃助力中小企業(yè)創(chuàng)新發(fā)展的通知》的政策精神,本文重點(diǎn)考慮選擇“云計(jì)算”領(lǐng)域的中小企業(yè)進(jìn)行研究。綜合考量企業(yè)的專利授權(quán)數(shù)量、成立時(shí)間、行業(yè)專注程度等,選擇“A公司”作為目標(biāo)企業(yè),該企業(yè)成立于2010年,是專業(yè)云計(jì)算解決方案供應(yīng)商,專注于云計(jì)算、虛擬化、云存儲(chǔ)、云平臺(tái)、應(yīng)用虛擬化等領(lǐng)域的方案解決與服務(wù)提供,在云計(jì)算領(lǐng)域授權(quán)專利23件。因此,將應(yīng)用高校專利個(gè)性化推薦模型,根據(jù)“A公司”在“云計(jì)算”領(lǐng)域的企業(yè)畫(huà)像,進(jìn)行高校專利個(gè)性化推薦,解決“找專利”問(wèn)題。
根據(jù)技術(shù)主題提取流程,當(dāng)主題數(shù)目設(shè)置為12個(gè),α=0.01,β=0.02時(shí),基于LDAvis模型呈現(xiàn)的主題可視化結(jié)果,各主題之間交叉度較小,主題之間相對(duì)獨(dú)立,表明主題數(shù)目最優(yōu)。依據(jù)最優(yōu)模型的輸出結(jié)果,應(yīng)用“專利-主題”概率矩陣進(jìn)行專利聚類,結(jié)合技術(shù)主題下的相關(guān)詞對(duì)主題進(jìn)行總結(jié)凝練。依據(jù)計(jì)算結(jié)果,統(tǒng)計(jì)“A公司”在“云計(jì)算”領(lǐng)域各個(gè)技術(shù)主題下的專利布局情況,見(jiàn)表1。“A公司”在“云計(jì)算”領(lǐng)域中3個(gè)技術(shù)主題的專利授權(quán)數(shù)量超過(guò)5件,在企業(yè)申請(qǐng)人排名中,這3個(gè)主題也進(jìn)入前5名。因此,“A公司”技術(shù)研發(fā)重點(diǎn)主題和技術(shù)研發(fā)薄弱主題的閾值設(shè)置以“雙五”為閾值進(jìn)行劃分,即專利授權(quán)數(shù)量超過(guò)5件且排名前5的技術(shù)主題。通過(guò)閾值設(shè)置,判斷出“A公司”在云計(jì)算領(lǐng)域有3個(gè)技術(shù)研發(fā)重點(diǎn)主題,分別為:“主題3→云服務(wù)器”“主題10→云計(jì)算機(jī)”“主題11→射頻識(shí)別”,其余9個(gè)主題視為“A公司”的技術(shù)研發(fā)薄弱主題。通過(guò)上述分析,實(shí)現(xiàn)對(duì)企業(yè)畫(huà)像中技術(shù)研發(fā)屬性的描述。
表1 “A公司”技術(shù)主題專利布局統(tǒng)計(jì)表
對(duì)“A公司”技術(shù)研發(fā)薄弱主題下的企業(yè)申請(qǐng)人專利進(jìn)行統(tǒng)計(jì),確定“A公司”在各個(gè)技術(shù)研發(fā)薄弱主題下的最大技術(shù)競(jìng)爭(zhēng)企業(yè),統(tǒng)計(jì)結(jié)果見(jiàn)表2?!癆公司”在“主題1→虛擬化技術(shù)”“主題4→工業(yè)云計(jì)算”“主題5→云計(jì)算安全”“主題6→設(shè)備控制”“主題7→智能終端”“主題9→圖像處理”中的最大技術(shù)競(jìng)爭(zhēng)企業(yè)是“華*技術(shù)有限公司”;在“主題2→云傳感器”“主題8→云管理”“主題12→大數(shù)據(jù)處理”中的最大技術(shù)競(jìng)爭(zhēng)企業(yè)是“國(guó)*科技股份有限公司”。在本文所用實(shí)驗(yàn)數(shù)據(jù)集中,華*技術(shù)有限公司擁有獨(dú)立授權(quán)專利115項(xiàng),在所有企業(yè)申請(qǐng)人中排名首位?!叭A*云”是“華*技術(shù)有限公司”的云服務(wù)品牌,專注于云計(jì)算中公有云領(lǐng)域的技術(shù)研究與生態(tài)拓展,為企事業(yè)用戶提供一站式云計(jì)算基礎(chǔ)設(shè)施服務(wù),已成為中國(guó)最大、全球領(lǐng)先的公有云服務(wù)與解決方案供應(yīng)商之一。“國(guó)*科技股份有限公司”擁有獨(dú)立授權(quán)專利85項(xiàng),在所有企業(yè)申請(qǐng)人中排名第二位?!皣?guó)*科技股份有限公司”在云計(jì)算領(lǐng)域擁有自主研發(fā)的安全可控G-CLOUD云操作系統(tǒng),還擁有“職教云、政務(wù)云、應(yīng)急云、遙感云、交通云”等成功案例和整體解決方案,是中國(guó)領(lǐng)先的云計(jì)算全面解決方案及服務(wù)供應(yīng)商。通過(guò)以上分析,“華*技術(shù)有限公司”“國(guó)*科技股份有限公司”是“A公司”在云計(jì)算領(lǐng)域的最大技術(shù)競(jìng)爭(zhēng)企業(yè),“A公司”擁有獨(dú)立授權(quán)專利23件,與“華*技術(shù)有限公司”“國(guó)*科技股份有限公司”存在較大差距,而在技術(shù)研發(fā)薄弱主題中,“主題4→工業(yè)云計(jì)算”“主題8→云管理”“主題9→圖像處理”“主題12→大數(shù)據(jù)處理”中授權(quán)專利為零。因此,“A公司”在立足技術(shù)研發(fā)重點(diǎn)主題的基礎(chǔ)上,需要針對(duì)技術(shù)研發(fā)薄弱主題開(kāi)展技術(shù)探索及專利布局,以提升其在云計(jì)算領(lǐng)域的競(jìng)爭(zhēng)實(shí)力,拓展業(yè)務(wù)范圍,增加在云計(jì)算解決方案與應(yīng)用服務(wù)的市場(chǎng)占有率。通過(guò)以上過(guò)程,實(shí)現(xiàn)了對(duì)企業(yè)畫(huà)像中競(jìng)爭(zhēng)對(duì)手屬性的描述。
表2 “A公司”技術(shù)薄弱主題下最大技術(shù)競(jìng)爭(zhēng)企業(yè)統(tǒng)計(jì)表
通過(guò)分析技術(shù)研發(fā)屬性和競(jìng)爭(zhēng)對(duì)手屬性,能夠描述A公司在云計(jì)算領(lǐng)域的企業(yè)畫(huà)像,并依據(jù)制定的推薦策略進(jìn)行高校專利個(gè)性化推薦。本文以主題3和主題6為例,進(jìn)行高校專利個(gè)性化推薦結(jié)果的展示,見(jiàn)表3-4,每個(gè)主題展示4件專利,排名結(jié)果以專利匹配度為衡量指標(biāo)。
分析表3發(fā)現(xiàn),“主題3→云服務(wù)器”是A公司技術(shù)研發(fā)重點(diǎn)主題,因此,采用基于企業(yè)技術(shù)研發(fā)屬性的專利推薦流程,結(jié)合基于內(nèi)容推薦的思想,進(jìn)行高校專利推薦。其中,專利匹配度排名第一的是湖南大學(xué)肖國(guó)慶等人的“一種可高效更新權(quán)限的多用戶可搜索加密方法和系統(tǒng)”,授權(quán)時(shí)間為2020年,被引證次數(shù)為2次,該發(fā)明規(guī)避數(shù)據(jù)權(quán)屬者與用戶的并行交互,提升數(shù)據(jù)權(quán)屬者的相關(guān)數(shù)據(jù)更新效率,但不會(huì)對(duì)用戶查詢產(chǎn)生影響,具有擴(kuò)展應(yīng)用空間。排名第二位的是黑龍江大學(xué)郭賢達(dá)的“用于客戶信息管理的機(jī)器人”,授權(quán)時(shí)間為2018年,被引證次數(shù)為2次,通過(guò)將智能機(jī)器人管理系統(tǒng)與云計(jì)算實(shí)時(shí)平臺(tái)進(jìn)行連接,提高客戶信息管理效率。排名第三位的是成都信息工程大學(xué)李斌勇等的“基于云平臺(tái)的智慧交通大數(shù)據(jù)預(yù)測(cè)分析系統(tǒng)”,授權(quán)時(shí)間為2018年,被引證次數(shù)為2次,該發(fā)明依托云計(jì)算平臺(tái)對(duì)多源交通數(shù)據(jù)進(jìn)行預(yù)測(cè)處理,以提升汽車的通行效率。排名第四位的是魯東大學(xué)曲海平等的“一種基于云計(jì)算的數(shù)據(jù)交換監(jiān)控系統(tǒng)”,授權(quán)時(shí)間為2017年,被引證次數(shù)為2次,該發(fā)明能借助云計(jì)算后臺(tái)服務(wù)器遠(yuǎn)程監(jiān)控實(shí)時(shí)交換數(shù)據(jù)。
表3 基于企業(yè)技術(shù)研發(fā)屬性的高校專利推薦匯總表
分析表4發(fā)現(xiàn),“主題6→設(shè)備控制”是A公司的技術(shù)研發(fā)薄弱主題,最大技術(shù)競(jìng)爭(zhēng)企業(yè)是“華*技術(shù)有限公司”,因此,采用基于企業(yè)競(jìng)爭(zhēng)對(duì)手屬性的推薦流程,結(jié)合基于協(xié)同過(guò)濾推薦的思想進(jìn)行專利推薦。其中,專利匹配度排名第一的是陜西科技大學(xué)孟彥京等人的“一種基于電氣PLC和遠(yuǎn)程云平臺(tái)的復(fù)卷機(jī)控制系統(tǒng)”,授權(quán)時(shí)間是2018年,被引證次數(shù)為4次,本系統(tǒng)將采集到的復(fù)卷機(jī)數(shù)據(jù)傳輸至云平臺(tái),實(shí)現(xiàn)移動(dòng)端對(duì)復(fù)卷機(jī)的實(shí)時(shí)監(jiān)控,可降低人力成本,提高生產(chǎn)效率。排名第二位的是重慶交通大學(xué)林鵬飛等人的“一種支持多種支付方式的智能云存儲(chǔ)柜系統(tǒng)”,授權(quán)時(shí)間是2014年,被引證次數(shù)為4次,該存儲(chǔ)柜依托云平臺(tái),實(shí)現(xiàn)支持在線支付、驗(yàn)貨錄像等功能,可以保障相關(guān)方利益,提高派送效率。排名第三位的是北京工業(yè)大學(xué)沈琦等人的“一種基于Hadoop架構(gòu)的移動(dòng)終端云資源調(diào)度方法”,授權(quán)時(shí)間是2017年,被引證次數(shù)為2次,該方法提升了移動(dòng)終端的本地化執(zhí)行效率,在多并發(fā)和請(qǐng)求擁堵情況下,實(shí)現(xiàn)集群節(jié)點(diǎn)的復(fù)雜均衡。排名第四位的是湘潭大學(xué)曾以成等人的“基于FPGA和云平臺(tái)的智能家居系統(tǒng)”,授權(quán)時(shí)間是2015年,被引證次數(shù)為3次,本系統(tǒng)整合了三重網(wǎng)絡(luò)機(jī)制,能夠?qū)崿F(xiàn)對(duì)智能家居的高效控制,具有安全性高、適用范圍強(qiáng)、智能化程度高等優(yōu)勢(shì)。
表4 基于企業(yè)競(jìng)爭(zhēng)對(duì)手屬性的高校專利推薦匯總表
通過(guò)上述分析,針對(duì)A公司在云計(jì)算領(lǐng)域的企業(yè)畫(huà)像,分別結(jié)合基于內(nèi)容推薦和基于協(xié)同過(guò)濾推薦的思想,為A公司進(jìn)行高校專利個(gè)性化推薦。財(cái)政部辦公廳、國(guó)家知識(shí)產(chǎn)權(quán)局辦公室發(fā)布的《關(guān)于實(shí)施專利轉(zhuǎn)化專項(xiàng)計(jì)劃 助力中小企業(yè)創(chuàng)新發(fā)展的通知》指出,校企技術(shù)交易率低的關(guān)鍵原因在于中小企業(yè)缺乏快捷高效尋求高校專利以及與專利權(quán)人、發(fā)明團(tuán)隊(duì)對(duì)接的渠道。因此,相對(duì)于企業(yè)“被動(dòng)”搜索專利,本文所提專利“主動(dòng)”推薦模型將切實(shí)提升企業(yè)獲取高校專利的效率。此外,推薦過(guò)程中的重點(diǎn)內(nèi)容,一是構(gòu)建“A公司”的企業(yè)畫(huà)像,從技術(shù)研發(fā)屬性和競(jìng)爭(zhēng)對(duì)手屬性兩個(gè)維度出發(fā),為選擇應(yīng)用不同的推薦策略提供參考;二是推薦專利的優(yōu)先級(jí)是采用“專利匹配度”這一指標(biāo)進(jìn)行排名,需要進(jìn)一步對(duì)“專利匹配度”評(píng)價(jià)有效性進(jìn)行評(píng)估,進(jìn)而驗(yàn)證本文所推薦模型的科學(xué)性和合理性。因此,本文采用“主題6→設(shè)備控制”的專利推薦結(jié)果,從相關(guān)性、統(tǒng)計(jì)學(xué)特征、區(qū)分能力三個(gè)角度展開(kāi)分析。
將“主題6→設(shè)備控制”中專利匹配度與專利影響力、專利相似度、被引證次數(shù)、時(shí)間因子進(jìn)行Spearman相關(guān)性分析,結(jié)果見(jiàn)表5。由表5可知,在0.01水平(雙側(cè))上,專利匹配度、專利影響力、專利相似度、被引證次數(shù)之間呈顯著正相關(guān),相關(guān)系數(shù)介于0.453~0.927,但專利匹配度與時(shí)間因子呈顯著負(fù)相關(guān)。這種高度相關(guān)性與專利匹配度的設(shè)計(jì)原理有關(guān),傳統(tǒng)的基于內(nèi)容或基于協(xié)同過(guò)濾的推薦,都僅考慮相似度的匹配,而本文提出的專利匹配度指標(biāo)又進(jìn)一步考慮了專利影響力因素,將兩個(gè)指標(biāo)進(jìn)行了進(jìn)一步的融合。所以,專利匹配度與專利相似度以及專利影響力的相關(guān)系數(shù)分別為0.696、0.927,表明專利匹配度指標(biāo)是延續(xù)了傳統(tǒng)推薦方法中重視相似度匹配的重要特征。而專利影響力是綜合考慮了專利的被引證次數(shù)、企業(yè)技術(shù)研發(fā)主題因素及時(shí)間因子,其中專利被引證次數(shù)是評(píng)價(jià)專利技術(shù)創(chuàng)造性的通用指標(biāo),專利影響力公式的設(shè)計(jì)就決定了時(shí)間因子會(huì)將時(shí)間靠前的專利突顯出來(lái),而相關(guān)研究表明在影響力評(píng)價(jià)過(guò)程中融入主題因素能夠讓評(píng)價(jià)結(jié)果更加科學(xué)合理[19]。上述內(nèi)容表明,專利匹配度綜合考慮了專利相似性、專利被引證次數(shù)、專利技術(shù)主題、時(shí)間因子等因素,具有更全面的評(píng)價(jià)視角,用于專利推薦過(guò)程中,對(duì)專利進(jìn)行評(píng)價(jià)是可行的,推薦結(jié)果是可接受的。
表5 相關(guān)性計(jì)算統(tǒng)計(jì)表
將“主題6→設(shè)備控制”中的專利匹配度繪制Q-Q圖,見(jiàn)圖2。Q-Q圖是用來(lái)鑒別樣本數(shù)據(jù)分布特征的一種統(tǒng)計(jì)圖形技術(shù),如果被檢驗(yàn)的樣本數(shù)據(jù)近似落在一條直線附近,則其理論分布為標(biāo)準(zhǔn)正態(tài)分布。分析圖2發(fā)現(xiàn),主題6中各件專利匹配度對(duì)應(yīng)的數(shù)據(jù)點(diǎn)基本在一條直線附近,說(shuō)明各件專利對(duì)應(yīng)的專利匹配度服從正態(tài)分布,指標(biāo)服從正態(tài)分布更符合人們的打分習(xí)慣。俞立平在分析期刊評(píng)價(jià)指標(biāo)的內(nèi)部差距時(shí)發(fā)現(xiàn),目前多數(shù)期刊評(píng)價(jià)指標(biāo)普遍是右偏的,不服從正態(tài)分布,指標(biāo)數(shù)據(jù)右偏會(huì)導(dǎo)致期刊評(píng)價(jià)值偏低,影響期刊一般水平的判斷,并建議最好選取數(shù)據(jù)偏倚情況相對(duì)較好的指標(biāo)來(lái)評(píng)價(jià)期刊[20]??梢?jiàn),服從正態(tài)分布的專利匹配度是進(jìn)行高校專利推薦過(guò)程中較為理想的專利評(píng)價(jià)指標(biāo)。
圖2 樣本數(shù)據(jù)正態(tài)分布的Q-Q圖
為判斷專利匹配度、專利影響力、專利被引證次數(shù)、專利相似度幾種指標(biāo)的區(qū)分能力,計(jì)算它們?cè)u(píng)價(jià)結(jié)果的標(biāo)準(zhǔn)差(STDEVP,SD)。標(biāo)準(zhǔn)差反映一組數(shù)據(jù)的發(fā)散程度,標(biāo)準(zhǔn)差越大,則數(shù)據(jù)越發(fā)散。四種指標(biāo)對(duì)應(yīng)的標(biāo)準(zhǔn)差分別為:被引證次數(shù)(SD)=0.931、專利相似度(SD)=0.078、專利影響力(SD)=0.151、專利匹配度(SD)=0.097,專利匹配度的標(biāo)準(zhǔn)差僅比專利相似度高,表明其評(píng)價(jià)結(jié)果發(fā)散程度較小。進(jìn)一步對(duì)主題6下不同指標(biāo)的排名結(jié)果繪制折線圖,見(jiàn)圖3。其中橫軸表示專利,縱軸表示專利排名情況。
圖3 “主題6”四種評(píng)價(jià)指標(biāo)的高校專利排名變化圖
分析圖3發(fā)現(xiàn),專利匹配度對(duì)應(yīng)的專利排名圖示是一條直線,表明沒(méi)有相同的評(píng)價(jià)結(jié)果,而專利影響力、專利被引證次數(shù)、專利相似度對(duì)應(yīng)的專利排名圖示是曲線,且具有較大的波動(dòng),出現(xiàn)不同專利具有相同評(píng)價(jià)結(jié)果的現(xiàn)象。以主題6中專利匹配度排名前兩位的專利為例,專利6-1和專利6-2的被引證次數(shù)均為4次,但前者的專利匹配度(PMD=0.984)要高于后者(PMD=0.776),這是因?yàn)閷@?-1授權(quán)時(shí)間為2018年,而專利6-2的授權(quán)時(shí)間為2014年,通過(guò)融入時(shí)間因子后計(jì)算專利影響力,專利6-1明顯高于專利6-2,因此,其專利匹配度的排名靠前。專利6-3和專利6-4的專利相似度均為0.928,且后者的專利被引證次數(shù)高于前者,但前者的專利匹配度(PMD=0.761)要高于后者(PMD=0.747)。這是因?yàn)閷@?-3的專利授權(quán)時(shí)間是2017年,而專利6-4的專利授權(quán)時(shí)間是2015年,且專利6-3的技術(shù)主題支持度(UPS=0.990)要高于專利6-4(UPS=0.987),所以專利6-3的專利影響力就高于專利6-4,使得專利6-3的專利匹配度高于專利6-4。可見(jiàn),專利匹配度綜合考慮了專利被引證次數(shù)、企業(yè)技術(shù)研發(fā)主題、專利授權(quán)時(shí)間、專利相似度,能夠?qū)⑸鲜鲋笜?biāo)相同的專利有效地區(qū)分開(kāi)來(lái)。因此,與被引證次數(shù)、專利影響力、專利相似度相比,專利匹配度具有較好的專利區(qū)分能力,通過(guò)結(jié)合基于企業(yè)畫(huà)像的推薦策略,適用于向企業(yè)推薦高校專利。
本文提出基于企業(yè)畫(huà)像的高校專利個(gè)性化推薦理論模型,旨在為企業(yè)尋求高校專利開(kāi)展技術(shù)交易時(shí),從技術(shù)研發(fā)屬性和競(jìng)爭(zhēng)對(duì)手屬性兩個(gè)維度構(gòu)建企業(yè)畫(huà)像,結(jié)合基于內(nèi)容推薦和基于協(xié)同過(guò)濾推薦的思想,依據(jù)“專利匹配度”指標(biāo)進(jìn)行專利推薦。既關(guān)注了目標(biāo)企業(yè)在技術(shù)研發(fā)重點(diǎn)主題層面的資源傾斜,又兼顧其在技術(shù)薄弱主題層面的潛在需求,能夠改變以往企業(yè)在應(yīng)用高校專利運(yùn)營(yíng)平臺(tái)過(guò)程中的專利搜索模式,從“被動(dòng)搜索”轉(zhuǎn)變?yōu)椤爸鲃?dòng)推薦”,幫助企業(yè)緩解專利信息過(guò)載困境,解決了企業(yè)“找專利”的問(wèn)題。“專利匹配度”融合了多個(gè)維度指標(biāo),能夠保證推薦專利的主題性、影響力、時(shí)效性、相關(guān)性,在傳統(tǒng)推薦方法僅重視推薦精準(zhǔn)性的基礎(chǔ)上,又進(jìn)一步凸顯了推薦質(zhì)量,從而實(shí)現(xiàn)了最佳的推薦結(jié)果。本文不足之處在于,首先,企業(yè)畫(huà)像維度廣泛,本文僅從技術(shù)研發(fā)和競(jìng)爭(zhēng)對(duì)手兩個(gè)屬性維度進(jìn)行描述,畫(huà)像維度有待進(jìn)一步拓展;其次,在專利相似度計(jì)算過(guò)程中,采用余弦相似度實(shí)現(xiàn),雖然提升了計(jì)算效率,但忽略了語(yǔ)義關(guān)聯(lián),后續(xù)研究需要重視從語(yǔ)義層面的探索。以上內(nèi)容會(huì)對(duì)本文的推薦結(jié)果產(chǎn)生一定影響,將在后續(xù)研究中加以改進(jìn)。