呂 源 劉敏榕
(福州大學(xué)圖書館,福建 福州 350100)
科學(xué)技術(shù)是推動社會進(jìn)步的主導(dǎo)力量,科技創(chuàng)新既是贏得未來發(fā)展主動權(quán)的必然選擇,也是應(yīng)對國際競爭新格局的內(nèi)在要求。黨的十八大以來,黨中央對科技創(chuàng)新和成果轉(zhuǎn)化給予了高度重視,黨的十九屆六中全會通過的《中共中央關(guān)于黨的百年奮斗重大成就和歷史經(jīng)驗的決議》強調(diào),要“把科技自立自強作為國家發(fā)展的戰(zhàn)略支撐,健全新型舉國體制,強化國家戰(zhàn)略科技力量,加強基礎(chǔ)研究,推進(jìn)關(guān)鍵核心技術(shù)攻關(guān)和自主創(chuàng)新”“加快建設(shè)創(chuàng)新型國家和世界科技強國”[1]。2016年5月,中共中央、國務(wù)院發(fā)布《國家創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略綱要》提出,創(chuàng)新驅(qū)動發(fā)展是我國面向未來的一項重大戰(zhàn)略[2]。2017年9月,國務(wù)院辦公廳印發(fā)《關(guān)于推廣支持創(chuàng)新相關(guān)改革舉措的通知》,在深化科技體制改革、提升自主創(chuàng)新能力、優(yōu)化創(chuàng)新創(chuàng)業(yè)環(huán)境等方面進(jìn)行了探索[3]。2021年3月,《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》提出,以國家戰(zhàn)略性需求為導(dǎo)向推進(jìn)創(chuàng)新體系優(yōu)化組合,加快構(gòu)建以國家實驗室為引領(lǐng)的戰(zhàn)略科技力量[4]。
當(dāng)前環(huán)境下,產(chǎn)學(xué)合作是我國科技體制改革的核心內(nèi)容。從宏觀角度上來講,產(chǎn)學(xué)合作模式深化了國家科技驅(qū)動發(fā)展戰(zhàn)略地位,推進(jìn)了供給側(cè)結(jié)構(gòu)改革以及培育了經(jīng)濟(jì)發(fā)展的新動能;而從微觀角度上來講,產(chǎn)學(xué)合作模式對于高校的意義在于規(guī)避了高校成果轉(zhuǎn)化效率低、資金不足的問題,對于企業(yè)而言,產(chǎn)學(xué)合作則為企業(yè)研發(fā)提供了高素質(zhì)的人才力量。然而,產(chǎn)學(xué)間的合作在現(xiàn)實層面往往存在突出困難。根據(jù)《2019年中國專利調(diào)查報告》數(shù)據(jù)顯示,我國國內(nèi)有效專利實施率為55.4%,高校和科研院所的有效專利實施率明顯低于企業(yè),分別為13.8%和38.0%,大量專利未能得到充分實施;而與此同時,我國企業(yè)普遍存在原始創(chuàng)新不足,關(guān)鍵技術(shù)受限等問題,在技術(shù)創(chuàng)新層面存在緊迫需求。顯然,通過產(chǎn)學(xué)合作優(yōu)化社會總體創(chuàng)新環(huán)境已成為提升國家科技強國戰(zhàn)略的關(guān)鍵。然而,由于協(xié)同性不足[5]、激勵機(jī)制缺位[6]、供需對接不暢[7]等原因,根據(jù)《中國科技成果轉(zhuǎn)化2019年度報告(高等院校與科研院所篇)》,3 200家高校和科研院所中設(shè)立技術(shù)轉(zhuǎn)移機(jī)構(gòu)的單位僅有688家(21.5%),只有307家單位認(rèn)為技術(shù)轉(zhuǎn)移機(jī)構(gòu)在成果轉(zhuǎn)化中發(fā)揮重要作用[8]。
專利文本作為一種科技寫作與法律寫作的結(jié)合體,本身具有專業(yè)性、技術(shù)性與新穎性的特點,同時又包含了豐富的信息,如IPC分類號、關(guān)鍵詞、引文關(guān)系等。對此,本文基于專利文本分析,設(shè)計產(chǎn)學(xué)合作推薦模型,并將現(xiàn)有的合作案例進(jìn)行處理并用以驗證模型的可行性,通過對專利文本語料信息的深層分析,發(fā)掘研究者與企業(yè)之間存在學(xué)術(shù)合作的可能,達(dá)到促成合作、提高科技成果轉(zhuǎn)化率以及提升市場競爭力和生產(chǎn)力的目的。
作為科技創(chuàng)新體系的重要組成部分,高校和企業(yè)扮演著不同的角色。高校作為學(xué)術(shù)性研究機(jī)構(gòu),其研發(fā)活動的主要目的在于發(fā)現(xiàn)新知識、新規(guī)律,進(jìn)而提升自身學(xué)術(shù)影響力。由于不受營利性要求約束,因此研發(fā)成果更加偏重學(xué)術(shù)性,對于現(xiàn)實生產(chǎn)力的轉(zhuǎn)化能力要求不高;而企業(yè)由于盈利性質(zhì),其研發(fā)活動具有很強的實用性和商業(yè)性導(dǎo)向,整個研發(fā)過程都是為提高生產(chǎn)力而服務(wù)的??偠灾?,高校在創(chuàng)新體系中的優(yōu)勢在于雄厚的研發(fā)力量、系統(tǒng)的研發(fā)模式以及豐富的研發(fā)資源;企業(yè)的優(yōu)勢在于高效的成果轉(zhuǎn)化體系,穩(wěn)定的資金支持以及對于市場信息的掌握。產(chǎn)學(xué)合作是科技政策與科技情報研究的熱點課題,國內(nèi)外對此開展了一系列研究。總體而言,相關(guān)研究可以分為3個方面展開:
1)產(chǎn)學(xué)合作體系建設(shè)。產(chǎn)學(xué)合作體系研究目前分為理論研究以及實例研究兩種:在理論研究方面,國外學(xué)者Natália D L F等提出,“三螺旋模型”探究在產(chǎn)學(xué)合作體系建設(shè)過程中政府支持所起到的作用[9];國內(nèi)相關(guān)的理論研究則包括對國家政策[10]、法律制度[11]以及高校內(nèi)部科技轉(zhuǎn)化服務(wù)體系構(gòu)建[12]的相關(guān)研究;而實例研究則包括對國內(nèi)現(xiàn)有產(chǎn)學(xué)合作體系的研究[13]和參考國外發(fā)達(dá)國家知識產(chǎn)權(quán)體系建設(shè)的研究[14],從實證的角度吸取相關(guān)經(jīng)驗,完善體系建設(shè)。
2)產(chǎn)學(xué)合作策略完善。當(dāng)前我國的科技技術(shù)轉(zhuǎn)移轉(zhuǎn)化存在動力不足、效率低等問題,學(xué)術(shù)界針對此類問題從產(chǎn)學(xué)合作策略的改進(jìn)與完善的角度進(jìn)行回答。當(dāng)前研究根據(jù)不同視角,可分為以下三類:一是國家政府主導(dǎo)產(chǎn)學(xué)合作及科技成果轉(zhuǎn)化體系完善[15];二是以市場或企業(yè)等需求方為視角探討校企合作方案[16];三是從高校視角出發(fā)探討產(chǎn)學(xué)合作對學(xué)術(shù)創(chuàng)新績效的影響[17]。
3)產(chǎn)學(xué)合作實證研究。此類研究主要包括國際經(jīng)驗借鑒和國內(nèi)實踐案例研究。國際經(jīng)驗借鑒是通過對美國[18]、日本[19]、英國[20]等知識產(chǎn)權(quán)強國所開展的促進(jìn)科技成果轉(zhuǎn)化的實踐進(jìn)行分析,為我國提供相關(guān)的經(jīng)驗;國內(nèi)實踐案例是通過對典型的成果轉(zhuǎn)化案例進(jìn)行分析,探究影響科技成果轉(zhuǎn)化的因素[21-23]。
現(xiàn)有的關(guān)于產(chǎn)學(xué)合作的研究成果主要是分析產(chǎn)學(xué)合作所需的相關(guān)要素,構(gòu)建較為完整的產(chǎn)學(xué)合作體系,從不同的角度闡述我國產(chǎn)學(xué)合作目前存在的問題和改善的策略,并充分借鑒國外產(chǎn)學(xué)合作較為成功的經(jīng)驗。但是目前關(guān)于產(chǎn)學(xué)合作相關(guān)研究存在兩點不足:第一,當(dāng)前的研究注重概念性和理論性的研究,缺乏方法論的相關(guān)研究;第二,當(dāng)前的研究主要偏向于定性研究,研究成果缺乏可重復(fù)性,具有主觀性。因此,本文擬通過基于專利文本分析的方法,探討如何進(jìn)一步有效提高產(chǎn)學(xué)合作概率和高校與企業(yè)相關(guān)信息的對接方法,最終幫助提高高??萍汲晒霓D(zhuǎn)化率。
正如上文所述,供需對接不暢是影響產(chǎn)學(xué)合作的重要因素之一。目前企業(yè)缺乏信息交流平臺,難以與高校對接,找到合適的投資項目或可以快速投入生產(chǎn)的科技成果;對于大部分高校而言,專利信息服務(wù)尚處于起步階段,難以找到合適的方法協(xié)助研發(fā)團(tuán)隊尋找合作伙伴,降低研發(fā)成本,避免科研資源浪費。而本文提出的基于專利文本的產(chǎn)學(xué)合作推薦模型,通過量化分析的手段,幫助企業(yè)尋找潛在的合作伙伴,也為高校的專利信息服務(wù)帶來了新的參考方法,提高了科技成果轉(zhuǎn)化的效率。
具體而言,本研究模型構(gòu)建包含3個步驟:第一步,首先統(tǒng)計高校專利數(shù)據(jù)庫和企業(yè)專利池中所擁有的專利,對這些專利進(jìn)行結(jié)構(gòu)化處理,如文本聚類分析,在Python中利用自編程序正則表達(dá)式提取待培育專利中的標(biāo)題、摘要、分類號、申請年份等關(guān)鍵信息等;其次對所提取的信息進(jìn)行篩選,選取技術(shù)相關(guān)的關(guān)鍵詞,并生成相應(yīng)的結(jié)構(gòu)化數(shù)據(jù);第二步,將結(jié)構(gòu)化數(shù)據(jù)利用專利地圖繪制的相關(guān)軟件制成專利地圖。然后根據(jù)專利地圖,識別企業(yè)專利池中的技術(shù)空白點,將企業(yè)專利空白點與高?,F(xiàn)有技術(shù)相聯(lián)系,尋找校企之間存在的潛在合作區(qū)域,提取出專利地圖中潛在合作區(qū)域的相關(guān)數(shù)據(jù);第三步,根據(jù)專利地圖中校企合作的潛在區(qū)域,反向確定具有合作可能的高校數(shù)據(jù)庫中的專利信息。將校企雙方的專利文本利用余弦相似度法進(jìn)行運算,將運算結(jié)果由高到低進(jìn)行排列,所得排名第一的專利即為存在最大合作潛能的高校專利。推薦模型構(gòu)建如圖1所示。
圖1 基于專利文本的產(chǎn)學(xué)合作推薦模型
目前,專利地圖在國際上還沒有標(biāo)準(zhǔn)、統(tǒng)一的定義。國外學(xué)者認(rèn)為,專利地圖由各種與專利相關(guān)的資料信息,以統(tǒng)計分析方法加以整理制成的各種圖表信息,使其具有類似地圖的指向功能[24],其中日本的研究程度最深,應(yīng)用范圍也最廣,日本于20世紀(jì)60年代就開始了專利地圖的研究。而國內(nèi)學(xué)者普遍認(rèn)為專利地圖是一種分析專利情報的方法,通過統(tǒng)計和加工的處理手段,使得原本復(fù)雜的專利情報,用各種可視化的圖表顯示出來,便于理解[25]。專利地圖在專利信息分析中起到了承上啟下的作用,承上是指專利地圖是將檢索到的專利信息歸納匯總,并以可視化的形式表現(xiàn)出來,以供后續(xù)定性分析和定量分析所用;而啟下是指通過對專利地圖的分析和研究,獲得相關(guān)信息,如技術(shù)水平、發(fā)展動態(tài)等,依照該信息可以為企業(yè)制定相應(yīng)的戰(zhàn)略規(guī)劃和專利布局。在本文中,專利地圖的主要功能在于以下幾點:首先是通過可視化識別出企業(yè)可以對現(xiàn)有技術(shù)進(jìn)行改進(jìn)的領(lǐng)域;其次是通過研究發(fā)現(xiàn)企業(yè)技術(shù)相對密集的領(lǐng)域所存在的空白技術(shù)點,最后是根據(jù)專利地圖的空白點反向識別出周邊可能存在的合作伙伴。
專利文本相似度計算是本研究的核心任務(wù)。當(dāng)前,有關(guān)文本相似度計算的主流方法主要有基于統(tǒng)計、基于句法結(jié)構(gòu)、基于編輯距離、基于語義信息4種。其中,余弦相似度法是基于語義信息的文本相似度計算方法之一,該方法由于擺脫了知識庫的構(gòu)建過程,直接通過文本內(nèi)所包含的語料進(jìn)行對比,因此具有較高的準(zhǔn)確率和較低的計算成本,能夠有效應(yīng)用于大規(guī)模文本分析任務(wù)中。因此,本文選擇余弦相似度計算專利文本的相似程度。
余弦相似度的原理是將準(zhǔn)備進(jìn)行比對的兩份文本轉(zhuǎn)化為空間內(nèi)的兩個特征向量,通過測量兩個特征向量之間的夾角,計算出其余弦值,來判斷兩個特征向量的相似度。本研究將產(chǎn)學(xué)合作雙方的相關(guān)專利轉(zhuǎn)化為空間向量a和at,Ai和At分別表示雙方專利在同一IPC分類號下的權(quán)重,可根據(jù)TF-IDF方法計算得到。根據(jù)上文所述,余弦相似度基本公式在本文中的衍生的公式為:
在文本分析的情況下,由于某個詞的詞頻不可能為負(fù)數(shù),所以在本文中,兩個特征向量的余弦值取值范圍為(0,1)。如果兩個向量之間的夾角θ為0,則意味著兩個向量完全重合,此時夾角的余弦值為1,即為兩份文本的特征向量完全吻合,所以在本文中,余弦相似度的值越接近于1,則證明兩份文本之間的相似度越高,產(chǎn)學(xué)合作雙方存在合作的潛力就越大。
通過網(wǎng)絡(luò)調(diào)研,本文選取L公司作為分析案例,有以下幾點原因:①L公司始建于1971年,是我國環(huán)境保護(hù)除塵行業(yè)的首家上市公司,是中國環(huán)保產(chǎn)業(yè)的領(lǐng)軍企業(yè),也是位居國際前列的大氣環(huán)保裝備制造企業(yè),40余年來專業(yè)致力于大氣污染控制領(lǐng)域環(huán)保產(chǎn)品的研發(fā)、設(shè)計、制造、安裝、調(diào)試、運營,其規(guī)模大,涉及產(chǎn)業(yè)廣,在一眾企業(yè)中具有代表性;②根據(jù)網(wǎng)絡(luò)調(diào)研可知,L公司與高校存在過合作的歷史,可以用于驗證合作預(yù)測模型的準(zhǔn)確性,提高可信度;③L公司擁有公司專屬的研發(fā)團(tuán)隊,是全國環(huán)保產(chǎn)業(yè)骨干龍頭企業(yè)和我國最大的專業(yè)從事煙氣除塵、脫硫脫硝裝置等大氣污染治理設(shè)備機(jī)電一體化的研發(fā)制造基地,具有與高校合作的研發(fā)潛力。
根據(jù)企查查提供的數(shù)據(jù)可知,L公司2018年、2019年、2020年以及2021年在研發(fā)上投入的研發(fā)資金分別為4.363億、4.621億、4.822億和3.219億,并主要運用于環(huán)境保護(hù)專用設(shè)備制造、大氣污染治理的技術(shù)研發(fā)。但是據(jù)分析,自2018年后,雖然L公司在研發(fā)上的投入有所增加,但L公司的專利授權(quán)通過率明顯下降。在技術(shù)研發(fā)方面,L公司現(xiàn)面臨研發(fā)動力不足、投入成本高等問題。因此,對于高校的科研成果存在迫切需求,有強烈的合作動機(jī)。
本文中的專利數(shù)據(jù)來源于國家知識產(chǎn)權(quán)局專利檢索及分析數(shù)據(jù)庫,經(jīng)篩選后,共獲得1 199篇專利,將專利相關(guān)信息導(dǎo)出。然后,利用Python的自編程序正則表達(dá)式提取每一篇專利文獻(xiàn)中的標(biāo)題、摘要、分類號、公開年份、關(guān)鍵詞字段,生成結(jié)構(gòu)化數(shù)據(jù)。
在進(jìn)行專利樣本選擇時,考慮到較早申請的專利技術(shù)L公司已經(jīng)較為成熟地運用于投入生產(chǎn)與占領(lǐng)市場,因此合作潛力較小,所以篩選了近3年內(nèi)L公司所申請的專利技術(shù)作為實驗樣本,共計174篇。部分處理后的信息如表1所示。
表1 部分已處理專利信息
根據(jù)處理好的數(shù)據(jù)繪制專利地圖,如圖3所示。由專利地圖可以看出,L公司目前研究的核心方向共有3個,分別是脫硝、煙氣處理系統(tǒng)等,吸收塔、廢水脫硫等,以及熱管、煙氣轉(zhuǎn)換器等。其他較為完善的研究方向多為核心研究方向的上下游產(chǎn)業(yè)鏈相關(guān)方向,如清灰裝置、濾袋除塵、電源控制、檢測裝置、造粒塔、廢氣處理、脫附、液冷板等,這些專利共同構(gòu)成了L公司完整的產(chǎn)業(yè)鏈。其核心技術(shù)部分存在合作的可能性較小,相關(guān)研究取得突破性進(jìn)展的難度較大,因此,核心技術(shù)上下游產(chǎn)業(yè)鏈中研究較為薄弱的部分,即為合作潛力較大的技術(shù)空白點。
圖2 L公司2013—2021年專利申請趨勢
圖3 L公司2019—2021年專利地圖
對上述專利進(jìn)行聚類分析,共得到8個聚類,如圖4所示。根據(jù)該圖可以看出,技術(shù)空白點主要集中于清灰裝置、濾袋除塵等區(qū)域,檢測裝置、輸送機(jī)、法蘭管等區(qū)域,造粒塔、廢氣處理等區(qū)域以及電源柜、電爐、脫附等區(qū)域。
圖4 專利聚類分析
提取識別出的空白點周圍的專利關(guān)鍵詞并按照關(guān)鍵詞詞頻進(jìn)行加權(quán)處理,得到如圖5所示的專利關(guān)鍵詞詞云。從圖中可以看出,L公司的空白點周邊技術(shù)主要集中于除塵器及其相關(guān)技術(shù)。以圖5中的主要關(guān)鍵詞作為檢索詞,在高校專利庫內(nèi)進(jìn)行檢索,經(jīng)過清洗掉失效專利數(shù)據(jù)后,共得到4 766條相關(guān)記錄,共有38所高校與L企業(yè)產(chǎn)生技術(shù)關(guān)聯(lián)。將上述4 766條記錄同樣進(jìn)行結(jié)構(gòu)化處理和聚類分析,并與L公司的相關(guān)技術(shù)主題進(jìn)行匹配對應(yīng)。
圖5 專利關(guān)鍵詞云圖
以煙氣凈化與除塵裝置兩個主題為例,將高校專利庫與企業(yè)技術(shù)空白點按照IPC分類號進(jìn)行分類,如表2所示,反映了高校專利數(shù)據(jù)庫中專利文獻(xiàn)與這兩個專利主題的匹配情況。按照上文所示余弦相似度公式,計算各個專利文本之間的相似度,可以為企業(yè)挖掘潛在合作伙伴,如圖6所示,L企業(yè)在煙氣凈化領(lǐng)域的潛在合作伙伴有山東大學(xué)、浙江大學(xué)、清華大學(xué)等,合作可能分別是22.52%、23.81%、23.60%。
表2 高校匹配專利主題情況
圖6 企業(yè)合作對象推薦圖
圖6展示了L企業(yè)在煙氣凈化領(lǐng)域的潛在合作伙伴。如上海交通大學(xué),在本次調(diào)研的高校中合作潛力位列第二,并且根據(jù)文獻(xiàn)調(diào)研的結(jié)果得知,L企業(yè)曾成功與上海交通大學(xué)達(dá)成合作,目前共有兩項專利已獲得授權(quán),也正是煙氣凈化領(lǐng)域的相關(guān)專
利。除此之外,例如山東大學(xué),共有3項專利聚類到煙氣凈化主題,專利組的IPC號為B01D53,其主要研究方向為氣體處理的工藝、裝置或方法;而L企業(yè)在此分類號下的專利共有10項,主要集中于煙氣凈化系統(tǒng)的研究。煙氣處理工藝、裝置或方法正是煙氣處理系統(tǒng)中重要的一環(huán),因此,L公司在此領(lǐng)域與山東大學(xué)具有較高的合作潛力。此外,安徽工業(yè)大學(xué)、華北電力大學(xué)等其他高??蒲性核簿哂休^強的技術(shù)實力和合作可能,在一些特定的技術(shù)分支方向具有較高價值的專利,可作為某些技術(shù)方向技術(shù)合作的參考合作對象。
本文提出了一種基于專利文本分析的產(chǎn)學(xué)合作推薦模型,該模型基于專利地圖識別企業(yè)技術(shù)空白點,并通過計算余弦相似度從高校專利庫中匹配潛在的技術(shù)合作對象。通過L公司的實證分析,發(fā)現(xiàn)L公司在煙氣凈化、除塵裝置等方面存在技術(shù)缺口,對此分別識別出上海交通大學(xué)、華北電力大學(xué)、安徽工業(yè)大學(xué)、山東大學(xué)等潛在合作對象。本文主要研究結(jié)論如下:
1)本研究基于專利文本的量化分析,可以為大規(guī)模的產(chǎn)學(xué)合作預(yù)測任務(wù)提供可行的方法,能夠避免專家咨詢等傳統(tǒng)質(zhì)性方法在客觀性方面的不足。并且當(dāng)前研究大多數(shù)聚焦于定性研究,本文從定量分析的角度出發(fā),有助于完善產(chǎn)學(xué)合作相關(guān)的研究體系。
2)本文采取信息可視化與文本分析相結(jié)合的方法,在一定程度上更為有效地幫助企業(yè)尋找出潛在的合作伙伴。先利用專利信息可視化技術(shù)圈定潛在合作伙伴范圍,再使用文本分析的方法對圈定范圍內(nèi)的潛在合作伙伴進(jìn)行相似度排序,甄別出合作可能最大的潛在合作伙伴,比起單純的文本分析方法更加快捷高效,節(jié)省人力和相關(guān)資源,符合當(dāng)前產(chǎn)學(xué)合作環(huán)境中專利數(shù)量多而服務(wù)人員少的需求。
3)本文實證研究是以企業(yè)為視角尋找潛在合作伙伴,但是本模型也可以以高校為視角查找相關(guān)企業(yè)進(jìn)行合作伙伴預(yù)測,但需要提前調(diào)查企業(yè)的相關(guān)資料,例如核心技術(shù)、產(chǎn)業(yè)鏈相關(guān)技術(shù)等,具有一定的難度,可以作為本研究未來的研究方向進(jìn)行深入探索。
需要指出的是,本研究主要聚焦于特定企業(yè),從國家宏觀科技戰(zhàn)略的角度看,未來對于大規(guī)模校企合作自動匹配的方法上仍有繼續(xù)探索的空間。除此之外,本研究僅涉及高校層面,如果利用研究中相應(yīng)的專利信息,再深入探索高校專利申請人和企業(yè)專利申請人之間點對點的精確合作,則更有可能提升產(chǎn)學(xué)合作的效率。