姜 南,李逸凡,劉 謙,劉 星
(1.同濟(jì)大學(xué) 上海國際知識產(chǎn)權(quán)學(xué)院,上海 200092;2.河海大學(xué) 商學(xué)院,江蘇 南京 210024)
我國專利申請量近年來呈爆發(fā)式增長趨勢,從2011年開始一直位居世界首位。世界知識產(chǎn)權(quán)組織(WIPO)發(fā)布的《2021年世界知識產(chǎn)權(quán)指標(biāo)》顯示,2020年中國國家知識產(chǎn)權(quán)局受理專利申請149.7萬件,增速高達(dá)6.9%,占全球總量的45.7%,數(shù)量相當(dāng)于排名第二位至第十一位主管局受理量之和。然而,中國創(chuàng)新體系激勵政策雖然大幅提升了專利申請量,但并沒有帶來商業(yè)化收益的顯著增長[1]。2012年《世界銀行報告》指出,盡管2003-2009年中國專利申請量上升26%,遠(yuǎn)高于美國(6%)、韓國(5%)、歐洲(4%)和日本(1%)的增幅,但是中國專利收益率卻遠(yuǎn)低于這些國家[2]。專利商業(yè)化價值一方面受專利法保護(hù),另一方面也與專利質(zhì)量息息相關(guān),如專利前向引用情況、權(quán)利要求數(shù)、IPC技術(shù)范圍、專利維持時間及應(yīng)用領(lǐng)域等都是影響專利價值的重要因素。
2015年8月,全國人大常委會修訂了《中華人民共和國促進(jìn)科技成果轉(zhuǎn)化法》;2016年3月,國務(wù)院印發(fā)《實(shí)施<中華人民共和國促進(jìn)科技成果轉(zhuǎn)化法>若干規(guī)定》;2016年5月,國務(wù)院辦公廳印發(fā)《促進(jìn)科技成果轉(zhuǎn)移轉(zhuǎn)化行動方案》,這一系列政策被稱為我國科技成果轉(zhuǎn)移轉(zhuǎn)化的“三部曲”。除國家政策外,上海、廣東、四川、山東等十余個省市也相繼出臺“地方版”細(xì)則方案。中央和地方政府正著力從科技成果轉(zhuǎn)化產(chǎn)業(yè)、服務(wù)和人才等方面疏通科技成果轉(zhuǎn)化的“難點(diǎn)、痛點(diǎn)和堵點(diǎn)”,全面促進(jìn)科技成果轉(zhuǎn)化。但我國科技成果轉(zhuǎn)化率依然較低,以2021年6月發(fā)布的《2020年高等學(xué)??萍冀y(tǒng)計資料匯編》為例,各類高等學(xué)校年度專利申請量330 375件,專利授權(quán)數(shù)206 036件,年度專利出售合同數(shù)9 229件,專利出售數(shù)占當(dāng)年專利授權(quán)量的3%,大部分科技成果并未真正轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力。
在當(dāng)前政府政策主導(dǎo)下,研究新興前沿領(lǐng)域?qū)@夹g(shù)轉(zhuǎn)化識別因素并對專利成果轉(zhuǎn)化進(jìn)行預(yù)測,對于申請高質(zhì)量專利、加強(qiáng)專利商業(yè)化運(yùn)營、提升我國科技成果轉(zhuǎn)化效率和精準(zhǔn)度具有重要意義。人工智能芯片作為數(shù)字經(jīng)濟(jì)時代最為核心的技術(shù)需求與發(fā)展方向,對于加速推進(jìn)我國智能計算革命、實(shí)現(xiàn)科技自立自強(qiáng)以及攻克“卡脖子”技術(shù)難題具有重要意義。本研究利用機(jī)器學(xué)習(xí)算法聚焦人工智能芯片專利領(lǐng)域,研究專利成功轉(zhuǎn)化的特征并尋找最優(yōu)預(yù)測方案,探討主要國家或地區(qū)技術(shù)成功轉(zhuǎn)化影響因素,以及企業(yè)/高校、國內(nèi)/國際等不同層面專利成功轉(zhuǎn)化的主要特征,可為我國科技成果有效轉(zhuǎn)化提供針對性政策建議。
專利轉(zhuǎn)化作為學(xué)術(shù)界、產(chǎn)業(yè)界持續(xù)關(guān)注的重要研究領(lǐng)域,目前已取得豐碩研究成果。就轉(zhuǎn)化階段而言,專利技術(shù)轉(zhuǎn)化包括從研發(fā)到商業(yè)化的所有階段[3]。從法律法規(guī)看,Zhu 等[4]通過對比美國拜杜法案和中國版“拜杜法案”,認(rèn)為中國版“拜杜法案”實(shí)施效果沒有達(dá)到預(yù)期;何文韜等[5]認(rèn)為新能源汽車推廣政策雖然有助于激發(fā)汽車行業(yè)專利轉(zhuǎn)化積極性,但也容易造成其在未了解市場需求情況下推動新產(chǎn)品快速入市的盲目性;Soares 等[6]研究高校規(guī)章制度對專利申請和許可行為的影響,指出高校規(guī)章制度雖然促進(jìn)專利申請和許可數(shù)量增加,但對二者經(jīng)濟(jì)收益未產(chǎn)生太大影響。從轉(zhuǎn)化主體看,高等院校和科研機(jī)構(gòu)是專利轉(zhuǎn)化的重要載體,許多學(xué)者研究了高校專利轉(zhuǎn)化和技術(shù)轉(zhuǎn)移。冉從敬等[7]選取與專利價值相關(guān)的16個指標(biāo),采用AdaBoost算法提升了高校專利轉(zhuǎn)化的可識別性;Ye 等[8]通過對中國雙一流高校知識(專利)轉(zhuǎn)移網(wǎng)絡(luò)進(jìn)行分析,指出關(guān)鍵高校在知識擴(kuò)散網(wǎng)絡(luò)中居于核心地位,同時高校之間穩(wěn)定的知識交流與轉(zhuǎn)移是帶動落后地區(qū)發(fā)展的關(guān)鍵;張曉月等[9]探討高校專利轉(zhuǎn)化與專利價值之間的關(guān)系,認(rèn)為專利轉(zhuǎn)化及專利部分技術(shù)特征可以提升專利價值;金玉成[10]研究高校專利成果轉(zhuǎn)化模式發(fā)現(xiàn),專利技術(shù)特征影響高校專利轉(zhuǎn)化模式,專利成熟度和技術(shù)質(zhì)量不同,專利轉(zhuǎn)化模式也不同;袁傳思等[11]指出,影響高校新型研發(fā)機(jī)構(gòu)專利成果轉(zhuǎn)化的原因有建設(shè)主體文化水平較低、知識產(chǎn)權(quán)投入不足、科技成果轉(zhuǎn)化專業(yè)人員較少等。還有一些學(xué)者進(jìn)一步構(gòu)建高校專利轉(zhuǎn)化評價指標(biāo)體系,并從專利申請量、專利授權(quán)量、技術(shù)轉(zhuǎn)移收入、專利涵蓋領(lǐng)域等視角展開研究[12-14]。
綜上所述,專利技術(shù)轉(zhuǎn)化研究雖然已經(jīng)取得豐碩成果,但依然存在如下問題:研究對象多為發(fā)達(dá)國家,聚焦中國現(xiàn)實(shí)情境探討專利轉(zhuǎn)化的理論和實(shí)證研究較少,僅分析高校與科研機(jī)構(gòu)等單一主體而未涵蓋全部創(chuàng)新主體,尤其是針對特定前沿技術(shù)領(lǐng)域的研究更少。鑒于此,本研究從人工智能芯片領(lǐng)域出發(fā),通過機(jī)器學(xué)習(xí)算法精準(zhǔn)識別專利轉(zhuǎn)化特征并測度最優(yōu)轉(zhuǎn)化預(yù)測方案,分析主要國家或地區(qū)專利成功轉(zhuǎn)化影響因素,從企業(yè)/高校、國內(nèi)/國際等不同主體或?qū)用婵偨Y(jié)專利成功轉(zhuǎn)化的主要特征,可為我國破解“卡脖子”技術(shù)難題及專利轉(zhuǎn)化相關(guān)研究提供有益借鑒。
本文以人工智能芯片領(lǐng)域?yàn)檠芯繉ο?,人工智能芯片作為人工智能時代的硬件載體,其重要性不言而喻。由于人工智能技術(shù)應(yīng)用場景的復(fù)雜性,很難有一種單一且適用于各種環(huán)境的人工智能芯片設(shè)計方法。因此,工業(yè)界和學(xué)術(shù)界涌現(xiàn)出許多新的人工智能芯片設(shè)計方法,涵蓋材料、器件、電路、半導(dǎo)體等各個層面。人工智能芯片處于整個人工智能產(chǎn)業(yè)鏈的中間層,向上為應(yīng)用和算法提供有效支撐,向下對器件和電路、工藝和材料提出新要求。一方面,應(yīng)用和算法的快速發(fā)展,特別是深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)的快速發(fā)展對人工智能芯片提出高性能要求,為近年來人工智能芯片研發(fā)熱潮帶來新動力[15];另一方面,新材料、新工藝和新器件的迅速發(fā)展,如3D芯片堆疊存儲器和工藝進(jìn)化為人工智能芯片大幅提高性能和降低功耗提供了可行性??傮w來說,這兩種力量共同推動人工智能芯片技術(shù)迅速發(fā)展[16]。
人工智能芯片包括通用芯片(圖形處理單元,GPU)、半定制芯片(現(xiàn)場可編程門陣列,F(xiàn)PGA)、完全定制芯片(專用集成電路,ASIC)和類腦芯片4種類型。各自特性如下:GPU常用于開發(fā)和改進(jìn)人工智能算法。與傳統(tǒng)CPU相比,改進(jìn)的GPU具有更高的并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復(fù)雜算法等方面更加高效,同時程序運(yùn)行速度也提高了數(shù)千倍甚至數(shù)萬倍。與CPU和GPU相比,F(xiàn)PGA將經(jīng)過訓(xùn)練的AI算法應(yīng)用于實(shí)際數(shù)據(jù)輸入,可同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計算,具有明顯的性能和能耗優(yōu)勢;除功耗以外,F(xiàn)GPA在架構(gòu)上也存在顯著優(yōu)勢。ASIC是為學(xué)習(xí)具有計算性能的功能而設(shè)計的一種芯片,根據(jù)特定應(yīng)用需求定制。類腦芯片可以模擬人腦神經(jīng)網(wǎng)絡(luò)與人腦結(jié)構(gòu)進(jìn)行功能感知。
在人工智能芯片專利檢索過程中,本文以Derwent Innovation專利數(shù)據(jù)庫為檢索對象,來源國/地區(qū)主要選取中國、美國、歐盟、日本和韓國等。由于專利信息披露的滯后性,將專利檢索時間限定為2009年1月1日至2018年12月31日。通過查閱相關(guān)文獻(xiàn)資料、與專家多次溝通、多輪檢索最終確定專利檢索策略,并對數(shù)據(jù)進(jìn)行降噪、降雜處理從而得到本文專利樣本數(shù)據(jù),如表1所示。其中,人工智能芯片專利申請數(shù)量22 389件,已授權(quán)專利數(shù)12 741件。專利檢索條目包括申請日期、申請國別、名稱、專利摘要、發(fā)明人、專利權(quán)人、IPC分類號、法律狀態(tài)、引用專利/文獻(xiàn)數(shù)量等著錄信息。
廣泛意義上的專利轉(zhuǎn)化主要是指將專利技術(shù)產(chǎn)業(yè)化,諸如專利轉(zhuǎn)讓[17]、專利許可、專利質(zhì)押融資[18]等均可視為專利成功轉(zhuǎn)化。專利指標(biāo)通常涉及技術(shù)、法律和經(jīng)濟(jì)3個維度,本研究結(jié)合國家知識產(chǎn)權(quán)局發(fā)布的《專利價值分析指標(biāo)體系操作手冊》,遵循數(shù)據(jù)可得性原則,基于技術(shù)、法律、經(jīng)濟(jì)三大維度對專利評價指標(biāo)體系進(jìn)行細(xì)分,最終選取如表2所示的專利指標(biāo)衡量專利特征。
表1 人工智能芯片專利檢索策略Tab.1 Patent retrieval strategy of artificial intelligence chip
表2 指標(biāo)選取及含義Tab.2 Index selection and brief meaning
(1)技術(shù)指標(biāo):申請人數(shù)量、代理人數(shù)量、發(fā)明人數(shù)量、技術(shù)分類數(shù)量(IPC跨度)、維持時間、引用專利數(shù)、引用參考文獻(xiàn)數(shù)、當(dāng)前是否有效。其中,申請人數(shù)量是指企業(yè)與其它組織合作申請的專利,一定程度上反映企業(yè)之間的技術(shù)合作關(guān)系,是衡量企業(yè)技術(shù)合作關(guān)系和合作度的重要指標(biāo)[19]。代理人數(shù)量反映專利技術(shù)在申請專利保護(hù)過程中與專利代理人的關(guān)系,專利代理人服務(wù)涉及專利發(fā)明、專利申請、專利審查及專利保護(hù)運(yùn)用的各個階段[20],能夠從另一維度反映技術(shù)申請專利保護(hù)過程中的合作關(guān)系。發(fā)明人數(shù)量體現(xiàn)了技術(shù)復(fù)雜度,發(fā)明人是指對專利創(chuàng)造起實(shí)質(zhì)性作用的人,反映完成發(fā)明創(chuàng)造所需投入的人力資本[21],發(fā)明人數(shù)量與專利技術(shù)復(fù)雜度存在一定相關(guān)性。技術(shù)分類數(shù)量通常指專利IPC分類號跨度情況,用以表征技術(shù)多元性與技術(shù)跨度[22],本研究選取國際專利分類號小類(IPC四位編碼)數(shù)量表征技術(shù)多元性。維持時間和當(dāng)前是否有效存在相似功能,專利維持時間體現(xiàn)了專利的重要性,專利維持時間越長,專利市場價值、經(jīng)濟(jì)效益也就越高[23]。引用專利數(shù)與參考文獻(xiàn)數(shù)反映科學(xué)與技術(shù)的繼承性,用以表征專利吸取外部信息的能力,代表專利質(zhì)量水平,即技術(shù)可能處于的技術(shù)生命周期與市場應(yīng)用價值,體現(xiàn)技術(shù)創(chuàng)新性及對其它知識的借鑒程度[24]。
(2)法律指標(biāo):權(quán)利要求數(shù)、獨(dú)立權(quán)利要求數(shù)、從屬權(quán)利要求數(shù)、權(quán)利要求字符數(shù)。其中,權(quán)利要求數(shù)指專利申請人對專利技術(shù)的保護(hù)是否全面[25],單個專利權(quán)利要求數(shù)量越多,說明專利保護(hù)越全面,因此本文采用權(quán)利要求數(shù)衡量專利技術(shù)保護(hù)全面程度。獨(dú)立權(quán)利要求數(shù)指專利的必要技術(shù)特征,能夠從整體上反映專利的主要技術(shù)內(nèi)容,用以表征專利主要保護(hù)的技術(shù)內(nèi)容[26]。從屬權(quán)利要求數(shù)越多,越能對抗他人申請同樣或類似的改進(jìn)專利(宋河發(fā)等,2014)。權(quán)利要求字符數(shù)能夠從側(cè)面反映專利權(quán)法律效力,體現(xiàn)專利權(quán)人在專利起草和申請過程中投入資源的大小(張杰等,2015)。
(3)經(jīng)濟(jì)指標(biāo):同族專利、同族專利成員國數(shù)、權(quán)利人是否為企業(yè)以及是否來自中國、專利被引用次數(shù)。其中,同族專利和同族專利成員國數(shù)反映專利權(quán)人技術(shù)全球保護(hù)策略(劉紅光等,2013),用以表征專利技術(shù)在全球的布局情況以及專利技術(shù)在全球市場的應(yīng)用價值。權(quán)利人是否為企業(yè)以及是否來自中國反映不同創(chuàng)新主體與國家的專利技術(shù)轉(zhuǎn)讓情況[27]。專利被引用次數(shù)代表專利被認(rèn)可度,專利被引用次數(shù)越多,說明專利價值越高[28]。
(4)目標(biāo)指標(biāo):專利轉(zhuǎn)讓、許可和質(zhì)押,表征專利轉(zhuǎn)化情況。專利所有權(quán)轉(zhuǎn)讓、許可貿(mào)易與專利權(quán)質(zhì)押融資都是科技創(chuàng)新轉(zhuǎn)化的重要表現(xiàn)形式。專利只有通過市場轉(zhuǎn)化才能有效推動經(jīng)濟(jì)發(fā)展,故本文選取專利轉(zhuǎn)讓、許可或質(zhì)押評價專利技術(shù)成功轉(zhuǎn)化情況。
為保證數(shù)據(jù)研究效果和均衡性,收集上文專利數(shù)據(jù)中成功轉(zhuǎn)化的專利技術(shù),共獲得2 228條專利數(shù)據(jù),統(tǒng)計其是否存在專利技術(shù)成功轉(zhuǎn)化的情況,若有則標(biāo)為1,無則標(biāo)為0;同時,對已授權(quán)但未成功轉(zhuǎn)化的專利數(shù)據(jù)進(jìn)行收集,按1∶1的比例隨機(jī)匹配,共獲得2 228條數(shù)據(jù),合并形成4 456條數(shù)據(jù),對其進(jìn)行Z-score歸一化處理,形成訓(xùn)練集。由于本文目標(biāo)數(shù)據(jù)(專利轉(zhuǎn)讓、許可和質(zhì)押)為二項(xiàng)分類變量(0、1變量),本身離散不連續(xù),故構(gòu)建二分類模型,采用Python軟件對專利轉(zhuǎn)化進(jìn)行預(yù)測。
本文使用隨機(jī)森林算法選取相互獨(dú)立的弱分類器組成隨機(jī)森林分類器結(jié)構(gòu),對每個決策樹的輸出結(jié)果進(jìn)行平均化處理,從而得到最終的分類結(jié)果。相較于神經(jīng)網(wǎng)絡(luò)等經(jīng)典分類模型,隨機(jī)森林算法能夠輸出每個子分類器的影響結(jié)果,方便對特征篩選、分類器進(jìn)行改進(jìn)。
利用隨機(jī)森林算法[29]計算每個特征指標(biāo)的重要性,結(jié)果如表3所示。設(shè)定隨機(jī)森林決策樹數(shù)量為1 000,由于其它參數(shù)特征量不大,因此選擇默認(rèn)值。對Python 中的相關(guān)函數(shù)進(jìn)行處理可以得到各特征的相對重要性,并隨機(jī)給各特征變量加入噪聲干擾,以改變特征值,并觀察模型效果下降程度。如果改變某個特征能使模型效果明顯變差,說明這一特征比較重要。由表3可知,對于專利轉(zhuǎn)化而言,維持時間重要性最高,重要度為0.157。其次為權(quán)利要求字符數(shù)、發(fā)明人數(shù)量和權(quán)利要求數(shù),重要度分別為0.145、0.092和0.076。這說明,代表專利存活時間的維持時間特征最能反映專利能否成功轉(zhuǎn)化,說明專利維持時間不僅可以表征專利技術(shù)存活時間,而且能從側(cè)面反映專利質(zhì)量及專利權(quán)人重視程度,對于專利是否可以轉(zhuǎn)化起較為重要的作用。權(quán)利要求字符數(shù)和權(quán)利要求數(shù)重要性排第2位和第4位,說明專利文本中權(quán)利要求詳細(xì)程度對專利成功轉(zhuǎn)化起重要作用。發(fā)明人數(shù)量排第3位,說明專利技術(shù)復(fù)雜度對于專利轉(zhuǎn)化具有積極影響。
表3 指標(biāo)重要度排序Tab.3 Index importance rankings
前4個特征重要性合計占比47%,其它13個特征重要性合計只占53%,說明各特征在隨機(jī)森林算法中的重要性區(qū)別較小,可進(jìn)一步進(jìn)行特征篩選和數(shù)據(jù)降維。然而,由于所有特征的重要性均大于0.01,直接刪除其它變量將會導(dǎo)致研究精度下降,故進(jìn)一步采取主成分分析法,以相關(guān)性矩陣和熱力圖對特征進(jìn)行篩選,特征相關(guān)性矩陣如圖1所示。從中可見,權(quán)利要求數(shù)和從屬權(quán)利要求數(shù)、同族專利數(shù)和同族專利成員國數(shù)、引用專利數(shù)和引用參考文獻(xiàn)數(shù)存在較高的相關(guān)性。
結(jié)合KMO檢驗(yàn)值,將申請人數(shù)量、代理人數(shù)量、從屬權(quán)利要求數(shù)、權(quán)利人是否為企業(yè)和引用參考文獻(xiàn)數(shù)5個特征予以剔除,以獲取較好的主成分分析結(jié)果。值得注意的是,雖然同族專利數(shù)和同族專利成員國數(shù)相關(guān)性較高,但是在實(shí)驗(yàn)中刪去其中任何一個特征后KMO值并未得到優(yōu)化,故予以保留。其中,剔除申請人數(shù)量、代理人數(shù)量是由于在多數(shù)專利中其數(shù)值多為“1”,導(dǎo)致這兩個特征不具備顯著性。從屬權(quán)利要求數(shù)量也被剔除,是因?yàn)闄?quán)利要求數(shù)與獨(dú)立權(quán)利要求數(shù)已經(jīng)存在,而三者存在“權(quán)利要求數(shù)=獨(dú)立權(quán)利要求數(shù)+從屬權(quán)利要求數(shù)”的數(shù)量關(guān)系,故保留從屬權(quán)利要求數(shù)有可能產(chǎn)生嚴(yán)重的共線性問題(相關(guān)性大于0.8)。引用參考文獻(xiàn)數(shù)與引用專利數(shù)也存在較強(qiáng)的共線性,其值會隨著引用專利數(shù)的變化而發(fā)生改變。剔除權(quán)利人是否為企業(yè)是因?yàn)樵撎卣髋c其它特征弱相關(guān)(值小于0.3),說明該指標(biāo)信息保護(hù)較少。在剔除如上5個特征后,KMO度量值由0.590上升到0.754,結(jié)果如表4所示。這說明,利用上述12個特征進(jìn)行專利可轉(zhuǎn)化預(yù)測是合理的,處理后模型特征數(shù)量實(shí)現(xiàn)降維。
圖1 特征指標(biāo)相關(guān)性矩陣熱力圖Fig.1 Feature index correlation matrix heatmap
表4 特征數(shù)量KMO值Tab.4 KMO value of characteristic quantity
為選取一個性能更好的算法構(gòu)建預(yù)測模型,本文分別利用邏輯回歸算法、支持向量機(jī)算法、隨機(jī)森林算法和AdaBoost算法進(jìn)行對比實(shí)驗(yàn)。對專利數(shù)據(jù)分配0/1變量的分類預(yù)測任務(wù),以解決不同算法預(yù)測可能產(chǎn)生的過擬合問題。對剔除特征變量后的數(shù)據(jù)集以8∶2的比例隨機(jī)抽取訓(xùn)練集和預(yù)測集,用4種分類算法采取十折交叉驗(yàn)證進(jìn)行訓(xùn)練預(yù)測,以Accuracy值作為評估特征,具體分析如下:
(1)邏輯回歸算法。邏輯回歸算法作為一種二分類算法,預(yù)測結(jié)果有true(1)和false(0)兩種,使用的擬合函數(shù)為sigmoid函數(shù),通過擬合解釋變量與事件發(fā)生或否(二分類因變量)之間的非線性關(guān)系,建立二分類因變量發(fā)生概率與解釋變量關(guān)系模型。
(1)
在識別模型構(gòu)建過程中,采用Python 所包含的邏輯回歸算法進(jìn)行模型訓(xùn)練與分類擬合,并構(gòu)建預(yù)測模型。由于訓(xùn)練集是小樣本數(shù)據(jù),所以采取十折交叉驗(yàn)證進(jìn)行模型訓(xùn)練,以Accuracy 值作為模型性能評估指標(biāo)。通過多次參數(shù)調(diào)優(yōu),使用邏輯回歸算法構(gòu)建的識別模型Accuracy值為0.720。
(2)支持向量機(jī)算法。支持向量機(jī)是在高位特征空間使用線性函數(shù)假設(shè)空間的學(xué)習(xí)系統(tǒng),由于其具有良好的分類性能,近年來在自然語言處理等研究領(lǐng)域得到廣泛應(yīng)用。本文使用構(gòu)造核函數(shù)的支持向量機(jī)算法解決非線性分類任務(wù)。在識別模型構(gòu)建過程中,采用Python 所包含的支持向量機(jī)算法構(gòu)造核函數(shù)進(jìn)行模型訓(xùn)練與分類擬合,構(gòu)建預(yù)測模型。通過多次參數(shù)調(diào)優(yōu),使用支持向量機(jī)算法構(gòu)建的識別模型Accuracy值為0.716。
(3)隨機(jī)森林算法。隨機(jī)森林算法屬于機(jī)器學(xué)習(xí)算法的一種,主要通過決策優(yōu)化或覆蓋優(yōu)化兩種手段將多種不同分類器進(jìn)行綜合,最后輸出一個最優(yōu)解以達(dá)到優(yōu)化總體性能的目的,流程如圖2所示。
圖2 隨機(jī)森林算法Fig.2 Random forest algorithm
在隨機(jī)森林算法分類中,隨機(jī)森林算法中的每棵決策樹都是一個分類器,對于一個輸入樣本,N棵樹會呈現(xiàn)N個分類結(jié)果,因此將投票次數(shù)最多的類別指定為最終輸出。在識別模型構(gòu)建過程中,采用Python 所包含的隨機(jī)森林算法進(jìn)行模型訓(xùn)練與分類擬合,通過二分類預(yù)測任務(wù)解決隨機(jī)森林算法中出現(xiàn)的非連續(xù)性預(yù)測問題,以避免出現(xiàn)對訓(xùn)練數(shù)據(jù)外對象分類正確率較低的問題。通過多次參數(shù)調(diào)優(yōu),當(dāng)參數(shù)設(shè)置為使用1 000個弱分類器時,模型Accuracy值為0.737。
(4)AdaBoost算法。AdaBoost算法屬于集成學(xué)習(xí)方法的一種,旨在使用一個訓(xùn)練集訓(xùn)練,如SVM、BP網(wǎng)絡(luò)等弱分類器,將不同訓(xùn)練集結(jié)合起來構(gòu)成一個更強(qiáng)的分類器,通過改變數(shù)據(jù)分布實(shí)現(xiàn)分類器選擇,根據(jù)訓(xùn)練集樣本分類修正分類器,并以整體分類精度為依據(jù)確定每個樣本權(quán)重,然后對新權(quán)重值進(jìn)行下一層訓(xùn)練,最后將每個分類器融合在一起。在識別模型構(gòu)建過程中,采用Python 所包含的AdaBoost分類算法進(jìn)行模型訓(xùn)練與分類擬合,構(gòu)建預(yù)測模型。通過多次參數(shù)調(diào)優(yōu),使用AdaBoost分類算法構(gòu)建的識別模型Accuracy值為0.728。
分別運(yùn)行上述4種算法,結(jié)果如表5和圖3所示。從中可見,在4種算法中,基于隨機(jī)森林算法的預(yù)測模型性能最優(yōu),體現(xiàn)了隨機(jī)森林算法在專利轉(zhuǎn)化特征識別與預(yù)測中的應(yīng)用價值。
表5 4種分類算法性能分值Tab.5 Performance scores of four classification algorithms
圖3 4種分類算法性能對比Fig.3 Performance comparison of four classification algorithms
在驗(yàn)證模型有效性的基礎(chǔ)上,進(jìn)一步利用模型對人工智能芯片專利進(jìn)行識別,輸出每件專利的分類結(jié)果及轉(zhuǎn)化概率。根據(jù)專利轉(zhuǎn)化概率,仿照10分標(biāo)準(zhǔn)評估法,設(shè)置10層專利可轉(zhuǎn)化概率閾值,形成評估表,如表6所示。從中可見,在人工智能芯片領(lǐng)域,轉(zhuǎn)化概率在90%~100%之間的專利比重僅為1%,可認(rèn)為這部分專利最具轉(zhuǎn)化價值和商業(yè)效益,共包含327件專利??傮w來看,轉(zhuǎn)化概率在70%以上的專利占比僅為17%(1%+5%+11%=17%),可見全球范圍內(nèi)人工智能芯片具有較高專利轉(zhuǎn)化價值的數(shù)量偏少。同時,轉(zhuǎn)化概率介于40%~70%之間的專利比重占44%,介于0~40%之間的專利比重占38%,反映出人工智能芯片領(lǐng)域大部分專利都具備一定的轉(zhuǎn)化價值,但仍有近1/3的專利存在失效風(fēng)險,轉(zhuǎn)化概率較低。
在專利轉(zhuǎn)化概率的基礎(chǔ)上,繪制專利可轉(zhuǎn)化性柱狀圖,并對其進(jìn)行線性擬合。由圖4可知,人工智能芯片領(lǐng)域?qū)@赊D(zhuǎn)化概率呈對數(shù)曲線分布態(tài)勢,擬合對數(shù)函數(shù)方程為y=-0.203 6lnx+2.307 3,R2=0.761 78。已有研究指出,專利價值通常呈對數(shù)常態(tài)曲線分布趨勢[30],即在一個領(lǐng)域中,僅有少數(shù)專利為高價值專利,大部分專利價值都較低,本文模型與一般的經(jīng)驗(yàn)感知相符。但與文獻(xiàn)[9]對人工智能領(lǐng)域可轉(zhuǎn)化專利研究相比,轉(zhuǎn)化概率中閾值為10(轉(zhuǎn)化概率介于90%~100%)的專利比例較小,說明人工智能芯片領(lǐng)域?qū)@赊D(zhuǎn)化概率較小,可能與人工智能芯片研發(fā)難度大、對轉(zhuǎn)化過程情境要求較高等因素有關(guān)。
表6 人工智能芯片領(lǐng)域?qū)@晒D(zhuǎn)化概率評估Tab.6 Evaluation of successful patent conversion probability in the field of artificial intelligence chip
圖4 人工智能芯片領(lǐng)域?qū)@赊D(zhuǎn)化概率分布趨勢Fig.4 Trend of patent convertible probability distribution in artificial intelligence chip field
3.5.1 創(chuàng)新主體層面
本文從高校/科研機(jī)構(gòu)、企業(yè)等不同主題層面對專利轉(zhuǎn)化影響因素進(jìn)行對比分析。通過收集5 958條學(xué)校專利和17 848條企業(yè)專利數(shù)據(jù)集,對專利特征重要性與可轉(zhuǎn)化概率進(jìn)行比較,結(jié)果如表7和表8所示。從中可以看出,影響高校/科研機(jī)構(gòu)、企業(yè)專利成功轉(zhuǎn)化的因素大致相同,但重要性略有不同。具體而言,對高校/科研機(jī)構(gòu)影響最大的前3個因素分別是維持時間、權(quán)利要求字符數(shù)和發(fā)明人數(shù)量,對企業(yè)影響最大的前3個因素分別是權(quán)利要求字符數(shù)、維持時間和權(quán)利要求數(shù)。導(dǎo)致這一差異的原因在于,高校教師和科研人員通常是為完成科研任務(wù)或?qū)W科評估指標(biāo)而非基于市場需求申請專利,因而不太關(guān)注高價值專利維持時間,導(dǎo)致專利維持時間指標(biāo)表征專利質(zhì)量的自然度更高。發(fā)明人數(shù)量說明高校/科研機(jī)構(gòu)在人工智能芯片領(lǐng)域更側(cè)重于專利團(tuán)隊合作。同時,高校和企業(yè)在人工智能芯片領(lǐng)域均應(yīng)注重專利本身的技術(shù)質(zhì)量和撰寫質(zhì)量。由圖5可知,企業(yè)高質(zhì)量專利和低質(zhì)量專利比例均高于學(xué)校,學(xué)校專利可轉(zhuǎn)化概率在中間段數(shù)量集聚較多,更符合正態(tài)曲線分布。
表7 高校/科研機(jī)構(gòu)、企業(yè)專利成功轉(zhuǎn)化影響因素對比Tab.7 Comparison of influencing factors of successful patent transformation between universities / scientific research institutions and enterprises
表8 企業(yè)與高校專利轉(zhuǎn)化概率對比Tab.8 Statistical table of patent transformation probability of enterprises and schools
圖5 企業(yè)與高校/科研機(jī)構(gòu)專利轉(zhuǎn)化概率對比Fig.5 Comparative statistical chart of patent conversion probability of enterprises and universities / scientific research institutions
3.5.2 國際與國內(nèi)層面
本文進(jìn)一步分析影響國際和國內(nèi)專利轉(zhuǎn)化的不同因素,通過構(gòu)建專利數(shù)據(jù)模型得到如表9所示的國際和國內(nèi)專利成功轉(zhuǎn)化影響因素對比結(jié)果。從中可見,影響國外和國內(nèi)專利成功轉(zhuǎn)化的影響因素有所不同。其中,影響我國專利成功轉(zhuǎn)化的前5個因素分別為權(quán)利要求字符數(shù)、維持時間、權(quán)利要求數(shù)、發(fā)明人數(shù)量和引用專利數(shù),前3項(xiàng)權(quán)利要求字符數(shù)、維持時間和權(quán)利要求數(shù)重要性合計超過56%,說明影響我國專利成功轉(zhuǎn)化的因素主要為專利質(zhì)量。影響國外專利成功轉(zhuǎn)化的前5個因素分別為發(fā)明人數(shù)量、權(quán)利要求字符數(shù)、同族專利數(shù)、權(quán)利要求數(shù)和當(dāng)前是否有效。其中,發(fā)明人數(shù)量、權(quán)利要求字符數(shù)和同族專利數(shù)重要性合計超過47%,可見在影響國外專利成功轉(zhuǎn)化的因素中,技術(shù)復(fù)雜性、專利質(zhì)量和全球?qū)@季智闆r發(fā)揮重要作用,這可能與美、日、韓、歐州等主要發(fā)達(dá)國家或地區(qū)專利質(zhì)量較高有關(guān),技術(shù)復(fù)雜性和海外市場布局等因素變得尤為重要。
表9 國際與國內(nèi)專利成功轉(zhuǎn)化影響因素對比Tab.9 Comparison of influencing factors of successful transformation of international and domestic patents
本研究基于多維視角,采用多種算法對人工智能芯片領(lǐng)域主要國家/地區(qū)的專利轉(zhuǎn)化特征進(jìn)行分析,并對該領(lǐng)域?qū)@夹g(shù)的成功轉(zhuǎn)化進(jìn)行預(yù)測,得出如下結(jié)論:①采用降維處理和主成分分析法進(jìn)一步聚焦專利技術(shù)轉(zhuǎn)化影響因素,在選取的邏輯回歸算法、支持向量機(jī)算法、隨機(jī)森林算法和AdaBoost 4種算法中,隨機(jī)森林算法預(yù)測效果最好;②人工智能芯片領(lǐng)域?qū)@D(zhuǎn)化概率呈對數(shù)曲線分布態(tài)勢,與通常所說的專利價值分布曲線相吻合;對高校/科研機(jī)構(gòu)專利轉(zhuǎn)化影響最大的前3個因素分別是維持時間、權(quán)利要求字符數(shù)和發(fā)明人數(shù)量,對企業(yè)專利轉(zhuǎn)化影響最大的前3個因素分別是權(quán)利要求字符數(shù)、維持時間和權(quán)利要求數(shù);③影響國外和國內(nèi)專利成功轉(zhuǎn)化的因素有所不同。影響中國專利成功轉(zhuǎn)化的因素主要是專利質(zhì)量,影響國外主要國家或地區(qū)專利成功轉(zhuǎn)化的因素主要是專利技術(shù)復(fù)雜性及海外市場布局等。
本文理論貢獻(xiàn)如下:
(1)從專利質(zhì)量分析[31]、價值評估、核心技術(shù)識別等應(yīng)用場景對機(jī)器學(xué)習(xí)算法進(jìn)行拓展,詳細(xì)定義專利的三大特征,將其劃分為技術(shù)指標(biāo)、法律指標(biāo)、經(jīng)濟(jì)指標(biāo),并對每個層面指標(biāo)進(jìn)行詳細(xì)論述。采用定量方法構(gòu)建相關(guān)評價指標(biāo)體系,最終將其綜合為專利特征指標(biāo),將專利質(zhì)量指標(biāo)與專利轉(zhuǎn)化指標(biāo)相結(jié)合,并將其應(yīng)用到特定前沿技術(shù)專利轉(zhuǎn)化領(lǐng)域。
(2)綜合使用邏輯回歸算法、支持向量機(jī)算法、隨機(jī)森林算法以及AdaBoost算法進(jìn)行對比實(shí)驗(yàn),通過對每個決策樹的輸出結(jié)果進(jìn)行平均化處理,從而得到最終分類結(jié)果,并對專利數(shù)據(jù)進(jìn)行離散0/1變量分類預(yù)測任務(wù),以解決不同算法預(yù)測可能產(chǎn)生的過擬合問題。將剔除特征變量后的數(shù)據(jù)集以8∶2的比例隨機(jī)抽取訓(xùn)練集與預(yù)測集,并從技術(shù)、法律和經(jīng)濟(jì)等維度對專利質(zhì)量指標(biāo)進(jìn)行分析,豐富了相關(guān)研究成果[22]。
(3)在現(xiàn)有研究的[7,9]基礎(chǔ)上,從實(shí)施主體層面分析專利轉(zhuǎn)化影響因素,從多維視角進(jìn)行論證,通過構(gòu)建專利數(shù)據(jù)集對專利特征重要性與可轉(zhuǎn)化概率進(jìn)行比較,針對企業(yè)、高校/科研機(jī)構(gòu)等創(chuàng)新主體及國內(nèi)、國外層面進(jìn)行對比分析。結(jié)果發(fā)現(xiàn),影響高校/科研機(jī)構(gòu)和企業(yè)專利成功轉(zhuǎn)化的影響因素大致相同,但重要性略有不同,影響國外和我國專利成功轉(zhuǎn)化的影響因素有所不同,拓展了實(shí)施主體研究范圍。
針對本文研究結(jié)論,為更好地促進(jìn)前沿技術(shù)專利成功轉(zhuǎn)化,提出如下對策建議:
(1)在不同前沿技術(shù)領(lǐng)域均可通過隨機(jī)森林算法等多種機(jī)器學(xué)習(xí)算法進(jìn)行預(yù)測,從而尋找特定技術(shù)領(lǐng)域中影響科技成果(包含但不限于專利)轉(zhuǎn)化的因素,有針對性地對成功進(jìn)行科技成果轉(zhuǎn)化的專利特征進(jìn)行識別與預(yù)測。
(2)高校/科研機(jī)構(gòu)應(yīng)注重高價值專利維持時間和團(tuán)隊合作。高校/科研機(jī)構(gòu)應(yīng)發(fā)揮特定學(xué)科優(yōu)勢,加強(qiáng)與重點(diǎn)企業(yè)之間的合作,通過技術(shù)聯(lián)合攻關(guān)形成高價值專利組合,實(shí)施高價值專利挖掘與培育工程,強(qiáng)化專利全過程管理,從而更好地實(shí)現(xiàn)專利轉(zhuǎn)化。同時,還應(yīng)從制度、機(jī)構(gòu)、人才等方面形成合力,通過成立科技成果轉(zhuǎn)化中心/知識產(chǎn)權(quán)中心、制定或修訂學(xué)校專利轉(zhuǎn)化實(shí)施辦法與細(xì)則、引入專業(yè)知識產(chǎn)權(quán)服務(wù)機(jī)構(gòu)或團(tuán)隊、與第三方切實(shí)加強(qiáng)合作開展專利價值評估等措施,從專利申請、保護(hù)、運(yùn)用與管理等各個環(huán)節(jié)為專利成功轉(zhuǎn)化提供保障。
(3)企業(yè)應(yīng)提升專利技術(shù)質(zhì)量和撰寫質(zhì)量。從政府層面看,企業(yè)應(yīng)充分利用政府的相關(guān)政策,如專利申請優(yōu)先審查、快速審查、各省市高價值專利培育項(xiàng)目、專利導(dǎo)航項(xiàng)目等,結(jié)合自身優(yōu)勢和特點(diǎn),支撐企業(yè)創(chuàng)新發(fā)展。從企業(yè)內(nèi)部看,應(yīng)制定“知識產(chǎn)權(quán)先行”戰(zhàn)略,在研發(fā)初期利用專利分析優(yōu)化核心技術(shù)布局,在撰寫階段重視權(quán)利要求對技術(shù)特征組合與保護(hù)層級的遞進(jìn),在申請階段加強(qiáng)與專利代理人之間的溝通。從外部合作看,應(yīng)積極組建行業(yè)協(xié)會、知識產(chǎn)權(quán)聯(lián)盟,加強(qiáng)產(chǎn)學(xué)研協(xié)作,共同培育高價值專利。
本研究存在如下不足:①受限于數(shù)據(jù)可得性,只選取與專利價值相關(guān)指標(biāo)對人工智能芯片領(lǐng)域?qū)@D(zhuǎn)化預(yù)測和影響因素進(jìn)行研究,未對制度設(shè)計、審查程序等其它影響因素進(jìn)行分析,未來可進(jìn)一步挖掘上述影響因素,提高模型可靠性,同時從專利視角出發(fā),在更加細(xì)分的技術(shù)主題層面對專利成功轉(zhuǎn)化進(jìn)行研究,為推動技術(shù)創(chuàng)新、實(shí)現(xiàn)專利成功轉(zhuǎn)化提供參考依據(jù);②綜合使用邏輯回歸算法、支持向量機(jī)算法、隨機(jī)森林算法及AdaBoost算法,僅從客觀指標(biāo)出發(fā)對評價模型進(jìn)行計算,在實(shí)際專利成果管理中,還可結(jié)合管理人員其它信息,加入主觀評價指標(biāo),提升研究結(jié)論準(zhǔn)確性和指導(dǎo)力;③企業(yè)、高校/科研機(jī)構(gòu)等創(chuàng)新主體的科研能力及產(chǎn)生的大量科技成果未被有效闡釋,未能深入研究各創(chuàng)新主體科技成果轉(zhuǎn)化鏈條。未來可通過高校科技成果信息披露機(jī)制、企業(yè)知識產(chǎn)權(quán)管理標(biāo)準(zhǔn)化流程等途徑,研究科研人員研發(fā)合作模式,賦能技術(shù)開發(fā)效率,為價值評估管理提供方向。