• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于權(quán)利要求語(yǔ)義分析的專利價(jià)值評(píng)估及應(yīng)用研究
    ——以區(qū)塊鏈技術(shù)為例

    2020-08-18 05:56:04李士龍魏鵬濤
    世界科技研究與發(fā)展 2020年2期
    關(guān)鍵詞:區(qū)塊專利數(shù)量

    李士龍 魏鵬濤

    (北京工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京100124)

    今年正值《國(guó)家知識(shí)產(chǎn)權(quán)戰(zhàn)略綱要》實(shí)施第十二周年,這期間中國(guó)在保護(hù)知識(shí)產(chǎn)權(quán)、促進(jìn)創(chuàng)新能力上有了較大的進(jìn)步,根據(jù)聯(lián)合國(guó)世界知識(shí)產(chǎn)權(quán)組織(World Intellectual Property Organization,WIPO)發(fā)布的《2019年全球創(chuàng)新指數(shù)報(bào)告》顯示,中國(guó)排名升至全球第14位,在中等收入經(jīng)濟(jì)體中連續(xù)7年在創(chuàng)新質(zhì)量上居首。專利作為國(guó)家保護(hù)發(fā)明人知識(shí)產(chǎn)權(quán)的有效手段,如何科學(xué)準(zhǔn)確地對(duì)專利價(jià)值進(jìn)行評(píng)估,一方面可以幫助企業(yè)確立技術(shù)競(jìng)爭(zhēng)優(yōu)勢(shì),進(jìn)行戰(zhàn)略部署和指導(dǎo)并購(gòu)策略,另一方面對(duì)于我國(guó)提高專利質(zhì)量和提升專利經(jīng)濟(jì)效益,加速?gòu)漠?dāng)前“知識(shí)產(chǎn)權(quán)大國(guó)”邁向“知識(shí)產(chǎn)權(quán)強(qiáng)國(guó)”至關(guān)重要。

    目前評(píng)價(jià)專利價(jià)值的方法主要集中于從技術(shù)價(jià)值、市場(chǎng)價(jià)值和法律價(jià)值三個(gè)方面構(gòu)建評(píng)價(jià)指標(biāo)體系[1],國(guó)內(nèi)外有學(xué)者在從不同的角度對(duì)評(píng)價(jià)指標(biāo)體系做了探索,如專利特征[2]、商業(yè)化潛力[3]、專利文獻(xiàn)的引用數(shù)量和專利的被引次數(shù)[4]、專利權(quán)人實(shí)力和專利技術(shù)的角度[5]、權(quán)利要求數(shù)、專利家族深度[6]。由于對(duì)于專利價(jià)值的定義標(biāo)準(zhǔn)不同,構(gòu)建評(píng)價(jià)體系指標(biāo)的選取就有所不同,這使得此類方法具有較強(qiáng)的主觀性。

    為了客觀地評(píng)估專利價(jià)值,部分學(xué)者從專利保護(hù)范圍的角度展開研究。專利申請(qǐng)的目的是保護(hù)專利人對(duì)其發(fā)明創(chuàng)造的獨(dú)占權(quán),專利保護(hù)范圍越廣,被侵權(quán)的可能就越大,對(duì)于申請(qǐng)人來(lái)說(shuō),專利保護(hù)范圍應(yīng)當(dāng)盡可能廣泛,但與此同時(shí),專利申請(qǐng)的成本就越高,且越不容易通過(guò)審查[7]。所以專利保護(hù)范圍對(duì)專利價(jià)值至關(guān)重要,已有文獻(xiàn)用經(jīng)驗(yàn)數(shù)據(jù)證實(shí)了專利保護(hù)范圍與專利價(jià)值之間的正相關(guān)關(guān)系[8]。對(duì)專利保護(hù)范圍的衡量也有幾種不同的方法,如獨(dú)立權(quán)利要求的長(zhǎng)度和數(shù)量[9]、首項(xiàng)權(quán)利要求的字?jǐn)?shù)(首項(xiàng)權(quán)利要求的字?jǐn)?shù)越長(zhǎng),定語(yǔ)越多,范圍越?。?0]、國(guó)際專利分類(International Patent Classification,IPC)[8]等等。

    上述文獻(xiàn)都能在一定程度上度量專利保護(hù)范圍,但是專利的具體保護(hù)范圍和法律依據(jù)是通過(guò)權(quán)利要求確立的,雖然也有部分文獻(xiàn)借助語(yǔ)義分析的方法研究專利文本,如借助“主語(yǔ)-行為-賓語(yǔ)”(Subject-Action-Object,SAO)結(jié)構(gòu)的主題模型識(shí)別新興技術(shù)[11]、借助文檔主題生成模型(Latent Dirichlet Allocation,LDA)對(duì)專利主題進(jìn)行分類[12]等,但很少有文獻(xiàn)從專利權(quán)利要求的內(nèi)容出發(fā),借助語(yǔ)義分析的方法,對(duì)專利保護(hù)范圍進(jìn)行衡量,并進(jìn)行相關(guān)專利價(jià)值分析和應(yīng)用研究。本文將以專利的權(quán)利要求為研究對(duì)象,通過(guò)語(yǔ)義分析,測(cè)算專利保護(hù)范圍,分析法律層面上的專利價(jià)值,提出相應(yīng)的對(duì)策建議。

    1 研究設(shè)計(jì)

    為了從權(quán)利要求文本出發(fā),通過(guò)語(yǔ)義分析方法衡量專利保護(hù)范圍,進(jìn)而對(duì)專利價(jià)值進(jìn)行測(cè)算,對(duì)專利進(jìn)行價(jià)值分析。本文提出如下方法,具體步驟見圖1。分為四個(gè)部分,第一步要提取待研究技術(shù)領(lǐng)域的權(quán)利要求文本,結(jié)合相應(yīng)的檢索策略,從專利數(shù)據(jù)庫(kù)中導(dǎo)出待處理的文本;第二步,計(jì)算專利價(jià)值,專利的法律價(jià)值體現(xiàn)在保護(hù)范圍,而權(quán)利要求文本是權(quán)利保護(hù)范圍的法律依據(jù),借助語(yǔ)義分析的方法,對(duì)權(quán)利要求中所界定的專利保護(hù)范圍進(jìn)行測(cè)算,并將其進(jìn)行標(biāo)準(zhǔn)化處理,使其具備可比性,能夠客觀地衡量不同專利的專利價(jià)值;第三步,專利主題分類,在專利價(jià)值指標(biāo)測(cè)算完成之后,需要對(duì)專利進(jìn)行價(jià)值分析和研究,而一般情況下,同一技術(shù)領(lǐng)域的專利數(shù)量太多,專利的內(nèi)容各不相同,不利于客觀規(guī)律的把握和相關(guān)研究的開展,所以需要一種科學(xué)有效的分類方法,對(duì)文本內(nèi)容進(jìn)行分類分析,對(duì)此引入LDA主題模型對(duì)專利文本進(jìn)行主題抽取,得到專利的主題分類;第四步,借助測(cè)算的專利價(jià)值指標(biāo)和專利主題分類進(jìn)行主題-價(jià)值分析和研究。接下來(lái)對(duì)各部分內(nèi)容進(jìn)行詳細(xì)說(shuō)明。

    1.1 專利權(quán)利要求提取

    本文選擇美國(guó)專利局(The United States Patent and Trademark Office,USPTO)進(jìn)行專利檢索,原因有以下兩點(diǎn):1)美國(guó)是全球最大的專利市場(chǎng),提交給美國(guó)專利局的大部分專利也在其他國(guó)家提交;2)美國(guó)專利局?jǐn)?shù)據(jù)庫(kù)組織良好,歷史信息可以追溯到1976年。為此,本文通過(guò)USPTO專利數(shù)據(jù)庫(kù)檢索相關(guān)領(lǐng)域?qū)@瑥亩@取專利所對(duì)應(yīng)的權(quán)利要求范圍。

    1.2 專利保護(hù)范圍測(cè)算

    專利的價(jià)值在于排他性,這種排他性是通過(guò)專利保護(hù)范圍體現(xiàn)的,專利的具體保護(hù)范圍是通過(guò)權(quán)利要求進(jìn)行聲明的,如圖2,其權(quán)利要求文本由若干項(xiàng)權(quán)利要求構(gòu)成,按照從屬關(guān)系分為獨(dú)立權(quán)利要求(如 Claim 1、Claim 13、Claim 19)、單項(xiàng)從屬權(quán)利要求(Claim 3、Claim4等)和多項(xiàng)從屬權(quán)利(Claim 31)要求,其中獨(dú)立權(quán)利要求的數(shù)量越多,保護(hù)的范圍就越廣[9],而從屬權(quán)利要求包含引用部分和限定部分,限定部分越多,保護(hù)范圍就越窄[13](如一種太陽(yáng)能熱水器和一種管道防凍式太陽(yáng)能熱水器)。基于此,本節(jié)對(duì)專利價(jià)值的測(cè)算將借助語(yǔ)義分析方法,對(duì)權(quán)利要求文本進(jìn)行分解,描述權(quán)利要求的引用關(guān)系樹,并計(jì)算依賴度,得到可比的專利保護(hù)范圍指數(shù),進(jìn)而衡量專利價(jià)值。該方法由權(quán)利要求文本分解、權(quán)利要求樹的合成以及權(quán)利要求依賴度三個(gè)步驟組成。

    圖1 方法流程圖Fig.1 Method Flow Chart

    1.2.1 權(quán)利要求文本分解

    一項(xiàng)專利的權(quán)利要求文本包含若干項(xiàng)權(quán)利要求,圖2顯示了其基本結(jié)構(gòu),首先需要按項(xiàng)進(jìn)行抽取,可以看出每項(xiàng)權(quán)利要求的起始位置都是數(shù)字字加“.”作為該項(xiàng)序號(hào),兩個(gè)序號(hào)之間的部分為一項(xiàng)專利要求的文本信息,利用這個(gè)書寫規(guī)則,對(duì)文本進(jìn)行分割,抽取每項(xiàng)權(quán)利要求。其中,有部分權(quán)利要求在審查過(guò)程中被修改,即在文本中該項(xiàng)內(nèi)容為“(Canceled)”,有時(shí)此類文本序號(hào)會(huì)根據(jù)上下文合并,使得排序序號(hào)規(guī)則發(fā)生改變,例如“6.-12.”,在處理的過(guò)程中要考慮到此類特殊情況,并將其清洗。

    圖2 專利號(hào)US20190238340A1的權(quán)利要求文本(部分內(nèi)容省略)[14]Fig.2 The Claim of Patent US20190238340A1(Partially Omitted)[14]

    1.2.2 權(quán)利要求引用關(guān)系樹合成

    根據(jù)處理好的各項(xiàng)權(quán)利要求文本合成引用關(guān)系樹,需要識(shí)別各項(xiàng)文本的類別及引用關(guān)系。

    首先識(shí)別文本類型,有以下三種情況:

    1)單項(xiàng)從屬權(quán)利要求,即該項(xiàng)文本中引用了其他權(quán)利要求,引用次數(shù)有且僅有1次。在具體識(shí)別時(shí),當(dāng)出現(xiàn)“according to claim”加數(shù)字序號(hào)等文本組合時(shí),即代表該項(xiàng)權(quán)利要求存在引用,參考相關(guān)文獻(xiàn)并結(jié)合實(shí)際情況對(duì)該類文本組合進(jìn)行歸納總結(jié)[13],利用圖3中的正則表達(dá)式進(jìn)行識(shí)別,并記錄所引用權(quán)利要求的序號(hào)。

    2)多項(xiàng)從屬權(quán)利要求,即該項(xiàng)文本中引用了其他權(quán)利要求,與單項(xiàng)從屬權(quán)利要求的不同點(diǎn)在于,引用次數(shù)大于1次。Wittfoth認(rèn)為多項(xiàng)從屬權(quán)利要求對(duì)專利保護(hù)范圍的貢獻(xiàn)程度跟獨(dú)立從屬權(quán)利要求相似[15]?!秾@麑徖碇改希?012)》(Office Patent Trial Practice Guide)規(guī)定從屬權(quán)利要求在引用時(shí)要服從“多項(xiàng)不引”原則,在分析引用關(guān)系時(shí),將多項(xiàng)從屬權(quán)利要求與獨(dú)立從屬權(quán)利要求都?xì)w于0級(jí)。

    3)獨(dú)立權(quán)利要求,即該項(xiàng)文本中未出現(xiàn)引用其他權(quán)利要求的情況。

    其次,確定各項(xiàng)權(quán)利要求之間的引用關(guān)系。根據(jù)權(quán)利要求的“前向引用”原則,按照序號(hào),從小到大向后查找引用關(guān)系,按照引用的先后次序,將分為一級(jí)、二級(jí)權(quán)利要求,以圖2中的權(quán)利要求為例,得到如下引用關(guān)系和引用關(guān)系層級(jí)。

    圖3 引用關(guān)系識(shí)別的正則表達(dá)式Fig.3 Regular Expressions for Reference Recognition

    圖4 專利號(hào)US20190238340A1的權(quán)利要求引用關(guān)系Fig.4 Patent US20190238340A1 Claims Reference Relationship

    表1 專利號(hào)US20190238340A1的權(quán)利要求引用關(guān)系層級(jí)Tab.1 Patent US20190238340A1 Claims Reference Relationship Level

    1.2.3 權(quán)利要求依賴度計(jì)算

    在得到各項(xiàng)權(quán)利要求引用關(guān)系之后,接下來(lái)將計(jì)算權(quán)利要求的依賴度。從屬權(quán)利要求越多、引用層級(jí)越多,專利保護(hù)范圍就越窄,參考Wittfoth的方法,用依賴度衡量專利保護(hù)范圍,并進(jìn)行標(biāo)準(zhǔn)化處理,計(jì)算專利價(jià)值。具體計(jì)算公式如下:

    其中,D表示依賴度,Cn表示第n級(jí)從屬權(quán)利要求,Count(Cn)表示 n級(jí)權(quán)利要求的個(gè)數(shù),Count(C)表示總數(shù)。該公式表明,引用層級(jí)越多,賦權(quán)越大,依賴度就越大,專利保護(hù)范圍就越窄。

    以圖4中的專利US20190238340A1為例,其依賴度D=1.0625,對(duì)于一個(gè)有三層級(jí)引用關(guān)系的權(quán)利要求,Patent1是最小專利保護(hù)范圍的權(quán)利要求引用結(jié)構(gòu),其依賴度為Dmin=(0×1+1×1+2×1)/3=1,Patent2是最大專利保護(hù)范圍的權(quán)利要求引用結(jié)構(gòu),其依賴度為Dmax=(0×3)/3=0。

    由于專利的法律價(jià)值在于其專利保護(hù)范圍,而專利保護(hù)范圍是由專利的權(quán)利要求文本作為法律依據(jù)進(jìn)行確定的,所以衡量專利保護(hù)范圍就可以對(duì)專利的專利價(jià)值進(jìn)行測(cè)算。上述依賴度雖然可以測(cè)算某專利的專利保護(hù)范圍的大小,但其存在一個(gè)缺點(diǎn),對(duì)于不同權(quán)利要求項(xiàng)數(shù)的專利無(wú)法進(jìn)行對(duì)比,為了比較不同權(quán)利要求數(shù)量的專利之間的專利價(jià)值,本文參考了Wittfoth的方法,用如下公式進(jìn)行標(biāo)準(zhǔn)化處理,得到專利價(jià)值指標(biāo)V。

    借助專利價(jià)值V,可以計(jì)算不同權(quán)利要求引用結(jié)構(gòu)的專利價(jià)值,在充分考慮了權(quán)利要求數(shù)量和引用層級(jí)對(duì)專利保護(hù)范圍影響的前提下,使其具有可比性,為專利價(jià)值分析提供了客觀方法。

    1.3 LDA主題模型分析

    在計(jì)算完某一領(lǐng)域內(nèi)所有專利的專利價(jià)值之后,接下來(lái)要對(duì)其進(jìn)行價(jià)值分析,而一個(gè)領(lǐng)域內(nèi)的專利往往數(shù)量較多,且技術(shù)主題各有不同,這就需要對(duì)專利進(jìn)行分類,來(lái)更加直觀和科學(xué)地進(jìn)行專利價(jià)值分析。而LDA主題模型是一種用來(lái)識(shí)別大規(guī)模文檔中主題信息的機(jī)器學(xué)習(xí)方法,能夠識(shí)別文本的主題,實(shí)現(xiàn)專利主題提取的功能。該方法有三層架構(gòu),包括詞、主題和文檔[16]。具體算法步驟如下:

    1)文本預(yù)處理。在之前語(yǔ)義分析的基礎(chǔ)上,對(duì)權(quán)利要求文本進(jìn)行處理、清洗,主要包括統(tǒng)一單復(fù)數(shù)、去除標(biāo)點(diǎn)符號(hào)、數(shù)詞和停用詞等。

    2)確定主題數(shù)。采用困惑度指數(shù)(Perplexity)確定最優(yōu)的主題數(shù)[17]。

    3)提取主題和特征詞。使用模型計(jì)算“文檔—主題”矩陣、“主題—詞”矩陣,獲得特征詞以及文檔在各主題上的概率分布,選擇概率值較大的前10個(gè)特征詞,結(jié)合相關(guān)技術(shù)資料進(jìn)行主題標(biāo)注。

    4)結(jié)合專利價(jià)值進(jìn)行主題分析。對(duì)不同主題的專利進(jìn)行價(jià)值分析。

    借助上述算法,可以有效的對(duì)某一技術(shù)領(lǐng)域內(nèi)的專利按主題進(jìn)行分類,從主題的維度進(jìn)行專利價(jià)值分析,可以更好的把握專利的價(jià)值分布和主題-價(jià)值分析。

    2 實(shí)證分析

    本文以區(qū)塊鏈技術(shù)(Blockchain technology)為例,借助權(quán)利要求語(yǔ)義分析的研究方法,分析區(qū)塊鏈專利現(xiàn)階段研究方向以及專利價(jià)值分布。區(qū)塊鏈技術(shù)是一項(xiàng)在科學(xué)研究、科技創(chuàng)新、供應(yīng)鏈金融科技以及投資應(yīng)用方面具有遠(yuǎn)大前景的技術(shù)之一[18],2019年10月,習(xí)近平總書記在中央政治局第十八次集體學(xué)習(xí)時(shí)強(qiáng)調(diào),“把區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新重要突破口,加快推動(dòng)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展”,借助專利價(jià)值分析,研究區(qū)塊鏈技術(shù)現(xiàn)階段的發(fā)展?fàn)顩r,對(duì)中國(guó)區(qū)塊鏈技術(shù)創(chuàng)新和商業(yè)應(yīng)用有一定的現(xiàn)實(shí)意義。

    2.1 數(shù)據(jù)來(lái)源及說(shuō)明

    首先確定待檢索專利的檢索表達(dá)式。通過(guò)查閱文獻(xiàn)與研究成果[19],嘗試?yán)藐P(guān)鍵詞匹配方法進(jìn)行檢索,結(jié)合檢索準(zhǔn)確性原則,將 TS=(“blockchain”)作為檢索策略的表達(dá)式,檢索日期為2019年10月,從USPTO數(shù)據(jù)庫(kù)中共導(dǎo)出1693項(xiàng)專利。

    從申請(qǐng)專利數(shù)量來(lái)看,區(qū)塊鏈技術(shù)更多集中于擁有區(qū)塊鏈技術(shù)數(shù)量最多的前十大專利權(quán)人,表2說(shuō)明,IBM持有的區(qū)塊鏈專利數(shù)量最多,占全部專利數(shù)量的11.28%,其次為阿里巴巴集團(tuán),持有101件專利,占整體的5.97%,從國(guó)別來(lái)看,美國(guó)企業(yè)的區(qū)塊鏈專利申請(qǐng)數(shù)量較多,除此之外,還有中國(guó)、韓國(guó)、英國(guó)的企業(yè)排名靠前。

    表2 前十大專利權(quán)人情況Tab.2 The Top Ten Patentees

    2.2 區(qū)塊鏈專利價(jià)值計(jì)算

    根據(jù)上述權(quán)利要求文本處理方法,對(duì)權(quán)利要求進(jìn)行分解并分析權(quán)利要求引用關(guān)系。圖5繪制了專利權(quán)利要求數(shù)分布的直方圖,橫軸代表權(quán)利要求數(shù)的分布區(qū)間,縱軸代表區(qū)間包含的專利數(shù)量,根據(jù)圖5可以看出,權(quán)利要求數(shù)小于等于20項(xiàng)的有1328個(gè),占樣本總數(shù)的78.4%,其中權(quán)利要求數(shù)為20項(xiàng)的專利最多,有833個(gè),占樣本總數(shù)的50%。根據(jù)美國(guó)專利局的收費(fèi)標(biāo)準(zhǔn),超過(guò)20項(xiàng)權(quán)利要求需要額外收取每項(xiàng)80美元的費(fèi)用,這也在一定程度上說(shuō)明,專利申請(qǐng)人為了使專利價(jià)值最大化,會(huì)在不超過(guò)額外收費(fèi)標(biāo)準(zhǔn)的前提下盡可能多的增加權(quán)利要求的數(shù)量。

    根據(jù)專利要求引用關(guān)系計(jì)算權(quán)利價(jià)值。圖6顯示了不同價(jià)值區(qū)間的專利數(shù)量分布情況,橫軸為專利價(jià)值區(qū)間,縱軸為專利數(shù)量,圖像表明,專利價(jià)值較為集中在[0.62,0.88]區(qū)間,由于前10%的專利最具影響力[20],且一個(gè)技術(shù)領(lǐng)域內(nèi)的專利價(jià)值更多集中在前10%的專利中[10],選取專利價(jià)值前10%作為高價(jià)值專利,其專利價(jià)值大于0.88,數(shù)量為174件。

    圖5 權(quán)利要求數(shù)分布直方圖Fig.5 Distribution Histogram of Claims

    2.3 區(qū)塊鏈專利價(jià)值應(yīng)用研究

    2.3.1 專利主題分類

    在計(jì)算完區(qū)塊鏈領(lǐng)域?qū)@麅r(jià)值之后,接下來(lái)要對(duì)其進(jìn)行價(jià)值分析,而一個(gè)領(lǐng)域內(nèi)的專利往往數(shù)量較多,且技術(shù)主題各有不同,這就需要對(duì)專利進(jìn)行分類,來(lái)更加直觀和科學(xué)地進(jìn)行專利價(jià)值分析。本節(jié)內(nèi)容將借助LDA主題模型,對(duì)專利權(quán)利要求文本進(jìn)行分析,結(jié)合區(qū)塊鏈領(lǐng)域的相關(guān)資料,對(duì)專利按照技術(shù)領(lǐng)域進(jìn)行主題分類。

    圖6 專利價(jià)值分布直方圖Fig.6 Histogram of Patent Value Distribution

    參考區(qū)塊鏈現(xiàn)有資料和相關(guān)文獻(xiàn)[21,22],根據(jù)技術(shù)層級(jí)確定區(qū)塊鏈技術(shù)分布領(lǐng)域,主要分為協(xié)議層、擴(kuò)展層與應(yīng)用層(表3)。其中,協(xié)議層是區(qū)塊鏈的底層技術(shù),是一切的基礎(chǔ),負(fù)責(zé)通過(guò)數(shù)據(jù)存儲(chǔ)以及網(wǎng)絡(luò)構(gòu)架實(shí)現(xiàn)去中心化交易、搭建通道、構(gòu)建網(wǎng)絡(luò)環(huán)境,其技術(shù)特征詞主要涉及算法、數(shù)據(jù)領(lǐng)域;擴(kuò)展層是使區(qū)塊鏈向某些領(lǐng)域擴(kuò)展的技術(shù),其開發(fā)目的是使區(qū)塊鏈更實(shí)用,目前較為普遍的方向主要是兩個(gè),一是利用區(qū)塊鏈跨鏈、側(cè)鏈、多鏈的技術(shù)特征,開發(fā)的智能合約技術(shù),二是與交易清算系統(tǒng)結(jié)合,開發(fā)的交易支付技術(shù);應(yīng)用層是服務(wù)于具體應(yīng)用場(chǎng)景的技術(shù),目前主要集中于數(shù)字貨幣以及安全認(rèn)證領(lǐng)域。

    在使用LDA模型抽取主題之前,需要確定抽取的主題數(shù)量,如果主題數(shù)量太少會(huì)導(dǎo)致主題的辨識(shí)程度不高,為了解決這個(gè)問(wèn)題,Blei和Jordan(2003)采用困惑度來(lái)確定模型的最優(yōu)主題數(shù)[17],困惑度是用來(lái)評(píng)價(jià)語(yǔ)言模型預(yù)測(cè)結(jié)果優(yōu)劣程度的指標(biāo),通過(guò)對(duì)比訓(xùn)練好的模型在測(cè)試集上的概率,判斷模型的優(yōu)劣程度,困惑度越小,概率越大,模型的預(yù)測(cè)結(jié)果越準(zhǔn)確。對(duì)樣本不同主題數(shù)下的困惑度進(jìn)行計(jì)算并將結(jié)果通過(guò)折線圖的形式呈現(xiàn),如圖7。圖片顯示,主題數(shù)為6時(shí)出現(xiàn)明顯拐點(diǎn),之后走勢(shì)趨于平緩,結(jié)合區(qū)塊鏈技術(shù)領(lǐng)域分布情況,確定最優(yōu)主題數(shù)目為6。

    表3 當(dāng)前區(qū)塊鏈技術(shù)領(lǐng)域Tab.3 Blockchain Technology Field

    利用LDA對(duì)區(qū)塊鏈專利權(quán)利要求進(jìn)行主題抽取,將各個(gè)主題出現(xiàn)概率前十的特征詞進(jìn)行分析,并結(jié)合區(qū)塊鏈技術(shù)當(dāng)前發(fā)展情況對(duì)主題進(jìn)行標(biāo)注,結(jié)果如表4所示。經(jīng)過(guò)LDA主題模型分析之后,將本文選取的區(qū)塊鏈技術(shù)專利樣本劃分為了六大主題,接下來(lái)將結(jié)合專利價(jià)值進(jìn)行區(qū)塊鏈技術(shù)主題與專利價(jià)值組合分析。

    圖7 專利困惑度折線圖Fig.7 Patent Confusion Line Graph

    表4 區(qū)塊鏈技術(shù)“主題—特征詞”Tab.4 The Theme-Feature Words of Blockchain Technology

    2.3.2 區(qū)塊鏈技術(shù)主題與專利價(jià)值組合分析

    通過(guò)LDA主題模型對(duì)區(qū)塊鏈技術(shù)主題和專利價(jià)值進(jìn)行組合分析,一方面可以了解不同技術(shù)主題下的專利價(jià)值分布情況;另一方面可以明確不同專利權(quán)人區(qū)塊鏈技術(shù)的競(jìng)爭(zhēng)地位,根據(jù)分析結(jié)果,從而為國(guó)家和企業(yè)層面就如何發(fā)展我國(guó)區(qū)塊鏈技術(shù)提出相應(yīng)的建議。

    圖8 不同技術(shù)主題的區(qū)塊鏈專利數(shù)量與專利質(zhì)量對(duì)比分布圖Fig.8 Distribution Map of Patent Quantity and Quality of Blockchain in Different Technical Topics

    根據(jù)圖8,從專利數(shù)量來(lái)看,數(shù)據(jù)存儲(chǔ)領(lǐng)域的專利數(shù)量最多,高達(dá)383件,安全認(rèn)證領(lǐng)域?qū)@麛?shù)量最少,在智能合約、虛擬貨幣、交易支付和網(wǎng)絡(luò)構(gòu)架四個(gè)領(lǐng)域的專利數(shù)量比較接近;從專利價(jià)值來(lái)看,數(shù)據(jù)存儲(chǔ)領(lǐng)域的專利價(jià)值最高,高達(dá)0.72,網(wǎng)絡(luò)架構(gòu)專利價(jià)值最低,在智能合約、虛擬貨幣、交易支付和安全認(rèn)證的專利價(jià)值比較接近。從整體上來(lái)看,數(shù)據(jù)存儲(chǔ)領(lǐng)域的專利數(shù)量和專利價(jià)值都高于其他領(lǐng)域,在網(wǎng)絡(luò)構(gòu)架領(lǐng)域的專利價(jià)值較低,相關(guān)企業(yè)還需進(jìn)一步在這個(gè)領(lǐng)域提升專利價(jià)值。

    為了進(jìn)一步分析高價(jià)值專利主題分布,由于最具有價(jià)值的專利只占少數(shù),在此對(duì)專利價(jià)值進(jìn)行排序,觀察前10%的高價(jià)值專利。圖9顯示了區(qū)塊鏈技術(shù)高價(jià)值專利主題分布情況,結(jié)果表明,數(shù)據(jù)存儲(chǔ)領(lǐng)域?qū)@麛?shù)量占高價(jià)值專利的比例最大,且與全樣本進(jìn)行對(duì)比,該比例有所上升,說(shuō)明價(jià)值較高的專利更多集中在數(shù)據(jù)存儲(chǔ)領(lǐng)域,而交易支付領(lǐng)域在價(jià)值較高的專利中的數(shù)量最少,且與全樣本相比在高價(jià)值專利樣本中比例有所下降。

    圖9 區(qū)塊鏈專利主題分布Fig.9 Blockchain Patent Subject Distribution

    圖10為前十大專利權(quán)人的綜合競(jìng)爭(zhēng)地位分布圖,由圖可知,IBM的專利數(shù)量最多為191件,但是專利價(jià)值偏低,平均專利價(jià)值為0.69,Coin-Plug和英特爾的專利數(shù)量較少,但其專利平均價(jià)值最高為0.789和0.786,而阿里巴巴在區(qū)塊鏈領(lǐng)域雖然專利數(shù)量排名第二,但是平均專利價(jià)值最低,為0.67。根據(jù)綜合競(jìng)爭(zhēng)地位分布圖,可以將前十大專利權(quán)人分為三個(gè)組別:高價(jià)值組,有CoinPlug、英特爾、nChain、思科,其特點(diǎn)為專利數(shù)量較少,但專利價(jià)值較高;高數(shù)量組,有IBM、阿里巴巴,雖然專利數(shù)量較多,但是專利價(jià)值較低;均衡組,有埃森哲、萬(wàn)事達(dá)卡、美國(guó)銀行、沃爾瑪,其專利數(shù)量和專利價(jià)值均處于中等水平。

    圖10 前十大專利權(quán)人的綜合競(jìng)爭(zhēng)地位分布圖Fig.10 Distribution Map of The Comprehensive Competitive Status of the Top Ten Patentees

    3 結(jié)論與展望

    本文提出了基于權(quán)利要求語(yǔ)義分析和LDA主題模型的專利價(jià)值測(cè)算方法及分析框架,以USPTO專利數(shù)據(jù)庫(kù)中的區(qū)塊鏈專利為研究對(duì)象,對(duì)高價(jià)值區(qū)塊鏈專利分布情況、不同技術(shù)領(lǐng)域的專利價(jià)值分布和不同專利權(quán)人的綜合競(jìng)爭(zhēng)地位進(jìn)行了分析,通過(guò)上述分析,可以得到如下結(jié)論,就我國(guó)如何發(fā)展和布局區(qū)塊鏈技術(shù)提出相應(yīng)的對(duì)策建議。

    1)通過(guò)分析各個(gè)主題專利價(jià)值分布,發(fā)現(xiàn)數(shù)據(jù)存儲(chǔ)領(lǐng)域的專利價(jià)值最高,專利數(shù)量最多,網(wǎng)絡(luò)構(gòu)架領(lǐng)域?qū)@麅r(jià)值最小。由于區(qū)塊鏈本質(zhì)上是一個(gè)去中心化的數(shù)據(jù)庫(kù),而當(dāng)前的熱點(diǎn)技術(shù)無(wú)論是5G技術(shù)、物聯(lián)網(wǎng)還是共享經(jīng)濟(jì)等,都離不開海量數(shù)據(jù)的傳輸與處理,這使得在當(dāng)前信息時(shí)代下,數(shù)據(jù)存儲(chǔ)技術(shù)成為研究和應(yīng)用的核心,這與本文通過(guò)對(duì)區(qū)塊鏈專利權(quán)利要求進(jìn)行語(yǔ)義分析得出的結(jié)論一致,對(duì)于企業(yè)決策者來(lái)說(shuō),要重點(diǎn)關(guān)注區(qū)塊鏈數(shù)據(jù)存儲(chǔ)領(lǐng)域,加強(qiáng)區(qū)塊鏈技術(shù)領(lǐng)域的研發(fā)投入,提升國(guó)際核心競(jìng)爭(zhēng)力,全面推進(jìn)研究成果轉(zhuǎn)化為專利技術(shù),把握技術(shù)發(fā)展前沿,占據(jù)創(chuàng)新制高點(diǎn)。

    2)從國(guó)家分布來(lái)看,前十大專利權(quán)人屬地主要集中在美國(guó),有七家公司,其余三家分別屬于中國(guó)、英國(guó)、韓國(guó)。通過(guò)分析不同專利權(quán)人的專利價(jià)值分布,可以將前十大專利權(quán)人分為三組:高價(jià)值組、高數(shù)量組、均衡組,其中專利數(shù)量較少的nChain、英特爾,其專利價(jià)值較高,而持有專利數(shù)量較多的IBM和阿里巴巴,其專利平均價(jià)值偏低。我國(guó)在加快推進(jìn)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展的過(guò)程中,一方面要培育一批區(qū)塊鏈骨干企業(yè)和研發(fā)機(jī)構(gòu),發(fā)揮引領(lǐng)和帶頭作用,掌握國(guó)際競(jìng)爭(zhēng)話語(yǔ)權(quán);另一方面要注重引導(dǎo)企業(yè)對(duì)于高價(jià)值專利的研發(fā)投入,從以量取勝向質(zhì)量兼?zhèn)滢D(zhuǎn)變。由于企業(yè)是市場(chǎng)競(jìng)爭(zhēng)的直接參與者,國(guó)家層面要研究激勵(lì)區(qū)塊鏈企業(yè)的相關(guān)政策,以阿里巴巴等優(yōu)質(zhì)企業(yè)作為領(lǐng)頭羊,培養(yǎng)區(qū)塊鏈企業(yè)在國(guó)際上的競(jìng)爭(zhēng)力,力爭(zhēng)占領(lǐng)區(qū)塊鏈技術(shù)的科技制高點(diǎn)。

    本文提出的專利價(jià)值計(jì)算方法和分析框架,能客觀有效地對(duì)一個(gè)領(lǐng)域的專利價(jià)值進(jìn)行評(píng)估和分析,但是仍存在一定的不足之處,由于只對(duì)英文專利文獻(xiàn)進(jìn)行了分析,沒(méi)有分析中文專利,使得分析樣本不夠全面,接下來(lái)需要對(duì)如何分析中文權(quán)利要求進(jìn)行探索,豐富現(xiàn)有研究框架。

    猜你喜歡
    區(qū)塊專利數(shù)量
    專利
    區(qū)塊鏈:一個(gè)改變未來(lái)的幽靈
    科學(xué)(2020年5期)2020-11-26 08:19:12
    區(qū)塊鏈:主要角色和衍生應(yīng)用
    科學(xué)(2020年6期)2020-02-06 08:59:56
    發(fā)明與專利
    傳感器世界(2019年4期)2019-06-26 09:58:44
    統(tǒng)一數(shù)量再比較
    區(qū)塊鏈+媒體業(yè)的N種可能
    讀懂區(qū)塊鏈
    頭發(fā)的數(shù)量
    我國(guó)博物館數(shù)量達(dá)4510家
    專利
    枝江市| 镶黄旗| 肥西县| 营口市| 铜梁县| 金乡县| 高安市| 新巴尔虎右旗| 阳朔县| 诏安县| 莱州市| 沙湾县| 固阳县| 水富县| 潮安县| 德安县| 尼玛县| 珠海市| 左贡县| 临澧县| 铜鼓县| 宁阳县| 洱源县| 阿拉善盟| 仁怀市| 乡宁县| 武宣县| 卢氏县| 嘉荫县| 海兴县| 宜丰县| 新宾| 湾仔区| 拜泉县| 富裕县| 江口县| 景泰县| 年辖:市辖区| 海盐县| 昌乐县| 沙坪坝区|