摘 要:[目的/意義]顛覆性和延續(xù)性創(chuàng)新專利在標(biāo)題用詞上有差異嗎?它們各自偏向使用哪些詞呢?這些詞在特征上有哪些不同?[方法/過程]針對這些問題,本文選取分子生物學(xué)與微生物學(xué)領(lǐng)域的專利,首先使用D指數(shù)將專利劃分為顛覆性創(chuàng)新和延續(xù)性創(chuàng)新兩類,然后通過詞頻比較、共現(xiàn)圖展示兩類專利在標(biāo)題高頻用詞上的差異性,最后提出創(chuàng)新類型度量值來度量每個標(biāo)題詞的創(chuàng)新性,并遴選區(qū)分性較大的研究主題詞和寫作風(fēng)格詞。[結(jié)果/結(jié)論]研究表明,顛覆性和延續(xù)性創(chuàng)新專利在標(biāo)題用詞上存在顯著的差異,延續(xù)性創(chuàng)新專利常用 “Detection”和“with”等具有逐步改進、進一步發(fā)現(xiàn)傾向的詞,并多將“Methods”和“Compositions”一起使用;顛覆性創(chuàng)新專利標(biāo)題常用 “Human”等一些新興、新穎詞匯,并多將 “Methods”和“Producing”一起使用;此外,創(chuàng)新類型度量值能夠很好地遴選出兩類專利標(biāo)題中創(chuàng)新性差異較大的研究主題詞和寫作風(fēng)格詞。
關(guān)鍵詞:顛覆性創(chuàng)新;延續(xù)性創(chuàng)新;創(chuàng)新類型度量值;標(biāo)題詞差異性
DOI:10.3969/j.issn.1008-0821.2025.08.007
〔中圖分類號〕G250.2;G254 〔文獻標(biāo)識碼〕A 〔文章編號〕1008-0821(2025)08-0085-11
Is There Any Difference in Title Terms Between Continuing and
Disruptive Innovation Patents?
Liu Xiang Liu Xiang
(School of Information Management,Central China Normal University,Wuhan 430079,China)
Abstract:[Purpose/Significance]Is there any difference in title terms between disruptive and continuing innovation patents?What words do they prefer?What are the differences about characteristics between these words?[Method/Process]To solve these problems,this paper selected patents in the field of molecular biology and microbiology.First,the study divided the patents into continuous and disruptive types by using D index,and then displayed two patents of the difference of high frequency words in the title by comparing word frequency,the co-occurrence graph,at last,put forward the innovation type measurement to measure each of the headings of innovative and selection process to distinguish the larger research subject and writing style.[Result/Conclusion]The research shows that there are significant differences between disruptive and continuous innovation patents in terms of title words.Continuous innovation patents often use words with the tendency of gradual improvement and further discovery,such as“Detection”and“with”,and often use“Methods”and“motivation”together.The title of disruptive innovation patent is commonly used with some emerging and novel words such as“Human”,and“Methods”and“Producing”are often used together.In addition,the innovation type metric can well select the research subject words and writing style words with great innovation difference between the two types of patent titles.
Key words:disruptive innovation;continuous innovation;Innovation type metric value;differences in title words
習(xí)近平總書記指出,創(chuàng)新是“民族進步的靈魂”,創(chuàng)新能力是支持一個國家發(fā)展和競爭力的關(guān)鍵因素。專利作為科技研究的重要成果,被認(rèn)為是創(chuàng)新的主要載體[1]。據(jù)世界知識產(chǎn)權(quán)組織統(tǒng)計,世界上90%~95%的重要發(fā)明創(chuàng)造和科技成果最早在專利文獻進行發(fā)表[2]。當(dāng)前,世界大國政治和科技競爭加劇,全球產(chǎn)業(yè)和供應(yīng)鏈面臨深度調(diào)整。準(zhǔn)確的識別發(fā)明創(chuàng)造的創(chuàng)新類型、評估其創(chuàng)新效能對于國家、企業(yè)都是一個重要的話題。顛覆性創(chuàng)新專利是那些與傳統(tǒng)的技術(shù)路線和方法截然不同的一類發(fā)明創(chuàng)造[3-5],這類發(fā)明創(chuàng)造對于技術(shù)和產(chǎn)業(yè)的換代升級具有重要的作用,而要將這些重要的專利從浩繁的文獻之中識別出來卻并不容易。
2019年,Nature上的一項研究提到,顛覆性創(chuàng)新文獻的標(biāo)題中常用“Change”“Technique”“Why”等詞,而延續(xù)性創(chuàng)新文獻標(biāo)題中常使用“Endorse”“Theory”“Across”等詞[6]。然而,對顛覆性創(chuàng)新和延續(xù)性創(chuàng)新專利在標(biāo)題用詞上的具體差異沒有深入探討。本文以專利標(biāo)題詞為研究對象,采用詞頻統(tǒng)計、詞云圖、共現(xiàn)圖對標(biāo)題高頻用詞的差異進行展示,試圖通過高頻詞的差異來區(qū)分顛覆性創(chuàng)新和延續(xù)性創(chuàng)新專利在標(biāo)題用詞上的差異性,得出更加一般性的結(jié)論,并提出標(biāo)題詞的創(chuàng)新類型度量指標(biāo)來遴選區(qū)分度較大的標(biāo)題詞,以發(fā)現(xiàn)顛覆性創(chuàng)新和延續(xù)性創(chuàng)新專利在標(biāo)題用詞上的一般規(guī)律。
1 相關(guān)研究
創(chuàng)新是社會經(jīng)濟進步和機構(gòu)競爭優(yōu)勢的核心組成部分。1942年,Schumpeter J[7]首次提出了顛覆性創(chuàng)新(Creative Destruction)的概念,他認(rèn)為一種理想的競爭環(huán)境是以顛覆性創(chuàng)新為主的,在這種競爭環(huán)境中,那些推動世界走向更大改變的技術(shù)掌握著主要優(yōu)勢。而后,Dosi G等[8]在《技術(shù)范式與技術(shù)軌道》一書中開始對顛覆性創(chuàng)新的相關(guān)理論進行深入探索,建立了關(guān)于延續(xù)性和顛覆性技術(shù)創(chuàng)新的統(tǒng)一理論框架。Foster R N[9]也基于技術(shù)發(fā)展的視角,提出了與Dosi G等[8]類似的觀點,他認(rèn)為不同技術(shù)發(fā)展軌跡之間存在間隙,代表了技術(shù)發(fā)展的不連續(xù)性,即原技術(shù)被替代的過程。基于此,以不延續(xù)性、變革性為核心的創(chuàng)新的二元分類模式——顛覆性創(chuàng)新與延續(xù)性創(chuàng)新受到了廣泛認(rèn)同[10]。其中,顛覆性創(chuàng)新強調(diào)的是開發(fā)新技術(shù)的知識與能力[11],其技術(shù)軌跡呈現(xiàn)出明顯偏離于現(xiàn)有技術(shù)軌跡的特點[9]。而延續(xù)性創(chuàng)新則是沿著原有的技術(shù)路線,對現(xiàn)有知識和技術(shù)的鞏固發(fā)展[12]。
對專利的延續(xù)性和顛覆性創(chuàng)新進行識別的研究主要集中在科學(xué)計量學(xué)領(lǐng)域,基于文獻計量學(xué)的相關(guān)指標(biāo)進行判斷。Dahlin K B等[13]認(rèn)為專利引用的新專利越多,專利的新穎性越高,越容易成為顛覆性創(chuàng)新。Lucio-Arias D等[14]從主路徑分析和知識流的視角對文獻引用網(wǎng)絡(luò)進行分析,從關(guān)鍵知識的轉(zhuǎn)變中來識別顛覆性創(chuàng)新。杜建等[15]提出,使用被專利引用和延遲承認(rèn)指數(shù)兩個指標(biāo)區(qū)分睡美人文獻的延續(xù)性創(chuàng)新與顛覆性創(chuàng)新。鑒于多數(shù)指標(biāo)對顛覆性創(chuàng)新與延續(xù)性創(chuàng)新的區(qū)分度較弱,且無法描述一項發(fā)明對其技術(shù)前輩的后續(xù)使用或技術(shù)軌跡的演變可能產(chǎn)生的實質(zhì)性的影響[16]。Funk R J等[17]提出了CD指數(shù),該指數(shù)介于-1~1之間,用來衡量節(jié)點的鞏固能力或者破壞能力,基本思想是一項發(fā)明的重要性既源于它如何影響其他技術(shù)的使用,也源于它自己的直接使用,即若一項新成果的出現(xiàn)使得后續(xù)的技術(shù)都不再使用其前期成果,表明該成果的創(chuàng)新具有顛覆性;反之,若后繼研究持續(xù)引用前期成果,則說明新成果是在鞏固現(xiàn)有的知識體系,表明其更具延續(xù)性創(chuàng)新的特點。Wu L等[6]簡化了CD指數(shù),并提出了D指數(shù),在論文、軟件和專利等不同的數(shù)據(jù)集上進行了檢驗,證明了該指標(biāo)在區(qū)分延續(xù)性創(chuàng)新和顛覆性創(chuàng)新方面的可行性和有效性。
詞匯是語言構(gòu)成中最小的基本語義單元,詞匯功能識別是指從語用和語義的角度研究詞匯在文本中所承載的功能角色[18]。Mack C A[19]指出論文中的標(biāo)題、摘要和關(guān)鍵詞包含了作者的主要研究內(nèi)容、方法和主要結(jié)論,能直接地反映論文的框架結(jié)構(gòu)和研究方向。Kondo T等[20]使用CRF(Conditional Random Field)模型對科技文獻標(biāo)題中的詞匯進行“領(lǐng)域(head)”“目標(biāo)(goal)”“方法(method)”及“其他(other)”4個類別的判定。肖悅珺等[21]在詞頻統(tǒng)計的基礎(chǔ)上,將句子向量與專有名詞向量進行融合,對專利文本類別進行識別。賈杉杉等[22]使用從專利申請書中提取的主題詞詞頻特征對專利的分類號進行了預(yù)測。楊雪梅等[23]從顛覆性文章中提取摘要的高頻詞作為顛覆性研究特征詞??梢?,學(xué)者們已經(jīng)開始將文本信息用于顛覆性創(chuàng)新的分類和識別,但對顛覆性創(chuàng)新和延續(xù)性創(chuàng)新在文本使用上的差異研究還較少。
Bertin M等[24]研究了4萬多篇文章的用詞習(xí)慣,發(fā)現(xiàn)動詞在不同段落中的使用存在明顯的差異,Lu C等[25]統(tǒng)計了10萬余篇發(fā)表在PLoS上的學(xué)術(shù)論文,在名詞、動詞和修飾詞方面比較了學(xué)者的寫作差異性,發(fā)現(xiàn)母語者比非母語者運用了更多的修飾詞。Wu L等[6]的研究說明了延續(xù)性創(chuàng)新專利和顛覆性創(chuàng)新專利的標(biāo)題在動詞、名詞、副詞和介詞等上的使用都存在明顯的差異。
因此,本文以專利標(biāo)題為研究對象,使用D指數(shù)將專利劃分為延續(xù)性創(chuàng)新和顛覆性創(chuàng)新專利兩類,比較兩者標(biāo)題在動詞、名詞及其他寫作風(fēng)格詞上使用的差異性,并通過一些高頻詞的使用來發(fā)現(xiàn)兩者在標(biāo)題用詞上的一般規(guī)律性,同時也為顛覆性創(chuàng)新研究的辨識提供相關(guān)的理論支撐。
2 研究設(shè)計
2.1 顛覆性與延續(xù)性創(chuàng)新專利的界定
一項科技發(fā)明的創(chuàng)新性取決于它如何影響其他技術(shù)的使用,Wu L等[6]通過焦點專利、現(xiàn)有專利與未來其他專利的聯(lián)系,提出一種新的度量指標(biāo)——D指數(shù),該值變化區(qū)間為-1~1,D值小于0表明該創(chuàng)新具有延續(xù)性,越趨向于-1,延續(xù)性越高;D值大于0表明該創(chuàng)新具有顛覆性,越趨向于1,顛覆性越高;D值等于0,則表明該創(chuàng)新處于“中立”狀態(tài),具體計算公式如式(1)所示。本文根據(jù)D指數(shù)計算出領(lǐng)域內(nèi)所有專利的D值,將D值大于0的專利歸類為顛覆性創(chuàng)新專利,將D值小于0的專利歸類為延續(xù)性創(chuàng)新專利。
D=ni-njni+nj+nk(1)
其中,ni計算引用焦點專利f但不引用其現(xiàn)有技術(shù)pi的專利,nj計算同時引用f和pi的專利,nk計算僅引用焦點專利f的現(xiàn)有技術(shù)pi的專利。
2.2 顛覆性與延續(xù)性創(chuàng)新專利標(biāo)題詞差異性檢驗
考慮到本文所要檢驗的差異性是兩配對樣本之間的差異性,且標(biāo)題詞詞頻分布不具有正態(tài)性[27],因此,采用非參數(shù)Wilcoxon秩檢驗方法對兩樣本用詞上的差異進行檢驗。Wilcoxon符號秩檢驗(Wilcoxon Signed-rank Test),也稱符號秩和檢驗,其基本思想是假定配成對子的兩種處理效應(yīng)相同,即其差值的總體分布應(yīng)為對稱分布,且差值的總體中位數(shù)為0。
2.3 顛覆性與延續(xù)性創(chuàng)新專利標(biāo)題詞差異性描述
分別對顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利的標(biāo)題詞進行詞頻統(tǒng)計,在統(tǒng)計的過程中發(fā)現(xiàn),像“with”“which”等連詞和代詞在兩類專利標(biāo)題中出現(xiàn)的頻次也存在一定的差異性,因此本文將以一類詞劃分為“寫作風(fēng)格詞”,其他詞劃分為“研究主題詞”。由于不同創(chuàng)新類型的專利在單復(fù)數(shù)和時態(tài)的使用上也存在一定的差異性,如“methods”就常出現(xiàn)在延續(xù)型創(chuàng)新專利中,因為這一類專利往往會提出多種方法,而這些方法中的大多數(shù)往往只會逐漸改進其領(lǐng)域[26]。因此,本文沒有對詞語的單復(fù)數(shù)形式以及時態(tài)進行還原。在此基礎(chǔ)上,比較兩類專利標(biāo)題中的高頻詞語,對比分析兩類專利在用詞上的差異,再通過共現(xiàn)分析比較顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利中標(biāo)題詞搭配上的差異。
2.4 創(chuàng)新類型度量值計算方法
通過詞頻統(tǒng)計對比和共現(xiàn)圖,可以清楚看到,兩類專利在高頻研究主題詞和寫作風(fēng)格詞使用上的不同,但當(dāng)某個標(biāo)題詞在兩類專利中出現(xiàn)的頻次都較高時,無法判斷該詞到底是偏向于出現(xiàn)在延續(xù)性創(chuàng)新專利中,還是顛覆性創(chuàng)新專利中。因此,本文提出標(biāo)題詞創(chuàng)新類型度量值CDi,通過對根據(jù)D指數(shù)劃分的顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利標(biāo)題進行分詞,統(tǒng)計每個標(biāo)題詞i在顛覆性創(chuàng)新專利中出現(xiàn)的頻次tfdi和在延續(xù)性創(chuàng)新專利中出現(xiàn)的頻次tfCi,并統(tǒng)計顛覆性創(chuàng)新專利的總數(shù)∑ni=1tfdi和延續(xù)性創(chuàng)新專利的總數(shù)∑ni=1tfCi,計算每個標(biāo)題詞在兩類專利中出現(xiàn)的平均頻次tfdi∑ni=1tfdi和tfCi∑ni=1tfCi,如果一個標(biāo)題詞i在顛覆性專利中出現(xiàn)的頻次明顯高于延續(xù)性專利,則該標(biāo)題詞更傾向于描述顛覆性創(chuàng)新專利,當(dāng)該標(biāo)題詞出現(xiàn)在專利標(biāo)題中時,可以大致判斷該專利是一個顛覆性創(chuàng)新專利;同理,如果一個標(biāo)題詞i在延續(xù)性專利中出現(xiàn)的頻次明顯高于顛覆性專利,則該標(biāo)題詞更傾向于描述顛覆性創(chuàng)新專利,當(dāng)該標(biāo)題詞出現(xiàn)在專利標(biāo)題中時,則可以大致判斷該專利是一個延續(xù)性創(chuàng)新專利;如果一個標(biāo)題詞i在顛覆性專利中出現(xiàn)的頻次和在延續(xù)性專利中出現(xiàn)的頻次差不多,則該標(biāo)題詞沒有什么區(qū)分性。CDi的具體計算公式如式(2)所示,使用標(biāo)
題詞i在顛覆性和延續(xù)性創(chuàng)新專利中出現(xiàn)的平均頻次總和(tfdi∑ni=1tfdi+tfCi∑ni=1tfCi)進行歸一化處理,處理后該指標(biāo)的取值范圍在-1~1,越趨向于-1說明該詞偏向描述延續(xù)性,即延續(xù)性創(chuàng)新專利更傾向于使用該詞語;越趨向于1說明該詞偏向描述顛覆性,即顛覆性創(chuàng)新專利更傾向于使用該詞語。
CDi=tfdi∑ni=1tfdi-tfCi∑ni=1tfCitfdi∑ni=1tfdi+tfdi∑ni=1tfdi(2)
3 數(shù)據(jù)分析與結(jié)果
3.1 數(shù)據(jù)來源及預(yù)處理
3.1.1 數(shù)據(jù)集
本文的實驗數(shù)據(jù)來源于美國專利數(shù)據(jù)庫(1976.01—2020.12)Chemistry:Molecular Biology and Microbiology(分子生物學(xué)與微生物學(xué))分類號435類及其子類的所有專利,從美國專利分類號欄中采用“435*”進行檢索,共計得到78 426條發(fā)明專利的文獻題錄信息,包括專利申請?zhí)枴PC分類號、發(fā)明人、題目、摘要、參考文獻專利號等相關(guān)內(nèi)容。選取該數(shù)據(jù)集的原因主要有:①分子生物學(xué)與微生物學(xué)學(xué)科的引用較為集中,多是針對數(shù)據(jù)子集內(nèi)部的引用,相較具有大量外部引用的數(shù)據(jù)集,該數(shù)據(jù)集有更好的完整性;②該數(shù)據(jù)集中高影響力專利較多[26],用于專利創(chuàng)新性具有更好的代表性;③435類別數(shù)據(jù)集下累計了大量的專利,是美國授權(quán)專利數(shù)據(jù)庫中專利數(shù)最多的類目數(shù)據(jù)子集之一。
3.1.2 數(shù)據(jù)預(yù)處理
首先,對分子生物學(xué)與微生物學(xué)領(lǐng)域的數(shù)據(jù)進行清洗,進行去重和缺失值等處理;然后,對清洗后數(shù)據(jù)構(gòu)建專利引用網(wǎng)絡(luò),得到專利的被引量、ni值、nj值和nk值,去除沒有被引用和沒有標(biāo)題信息的專利,最終得到40 274條發(fā)明專利的文獻題錄信息;接著,根據(jù)ni值、nj值和nk值計算出每個專利的創(chuàng)新度量值,并以0值為分界線,將專利劃分為顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利兩類,共計得到26 302個顛覆性創(chuàng)新專利和13 972個延續(xù)性創(chuàng)新專利;最后,對兩類專利的標(biāo)題進行分詞、去停用詞處理,統(tǒng)計標(biāo)題詞在兩類專利中出現(xiàn)的頻次。
3.2 顛覆性與延續(xù)性創(chuàng)新專利標(biāo)題詞差異性檢驗結(jié)果
為了消除由于專利樣本數(shù)量的差異造成的專利在用詞上的差異,本文對分子生物學(xué)與微生物學(xué)領(lǐng)域的專利進行隨機抽樣,獲得顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利各10 000條,對20 000條專利標(biāo)題進行分詞處理后,共得到標(biāo)題詞11 942個,統(tǒng)計標(biāo)題詞在兩類專利中出現(xiàn)的頻次,如表1所示;再采用非參數(shù)檢驗中的威爾科克森符號秩檢驗,關(guān)于數(shù)據(jù)的描述統(tǒng)計和檢驗結(jié)果如表2和表3所示。
由表2的描述統(tǒng)計可知,樣本中共包含11 942個標(biāo)題詞,在顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利中出現(xiàn)頻次的平均值接近,為5.3;在顛覆性創(chuàng)新專利中的標(biāo)準(zhǔn)偏差為34.84,在延續(xù)性創(chuàng)新專利中的標(biāo)準(zhǔn)偏差為36.28。從表3的檢驗結(jié)果可知,p值為0.000,說明顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利在用詞上存在明顯的差異性。
3.3 顛覆性與延續(xù)性創(chuàng)新專利標(biāo)題詞差異性分析
3.3.1 高頻標(biāo)題詞詞頻對比分析
對整個領(lǐng)域內(nèi)的詞頻進行統(tǒng)計,由于極低詞頻的詞可能為某些極小領(lǐng)域的特有名詞,無法代表整個領(lǐng)域用詞的偏好,因此本文選取了排名前100的高頻詞進行可視化展示,試圖得到更加一般化的結(jié)論。由于“Method(s)”“Use(s/ing)”“Acid(s)”等詞為該領(lǐng)域的常用詞,刪除了該部分詞語,對部分高頻詞進行了展示,如表4所示。
通過表4可知,兩類專利標(biāo)題在用詞上存在著明顯差異。延續(xù)性創(chuàng)新專利常用“Detection”“Compositions”和“Apparatus”等詞,顛覆性創(chuàng)新專利標(biāo)題常用“Human”“Protein”和“Gene”等詞。以上述詞為例,分析它們所在的標(biāo)題,展示所在的部分高被引專利的標(biāo)題,如表5、表6所示。
通過表5可知,從“Detection”所在的標(biāo)題可以看出,延續(xù)性創(chuàng)新專利偏向于研究利用現(xiàn)有技術(shù)去檢測該領(lǐng)域下的一些物質(zhì);從“Compositions”所在的標(biāo)題可以發(fā)現(xiàn),延續(xù)性創(chuàng)新專利偏向于研究物質(zhì)的組成成分及一些組合方法的應(yīng)用;從“Apparatus”所在的標(biāo)題可以發(fā)現(xiàn),延續(xù)性創(chuàng)新專利偏向于基礎(chǔ)裝置的研究??傮w來說,延續(xù)性創(chuàng)新專利偏向于研究利用現(xiàn)有技術(shù)在原有發(fā)現(xiàn)的基礎(chǔ)上獲得一些新發(fā)現(xiàn)或新的改進技術(shù)。
通過表6可知,“Human”能成為顛覆性創(chuàng)新專利的高頻研究主題詞的一個原因,可能是“人造干細(xì)胞”的發(fā)現(xiàn),它為醫(yī)學(xué)領(lǐng)域打開了大門,讓科學(xué)家們可以尋找再生、修復(fù)或替換受損或患病細(xì)胞的方法,使用治療性干細(xì)胞,甚至制造人造器官;從“Protein”和“Gene”所在的標(biāo)題可以發(fā)現(xiàn),顛覆性創(chuàng)新專利偏向于研究蛋白質(zhì)和基因等一類的物質(zhì),尋找該領(lǐng)域下新的物質(zhì)??傮w來說,顛覆性創(chuàng)新專利偏向于研究如何發(fā)現(xiàn)新的物質(zhì)或者尋找一些新的方法來研究某些物質(zhì)。
通過表7可知,兩類專利標(biāo)題詞常用寫作風(fēng)格詞有“with”“or”“therefor”“non”和“which”等,從詞頻對比上,具有明顯使用傾向的是“which”,即如果一篇專利的標(biāo)題詞中使用“which”,則它大概率是一項顛覆性的研究。
3.3.2 標(biāo)題詞共現(xiàn)分析
此外,本文也對延續(xù)性創(chuàng)新專利和顛覆性創(chuàng)新專利的標(biāo)題詞的共現(xiàn)關(guān)系進行了可視化分析,這里僅展示了詞頻位于前100的標(biāo)題詞,如圖1、圖2所示。網(wǎng)絡(luò)圖節(jié)點的大小代表節(jié)點的度,這里將100個節(jié)點按照度值劃分為3類,3類節(jié)點依次增大;邊的粗細(xì)代表邊的權(quán)重,根據(jù)整個網(wǎng)絡(luò)的邊權(quán)分布,也將邊劃分為3類,3類邊依次加粗。通過比較圖1和圖2,發(fā)現(xiàn)延續(xù)性創(chuàng)新和顛覆性創(chuàng)新專利都將“Nucleic”和“Acid”一起使用,可見“核酸”是該領(lǐng)域的主要研究方向和研究熱點。
從圖1可知,延續(xù)性創(chuàng)新專利通常將“Methods”和“Compositions”一起使用,分析它們所在的標(biāo)題,如專利“6251639”的標(biāo)題為“Methods and Compositions for Linear Isothermal Amplification of Polynucleotide Sequences,Using a RNA-DNA Composite Primer(使用RNA-DNA復(fù)合引物線性等溫擴增多核苷酸序列的方法和組成)”,專利“6312893”的標(biāo)題為“Methods and Compositions for Determining the Sequence of Nucleic Acid Molecules(測定核酸分子序列的方法和組成)”,可見延續(xù)性創(chuàng)新專利標(biāo)題中“Methods”和“Compositions”是十分常見的組合,這可能意味著延續(xù)性創(chuàng)新專利往往會提出多種方法,而這些方法中的大多數(shù)往往只是在進行逐步、累進式的改進。
從圖2可知,顛覆性創(chuàng)新專利通常將“Methods”和“Producing”一起使用,分析它們所在的標(biāo)題,如專利“4196265”的標(biāo)題為“Method of Producing Antibodies(產(chǎn)生抗體的方法)”,專利“4745051”的標(biāo)題為“Method for Producing a Recombinant Baculovirus Expression Vector(重組桿狀病毒表達載體的制備方法)”,顛覆性創(chuàng)新專利偏向于發(fā)現(xiàn)新的方法,研究制備、產(chǎn)生該領(lǐng)域下的一些物質(zhì)的基礎(chǔ)方法。
3.4 標(biāo)題詞創(chuàng)新類型度量分析
3.4.1 創(chuàng)新類型度量值總體分布
本文計算了40 274個專利的標(biāo)題創(chuàng)新性,總體差異分布如圖3所示,從圖3可以看出,創(chuàng)新值存在較多的-1值和1值,這可能是一些不常用詞導(dǎo)致的,他們在延續(xù)性創(chuàng)新專利或顛覆性創(chuàng)新專利中只出現(xiàn)一兩次。不考慮-1值和1值的出現(xiàn),可以發(fā)現(xiàn)創(chuàng)新類型度量值主要集中在-0.5和0.5之間,分布近似呈中間高兩頭低、較為對稱的形態(tài)。
3.4.2 排名前100高頻詞創(chuàng)新類型度量值分布
由于一些低頻生僻詞的使用,可能會導(dǎo)致該類詞語的創(chuàng)新類型度量值較大,但這些詞在標(biāo)題中并不是很常用,無法得出顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利在標(biāo)題用詞上的一般規(guī)律性。因此,本文選取了詞頻位于前100的詞語進行展示,試圖遴選出區(qū)分度較大的常用詞,以總結(jié)顛覆性創(chuàng)新專利和延續(xù)性創(chuàng)新專利在標(biāo)題用詞上的一般規(guī)律。表8和表9分別展示了創(chuàng)新類型度量值最高和最低的20個研究主題詞,表10展示了區(qū)分性較大的寫作風(fēng)格詞。
通過表8可知,顛覆性創(chuàng)新專利往往集中在領(lǐng)域內(nèi)的新發(fā)現(xiàn)、新研究方向,如“Monoclonal”“Human”“Novel”等詞通常出現(xiàn)在顛覆性創(chuàng)新的專利標(biāo)題中。單克隆技術(shù)和人造干細(xì)胞的發(fā)現(xiàn)對生物學(xué)、醫(yī)學(xué)來說都有著重大的變革意義,是生物學(xué)和醫(yī)學(xué)史上的重大新發(fā)現(xiàn),如專利“4486530”的標(biāo)題為“Immunometric Assays Using Monoclonal Antibodies(單克隆抗體免疫測定)”和專利“5061620”的標(biāo)題為“Human Hematopoietic Stem Cell(人類造血干細(xì)胞)”,這兩個專利發(fā)現(xiàn)了單克隆抗體技術(shù)和人類造血干細(xì)胞,也就是說,專利標(biāo)題中出現(xiàn)“Monoclonal”“Human”等詞的大概率會是一個顛覆性創(chuàng)新的專利。
通過表9可知,延續(xù)性創(chuàng)新專利通常關(guān)注具有良好研究基礎(chǔ)的、系統(tǒng)的、具有分析性質(zhì)的研究,如“Based”“Systems”“Analysis”等詞普遍出現(xiàn)在延續(xù)性創(chuàng)新的專利標(biāo)題中。同時,通過“Modified”也包含了改進與延續(xù)性創(chuàng)新的含義,如專利“5645985”的標(biāo)題為“Enhanced Triple-Helix and Double-Helix Formation with Oligomers Containing Modified Pyrimidines(與含有修飾嘧啶的低聚物形成增強的三螺旋和雙螺旋結(jié)構(gòu))”、專利“5614365”的標(biāo)題為“DNA Polymerase Having Modified Nucleotide Binding Site for DNA Sequencing(用于DNA測序的修改了核苷酸結(jié)合位點的DNA聚合酶)”等,延續(xù)性創(chuàng)新專利也偏向于做一些逐步改進其領(lǐng)域的研究。
由表10可知,顛覆性創(chuàng)新專利在標(biāo)題的寫作風(fēng)格上會使用類似于“Which”的疑問代詞,如標(biāo)題為“Nucleic Acid Hybridization and Amplification Method for Detection of Specific Sequences in Which a Complementary Labeled Nucleic Acid Probe is Cleaved(核雜交和擴增法,用于檢測互補標(biāo)記的核酸探針被切割的特定序列)”的專利“5403711”、標(biāo)題為“Method of Detection of Methylated Nucleic Acid Using Agents Which Modify Unmethylated Cytosine and Distinguishing Modified Methylated and Non-methylated Nucleic Acids(用修飾未甲基化胞嘧啶和區(qū)分修飾甲基化和非甲基化核酸的試劑檢測甲基化核酸的方法)”的專利“5786146”等都是具有較高顛覆性創(chuàng)新能力的專利。延續(xù)性創(chuàng)新專利在標(biāo)題的寫作風(fēng)格上則會使用類似于“with”“or”等連詞和介詞,標(biāo)題為“Nucleic Acid Amplification Oligonucleotides with Molecular Energy Transfer Labels and Methods Based Thereon(具有分子能量轉(zhuǎn)移標(biāo)記的核酸擴增寡核苷酸及其方法)”的專利“5866336”、標(biāo)題為“Process for Amplifying,Detecting,and/or Cloning Nucleic Acid Sequences Using a Thermostable Enzyme(用耐熱酶擴增、檢測和/或克隆核酸序列的過程)”的專利“4965188”都是具有較高延續(xù)性創(chuàng)新的專利。
4 討 論
4.1 主要貢獻
本文從“延續(xù)性創(chuàng)新”和“顛覆性創(chuàng)新”兩個維度,將專利劃分為“延續(xù)性創(chuàng)新專利”和“顛覆性創(chuàng)新專利”兩類,采用詞云圖、共現(xiàn)圖和創(chuàng)新類型度量值等方式展示了兩者在標(biāo)題高頻詞使用上的差異。研究標(biāo)題在使用一些通用詞而不是專有名詞上的差異的優(yōu)勢體現(xiàn)為:①通過研究標(biāo)題在一些通用詞、常用詞使用上的差異,可以得出更加一般化的結(jié)論,如一個專利標(biāo)題中使用“Which”“Human”這一類的詞語或者將“Methods”和“Producing”搭配使用,則可以判斷這個專利更大可能性是一個偏向顛覆性的研究;同理,一個專利標(biāo)題中使用“with”“Based”這一類的詞語或者將“Methods”和“Compositions”搭配使用,則可以判斷這個專利更大可能性是一個偏向延續(xù)性的研究;②文中所使用的方法也可以應(yīng)用于探索其他領(lǐng)域或者其他類別之間在文本使用上的差異性,具有一定的通用性;③本文所得出來的結(jié)論為一些使用機器學(xué)習(xí)等方法進行文本分類任務(wù)的研究補充了理論依據(jù)。
4.2 局 限
使用標(biāo)題詞研究專利用詞的差異性的不足主要有以下兩點:①本文僅以標(biāo)題作為主要文本信息來探索延續(xù)性創(chuàng)新和顛覆性創(chuàng)新專利在文本使用上的差異,雖然標(biāo)題是文獻最關(guān)鍵的內(nèi)容集中展示,但是由于標(biāo)題非常簡短,會出現(xiàn)代表不足的問題,可以進一步使用摘要信息進行分析;②本文對寫作風(fēng)格詞的特征挖掘還比較少。因此,今后將基于以上不足,進一步進行深入研究。
參考文獻
[1]馮立杰,吳漢爭,王金鳳,等.技術(shù)創(chuàng)新過程的基因圖譜構(gòu)建及其實證[J].情報學(xué)報,2016,35(8):806-816.
[2]李建蓉.專利信息與利用[M].北京:知識產(chǎn)權(quán)出版社,2006.
[3]Bower J L,Christensen C M.Disruptive Technologies:Catching the Wave[J].Harvard Business Review,1995(1):43-53.
[4]Christensen C M.The Innovators Dilemma:When New Technologies Cause Great Firms to Fail[M].Harvard College,1997.
[5]Christensen C M,Raynor M,McDonald R.What is Disruptive Innovation[J].Harvard Business Review,2015,93:44-53.
[6]Wu L,Wang D,Evans J A.Large Teams Develop and Small Teams Disrupt Science and Technology[J].Nature,2019,566:378-382.
[7]Schumpeter J.Creative Destruction[J].Capitalism,Socialism and Democracy,1942.
[8]Dosi G,Nelson R R.Technological Paradigms and Technological Trajectories[J].Research Policy,1982,11(3):147-162.
[9]Foster R N.Working the S-curve:Assessing Technological Threats[J].Research Management,1986,29(4):17-20.
[10]Lavie D,Kang J,Rosenkopf L.Balance Within and Across Domains:The Performance Implications of Exploration and Exploitation in Alliances[J].Organization Science,2011,22(6):1517-1538.
[11]Ettlie J E,Bridges W P,OKeefe R D.Organization Strategy and Structural Differences for Radical Versus Incremental Innovation[J].Management Science,1984,30(6):682-695.
[12]Dewar R D,Dutton J E.The Adoption of Radical and Incremental Innovations:An Empirical Analysis[J].Management Science,1986,32(11):1422-1433.
[13]Dahlin K B,Behrens D M.When is an Invention Really Radical?:Defining and Measuring Technological Radicalness[J].Research Policy,2005,34(5):717-737.
[14]Lucio-Arias D,Leydesdorff L.Main-path Analysis and Path-dependent Transitions in HistCiteTM-based Historiograms[J].Journal of the American Society for Information Science and Technology,2008,59(12):1948-1962.
[15]杜建,孫軼楠,張陽,等.變革性研究的科學(xué)計量學(xué)特征與早期識別方法[J].中國科學(xué)基金,2019,33(1):90-100.
[16]蘇鵬,蘇成,潘云濤.顛覆性技術(shù)識別方法發(fā)展現(xiàn)狀及啟示[J].圖書情報工作,2019,63(20):129-138.
[17]Funk R J,Owen-Smith J.A Dynamic Network Measure of Technological Change[J].Management Science,2017,63(3):791-817.
[18]程齊凱.學(xué)術(shù)文本的詞匯功能識別[D].武漢:武漢大學(xué),2015.
[19]Mack C A.How to Write a Good Scientific Paper:Title,Abstract,and Keywords[J].Journal of Micro/Nanolithography Mems amp; Moems,2012,11(2):242 -248.
[20]Kondo T,Nanba H,Takezawa T,et al.Technical Trend Analysis By Analyzing Research Papers Titles[C]//Proceedings of the Lan-guage and Technology Conference.Heidelberg:Springer,2011:512-521.
[21]肖悅珺,李紅蓮,張樂,等.特征融合的中文專利文本分類方法研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2022,6(4):49-59.
[22]賈杉杉,劉暢,孫連英,等.基于多特征多分類器集成的專利自動分類研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2017,1(8):76-84.
[23]楊雪梅,王雪,杜建,等.基于論文摘要和引文文本語料的顛覆性研究特征詞識別[J].圖書情報工作,2020,64(11):125-132.
[24]Bertin M,Atanassova I.A Study of Lexical Distribution in Citation Contexts Through the IMRaD Standard[J].PloS Negl.Trop.Dis,2014,1(200,920):83-402.
[25]Lu C,Bu Y,Wang J,et al.Examining Scientific Writing Styles from the Perspective of Linguistic Complexity[J].Journal of the Association for Information Science and Technology,2019,70(5):462-475.
[26]閔超,步一,孫建軍.基于專利大數(shù)據(jù)的中國國際專利技術(shù)流動分析[J].圖書與情報,2017(5):33-39.
[27]鄒永利,林智昊.中文學(xué)術(shù)文獻網(wǎng)頁的特征[J].圖書館論壇,2011,31(6):178-185.
[28]Chen J,Shao D,F(xiàn)an S.Destabilization and Consolidation:Conceptualizing,Measuring,and Validating the Dual Characteristics of Technology[J].Research Policy,2021,50(1):1-15.
(責(zé)任編輯:郭沫含)