• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多維屬性動(dòng)態(tài)變化特征的新興技術(shù)識(shí)別研究

    2022-06-07 10:36:56楊中楷
    情報(bào)學(xué)報(bào) 2022年5期
    關(guān)鍵詞:新穎性納米研究

    李 昌,楊中楷,董 坤

    (1.大連理工大學(xué)科學(xué)學(xué)與科技管理研究所,大連 116024;2.山東理工大學(xué)信息管理研究院,淄博 255049)

    1 引 言

    當(dāng)前新一輪科技革命風(fēng)起云涌,尤其是新興技術(shù)可能會(huì)改變已有產(chǎn)業(yè)的發(fā)展形態(tài),創(chuàng)造出新興行業(yè),并催生出一系列新的發(fā)展模式,對(duì)加強(qiáng)科技戰(zhàn)略規(guī)劃、占領(lǐng)科技制高點(diǎn)、支撐科研前瞻布局等具有重要作用。但隨著技術(shù)演變速度和復(fù)雜性不斷提升、技術(shù)之間交叉性與相互依賴性不斷增強(qiáng)[1],新興技術(shù)識(shí)別越來(lái)越難,因而如何在復(fù)雜繁多又彼此交織的技術(shù)中識(shí)別出新興技術(shù)就顯得尤為迫切。

    當(dāng)前新興技術(shù)識(shí)別主要包括定性研究和定量研究。定性研究主要利用德爾菲法、專家頭腦風(fēng)暴法等進(jìn)行人工識(shí)別,正確率較高,但信息的爆發(fā)式增長(zhǎng),使人工識(shí)別難度越來(lái)越高。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,利用機(jī)器學(xué)習(xí)識(shí)別新興技術(shù)的方法得到快速發(fā)展。定量研究主要包括技術(shù)主題識(shí)別和識(shí)別指標(biāo)構(gòu)建兩個(gè)步驟。其中技術(shù)主題識(shí)別主要包括網(wǎng)絡(luò)關(guān)系識(shí)別和文本挖掘識(shí)別,前者是利用引文關(guān)系識(shí)別相似內(nèi)容[2],后者是利用能表征文本含義的特征詞進(jìn)行聚類/分類識(shí)別[3]。其中LDA(latent Dirich‐let allocation)主題模型[4]因能在語(yǔ)義層面上解釋及分析主題分布,被廣泛應(yīng)用,并在后期得到了諸多改善。例如,考慮SAO(subject-action-object)結(jié)構(gòu)詞[5]和考慮技術(shù)背景[6]的WI-LDA(word IPC-LDA)等。識(shí)別指標(biāo)構(gòu)建主要針對(duì)新興技術(shù)主題的新穎性和增長(zhǎng)性特征[7],新穎性主要利用主題中文獻(xiàn)[8]或單詞[9]出現(xiàn)時(shí)間來(lái)表征,增長(zhǎng)性主要利用主題內(nèi)文獻(xiàn)的數(shù)量[10]、(結(jié)構(gòu))詞[11]、作者(專利權(quán)人)、權(quán)利要求等數(shù)量變化表示,或利用網(wǎng)絡(luò)中一些關(guān)系指標(biāo)如中介中心度、PageRank[12]、聚類系數(shù)[13]等表征。此外,部分學(xué)者還從多源數(shù)據(jù)[14]、構(gòu)建屬性綜合評(píng)價(jià)和決策系統(tǒng)[15]、機(jī)器學(xué)習(xí)[16]和動(dòng)態(tài)監(jiān)測(cè)成長(zhǎng)階段[17]等角度進(jìn)行識(shí)別。

    現(xiàn)有研究在新興技術(shù)識(shí)別方面已取得一定成果,但還存在以下不足:①技術(shù)識(shí)別精確度不足。新興技術(shù)本身并不成熟,文檔與新興特征詞數(shù)量較少,當(dāng)前研究利用高頻詞識(shí)別遺漏了較多體現(xiàn)新興技術(shù)的技術(shù)詞;識(shí)別過程中技術(shù)詞缺乏語(yǔ)義信息,同時(shí)存在語(yǔ)義粒度較粗且無(wú)法直觀讀取、難以解讀、同化技術(shù)主題和低頻詞弱技術(shù)主題識(shí)別率較低等問題。技術(shù)主題識(shí)別是新興技術(shù)識(shí)別的第一步,至關(guān)重要,技術(shù)主題識(shí)別誤差大降低了識(shí)別的效率和準(zhǔn)確性。②指標(biāo)單一,覆蓋面不夠完整。當(dāng)前研究主要考慮新穎性和增長(zhǎng)性兩個(gè)指標(biāo),忽略了其他屬性,難以全面反映,準(zhǔn)確性不足;且指標(biāo)得到簡(jiǎn)化,新穎性研究集中在時(shí)間的新穎,忽略技術(shù)內(nèi)容創(chuàng)新性,增長(zhǎng)性主要從數(shù)量的宏觀角度進(jìn)行測(cè)量,無(wú)法深入文本內(nèi)部微觀技術(shù)詞層面。③當(dāng)前對(duì)技術(shù)的識(shí)別通常是靜態(tài)分析,缺少時(shí)間因素,無(wú)法從屬性動(dòng)態(tài)變化特征的角度識(shí)別。④因定義和屬性的不明確,當(dāng)前所建立的指標(biāo)與定義、屬性之間缺乏關(guān)聯(lián)解釋,導(dǎo)致方法層面的改進(jìn)效果總是欠佳[1],有些“舍本逐末”。

    基于上述不足,本研究首先明確了新興技術(shù)定義和識(shí)別的技術(shù)原理、屬性及其屬性的動(dòng)態(tài)變化特征,為識(shí)別奠定理論基礎(chǔ),之后提出MWI-LDA(multiple word IPC-LDA)模型以提升技術(shù)主題識(shí)別效率和準(zhǔn)確性,依據(jù)新興技術(shù)的多維屬性在時(shí)間上的變化,構(gòu)建基于多維屬性動(dòng)態(tài)變化特征的新興技術(shù)識(shí)別框架,以期改進(jìn)當(dāng)前研究中的不足,實(shí)現(xiàn)新興技術(shù)的高效、準(zhǔn)確識(shí)別。最后以納米醫(yī)學(xué)為例進(jìn)行實(shí)證研究,驗(yàn)證了本方法的可行性和有效性。

    2 新興技術(shù)識(shí)別方法的理論基礎(chǔ)

    2.1 基本定義

    新興技術(shù)是2000年賓夕法尼亞大學(xué)沃頓商學(xué)院在著作Wharton on Mana gin g Emergin g Tech nolo gies中首次提出的,至今沒有公認(rèn)的定義和屬性。新興技術(shù)有廣義和狹義之分,廣義上較廣泛認(rèn)可的是羅托洛(D.Rotolo)在2015年給出的定義[18],“具有高新穎性且相對(duì)快速發(fā)展的技術(shù),在出現(xiàn)階段具有無(wú)序性和模糊性,可能會(huì)對(duì)社會(huì)經(jīng)濟(jì)產(chǎn)生重大影響”,代表一個(gè)技術(shù)領(lǐng)域,凸顯出潛在的技術(shù)和經(jīng)濟(jì)價(jià)值。狹義與廣義新興技術(shù)之間有一些重疊[19],但略有區(qū)別。狹義新興技術(shù)是用特征關(guān)鍵詞組成的主題領(lǐng)域表征剛出現(xiàn)并正在發(fā)展的技術(shù)[20],是新的分支技術(shù)領(lǐng)域[21]。狹義新興技術(shù)與廣義新興技術(shù)相比,更多體現(xiàn)在技術(shù)價(jià)值上,在識(shí)別粒度上,狹義新興技術(shù)更細(xì)化,在不考慮經(jīng)濟(jì)因素和識(shí)別粒度時(shí)兩者基本對(duì)等。本研究所述的新興技術(shù)是狹義上的新興技術(shù)。上述觀點(diǎn)雖然得到了認(rèn)可,但仍有以下不足:①當(dāng)前定義主要針對(duì)“新”和“興”兩個(gè)角度進(jìn)行定義,忽略了其他屬性,也沒有充分闡述兩者的具體含義;②主要從靜態(tài)角度對(duì)新興技術(shù)進(jìn)行定義,缺失技術(shù)隨時(shí)間不斷發(fā)展變化的過程。

    針對(duì)當(dāng)前研究現(xiàn)狀和不足,本研究從時(shí)間、技術(shù)兩個(gè)角度對(duì)新興技術(shù)進(jìn)行定義:新興技術(shù)是利用特征關(guān)鍵詞表征的新技術(shù)領(lǐng)域,在某一時(shí)間段內(nèi),該技術(shù)足夠新穎并能對(duì)其他技術(shù)產(chǎn)生帶動(dòng)促進(jìn)作用,具有較大關(guān)注度,在整個(gè)發(fā)展歷程中,研究?jī)?nèi)容朝有序方向快速、連貫發(fā)展。

    技術(shù)有層級(jí)結(jié)構(gòu),具有遞歸性[22],即技術(shù)由不同等級(jí)的技術(shù)構(gòu)建而成。例如,納米技術(shù)包括納米醫(yī)學(xué)技術(shù),而納米醫(yī)學(xué)技術(shù)又包括干細(xì)胞納米技術(shù)等。但是到目前為止,并沒有一個(gè)明確的劃分標(biāo)準(zhǔn),需要依據(jù)需求合理選擇,主題層次的技術(shù)顆粒度較細(xì),相對(duì)于粗粒度的技術(shù)能在科技管理部門和科研工作者需要時(shí)提供細(xì)致的參考。因此,本研究選擇主題級(jí)別的技術(shù)。

    2.2 識(shí)別的技術(shù)原理及屬性動(dòng)態(tài)變化特征歸納

    本研究中的屬性是新興技術(shù)固有的性質(zhì),隨時(shí)間推移屬性強(qiáng)弱發(fā)生變化,但屬性不會(huì)消失;特征是其區(qū)別于其他技術(shù)的特點(diǎn),特征源于屬性,是屬性的外在具象,動(dòng)態(tài)變化特征是隨時(shí)間推移,新興技術(shù)相對(duì)于其他技術(shù),其屬性在強(qiáng)弱上的獨(dú)特變化。當(dāng)前新興技術(shù)識(shí)別研究主要考慮新興技術(shù)的“新”與“興”作為其屬性特征,側(cè)重于技術(shù)的新穎和快速發(fā)展的特點(diǎn)。依據(jù)其定義,這些屬性不足以表征新興技術(shù)的全貌,因此部分學(xué)者又總結(jié)了如一致性、影響性、無(wú)序性[18]等屬性,但也存在屬性與新興技術(shù)指標(biāo)之間邏輯對(duì)應(yīng)關(guān)系不清晰的問題。因此,本節(jié)嘗試?yán)迩逍屡d技術(shù)識(shí)別的技術(shù)原理、屬性及其動(dòng)態(tài)變化特征。

    阿奇舒勒的技術(shù)進(jìn)化論[23]被稱為三大進(jìn)化論之一,是針對(duì)技術(shù)普遍規(guī)律的總結(jié),包括“技術(shù)系統(tǒng)的S曲線進(jìn)化法則”和“子系統(tǒng)不均衡法則”等八大技術(shù)系統(tǒng)進(jìn)化法則。新興技術(shù)作為一種技術(shù)系統(tǒng),應(yīng)遵循這些法則,同時(shí)依據(jù)矛盾的普遍性和特殊性以及共性與個(gè)性之間辯證統(tǒng)一關(guān)系,新興技術(shù)遵循技術(shù)的普遍規(guī)律,又應(yīng)具有自己獨(dú)特特征。融合新興技術(shù)的共性與個(gè)性規(guī)律結(jié)合定義和本研究目的從研究時(shí)間、演化軌跡等5個(gè)方面對(duì)新興技術(shù)的識(shí)別原理和屬性進(jìn)行分析歸納。

    依據(jù)“向微觀級(jí)和場(chǎng)的應(yīng)用進(jìn)化法則”,技術(shù)系統(tǒng)傾向于從宏觀到微觀的轉(zhuǎn)化,其研究范圍不斷擴(kuò)大的同時(shí)研究?jī)?nèi)容不斷深化,凸顯技術(shù)的發(fā)展過程,與本研究探索不同時(shí)間段新興技術(shù)屬性變化的目的相契合,新興技術(shù)的研究強(qiáng)度、研究時(shí)間和研究方向遵循上述法則。演化軌跡遵循技術(shù)系統(tǒng)客觀進(jìn)化模式的定律,成長(zhǎng)階段遵循“S曲線進(jìn)化法則”。以下在遵循上述定律/法則的基礎(chǔ)上對(duì)新興技術(shù)識(shí)別的技術(shù)原理進(jìn)行分析。

    (1)從研究強(qiáng)度上:新知識(shí)產(chǎn)生以后,在相當(dāng)一段時(shí)間內(nèi)不會(huì)被注意[24],即在出現(xiàn)初期受到的關(guān)注度較低,研究的內(nèi)容范圍以及對(duì)其他專利的帶動(dòng)促進(jìn)作用相對(duì)較小,由于新興技術(shù)具有“興”的特征,相對(duì)于其他技術(shù),其發(fā)展迅速,關(guān)注度增強(qiáng)速度更快,對(duì)促進(jìn)后續(xù)專利產(chǎn)生和發(fā)展的持續(xù)帶動(dòng)作用提升更快速。

    (2)從研究時(shí)間上:具有時(shí)間、內(nèi)容的新穎,在新興技術(shù)出現(xiàn)的時(shí)間段t內(nèi),其出現(xiàn)的時(shí)間晚于其他技術(shù),在t+1時(shí)間段,時(shí)間上的新不再凸顯,但新興技術(shù)相對(duì)于其他技術(shù)發(fā)展速度快,新內(nèi)容不斷涌現(xiàn),隨時(shí)間變化其內(nèi)容深化、擴(kuò)展速度更快。

    (3)從研究方向上:技術(shù)初期內(nèi)部研究方向模糊,依據(jù)“香農(nóng)信息論”,其內(nèi)部的無(wú)序性較大,更傾向于無(wú)序,隨時(shí)間的推移,相對(duì)于其他技術(shù)內(nèi)部無(wú)序性迅速降低,呈現(xiàn)更快速?gòu)臒o(wú)序到有序、從模糊到明確的發(fā)展?fàn)顟B(tài)。

    (4)從演化軌跡上:新興技術(shù)的發(fā)展是原有技術(shù)重組再造的結(jié)果[25],發(fā)展過程中知識(shí)的發(fā)展和重組相伴而生,形成技術(shù)軌道[22],根源于新興技術(shù)知識(shí)的更新[26],具有積累和演化的特性,在一定時(shí)空內(nèi)其發(fā)展具有“慣性”和“方向鎖定”的特征[15],相對(duì)于其他技術(shù),新興技術(shù)研究的內(nèi)容一直被繼承,研究不會(huì)在較長(zhǎng)時(shí)間內(nèi)停滯,具有更強(qiáng)的一致性和持久性。

    (5)從成長(zhǎng)階段上:相對(duì)于其他技術(shù),新興技術(shù)只涉及嬰兒期和成長(zhǎng)期,因?yàn)橐坏┻M(jìn)入成熟期就會(huì)成為廣泛研究的熱門技術(shù)。

    綜上,從5個(gè)方面闡述新興技術(shù)識(shí)別的技術(shù)原理,并在此基礎(chǔ)上借鑒前人研究總結(jié)出5條屬性:新穎性(研究方向角度)、關(guān)注性和引領(lǐng)性(研究強(qiáng)度角度)、傳承性(演化軌跡角度)、無(wú)序性(研究方向角度)。新興技術(shù)在不同的時(shí)間片段上應(yīng)該滿足以上所有屬性,且所有屬性都是相對(duì)的概念,即在某一時(shí)間段內(nèi)新興技術(shù)與其他技術(shù)相比以上屬性較為明顯。依據(jù)“子系統(tǒng)不均衡進(jìn)化法則”,不同技術(shù)具有不同的發(fā)展時(shí)間線,并非同步發(fā)展,同時(shí)本研究定義了均值線,均值線是所有技術(shù)的屬性均值,用來(lái)判定新興技術(shù)研究水平高低。結(jié)合上述識(shí)別的技術(shù)原理和屬性得到各屬性在時(shí)間維度上的變化特征,如圖1所示。

    圖1 屬性的動(dòng)態(tài)變化特征

    3 新興技術(shù)的識(shí)別方法建構(gòu)

    依據(jù)上述的技術(shù)原理和屬性的動(dòng)態(tài)變化特征,本研究提出基于多維屬性動(dòng)態(tài)變化特征的新興技術(shù)識(shí)別方法,主要研究思路如圖2所示,共分3個(gè)步驟:

    圖2 研究思路

    Step1.數(shù)據(jù)獲取與預(yù)處理。設(shè)立檢索式獲取原始數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗和過濾,以及MWI結(jié)構(gòu)詞的構(gòu)建和時(shí)間切片。

    Step2.技術(shù)演化網(wǎng)絡(luò)構(gòu)建。利用MWI-LDA模型識(shí)別技術(shù)主題,計(jì)算不同切片之間主題的相似度,并判斷相鄰技術(shù)主題的關(guān)系,構(gòu)建技術(shù)演化網(wǎng)絡(luò)。

    Step3.基于多維屬性動(dòng)態(tài)變化特征的指標(biāo)體系構(gòu)建。依據(jù)連貫性、新穎性、關(guān)注性、引領(lǐng)性和無(wú)序性5個(gè)屬性在時(shí)間維度上的變化特征構(gòu)建指標(biāo)體系,識(shí)別新興技術(shù)。

    3.1 MWI-LDA主題模型構(gòu)建

    借鑒以往研究,本研究利用主題模型識(shí)別技術(shù)主題,并依據(jù)新興技術(shù)的屬性特征構(gòu)建了MWILDA主題模型。該模型是對(duì)WI-LDA主題模型[6]的改進(jìn),WI-LDA主題模型是為技術(shù)詞賦予IPC語(yǔ)義背景,但是賦予主IPC號(hào),忽略了副IPC的作用。專利中副IPC號(hào)代表著專利涉及的可能技術(shù)方向,MWI-LDA主題模型不僅考慮了專利主IPC同時(shí)還考慮了專利的副IPC。實(shí)現(xiàn)專利中每一個(gè)IPC到每個(gè)技術(shù)詞的映射,使每一個(gè)技術(shù)詞在同一個(gè)專利中具有不同的技術(shù)背景,豐富、精準(zhǔn)了技術(shù)詞含義,同時(shí)增加了專利中技術(shù)詞數(shù)量,提高了語(yǔ)義表達(dá)能力,緩解數(shù)據(jù)稀疏問題,一定程度增強(qiáng)了專利與具有豐富含義重要低頻詞的共現(xiàn),同時(shí)過濾掉高頻詞,以提高新興技術(shù)識(shí)別的精準(zhǔn)度。MWI-LDA主題模型核心思想是:一篇文章的每一個(gè)MWI詞匯都是以一定的概率選擇了某個(gè)主題,并且這個(gè)主題以一定概率選擇了某個(gè)MWI詞匯。具體模型原理如圖3所示。

    圖3 MWI-LDA主題模型

    在圖3中,空心區(qū)域表示隱含變量;實(shí)心區(qū)域是可觀察到的變量,即MWI技術(shù)詞;實(shí)心方塊是專利i中的IPC向技術(shù)詞的映射。其中,D和Nd分別表示語(yǔ)料庫(kù)中文檔和詞的數(shù)量,K表示主題個(gè)數(shù)。主題模型生成過程與WI-LDA主題模型類似,此處不再贅述。一篇文檔的生成,每一個(gè)結(jié)構(gòu)詞/詞組出現(xiàn)的概率為

    3.2 多維屬性動(dòng)態(tài)變化特征的指標(biāo)體系構(gòu)建

    依據(jù)新興技術(shù)的屬性動(dòng)態(tài)變化特征構(gòu)建指標(biāo)體系,包括傳承性、新穎性、關(guān)注性、引領(lǐng)性、無(wú)序性在時(shí)間維度上的動(dòng)態(tài)變化特征。在3.1節(jié)識(shí)別出技術(shù)主題后,先依據(jù)傳承性識(shí)別技術(shù)演化路徑,再計(jì)算演化路徑上技術(shù)主題的新穎性、關(guān)注性、引領(lǐng)性和無(wú)序性屬性的變化識(shí)別新興技術(shù),具體模型示意圖如圖4所示。

    圖4 多維屬性動(dòng)態(tài)變化特征的新興技術(shù)識(shí)別模型示意圖

    科學(xué)合理的指標(biāo)選取是實(shí)現(xiàn)新興技術(shù)識(shí)別的關(guān)鍵前提。為了提高分析的權(quán)威與客觀性,減少人工干預(yù)的隨意性,在指標(biāo)選取方面遵循能最大限度體現(xiàn)屬性的含義,且客觀、定量的獲取原則。通過文獻(xiàn)調(diào)研總結(jié),最終選取了各屬性的指標(biāo),具體如表1所示。其中被引有正向和負(fù)向被引,本研究認(rèn)為不論是哪一種都能為后續(xù)研究提供了一定的參考和借鑒。

    表1 屬性表征指標(biāo)

    同時(shí)為了便于觀察對(duì)比,本研究把技術(shù)的屬性指標(biāo)與所在時(shí)間階段內(nèi)所有技術(shù)屬性指標(biāo)的均值進(jìn)行比較,形成屬性指標(biāo)指數(shù)。

    3.2.1 繼承性指數(shù)的構(gòu)建

    潛在新興技術(shù)產(chǎn)生有兩種方式,一是在過去某個(gè)時(shí)間點(diǎn)突然產(chǎn)生,并在后續(xù)演化中不斷被繼承(突繼技術(shù));一種是現(xiàn)有技術(shù)分化/分裂而來(lái),并在后續(xù)發(fā)展中不斷被繼承(分繼技術(shù))。技術(shù)隨時(shí)間的推移會(huì)產(chǎn)生一條條技術(shù)演化路徑,具體如圖5所示。另外,突繼技術(shù)的產(chǎn)生并不是完全與原有技術(shù)脫離,只是與原有技術(shù)關(guān)系較弱。

    圖5 技術(shù)演化路徑識(shí)別網(wǎng)絡(luò)

    演化關(guān)系主要包括主題之間的繼承與分化關(guān)系,這種關(guān)系可以通過相似度來(lái)衡量[27]。其中,繼承是同一技術(shù)在不同時(shí)間的具象,從知識(shí)流動(dòng)視角看,知識(shí)隨時(shí)間在不斷發(fā)展、變化,同一技術(shù)在不同時(shí)間內(nèi),知識(shí)會(huì)有變化;同樣,分化是上一階段的知識(shí)擴(kuò)散到下一階段的其他技術(shù)之中,由此產(chǎn)生了關(guān)系。本研究借鑒文獻(xiàn)[29]的方法,利用相鄰時(shí)間段內(nèi)技術(shù)之間的余弦值相似度來(lái)衡量,相似度越高,說(shuō)明關(guān)系越強(qiáng),具體公式為

    其中,A和B表示兩個(gè)不同時(shí)間段技術(shù)分別對(duì)應(yīng)的向量。

    3.2.2 新穎性指數(shù)的構(gòu)建

    新穎性主要是從時(shí)間和內(nèi)容兩個(gè)維度來(lái)測(cè)算的。其中,時(shí)間新穎性(TNk)考慮的是技術(shù)出現(xiàn)的時(shí)間,時(shí)間越晚,代表新穎性越高;內(nèi)容新穎(CNk)考慮的是技術(shù)的研究領(lǐng)域,研究領(lǐng)域擴(kuò)展速度越快,表示內(nèi)容新穎性越高。兩者分別用技術(shù)內(nèi)文本出現(xiàn)的平均時(shí)間、IPC類別和數(shù)量增長(zhǎng)率指標(biāo)來(lái)表示。具體新穎性指數(shù)公式為

    3.2.3 關(guān)注性指數(shù)構(gòu)建

    關(guān)注性主要考慮主題內(nèi)文本數(shù)量和文本屬于技術(shù)的概率兩個(gè)方面,文本數(shù)量越多和文本屬于技術(shù)的概率越大,認(rèn)為其關(guān)注性越大。具體關(guān)注性指數(shù)(TI)公式為

    3.2.4 引領(lǐng)性指數(shù)的構(gòu)建

    本研究采用技術(shù)文本的被引來(lái)表示,技術(shù)內(nèi)文本平均被引越高,發(fā)揮的引領(lǐng)作用就越大。具體引領(lǐng)性指數(shù)(CI)公式為

    其中,表示技術(shù)主題(k)內(nèi)文本(i)的被引數(shù)量(c);n表示文本數(shù)量。

    3.2.5 無(wú)序性指數(shù)構(gòu)建

    無(wú)序性主要測(cè)算技術(shù)研究方向的模糊性,主要利用詞對(duì)距離和信息熵(H)兩個(gè)指標(biāo)。其中,詞之間的距離測(cè)算先利用word2vec得到詞的語(yǔ)義向量,再利用余弦相似度得到詞對(duì)距離,信息熵和詞對(duì)距越大,說(shuō)明無(wú)序性越大。具體無(wú)序性指數(shù)(UI)公式為

    4 新興技術(shù)識(shí)別的實(shí)證研究

    4.1 數(shù)據(jù)獲取與預(yù)處理

    為驗(yàn)證上述新興技術(shù)識(shí)別方法的可行性和有效性,本研究選擇納米醫(yī)學(xué)領(lǐng)域?qū)@M(jìn)行實(shí)證研究。以智慧芽為數(shù)據(jù)源,首先在文獻(xiàn)調(diào)研與專家知識(shí)的基礎(chǔ)上,確定檢索式:TA:(nanomedicine*OR nano‐drug*OR nanomaterial drug*OR nano-drug*OR nano medicine*OR nano drug*),檢索包括中、美、歐、日、韓等116個(gè)國(guó)家和地區(qū)的數(shù)據(jù);檢索時(shí)間為2020年9月28日,時(shí)間跨度為2005—2019年;剔除重復(fù)和不符合規(guī)范專利后,檢索結(jié)果為8443件。劃分?jǐn)?shù)據(jù)集時(shí)借鑒文獻(xiàn)[30]中“固定時(shí)間窗”的方法,結(jié)合不同年份的數(shù)據(jù)量,最后確定每3年為一個(gè)時(shí)間窗,最后劃分為2005-2007、2008-2010、2011-2013、2014-2016、2017-2019共5個(gè)數(shù)據(jù)集,分別包含專利644、987、1525、2353、2934件。

    之后對(duì)檢索得到的數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,主要內(nèi)容為將獲取的發(fā)明名稱與摘要進(jìn)行合并、分詞、名詞提取和停用詞去除[31],同時(shí)利用Python編程實(shí)現(xiàn)專利文本中IPC到技術(shù)詞的映射,并依據(jù)“二八準(zhǔn)則”過濾掉前20%的高頻結(jié)構(gòu)詞。本研究經(jīng)過試驗(yàn)發(fā)現(xiàn),當(dāng)IPC為小組時(shí)最后識(shí)別結(jié)果較優(yōu),所以選擇IPC小組作為語(yǔ)義背景,為下一步新興技術(shù)識(shí)別奠定數(shù)據(jù)基礎(chǔ)。

    4.2 新興技術(shù)識(shí)別過程

    4.2.1 MWI-LDA主題識(shí)別

    在利用MWI-LDA模型識(shí)別之前,本研究利用肘拐點(diǎn)法確定主題數(shù)目。肘拐點(diǎn)法是計(jì)算集群內(nèi)所有數(shù)據(jù)點(diǎn)到中心之間距離的平方誤差總和(sum of squared error,SSE),也稱為困惑度,一般選取困惑度畸變程度最大點(diǎn)作為最優(yōu)主題數(shù)。通過計(jì)算確定5個(gè)時(shí)間段數(shù)據(jù)集的最優(yōu)主題數(shù)分別為5、7、9、13、19,具體的困惑度如圖6所示。

    圖6 主題困惑度計(jì)算結(jié)果

    本實(shí)驗(yàn)參數(shù)具體設(shè)置如下:α(document-topic associations)=50/K(K為主題數(shù)),β(topic-term associ‐ations)=0.1,迭代次數(shù)為2000。

    4.2.2 多維屬性指標(biāo)計(jì)算

    按照上文提出的傳承性指數(shù),對(duì)各數(shù)據(jù)集進(jìn)行繼承性計(jì)算,依據(jù)公式(1)得到相鄰時(shí)期主題的相似度值。主題之間繼承與分化關(guān)系確定需要判斷相似度閾值[30],閾值大小與不同領(lǐng)域以及設(shè)置的時(shí)間窗長(zhǎng)短有關(guān),機(jī)械地設(shè)定一個(gè)固定閾值并不可取[32],可采用人工可調(diào)節(jié)的方式進(jìn)行設(shè)置。借鑒文獻(xiàn)[33]的方法,通過實(shí)驗(yàn)測(cè)試并討論,發(fā)現(xiàn)當(dāng)分化與繼承關(guān)系的最小相似度值分別為0.2與0.5時(shí),效果較好。依據(jù)識(shí)別的關(guān)系得到技術(shù)演化網(wǎng)絡(luò),如圖7所示,依據(jù)連貫性判斷規(guī)則,最后得到11條技術(shù)演化路徑。

    圖7 技術(shù)演化網(wǎng)絡(luò)

    依據(jù)得到的技術(shù)演化路徑進(jìn)行不同時(shí)間軸上新穎性、關(guān)注性、引領(lǐng)性和無(wú)序性的計(jì)算,結(jié)果如表2所示。

    表2 多維屬性值動(dòng)態(tài)變化結(jié)果

    4.3 識(shí)別結(jié)果分析

    依據(jù)識(shí)別指標(biāo)體系中各指標(biāo)隨時(shí)間的變化情況,得到3T0→4T10→5T1、3T5→4T8→5T13和4T7→5T4共3條符合條件的新興技術(shù)演化路徑。在技術(shù)內(nèi)容確定上,本研究對(duì)技術(shù)演化路徑每個(gè)時(shí)間段的技術(shù)詞和整個(gè)演化過程進(jìn)行分析,以確定具體的研究?jī)?nèi)容及其具體演變內(nèi)容,各技術(shù)演化路徑在不同時(shí)間階段上的代表性結(jié)構(gòu)詞分布如表3所示。以下主要以3T0→4T10→5T1為例對(duì)其時(shí)間線上的演化內(nèi)容作具體分析。

    表3 技術(shù)演化路徑在不同時(shí)間段的技術(shù)特征詞分布

    3T0→4T10→5T1是干細(xì)胞納米技術(shù),即利用納米粒子促使干細(xì)胞產(chǎn)生和標(biāo)記干細(xì)胞用于疾病治療的技術(shù)。從內(nèi)容演化來(lái)看,在2011—2013年時(shí)間段,技術(shù)主要集中在利用信號(hào)去追蹤和指導(dǎo)干細(xì)胞開發(fā)的方法或者解決方案上;在2014—2016年時(shí)間段,出現(xiàn)了誘導(dǎo)干細(xì)胞的產(chǎn)生或利用核酸等聚合物作為載體提高干細(xì)胞產(chǎn)生效率的研究;在2017—2019年時(shí)間段,技術(shù)內(nèi)容研究的重點(diǎn)轉(zhuǎn)向疾病的預(yù)防、評(píng)估治療效果以及檢測(cè)。

    4.4 驗(yàn) 證

    4.4.1 效果驗(yàn)證

    2016年,來(lái)自全球64個(gè)大學(xué)或科研機(jī)構(gòu)的86名納米生物學(xué)領(lǐng)域的頂尖學(xué)者在著名的納米類期刊A C S Nano上發(fā)表題為“Diverse Applications of Nano‐medicine”的綜述文章[34],引用796篇文獻(xiàn),全面總結(jié)概述了當(dāng)前納米醫(yī)學(xué)技術(shù)的研究現(xiàn)狀和最新進(jìn)展,截止到2021年6月1日,被引用536次。該文獻(xiàn)較為準(zhǔn)確、客觀地展現(xiàn)了當(dāng)前納米醫(yī)學(xué)領(lǐng)域的新興技術(shù)。為了驗(yàn)證科學(xué)性和完整性,本研究以該綜述為主,以2017-2019數(shù)據(jù)集部分涉及納米醫(yī)學(xué)新興技術(shù)論述的文獻(xiàn)為輔進(jìn)行驗(yàn)證。

    通過對(duì)比,發(fā)現(xiàn)本研究識(shí)別的結(jié)果與專家所述現(xiàn)狀有殊途同歸之處。在技術(shù)方面,專家認(rèn)為干細(xì)胞納米技術(shù)作為新興的交叉技術(shù),在疾病治療和再生醫(yī)學(xué)應(yīng)用領(lǐng)域具有潛力[35];納米造影劑技術(shù)是納米醫(yī)學(xué)領(lǐng)域研究的重點(diǎn)和未來(lái)臨床應(yīng)用中最有希望的候選者,主要研究涉及納米材料的研發(fā)、試劑的制備和與檢測(cè)有關(guān)的儀器;納米癌治療技術(shù)被認(rèn)為是納米醫(yī)學(xué)中最有前途的治療策略,具有巨大的發(fā)展?jié)摿36],當(dāng)前集中在先進(jìn)療法藥物的安全性[37]、有效性和納米材料研制上[38]。本研究識(shí)別的結(jié)果與專家所述現(xiàn)狀也有不同之處。專家認(rèn)為“吸入性納米藥物遞送”是治療全身和肺部疾病的新興領(lǐng)域。“吸入性納米藥物遞送”屬于納米藥物遞送技術(shù),指納米材料承載藥物到達(dá)指定位置,是納米藥物在人體發(fā)揮作用的基礎(chǔ)[39],此技術(shù)應(yīng)用比較寬泛。識(shí)別出的新興技術(shù)內(nèi)均涉及delivery、medicine等技術(shù)詞,該技術(shù)能夠融入3個(gè)技術(shù)之中。

    此外,本研究查找了2005—2019年資助涉及3個(gè)技術(shù)的國(guó)家自然科學(xué)基金的數(shù)量和金額(題目中分別含有“納米與干細(xì)胞”“納米與造影劑”“納米與癌”)。從圖8可以看出,3個(gè)技術(shù)在資助數(shù)量和資助金額上整體呈上升趨勢(shì)。其中,“納米干細(xì)胞技術(shù)”與“納米造影劑技術(shù)”在2010年之前數(shù)量和金額較少,增長(zhǎng)速度慢,處于嬰兒期;技術(shù)不斷沉淀逐漸形成清晰的技術(shù)領(lǐng)域,2011年之后增長(zhǎng)速度加快,且資助布局在不斷擴(kuò)大,形成清晰的技術(shù)領(lǐng)域,進(jìn)入成長(zhǎng)期;“納米癌治療技術(shù)”資助的數(shù)量和金額相對(duì)較少,相對(duì)于前兩個(gè)技術(shù)出現(xiàn)較晚,但2014年有一個(gè)明顯的上升拐點(diǎn),且不斷上升,當(dāng)前正處于嬰兒期,預(yù)計(jì)后期增長(zhǎng)速度會(huì)不斷加快。整體情況與本研究識(shí)別的技術(shù)發(fā)展情況大致相契合。

    圖8 國(guó)家自然科學(xué)基金項(xiàng)目資助的數(shù)量與金額

    4.4.2 對(duì)比驗(yàn)證

    本研究在上文文獻(xiàn)綜述基礎(chǔ)上結(jié)合具有普遍性的識(shí)別框架[20],提取一種常用的新興技術(shù)識(shí)別方法:利用LDA主題模型識(shí)別技術(shù),使用新穎性指標(biāo)找到新興技術(shù);其中新穎性是利用技術(shù)內(nèi)專利申請(qǐng)的時(shí)間均值來(lái)表示的,時(shí)間越晚,新穎度越高。利用與本研究相同的數(shù)據(jù)與處理方法通過計(jì)算得到新穎度,結(jié)果如表4所示。

    表4 技術(shù)分布及其新穎度

    通過對(duì)比發(fā)現(xiàn),本研究提出的方法優(yōu)勢(shì)主要體現(xiàn)在三個(gè)方面:①M(fèi)WI-LDA主題模型降低了技術(shù)識(shí)別難度,LDA主題模型得出的結(jié)果因一詞多義現(xiàn)象導(dǎo)致主題解讀困難,例如,material在B82Y30/00下是納米復(fù)合材料,在C01G53/04下則是氧化物或者是氫氧化物材料;而MWI-LDA則考慮了此方面,降低了技術(shù)識(shí)別的難度;②動(dòng)態(tài)呈現(xiàn)技術(shù)在不同時(shí)間段下的內(nèi)容及其發(fā)展情況;③提高了識(shí)別的準(zhǔn)確度,本研究對(duì)新穎度最高的3個(gè)技術(shù)進(jìn)行解讀分析,發(fā)現(xiàn)topic_7為納米癌治療技術(shù),topic_5是納米藥物制備技術(shù),topic_9為DNA納米技術(shù),其中只有topic_7識(shí)別正確;同時(shí)發(fā)現(xiàn)topic_2涉及納米造影劑技術(shù)的內(nèi)容,但其新穎度卻排在第6位,且沒有識(shí)別出納米干細(xì)胞技術(shù),相比而言,本研究提出方法識(shí)別的結(jié)果更符合現(xiàn)實(shí)情況。

    綜上,本研究識(shí)別的新興技術(shù)與當(dāng)前納米醫(yī)學(xué)領(lǐng)域的新興研究相匹配,技術(shù)具體研究?jī)?nèi)容也與現(xiàn)實(shí)技術(shù)內(nèi)容基本吻合,通過專家意見與國(guó)家自然科學(xué)基金資助數(shù)量和金額對(duì)識(shí)別的結(jié)果進(jìn)行旁證,并與普遍的方法進(jìn)行對(duì)比分析,證明本研究新構(gòu)建的主題模型和識(shí)別方法的可行性與有效性。同時(shí)發(fā)現(xiàn)能夠細(xì)粒度地展現(xiàn)技術(shù)內(nèi)容的演化,例如,干細(xì)胞納米技術(shù)呈現(xiàn)為從開始的干細(xì)胞開發(fā)到提升生產(chǎn)效率,最后涉及技術(shù)應(yīng)用,能夠動(dòng)態(tài)、細(xì)粒度識(shí)別研究?jī)?nèi)容和發(fā)展過程。

    5 結(jié)論與不足

    本研究提出了基于新興技術(shù)屬性在時(shí)間線上的強(qiáng)弱變化識(shí)別新興技術(shù)的新方法。首先,界定了具體定義,明確了新興技術(shù)的新穎性、繼承性、關(guān)注性、引領(lǐng)性和無(wú)序性5個(gè)屬性;其次,依據(jù)屬性在時(shí)間軸上的變化特征構(gòu)建指標(biāo)體系識(shí)別新興技術(shù);最后,對(duì)納米醫(yī)學(xué)領(lǐng)域進(jìn)行驗(yàn)證的結(jié)果表明,本研究提出的方法能有效識(shí)別新興技術(shù),有助于分析新興技術(shù)現(xiàn)狀和推演技術(shù)發(fā)展態(tài)勢(shì),能夠?yàn)榭萍脊芾聿块T和科研人員在需要新興技術(shù)研判時(shí)提供有效的決策數(shù)據(jù)支持,輔助把握新興技術(shù)及其未來(lái)走向,尤其隨著技術(shù)交叉越來(lái)越普遍,可為科研人員快速了解其他領(lǐng)域提供方法支撐。

    該研究的貢獻(xiàn)有兩點(diǎn)。第一,在理論上,界定了新興技術(shù)的定義和屬性特征,一定程度上解決了指標(biāo)與新興技術(shù)屬性之間缺乏關(guān)聯(lián)的問題,可為后續(xù)相關(guān)研究提供理論基礎(chǔ)支撐。第二,在方法上,①提供了一種新興技術(shù)識(shí)別的新方法,加入時(shí)間線、基于多維屬性動(dòng)態(tài)變化特征的研究思路也可以用到其他領(lǐng)域(如技術(shù)機(jī)會(huì)識(shí)別和前沿技術(shù)識(shí)別等);②依據(jù)屬性從數(shù)量的宏觀角度和文本內(nèi)部技術(shù)詞的微觀角度構(gòu)建了多維屬性指標(biāo),改善了已有研究指標(biāo)單一的不足;③針對(duì)當(dāng)前主題模型存在的不足,構(gòu)建了MWI-LDA主題模型,能夠完善技術(shù)詞語(yǔ)義,提升主題可解釋性,提高新興技術(shù)識(shí)別的準(zhǔn)確率。

    本研究尚存在一些不足。首先,MWI-LDA模型雖然提高了技術(shù)主題識(shí)別率,但其運(yùn)算矩陣過大,如何在提高技術(shù)識(shí)別率的同時(shí)縮短運(yùn)算時(shí)間,是未來(lái)繼續(xù)改進(jìn)的方向;其次,未來(lái)發(fā)展態(tài)勢(shì)是新興技術(shù)識(shí)別的重要后續(xù)研究,雖然本研究利用演化做了嘗試,但如何針對(duì)性地提出解決方法是后續(xù)研究的方向之一;最后,發(fā)明名稱和摘要之間合理的權(quán)重是提高準(zhǔn)確率的一個(gè)方面,如何為其賦予權(quán)重也是后續(xù)研究方向之一。

    猜你喜歡
    新穎性納米研究
    納米潛艇
    FMS與YBT相關(guān)性的實(shí)證研究
    遼代千人邑研究述論
    外觀新穎性對(duì)消費(fèi)者購(gòu)買意愿的影響:自我建構(gòu)與產(chǎn)品類型的調(diào)節(jié)效應(yīng)
    視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
    科技傳播(2019年22期)2020-01-14 03:06:54
    EMA伺服控制系統(tǒng)研究
    日本計(jì)劃將新穎性寬限期延長(zhǎng)至12個(gè)月
    納米SiO2的制備與表征
    超細(xì)YF3與GdF3納米晶的合成及其上轉(zhuǎn)換發(fā)光
    《國(guó)防專利條例》新穎性標(biāo)準(zhǔn)應(yīng)當(dāng)及時(shí)進(jìn)行修改
    金门县| 城固县| 景东| 弋阳县| 丰县| 台安县| 宁陕县| 介休市| 故城县| 台北市| 敦煌市| 临沭县| 武山县| 盐山县| 呼和浩特市| 乐清市| 彩票| 安顺市| 新干县| 门源| 嘉兴市| 和田市| 象山县| 临夏县| 江阴市| 兴宁市| 遂宁市| 邵阳市| 广灵县| 绩溪县| 梁山县| 安乡县| 蛟河市| 淮北市| 谢通门县| 白城市| 上杭县| 多伦县| 蓬溪县| 道孚县| 正安县|