• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)科學(xué)驅(qū)動(dòng)下ESI潛力學(xué)科入圍預(yù)測方法的實(shí)踐探索

      2019-12-04 02:18:14
      關(guān)鍵詞:象限潛力論文

      自我國提出建設(shè)世界一流大學(xué)和一流學(xué)科(簡稱“雙一流”)目標(biāo)[1]以來,ESI(Essential Science Indicators,基本科學(xué)指標(biāo)[2])就與“雙一流”學(xué)科建設(shè)就產(chǎn)生了千絲萬縷的聯(lián)系。2016年的第四輪學(xué)科評(píng)估工作中,教育部首次明確要求使用ESI作為衡量學(xué)術(shù)產(chǎn)出水平的重要指標(biāo)。之后,各地對(duì)ESI學(xué)科發(fā)展進(jìn)行定期的動(dòng)態(tài)跟蹤,ESI及其相關(guān)分析越來越受到政府部門、各高校、科研機(jī)構(gòu)的關(guān)注和重視。目前,ESI已成為全球反映學(xué)科論文質(zhì)量、體現(xiàn)學(xué)科競爭力和影響力的權(quán)威工具,并把學(xué)科能否進(jìn)入ESI全球前1%作為評(píng)價(jià)學(xué)科水平高低的重要標(biāo)準(zhǔn)之一[3]。

      1 數(shù)據(jù)與方法

      通過檢索維普期刊全文數(shù)據(jù)庫、中國知網(wǎng)(CNKI)的期刊全文數(shù)據(jù)庫、萬方期刊全文數(shù)據(jù)庫3個(gè)國內(nèi)知名數(shù)據(jù)庫進(jìn)行文獻(xiàn)調(diào)研[4],使用“ESI”合并“預(yù)測”或“趨勢”作為檢索入口詞,不限定檢索年限,發(fā)現(xiàn)我國對(duì)ESI學(xué)科的預(yù)測分析從2011年開始,近二三年通過文獻(xiàn)計(jì)量學(xué)和情報(bào)學(xué)等研究方法對(duì)學(xué)科趨勢進(jìn)行預(yù)測分析比較活躍,截止到2019年7月20日,此類論文約有20余篇。其中,“學(xué)術(shù)機(jī)構(gòu)入圍ESI前1%學(xué)科時(shí)間的曲線擬合預(yù)測方法研究[5]”“基于ESI和InCites的高校潛力學(xué)科發(fā)展預(yù)測[6]”以及“基于ESI的潛力學(xué)科預(yù)測模型修正和實(shí)證分析[7]”等3篇論文均在業(yè)內(nèi)具有較高的關(guān)注度和影響力,但增加合并“暗數(shù)據(jù)”或“dark data”后只發(fā)現(xiàn)1篇相關(guān)文獻(xiàn)。從檢索結(jié)果可知,在文獻(xiàn)報(bào)道方面,國內(nèi)對(duì)此研究接近空白。

      “雙一流”建設(shè)需要放眼全球,定位不僅僅是國內(nèi)的同行,還有世界一流高校及其優(yōu)勢學(xué)科,涉及的成果數(shù)已經(jīng)達(dá)到大數(shù)據(jù)量級(jí)。已進(jìn)入ESI全球前1%的研究機(jī)構(gòu)的學(xué)科情況是直觀可見的,可通過直接登入ESI數(shù)據(jù)庫檢索獲得,但尚未進(jìn)入的潛力學(xué)科則是不可見的,筆者將其定義為“暗數(shù)據(jù)”范疇。從分析的廣度來看,符合“暗數(shù)據(jù)”作為大數(shù)據(jù)主體的數(shù)據(jù)分析量[4]。

      潛力學(xué)科需要聯(lián)合使用ESI數(shù)據(jù)庫的閾值(圖1)和InCites數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行合并計(jì)算,才能估算出該機(jī)構(gòu)某學(xué)科進(jìn)入ESI全球前1%的可能性。從分析的深度來看,該過程則可看作是“暗數(shù)據(jù)”的可視化分析。

      本文以“暗數(shù)據(jù)”可視化分析與ESI潛力學(xué)科入圍全球前1%的趨勢預(yù)測的耦合關(guān)系作為主要研究對(duì)象,通過對(duì)ESI學(xué)科數(shù)據(jù)定期抓取與分析,合并使用WOS-SCIE、InCites、ESI、SQL數(shù)據(jù)庫,聯(lián)用SWOT分析法、文獻(xiàn)調(diào)研法和回歸分析法等進(jìn)行文獻(xiàn)計(jì)量學(xué)分析,實(shí)現(xiàn)機(jī)構(gòu)學(xué)科潛力全景分析,構(gòu)建潛力學(xué)科入圍所需論文篇數(shù)的線性預(yù)測公式,并分別從絕對(duì)指標(biāo)和相對(duì)指標(biāo)的不同維度搭建入圍預(yù)測的絕對(duì)指標(biāo)和相對(duì)指標(biāo)2個(gè)數(shù)據(jù)模型,嘗試對(duì)ESI潛力學(xué)科進(jìn)行態(tài)勢分析與趨勢預(yù)測,從絕對(duì)指標(biāo)和相對(duì)指標(biāo)的不同維度歸納合理或通用的預(yù)測方法,為更好地挖掘未來發(fā)展?jié)摿W(xué)科提供高效且通用的預(yù)測方法,為進(jìn)一步研究“雙一流”學(xué)科建設(shè)提供參考依據(jù)和經(jīng)驗(yàn)借鑒。

      2 結(jié)果與分析

      首先通過SWOT進(jìn)行某機(jī)構(gòu)當(dāng)前學(xué)科的全景分析,尋找其當(dāng)前最具發(fā)展?jié)摿Φ?個(gè)或多個(gè)潛力學(xué)科,然后確定具體分析目標(biāo)并實(shí)施下一步的潛力深挖??紤]到潛力學(xué)科的測算數(shù)據(jù)主體主要來源于InCites數(shù)據(jù)庫,并通過對(duì)某機(jī)構(gòu)一定時(shí)期的數(shù)據(jù)動(dòng)態(tài)跟蹤分析積累數(shù)據(jù)樣本,分別從絕對(duì)指標(biāo)和相對(duì)指標(biāo)的不同維度嘗試探尋入圍預(yù)測方法的規(guī)律性。

      2.1 學(xué)科發(fā)展?jié)摿θ胺治?/h3>

      從SWOT分析的角度定量研究ESI學(xué)科發(fā)展優(yōu)、劣勢預(yù)估分析。圖2中,X軸以Web of Science論文數(shù)表示,為絕對(duì)指標(biāo);Y軸以學(xué)科規(guī)范化引文影響力(CNCI)表示,為相對(duì)指標(biāo),它表示機(jī)構(gòu)某學(xué)科的文獻(xiàn)產(chǎn)量占該機(jī)構(gòu)文獻(xiàn)總產(chǎn)量的比例除以全球該學(xué)科的文獻(xiàn)產(chǎn)量占全球文獻(xiàn)總產(chǎn)量的比例的比值。這是一個(gè)均一化指標(biāo),排除了出版年、學(xué)科領(lǐng)域與文獻(xiàn)類型的影響,是反映質(zhì)量和效率的指標(biāo)。如果CNCI值等于1,說明該組論文的被引表現(xiàn)與全球平均水平相當(dāng);如果CNCI值大于1,表明該組論文的被引表現(xiàn)高于全球平均水平;如果CNCI值小于1,表明該組論文的被引表現(xiàn)低于全球平均水平。Y軸揭示了機(jī)構(gòu)在各學(xué)科的相對(duì)科研產(chǎn)出是否高于全球平均值1的水平,圖中每個(gè)圓圈的面積大小表示22個(gè)ESI學(xué)科的被引頻次多少。由于學(xué)科、年代的不同,被引頻次的高低沒有直接可比性,故引入歸一化的CNCI。因而,圖2表示在發(fā)文數(shù)量和引用影響不同的狀態(tài)下,體現(xiàn)各個(gè)學(xué)科在歸一化之后的影響力差異比較。

      圖2 某研究機(jī)構(gòu)22個(gè)ESI學(xué)科SWOT分析

      圖2中右上角的第一象限代表優(yōu)勢(Strengths),該區(qū)域的學(xué)科文獻(xiàn)產(chǎn)量占比高且具有高引文影響力;左上角的第二象限代表機(jī)會(huì)(Opportunities),該區(qū)域的學(xué)科文獻(xiàn)產(chǎn)量占比較小,但相對(duì)于全球平均水平而言具有較高的引文影響力。這兩個(gè)象限的所在學(xué)科都是該機(jī)構(gòu)當(dāng)前發(fā)展關(guān)注的重點(diǎn)對(duì)象,也是對(duì)潛力學(xué)科進(jìn)行深挖掘的關(guān)注區(qū)域。從圖2中也可以看出,基于目前的數(shù)據(jù)和4個(gè)象限制定的規(guī)則來看,位于優(yōu)勢學(xué)科區(qū)域的分別有臨床醫(yī)學(xué)、分子生物與遺傳學(xué)、藥理與毒理學(xué)3個(gè)學(xué)科,其論文產(chǎn)出占比和引文影響力均超過了全球平均水平;而第二象限的免疫學(xué)、精神病學(xué)2個(gè)學(xué)科已比較接近第一象限,雖然這些學(xué)科的產(chǎn)出絕對(duì)數(shù)量較少,但其引文影響力均超過了全球平均水平1,未來可能轉(zhuǎn)化為優(yōu)勢學(xué)科的機(jī)會(huì)較大。它們都可為學(xué)校未來的規(guī)劃提供更為合適的建議和本機(jī)構(gòu)未來發(fā)展規(guī)劃的重點(diǎn)關(guān)注對(duì)象。此外,圖2左下角的第三象限的ESI學(xué)科,由于發(fā)文量較少,CNCI被引表現(xiàn)也尚未達(dá)到全球平均水平,屬于潛力較弱的學(xué)科(weaknesses);而位于右下角的第四象限的學(xué)科雖然文獻(xiàn)產(chǎn)量較高,但影響力表現(xiàn)也尚未達(dá)到全球平均水平,屬于受到威脅的學(xué)科(threats)。位于這2個(gè)象限的學(xué)科,由于其學(xué)術(shù)水平均較低,對(duì)于本文對(duì)潛力學(xué)科的確定分析相關(guān)度不大,因而在此不再贅述。

      2.2 線性預(yù)測公式

      ESI潛力學(xué)科當(dāng)前所需該學(xué)科論文篇數(shù)的線性預(yù)測公式如下:

      (公式1)

      公式中,Pi表示所需新增論文數(shù),Xy表示該學(xué)科進(jìn)入全球前1%被引的閾值次數(shù)(圖1),Xi表示某機(jī)構(gòu)該學(xué)科當(dāng)時(shí)已達(dá)到的被引次數(shù),Yi表示某機(jī)構(gòu)該學(xué)科的篇均被引次數(shù)。

      明確學(xué)校當(dāng)前的學(xué)科發(fā)展?jié)摿螅瑒t對(duì)第二象限重點(diǎn)關(guān)注的潛力學(xué)科做進(jìn)一步的預(yù)測研究,可通過預(yù)測公式(公式1)估算。但此公式是按照ESI對(duì)近10年收錄論文規(guī)律的統(tǒng)計(jì),并按照當(dāng)前的發(fā)展速度進(jìn)行推演的。實(shí)際上,新出版的論文一般在出版2-3年后才進(jìn)入引用高峰期,“新增論文的被引次數(shù)”往往低于作為分母的“某機(jī)構(gòu)該學(xué)科的篇均被引次數(shù)”,而且該公式并未考慮現(xiàn)有論文的被引次數(shù)繼續(xù)增加的情況。所以所需新增論文數(shù)與實(shí)際存在一定的差距[5],只能作為粗略估算的摸底嘗試。

      2.3 絕對(duì)指標(biāo)模型

      目前,各機(jī)構(gòu)更多關(guān)注的是該潛力學(xué)科需要多長時(shí)間才能進(jìn)入ESI全球前1%。對(duì)于這個(gè)時(shí)間長度問題,筆者根據(jù)近年來從InCites數(shù)據(jù)庫定期更新并抓取下來的潛力學(xué)科數(shù)據(jù)尋找規(guī)律,利用回歸算法繪制入圍時(shí)間預(yù)測的擬合趨勢模型,形成圖3的絕對(duì)指標(biāo)預(yù)測模型。

      圖3 回歸算法預(yù)測潛力學(xué)科入圍時(shí)間趨勢模型

      圖3是以廣州醫(yī)科大學(xué)藥理與毒理學(xué)ESI學(xué)科為例,于2017年底至2018年初建立了該學(xué)科的預(yù)測模型。該模型通過進(jìn)一步修正誤差得到量化的入圍差距,充分考慮到每年5月份ESI與InCites數(shù)據(jù)庫將對(duì)統(tǒng)計(jì)周期進(jìn)行滾動(dòng)10年的特定年份進(jìn)行割舍,從而造成閾值預(yù)估值顯著下調(diào)等客觀因素影響。

      從圖3可以看出,藍(lán)綠色線條代表該學(xué)科進(jìn)入全球前1%的閾值變化和預(yù)估值變化情況,紫色線條代表該學(xué)科被引頻次的預(yù)估值變化情況,2條線的預(yù)測公式如下。

      y=15.612x+3076.9,R2=0.3301

      (公式2)

      y=108.82x+2100,R2=0.7858

      (公式3)

      兩條曲線的相交點(diǎn)對(duì)應(yīng)于2019年3月至5月之間,因而推斷廣州醫(yī)科大學(xué)藥理與毒理學(xué)ESI學(xué)科的入圍時(shí)間預(yù)計(jì)為2019年上半年[5]。經(jīng)過與實(shí)際情況驗(yàn)證,預(yù)測時(shí)間與實(shí)際入圍時(shí)間完全相符,廣州醫(yī)科大學(xué)的藥理與毒理學(xué)ESI學(xué)科在2019年3月份如期入圍。

      2.4 相對(duì)指標(biāo)模型

      某機(jī)構(gòu)的學(xué)科進(jìn)入ESI意味著它在某學(xué)科的總被引頻次達(dá)到全球的前1%。這是一個(gè)相對(duì)指標(biāo),表示某學(xué)科論文的總被引頻次與閾值的比值是較常用的標(biāo)準(zhǔn)化測算方法。在積累了一定時(shí)間段機(jī)構(gòu)學(xué)科數(shù)據(jù)的前提下,具有一定的合理性,能比較合理地描述尚未入圍的潛力學(xué)科與已入圍的ESI學(xué)科的接近度。

      圖4是以廣州醫(yī)科大學(xué)分子生物與遺傳學(xué)ESI學(xué)科為例建立的入圍預(yù)測的相對(duì)指標(biāo)模型,數(shù)據(jù)樣本從2016年9月至2019年7月,3年共18個(gè)周期[8]。

      從圖4中可見,紅色曲線為分子生物與遺傳學(xué)ESI學(xué)科每個(gè)周期與閾值比對(duì)后得出的入圍可能性,藍(lán)色直線為修正偏差后的預(yù)測趨勢線,兩條線的相交點(diǎn)對(duì)應(yīng)于2019年11月之后,因而推斷廣州醫(yī)科大學(xué)分子生物與遺傳學(xué)ESI學(xué)科的入圍時(shí)間預(yù)計(jì)為2020年初,今后將進(jìn)一步關(guān)注和驗(yàn)證。

      圖4 潛力學(xué)科入圍預(yù)測的相對(duì)指標(biāo)模型

      3 討論

      由于數(shù)據(jù)主體均為預(yù)估值,因而誤差的存在有一定的必然性,主要涉及以下3方面的原因。

      3.1 數(shù)據(jù)統(tǒng)計(jì)源的客觀偏差

      ESI學(xué)科論文總被引頻次的統(tǒng)計(jì)來源為SCI-E、SSCI 和A&HCI數(shù)據(jù)庫;而在測算過程中使用的InCites數(shù)據(jù)庫統(tǒng)計(jì)范圍更廣泛,除了來自上述3個(gè)數(shù)據(jù)庫的被引頻次外,還包含來自CPCI-S、CPCI-SSH、ESCI等其他數(shù)據(jù)庫的被引頻次[6],無法通過檢索操作簡單區(qū)分。因此,通過InCites數(shù)據(jù)庫統(tǒng)計(jì)的潛力學(xué)科總被引頻次可能比實(shí)際閾值稍大,在預(yù)測模型中的測算值將略高于實(shí)際數(shù)值;同時(shí)ESI和InCites數(shù)據(jù)庫由于更新頻率的步調(diào)并不完全一致,導(dǎo)致統(tǒng)計(jì)時(shí)所截取的時(shí)間軸長短也并不完全吻合;此外,數(shù)據(jù)樣本的多寡也會(huì)影響模型曲線走勢描摹的精準(zhǔn)度。它們都可能對(duì)潛力學(xué)科的入圍預(yù)測帶來較難避免的客觀因數(shù)誤差。圖3和圖4分別是對(duì)2個(gè)不同的ESI學(xué)科進(jìn)行較長時(shí)間的數(shù)據(jù)跟蹤和抓取分析而繪制的,尤其是圖4的分子生物與遺傳學(xué),經(jīng)過3年左右的歷史數(shù)據(jù)積累,呈現(xiàn)較直觀的一元線性回歸模型。通過擬合分析發(fā)現(xiàn)以上2個(gè)ESI學(xué)科的數(shù)據(jù)分布均呈現(xiàn)出線性趨勢。雖然這經(jīng)過了實(shí)踐的初步檢驗(yàn),但僅能體現(xiàn)有限范圍的短期預(yù)測效果。今后我們將對(duì)更多的ESI學(xué)科數(shù)據(jù)做進(jìn)一步的動(dòng)態(tài)跟蹤和擬合分析,對(duì)是否符合線性發(fā)展趨勢做更深入的嘗試。

      3.2 人才流動(dòng)或政策引導(dǎo)變化

      根據(jù)以往的數(shù)據(jù)分析可以看到每個(gè)機(jī)構(gòu)的發(fā)展都不盡相同,當(dāng)機(jī)構(gòu)的指導(dǎo)政策或人才隊(duì)伍發(fā)生變動(dòng)時(shí),可能會(huì)影響機(jī)構(gòu)整體或個(gè)別學(xué)科的發(fā)展。如當(dāng)引入某一優(yōu)秀人才團(tuán)隊(duì)或者發(fā)布一些相關(guān)激勵(lì)措施時(shí),可能會(huì)在短時(shí)間內(nèi)迅速提升機(jī)構(gòu)某學(xué)科的影響力;反之,某一高水平科研人員/團(tuán)隊(duì)離開時(shí),也可能會(huì)造成進(jìn)入該學(xué)科前1%的速度放緩。

      3.3 高水平論文或期刊的學(xué)科歸屬變動(dòng)

      實(shí)際上,是否入圍ESI只以被引頻次高低這一單一指標(biāo)作為依據(jù),在使用時(shí)較容易受到高水平論文(即高被引論文或熱點(diǎn)論文)的影響。如果ESI學(xué)科論文所屬期刊的ESI學(xué)科歸屬有所調(diào)整,如有新的期刊進(jìn)入該學(xué)科或另一些期刊從該學(xué)科被剔除出去時(shí),該學(xué)科的閾值發(fā)展就會(huì)變得難以預(yù)測。而圖3和圖4中的設(shè)定是在假設(shè)該學(xué)科期刊收錄量不變的前提下,對(duì)未來的閾值數(shù)據(jù)進(jìn)行大膽假設(shè)而形成的趨勢模型。

      4 結(jié)語

      入選ESI與否只是一個(gè)結(jié)果,實(shí)現(xiàn)它的方法、過程和途徑既是本文研究的立足點(diǎn),也是實(shí)施“雙一流”建設(shè)以來一直受到關(guān)注的熱點(diǎn)議題之一。在預(yù)測方法的實(shí)踐探索中,其數(shù)據(jù)主體均為預(yù)估值,誤差的存在有一定的必然性。這既受到數(shù)據(jù)統(tǒng)計(jì)源的客觀偏差、人才流動(dòng)或政策引導(dǎo)變化、論文或期刊的學(xué)科歸屬變動(dòng)等眾多客觀因素的影響,也受到構(gòu)建模型或研究方法等各種主觀因素的干擾。雖然本文對(duì)2個(gè)不同的ESI學(xué)科進(jìn)行了較長時(shí)間的數(shù)據(jù)跟蹤和抓取分析,部分學(xué)科經(jīng)過3年左右的歷史數(shù)據(jù)積累,呈現(xiàn)出較直觀的一元線性回歸模型,也經(jīng)過了實(shí)踐的初步檢驗(yàn),但僅能體現(xiàn)有限范圍的短期預(yù)測效果。今后我們將對(duì)更多的ESI學(xué)科數(shù)據(jù)進(jìn)行進(jìn)一步的動(dòng)態(tài)跟蹤和擬合分析,對(duì)是否符合線性發(fā)展趨勢做更深入的嘗試。

      這項(xiàng)工作能夠協(xié)助領(lǐng)導(dǎo)決策層、科研管理人員實(shí)時(shí)跟蹤本機(jī)構(gòu)的研究產(chǎn)出和影響力,并將研究績效與其他機(jī)構(gòu)甚至是全球的平均值進(jìn)行對(duì)比,發(fā)掘機(jī)構(gòu)內(nèi)學(xué)術(shù)影響力較高或具備發(fā)展?jié)摿Φ难芯咳藛T,挖掘潛在的科研合作機(jī)會(huì)[9]。今后,在進(jìn)行學(xué)科影響力估算和預(yù)測時(shí),除了探索文獻(xiàn)計(jì)量學(xué)等較直觀的定量方法外,還應(yīng)結(jié)合更多維度的其他評(píng)價(jià)指標(biāo),如南京大學(xué)葉繼元教授課題組“全評(píng)價(jià)”分析框架等[10],實(shí)現(xiàn)定量與定性分析的兼容并蓄,尋求對(duì)學(xué)術(shù)評(píng)價(jià)更全面、更客觀、通用和可靠的可視化分析方法,助力“雙一流”建設(shè),探尋決策咨詢等深層次信息服務(wù)的新一輪飛躍。

      猜你喜歡
      象限潛力論文
      復(fù)數(shù)知識(shí)核心考點(diǎn)綜合演練
      基于四象限零電壓轉(zhuǎn)換PWM軟開關(guān)斬波器的磁懸浮列車
      電子測試(2018年11期)2018-06-26 05:56:04
      潛力榜
      平面直角坐標(biāo)系典例分析
      PPP模式怎樣發(fā)揮最大潛力?
      學(xué)習(xí)潛力揭秘
      12星座
      創(chuàng)新思維竟賽
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      花莲县| 尚志市| 罗江县| 南城县| 汉川市| 襄汾县| 周口市| 琼海市| 徐汇区| 化德县| 郁南县| 庆元县| 噶尔县| 年辖:市辖区| 济阳县| 龙井市| 孟津县| 安远县| 易门县| 岱山县| 黎平县| 石城县| 白河县| 洛浦县| 深泽县| 桓台县| 安岳县| 南昌县| 务川| 左云县| 阿拉善盟| 太和县| 泰宁县| 莱芜市| 西吉县| 东光县| 雷波县| 郴州市| 孟津县| 乐安县| 广安市|