• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      領(lǐng)域性科研機(jī)構(gòu)的研究熱度評價(jià)方法

      2015-09-27 08:22:58劉金花
      現(xiàn)代計(jì)算機(jī) 2015年29期
      關(guān)鍵詞:數(shù)量論文領(lǐng)域

      劉金花

      (山西醫(yī)科大學(xué)汾陽學(xué)院衛(wèi)生信息管理系,汾陽 032200)

      領(lǐng)域性科研機(jī)構(gòu)的研究熱度評價(jià)方法

      劉金花

      (山西醫(yī)科大學(xué)汾陽學(xué)院衛(wèi)生信息管理系,汾陽032200)

      0 引言

      科學(xué)技術(shù)的高速發(fā)展促使科技文獻(xiàn)知識(shí)的研究也日益專門化,作為創(chuàng)新主體的科研工作者他們對快速獲取有用的信息和知識(shí)變的更為迫切,在現(xiàn)實(shí)情況中,通過查找關(guān)鍵詞在電子檢索系統(tǒng)檢索到的相關(guān)文獻(xiàn)成千上萬篇。很多準(zhǔn)備從事科研工作的人員,希望能夠?qū)δ骋豢蒲蓄I(lǐng)域的主要研究機(jī)構(gòu)有一個(gè)完整的、具體的認(rèn)識(shí);然后決定奔赴哪個(gè)科研機(jī)構(gòu)學(xué)習(xí)或者是增加與哪個(gè)科研機(jī)構(gòu)的學(xué)術(shù)交流等。

      本文提出了科技文獻(xiàn)科研機(jī)構(gòu)的熱度挖掘方法,文中綜合考慮了某領(lǐng)域研究機(jī)構(gòu)中研究人員的數(shù)量、發(fā)表文章的數(shù)量和學(xué)術(shù)水平三方面的因素,對科研機(jī)構(gòu)在給定領(lǐng)域的研究熱度進(jìn)行打分。然后用同樣的評價(jià)方法獲得每個(gè)機(jī)構(gòu)在各個(gè)時(shí)間段的研究熱度值,我們就可以清晰的看出各個(gè)研究機(jī)構(gòu)在給定領(lǐng)域的研究熱度趨勢,以便預(yù)測將來的發(fā)展趨勢。

      1 實(shí)驗(yàn)數(shù)據(jù)結(jié)構(gòu)

      1.1數(shù)據(jù)來源

      本文研究的數(shù)據(jù)來源于1999-2010年的中國學(xué)術(shù)期刊網(wǎng)站,以“機(jī)器翻譯”作為搜索的關(guān)鍵詞搜索文獻(xiàn)。選取其中被引用頻次超過一次(包含一次)的文獻(xiàn),抽取了文獻(xiàn)數(shù)據(jù)中的論文標(biāo)題、作者、摘要、標(biāo)題、研究機(jī)構(gòu)、發(fā)表時(shí)間、被引用頻次、被下載頻次、分類編號(hào)等10個(gè)字段,導(dǎo)入到MySQL數(shù)據(jù)庫中。舍棄被引頻次小于1的文獻(xiàn),是因?yàn)闆]有引用頻次的文章我們可以認(rèn)為這些文獻(xiàn)的學(xué)術(shù)價(jià)值是比較低的,并且沒有引用頻次的文獻(xiàn)大都不是來自主流的期刊和會(huì)議。

      1.2文獻(xiàn)機(jī)構(gòu)信息統(tǒng)計(jì)

      對于每篇文章所隸屬的研究機(jī)構(gòu)進(jìn)行統(tǒng)計(jì),因?yàn)檎撐牡难芯繖C(jī)構(gòu)署名在不同的階段單位名稱會(huì)有稍微的差別,但是其實(shí)都屬于一個(gè)研究單位,例如:“中國科學(xué)院自動(dòng)化研究所”,有時(shí)候也簡稱為“中科院自動(dòng)化研究所”。所以本文在統(tǒng)計(jì)機(jī)構(gòu)信息時(shí),對這些機(jī)構(gòu)單位進(jìn)行了統(tǒng)一處理,將同一所大學(xué)的整理為同一個(gè)研究機(jī)構(gòu)。我們對本文的實(shí)驗(yàn)數(shù)據(jù)的機(jī)構(gòu)信息及其所在1999-2010這12年間發(fā)表的文章數(shù)量做了統(tǒng)計(jì),在“機(jī)器翻譯”領(lǐng)域發(fā)表的文章中,署名的機(jī)構(gòu)數(shù)總共有688個(gè),大部分是高等院校,還有一些研究所等。表1中只列出了發(fā)文數(shù)量超過20(包括20)篇的研究機(jī)構(gòu)。

      2 研究機(jī)構(gòu)的研究熱度分析

      由于絕大多數(shù)的人都關(guān)心的是某一領(lǐng)域中的核心研究機(jī)構(gòu),因?yàn)檫@些機(jī)構(gòu)的研究人員和發(fā)文數(shù)量都是非常高的,故我們在對研究機(jī)構(gòu)進(jìn)行熱度評價(jià)之前,可以進(jìn)行一些過濾操作以確定主要的研究機(jī)構(gòu),然后再對這些主要的研究機(jī)構(gòu)進(jìn)行研究熱度值評價(jià)。另外,各個(gè)研究機(jī)構(gòu)對該領(lǐng)域研究熱度可以通過該機(jī)構(gòu)發(fā)表的論文數(shù)量、研究人員數(shù)量等信息來反映出來,但是一般反映一個(gè)研究機(jī)構(gòu)的學(xué)術(shù)研究水平及研究的深度,僅僅通過數(shù)量是不夠的,還應(yīng)該考慮到該機(jī)構(gòu)發(fā)表論文的質(zhì)量。因此研究機(jī)構(gòu)的熱度分析可以按照以下流程進(jìn)行,如圖1所示。

      圖1 研究機(jī)構(gòu)熱度分析流程圖

      表1文獻(xiàn)的機(jī)構(gòu)信息及發(fā)文數(shù)量統(tǒng)計(jì)

      2.1主要研究機(jī)構(gòu)的確定

      一般情況下,一個(gè)研究機(jī)構(gòu)發(fā)表的論文數(shù)量越多,說明該機(jī)構(gòu)對該領(lǐng)域的研究越深入,但是不能忽略掉一個(gè)因素——研究人員的數(shù)量。如果一個(gè)研究機(jī)構(gòu)A在某一領(lǐng)域總共發(fā)表了論文數(shù)為100篇,但是A機(jī)構(gòu)中的研究人員數(shù)為20;而另外一個(gè)研究機(jī)構(gòu)B在該領(lǐng)域發(fā)表的論文數(shù)為20篇,但是B機(jī)構(gòu)的研究人員為1人次。A機(jī)構(gòu)與B機(jī)構(gòu)的人均發(fā)文量是一樣的,我們該認(rèn)為哪個(gè)機(jī)構(gòu)更有影響力?通常我們會(huì)認(rèn)為機(jī)構(gòu)A比B更有影響力。為了避免這種情況的大量發(fā)生,本文采取了對研究機(jī)構(gòu)進(jìn)行初步篩選的過程,過濾掉那些機(jī)構(gòu)中研究人員特別少的或者是發(fā)表的論文數(shù)量特別少。制定的研究機(jī)構(gòu)過濾準(zhǔn)則如下:

      (1)如果一個(gè)機(jī)構(gòu)的研究人員的數(shù)量少于12,則去掉該機(jī)構(gòu)。

      (2)如果一個(gè)機(jī)構(gòu)的發(fā)文數(shù)量少于12(包含12),則去掉該機(jī)構(gòu)。

      為了保證在12年間年均研究人員數(shù)是1人,年均發(fā)文量是1。述兩條過濾準(zhǔn)則的中提到的閾值都設(shè)為12。在上文已經(jīng)對文獻(xiàn)機(jī)構(gòu)信息進(jìn)行了統(tǒng)計(jì)共有688個(gè)機(jī)構(gòu),按照上述研究機(jī)構(gòu)的過濾準(zhǔn)則進(jìn)行初步的過濾之后,剩下了31個(gè)研究機(jī)構(gòu)。

      另外,一個(gè)研究機(jī)構(gòu)在某領(lǐng)域的研究水平,僅僅通過論文數(shù)量和人員數(shù)量是不行的,如果一個(gè)研究機(jī)構(gòu)研究人員壯大,但是發(fā)表了一堆沒有什么含金量的文章,那么我們也不能認(rèn)為該機(jī)構(gòu)是非常有影響力的機(jī)構(gòu)。一般來說被引用頻次是評價(jià)學(xué)術(shù)論文學(xué)術(shù)質(zhì)量的重要指標(biāo),如果一個(gè)機(jī)構(gòu)發(fā)表的論文的引用頻次越高越能體現(xiàn)出該機(jī)構(gòu)的學(xué)術(shù)研究質(zhì)量,在一定程度上發(fā)表的論文的被引用頻次、篇均被引頻次能說明該機(jī)構(gòu)的研究水平。下面對各個(gè)研究機(jī)構(gòu)的人員分布和被引用情況的統(tǒng)計(jì),表中列出了去掉了篇均被引率小于14的機(jī)構(gòu)。

      表2機(jī)器翻譯領(lǐng)域主要的研究機(jī)構(gòu)

      2.2機(jī)構(gòu)的研究熱度評價(jià)方法

      當(dāng)我們確定了該研究領(lǐng)域的核心研究機(jī)構(gòu)之后,接下來制定評價(jià)一個(gè)研究機(jī)構(gòu)對某一領(lǐng)域的研究熱度值,不光要考慮該機(jī)構(gòu)投入的研究人員數(shù)量,還應(yīng)該考慮該機(jī)構(gòu)的產(chǎn)出量和學(xué)術(shù)水平,故本文綜合了這三個(gè)因素來評價(jià)某一研究機(jī)構(gòu)對特定領(lǐng)域的研究熱度,如公式(1):

      其中Hot(Oi)表示機(jī)構(gòu)Oi的研究熱度值,persons(Oi)表示機(jī)構(gòu)Oi的研究人員總數(shù),papers(Oi)表示機(jī)構(gòu)Oi發(fā)表的論文總數(shù),cited(Oi)表示機(jī)構(gòu)Oi的文獻(xiàn)被引用的總次數(shù),m是已確定的核心研究機(jī)構(gòu)的個(gè)數(shù)。因?yàn)楣剑?)中三部分都是一個(gè)比例關(guān)系,這種比例值有時(shí)候會(huì)出現(xiàn)非常小甚至趨向于零的情況,因此為了計(jì)算的準(zhǔn)確性本文在計(jì)算的過程中對最終的熱度值Hot (Oi)進(jìn)行了取對數(shù)操作。

      表3 1999-2010年各個(gè)研究機(jī)構(gòu)機(jī)器翻譯領(lǐng)域的研究熱度值

      表3是本文根據(jù)上述的熱度計(jì)算公式計(jì)算的在1999-2010這12年機(jī)器翻譯領(lǐng)域各個(gè)研究機(jī)構(gòu)的熱度值。從表中來看,排在前幾位的研究機(jī)構(gòu)確實(shí)是在人員投入、發(fā)文的數(shù)量和質(zhì)量方面都是比較高的,因此,用本文提出的對研究機(jī)構(gòu)的熱度值打分的方法一定程度上是有效的,但是對于排名靠后的機(jī)構(gòu)的次序就不確定是否準(zhǔn)確。

      2.3研究機(jī)構(gòu)研究熱度趨勢變化

      類似的我們可以計(jì)算某一研究機(jī)構(gòu)在不同年度的研究熱度值,這樣就可以描繪出該研究機(jī)構(gòu)在該領(lǐng)域的研究熱度曲線圖。通過這個(gè)熱度變化趨勢可以進(jìn)一步預(yù)測在接下來的時(shí)間內(nèi),該機(jī)構(gòu)在該領(lǐng)域的研究趨勢是處于較高狀態(tài)還是較低的狀態(tài)。如圖2所示,是我們選取的五個(gè)主要的研究機(jī)構(gòu)在“機(jī)器翻譯”領(lǐng)域的研究熱度曲線圖。從圖中趨勢就可以預(yù)測在未來的幾年之內(nèi)中科院在機(jī)器翻譯領(lǐng)域的研究會(huì)一直處于比較高的狀態(tài)。

      圖2  1999-2010年五個(gè)研究機(jī)構(gòu)在機(jī)器翻譯領(lǐng)域的研究熱度曲線

      3 結(jié)語

      本文對某一領(lǐng)域文獻(xiàn)知識(shí)進(jìn)行了研究機(jī)構(gòu)的熱挖掘工作。并且以“機(jī)器翻譯”領(lǐng)域來舉例,從實(shí)驗(yàn)數(shù)據(jù)的設(shè)置到研究點(diǎn)的熱度分析步驟,研究機(jī)構(gòu)的熱度分析步驟都做了詳細(xì)的講解,并且對實(shí)驗(yàn)的結(jié)果進(jìn)行了分析,證實(shí)了此種方法在一定程度上還是可行有效的,而且用了可視化的方法展示給用戶,符合了本文研究的初衷。另外,本文的熱度挖掘方法不僅是針對機(jī)器翻譯這一領(lǐng)域的,還可以運(yùn)用到其他的領(lǐng)域,只要保證數(shù)據(jù)是文獻(xiàn)數(shù)據(jù),并且能夠達(dá)到一定的規(guī)模,用本文提出的方法對某一領(lǐng)域的研究機(jī)構(gòu)進(jìn)行熱度分析,都是可行的。另外,本文的針對科技文獻(xiàn)的挖掘工作都是針對下載到本地的文獻(xiàn)數(shù)據(jù)做的挖掘工作,但是現(xiàn)實(shí)生活中網(wǎng)絡(luò)的發(fā)達(dá),導(dǎo)致文獻(xiàn)數(shù)據(jù)的更新很快,如果我們能夠針對在線的數(shù)據(jù)進(jìn)行挖掘工作,并且能夠提供出可視化的熱度分析趨勢圖,那將會(huì)造福很多的科研工作者。因此,基于實(shí)時(shí)性的在線文獻(xiàn)挖掘工作也是將來工作的一個(gè)重點(diǎn)。

      [1]HAN Jia-wei,Micheline Kamber,PEI Jian.數(shù)據(jù)挖掘概念與技術(shù)(原書第3版)[M].北京:機(jī)械工業(yè)出版社,2012.

      [2]宗成慶.統(tǒng)計(jì)自然語言處理(第2版)[M].清華大學(xué)出版社.北京:清華大學(xué)出版社,2013.

      [3]柯健,李超.我國社會(huì)科學(xué)領(lǐng)域數(shù)據(jù)挖掘研究的文獻(xiàn)計(jì)量分析.現(xiàn)代情報(bào),2010,31(6):102-106.

      [4]黃永煤.讀者需求分析中的數(shù)據(jù)挖掘技術(shù)[J].大學(xué)圖書情報(bào)學(xué)刊,2006,24(4):48-50.

      [5]邱均平,繆雯婷.文獻(xiàn)計(jì)量學(xué)在人才評價(jià)中應(yīng)用的新探索[J].評價(jià)與管理,2007,2(6):1-5

      Literature Mining;Research Institutions;Evaluation of Research Hot

      Research Hot Degree of the Evaluation Method of Research Institutions in a Certain Field

      LIU Jin-hua
      (Fenyang College Shanxi Medical University,F(xiàn)enyang 032200)

      1007-1423(2015)29-0045-04

      10.3969/j.issn.1007-1423.2015.29.012

      劉金花(1987-),女,山西汾陽人,碩士,助教,研究方向?yàn)樽匀徽Z言處理、數(shù)據(jù)挖掘

      2015-09-24

      2015-10-07

      從大量文獻(xiàn)中快速獲得某一領(lǐng)域的核心科研機(jī)構(gòu),對準(zhǔn)備開展科研工作的科研人員具有極大的導(dǎo)向作用。爬取網(wǎng)上某一領(lǐng)域文獻(xiàn)數(shù)據(jù),綜合考慮機(jī)構(gòu)的研究人員數(shù)、發(fā)文量和被引文量,提出針對研究機(jī)構(gòu)的研究熱度的評價(jià)方法,并且對每一個(gè)研究機(jī)構(gòu)在各個(gè)時(shí)間段進(jìn)行熱度評價(jià),然后繪制出熱度趨勢圖。

      文獻(xiàn)挖掘;研究機(jī)構(gòu);研究熱度評價(jià)

      It has a great role in guiding for research staff whom preparing to carry out research work,if we can obtain the core research institutions for a given field from a large number of scientific literature rapidly.Crawls a certain field literature data from Internet,and proposes an evaluation method of research hot value for each institute considering the number of researchers,the volume of published articles and the amount of the citation comprehensively,uses a visual way to display distribution graph of the field in a certain period.

      猜你喜歡
      數(shù)量論文領(lǐng)域
      領(lǐng)域·對峙
      青年生活(2019年23期)2019-09-10 12:55:43
      統(tǒng)一數(shù)量再比較
      頭發(fā)的數(shù)量
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      我國博物館數(shù)量達(dá)4510家
      新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
      2013年5—12月最佳論文
      新聞前哨(2014年1期)2014-03-12 22:10:06
      肯定與質(zhì)疑:“慕課”在基礎(chǔ)教育領(lǐng)域的應(yīng)用
      赤水市| 正安县| 云梦县| 西乌珠穆沁旗| 安福县| 涡阳县| 离岛区| 潼关县| 嘉鱼县| 壤塘县| 涟源市| 松桃| 马龙县| 唐海县| 宝鸡市| 潢川县| 中西区| 无极县| 湖南省| 海阳市| 象州县| 民乐县| 公安县| 建水县| 安溪县| 龙江县| 兴文县| 安溪县| 孟州市| 托克逊县| 松潘县| 瑞丽市| 上思县| 措美县| 盐边县| 安平县| 黔南| 北辰区| 丰台区| 镇远县| 积石山|