郭晶晶 于璠 宋娜
摘要:開放科學環(huán)境下,對科學數(shù)據(jù)的學術(shù)影響力進行客觀評價有利于科學數(shù)據(jù)提供者了解科學數(shù)據(jù)的被引用情況,提高科研人員的創(chuàng)新活力,正向推動科學數(shù)據(jù)的發(fā)展和開放。文章以中國綜合社會調(diào)查數(shù)據(jù)為例,基于引文內(nèi)容,將引文引用行為進行深度標引和揭示,篩選出利用科學數(shù)據(jù)進行分析研究并產(chǎn)出成果的引文,通過分析該引文集合的產(chǎn)出情況、學科分布等規(guī)律來評價該數(shù)據(jù)的學術(shù)影響力情況。
關(guān)鍵詞:科學數(shù)據(jù);科學數(shù)據(jù)集評價;中國綜合社會調(diào)查數(shù)據(jù)
中圖分類號:G252.7? 文獻標志碼:A
0 引言
科學數(shù)據(jù)是指在科技活動時或通過其他方式所獲得的能夠反映客觀世界本質(zhì)、特征、變化規(guī)律的原始基本數(shù)據(jù),根據(jù)不同科技活動需要,進行系統(tǒng)加工整理的各類數(shù)據(jù)[1]。隨著科學技術(shù)的發(fā)展,調(diào)查數(shù)據(jù)的不斷完善,勢必會產(chǎn)生大規(guī)模、多元化的科學數(shù)據(jù),科研人員利用已有的科學數(shù)據(jù)產(chǎn)生創(chuàng)新性成果是一種普遍的科研模式。
對科學數(shù)據(jù)進行評價的意義在于,讓數(shù)據(jù)提供者感受到被認可,激勵科研人員再生產(chǎn),從而促進業(yè)內(nèi)共享交流,益于科學發(fā)展。歐洲科學數(shù)據(jù)的高級專家小組在2010年發(fā)表的報告[2]中也指出,需要開發(fā)和利用新的方法來測量數(shù)據(jù)的價值,并獎勵那些貢獻數(shù)據(jù)的研究人員。
科學數(shù)據(jù)評價內(nèi)容研究主要涉及科學數(shù)據(jù)質(zhì)量評價、科學數(shù)據(jù)影響力評價、科學數(shù)據(jù)平臺評價、科學數(shù)據(jù)安全評估以及科學數(shù)據(jù)素養(yǎng)能力評價等方面[3]。其中,科學數(shù)據(jù)影響力是指應用科學數(shù)據(jù)對學術(shù)、社會、經(jīng)濟、文化、公共政策、環(huán)境等多方面產(chǎn)生的有益影響[4]??茖W數(shù)據(jù)影響力評價是客觀判斷科學數(shù)據(jù)質(zhì)量的方法,可為數(shù)據(jù)提供者了解該科學數(shù)據(jù)被重用程度和為用戶選擇科學數(shù)據(jù)提供幫助。
目前,對科學數(shù)據(jù)學術(shù)影響力評價主要有兩個研究方向:一是參考傳統(tǒng)出版物評價體系,利用相關(guān)引文指標來構(gòu)建科學數(shù)據(jù)影響力評價體系;二是通過探究科學數(shù)據(jù)自身特征,提煉出評價指標實現(xiàn)對科學數(shù)據(jù)學術(shù)影響力的定量化計算。本文采用第一種科學數(shù)據(jù)學術(shù)影響力評價方法,參考科學數(shù)據(jù)引文指標構(gòu)建影響力評價模式??茖W數(shù)據(jù)的被引用情況是評價其影響力的重要指標,對科學數(shù)據(jù)的引用類似于對學術(shù)論文的引用,同樣是基于他人的科研成果開展進一步的研究,或是利用他人的科研成果論證自己的結(jié)論。數(shù)據(jù)引用(Data Citation)也是衡量科研價值的重要方式之一,可以激勵科研人員以可持續(xù)的方式存檔和管理數(shù)據(jù),促進科研人員開放和共享其科研數(shù)據(jù)。王雪等[5]針對生物信息學領(lǐng)域的文獻對科學數(shù)據(jù)的引用行為構(gòu)建了基于引用行為的科學評價數(shù)據(jù)集/數(shù)據(jù)倉儲影響力和質(zhì)量評價模型,測量科學數(shù)據(jù)的質(zhì)量與科學文獻質(zhì)量之間的關(guān)系;丁楠等[6]以DCI中的人口調(diào)查數(shù)據(jù)為例,借助引文分析方法,構(gòu)建了基于引用的數(shù)據(jù)評價體系,旨在將不同科學數(shù)據(jù)集放到同一個維度中評價其影響力,發(fā)現(xiàn)數(shù)據(jù)引用可以有效地對科學數(shù)據(jù)的發(fā)布及存儲機構(gòu)的影響力進行評估;劉闖[7]以引文為基礎、以引用數(shù)據(jù)的論文發(fā)表學術(shù)期刊的影響因子為權(quán)重作為核心參數(shù)的統(tǒng)計方法,提出了“數(shù)據(jù)影響力積分”的計算模型和案例。
整體來看,我國對于科學數(shù)據(jù)影響力的評價大多參照論文評價的方法,目前還沒有形成公認的、完整可實施的科學數(shù)據(jù)學術(shù)影響力評價標準,也鮮有學者對引用科學數(shù)據(jù)的文獻內(nèi)容進行深度標引和揭示。本文以連續(xù)發(fā)布類科學數(shù)據(jù)為例,揭示并標引了引文的內(nèi)容,將引文的引用行為分為6類,分別是分析研究、轉(zhuǎn)述、參考文獻、提及、負面引用和其他。通過分析分析研究型引文的產(chǎn)出情況、學科分布等規(guī)律來評價該數(shù)據(jù)的影響力情況和科研價值,為該科學數(shù)據(jù)提供者和學術(shù)評價機構(gòu)提供參考和決策。
1 研究設計
本文嘗試利用引文分析法,縱向評價單一科學數(shù)據(jù)集的影響力趨勢。該結(jié)果可為科學數(shù)據(jù)提供者提供參考和決策。
為單獨研究一項連續(xù)發(fā)布類科學數(shù)據(jù)的影響力評價模式,本文選取已發(fā)布12次年度調(diào)查的社會科學領(lǐng)域的數(shù)據(jù)集——中國綜合社會調(diào)查數(shù)據(jù)(Chinese General Social Survey,CGSS)為例,通過分析引用該科學數(shù)據(jù)的引文,探討縱向評價連續(xù)發(fā)布類科學數(shù)據(jù)的影響力評價模式。
1.1 數(shù)據(jù)來源
CGSS第1期起止時間為2003—2008年,其間共完成5次年度調(diào)查(2007年沒有執(zhí)行),形成了5套年度調(diào)查數(shù)據(jù)。2010—2019年是CGSS項目的第2期,截至2018年年底,已完成7次年度調(diào)查,分別是2010、2011、2012、2013、2015、2017和2018年。2021年是中國綜合社會調(diào)查(CGSS)的第14次年度調(diào)查。除2004年的調(diào)查數(shù)據(jù)未公布,其他各年度數(shù)據(jù)都已在中國國家調(diào)查數(shù)據(jù)庫(China National Survey Data Archive,CNSDA)的網(wǎng)站(cnsda.ruc.edu.cn)和中國綜合社會調(diào)查(cgss.ruc.edu.cn)的官網(wǎng)上發(fā)布,注冊用戶可免費申請使用。
本文選擇中國知網(wǎng)(CNKI)、萬方數(shù)據(jù)知識服務平臺和讀秀數(shù)據(jù)平臺為數(shù)據(jù)來源,在以上數(shù)據(jù)平臺檢索引用CGSS數(shù)據(jù)的中文文獻。以CNKI為例,構(gòu)建如下檢索式:TKA=中國綜合社會調(diào)查+全國綜合社會調(diào)查+“Chinese General Social Survey”+“China General Social Survey”+“CGSS”+“China GSS”+“Chinese GSS” OR SU=中國綜合社會調(diào)查+全國綜合社會調(diào)查+“Chinese General Social Survey”+“China General Social Survey”+“CGSS”+“China GSS”+“Chinese GSS” OR RF=中國綜合社會調(diào)查+全國綜合社會調(diào)查+“Chinese General Social Survey”+“China General Social Survey”+“CGSS”+“China GSS”+“Chinese GSS”。由于CGSS數(shù)據(jù)第一期于2003年發(fā)布,設置檢索時間為2003—2022年。
由于多平臺檢索存在文獻重復和字段不統(tǒng)一等問題,本文對檢索到的相關(guān)文獻進行了文獻去重、機構(gòu)合并等數(shù)據(jù)清洗。利用NoteExpress和Excel進行去重處理,優(yōu)先保留CNKI數(shù)據(jù)庫的題錄,去重后得到引文共14709條。
1.2 研究方法與工具
科學數(shù)據(jù)的引用行為中,既包括引用主體利用科學數(shù)據(jù)產(chǎn)出新的科學成果,也包括對引用科學數(shù)據(jù)論文的再引用以及對科學數(shù)據(jù)的負面評價。由于CGSS數(shù)據(jù)提供平臺并未統(tǒng)一要求數(shù)據(jù)使用者在引用數(shù)據(jù)時的引用格式,僅通過關(guān)鍵詞檢索勢必會產(chǎn)生“噪聲文獻”,例如,通過上一節(jié)的檢索式檢索到的引文中,有部分引文在正文中并未提及CGSS數(shù)據(jù),而是在參考文獻中列出了標題含有“CGSS”或“中國綜合社會調(diào)查”的文獻,這類引文嚴格意義上并不能算基于CGSS數(shù)據(jù)產(chǎn)出的論文。本文為探討科學數(shù)據(jù)產(chǎn)生的學術(shù)影響力,對引文的引用目的進行甄別,通過逐篇閱讀的方式,將引文的引用行為進行了分類,分類方式和評判標準如表1所示。
標引時若引文同時出現(xiàn)上述多種分類特征,將引文歸屬分類的優(yōu)先級定為負面引用>分析研究>轉(zhuǎn)述>提及>參考文獻>其他。
通過上述的引文分類目的可知,真正將CGSS數(shù)據(jù)用作科學研究并產(chǎn)出學術(shù)成果的引文主要是分析研究型引文,轉(zhuǎn)述、提及和參考文獻型引文并沒有直接基于CGSS數(shù)據(jù)產(chǎn)出學術(shù)成果。因此,本文僅以分析研究型引文(以下簡稱“引文”)進行分析,了解CGSS數(shù)據(jù)的學術(shù)影響力情況。
本文采用Excel和Derwent Data Analyzer(DDA)為主要分析工具,利用Excel實現(xiàn)引文發(fā)文數(shù)量趨勢變化分析;利用DDA完成引文數(shù)據(jù)的統(tǒng)計和清洗,包括對CGSS各年份數(shù)據(jù)的統(tǒng)計、引文所屬機構(gòu)清洗、學科分類號的一級和二級統(tǒng)計以及關(guān)鍵詞清洗,并利用DDA完成矩陣氣泡圖等可視化分析。
2 科學數(shù)據(jù)影響力評價
在選用影響力評價指標時,考慮從引文逐年發(fā)文情況、連續(xù)發(fā)布類科學數(shù)據(jù)不同數(shù)據(jù)年份的影響力情況、在不同學科領(lǐng)域產(chǎn)生的影響力情況、引證主體情況4個角度縱向評價連續(xù)發(fā)布類科學數(shù)據(jù)的影響力。
2.1 引文逐年發(fā)文情況
經(jīng)過對引文數(shù)據(jù)的清洗和引文目的評判,得到利用CGSS數(shù)據(jù)分析研究型的引文共5374條,主要以期刊論文和學位論文為主,引文中不同類型文獻組成情況如表2所示。
本文統(tǒng)計了2005—2022年引文中最主要組成部分的期刊論文和學位論文的發(fā)文量情況,基本呈現(xiàn)逐年上升的趨勢,如圖1所示,2010年引文數(shù)量就已超過100篇。
基于CGSS進行研究的期刊論文最早發(fā)表于2005年,是由中國人民大學的洪大用在《江蘇社會科學》上發(fā)表的題名為《中國城市居民的環(huán)境意識》的論文[8]。期刊論文在2009—2010年期間表現(xiàn)出較快的增長速度,年均增長率接近100%。
最早的基于CGSS進行研究的學位論文完成于2007年,是來自上海大學的張文宏教授指導的3篇碩士論文[9-11]和1篇來自中國人民大學洪大用教授指導的碩士論文[12]。2007年之后,學位論文數(shù)量逐年遞增,而2020年學位論文數(shù)出現(xiàn)了小幅下降,可能是由于學位論文需要較長時間才收錄進數(shù)據(jù)庫導致的。
2.2 各年份數(shù)據(jù)影響力情況
CGSS數(shù)據(jù)基本每1~2年發(fā)布一版新的調(diào)查數(shù)據(jù)供研究者使用。對于此類連續(xù)發(fā)布的科學數(shù)據(jù),分析其各年份數(shù)據(jù)被關(guān)注引用程度,有助于了解各年份數(shù)據(jù)的影響力情況。
截至2022年12月,CGSS項目已經(jīng)對外發(fā)布的數(shù)據(jù)年份有2003、2005、2006、2008、2010、2011、2012、2013、2015、2017和2018年。引文中CGSS各年數(shù)據(jù)的使用頻次如圖2所示。
2.3 學科覆蓋情況
以引文文獻類型為期刊論文為例,該類型引文數(shù)據(jù)來源于CNKI和萬方,這些數(shù)據(jù)庫平臺普遍使用了《中國圖書館分類法》(以下簡稱“中圖法”)分類號標記文獻所屬的學科類別。本報告通過CNKI數(shù)據(jù)平臺標記的中圖法分類號來統(tǒng)計分析國內(nèi)論文的學科分布,以此來揭示CGSS數(shù)據(jù)的學科覆蓋程度和影響力廣度。
通過中圖法一級大類可以看出4033篇文獻類型為期刊論文的引文在各學科大類的分布情況,如圖3所示。
通過中圖法二級分類對學科進行細分,得到期刊論文引文主要分布的二級學科領(lǐng)域(見表3)。表3中統(tǒng)計了分布在前12個領(lǐng)域的論文數(shù)量,其數(shù)量之和為3592篇,占全部研究領(lǐng)域的89%,說明CGSS數(shù)據(jù)的引文所在學科領(lǐng)域比較集中。
2.4 引證主體情況
通過分析引證主體所屬機構(gòu),了解不同引證機構(gòu)的引證方向和目標,也可為科學數(shù)據(jù)提供者尋找潛在合作機構(gòu)。以引文文獻類型為期刊論文為例,期刊論文引文的作者來自792所機構(gòu)。發(fā)表引文較多的機構(gòu)如表4所示。高校構(gòu)成了機構(gòu)用戶的主體,參與發(fā)表了論文3798篇,占到國內(nèi)中文期刊論文總量的94%。中國人民大學作為CGSS項目的主要執(zhí)行單位,是基于該數(shù)據(jù)發(fā)表國內(nèi)中文期刊論文最多的機構(gòu),而且數(shù)量是第二位武漢大學的3倍以上。在排名前20位的機構(gòu)中,只有1家研究院所——中國社會科學院,其余全部為高校。
為了考察主要發(fā)文機構(gòu)對CGSS數(shù)據(jù)的關(guān)注度趨勢,本文選取發(fā)文數(shù)量排名前10的機構(gòu),統(tǒng)計他們CGSS分析研究型引文產(chǎn)出數(shù)量在年份上的分布情況,如圖4所示。
中國人民大學于2005年最早發(fā)表了采用CGSS數(shù)據(jù)進行相關(guān)研究的國內(nèi)論文。其他機構(gòu)中,發(fā)文較早的是復旦大學和中國社會科學院,均在2007年首次發(fā)表基于CGSS數(shù)據(jù)的論文;武漢大學發(fā)文總量僅次于中國人民大學;其他值得關(guān)注的還有南京大學,它在近幾年的發(fā)文量相對較多。
3 思考與總結(jié)
在科學數(shù)據(jù)持續(xù)增長,數(shù)據(jù)共享總量不斷擴大的環(huán)境下,如何縱向評價科學數(shù)據(jù)的學術(shù)影響力成為新的需求,更多的數(shù)據(jù)提供者希望通過對數(shù)據(jù)的科學評價了解其產(chǎn)出的科學數(shù)據(jù)在業(yè)界內(nèi)如何被引用,學術(shù)影響力如何,了解負面評價也有助于為下一次的科學數(shù)據(jù)生產(chǎn)提供參考和建議。
本文以單一且連續(xù)發(fā)布的科學數(shù)據(jù)——CGSS數(shù)據(jù)為例,探討了縱向評價科學數(shù)據(jù)的模式和方法,以期從一個新的角度揭示科學數(shù)據(jù)產(chǎn)生的學術(shù)價值,并為科學數(shù)據(jù)提供者評估科學數(shù)據(jù)學術(shù)影響力提供參考。
根據(jù)以上研究,從對科學數(shù)據(jù)引用規(guī)范和科學數(shù)據(jù)影響力評價結(jié)果使用角度對科學數(shù)據(jù)的科研產(chǎn)出及科學評價單位提出幾點建議。
3.1 規(guī)定科學數(shù)據(jù)引用格式
數(shù)據(jù)提供者應在提供科學數(shù)據(jù)的同時規(guī)定引用數(shù)據(jù)的格式,形成良性引用循環(huán),提升科學數(shù)據(jù)影響力。
研究表明,科學數(shù)據(jù)引用不僅能夠體現(xiàn)對科學數(shù)據(jù)工作者的認可,也可以幫助追蹤數(shù)據(jù)使用狀況,建立數(shù)據(jù)定位或參考機制,開展數(shù)據(jù)計量和評價[13],同時科學數(shù)據(jù)的引用也是實現(xiàn)科學數(shù)據(jù)共享的重要方式之一。因此,采用規(guī)范化的引用格式是科研工作者應具有的科研素質(zhì)。
為規(guī)范引用格式,更多數(shù)據(jù)中心在提供科學數(shù)據(jù)服務的同時要求數(shù)據(jù)使用者按照規(guī)定的格式引用,例如Integrated Public Use Microdata Series(IPUMS)和羅珀輿論研究中心 (Roper Center for Public Opinion Research),在官網(wǎng)中都提供了如何引用他們數(shù)據(jù)的指南來規(guī)范引用動作。中國社會狀況調(diào)查(CSS)要求數(shù)據(jù)使用者在正文中按照標準格式注明資料出處,并要求以該科學數(shù)據(jù)產(chǎn)出的成果公布后通知數(shù)據(jù)提供方,并提供成果復件,以便為其他數(shù)據(jù)使用者提供參考。
數(shù)據(jù)提供中心提出的引用規(guī)范要求可以很好地約束數(shù)據(jù)使用者的引用規(guī)范,一定程度上可以保障數(shù)據(jù)提供者的權(quán)益,提高科學數(shù)據(jù)的回溯率,利于科學數(shù)據(jù)再傳播和再利用,形成良性循環(huán)。
3.2 關(guān)注負面引用
本文除了關(guān)注利用CGSS數(shù)據(jù)進行分析研究的引文情況,也關(guān)注有些學者對CGSS數(shù)據(jù)提出的負面評價或建議。其中有學者對CGSS數(shù)據(jù)內(nèi)容的研究設計提出建議,例如,趙聯(lián)飛[14]在文獻中提到CGSS數(shù)據(jù)的設計中缺乏針對互聯(lián)網(wǎng)鴻溝的研究設計;張弛等[15]提出CGSS數(shù)據(jù)中將個人消費開支按照家庭為單位合并處理,從而無法獲得個人消費的數(shù)據(jù)。也有學者從宏觀設計和平臺服務對CGSS數(shù)據(jù)提出建議,如李磊等[16]提出CGSS數(shù)據(jù)調(diào)查的城市較多,但每個城市調(diào)查的個體較少,可能導致樣本選擇的代表性不足;馬得勇[17]提出CGSS數(shù)據(jù)與美國、日本、韓國等國家的“綜合社會調(diào)查(GSS)”相比,該調(diào)查在內(nèi)容上不夠綜合,未能充分考慮社會科學的整體性和經(jīng)濟學、政治學、社會學各學科之間的關(guān)聯(lián)性,在數(shù)據(jù)使用申請、數(shù)據(jù)庫數(shù)量和種類、網(wǎng)站下載服務等方面與歐美等發(fā)達國家有較大差距。還有學者建議CGSS的數(shù)據(jù)調(diào)查可以和相關(guān)研究聯(lián)合開展,以此來節(jié)約調(diào)查資源,增加調(diào)查之間的互補性[18]。
連續(xù)發(fā)布類科學數(shù)據(jù),如氣象數(shù)據(jù)、地質(zhì)資料以及本文研究的社會調(diào)查類數(shù)據(jù),往往需要將數(shù)據(jù)不斷地更新和豐富。借助負面評價的引文可以得到數(shù)據(jù)使用者對科學數(shù)據(jù)的建議,有助于數(shù)據(jù)提供者在下次設計科學數(shù)據(jù)內(nèi)容和采集方式上找到新思路和新方向,不斷豐富科學數(shù)據(jù)內(nèi)容,提供更完善的科學數(shù)據(jù)服務。
3.3 將科學數(shù)據(jù)評價納入人才評價體系
科研評價單位應考慮將科學數(shù)據(jù)評價納入人才評價體系??茖W數(shù)據(jù)也是科研成果產(chǎn)出的一部分,也是體現(xiàn)科研人員勞動產(chǎn)出的一項指標,應類同于學術(shù)論文??茖W數(shù)據(jù)的影響力越高也證明其越有學術(shù)價值,應該納入人才評價體系,讓評價體系更加多元化、全面化,同時也能激勵科學數(shù)據(jù)的發(fā)展,提高科研人員對科學數(shù)據(jù)的重視程度,產(chǎn)出更高質(zhì)量的科學數(shù)據(jù),加速科學技術(shù)的進步和發(fā)展。
參考文獻
[1]李慧佳,馬建玲,王楠,等.國內(nèi)外科學數(shù)據(jù)的組織與管理研究進展[J].圖書情報工作,2013(23):130-136.
[2]黃永文,張建勇,黃金霞,等.國外開放科學數(shù)據(jù)研究綜述[J].現(xiàn)代圖書情報技術(shù),2013(5):21-27.
[3]胡惠芳,方向明.國內(nèi)外科學數(shù)據(jù)評價研究綜述[J].大學圖書情報學刊,2021(3):131-138.
[4]王毅萍,馬建玲.國外科學數(shù)據(jù)影響力研究進展[J].圖書情報工作,2017(7):118-126.
[5]王雪,馬勝利,佘曾溧,等.科學數(shù)據(jù)的引用行為及其影響力研究[J].情報學報,2016(11):1132-1139.
[6]丁楠,黎嬌,李文雨澤,等.基于引用的科學數(shù)據(jù)評價研究[J].圖書與情報,2014(5):95-99.
[7]劉闖.數(shù)據(jù)影響力積分(DIS):數(shù)據(jù)影響力新的計量方法[J].全球變化數(shù)據(jù)學報(中英文),2018(2):135-143.
[8]洪大用.中國城市居民的環(huán)境意識[J].江蘇社會科學,2005(1):127-132.
[9]李鴿.中國家庭網(wǎng)的階層構(gòu)成及其影響因素[D].上海:上海大學,2007.
[10]段雪輝.城市移民的階層網(wǎng)絡結(jié)構(gòu)與社會融合[D].上海:上海大學,2007.
[11]楊輝英.城市職業(yè)女性的社會網(wǎng)絡[D].上海:上海大學,2007.
[12]胡偉.環(huán)境關(guān)心的年齡差異:基于2003年中國綜合社會調(diào)查數(shù)據(jù)的分析與發(fā)現(xiàn)[D].北京:中國人民大學,2007.
[13]屈寶強,王凱.科學數(shù)據(jù)引用現(xiàn)狀和研究進展[J].情報理論與實踐,2016(5):134-138.
[14]趙聯(lián)飛.中國大學生中的三道互聯(lián)網(wǎng)鴻溝:基于全國12所高校調(diào)查數(shù)據(jù)的分析[J].社會學研究,2015(6):145-168.
[15]張弛,楊燕綏.基于生命周期的征地補償公共治理:以海南省定安縣為例[J].公共管理評論,2015(2):86-106.
[16]李磊,鄭妍妍,劉鵬程.金融發(fā)展、職業(yè)選擇與企業(yè)家精神:來自微觀調(diào)查的證據(jù)[J].金融研究,2014(6):193-206.
[17]馬得勇.如何利用互聯(lián)網(wǎng)資源來進行跨國比較研究[J].經(jīng)濟社會體制比較,2008(1):149-155.
[18]范川.借助于CGSS的流動人口抽樣設計[D].上海:復旦大學,2013.
(編輯 何 琳)
Analysis of the academic impact evaluation model of scientific data sets based on citation content: taking Chinese General Social Survey data as an example
GUO? Jingjing, YU? Fan, SONG? Na
(National Library of China, Beijing 100081, China)
Abstract: In the open science environment, objective evaluation of the academic influence of scientific data is beneficial for scientific data providers to understand the citation of scientific data, improve the innovation vitality of researchers, and positively promote the development and openness of scientific data. The article takes CGSS data as an example, based on the content of citations, deeply indexes and reveals the citation behavior, selects citations that use scientific data for analysis and research, and produces results. By analyzing the output situation and disciplinary distribution of the citation set, the academic influence of the data is evaluated.
Key words: scientific data; evaluation of scientific dataset; Chinese General Social Survey
作者簡介:郭晶晶(1990— ),女,館員,碩士;研究方向:科技咨詢。