陳佳宇 郭建偉 燕娜 張素娟
摘 要:以北京市科學(xué)技術(shù)研究院采購(gòu)的超星知識(shí)發(fā)現(xiàn)系統(tǒng)為例,依據(jù)數(shù)據(jù)商在線統(tǒng)計(jì)平臺(tái)提供的使用報(bào)告,研究電子資源的利用情況。基于用戶的檢索行為數(shù)據(jù)、各學(xué)科電子資源的使用量,了解用戶在檢索過(guò)程中的習(xí)慣和對(duì)各學(xué)科電子資源的利用情況。為北京市科學(xué)技術(shù)研究院資源建設(shè)提供有針對(duì)性的指導(dǎo)意見(jiàn),同時(shí)為信息資源訂購(gòu)工作的有效開(kāi)展提供建議。
關(guān)鍵詞:超星知識(shí)發(fā)現(xiàn);數(shù)據(jù)庫(kù)資源;用戶行為
中圖分類(lèi)號(hào):G717 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-0037(2018)2-79-4
Abstract: Taking the superstar knowledge discovery system purchased by Beijing Institute of Science and Technology Information as an example, this paper studied the utilization of electronic resources according to the reports provided by the data vendors online statistical platform. Based on the user's search behavior data, the use of electronic resources of various disciplines, the user's habits in the search process and the use of electronic resources of various disciplines were understood. It provide targeted guidance for the resources construction of Beijing Institute of Science and Technology Information, and provided suggestions for the effective development of information resource ordering.
Key words: superstar knowledge discovery; database resources; user behavior
隨著大數(shù)據(jù)時(shí)代的來(lái)臨和數(shù)據(jù)密集型科研環(huán)境的形成,科研工作者對(duì)文獻(xiàn)資源的利用行為以及其對(duì)資源內(nèi)容、種類(lèi)和獲取方式等方面的需求都發(fā)生了巨大的變化,這對(duì)數(shù)據(jù)資源的采購(gòu)數(shù)量、類(lèi)型都提出了新的要求[1]。北京市科學(xué)技術(shù)研究院(簡(jiǎn)稱“市科研院”)已逐步建立起有效的評(píng)估機(jī)制,并結(jié)合院所數(shù)字資源建設(shè)的特點(diǎn)及發(fā)展趨勢(shì),有效解決用戶需求逐年增加和變化、資源漲價(jià)與有限的資源采購(gòu)經(jīng)費(fèi)之間的矛盾,有針對(duì)性地調(diào)整訂購(gòu)策略,優(yōu)化數(shù)據(jù)庫(kù)資源。每年訂購(gòu)的這些數(shù)據(jù)資源實(shí)際使用情況如何呢?這就需要對(duì)已經(jīng)采購(gòu)的各個(gè)資源進(jìn)行一定時(shí)間段的跟蹤,準(zhǔn)確地了解從資源開(kāi)通使用之后一段時(shí)間內(nèi)市科研院用戶的實(shí)際使用情況,可以從數(shù)據(jù)庫(kù)的登錄次數(shù)、訪問(wèn)量、檢索次數(shù)、下載量和點(diǎn)擊率等角度進(jìn)行研究。
本文通過(guò)對(duì)資源使用情況的統(tǒng)計(jì),整體分析市科研院下屬科研工作者對(duì)該類(lèi)電子資源的需求?;谠L問(wèn)量,結(jié)合購(gòu)買(mǎi)經(jīng)費(fèi),粗略地評(píng)價(jià)市科研院對(duì)電子資源的成本效益,為市科研院資源建設(shè)提供有針對(duì)性的指導(dǎo)意見(jiàn),同時(shí)為信息資源訂購(gòu)工作的有效開(kāi)展提供建議。此外,各類(lèi)學(xué)術(shù)數(shù)據(jù)庫(kù)均提供了很多數(shù)據(jù)庫(kù)的使用方法,比如初級(jí)檢索、高級(jí)檢索和專業(yè)檢索等[2],如果這些檢索方法使用不當(dāng),很難達(dá)到準(zhǔn)確查找資源的效果,進(jìn)而影響用戶對(duì)資源的利用率。對(duì)用戶檢索行為的分析有助于我們了解用戶的檢索習(xí)慣,根據(jù)用戶的檢索習(xí)慣制訂相應(yīng)的推廣策劃,進(jìn)而提高已購(gòu)電子資源的利用率[3]。
1 超星知識(shí)發(fā)現(xiàn)系統(tǒng)的使用統(tǒng)計(jì)
1.1 檢索方式統(tǒng)計(jì)
依據(jù)數(shù)據(jù)商提供的使用監(jiān)測(cè)數(shù)據(jù),可以大致了解到用戶的使用情況,包括每個(gè)月份讀者訪問(wèn)電子資源的情況。市科研院2016年5月底正式開(kāi)通使用超星知識(shí)發(fā)現(xiàn)系統(tǒng),通過(guò)2016年6—12月數(shù)據(jù)量統(tǒng)計(jì)發(fā)現(xiàn),市科研院的電子資源訪問(wèn)量在這段時(shí)間呈現(xiàn)拋物線狀態(tài),其趨勢(shì)與歷年訪問(wèn)量趨勢(shì)一致,且符合市科研院自身的科研現(xiàn)狀。
從圖1我們可以看出,2016年用戶訪問(wèn)的高峰期集中在7月份和11月份,這兩個(gè)月每月訪問(wèn)量都達(dá)到33 000多人次以上,這與市科研院下屬院所年中科研成果匯報(bào)以及年底科研成果匯總及論文審核有一定關(guān)系;9月訪問(wèn)量出現(xiàn)小高峰,這是由于9月份是每年科研工作者評(píng)職稱的月份,科研工作者對(duì)電子圖書(shū)的需求也是很大的,因此訪問(wèn)量也出現(xiàn)了高值;訪問(wèn)量低谷期集中在6月份、12月份,每月訪問(wèn)量均集中在30 000人次左右,其中12月份最低,不到30 000人次,與訪問(wèn)高峰期11月份相差將近5 000人次,這主要由于市科研院各下屬院所在12月份進(jìn)行年底總結(jié),科研人員主要精力集中在成果梳理上,因此,數(shù)據(jù)庫(kù)使用量下降。
1.2 成本效益分析
2016年6-12月市科研院第一次集中開(kāi)通使用超星知識(shí)發(fā)現(xiàn)系統(tǒng),在開(kāi)通的這段時(shí)間里,總訪問(wèn)量將近23萬(wàn)人次,月均訪問(wèn)量約33 000人次,從市科研院數(shù)據(jù)庫(kù)資源使用統(tǒng)計(jì)分析報(bào)告(2016)可以看出,在行業(yè)、產(chǎn)業(yè)和工具相關(guān)數(shù)據(jù)庫(kù)中超星知識(shí)發(fā)現(xiàn)系統(tǒng)是市科研院用戶瀏覽、檢索、下載最多的。在2016年市科研院購(gòu)買(mǎi)的39個(gè)學(xué)術(shù)數(shù)據(jù)庫(kù)里面,超星知識(shí)發(fā)現(xiàn)系統(tǒng)月均訪問(wèn)量排第五,僅次于(萬(wàn)方)中國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)、中國(guó)知網(wǎng)的學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)、中國(guó)知網(wǎng)的優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)、中國(guó)知網(wǎng)的博士學(xué)位論文全文數(shù)據(jù)庫(kù),說(shuō)明科研人員對(duì)超星知識(shí)發(fā)現(xiàn)系統(tǒng)的認(rèn)可度還是比較高的,下載量最高的萬(wàn)方中國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)篇均成本費(fèi)用大約為0.76元。
在數(shù)據(jù)庫(kù)使用統(tǒng)計(jì)分析的基礎(chǔ)上,我們結(jié)合數(shù)據(jù)庫(kù)的購(gòu)買(mǎi)價(jià)格,將費(fèi)用按時(shí)間平均折算,一次訪問(wèn)量的費(fèi)用僅僅為0.26元。按照NSTL(國(guó)家科技圖書(shū)文獻(xiàn)中心)的收費(fèi)標(biāo)準(zhǔn),普通請(qǐng)求0.3元/頁(yè),代查請(qǐng)求0.3元/頁(yè),服務(wù)費(fèi)2元/篇,超星知識(shí)發(fā)現(xiàn)系統(tǒng)一次訪問(wèn)量的費(fèi)用接近國(guó)內(nèi)目前廣泛推廣的NSTL中文文獻(xiàn)0.3元/頁(yè)的費(fèi)用,顯然市科研院對(duì)該數(shù)據(jù)庫(kù)的購(gòu)置較合理,利用程度較高。
2 超星知識(shí)發(fā)現(xiàn)系統(tǒng)的用戶檢索行為分析
超星知識(shí)發(fā)現(xiàn)系統(tǒng)利用數(shù)據(jù)倉(cāng)儲(chǔ)、資源整合、知識(shí)挖掘、數(shù)據(jù)分析、文獻(xiàn)計(jì)量學(xué)模型等相關(guān)技術(shù)[4],實(shí)現(xiàn)統(tǒng)一的學(xué)術(shù)資源搜索,通過(guò)分面聚類(lèi)、引文分析、知識(shí)關(guān)聯(lián)分析等實(shí)現(xiàn)文獻(xiàn)的深度知識(shí)挖掘[5]。對(duì)用戶檢索方式和學(xué)科使用的統(tǒng)計(jì),可以粗略地了解用戶的檢索行為。
2.1 檢索方式統(tǒng)計(jì)
在超星知識(shí)發(fā)現(xiàn)系統(tǒng)首頁(yè)檢索框中輸入查詢?cè)~,點(diǎn)擊“檢索”,將在海量的資源中查找相關(guān)的各種類(lèi)型文獻(xiàn),即為普通檢索[6]。該類(lèi)檢索方式類(lèi)似于百度搜索或者在各種商業(yè)網(wǎng)站查找需要的物品,用戶只要在顯示界面的搜索框里面輸入查詢關(guān)鍵詞,點(diǎn)擊檢索框右邊的“檢索”按鈕,即可完成基本檢索,數(shù)據(jù)庫(kù)里面該查詢?cè)~相關(guān)的內(nèi)容均顯示在檢索框下面。此時(shí),一般檢索出來(lái)的條數(shù)會(huì)很多、范圍太泛,需要在結(jié)果中進(jìn)行深度檢索,在檢索結(jié)果頁(yè)瀏覽所查找關(guān)鍵詞的數(shù)據(jù)。如:多維度分面、高級(jí)檢索、專業(yè)檢索、可視化、智能期刊導(dǎo)航、趨勢(shì)展示[7]。
根據(jù)超星知識(shí)發(fā)現(xiàn)系統(tǒng)中檢索的難易程度,本文將檢索功能分為普通檢索、專業(yè)檢索和高級(jí)檢索3種類(lèi)型,進(jìn)而了解不同科研工作者使用該類(lèi)資源的檢索習(xí)慣。
依據(jù)數(shù)據(jù)商提供的監(jiān)測(cè)數(shù)據(jù),將超星知識(shí)發(fā)現(xiàn)系統(tǒng)中的不同檢索方式進(jìn)行匯總統(tǒng)計(jì),各類(lèi)型的使用次數(shù)如表1所示。
圖2顯示了3種檢索方式的比例分布,由圖可知,市科研院用戶在使用超星知識(shí)發(fā)現(xiàn)系統(tǒng)時(shí),3種檢索方式都有涉及。普通檢索方式因其具有跟日常搜索引擎相似的界面,具有直觀、操作簡(jiǎn)便等優(yōu)點(diǎn),相對(duì)而言,它的使用比例較大,約為34%。專業(yè)檢索的使用涉及邏輯符號(hào)“與”“或”“非”、文獻(xiàn)類(lèi)型、通用字段、運(yùn)算符等;高級(jí)檢索雖然沒(méi)有專業(yè)檢索那么復(fù)雜,但涉及主題、題名、作者、作者機(jī)構(gòu)、關(guān)鍵詞、摘要等字段[8]以及語(yǔ)種、文獻(xiàn)類(lèi)型,也要求用戶熟悉掌握邏輯符號(hào)“與”“或”“非”。后兩種檢索方式對(duì)數(shù)據(jù)庫(kù)檢索的專業(yè)知識(shí)要求較高。本文研究的對(duì)象北京市科學(xué)技術(shù)研究院用戶,高級(jí)檢索和專業(yè)檢索使用量基本相同,雖然沒(méi)有普通檢索使用量高,但僅比普通檢索使用比例低1%左右,這一現(xiàn)象說(shuō)明,市科研院科研工作者對(duì)數(shù)據(jù)庫(kù)檢索相關(guān)使用技巧掌握較好,數(shù)據(jù)庫(kù)使用水平較高。
高級(jí)檢索和專業(yè)檢索都涉及了文獻(xiàn)類(lèi)型,較普通檢索結(jié)果可以縮小檢索范圍。如果對(duì)檢索的結(jié)果不夠滿意,還可以加入邏輯符號(hào),進(jìn)行檢索策略的調(diào)整。這些均能進(jìn)一步縮小檢索范圍,提高檢索的準(zhǔn)確性。市科研院高級(jí)檢索和專業(yè)檢索的使用量占整體檢索量的66%,雖然過(guò)半但是比例仍較低。這反映出用戶在檢索過(guò)程中對(duì)于精確檢索行為的積極性和檢索成熟度不夠高。
2.2 學(xué)科使用統(tǒng)計(jì)
表2顯示的是市科研院2016年6—12月超星知識(shí)發(fā)現(xiàn)系統(tǒng)不同中文學(xué)科電子圖書(shū)訪問(wèn)量、全文鏈接使用量、文獻(xiàn)傳遞使用量和收藏量。同一月份訪問(wèn)量、全文鏈接使用量、文獻(xiàn)傳遞使用量和收藏量之間數(shù)量基本保持一致,我們重點(diǎn)以訪問(wèn)量作為分析對(duì)象。2016年6—12月電子圖書(shū)總訪問(wèn)量為114 510人次,從表2和圖3可以看出,訪問(wèn)量最多的學(xué)科為工業(yè)技術(shù),為20 282人次;其次是經(jīng)濟(jì),訪問(wèn)量為19 268人次;環(huán)境科學(xué)、安全科學(xué)訪問(wèn)量為13 720人次,文化、科學(xué)、教育、體育訪問(wèn)量為10 304人次,自然科學(xué)總論訪問(wèn)量為10 120人次;訪問(wèn)量最少的學(xué)科是天文學(xué)、地球科學(xué)和藝術(shù),訪問(wèn)量都不足2 400人次;訪問(wèn)量居中的學(xué)科是政治、法律,交通運(yùn)輸,語(yǔ)音、文字,軍事,農(nóng)業(yè)科學(xué)等,訪問(wèn)量大約保持在3 000~4 000人次。
根據(jù)以上統(tǒng)計(jì)分析可知,重點(diǎn)學(xué)科是工業(yè)技術(shù),經(jīng)濟(jì),環(huán)境科學(xué)、安全科學(xué),文化、科學(xué)、教育、體育,自然科學(xué)總論,學(xué)科使用統(tǒng)計(jì)分析的結(jié)果基本與市科研院的業(yè)務(wù)內(nèi)容和發(fā)展情況相符。市科研院是以文科為主的科研機(jī)構(gòu),科研人員專業(yè)以文科為主。近年來(lái),市科研院緊緊圍繞首都經(jīng)濟(jì)建設(shè)和社會(huì)發(fā)展的需求,加強(qiáng)應(yīng)用研究、高新技術(shù)研究和重大科技攻關(guān),逐步形成側(cè)重應(yīng)用的多學(xué)科、綜合性、跨行業(yè)的大型科技研發(fā)機(jī)構(gòu)。
3 結(jié)語(yǔ)
數(shù)據(jù)資源有別于其他資源,其使用評(píng)價(jià)過(guò)程一直沒(méi)有一個(gè)既定的方法和指標(biāo)系統(tǒng)[9]。本研究主要以市科研院采購(gòu)的超星知識(shí)發(fā)現(xiàn)系統(tǒng)為例,基于數(shù)據(jù)庫(kù)后臺(tái)監(jiān)測(cè)到的數(shù)據(jù)資源的使用情況,研究市科研院下屬單位對(duì)超星知識(shí)發(fā)現(xiàn)系統(tǒng)的利用情況。依據(jù)用戶的檢索行為分析,了解用戶在檢索過(guò)程中的習(xí)慣和對(duì)各學(xué)科電子資源的利用情況,進(jìn)而了解用戶對(duì)己購(gòu)超星知識(shí)發(fā)現(xiàn)系統(tǒng)的使用情況,為是否繼續(xù)購(gòu)買(mǎi)提供依據(jù)。綜合考慮以上因素,結(jié)合市科研院數(shù)字資源建設(shè)的特點(diǎn)及發(fā)展趨勢(shì),制定數(shù)據(jù)庫(kù)資源訂購(gòu)方案。
參考文獻(xiàn):
[1] 劉艷紅.數(shù)據(jù)密集型科研環(huán)境下的高校圖書(shū)館發(fā)展與思考[J].圖書(shū)與情報(bào),2014(6):127-129.
[2] 岳丹.高校數(shù)據(jù)庫(kù)采購(gòu)策略與技巧:以福州大學(xué)圖書(shū)館為例[J].大學(xué)圖書(shū)情報(bào)學(xué)刊,2015(4):49-52.
[3] 劉佳音.高校圖書(shū)館電子資源使用與用戶檢索行為統(tǒng)計(jì)分析:以ScienceDirect數(shù)據(jù)庫(kù)為例[J].大學(xué)圖書(shū)館學(xué)報(bào),2012(2):81-86.
[4] 劉哲.2006—2015年我國(guó)機(jī)構(gòu)知識(shí)庫(kù)研究現(xiàn)狀分析:基于超星發(fā)現(xiàn)平臺(tái)與STADS的統(tǒng)計(jì)與分析[J].圖書(shū)情報(bào)導(dǎo)刊,2016(4):114-118.
[5] 李爽,王玉香.2006—2015年閱讀推廣研究現(xiàn)狀分析:基于超星發(fā)現(xiàn)平臺(tái)的統(tǒng)計(jì)與分析[J].河南圖書(shū)館學(xué)刊,2016(4):106-108.
[6] 陳艷艷.科技查新中超星知識(shí)發(fā)現(xiàn)系統(tǒng)的運(yùn)用[J].創(chuàng)新科技,2013(12):57-58.
[7] 張學(xué)梅.期刊論文語(yǔ)義檢索與可視化導(dǎo)航系統(tǒng)研究:以數(shù)字參考咨詢領(lǐng)域?yàn)槔齕D].南京:南京農(nóng)業(yè)大學(xué),2010.
[8] 謝奇,李立立,畢玉俠,等.五大學(xué)術(shù)搜索引擎比較[J].情報(bào)探索,2015(11):42-46.
[9] 王彥峰.綜合考慮資源和環(huán)境的過(guò)程系統(tǒng)的評(píng)價(jià)指標(biāo)和評(píng)價(jià)方法研究[D].西安:西安交通大學(xué),2001.