沈奎林
摘 要 信息技術(shù)、傳播技術(shù)的飛速發(fā)展,帶來了信息環(huán)境的變化。大數(shù)據(jù)、移動互聯(lián)網(wǎng)、新媒體以及個性化定制和社交網(wǎng)絡(luò)的蓬勃發(fā)展,加上學(xué)術(shù)分析、知識圖譜的普及,給知識發(fā)現(xiàn)系統(tǒng)提出了新的更高的要求。論文在文獻(xiàn)分析的基礎(chǔ)上,分析了目前知識發(fā)現(xiàn)系統(tǒng)的現(xiàn)狀和不足,以超星發(fā)現(xiàn)系統(tǒng)為例,提出了一些創(chuàng)新型的探索。
關(guān)鍵詞 大數(shù)據(jù) 知識發(fā)現(xiàn)系統(tǒng) 新媒體 社交化網(wǎng)絡(luò)知識圖譜
分類號 G250.73
DOI 10.16810/j.cnki.1672-514X.2017.01.003
The Exploration of Innovation in Knowledge Discovery System Under the New Information Environment
Shen Kuilin
Abstract The fast development of information technology and communication technology brings the change of information environment. Big data, mobile Internet and new media as well as customization and social network, combine with academic analysis, the popularization of knowledge map, request new and higher requirements to the knowledge discovery system. This paper takes the superstar discovery system as an example, and puts forward some innovative exploration based on the analysis of literature review of the current knowledge discovery system.
Keywords Big data. Knowledge discovery system. New media. Social network knowledge map.
近幾年來,隨著圖書館紙本資源及電子圖書、數(shù)據(jù)庫資源的快速增長,從海量的資源里找到所需的文獻(xiàn)成了讀者的迫切需要,于是很多一站式檢索系統(tǒng)應(yīng)運而生,從最初的聯(lián)邦檢索到后來帶有一定智能的知識(資源)發(fā)現(xiàn)系統(tǒng),以及各種類似百度、谷歌的檢索系統(tǒng)。2012年更是被稱為“知識發(fā)現(xiàn)系統(tǒng)元年”,知識發(fā)現(xiàn)系統(tǒng)相關(guān)的研究成果頻繁出現(xiàn)在各個學(xué)術(shù)期刊上,學(xué)界也召開了很多相關(guān)的會議,目前發(fā)現(xiàn)系統(tǒng)的發(fā)展處在一個膠著期,在新信息環(huán)境下如何讓發(fā)現(xiàn)系統(tǒng)更實用、更能贏得用戶的喜歡、與“互聯(lián)網(wǎng)+”的概念更融合,是我們應(yīng)該關(guān)注和研究的重要課題。
1 知識發(fā)現(xiàn)系統(tǒng)的研究和應(yīng)用現(xiàn)狀
在大數(shù)據(jù)、新媒體等新信息環(huán)境下,要研究和實現(xiàn)更好用的知識發(fā)現(xiàn)系統(tǒng),就有必要對目前發(fā)現(xiàn)系統(tǒng)的發(fā)展現(xiàn)狀從計量、圖譜等方面分析研究圖書情報界的研究主題,為后期的內(nèi)容做梳理和支持。
1.1 國內(nèi)知識發(fā)現(xiàn)系統(tǒng)的研究現(xiàn)狀
在超星中文發(fā)現(xiàn)系統(tǒng)里面,選擇高級檢索功能,以“知識發(fā)現(xiàn)系統(tǒng)”或“資源發(fā)現(xiàn)系統(tǒng)”或“知識發(fā)現(xiàn)”進(jìn)行精確匹配,選擇載體類型為圖書、期刊、會議論文、學(xué)位論文、報紙為來源,檢索得到9896條相關(guān)信息,對這些文獻(xiàn)進(jìn)行分析,可以得出目前國內(nèi)知識發(fā)現(xiàn)系統(tǒng)的研究和應(yīng)用現(xiàn)狀。
1.1.1 文獻(xiàn)計量分析
根據(jù)超星發(fā)現(xiàn)系統(tǒng)的分析結(jié)果(見圖1)來看,知識發(fā)現(xiàn)系統(tǒng)的研究文獻(xiàn)自1996年始逐年上漲,雖然最近2年發(fā)展平穩(wěn),在2015年還略有下降趨勢,但符合事物螺旋上升的發(fā)展規(guī)律。
根據(jù)期刊和相關(guān)學(xué)科以及相關(guān)知識的分析結(jié)果,從圖2可以看出知識發(fā)現(xiàn)系統(tǒng)涉及到了很多學(xué)科,在技術(shù)方面,主要研究領(lǐng)域在計算機(jī)領(lǐng)域、圖書情報領(lǐng)域,涉及到數(shù)據(jù)挖掘、人工智能、數(shù)據(jù)庫、聚類、情報分析、知識分析、信息分析、檢索、搜索引擎等概念,相關(guān)的發(fā)文高頻學(xué)者也是這兩個領(lǐng)域最多。
根據(jù)相關(guān)的地區(qū)數(shù)據(jù)統(tǒng)計來看(見圖3),經(jīng)濟(jì)和文化發(fā)達(dá)的地區(qū),有關(guān)知識發(fā)現(xiàn)系統(tǒng)研究的研究機(jī)構(gòu)、學(xué)者和話題最多,這也是符合事物的發(fā)展規(guī)律的;另外一個相關(guān)因素是高校和名校,特別是計算機(jī)相關(guān)專業(yè)和圖書情報專業(yè)發(fā)展比較迅速的高校,比如武漢就是因為武漢大學(xué)信息管理學(xué)院是圖情相關(guān)領(lǐng)域研究和發(fā)展的排頭兵。
圖3 知識發(fā)現(xiàn)系統(tǒng)研究的地區(qū)分布
1.1.2 文獻(xiàn)主題分析
1.1.2.1 關(guān)鍵文獻(xiàn)內(nèi)容分析
胡瑋[1]調(diào)查985工程高校圖書館資源發(fā)現(xiàn)系統(tǒng)建設(shè)和應(yīng)用現(xiàn)狀,統(tǒng)計和分析了數(shù)量、系統(tǒng)名稱、建設(shè)方式以及系統(tǒng)選擇幾個方面,認(rèn)為要根據(jù)館情選擇系統(tǒng)。袁玉英[2]介紹了目前常用的四種資源發(fā)現(xiàn)系統(tǒng),從功能性、可靠性、易用性、可移植性等角度對其進(jìn)行分析比較,指出資源發(fā)現(xiàn)產(chǎn)品的不足和今后發(fā)展方向。王悅辰[3]從整合資源、發(fā)現(xiàn)知識、知識關(guān)聯(lián)與預(yù)測、文獻(xiàn)獲取方便度以及個性化服務(wù)等方面,對國內(nèi)四大發(fā)現(xiàn)系統(tǒng)“中國學(xué)術(shù)搜索”“超星發(fā)現(xiàn)系統(tǒng)”“智立方發(fā)現(xiàn)系統(tǒng)”“學(xué)知搜索”的中文資源發(fā)現(xiàn)功能進(jìn)行了比較分析,認(rèn)為“超星發(fā)現(xiàn)系統(tǒng)”在各方面都占據(jù)優(yōu)勢。朱前東[4]通過國外文獻(xiàn)調(diào)研和網(wǎng)站調(diào)查,將國外資源發(fā)現(xiàn)系統(tǒng)評價策略歸納為三種,即系統(tǒng)功能評價、系統(tǒng)可用性評價和系統(tǒng)使用績效評價。陳小磊[5]等人利用資源發(fā)現(xiàn)系統(tǒng)的特性研究了圖書館的學(xué)科服務(wù)內(nèi)容。張為江[6]以用戶需求為中心、從知識服務(wù)平臺、用戶知識行為分析平臺、知識發(fā)現(xiàn)平臺、數(shù)字圖書館資源等方面對數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)進(jìn)行了論述。王灝[7]從圖情機(jī)構(gòu)館藏和服務(wù)的問題入手,介紹了資源發(fā)現(xiàn)系統(tǒng)的概念和技術(shù)路線,并以“中國學(xué)術(shù)搜索網(wǎng)”為例,介紹了該平臺在資源發(fā)現(xiàn)服務(wù)中的總體設(shè)計、關(guān)鍵技術(shù)、核心功能和服務(wù)方式。張松巖和崔鵬[8]概述了發(fā)現(xiàn)系統(tǒng)的內(nèi)涵和功能,對比國內(nèi)常見的發(fā)現(xiàn)系統(tǒng),提出發(fā)現(xiàn)系統(tǒng)引進(jìn)和應(yīng)用的措施。陳定權(quán)[9]等人介紹了WorldCat Local、EBSCO
Discovery Service、Summon、Primo四大具有集中索引倉儲的Web級資源發(fā)現(xiàn)系統(tǒng),從內(nèi)容索引、系統(tǒng)特性、檢索結(jié)果顯示三個方面對它們進(jìn)行比較分析,測定出未來的發(fā)展趨勢。王?;ê完憺閲鳾10]在比較和評估發(fā)現(xiàn)系統(tǒng)的過程中,開展用戶體驗度量測試,結(jié)果表明,用戶體驗測試在一定程度上能夠反映不同廠商發(fā)現(xiàn)系統(tǒng)的優(yōu)勢與缺陷,發(fā)現(xiàn)系統(tǒng)的信息質(zhì)量影響著用戶的滿意度。竇天芳和姜愛蓉[11]介紹資源發(fā)現(xiàn)系統(tǒng)的產(chǎn)生背景、邏輯、結(jié)構(gòu)、功能特點及體系框架,指出當(dāng)前資源發(fā)現(xiàn)系統(tǒng)需要引起關(guān)注的兩個問題,以清華探索實踐為例,介紹使用經(jīng)驗,創(chuàng)新出數(shù)據(jù)驅(qū)動新思路。王天虹[12]對基于超星發(fā)現(xiàn)系統(tǒng)的高校圖書館中文資源發(fā)現(xiàn)服務(wù)進(jìn)行了初步評估,并比較了其與國外發(fā)現(xiàn)系統(tǒng)的不同之處。謝含[13]以超星發(fā)現(xiàn)系統(tǒng)為原始數(shù)據(jù)統(tǒng)計源,對2010年至2013年江西中醫(yī)藥大學(xué)發(fā)表的國內(nèi)論文進(jìn)行統(tǒng)計分析,通過對論文中文學(xué)科分類情況、作者、文獻(xiàn)類型、核心期刊、基金項目等項指標(biāo)的統(tǒng)計分析,研究了大學(xué)學(xué)術(shù)發(fā)展?fàn)顩r以及影響力。
1.1.2.2 內(nèi)容主題分析
從知識發(fā)現(xiàn)系統(tǒng)相關(guān)文獻(xiàn)和系統(tǒng)的調(diào)查來看,目前圖書情報界對知識發(fā)現(xiàn)系統(tǒng)領(lǐng)域的主要研究分為以下幾個部分。(1)理論探索。這些文獻(xiàn)主要在早期,主要以內(nèi)容統(tǒng)一檢索、一站式檢索、聯(lián)邦檢索、元數(shù)據(jù)整合、系統(tǒng)可行性等方面的研究居多。(2)實踐探索。主要內(nèi)容是關(guān)于圖書館技術(shù)部門自身或聯(lián)合相關(guān)技術(shù)公司共同開發(fā)適合于圖書館使用的知識發(fā)現(xiàn)系統(tǒng),這部分多數(shù)是原型和框架結(jié)構(gòu)的研究,還有部分試用型產(chǎn)品,能用于正式使用的系統(tǒng)并不多。(3)對國內(nèi)外知識發(fā)現(xiàn)系統(tǒng)的介紹、比較、選型。這個類型的文獻(xiàn)最多,主要是世界上三大發(fā)現(xiàn)系統(tǒng)的推廣和使用,超星中文發(fā)現(xiàn)系統(tǒng)的研究和應(yīng)用。這些產(chǎn)品的應(yīng)用給圖書館帶來了活力,也引發(fā)了一系列的討論和對比研究。(4)知識發(fā)現(xiàn)系統(tǒng)評價類、綜述類。主要是對發(fā)現(xiàn)系統(tǒng)本身的合理性、易用性等方面的研究。(5)利用知識發(fā)現(xiàn)系統(tǒng)對其他學(xué)科的分析。主要是基于國外三大發(fā)現(xiàn)系統(tǒng)、超星中文發(fā)現(xiàn)系統(tǒng),利用系統(tǒng)本身的檢索和匯聚功能對各自學(xué)科的研究熱點、研究趨勢等方面的研究。(6)對發(fā)現(xiàn)系統(tǒng)本身優(yōu)點、缺點的研究和思考,以及對發(fā)現(xiàn)系統(tǒng)近幾年來的使用效果的反思。(7)新信息環(huán)境下知識發(fā)現(xiàn)系統(tǒng)的更新和功能增強。這方面文獻(xiàn)較少,可能更值得去關(guān)注和研究。
1.2 知識發(fā)現(xiàn)系統(tǒng)的欠缺之處
根據(jù)文獻(xiàn)調(diào)研和瀏覽各廠商知識發(fā)現(xiàn)系統(tǒng),可以看出,目前的知識分析系統(tǒng)已經(jīng)做得非常實用,從功能、資源到使用友好度,都有了很大提高,但還有欠缺之處,其主要表現(xiàn)在以下幾個方面。(1)產(chǎn)品的成熟度方面。元數(shù)據(jù)的深度整合和標(biāo)準(zhǔn)化處理流程、網(wǎng)絡(luò)環(huán)境下的系統(tǒng)架構(gòu)和智能化發(fā)現(xiàn)功能需要增強。(2)資源覆蓋率不足。(3)圖書館資源信息安全隱患,如數(shù)據(jù)的流失。(4)個性化、社交化功能欠缺。(5)資源推薦、數(shù)據(jù)挖掘、知識分析等方面有待加強。(6)信息滯后問題,特別是和館藏更新的匹配方面。
2 知識發(fā)現(xiàn)系統(tǒng)在新信息環(huán)境下的改進(jìn)要求
目前,知識發(fā)現(xiàn)系統(tǒng)雖已在業(yè)界得到了一定的程度的研究和實踐,數(shù)據(jù)庫商、系統(tǒng)開發(fā)商主導(dǎo)開發(fā)的系統(tǒng)功能、用戶體驗、資源配置等方面都基本滿足了需求,但整個開發(fā)進(jìn)程當(dāng)中圖書館員和讀者參與度比較小,開發(fā)商不能及時了解用戶的需求,使得系統(tǒng)和用戶之間始終有一道隔膜,使用中也有很多不滿意的地方。這就需要主導(dǎo)產(chǎn)品的開發(fā)商積極聯(lián)系圖書館行業(yè)的專業(yè)人士、調(diào)研廣大的讀者,根據(jù)需求改進(jìn)知識發(fā)現(xiàn)系統(tǒng),使其成為用戶喜愛的產(chǎn)品。
2.1 大數(shù)據(jù)環(huán)境對知識發(fā)現(xiàn)系統(tǒng)的要求
大數(shù)據(jù)(Big data或Megadata),或稱巨量數(shù)據(jù)、海量數(shù)據(jù),指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工在合理時間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息。大數(shù)據(jù)復(fù)雜而無序,其內(nèi)在的關(guān)聯(lián)性是其價值所在。大數(shù)據(jù)的核心是從海量數(shù)據(jù)中抽取相關(guān)內(nèi)容,形成有價值的信息[14]。知識發(fā)現(xiàn)系統(tǒng)產(chǎn)生的基礎(chǔ)是資源的海量增長,目的是將書刊目錄、二次文獻(xiàn)、電子期刊、電子圖書等文摘或全文有效地加以利用,為用戶提供完善有效地知識挖掘、信息分析、趨勢預(yù)測。發(fā)現(xiàn)系統(tǒng)的基礎(chǔ)是大數(shù)據(jù)、全數(shù)據(jù),發(fā)現(xiàn)系統(tǒng)包括結(jié)構(gòu)化元數(shù)據(jù)和全文數(shù)據(jù),更包括半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù),建立關(guān)鍵詞表、機(jī)構(gòu)庫、引文庫、作者庫、學(xué)科分類、刊種表、來源庫、學(xué)術(shù)專業(yè)詞庫同義詞表、單位產(chǎn)出庫等,來建立數(shù)據(jù)資源基礎(chǔ)。
2.2 新媒體環(huán)境對知識發(fā)現(xiàn)系統(tǒng)的啟發(fā)
一般來說,新媒體可以看做是利用網(wǎng)絡(luò)技術(shù)、數(shù)字和終端技術(shù)向用戶提供信息、娛樂服務(wù)的傳播形態(tài)[15]。一般包括數(shù)字雜志、報紙和廣播,手機(jī)上的微信、微博、電視、網(wǎng)絡(luò)以及桌面視窗、數(shù)字電視、數(shù)字電影、觸摸媒體等。新媒體平臺一般指的是微博、微信、各種APP、MOOC、播客、Wiki、RFID等等和傳播、服務(wù)有關(guān)的載體或技術(shù)平臺。知識發(fā)現(xiàn)系統(tǒng)應(yīng)該跟進(jìn)這些新媒體的發(fā)展,創(chuàng)新服務(wù),做好用戶體驗,服務(wù)用戶。
2.3 移動互聯(lián)網(wǎng)、“互聯(lián)網(wǎng)+”環(huán)境下知識發(fā)現(xiàn)系統(tǒng)的跟進(jìn)
截止2015年12月,國內(nèi)移動終端設(shè)備擁有8.99億的活躍量,人均單日手機(jī)使用時長為2.36小時,人均單日啟動手機(jī)應(yīng)用頻次為78次,在應(yīng)用上微信和QQ處于領(lǐng)先地位[16]。任忠忠和胡德華[18]調(diào)查發(fā)現(xiàn),大學(xué)生使用手機(jī)上網(wǎng)比較頻繁,使用移動搜索的機(jī)會比較多,上網(wǎng)頻率以“每天多次”為主,平均每天3次以上使用手機(jī)上網(wǎng)的用戶占54%左右,有32%的用戶使用手機(jī)上網(wǎng)的頻率為每天1-3次,已是移動搜索的一個龐大的穩(wěn)定消費群體。知識發(fā)現(xiàn)系統(tǒng)應(yīng)該順應(yīng)移動互聯(lián)網(wǎng)的需求,開發(fā)出基于微信或“手搜”APP之類的移動化服務(wù),以好用、易用、有效為上,牢牢抓住年輕大學(xué)生的使用習(xí)慣。
2.4 社交化、個性化對知識發(fā)現(xiàn)系統(tǒng)的需求
社交化、個性化是Web2.0概念的核心產(chǎn)物,很多產(chǎn)品都是基于SNS理念將產(chǎn)品帶上了盈利的道路。知識發(fā)現(xiàn)系統(tǒng)作為圖書館應(yīng)用的重要產(chǎn)品,不應(yīng)千人一面,應(yīng)該結(jié)合本校系統(tǒng)的讀者庫,做到個性化服務(wù)、社交化服務(wù)。
3 知識發(fā)現(xiàn)系統(tǒng)功能改進(jìn)的想法
在大數(shù)據(jù)、“互聯(lián)網(wǎng)+”、新媒體乃至全媒體環(huán)境下,知識發(fā)現(xiàn)系統(tǒng)必須從功能和體驗上改進(jìn),以便能在新環(huán)境下吸引用戶來使用。根據(jù)文獻(xiàn)和實踐研究,筆者設(shè)計新環(huán)境下知識發(fā)現(xiàn)系統(tǒng)的結(jié)構(gòu)如圖4所示。從圖中可以看出,知識發(fā)現(xiàn)系統(tǒng)核心是大數(shù)據(jù)處理、預(yù)測;新媒體的引入;社交化服務(wù)的引入;多終端個性化輸出。
3.1 基本功能的完善
知識發(fā)現(xiàn)系統(tǒng)的基礎(chǔ)功能是:提供類似谷歌、百度的簡單搜索框,進(jìn)行全文、全字段搜索,檢索結(jié)果列表頁包括相關(guān)結(jié)果(本館館藏書刊、電子圖書、電子期刊、學(xué)位論文、會議論文等),提供分面檢索(按文獻(xiàn)類型、時間、作者、機(jī)構(gòu)、期刊等類型精煉檢索),提供檢索結(jié)果的多個全文下載途徑或者文獻(xiàn)傳遞入口。在點開某個具體記錄的結(jié)果頁面中,提供相關(guān)文獻(xiàn)推薦和文獻(xiàn)的相關(guān)引文。
需要增強的相關(guān)功能:(1)檢索結(jié)果最好能直接提供全文下載,將多個途徑一一列出,區(qū)分開CNKI、維普、萬方等數(shù)據(jù)庫,避免有時候某個數(shù)據(jù)庫暫時不能訪問的問題;(2)嚴(yán)格檢測檢索結(jié)果重復(fù)條目,區(qū)分是數(shù)據(jù)庫里面重復(fù)還是知識發(fā)現(xiàn)系統(tǒng)本身的問題;(3)館藏紙本資源可分成紙本圖書、紙本期刊,并且能用接口及時同步圖書館自動化管理系統(tǒng)中的書刊數(shù)據(jù),本館館藏能顯示館藏地基本信息;(4)在搜索框中加入類似谷歌自動提示的功能,提高用戶搜索體驗;(5)對于用戶輸入錯誤能夠智能糾錯,如提示“你是否要搜索xxx”;(6)提供搜索推薦,如果讀者未能找到自己想要的資料,在頁面底部的檢索建議欄目為讀者提供更多選擇,如谷歌、百度、讀秀、e讀等等,或讓用戶嘗試“返回檢索框,檢查您的拼寫、修改檢索詞或擴(kuò)展檢索條件”,或者轉(zhuǎn)向咨詢臺去在線咨詢或者留言;(7)收錄要全、相關(guān)度排序更準(zhǔn)確;(8)收集用戶的搜索關(guān)鍵詞,對熱門搜索的關(guān)鍵詞做成標(biāo)簽云圖,對讀者的搜索起到一個導(dǎo)向作用;(9)嵌入百科類產(chǎn)品、用戶評論、網(wǎng)摘、系統(tǒng)或自定義標(biāo)簽等,將用戶的搜索名詞、地點等有定義和典故的顯示出來,以眾籌、眾包模式來解決用戶的問題,強化圖書館的知識交流中心功能,拉近用戶與圖書館的距離;(10)吸收更多OA資源。
3.2 大數(shù)據(jù)功能的支持
大數(shù)據(jù)對知識發(fā)現(xiàn)系統(tǒng)要求集成海量資源、資源深度加工、超強計算能力、穩(wěn)定的檢索服務(wù)和優(yōu)質(zhì)的檢索效果。
海量資源的高度集成及深度加工需要與世界知名內(nèi)容提供商進(jìn)行一對一合作,授權(quán)獲取到最為全面、穩(wěn)定、優(yōu)質(zhì)的題錄數(shù)據(jù)。對于OA資源,利用OAI-PMH等協(xié)議收割數(shù)據(jù),利用爬蟲收錄、解析、加工和處理長尾站點。這樣就可能構(gòu)建比較全面的元數(shù)據(jù)庫。
大數(shù)據(jù)處理能力上,TB、PB以及EB等級別的數(shù)據(jù),可以進(jìn)行實時計算、更新,然后深加工為優(yōu)質(zhì)學(xué)者庫、期刊庫、會議庫、機(jī)構(gòu)庫等,為用戶提供更好的信息揭示服務(wù)。
檢索系統(tǒng)要穩(wěn)定快速,檢索效果相關(guān)度要高,對此,可學(xué)習(xí)百度、谷歌的搜索技術(shù),提供更好的檢索體驗。利用相關(guān)性計算,分析文獻(xiàn)他引情況、作者影響、影響因子、時間等因素綜合給出最為貼切的排序效果。
3.3 個性化、社交功能的引入
SNS社交網(wǎng)絡(luò)是Web2.0、Web3.0的核心理念和應(yīng)用。人們在網(wǎng)絡(luò)上渴望交往和交流,喜歡記錄自己的心得、評論,將人類生活的社交圈子無限擴(kuò)展。六度分割理論、小世界網(wǎng)絡(luò)理論、長尾理論是SNS的理論基礎(chǔ)。
知識發(fā)現(xiàn)系統(tǒng)的核心對象是資源和讀者,讓讀者活躍、讓資源流動和被揭示是其重要作用。要想做到這點,引入個性化和社交化是必不可少的。以人為中心,把相關(guān)興趣和學(xué)科的用戶聯(lián)系在一起;以資源為中心,把和此資源有關(guān)的書刊、電子資源、人推薦給使用者;提供檢索結(jié)果、命中條目打分、評論、推薦、添加標(biāo)簽、認(rèn)領(lǐng)成果等功能。圖5和圖6是基本功能示意圖。
3.4 文獻(xiàn)分析、知識分析的功能
知識發(fā)現(xiàn)系統(tǒng)中文獻(xiàn)信息分析、知識分析和知識圖譜的應(yīng)用越來越多,將應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與方法與計量學(xué)引文分析、共現(xiàn)分析等方法結(jié)合,利用可視化圖形形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識架構(gòu)為學(xué)科研究提供切實的、有價值的參考[18]。以超星知識發(fā)現(xiàn)系統(tǒng)為例,目前,該系統(tǒng)已經(jīng)能做到以下幾方面。(1)知識相關(guān)鏈、作者相關(guān)鏈、作者機(jī)構(gòu)相關(guān)鏈,將知識、作者、作者機(jī)構(gòu)等立體關(guān)聯(lián),追溯、挖掘?qū)W科與文獻(xiàn)信息的研究領(lǐng)域和研究方向。(2)學(xué)術(shù)發(fā)展現(xiàn)狀、預(yù)測未來趨勢。(3)提供同類主題、學(xué)科、領(lǐng)域等文獻(xiàn)資源的知識發(fā)展方向分析,方便研究某一學(xué)科領(lǐng)域或者主題方向的知識發(fā)展;挖掘分析多個主題、學(xué)科、領(lǐng)域等文獻(xiàn)資源的知識生長方向,便于發(fā)現(xiàn)不同學(xué)科領(lǐng)域或者主題之間的知識關(guān)聯(lián)性;提供不同機(jī)構(gòu)的學(xué)術(shù)文獻(xiàn)生長方向分析,便于合理有效的利用和掌握機(jī)構(gòu)的知識體系。(4)將檢索結(jié)果根據(jù)關(guān)鍵詞的類型、時間、作者、學(xué)科、學(xué)術(shù)價值等進(jìn)行統(tǒng)計分析聚合,實現(xiàn)可視化查看統(tǒng)計結(jié)果。
但是,筆者在超星發(fā)現(xiàn)系統(tǒng)的“學(xué)術(shù)輔助分析系統(tǒng)”的實際操作中仍然發(fā)現(xiàn)一些需要改進(jìn)之處。(1)在文獻(xiàn)計量方面,發(fā)文趨勢圖上應(yīng)直接標(biāo)出每年的發(fā)文量,這樣更直接和明晰。(2)在圖表的展示上應(yīng)使用統(tǒng)一、簡潔風(fēng)格(顏色、樣式)。(3)應(yīng)加強合作網(wǎng)絡(luò)分析功能和作者、機(jī)構(gòu)或者國家的合作網(wǎng)絡(luò)分析。(4)應(yīng)加強主題、關(guān)鍵詞或WoS 分類的共現(xiàn)分析。(5)應(yīng)加強文獻(xiàn)的共被引分析、作者的共被引分析以及期刊的共被引分析。(6)應(yīng)加強文獻(xiàn)的耦合分析。(7)應(yīng)支持聚類分析,探測文獻(xiàn)突變,得出研究熱點和趨勢等功能。(8)應(yīng)支持多種記錄格式的導(dǎo)出,支持其他軟件的分析,擴(kuò)大超星發(fā)現(xiàn)系統(tǒng)的通用性和知名度。
參考文獻(xiàn):
[ 1 ] 胡瑋.“985工程”高校圖書館資源發(fā)現(xiàn)系統(tǒng)現(xiàn)狀分析和思考[J].圖書館學(xué)研究,2013(16):43-48.
[ 2 ] 袁玉英.常用幾種資源發(fā)現(xiàn)系統(tǒng)對比分析研究[J].圖書館工作與研究,2015(9):38-41.
[ 3 ] 王悅辰.國內(nèi)四大中文知識發(fā)現(xiàn)系統(tǒng)比較分析[J].圖書館工作與研究,2015(9):42-45.
[ 4 ] 朱前東.國外資源發(fā)現(xiàn)系統(tǒng)評價策略研究[J].圖書與情報,2014(4):6-10.
[ 5 ] 陳小磊,季培培,王莉.基于高校圖書館學(xué)科服務(wù)的資源發(fā)現(xiàn)系統(tǒng)研究[J].農(nóng)業(yè)圖書情報學(xué)刊,2015,12(12):25-28.
[ 6 ] 張為江.基于用戶需求分析的數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)研究[J].圖書館理論與實踐,2014(9):83-85.
[ 7 ] 王灝,張正鋒,馮巍.圖情資源發(fā)現(xiàn)系統(tǒng)的研究與實現(xiàn)[J].數(shù)字圖書館論壇,2013(6):51-56.
[ 8 ] 張松巖,崔鵬.圖書館知識發(fā)現(xiàn)系統(tǒng)建設(shè)與應(yīng)用研究[J].圖書館工作與研究,2014(2):54-57.
[ 9 ] 陳定權(quán),盧玉紅,楊敏.圖書館資源發(fā)現(xiàn)系統(tǒng)的現(xiàn)狀與趨勢[J].圖書情報工作,2012,56(7):44-48.
[10] 王?;ǎ憺閲?學(xué)術(shù)資源發(fā)現(xiàn)系統(tǒng)的用戶體驗測試研究[J].新世紀(jì)圖書館,2015(11):48-51.
[11] 竇天芳,姜愛蓉.資源發(fā)現(xiàn)系統(tǒng)功能分析及應(yīng)用前景[J].圖書情報工作,2012,56(7):38-43.
[12] 王天虹.基于超星發(fā)現(xiàn)系統(tǒng)的高校圖書館中文資源發(fā)現(xiàn)服務(wù)[J].圖書館學(xué)刊,2014(8):72-74,78.
[13] 謝含.基于超星發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)分析:以江西中醫(yī)
藥大學(xué)國內(nèi)論文為例[J].江西中醫(yī)藥大學(xué)學(xué)報,2015(3):95-98.
[14] 劉文遠(yuǎn),李少雄,王曉敏,等.大數(shù)據(jù)知識發(fā)現(xiàn)[J].燕山大學(xué)學(xué)報,2014,38(9):377-379.
[15] 百度百科.新媒體[EB/OL].[2016-03-10].http://baike.baidu.com/subview/339017/5403053.htm.
[16] 新浪科技.2015年中國移動互聯(lián)網(wǎng)研究報告[EB/OL].[2016-03-11].http://tech.sina.com.cn/2016-01-08/doc-ifxnkkuy7746197.shtml.
[17] 任忠忠,胡德華.大學(xué)生移動搜索特征研究[J].知識管理論壇,2014(3):45-52.
[18] 百度百科.知識圖譜[EB/OL].[2016-03-14].http://baike.baidu.com/view/5361633.htm.