趙冬香 朱巧玲
(凱里學(xué)院圖書館,貴州 凱里 556011)
機(jī)構(gòu)知識庫,很多文獻(xiàn)上又稱之為“機(jī)構(gòu)庫”、“機(jī)構(gòu)存儲”等,是一個(gè)學(xué)術(shù)機(jī)構(gòu)在網(wǎng)絡(luò)環(huán)境下建立的一個(gè)開放共享數(shù)據(jù)庫,該數(shù)據(jù)庫對機(jī)構(gòu)內(nèi)各種數(shù)字化學(xué)術(shù)成果獲取、存儲、管理、發(fā)布[1],最終目標(biāo)是實(shí)現(xiàn)可開放資源的共享,并借此提高本機(jī)構(gòu)的學(xué)術(shù)影響力。自2002年俄亥俄州立大學(xué)建立第一個(gè)機(jī)構(gòu)知識庫以來,機(jī)構(gòu)知識庫已被越來越多的國內(nèi)外科研院所與高等院校關(guān)注并加以應(yīng)用。目前,機(jī)構(gòu)知識庫已經(jīng)逐步成為知識共享的重要內(nèi)容,同時(shí)也是大學(xué)、科研院所等機(jī)構(gòu)傳播學(xué)術(shù)作品的重要交流平臺。
根據(jù)國際著名開放存取名錄OpenDOAR的實(shí)時(shí)統(tǒng)計(jì)[7],在 OpenDOAR 網(wǎng)站注冊的機(jī)構(gòu)知識庫從2005年的79個(gè),迅猛發(fā)展到2020年9月1日的5391。但是,數(shù)據(jù)顯示各國知識庫的發(fā)展分布很不平衡,5391個(gè)機(jī)構(gòu)庫中,中國大陸地區(qū)只有57個(gè),僅占總數(shù)的1.06%。瀏覽這57個(gè)機(jī)構(gòu)庫所涉及的高校,發(fā)現(xiàn)地方高校寥寥無幾。盡管中國機(jī)構(gòu)知識庫建設(shè)相關(guān)理論研究和實(shí)踐探索連年增長,但是關(guān)于地方高校機(jī)構(gòu)知識庫建設(shè)研究和實(shí)踐仍遠(yuǎn)遠(yuǎn)滯后于國內(nèi)大趨勢[1]。凱里學(xué)院作為新建地方本科高校,率先克服困難建設(shè)了機(jī)構(gòu)知識庫,在建庫過程中既有艱辛也有喜悅,現(xiàn)希望通過本文和其他地方高校分享整個(gè)建庫過程。
為適應(yīng)信息資源的共享發(fā)展,構(gòu)建學(xué)術(shù)研究資源收集、共享、展示、管理和存儲的平臺,全面揭示學(xué)校的學(xué)術(shù)研究成果資源,促進(jìn)校內(nèi)科研成果的傳播、共享與交流,凱里學(xué)院(以下簡稱凱院)機(jī)構(gòu)知識庫從2016年底月正式開始建設(shè),采用的是同方知網(wǎng)(北京)技術(shù)有限公司的軟件平臺。經(jīng)過1年的建設(shè),截止2017年11月,完成了全校所有分院、研究所及行政、教輔部門的機(jī)構(gòu)知識庫建設(shè)工作,實(shí)現(xiàn)了學(xué)術(shù)資源收集、整理、上傳[2],收集了學(xué)校教師自建校以來發(fā)表的論文元數(shù)據(jù)9000余條,以及1100多條學(xué)者數(shù)據(jù),至2020年9月22日,數(shù)據(jù)訪問量已達(dá)到142000余次,成果下載量達(dá)7200多次。由于凱里學(xué)院在2006年才升本,對于這樣升十多年的新建地方本科院校來說,這個(gè)數(shù)據(jù)訪問量是頻為驚人的。
我們在建設(shè)機(jī)構(gòu)知識庫時(shí)主要考慮了服務(wù)對象、實(shí)現(xiàn)功能、選用軟件、用戶元數(shù)據(jù)的設(shè)計(jì)及導(dǎo)入、資源元數(shù)據(jù)的設(shè)計(jì)及導(dǎo)入、數(shù)據(jù)更新及維護(hù)、后臺管理等因素,而其中最為重要的就是用戶元數(shù)據(jù)和資源元數(shù)據(jù)的設(shè)計(jì)及導(dǎo)入,這也是機(jī)構(gòu)知識庫建設(shè)的核心部分。本文也將針對這兩項(xiàng)進(jìn)行介紹。
凱院機(jī)構(gòu)庫的服務(wù)對象為本校的教師、博碩士研究生、科研人員/行政人員等凡在本校工作或?qū)W習(xí)的人員。服務(wù)對象可以向系統(tǒng)中提交多種類型的數(shù)據(jù)資源,具體內(nèi)容包括教學(xué)與學(xué)科科研活動(dòng)中產(chǎn)生的正式出版成果和非正式出版的灰色資源,類型有期刊論文、學(xué)位論文、會議論文、圖書、專利、標(biāo)準(zhǔn)、科技成果、研究報(bào)告、音視頻、演示課件、圖片、預(yù)印本等[3]。以上沒有的類型可以添加到“其他”這一類別中。同時(shí),在機(jī)構(gòu)知識庫中,服務(wù)對象提交學(xué)術(shù)成果之后,還能享受以下服務(wù):
1)管理個(gè)人在科研教學(xué)中產(chǎn)出的各種成果;
2)可查看自己成果的收錄引用情況;
3)可以查看個(gè)人成果的傳播情況;
4)管理自己的學(xué)術(shù)簡歷;
5)可查看自己成果的引證、合作、分布等可視化分析。
主要要求實(shí)現(xiàn)以下功能,如圖1所示:
圖1 凱院機(jī)構(gòu)知識庫實(shí)現(xiàn)功能
從圖一可以看出,凱院機(jī)構(gòu)庫主要從機(jī)構(gòu)知識庫展示、建設(shè)、系統(tǒng)設(shè)置/用戶管理三方面實(shí)現(xiàn)了其功能在機(jī)構(gòu)庫展示部分,主要是提供給訪客瀏覽、檢索的界面,包括資源導(dǎo)航、情況統(tǒng)計(jì)、成果展示等功能;機(jī)構(gòu)庫建設(shè)部分,是數(shù)據(jù)庫的核心區(qū)域,主要實(shí)現(xiàn)的是數(shù)據(jù)提供方或成果擁有者對數(shù)據(jù)或成果的錄入、認(rèn)領(lǐng)、審核、編輯、補(bǔ)充、統(tǒng)計(jì)、導(dǎo)出等。系統(tǒng)設(shè)置/用戶管理部分主要為系統(tǒng)管理員進(jìn)行后臺管理準(zhǔn)備,這部分功能是否能順利實(shí)現(xiàn)關(guān)系著建庫后系統(tǒng)維護(hù)、管理、推廣的效果與該庫的可持續(xù)性發(fā)展問題.
確定了機(jī)構(gòu)庫要實(shí)現(xiàn)的功能后,重點(diǎn)要考慮的就是建庫軟件的選用。通常有兩個(gè)選擇,其一是選用開源軟件,如高校機(jī)構(gòu)知識庫常用的DSpace、Eprints和Fedora等,其中DSpace因功能成熟,適合國情,國內(nèi)機(jī)構(gòu)知識庫建設(shè)大部分采用了該系統(tǒng)。
其二則是選用商業(yè)軟件。很多高校機(jī)構(gòu)選擇開源軟件,多半是迫于經(jīng)濟(jì)壓力,但是,例如DSpace軟件的問題就是當(dāng)對其系統(tǒng)擴(kuò)展功能進(jìn)行修改時(shí),需要更改系統(tǒng)的核心組件,這必然會影響系統(tǒng)的兼容性及穩(wěn)定性。因此,為了規(guī)避以上問題,更是為了方便今后的維護(hù)工作,凱里學(xué)院申請了專項(xiàng)建庫資金,購買了清華同方的軟件系統(tǒng),由其幫助建立系統(tǒng)構(gòu)架及進(jìn)行數(shù)據(jù)導(dǎo)入服務(wù)。
清華同方的建庫軟件系統(tǒng)優(yōu)勢如下:
1)CNKI海量數(shù)據(jù)支持機(jī)構(gòu)知識庫的便捷、規(guī)范建設(shè)。表現(xiàn)為:公開發(fā)表成果資源收錄完整;數(shù)據(jù)更新持續(xù)、及時(shí);支持歷史數(shù)據(jù)回溯;數(shù)據(jù)加工嚴(yán)格、規(guī)范;提供中文成果引文數(shù)據(jù)服務(wù)。
2)平臺擴(kuò)展性強(qiáng),安全性高。支持資源類型豐富:期刊論文、會議論文、報(bào)紙、著作文集、專利、標(biāo)準(zhǔn)、科技成果、軟件著作權(quán)、音像出版物、研究報(bào)告、演示文稿、音視頻圖片、預(yù)印本等。
3)功能模塊化,支持按需選配模塊。模塊化管理,可靈活控制用戶功能權(quán)限、數(shù)據(jù)權(quán)限,內(nèi)容開放策略自定義設(shè)置。
4)豐富的展示與應(yīng)用服務(wù),促進(jìn)機(jī)構(gòu)知識庫推廣。系統(tǒng)整理、呈現(xiàn)學(xué)者、團(tuán)隊(duì)的研究成果;通過學(xué)者關(guān)注與分享、成果引用與傳播分析等服務(wù),吸引作者提交內(nèi)容;增加成果傳播度,提高學(xué)術(shù)論文引用率;提供多維度統(tǒng)計(jì)圖表,為科研考核與評估提供客觀的數(shù)據(jù) 支撐[4]。
確定了合作對象為同方知網(wǎng)并選擇其軟件建庫后,開始著手創(chuàng)建機(jī)構(gòu)知識庫。從圖2機(jī)構(gòu)知識庫建設(shè)流程可以看出,創(chuàng)建機(jī)構(gòu)知識庫,首先要確定機(jī)構(gòu)內(nèi)成員個(gè)人基本情況,如院系、用戶姓名、部門、職稱、學(xué)位、聯(lián)系方式、獲獎(jiǎng)情況、研究方向等,并估算下數(shù)據(jù)規(guī)模,提出數(shù)據(jù)質(zhì)量要求。有關(guān)人員基本情況數(shù)據(jù)是請凱院人事部門以行政命令的形勢發(fā)文向各分院、部門收集,之后提供給知網(wǎng)技術(shù)人員,由其在建設(shè)初期利用Excel模板整理導(dǎo)入機(jī)構(gòu)基本信息,并且對于已知詞典信息進(jìn)行補(bǔ)充,對重點(diǎn)人員補(bǔ)充作者代碼信息。在收集整理人員信息的過程中不可避免的存在錯(cuò)漏及需更改情況,故在機(jī)構(gòu)庫建成以后,該部分信息交由用戶自行登陸進(jìn)行補(bǔ)充、修改。
圖2 機(jī)構(gòu)知識庫建設(shè)流程
用戶個(gè)人數(shù)據(jù)導(dǎo)入后,由圖二可以看出接下來要進(jìn)行機(jī)構(gòu)庫資源數(shù)據(jù)的收集及導(dǎo)入。在遴選機(jī)構(gòu)資源數(shù)據(jù)前,要進(jìn)行機(jī)構(gòu)字段拆分詞標(biāo)引、碩博士專業(yè)字段標(biāo)引,再對院系、人員字段機(jī)器標(biāo)引,慎重起見,對院系、人員數(shù)據(jù)字段再次檢查手工標(biāo)引,將經(jīng)過標(biāo)引后的機(jī)構(gòu)元數(shù)據(jù)導(dǎo)入機(jī)構(gòu)成果庫,將元數(shù)據(jù)發(fā)布到UI系統(tǒng),經(jīng)過UI數(shù)據(jù)檢查沒有問題后,最后進(jìn)行數(shù)據(jù)部署,即提取數(shù)據(jù)全文。這一部分是機(jī)構(gòu)知識庫內(nèi)容建設(shè)最重要的組成部分,因資源數(shù)據(jù)量龐大且每年遞增,所以在機(jī)構(gòu)知識庫初步建成后[2],后續(xù)最重要的工作內(nèi)容就是資源數(shù)據(jù)的持續(xù)更新。
對于凱院這種單一的高校機(jī)構(gòu)庫,資源數(shù)據(jù)獲取主要采用建設(shè)者批量導(dǎo)入方式,即由機(jī)構(gòu)知識庫管理者或建設(shè)者向機(jī)構(gòu)知識庫提交該機(jī)構(gòu)成員的成果內(nèi)容,這是機(jī)構(gòu)知識庫建設(shè)初期最主要的內(nèi)容建設(shè)方式,這種方式可快速提高機(jī)構(gòu)知識庫數(shù)據(jù)量[2]。很多高校有自建的論文庫、科研成果庫等,也可以做為資源數(shù)據(jù)的來源。但是,凱院之前沒有這方面的儲備,故請CNKI公司以建設(shè)者的身份數(shù)據(jù)批量導(dǎo)入凱院教師論文、專著等各項(xiàng)科研成果數(shù)據(jù),因?yàn)閯P院購買了CNKI的相應(yīng)數(shù)據(jù)庫,所以在導(dǎo)入數(shù)據(jù)方面沒有什么障礙。而且CNKI本身有龐大的歷史數(shù)據(jù)庫作支撐,其提供的資源數(shù)據(jù)無論在準(zhǔn)確性還是完整性上,都比較令人滿意,但大批量的數(shù)據(jù)導(dǎo)入過程中,難免會出現(xiàn)錯(cuò)抓、漏抓數(shù)據(jù)等情況[2],這時(shí)可以由機(jī)構(gòu)成員主動(dòng)向機(jī)構(gòu)知識庫系統(tǒng)提交個(gè)人成果,以輔助形式來查缺補(bǔ)漏。
在機(jī)構(gòu)知識庫建成并且運(yùn)行趨于穩(wěn)定后,我們關(guān)注的重點(diǎn)將轉(zhuǎn)向機(jī)構(gòu)數(shù)據(jù)的維護(hù)、更新及推廣等方面。凱院由于是購買的清華同方(知網(wǎng))公司的軟件使用權(quán),并委托其建庫,所以在軟件使用有效期內(nèi),都是由知網(wǎng)公司負(fù)責(zé)機(jī)構(gòu)庫的維護(hù)等工作。但知網(wǎng)作為第三方機(jī)構(gòu),首先不能隨時(shí)跟進(jìn)凱院的人員變動(dòng)情況,即時(shí)更新相關(guān)數(shù)據(jù);其次一旦到達(dá)軟件使用有效期,機(jī)構(gòu)庫的后續(xù)工作將完全交付回凱院,而凱院只能將這個(gè)學(xué)術(shù)型數(shù)據(jù)庫交給圖書館管理,盡管圖書館管理機(jī)構(gòu)庫有天然的資源優(yōu)勢和服務(wù)優(yōu)勢,但卻無法彌補(bǔ)其巨大的人員和技術(shù)缺陷。以凱院為例,作為一個(gè)地方本科院校,其圖書館根本沒有能力和權(quán)限引進(jìn)碩士及以上專業(yè)人員,而本科生更連進(jìn)入招聘計(jì)劃的機(jī)會都沒有。自2013年至今的七年時(shí)間,凱院圖書館沒有引進(jìn)一位專業(yè)技術(shù)人員,不是不想,而是引進(jìn)不來。今年是軟件使用期限的最后一年,凱院將面臨著是繼續(xù)交錢續(xù)費(fèi)由CNKI管理、更新,還是收回來自己管理的問題,無論是哪一種結(jié)果,都將面臨著許多問題。
在凱院機(jī)構(gòu)知識庫建庫過程中,遇到了一些問題,具體情況 如下:
目前,凱院的機(jī)構(gòu)庫提供的服務(wù)比較單一,僅局限于基本的成果檢索、瀏覽、下載等淺層功能,只初步實(shí)現(xiàn)了“成果典藏”的功能,并且缺乏個(gè)性化服務(wù),用戶體驗(yàn)度不高[5]。同時(shí),做為高校的單一機(jī)構(gòu)庫,沒有和其他高校結(jié)成聯(lián)盟,無法在最大范圍內(nèi)實(shí)現(xiàn)資源的共享,不能充分體現(xiàn)機(jī)構(gòu)庫的功能。
機(jī)構(gòu)知識庫在建庫時(shí)一般都有專項(xiàng)資金,所以在建庫時(shí)感覺不到資金壓力。但一旦建庫完成,其運(yùn)行階段的資金出處問題就凸顯出來了。沒有資金的具體出處,那機(jī)構(gòu)庫軟件的續(xù)費(fèi),機(jī)構(gòu)數(shù)據(jù)的維護(hù)、更新以及對機(jī)構(gòu)庫的推廣、功能擴(kuò)展等工作都不能順利進(jìn)行。如何使機(jī)構(gòu)庫保持持久的生命力,真正長期的服務(wù)于教學(xué)和科研,而不是淪為“形象工程”、“面子工程”,最終導(dǎo)致其成為“雞肋”,這些都是機(jī)構(gòu)庫持續(xù)發(fā)展面臨的難題。
凱院機(jī)構(gòu)知識庫在建成之初,曾在學(xué)校網(wǎng)站上發(fā)布了新聞,之后就沒有進(jìn)行過正式的宣傳,導(dǎo)致只有少部分老師知道學(xué)校機(jī)構(gòu)庫的存在及作用,后期的推廣應(yīng)用也沒有跟得上,這些都極大限制了機(jī)構(gòu)庫的持續(xù)發(fā)展和潛力開發(fā)。
凱院機(jī)構(gòu)庫在建立的過程中,雖然遇到了一些困難,在后期運(yùn)行過程中也逐步發(fā)現(xiàn)了不足,但不可不否認(rèn)的是,其日益增長的訪問量證明了學(xué)校師生已逐步認(rèn)可了機(jī)構(gòu)的科研價(jià)值,相信其在以后的發(fā)展中會出現(xiàn)更令人滿意的結(jié)果。
而凱院在建庫中遇到的困難,同樣也困擾著許多其他高校,要解決這些問題,不是單獨(dú)的一個(gè)高?;蚩蒲性核茏龅降?,而是需要多個(gè)機(jī)構(gòu)組成聯(lián)盟全力解決,即所謂的機(jī)構(gòu)知識庫聯(lián)盟。國外機(jī)構(gòu)知識庫聯(lián)盟的實(shí)踐較為成熟,國內(nèi)也日益重視機(jī)構(gòu)知識庫聯(lián)盟的建設(shè)。 聯(lián)盟合作協(xié)調(diào)的形式,將參與其中的每個(gè)成員的信息資源與科研成果進(jìn)行整合,構(gòu)建出具有共享性質(zhì)的機(jī)構(gòu)知識庫群,統(tǒng)一提供相應(yīng)的數(shù)字化服務(wù),最終實(shí)現(xiàn)不同機(jī)構(gòu)間知識資源的共享與使用[6]。聯(lián)盟化將成為今后機(jī)構(gòu)庫發(fā)展的一大趨勢。