詹華清 李 卉 介 鳳 盧志國(guó) 王 娟
2016年以來(lái),上海大學(xué)圖書館基于西安知先公司軟件平臺(tái)開展機(jī)構(gòu)知識(shí)庫(kù)建設(shè)。圍繞學(xué)校的科研與管理需求,以“為學(xué)校提供基礎(chǔ)成果數(shù)據(jù)、助力學(xué)??蒲泄芾頉Q策”為目標(biāo)開展建設(shè)與服務(wù)。機(jī)構(gòu)知識(shí)庫(kù)為上海大學(xué)聘期考核、年度考核、中級(jí)職稱評(píng)定提供了數(shù)據(jù)支持,成果數(shù)據(jù)直接嵌入人事信息系統(tǒng)。機(jī)構(gòu)知識(shí)庫(kù)成果嵌入教師信息門戶的個(gè)人信息頁(yè)面和教師主頁(yè),嵌入上海大學(xué)數(shù)據(jù)智能決策系統(tǒng)(BI),科研管理者界面可按評(píng)價(jià)指標(biāo)查詢教師、院系的論文等機(jī)構(gòu)庫(kù)成果。成果數(shù)據(jù)還在學(xué)校開展的各類成果統(tǒng)計(jì)與分析中得以運(yùn)用,如《ESI學(xué)科倍增計(jì)劃》、高水平人才評(píng)估等。將來(lái),上海大學(xué)研究生培養(yǎng)質(zhì)量的論文認(rèn)定工作也計(jì)劃遷移到機(jī)構(gòu)知識(shí)庫(kù)來(lái)。
面對(duì)學(xué)??蒲泄芾頉Q策的多樣化需求,機(jī)構(gòu)知識(shí)庫(kù)系統(tǒng)的功能亟需拓展與提升,本文將總結(jié)上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)的一些做法及我們的思考,以此拋磚引玉,和同行交流探討。
成果的收集完整、信息準(zhǔn)確是機(jī)構(gòu)知識(shí)庫(kù)提供決策支持服務(wù)的基礎(chǔ),決定了服務(wù)的質(zhì)量與水平。上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)自建立以來(lái),在成果收集的全面與準(zhǔn)確方面做了大量工作,在響應(yīng)藝術(shù)類院系的個(gè)性化需求方面增設(shè)了相關(guān)的成果類型,具體如下。
上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)中缺少對(duì)藝術(shù)成果及其相關(guān)活動(dòng)的支持,經(jīng)與藝術(shù)類院系和人文社會(huì)科學(xué)處的反復(fù)討論和梳理,在機(jī)構(gòu)知識(shí)庫(kù)中新增了作品、成果認(rèn)可與獲獎(jiǎng)兩類成果,增加作品分類表。
在圖書、期刊、報(bào)紙等成果類型中發(fā)表的文學(xué)、藝術(shù)類成果,在相應(yīng)類型的定義中增加“作品分類”字段,作品分類表的一級(jí)、二級(jí)內(nèi)容設(shè)置如下:
·文學(xué)作品:小說(shuō)、詩(shī)歌、散文、報(bào)告文學(xué)、傳記、戲劇、曲藝、雜著、兒童文學(xué)、民間文學(xué)、民族文學(xué)、宗教文學(xué)
·美術(shù)作品:繪畫作品、書法作品、雕塑作品、攝影作品、篆刻作品、工藝美術(shù)作品、設(shè)計(jì)作品
·其他作品:音樂作品、舞蹈作品、雜技作品、電影作品、電視作品
針對(duì)于未經(jīng)正式出版物發(fā)表的文學(xué)藝術(shù)類作品,設(shè)置了兩個(gè)作品類成果類型:藝術(shù)作品、音頻視頻作品,其元數(shù)據(jù)定義如表1所示。
在學(xué)校的各類考核中,藝術(shù)類成果的展覽、參賽、收藏/采納等也位列其中,文學(xué)藝術(shù)類院系和科研管理部門希望將其納入。因此設(shè)計(jì)了成果認(rèn)可與獲獎(jiǎng)相關(guān)的三種類型:作品展覽、作品參賽與獲獎(jiǎng)、其他認(rèn)可(收藏/采納等)。這些類型不登記成果本身,只登記與成果相關(guān)的學(xué)術(shù)活動(dòng)(見表2)。
表1 作品類成果類型的元數(shù)據(jù)定義
表2 成果認(rèn)可與獲獎(jiǎng)?lì)惓晒愋偷脑獢?shù)據(jù)定義
每一項(xiàng)成果在機(jī)構(gòu)庫(kù)中只登記一次,當(dāng)活動(dòng)(如作品展覽)涉及到一個(gè)或多個(gè)成果時(shí),需在作品展覽提交中添加“成果代碼”,從而建立作品展覽與成果的關(guān)聯(lián),無(wú)需多次重復(fù)提交成果。
成果收錄的“全”指數(shù)量全,主要包括以下兩方面:
(1)來(lái)源數(shù)據(jù)庫(kù)中成果抓取數(shù)量全。上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)提供了系統(tǒng)抓取、作者提交兩種方式采集成果。系統(tǒng)抓取采取寬進(jìn)+過濾器的方法,如先以“上海大學(xué)”、“Shanghai Univ”等作為署名地址關(guān)鍵詞檢索與獲取成果,再通過過濾器設(shè)立上海大學(xué)的“確定關(guān)鍵詞”和“否定關(guān)鍵詞”列表篩選上海大學(xué)的成果正式入庫(kù)。抓取遺漏的成果通過作者提交形式補(bǔ)充,從而保證成果收錄數(shù)量的全面。
為保證收錄的全面性,定期進(jìn)行校對(duì)與補(bǔ)充。圖書館從來(lái)源數(shù)據(jù)庫(kù)中檢索上海大學(xué)成果,然后從機(jī)構(gòu)知識(shí)庫(kù)導(dǎo)出相應(yīng)成果進(jìn)行比對(duì),發(fā)現(xiàn)遺漏成果后導(dǎo)入機(jī)構(gòu)知識(shí)庫(kù)。
(2)政策與管理人員支持,提升作者提交成果的積極性。對(duì)于無(wú)來(lái)源數(shù)據(jù)庫(kù)的成果,需要作者提交,主要通過職能部門、院系科研秘書配合,在年度考核、職稱評(píng)聘等重要的時(shí)間節(jié)點(diǎn)要求師生提交。
成果收錄的“準(zhǔn)”,主要包括三方面:
(1)元數(shù)據(jù)完整與準(zhǔn)確。如果是系統(tǒng)抓取的成果,元數(shù)據(jù)的質(zhì)量和完整度取決于來(lái)源數(shù)據(jù)庫(kù)數(shù)據(jù)開放的程度及數(shù)量質(zhì)量。如果是作者提交的成果,則取決于提交界面的友好、完善,以及提交者的提交態(tài)度。對(duì)于有來(lái)源數(shù)據(jù)庫(kù)收錄、且作者提交的成果,考慮到作者提交的數(shù)據(jù)質(zhì)量參差不齊,圖書館會(huì)定期對(duì)作者提交的成果到來(lái)源數(shù)據(jù)庫(kù)檢索后導(dǎo)入機(jī)構(gòu)知識(shí)庫(kù),覆蓋和補(bǔ)充作者提交內(nèi)容,以保證元數(shù)據(jù)的準(zhǔn)確與完整性。
(2)成果的唯一性,指一項(xiàng)成果在機(jī)構(gòu)知識(shí)庫(kù)中只有一條記錄,不得重復(fù)登記入庫(kù)。盡管機(jī)構(gòu)知識(shí)庫(kù)本身對(duì)去重設(shè)計(jì)了多種算法,但仍然存在相當(dāng)數(shù)量的重復(fù),原因很多,如:
· 同一數(shù)據(jù)庫(kù)多次抓取造成重復(fù),如中國(guó)知網(wǎng)中優(yōu)先發(fā)表論文與正式發(fā)表論文,Ei數(shù)據(jù)庫(kù)中In Press論文與正式發(fā)表后收錄論文,Ei數(shù)據(jù)庫(kù)中Accession Number發(fā)生變更的論文;
· 不同來(lái)源數(shù)據(jù)庫(kù)中抓取的同一論文,由于技術(shù)原因機(jī)構(gòu)知識(shí)庫(kù)無(wú)法識(shí)別造成重復(fù);
· 作者提交的成果和系統(tǒng)抓取的成果無(wú)法識(shí)別為同一論文造成重復(fù);
· 論文撤稿記錄、論文修正聲明等作為一項(xiàng)成果被入庫(kù)。
為清除重復(fù)論文,圖書館定期導(dǎo)出機(jī)構(gòu)知識(shí)庫(kù)中成果,設(shè)定規(guī)則和方法,根據(jù)標(biāo)題、作者、出版物、出版年、卷期、頁(yè)碼、DOI、收錄號(hào)等信息進(jìn)行程序和人工判斷,重復(fù)成果交由系統(tǒng)服務(wù)商批量合并、刪除,或由圖書館員進(jìn)行手工處理,并督促服務(wù)商改進(jìn)算法,降低重復(fù)率降。
(3)機(jī)構(gòu)知識(shí)庫(kù)中非本機(jī)構(gòu)成果的處理。首先,不斷完善過濾列表中的“否定關(guān)鍵詞”,提升本機(jī)構(gòu)成果的識(shí)別率;其次,定期將機(jī)構(gòu)庫(kù)成果與手工檢索成果進(jìn)行比對(duì)后予以剔除。
學(xué)位論文是上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)收集的成果類型之一,目前從萬(wàn)方數(shù)據(jù)庫(kù)抓取元數(shù)據(jù),但無(wú)論是萬(wàn)方還是中國(guó)知網(wǎng)的學(xué)位論文,對(duì)上海大學(xué)的收錄并不完整。而上海大學(xué)圖書館自建的學(xué)位論文數(shù)據(jù)庫(kù)相對(duì)完整。因此,圖書館計(jì)劃在機(jī)構(gòu)知識(shí)庫(kù)中導(dǎo)入上海大學(xué)學(xué)位論文數(shù)據(jù)庫(kù)的元數(shù)據(jù)和全文,同時(shí),基于機(jī)構(gòu)知識(shí)庫(kù)的成果提交、審核功能,進(jìn)行少量的二次開發(fā),使機(jī)構(gòu)知識(shí)庫(kù)成為集學(xué)位論文提交、審核、保存、管理和發(fā)布的平臺(tái)。
由于機(jī)構(gòu)庫(kù)建設(shè)較早,學(xué)校的需求發(fā)展較快,一些重要的成果屬性在機(jī)構(gòu)知識(shí)庫(kù)中并未揭示。而相關(guān)需求也不一定能得到系統(tǒng)服務(wù)商支持。為此,圖書館擬以二次開發(fā)的形式,在不改變機(jī)構(gòu)知識(shí)庫(kù)的基礎(chǔ)上,按需提取重要性信息,增設(shè)屬性信息表,增加屬性揭示的深度與細(xì)度。
機(jī)構(gòu)知識(shí)庫(kù)中的成果歸屬關(guān)系包括:機(jī)構(gòu)歸屬、部門歸屬、作者歸屬。其中,成果的機(jī)構(gòu)歸屬信息比較明確,因?yàn)闄C(jī)構(gòu)知識(shí)庫(kù)的成果收集標(biāo)準(zhǔn)就是以機(jī)構(gòu)成果為依據(jù)。作者歸屬依據(jù)署名作者,通過認(rèn)領(lǐng)后即可建立成果與作者的關(guān)聯(lián)。
成果的部門歸屬指成果署名單位中的部門,或成果發(fā)表時(shí)作者所在的部門。上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)建立成果的部門歸屬通過兩種方式:(1)在成果入庫(kù)時(shí)根據(jù)部門變形對(duì)成果署名單位進(jìn)行識(shí)別和標(biāo)記,在成果與院系部門中建立關(guān)聯(lián)。(2)在作者認(rèn)領(lǐng)時(shí),根據(jù)作者認(rèn)領(lǐng)時(shí)所在組織部門標(biāo)記成果的院系部門歸屬。
由于作者的任職部門可能會(huì)發(fā)生變化,與成果發(fā)表時(shí)的署名單位和部門不一致,導(dǎo)致成果的部門歸屬發(fā)生錯(cuò)誤。如科技處的領(lǐng)導(dǎo)認(rèn)領(lǐng)了其在理學(xué)院時(shí)發(fā)表的論文,導(dǎo)致該論文被同時(shí)標(biāo)記理學(xué)院(依署名地址識(shí)別)和科技處(依認(rèn)領(lǐng)人的任職部門標(biāo)記)兩個(gè)部門。
在針對(duì)院系部門的成果統(tǒng)計(jì)與KPI考核、學(xué)科分析報(bào)告時(shí),必須依據(jù)署名單位識(shí)別的成果部門歸屬信息。因此,有必要將以上兩種方式標(biāo)記的成果部門歸屬信息分開來(lái)。
我們?cè)O(shè)想在不改動(dòng)機(jī)構(gòu)知識(shí)庫(kù)底層數(shù)據(jù)的基礎(chǔ)上,增設(shè)部門歸屬信息表,依據(jù)署名單位識(shí)別成果的歸屬部門,而不依賴作者認(rèn)領(lǐng)記錄,歸屬部門屬性信息表示如表3所示。
表3 歸屬部門屬性信息表示例
國(guó)際合作、產(chǎn)學(xué)研合作、基金投入產(chǎn)出比等已經(jīng)成為科研考核和科研分析的重要指標(biāo)。上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)中,沒有對(duì)作者署名單位和地址中的國(guó)家、地區(qū)、發(fā)文機(jī)構(gòu)進(jìn)行分析與揭示,因此不能統(tǒng)計(jì)國(guó)際合作、國(guó)內(nèi)合作、產(chǎn)學(xué)合作等信息,成果的基金信息抓取到機(jī)構(gòu)庫(kù)中后,也未作詳細(xì)的區(qū)分,無(wú)法進(jìn)行分析。
為更好描述成果的上述特性,在不影響機(jī)構(gòu)知識(shí)庫(kù)結(jié)構(gòu)與功能的前提下,我們擬增設(shè)屬性表,對(duì)已經(jīng)在機(jī)構(gòu)庫(kù)中的成果署名地址、資助信息進(jìn)行分析,生成發(fā)文國(guó)家屬性表、成果資助基金屬性表,并建立成果的關(guān)聯(lián)。最后根據(jù)需要基于屬性表形成各種數(shù)據(jù)視圖,如統(tǒng)計(jì)科研人員的國(guó)際合作論文發(fā)文數(shù)量、學(xué)院的產(chǎn)學(xué)研合作情況、學(xué)校自然科學(xué)基金投入與論文產(chǎn)出情況、院系或科研團(tuán)隊(duì)的國(guó)際合作論文與非國(guó)際合作論文的引文影響力比較等。
在保證機(jī)構(gòu)知識(shí)庫(kù)成果的全與準(zhǔn)、重要屬性清晰揭示的基礎(chǔ)上,如果要真正發(fā)揮其在科研管理、績(jī)效評(píng)估、學(xué)科建設(shè)等方面的作用,還必須打破信息孤島狀態(tài),與其他業(yè)務(wù)部門的數(shù)據(jù)進(jìn)行多維度關(guān)聯(lián)。如學(xué)校、院系的投入產(chǎn)出評(píng)估中,通過項(xiàng)目數(shù)據(jù)與成果數(shù)據(jù)關(guān)聯(lián)了解產(chǎn)出績(jī)效,人才引進(jìn)、國(guó)際合作、行業(yè)合作、研究生培養(yǎng)、學(xué)科建設(shè)、科研團(tuán)隊(duì)等評(píng)估工作也可通過個(gè)人、院系、團(tuán)隊(duì)與成果的關(guān)聯(lián)產(chǎn)生翔實(shí)的數(shù)據(jù),支持管理決策和上級(jí)主管部門對(duì)學(xué)校的評(píng)估。因此,圖書館計(jì)劃從成果數(shù)據(jù)多維關(guān)聯(lián)與共享兩個(gè)角度對(duì)機(jī)構(gòu)知識(shí)庫(kù)進(jìn)行功能提升。
成果的多維關(guān)聯(lián)主要從兩個(gè)層面進(jìn)行:
(1)機(jī)構(gòu)知識(shí)庫(kù)內(nèi)部建立成果視圖,實(shí)現(xiàn)成果與屬性的關(guān)聯(lián)。對(duì)常規(guī)的規(guī)律性統(tǒng)計(jì)項(xiàng)目開發(fā)數(shù)據(jù)發(fā)布與動(dòng)態(tài)查詢系統(tǒng),通過自行開發(fā)或與信息辦合作,基于BI系統(tǒng)等形式實(shí)現(xiàn)。
(2)平臺(tái)成果與部處業(yè)務(wù)數(shù)據(jù)的關(guān)聯(lián)。在了解部處需求基礎(chǔ)上,根據(jù)各類統(tǒng)計(jì)要求定制個(gè)性化數(shù)據(jù)方案。如成果與人事信息關(guān)聯(lián)以評(píng)估人才、學(xué)院、系、科研團(tuán)隊(duì)的產(chǎn)出與質(zhì)量,為教師的聘期考核、年度考核、KPI考核等提供數(shù)據(jù);成果與創(chuàng)新管理部的項(xiàng)目信息關(guān)聯(lián)揭示項(xiàng)目投入與產(chǎn)出,成果與合作國(guó)家關(guān)聯(lián)以揭示國(guó)際合作成效等。
機(jī)構(gòu)知識(shí)庫(kù)的成果數(shù)據(jù)共享從兩個(gè)維度實(shí)現(xiàn):
(1)機(jī)構(gòu)知識(shí)庫(kù)系統(tǒng)中,重構(gòu)成果發(fā)布與查詢界面,向全校職能部門和院系開放共享;
(2)底層豐富的成果視圖通過接口向?qū)W校業(yè)務(wù)部門共享,如目前通過信息化辦公室實(shí)現(xiàn)的聘期考核、新版?zhèn)€人主頁(yè)、上海大學(xué)科研管理駕駛艙等項(xiàng)目。
成果數(shù)據(jù)多維關(guān)聯(lián)與共享,有助于消除機(jī)構(gòu)知識(shí)庫(kù)成果數(shù)據(jù)信息孤島的現(xiàn)狀,實(shí)現(xiàn)機(jī)構(gòu)知識(shí)庫(kù)內(nèi)部成果視圖多樣化與按需訂制;實(shí)現(xiàn)機(jī)構(gòu)知識(shí)庫(kù)與學(xué)校部處的業(yè)務(wù)數(shù)據(jù)有機(jī)關(guān)聯(lián),可滿足學(xué)校大部分的成果數(shù)據(jù)常規(guī)需求;基于BI或其他后期開發(fā)的系統(tǒng)能實(shí)現(xiàn)對(duì)接部處成果統(tǒng)計(jì)需求,靈活快速響應(yīng)。通過關(guān)聯(lián)與共享可從根本上解決師生成果數(shù)據(jù)重復(fù)提交問題,解決管理部門數(shù)據(jù)來(lái)源多頭、標(biāo)準(zhǔn)不一、數(shù)據(jù)不一問題,減輕院系科研秘書、管理部門及科研人員成果統(tǒng)計(jì)的工作量。
機(jī)構(gòu)知識(shí)庫(kù)一般由圖書館主導(dǎo)建設(shè),圖書館員作為機(jī)構(gòu)知識(shí)庫(kù)成果的當(dāng)然管理員和服務(wù)人員,面向教師、學(xué)生和職能部門。但因?yàn)橛脩袅看?,服?wù)量大,圖書館員面臨著很大的服務(wù)壓力。
從2016年起,上海大學(xué)在機(jī)構(gòu)知識(shí)庫(kù)中增設(shè)院系管理員角色。院系科研秘書熟悉本單位師生,參與成果管理與服務(wù)有許多優(yōu)勢(shì)。經(jīng)與科研管理部門協(xié)商設(shè)立院系管理員角色,權(quán)限包括:部門用戶管理、部門成果審核、部門產(chǎn)權(quán)確認(rèn)、部門成果管理、成果統(tǒng)計(jì)和成果導(dǎo)出等6項(xiàng)。院系管理員一般由科研院系科研秘書擔(dān)任,經(jīng)培訓(xùn)后上崗,負(fù)責(zé)機(jī)構(gòu)知識(shí)庫(kù)中本部門成果的審核、成果認(rèn)領(lǐng)與提交咨詢及機(jī)構(gòu)知識(shí)庫(kù)使用問題的解答,負(fù)責(zé)與圖書館機(jī)構(gòu)知識(shí)庫(kù)管理人員的聯(lián)絡(luò)。自實(shí)施以來(lái),能基本滿足本部門的日常成果管理、審核和使用咨詢,較大減輕了圖書館員的服務(wù)壓力。
雖然高校已普遍建設(shè)機(jī)構(gòu)知識(shí)庫(kù),但其生存和可持續(xù)發(fā)展受到諸多因素的制約。科研管理與決策支持是機(jī)構(gòu)知識(shí)庫(kù)發(fā)展的重要?jiǎng)恿?,但仍受制于外部政策支持和自身功能發(fā)展的不完善。上海大學(xué)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)過程中,對(duì)接院系及部處的科研管理需求,更重要的是應(yīng)盡快提升自身服務(wù)能力,從而保證成果數(shù)據(jù)收集的全面性與準(zhǔn)確性,深入揭示重要屬性,建立機(jī)構(gòu)知識(shí)庫(kù)內(nèi)在知識(shí)的關(guān)聯(lián),建立成果數(shù)據(jù)與部處業(yè)務(wù)數(shù)據(jù)的外部關(guān)聯(lián)實(shí)現(xiàn)在校內(nèi)充分共享,才能充分發(fā)揮機(jī)構(gòu)知識(shí)庫(kù)的潛在價(jià)值,實(shí)現(xiàn)可持續(xù)發(fā)展。