湯敬謙,楊鶴林,王小強
科學(xué)數(shù)據(jù)是信息時代最基本、最活躍、影響面最寬的戰(zhàn)略資源,其與科技創(chuàng)新和社會進步密不可分,這在國際科學(xué)界已形成共識。廣義的數(shù)據(jù)概念包括元數(shù)據(jù)和數(shù)據(jù),前者是對后者的描述,通過元數(shù)據(jù)可以識別、評價、追蹤信息在使用過程中的變化,實現(xiàn)有效發(fā)現(xiàn)、組織和管理。作為有效描述信息的元數(shù)據(jù)正受到越來越多的重視,故要對數(shù)據(jù)進行長期保存和再利用,應(yīng)當(dāng)首先開展元數(shù)據(jù)設(shè)定、登記、標(biāo)準(zhǔn)化等管理工作[1]。
對高校等科研機構(gòu)來說,論文是其最典型的科研產(chǎn)品。隨著科研投入不斷增加,高校論文產(chǎn)出量越來越大,2012 年SCI 收錄中國科技論文19.01 萬篇,占12.08%,排世界第2 位,其中“表現(xiàn)不俗”的論文有81.8%為高校所貢獻[2]。論文發(fā)表情況已成為衡量高??蒲袑嵙Φ闹匾罁?jù),圖書館作為高校的文獻情報中心,每年都會為人事處、科技處等職能部門提供本校論文發(fā)表數(shù)據(jù),以滿足科研評估、課程與教學(xué)變革、人才培養(yǎng)考察等需求。暨南大學(xué)圖書館雖然每年編制《暨南大學(xué)國際論文統(tǒng)計與分析年報》,但已不能滿足人事處和科技處等部門對不同年份數(shù)據(jù)和論文數(shù)據(jù)不同字段的動態(tài)要求,亟需開發(fā)既可長期保存全校論文成果,且能適應(yīng)不同用戶需求的規(guī)范化、可擴展的科研產(chǎn)出數(shù)據(jù)共享平臺。
從圖書館學(xué)角度看,論文的著錄特征,如責(zé)任者、機構(gòu)、文獻類型、影響因子等元數(shù)據(jù)正是評價科研產(chǎn)出的客觀依據(jù),故本文稱之為“科研產(chǎn)出元數(shù)據(jù)”??蒲挟a(chǎn)出元數(shù)據(jù)可以反映研究進展、活躍科研人員、協(xié)同創(chuàng)新關(guān)系等重要信息,利用好這些信息,有助于摸清科研現(xiàn)狀及發(fā)展脈絡(luò),客觀描述成果的真實價值與影響力,促進科學(xué)評估體系建立,引導(dǎo)高??蒲醒刂_方向發(fā)展。
Shaon Arif 等指出,雖然元數(shù)據(jù)已經(jīng)被證明足以為數(shù)字資源的長期綜合處理提供必需的信息保證,但如果不對元數(shù)據(jù)加以監(jiān)護,元數(shù)據(jù)的質(zhì)量和可信度將會隨著時間的推移而衰減[3]。近年我國基于元數(shù)據(jù)的機構(gòu)知識庫建設(shè)呈快速發(fā)展趨勢,為保存高校學(xué)術(shù)研究成果,展示高校研究實力作出了探索,但由于系統(tǒng)平臺技術(shù)所限,元數(shù)據(jù)應(yīng)用不能完全符合用戶習(xí)慣和需求,難以發(fā)揮論文元數(shù)據(jù)的真正價值[4-5]?;诖?,我們提出元數(shù)據(jù)監(jiān)護服務(wù)。元數(shù)據(jù)監(jiān)護是為更好地體現(xiàn)元數(shù)據(jù)對數(shù)據(jù)本身的描述,應(yīng)對不同用戶對元數(shù)據(jù)使用需求而開展的管理活動,包括對元數(shù)據(jù)進行收集、驗證、規(guī)范化設(shè)計和保護。它是一項持續(xù)性、系統(tǒng)性的維護工作,目的是使元數(shù)據(jù)可以為科研評估和科研管理服務(wù),最終實現(xiàn)元數(shù)據(jù)價值。
科研產(chǎn)出元數(shù)據(jù)是圖書館業(yè)務(wù)最常接觸的文獻信息之一,已發(fā)展多年的數(shù)字資源建設(shè)使圖書館配置了專門的服務(wù)器和存儲設(shè)備,完全滿足元數(shù)據(jù)監(jiān)護的硬件條件,而且元數(shù)據(jù)監(jiān)護作為數(shù)字化圖書館的一部分能夠很好地融合在其中。圖書館員也普遍具備良好的相關(guān)理論知識和實踐經(jīng)驗。在單純的科研產(chǎn)出數(shù)據(jù)保存工作已遠(yuǎn)遠(yuǎn)無法滿足當(dāng)前科研用戶和科研管理工作者需要的情況下,充分發(fā)揮圖書館特長和優(yōu)勢,對科研產(chǎn)出元數(shù)據(jù)進行監(jiān)護,并構(gòu)建元數(shù)據(jù)監(jiān)護平臺,對促進高??蒲性u估體系的發(fā)展有著積極意義。
據(jù)筆者業(yè)內(nèi)調(diào)查,目前僅知武漢大學(xué)、西安電子科技大學(xué)、大連醫(yī)科大學(xué)有固定的紙質(zhì)SCI論文統(tǒng)計年報或相關(guān)網(wǎng)頁供瀏覽,并無專門的元數(shù)據(jù)監(jiān)護系統(tǒng)。暨南大學(xué)圖書館從2001 年起一直堅持開展本校的論文數(shù)據(jù)統(tǒng)計工作,至今整理論文近萬篇,元數(shù)據(jù)10 余萬條,且全部經(jīng)過標(biāo)準(zhǔn)化處理;這些數(shù)據(jù)最初以文本格式保存,不足以滿足數(shù)據(jù)檢索、統(tǒng)計、分析的需要。為更好地利用科研產(chǎn)出元數(shù)據(jù),該館結(jié)合科研人員的需求及科研管理部門的需要,開發(fā)出國內(nèi)首個科研產(chǎn)出元數(shù)據(jù)監(jiān)護系統(tǒng)。
盡管存在有待完善的地方,但論文仍是我國進行科研產(chǎn)出評估最實用、最客觀的指標(biāo)。就高校管理者而言,透明度和清晰度是進行科研產(chǎn)出評估重要的兩項要求。由于科學(xué)發(fā)展既深化又廣泛交叉,管理者不可能對所有學(xué)科了如指掌,而科研產(chǎn)出不僅數(shù)量龐大,而且作者在寫作時的姓名、機構(gòu)、基金、學(xué)科等元數(shù)據(jù)表達紛繁復(fù)雜,數(shù)據(jù)庫商本身不具備對其進行標(biāo)準(zhǔn)化的必要知識和能力,這使得管理者在開展與論文相關(guān)的統(tǒng)計、申報、考核時困難重重,為保障全面客觀,往往反復(fù)讓科研人員填寫多種報表,效率低下,也占用科研人員寶貴時間和精力。圖書館發(fā)揮文獻信息獲取、核實、標(biāo)引、標(biāo)準(zhǔn)化處理能力強的優(yōu)勢,構(gòu)建一個元數(shù)據(jù)監(jiān)護平臺,不僅可以實現(xiàn)所有元數(shù)據(jù)無時空限制的獲取,而且能通過可視化的統(tǒng)計、分類功能滿足個性化評估需求,讓所有涉及其中的人對評估結(jié)果一目了然,從而整理出客觀、準(zhǔn)確的量化評估報告,使高校管理者在不必深入了解專業(yè)的情況下也能對科研成果進行公正、客觀的評價,提升工作效率。
目前學(xué)者的科研產(chǎn)出多通過普通網(wǎng)頁或個人網(wǎng)上空間進行展示,交流多通過個人通訊軟件進行,但依靠個人或非正規(guī)機構(gòu)網(wǎng)站保持的資料容易流失,而且缺乏權(quán)威性和說服力。圖書館恰好可以憑借穩(wěn)定性好,可信度高的優(yōu)勢,在機構(gòu)庫的基礎(chǔ)上構(gòu)建一個由專人維護的,長期運作的元數(shù)據(jù)監(jiān)護平臺,提供標(biāo)準(zhǔn)化的元數(shù)據(jù)并實現(xiàn)檢索、統(tǒng)計、分析和發(fā)現(xiàn)等高級功能。學(xué)者可直接在此平臺上實現(xiàn)科研產(chǎn)出成果展示和發(fā)布,從客觀上促進學(xué)術(shù)交流。
從圖書館業(yè)務(wù)角度來看,傳統(tǒng)圖書館服務(wù)模式正不斷受到新信息交流技術(shù)、交流方式的沖擊,高校圖書館在數(shù)字資源長期保存領(lǐng)域的研究已經(jīng)有20 余年,推出元數(shù)據(jù)監(jiān)護創(chuàng)新服務(wù),將管理對象從科研產(chǎn)出擴大到科研產(chǎn)出元數(shù)據(jù),不僅能擺脫單純的收藏者角色,成為知識發(fā)布、保存、利用和管理的解決方案,還能增強圖書館與科研工作的緊密度,進一步鞏固和提升自身在社會、科研環(huán)境中的價值,避免被邊緣化[6]。
科研產(chǎn)出元數(shù)據(jù)監(jiān)護系統(tǒng)基于面向?qū)ο蟮目缙脚_Java 語言實現(xiàn),可將元數(shù)據(jù)收集到MySQL數(shù)據(jù)庫,并使用JDBC 等技術(shù)通過網(wǎng)頁直接展示給用戶,無需安裝客戶端。其開發(fā)目的是為元數(shù)據(jù)的標(biāo)準(zhǔn)化、長期保存、獲取和使用提供方便,是集數(shù)據(jù)的保存,可視化動態(tài)展示,科研產(chǎn)出數(shù)據(jù)評估及科研人員之間、科研人員與系統(tǒng)管理人員之間交流互動的多功能平臺,可以滿足高??蒲性u估、課程與教學(xué)變革、人才培養(yǎng)考察等需求。
系統(tǒng)基于面向?qū)ο蟮目缙脚_Java 語言實現(xiàn):展示層使用struts2 框架,充分利用MVC 理念以減少代碼耦合,提高可擴展性;數(shù)據(jù)庫選用較靈活高效的MySQL,考慮到本系統(tǒng)數(shù)據(jù)結(jié)構(gòu)關(guān)系的復(fù)雜程度比較高,數(shù)據(jù)庫訪問層直接使用JDBC 的相關(guān)技術(shù)來完成查詢需求;頁面展示整體設(shè)計簡約,采用標(biāo)準(zhǔn)CSS+DIV對頁面進行編碼;用戶交互板塊使用JQuery 客戶端技術(shù)提升頁面友好度,增強用戶體驗。此外,系統(tǒng)具有權(quán)限控制和后臺管理功能,權(quán)限控制及IP 訪問控制通過Struts2 框架的攔截器實現(xiàn),后臺管理功能實現(xiàn)了系統(tǒng)大部分定制功能,增強系統(tǒng)擴展。系統(tǒng)的體系結(jié)構(gòu)如圖1 所示。
系統(tǒng)包括服務(wù)、管理和互動交流三個主要模塊,系統(tǒng)功能結(jié)構(gòu)如圖2。服務(wù)模塊的主要功能有瀏覽、檢索、統(tǒng)計分析和提交論文,可供全校所有科研人員和科研管理人員使用,以獲得不同需求的科研評估數(shù)據(jù)。管理模塊主要是管理人員進行數(shù)據(jù)采集、數(shù)據(jù)審核和問題維護時使用,以確保系統(tǒng)數(shù)據(jù)實時、有效?;咏涣髂K主要有用戶咨詢、館員答復(fù)和用戶交流三個主要功能,用戶可以選擇在線與系統(tǒng)管理人員進行咨詢,也可在系統(tǒng)留言板內(nèi)進行留言,館員可以針對某個用戶的問題進行私密解答,也可以對多名用戶提出的類似問題進行集體解釋與答疑。
4.3.1 服務(wù)模塊的主要功能
圖1 系統(tǒng)體系結(jié)構(gòu)圖
圖2 系統(tǒng)功能結(jié)構(gòu)圖
(1)瀏覽。瀏覽可以根據(jù)用戶需要通過不同字段瀏覽論文數(shù)據(jù),可按作者、題名、學(xué)院、研究領(lǐng)域、來源出版物、來源數(shù)據(jù)庫進行瀏覽。瀏覽到的論文數(shù)據(jù)可以下載全文保存,也可以導(dǎo)出為Excel 表格保存題錄格式。系統(tǒng)利用文獻內(nèi)容的相關(guān)性為用戶提供了一個知識鏈系統(tǒng),可以對研究領(lǐng)域相近的作者進行關(guān)聯(lián)。根據(jù)知識鏈系統(tǒng),在瀏覽某一作者的論文時,就可以通過可視化圖看到該作者與該校其他作者的合作情況(見圖3),點擊作者可以查看該作者的論文列表,點擊作者中間的連線可以查看兩個作者的合作論文列表,作者中間的連線越短,代表合作的論文篇數(shù)越多。通過知識鏈系統(tǒng),既使得相關(guān)研究方向的作者建立聯(lián)系,促進合作,又可使用戶閱讀這些文獻之后尋找到新的研究線索,實現(xiàn)知識發(fā)現(xiàn)。
(2)檢索。檢索功能中設(shè)置了兩種檢索方式,即基本檢索和高級檢索。基本檢索可直接輸入題名、作者、刊名進行檢索;高級檢索則可實現(xiàn)題名、刊名、作者以及摘要內(nèi)容的邏輯檢索。在作者檢索字段,支持中文名和英文名各種縮寫格式的檢索,除此之外,兩種檢索方式均可對學(xué)院、發(fā)表年份和收錄數(shù)據(jù)庫進行精煉檢索。
(3)統(tǒng)計分析。系統(tǒng)支持元數(shù)據(jù)導(dǎo)出功能,用戶可根據(jù)需要,通過組合來源數(shù)據(jù)庫、責(zé)任者、所在機構(gòu)、來源刊物、發(fā)表時間等限定條件檢索元數(shù)據(jù),通過用戶個性化統(tǒng)計分析,實現(xiàn)科研評估功能。檢索到的元數(shù)據(jù)支持導(dǎo)出為電子格式保存(見圖4)。
(4)論文提交。系統(tǒng)支持用戶自行提交論文元數(shù)據(jù)(見圖5),作者有新論文發(fā)表,即可在系統(tǒng)平臺提交,提交后的數(shù)據(jù)經(jīng)過管理人員審核,方可參與院系分布、作者發(fā)文與分布、論文數(shù)量及增長情況、論文語種、文獻類型、來源期刊分布等統(tǒng)計分析。
圖3 可視化作者關(guān)系界面
圖4 統(tǒng)計分析界面
4.3.2 管理模塊主要功能
(1)數(shù)據(jù)采集。數(shù)據(jù)通過RSS 訂閱,Endnote等管理軟件的運用,輔以人工優(yōu)化處理采集而得[7],標(biāo)準(zhǔn)化后的元數(shù)據(jù)除論文數(shù)據(jù)已有字段外,規(guī)范化標(biāo)注了論文作者的中文名、學(xué)院、系所、作者次序、是否第一作者或通訊作者等,并整合了發(fā)表論文所在期刊的影響因子和論文分區(qū)(見圖6)。整理好的元數(shù)據(jù)導(dǎo)入MySQL數(shù)據(jù)庫,使基于元數(shù)據(jù)的科研實證評估成為可能。
圖5 數(shù)據(jù)提交界面
圖6 元數(shù)據(jù)展示界面
(2)數(shù)據(jù)審核。元數(shù)據(jù)信息通過Struts2 框架展示,管理員可在Web 頁面直接對元數(shù)據(jù)進行審核,論文審核和已審核論文界面可對每一條論文各個元數(shù)據(jù)進行審核,包括論文的主題字段內(nèi)容,論文作者對應(yīng)的中文名和所屬院系,論文所屬研究領(lǐng)域和所在數(shù)據(jù)庫,論文來源出版物信息、合作機構(gòu)和基金資助機構(gòu)的選擇與審核(見圖7)。
圖7 元數(shù)據(jù)審核界面
(3)問題維護。館員維護模塊設(shè)置了管理員登陸頁面,只有被授權(quán)的管理員才有權(quán)限對數(shù)據(jù)監(jiān)護系統(tǒng)的數(shù)據(jù)進行修改和維護??删S護的內(nèi)容包括論文審核、已審核論文的修改、院系信息管理、作者信息管理、來源數(shù)據(jù)庫管理、期刊信息管理、合作機構(gòu)管理、資助機構(gòu)管理、研究領(lǐng)域管理等。
4.3.3 互動交流模塊主要功能
系統(tǒng)結(jié)合現(xiàn)有的Web 2.0 理念和技術(shù),嵌入可互動科研交流與知識共享平臺,該平臺基于以個人用戶為中心的理念,強調(diào)用戶參與和成員互動,支持用戶間通過發(fā)表評論、留言等方式進行溝通與交流,實現(xiàn)研究人員個體與個體之間,個體與群體之間的交流、共享與融合,調(diào)動知識與科研成果交互的積極性,促進科研人員科研產(chǎn)出的進程。
本系統(tǒng)采用Java 語言開發(fā),其開發(fā)環(huán)境為Eclipse3.7,JDK1.6。系統(tǒng)后臺數(shù)據(jù)庫采用MySQL 5.5,Web 頁面展示框架采用Struts2。這里主要說明系統(tǒng)的兩個重要功能的實現(xiàn)方法。
4.4.1 元數(shù)據(jù)采集
數(shù)據(jù)采集是通過數(shù)據(jù)庫的RSS 訂閱功能,使用Java 的Eclipse 生成。由于數(shù)據(jù)庫的Web服務(wù)使用WSDL 文件來描述它所提供的服務(wù),在Eclipse 中可以選擇新建一個Web Service Client,然后指定WSDL 的URL,生成所需客戶端。管理員通過設(shè)置檢索策略對數(shù)據(jù)庫進行檢索,數(shù)據(jù)庫的Web 服務(wù)器返回記錄之后,就可以對記錄進行解析,并存儲到本地數(shù)據(jù)庫。關(guān)鍵代碼如下:
4.4.2 科研評估功能的實現(xiàn)
科研評估功能是基于元數(shù)據(jù)的規(guī)范與監(jiān)護系統(tǒng)的強大兼容能力,通過信息技術(shù)的標(biāo)準(zhǔn)化與排序功能,圖表生成與可視化的實現(xiàn),結(jié)合數(shù)理統(tǒng)計等數(shù)學(xué)方法,圖文并茂地展示科研產(chǎn)出的評估數(shù)據(jù)。實現(xiàn)評估功能的主要代碼如下:
用戶還可按需篩選出學(xué)科帶頭人、學(xué)科專業(yè)、核心載文刊物和某學(xué)科科研發(fā)展軌跡等進行評估。通過瀏覽某作者的文獻,找出其與該校其他老師的合作關(guān)系。其在系統(tǒng)中實現(xiàn)的關(guān)鍵代碼如下:
從暨南大學(xué)的實踐來看,每個職能部門都有自己簡單的數(shù)據(jù)管理方式,原始數(shù)據(jù)多由圖書館提供。由于科研人員發(fā)表論文時地址字段著錄格式的不同,僅僅依靠圖書館檢索到的數(shù)據(jù)是不準(zhǔn)確的,需要全校科研人員的參與,數(shù)據(jù)的獲得應(yīng)以圖書館采集為主,科研人員提交為輔。這就需要將科研產(chǎn)出元數(shù)據(jù)的管理提升到學(xué)校層面進行整體規(guī)劃和設(shè)計,明確數(shù)據(jù)管理流程,落實各相關(guān)部門的職責(zé),以保障數(shù)據(jù)的準(zhǔn)確以及數(shù)據(jù)管理的正常運行和可持續(xù)發(fā)展。
數(shù)據(jù)應(yīng)用的功能需求會在一定程度上影響到平臺開發(fā)工具的選擇,在部署本地數(shù)據(jù)平臺時,應(yīng)考慮數(shù)據(jù)應(yīng)用需求、經(jīng)費、技術(shù)力量等選擇合適的開發(fā)方式和基礎(chǔ)軟件搭建應(yīng)用平臺,可以說用戶需求的變化是系統(tǒng)功能持續(xù)改進和完善的動力。暨南大學(xué)社科處、科技處等職能部門基于學(xué)??蒲性u估的需要,對系統(tǒng)功能的改進提出了很多寶貴意見,比如將數(shù)據(jù)以不同年份、不同數(shù)據(jù)庫來源進行報表式呈現(xiàn),按照學(xué)科進行科研產(chǎn)出數(shù)據(jù)的統(tǒng)計等??蒲腥藛T根據(jù)職聘考核、項目申報的需要提出了改進建議,比如同一篇論文中每一位作者的作者順序的顯示,同一個刊物不同年份的影響因子和刊物級別如何按照當(dāng)年的具體情況呈現(xiàn)等。通過走訪調(diào)查發(fā)現(xiàn),科研產(chǎn)出元數(shù)據(jù)監(jiān)護系統(tǒng)逐漸引起科研人員越來越多的關(guān)注,也正是由于科研人員和科研管理部門的關(guān)注,促進了系統(tǒng)的日益完善。
科研產(chǎn)出元數(shù)據(jù)監(jiān)護系統(tǒng)是集數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)挖掘和分析等多層次的服務(wù)平臺,加之用戶需求的不斷變化,系統(tǒng)功能必將持續(xù)改進,這就需要圖書館員不斷提升自己的服務(wù)能力和水平。首先,圖書館需要技術(shù)部門、咨詢部門和服務(wù)部門的通力合作,提升圖書館整體服務(wù)能力;其次,作為直接與科研人員和科研管理部門溝通的館員,需要具備較強的溝通能力,除了對科研產(chǎn)出元數(shù)據(jù)比較熟悉外,還需要對整個服務(wù)流程有著清晰的認(rèn)識;再次,隨著計算機技術(shù)的不斷發(fā)展,為適應(yīng)科研產(chǎn)出元數(shù)據(jù)服務(wù)的新需求,圖書館員需要不斷學(xué)習(xí)先進的計算機技術(shù)和數(shù)據(jù)管理經(jīng)驗,以快速提升服務(wù)能力。
科研產(chǎn)出元數(shù)據(jù)監(jiān)護系統(tǒng)上線運行以來,受到學(xué)校管理層和學(xué)者的一致關(guān)注及大力扶持,為學(xué)校職能部門和各院系提供了可靠的數(shù)據(jù)支持。隨著科研產(chǎn)出的不斷增加以及評估需求的多樣化,暨南大學(xué)圖書館在下階段的工作中將強化服務(wù)意識,提高館員元數(shù)據(jù)監(jiān)護方面的知識水平,加強與用戶的交流,著力向高校管理者和學(xué)者進行宣傳,積極嵌入到科研探索及科研評估工作中去。元數(shù)據(jù)監(jiān)護工作人員應(yīng)進一步細(xì)化工作流程,美化系統(tǒng)界面,創(chuàng)建基于Web2.0 的信息共享社區(qū),構(gòu)建基于過程的用戶元數(shù)據(jù)管理與增值方案,實現(xiàn)圖書館主導(dǎo)、學(xué)校多部門參與、多元共治的運作模式。
[1] 張曉林.開放元數(shù)據(jù)機制:理念與原則[J].中國圖書館學(xué)報,2003(3):8- 13.
[2] 中國國際科技論文統(tǒng)計結(jié)果[EB/OL].[2014- 08- 10].http://www.istic.ac.cn/tabid/640/default.aspx.
[3] Shaon A,Woolf A.An OAISbased approach to effective long- term digital metadata curation[J]. Computer and Information Science,2008,1(2):2- 16.
[4] 李國俊,王瑜,王李梅,等.基于元數(shù)據(jù)的高校機構(gòu)知識庫建設(shè)研究——以北京科技大學(xué)機構(gòu)知識庫為例[J].大學(xué)圖書館學(xué)報,2012(4):55- 60.
[5] 林愛群.機構(gòu)知識庫元數(shù)據(jù)的自動生成與評估研究[J].圖書館學(xué)研究,2009(7):21- 23,10.
[6] Corrall S,Kennan M A,Afzal W. Bibliometrics and research data management services:emerging trends in library support for research[J].Library Trends,2013,61(3):636- 674.
[7] 張春曉.基于Web of Knowledge Web 服務(wù)的機構(gòu)論文統(tǒng)計分析系統(tǒng)[J].現(xiàn)代情報,2013(1):98- 102.