●李 欣,于亞秀,劉 丹,張 毅,陳枝清(華東師范大學(xué)圖書館,上?!?00062)
基于學(xué)術(shù)資源的大學(xué)圖書館決策支持服務(wù)
——以學(xué)位論文為例
●李欣,于亞秀,劉丹,張毅,陳枝清
(華東師范大學(xué)圖書館,上海200062)
[關(guān)鍵詞]學(xué)術(shù)資源;學(xué)位論文;決策支持;Open API;大學(xué)圖書館 根據(jù)研究生學(xué)位論文主題詞/聚類分析,為準(zhǔn)確把握研究方向提供更準(zhǔn)確的分析數(shù)據(jù)。 (1)按專業(yè)、學(xué)科提取學(xué)位論文/主題詞,通過主題詞類聚分析,結(jié)合專業(yè)前沿研究熱點(diǎn),產(chǎn)生輔助學(xué)科發(fā)展的決策支持分析數(shù)據(jù)。 (2)結(jié)合學(xué)位論文作者性別、專業(yè)方向以及/主題詞分布等綜合數(shù)據(jù)處理后,可以分析出性別與選取專業(yè)方向的關(guān)系、性別在同一專業(yè)內(nèi)論文關(guān)鍵詞/主題詞的不同分布等統(tǒng)計(jì)分析結(jié)果,從而得出性別在學(xué)科選擇方面的趨勢,為學(xué)校制定研究生培養(yǎng)計(jì)劃和管理制度提供量化支持。 雖然主題詞/聚類分析的難點(diǎn)在于規(guī)范其對應(yīng)關(guān)系處理和計(jì)算機(jī)聚類工具開發(fā)的輔助,這方面還需要專業(yè)工具和相關(guān)的規(guī)范建立來支持,但是這項(xiàng)工作的意義不言而喻。
[摘要]分析了大學(xué)圖書館學(xué)術(shù)資源的特殊屬性、利用學(xué)術(shù)資源開展決策支持服務(wù)的需求和可行性;論述了在大學(xué)圖書館轉(zhuǎn)型發(fā)展過程中,依托自身學(xué)術(shù)資源優(yōu)勢開展增值服務(wù)成為大學(xué)圖書館新的服務(wù)增長點(diǎn),并以學(xué)位論文為例,結(jié)合華東師范大學(xué)圖書館實(shí)踐,介紹了利用大學(xué)特有學(xué)術(shù)資源開展決策支持服務(wù)的應(yīng)用案例,以期為大學(xué)圖書館開展服務(wù)創(chuàng)新提供參考。
當(dāng)前,國內(nèi)的博碩學(xué)位論文(簡稱:學(xué)位論文)主要由數(shù)據(jù)庫商、國家法定學(xué)位論文收藏機(jī)構(gòu)、公益性學(xué)位論文共建單位以及各高等學(xué)校和科研院所等提供相對集中的檢索和分級分布聯(lián)合保障相結(jié)合的信息共享服務(wù),提供的服務(wù)主要圍繞資源獲取開展,然而在利用學(xué)位論文元數(shù)據(jù)拓展其服務(wù)范圍、開展增值服務(wù)等方面還有進(jìn)一步拓展的空間。華東師范大學(xué)圖書館在利用學(xué)術(shù)資源——學(xué)位論文開展決策支持服務(wù)方面做了一些有益嘗試。在成熟的Web Service以及Widget技術(shù)基礎(chǔ)上,通過基于平臺或商用數(shù)據(jù)庫開發(fā)元數(shù)據(jù)Open API的方式獲取批量學(xué)位論文元數(shù)據(jù),并結(jié)合學(xué)位論文元數(shù)據(jù)特點(diǎn),從學(xué)位論文屬性出發(fā),在為教學(xué)科研提供學(xué)術(shù)支持基礎(chǔ)上,挖掘其在決策支持方面的潛力,為學(xué)校相關(guān)管理和職能部門提供基于數(shù)據(jù)的量化統(tǒng)計(jì)分析數(shù)據(jù)。這樣一來,從決策支持角度拓展了學(xué)位論文服務(wù)范圍,改變了學(xué)位論文僅僅作為學(xué)術(shù)資源提供檢索服務(wù)的單一屬性,探索出大學(xué)圖書館基于學(xué)術(shù)資源開展決策支持服務(wù)的途徑和方法。
1.1基于學(xué)術(shù)資源開展決策支持服務(wù)需求分析
隨著越來越多學(xué)術(shù)資源/內(nèi)容的出現(xiàn),基于學(xué)術(shù)資源支持教學(xué)科研的屬性,圖書館一直以來都在致力于基于學(xué)術(shù)資源元數(shù)據(jù)進(jìn)行分類整合和發(fā)現(xiàn)工具的研究,以提高在浩瀚的學(xué)術(shù)資源中讀者快速獲取所需資源的能力。在獲取資源方面,圖書館的投入相對較大,而學(xué)術(shù)資源元數(shù)據(jù)的其他屬性往往被忽略,學(xué)術(shù)資源并非只有支持大學(xué)教學(xué)科研的唯一屬性。以學(xué)位論文為例,它作為大學(xué)特有的學(xué)術(shù)資源,具有重要的學(xué)術(shù)價(jià)值和廣泛的用戶需求。學(xué)位論文特有的原創(chuàng)性、研究生培養(yǎng)以及與教學(xué)關(guān)系緊密等特性,在教學(xué)水平評估以及輔助決策支持等方面都可以發(fā)揮其獨(dú)特作用。
(1)提升教學(xué)水平、滿足學(xué)科發(fā)展的需求。學(xué)位論文是研究生在導(dǎo)師或前人研究基礎(chǔ)上的知識創(chuàng)新成果,具有較高的學(xué)術(shù)理論價(jià)值和現(xiàn)實(shí)應(yīng)用價(jià)值。特別對于研究型大學(xué)而言,學(xué)位論文數(shù)量的激增隨著辦學(xué)方向的轉(zhuǎn)變呈快速上升趨勢。以華東師范大學(xué)圖書館近10年收錄學(xué)位論文數(shù)量看(如圖1),這一趨勢表現(xiàn)得尤為明顯。學(xué)位論文具有的原創(chuàng)性、研究生培養(yǎng)以及與教學(xué)關(guān)系緊密等特性,更多地體現(xiàn)出研究型大學(xué)的教學(xué)與科學(xué)研究水平,是研究生教育的重要組成部分和最終體現(xiàn),是學(xué)校教學(xué)科研成果的重要內(nèi)容之一。
圖1 華東師范大學(xué)圖書館近十年收錄學(xué)位論文數(shù)量變化
華東師范大學(xué)圖書館在分析學(xué)位論文特有屬性基礎(chǔ)上,針對有碩博士授權(quán)的部分院系以及相關(guān)管理部門,進(jìn)行了有針對性的需求調(diào)研,從中了解到職能部門的需求表現(xiàn)在利用學(xué)位論文元數(shù)據(jù)信息輔助教學(xué)水平評估及反映學(xué)科發(fā)展變化方面。希望利用學(xué)位論文特有的原創(chuàng)、研究生培養(yǎng)以及與教學(xué)關(guān)系緊密等屬性,為學(xué)科發(fā)展、評估教師教學(xué)能力和學(xué)位論文質(zhì)量等方面提供科學(xué)的統(tǒng)計(jì)數(shù)據(jù),為建立完善的教師工作量化評估體系提供參考。以研究生院的需求為例,研究生院承擔(dān)著博碩士研究生的教學(xué)和管理工作。導(dǎo)師的量化管理對于提高教學(xué)質(zhì)量至關(guān)重要,通過分析學(xué)位論文的被引用數(shù)據(jù),用教師指導(dǎo)學(xué)位論文被引用數(shù)量和不同級別期刊被引用數(shù)量等量化指標(biāo)來考察教師的教學(xué)水平,為衡量教師教學(xué)能力提供科學(xué)的數(shù)據(jù)參考;通過分析教師與學(xué)生的人員關(guān)聯(lián)關(guān)系,了解教學(xué)科研團(tuán)隊(duì)人員組成以及科學(xué)研究的連續(xù)性。對于學(xué)校管理部門而言,通過學(xué)位論文整體數(shù)據(jù)分析,如某學(xué)科歷年學(xué)位論文數(shù)量變化,可以從一個(gè)側(cè)面反映出學(xué)科發(fā)展變化趨勢及研究熱點(diǎn)變化。
(2)圖書館轉(zhuǎn)型發(fā)展、服務(wù)創(chuàng)新的需要。服務(wù)多樣化、精細(xì)化和個(gè)性化是圖書館轉(zhuǎn)型發(fā)展過程中服務(wù)的變化趨勢,“面向用戶”或“用戶驅(qū)動”是圖書館服務(wù)方式改變的重要特征之一。面對不斷變化的用戶需求,圖書館不僅要發(fā)揮擁有資源優(yōu)勢的特點(diǎn),扎實(shí)做好深層次的基礎(chǔ)服務(wù),以不斷提升學(xué)術(shù)資源的服務(wù)能力使資源利用率進(jìn)一步提升。同時(shí),要尋求更大的服務(wù)空間和領(lǐng)域,彌補(bǔ)傳統(tǒng)服務(wù)萎縮的不足,使圖書館更有作為。大學(xué)圖書館是學(xué)校教學(xué)科研的重要支撐部門,助力學(xué)校教學(xué)科研是圖書館的責(zé)任,對學(xué)校發(fā)展、學(xué)科建設(shè)有幫助的服務(wù)一直是大學(xué)圖書館特有的服務(wù)方向。因此,充分挖掘?qū)W術(shù)資源多重屬性,為學(xué)校提供決策支持等服務(wù)將成為大學(xué)圖書館服務(wù)創(chuàng)新的增長點(diǎn)。依托學(xué)術(shù)資源優(yōu)勢,緊密圍繞人才培養(yǎng)、科學(xué)研究、社會服務(wù)、文化傳承的大學(xué)理念,不應(yīng)把服務(wù)工作僅僅局限于滿足讀者的廣義用戶需求,開展多元化、精細(xì)化和個(gè)性化服務(wù),而是應(yīng)將圖書館的使命與大學(xué)的戰(zhàn)略目標(biāo)與發(fā)展規(guī)劃緊密結(jié)合起來,使圖書館工作成為大學(xué)使命的有機(jī)組成部分。
1.2基于學(xué)術(shù)資源開展決策支持服務(wù)可行性
從某種意義上說,決策支持服務(wù)是傳統(tǒng)參考咨詢服務(wù)的拓展和延伸。大學(xué)圖書館所擁有的高端人才在長期業(yè)務(wù)工作實(shí)踐中積累了豐富的理論知識和實(shí)踐經(jīng)驗(yàn),他們掌握信息技術(shù)傳遞、信息管理、信息研究等諸多領(lǐng)域知識,加之其擁有豐富的學(xué)術(shù)資源、技術(shù)與設(shè)備優(yōu)勢,為開展決策支持服務(wù)提供了必要的條件。
(1)學(xué)術(shù)資源豐富。大學(xué)圖書館的收藏和服務(wù)對象特性,決定了大學(xué)圖書館的學(xué)術(shù)資源收藏豐富的特點(diǎn)。特別是近年來,各大學(xué)圖書館在逐年增加學(xué)術(shù)資源數(shù)據(jù)庫購買經(jīng)費(fèi)的同時(shí),都在積極開展基于本校重點(diǎn)學(xué)科或本館收藏特色為基礎(chǔ)的館藏特色數(shù)據(jù)庫建設(shè)。學(xué)位論文作為大學(xué)圖書館特有的館藏特色學(xué)術(shù)資源,基于完善的數(shù)據(jù)提交保障機(jī)制使學(xué)位論文數(shù)據(jù)庫建設(shè)具有明顯的持續(xù)性,近年來發(fā)展迅速。學(xué)位論文具有的原創(chuàng)性、研究生培養(yǎng)以及與教學(xué)關(guān)系緊密等特性,更多地體現(xiàn)出研究型大學(xué)的教學(xué)與科學(xué)研究水平,與購買的學(xué)術(shù)資源數(shù)據(jù)庫有明顯的不同。因此,豐富的學(xué)術(shù)資源構(gòu)成了大學(xué)圖書館開展決策支持服務(wù)強(qiáng)有力的資源保障。
(2)高端人才濟(jì)濟(jì)。圖書館的核心價(jià)值是通過每一位館員的服務(wù)來體現(xiàn)的。經(jīng)過改革開放30年的發(fā)展,大學(xué)圖書館已擁有一支知識結(jié)構(gòu)比較合理、專業(yè)素質(zhì)較高的服務(wù)團(tuán)隊(duì)。以華東師范大學(xué)圖書館為例,從業(yè)人員具有大專以上文化程度者已超過職工總?cè)藬?shù)的80%,獲得碩士、博士學(xué)位和具有高級專業(yè)技術(shù)職務(wù)者的專業(yè)人員逐年增多。大學(xué)圖書館的這種人員結(jié)構(gòu)與大學(xué)的人才招聘標(biāo)準(zhǔn)逐年提高有著密切關(guān)系,也是大學(xué)圖書館擁有高端人才得天獨(dú)厚的條件。在轉(zhuǎn)型發(fā)展、服務(wù)創(chuàng)新的大趨勢下,決策支持服務(wù)已經(jīng)成為支撐大學(xué)圖書館開創(chuàng)新型服務(wù)領(lǐng)域的重要方面之一。這項(xiàng)工作無論是在信息的有效組織還是對信息二次加工處理方面,對于圖書館工作人員的技術(shù)水平都有較高的要求。大學(xué)圖書館人員層次的提升必然會帶動圖書館管理、技術(shù)服務(wù)層次的提升,為大學(xué)圖書館突破傳統(tǒng)服務(wù)、開展服務(wù)創(chuàng)新提供有力的人員保障。信息時(shí)代成長起來的這支隊(duì)伍不僅掌握專業(yè)知識而且精通現(xiàn)代信息技術(shù),為網(wǎng)絡(luò)環(huán)境下圖書館從文獻(xiàn)資料的收藏者和提供者,轉(zhuǎn)變?yōu)樾畔a(chǎn)品的生產(chǎn)者、開發(fā)者的服務(wù)轉(zhuǎn)變提供了強(qiáng)有力的人力資源保障。
1.3國內(nèi)外應(yīng)用概況
美國普渡(Purdue)大學(xué)在挖掘?qū)W位論文深層服務(wù)方面,推出了一個(gè)Web服務(wù),[1]其涵蓋全州所有大學(xué)研究者目錄以及一個(gè)可以在搜索結(jié)果頁面顯示每一位研究者指導(dǎo)的學(xué)位論文信息,為研究者和商業(yè)人士提供了一個(gè)獲取學(xué)者以及其指導(dǎo)學(xué)位論文元數(shù)據(jù)的檢索平臺,在推進(jìn)研究成果商業(yè)化方面進(jìn)行了有益嘗試。平臺后端的元數(shù)據(jù)信息,即通過全州各大學(xué)學(xué)位論文數(shù)據(jù)庫系統(tǒng)元數(shù)據(jù)Open API自動獲取,這種數(shù)據(jù)獲取方式較好地解決了自動獲取多來源異構(gòu)或同構(gòu)數(shù)據(jù)以及數(shù)據(jù)同步更新一致性問題。
中國科學(xué)院國家科學(xué)圖書館建立了基于館藏特色資源元數(shù)據(jù)Open API的集成服務(wù)支撐平臺,[2]用以支持面向用戶環(huán)境的嵌入式服務(wù),通過元數(shù)據(jù)Open API將館藏特色資源服務(wù)推送到用戶桌面。
中山大學(xué)圖書館的“《泰晤士報(bào)高等教育副刊》亞洲大學(xué)排名分析——五所知名高校文獻(xiàn)被引統(tǒng)計(jì)分析報(bào)告”,[3]利用所購買的學(xué)術(shù)資源數(shù)據(jù)庫,依托資源優(yōu)勢為學(xué)校提供文獻(xiàn)的被引分析報(bào)告,從另一個(gè)角度挖掘?qū)W術(shù)資源在輔助決策支持方面的潛力。
上述國內(nèi)外利用學(xué)術(shù)資源開展的拓展服務(wù)應(yīng)用,為探索利用學(xué)位論文元數(shù)據(jù)開展決策支持服務(wù)提供了可借鑒的實(shí)例。
2.1基于管理平臺開發(fā)元數(shù)據(jù)Open API應(yīng)用
華東師范大學(xué)圖書館在學(xué)位論文數(shù)據(jù)庫回溯建庫工作中,基于有針對性的國內(nèi)外應(yīng)用調(diào)研,確定了拓展服務(wù)方向。從輔助學(xué)科發(fā)展、教學(xué)水平評估等方面,應(yīng)用基于TPI平臺或商用數(shù)據(jù)庫自行開發(fā)的元數(shù)據(jù)Open API,獲取批量學(xué)位論文數(shù)據(jù),為學(xué)校職能部門提供各種統(tǒng)計(jì)分析數(shù)據(jù)。
(1)通過學(xué)位論文數(shù)量變化,透視研究熱點(diǎn)。通過Open API獲取各學(xué)科或子學(xué)科的批量數(shù)據(jù),加之年限分面限制,從歷年學(xué)位論文數(shù)量變化角度反映各學(xué)科領(lǐng)域研究趨勢。報(bào)表可以通過結(jié)合Google圖形接口,從Open API返回查詢結(jié)果的XML格式數(shù)據(jù)直接提交到Google API,即可產(chǎn)生圖形化分析結(jié)果。圖2反映了“電子科學(xué)與技術(shù)”和“數(shù)學(xué)”專業(yè)學(xué)位論文數(shù)量在2006~2011年的變化情況。
(2)通過學(xué)位論文被引用數(shù)據(jù),輔助教學(xué)評價(jià)。通過Open API獲取各院系的批量數(shù)據(jù),輔以學(xué)院、專業(yè)以及年代參數(shù)限制獲取相關(guān)學(xué)位論文元數(shù)據(jù),并通過中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(CMFD)、萬方數(shù)據(jù)股份有限公司的“中國學(xué)位論文全文數(shù)據(jù)庫”等學(xué)位論文商用數(shù)據(jù)庫系統(tǒng),運(yùn)用屏幕抓取技術(shù),可以直接獲取學(xué)位論文被引數(shù)據(jù),從中產(chǎn)生學(xué)位論文被引用統(tǒng)計(jì)分析報(bào)告。而且通過教師指導(dǎo)學(xué)位論文被引數(shù)量這一側(cè)面,為學(xué)校從學(xué)位論文被引角度評價(jià)教師指導(dǎo)學(xué)位論文質(zhì)量提供了準(zhǔn)確的參考數(shù)據(jù)。
圖2 年度學(xué)位論文數(shù)量與學(xué)科變化關(guān)系
以教育科學(xué)學(xué)院2010年畢業(yè)生高被引學(xué)位論文為例,被引分析如表1所示(學(xué)生、教師名字以編碼表示)。
表1 2010年教育科學(xué)學(xué)院部分畢業(yè)研究生學(xué)位論文被引用統(tǒng)計(jì)(2013-04-29 CMFD統(tǒng)計(jì)數(shù)據(jù))
(3)輔助人員管理。通過Open API獲取學(xué)位論文元數(shù)據(jù),結(jié)合指導(dǎo)教師和學(xué)生的關(guān)聯(lián)關(guān)系,從教師出發(fā),可以得到學(xué)生以及學(xué)生的學(xué)生等關(guān)聯(lián)關(guān)系,形成上有教師下有學(xué)生,學(xué)生下面還有學(xué)生的學(xué)者關(guān)系網(wǎng),從中可以分析從一個(gè)教師出發(fā)所形成的教學(xué)科研人員關(guān)系網(wǎng),為分析科研團(tuán)隊(duì)組成以及教學(xué)研究連續(xù)性提供參考數(shù)據(jù)。
2.2基于發(fā)布平臺下載數(shù)據(jù)分析,關(guān)注研究熱點(diǎn)
學(xué)位論文數(shù)據(jù)庫一般存儲在收藏機(jī)構(gòu)本地,從下載數(shù)量角度可以分析其論文活躍度。表2為華東師范大學(xué)學(xué)位論文數(shù)據(jù)2012年下載次數(shù)統(tǒng)計(jì),從下載次數(shù)可以反映出關(guān)注度較高的論文,從學(xué)位論文關(guān)聯(lián)指導(dǎo)教師、專業(yè)、院系等信息反映了指導(dǎo)教師對研究熱
點(diǎn)的把握。
表2 2012年論文下載次數(shù)統(tǒng)計(jì)
學(xué)位論文作為學(xué)校教學(xué)科研成果的重要內(nèi)容之一,不僅從某一方面可以反映學(xué)校的教學(xué)科研水平,而且隨著研究型大學(xué)研究生招生比例的不斷增加,基于學(xué)位論文數(shù)據(jù)還可為學(xué)校職能部門提供客觀翔實(shí)的科研管理和統(tǒng)計(jì)分析數(shù)據(jù),能為學(xué)科發(fā)展、教學(xué)過程管理以及教師評優(yōu)等方面提供重要參考,充分發(fā)揮學(xué)位論文在支持管理決策方面的積極作用。
3.1主題詞聚類分析,提供更精準(zhǔn)的分析數(shù)據(jù)
3.2引文數(shù)據(jù)分析,輔助館藏建設(shè)
根據(jù)研究生學(xué)位論文引文數(shù)據(jù)分析,可以產(chǎn)生輔助圖書館期刊采購的參考數(shù)據(jù)。如哪些期刊或電子資源數(shù)據(jù)庫中的期刊引用率較高,可以從一個(gè)側(cè)面反應(yīng)出期刊或電子資源數(shù)據(jù)庫館藏對研究者的資源保障率。然而,要實(shí)現(xiàn)學(xué)位論文引文數(shù)據(jù)分析,需要在學(xué)位論文提交時(shí)將參考文獻(xiàn)以文本方式保存或提交后單獨(dú)作參考文獻(xiàn)與全文的分離處理。目前還沒有建立上述提交機(jī)制,而且在提交后作引文與全文的分離有一定難度,原因在于參考文獻(xiàn)著錄不標(biāo)準(zhǔn)或者論文格式不標(biāo)準(zhǔn)引起。盡管清華大學(xué)圖書館針對本校2007~2010年17683篇學(xué)位論文作了嘗試性全文與參考文獻(xiàn)的自動拆分處理,程序自動識別準(zhǔn)確率為76.25%,但是仍有近23.75%的學(xué)位論文需要人工拆分。[4]因此,要實(shí)現(xiàn)學(xué)位論文的引文數(shù)據(jù)分析,對于新提交數(shù)據(jù),需要在參考文獻(xiàn)的著錄標(biāo)準(zhǔn)要求方面統(tǒng)一相關(guān)規(guī)范,從源頭將數(shù)據(jù)規(guī)范剝離,其后續(xù)的分析工作就變得相對簡單;對于已經(jīng)提交數(shù)據(jù),需要人工拆分與機(jī)器自動拆分相結(jié)合方式實(shí)現(xiàn)對參考文獻(xiàn)數(shù)據(jù)的拆分處理。
[參考文獻(xiàn)]
[1]Nicole C Engard.Library Mashups:Exploring New Waysto Deliver Library Data[M].London:Information Today,Inc.,2009:285-287.
[2]李春旺.圖書館集成融匯服務(wù)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2009(12):1-6.
[3]程煥文.《泰晤士報(bào)高等教育副刊》亞洲大學(xué)排名分析——五所知名高校文獻(xiàn)被引統(tǒng)計(jì)分析報(bào)告[EB/OL].[2013-04-17].http://wenku.baidu.com/view/038f445bad02de80d4d840d5.html.
[4]趙陽.CALIS學(xué)位論文項(xiàng)目建設(shè)應(yīng)用技術(shù)探討[C].昆明:CALIS三期學(xué)位論文項(xiàng)目經(jīng)驗(yàn)交流會,2012.
[收稿日期]2014-04-11 [責(zé)任編輯]閻秋娟
[作者簡介]李欣(1961-),女,研究館員,研究方向:數(shù)字圖書館及圖書館自動化;于亞秀(1985-),女,館員,研究方向:圖書館自動化;劉丹(1979-),男,館員;張毅(1986-),男,館員;陳志清(1977-),女,館員。
[基金項(xiàng)目]本文系國家社科基金項(xiàng)目“社會網(wǎng)絡(luò)環(huán)境下學(xué)位論文信息的開放獲取與共享模式研究”(項(xiàng)目編號:12BTQ015)研究成果之一。
[文章編號]1005-8214(2015)02-0050-04
[文獻(xiàn)標(biāo)志碼]A
[中圖分類號]G250.73;G258.6