●宋 文,張士男(中國(guó)科學(xué)院 國(guó)家科學(xué)圖書(shū)館,北京 100190)
我們正處于數(shù)字化時(shí)代,數(shù)字信息環(huán)境已經(jīng)滲透和影響了社會(huì)生活、經(jīng)濟(jì)、文化、科研、教育等各個(gè)領(lǐng)域,改變著傳統(tǒng)的信息發(fā)布、獲取和交流模式。數(shù)字科研信息環(huán)境也正在形成并逐漸成熟,在這樣一個(gè)時(shí)代背景下,我們有幾個(gè)基本的判斷:
科研綜合數(shù)字信息環(huán)境有幾個(gè)典型特征。首先,一切科研對(duì)象,如科研人員、科研機(jī)構(gòu)、科研設(shè)備、科研項(xiàng)目、科研基金、科研成果等科學(xué)研究過(guò)程涉及的對(duì)象都越來(lái)越多地是用數(shù)字化表征并可通過(guò)網(wǎng)絡(luò)查詢(xún)。第二,科研人員更多地采用網(wǎng)絡(luò)和數(shù)字信息平臺(tái)進(jìn)行科學(xué)交流。如科研人員用個(gè)人博客發(fā)表論文和觀點(diǎn),開(kāi)展討論;跨區(qū)域的合作研究項(xiàng)目用門(mén)戶(hù)平臺(tái)發(fā)布科研成果,開(kāi)展合作與交流;科學(xué)家群體用MailingList對(duì)某個(gè)科學(xué)問(wèn)題進(jìn)行討論,用ARP、ERP進(jìn)行科研管理,用科學(xué)工作流系統(tǒng)進(jìn)行科研過(guò)程的管理等等。第三,數(shù)字信息資源的類(lèi)型極大豐富。綜合數(shù)字信息環(huán)境下信息資源類(lèi)型已大大超越傳統(tǒng)數(shù)字圖書(shū)館的電子期刊、論文、電子圖書(shū)、會(huì)議論文等有限的類(lèi)型,科研綜合數(shù)字信息環(huán)境下信息資源的類(lèi)型包括各種類(lèi)型的科學(xué)數(shù)據(jù)(白色數(shù)據(jù)、暗數(shù)據(jù)、灰色數(shù)據(jù)、管理數(shù)據(jù)等)、人物數(shù)據(jù)、機(jī)構(gòu)數(shù)據(jù)庫(kù)、網(wǎng)站、博客、郵件列表、RSS、PPT、會(huì)議信息、研究項(xiàng)目及相關(guān)資料、機(jī)構(gòu)知識(shí)庫(kù)等,還包括教育資源(如課件、課程計(jì)劃、課程管理系統(tǒng)、講座、可視化資料、教學(xué)/學(xué)習(xí)工具等),軟件資源、儀器設(shè)備資源(包括各種實(shí)驗(yàn)儀器、存儲(chǔ)設(shè)備、通信設(shè)備、各種圖像捕獲設(shè)備等)、計(jì)算資源,其他新型資源如動(dòng)植物種質(zhì)、微生物菌種、生物標(biāo)本、遺傳基因、巖石礦石化石土壤、標(biāo)準(zhǔn)物質(zhì)、實(shí)驗(yàn)材料、試劑、傳感器、觀測(cè)活體、實(shí)驗(yàn)活體、保護(hù)區(qū)、產(chǎn)品、樣品,等等。[1]在這樣一個(gè)綜合數(shù)字信息資源數(shù)量和類(lèi)型急速增長(zhǎng)的趨勢(shì)下,如何有效地組織、開(kāi)發(fā)、集成利用綜合科技信息資源已成為迫切需要研究和解決的關(guān)鍵問(wèn)題。
用戶(hù)的信息需求是隨著信息環(huán)境的發(fā)展而變化的,一個(gè)階段難以滿(mǎn)足的關(guān)鍵需求在另一個(gè)階段可能就是容易滿(mǎn)足的常態(tài)需求。如果說(shuō)20世紀(jì)90年代,用戶(hù)需求的主要矛盾是在文獻(xiàn)信息資源獲取方面,尤其是外文文獻(xiàn)資源的獲取是我國(guó)科研、教育領(lǐng)域的一個(gè)關(guān)鍵問(wèn)題,那么經(jīng)過(guò)NSTL國(guó)家科技圖書(shū)文獻(xiàn)中心大規(guī)模的文獻(xiàn)資源建設(shè),通過(guò)中科院、高校系統(tǒng)的大規(guī)模資金投入用于建設(shè)電子文獻(xiàn)信息資源,應(yīng)該說(shuō),科研、教育領(lǐng)域?qū)ξ墨I(xiàn)資源的需求已基本得到滿(mǎn)足。但是在綜合數(shù)字信息環(huán)境下,用戶(hù)信息需求的突出矛盾已演變?yōu)橛脩?hù)科研過(guò)程中綜合科技信息資源的快捷、準(zhǔn)確、方便的發(fā)現(xiàn)和獲取問(wèn)題,演變?yōu)橛脩?hù)科研過(guò)程中實(shí)時(shí)的綜合科技信息的發(fā)布、實(shí)時(shí)的成果共享交流等方面的問(wèn)題,演變?yōu)橛脩?hù)如何能在科研過(guò)程中集成利用各種類(lèi)型科研資源的問(wèn)題。
搜索引擎在用戶(hù)信息發(fā)現(xiàn)方面做出了巨大的貢獻(xiàn),但是網(wǎng)絡(luò)資源浩如煙海,廣泛散布,即使利用目前最為強(qiáng)大的搜索引擎,其涉獵的網(wǎng)頁(yè)也不超過(guò)15%。其次,所檢索的結(jié)果也無(wú)法適應(yīng)不同用戶(hù)(研究者、教師、學(xué)員等)的特殊要求。[2]
如何構(gòu)建緊密融入用戶(hù)科研過(guò)程的個(gè)性化知識(shí)環(huán)境,并通過(guò)這一環(huán)境有效地采集、集成多類(lèi)型的綜合科技信息資源,并基于這一環(huán)境提供知識(shí)化服務(wù)已經(jīng)成為信息服務(wù)領(lǐng)域面臨的關(guān)鍵問(wèn)題。
一方面網(wǎng)絡(luò)數(shù)字信息資源的極大豐富,使得搜索引擎已成為人們獲取信息的首選工具;[3]數(shù)字化出版使得出版商不再單純地賣(mài)文獻(xiàn),而是將文獻(xiàn)、數(shù)據(jù)、服務(wù)包裝成一個(gè)系統(tǒng)直接提供用戶(hù)使用;數(shù)字學(xué)術(shù)交流也已經(jīng)可以不通過(guò)圖書(shū)館這一中間環(huán)節(jié),圖書(shū)館賴(lài)以生存的核心價(jià)值正面臨極大的挑戰(zhàn)。另一方面,由于信息的過(guò)量和泛濫,造成信息無(wú)序和大量干擾信息,用戶(hù)無(wú)法快速、準(zhǔn)確、全面獲取所需要的信息;科研用戶(hù)科研過(guò)程中的大量數(shù)字信息資源迫切需要全面的管理和保存;數(shù)字學(xué)術(shù)交流需要信息服務(wù)者用一種嶄新的模式參與其中使其更加高效,這些需求是大量的、嶄新的、變化的。文獻(xiàn)信息機(jī)構(gòu)不管是從自身生存發(fā)展的需要出發(fā),還是從用戶(hù)需求出發(fā),都需要進(jìn)行服務(wù)能力的創(chuàng)新和再造,實(shí)現(xiàn)從傳統(tǒng)圖書(shū)館向融入用戶(hù)團(tuán)隊(duì)、融入用戶(hù)科研過(guò)程的知識(shí)化服務(wù)轉(zhuǎn)變。信息時(shí)代賦予圖書(shū)館新的歷史使命和發(fā)展機(jī)遇,建設(shè)專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境正是中科院國(guó)家科學(xué)圖書(shū)館為滿(mǎn)足科技創(chuàng)新的需求而啟動(dòng)的新的服務(wù)能力建設(shè)的一個(gè)具體措施。
為了滿(mǎn)足科研一線綜合科技信息發(fā)布、組織、管理和利用的需求,中科院國(guó)家科學(xué)圖書(shū)館開(kāi)始啟動(dòng)專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境的建設(shè)工作。
專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境(SubjectKnowledgeEnvironment,SKE)通過(guò)集成和個(gè)性化定制數(shù)字圖書(shū)館公共文獻(xiàn)服務(wù)體系資源,通過(guò)搜索采集遴選集成社會(huì)網(wǎng)絡(luò)中的相關(guān)資源,形成面向研究所、課題組、研究領(lǐng)域的個(gè)性化知識(shí)環(huán)境。一方面專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境與研究所文獻(xiàn)集成平臺(tái)、機(jī)構(gòu)知識(shí)倉(cāng)儲(chǔ)共同構(gòu)成了研究所數(shù)字知識(shí)環(huán)境,另一方面專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境又與遠(yuǎn)程會(huì)議系統(tǒng)、虛擬研究社區(qū)、科學(xué)工作流系統(tǒng)等共同構(gòu)成了用戶(hù)科研信息環(huán)境。
專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境的愿景是面向科研一線,支持融入科研過(guò)程的用戶(hù)自主靈活地構(gòu)建個(gè)性化的知識(shí)環(huán)境,支持知識(shí)資源和知識(shí)服務(wù)的動(dòng)態(tài)聚合和智能發(fā)現(xiàn),支持對(duì)領(lǐng)域知識(shí)資源的發(fā)布、交流、組織與利用。[4]具體來(lái)說(shuō):
(1)支持科研機(jī)構(gòu)、科研團(tuán)隊(duì)和科研人員科研過(guò)程中快速靈活構(gòu)建個(gè)性化知識(shí)環(huán)境,實(shí)現(xiàn)即時(shí)的知識(shí)發(fā)布、知識(shí)交流與知識(shí)管理。
(2)支持集成融匯、信息采集等先進(jìn)技術(shù)的應(yīng)用,支持對(duì)領(lǐng)域知識(shí)資源的集成,支持圖書(shū)館專(zhuān)業(yè)人員和用戶(hù)合作的領(lǐng)域知識(shí)資源的遴選、采集、集成組織和利用。
(3)支持圖書(shū)館員面向重點(diǎn)研究領(lǐng)域、重大項(xiàng)目、重要研究團(tuán)隊(duì)提供實(shí)時(shí)的、個(gè)性化的綜合科技信息服務(wù)和增值的知識(shí)化服務(wù)。
(4)支持科研用戶(hù)按照其需求和使用偏好對(duì)知識(shí)資源的個(gè)性化組織,支持圖書(shū)館專(zhuān)業(yè)人員協(xié)助進(jìn)行知識(shí)資源的描述、組織與管理。
(5)支持基于一個(gè)或多個(gè)專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境的集成的知識(shí)挖掘、知識(shí)發(fā)現(xiàn)、知識(shí)推理,支持知識(shí)資源的結(jié)構(gòu)化、可視化呈現(xiàn)和關(guān)聯(lián)導(dǎo)航。
專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境由三層技術(shù)體系支撐:集成層、存儲(chǔ)層和Web服務(wù)層。
集成層實(shí)現(xiàn)多來(lái)源異構(gòu)數(shù)據(jù)的采集集成,經(jīng)過(guò)對(duì)象識(shí)別、元數(shù)據(jù)轉(zhuǎn)換、語(yǔ)義映射等處理,將重要的綜合科技信息資源按本體結(jié)構(gòu)存儲(chǔ)到統(tǒng)一的知識(shí)庫(kù)中。集成層需要解決的關(guān)鍵問(wèn)題是目標(biāo)信息源的自動(dòng)搜索發(fā)現(xiàn),WWW上大量非結(jié)構(gòu)化或半結(jié)構(gòu)化異質(zhì)數(shù)據(jù)對(duì)象的智能識(shí)別和抽取,多來(lái)源數(shù)據(jù)的語(yǔ)義轉(zhuǎn)換和映射。
存儲(chǔ)層的核心組件是知識(shí)庫(kù)和本體引擎,知識(shí)庫(kù)又包括科研本體和綜合科技信息資源實(shí)例。本體引擎可以看作專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境的內(nèi)核,負(fù)責(zé)本體和知識(shí)庫(kù)的存儲(chǔ)管理,負(fù)責(zé)對(duì)知識(shí)庫(kù)的檢索推理和各種基于本體的計(jì)算。Web服務(wù)層通過(guò)本體引擎實(shí)現(xiàn)對(duì)知識(shí)庫(kù)的操作。本體引擎通過(guò)開(kāi)放的API接口,提供第三方應(yīng)用系統(tǒng)對(duì)知識(shí)庫(kù)內(nèi)容的檢索、存取操作。
Web服務(wù)層直接面向終端用戶(hù)提供服務(wù)。通過(guò)Web服務(wù)層,用戶(hù)可以按本體語(yǔ)義模型進(jìn)行知識(shí)的發(fā)布,可以基于本體邏輯實(shí)現(xiàn)知識(shí)的瀏覽、導(dǎo)航、關(guān)聯(lián)檢索,以及知識(shí)的推理和知識(shí)發(fā)現(xiàn)。
在中國(guó)科學(xué)院創(chuàng)新經(jīng)費(fèi)的支持下,國(guó)家科學(xué)圖書(shū)館建立了專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境關(guān)鍵技術(shù)研究項(xiàng)目組,對(duì)專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境建設(shè)的關(guān)鍵技術(shù)進(jìn)行研究并開(kāi)發(fā)試驗(yàn)系統(tǒng),開(kāi)展試點(diǎn)應(yīng)用。項(xiàng)目組經(jīng)過(guò)調(diào)研,決定以康奈爾大學(xué)的vitro系統(tǒng)為基礎(chǔ)系統(tǒng),對(duì)其進(jìn)行本地化改造和擴(kuò)展功能開(kāi)發(fā),來(lái)構(gòu)建專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境平臺(tái)(SKE平臺(tái)),項(xiàng)目從2008年底啟動(dòng),目前專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境已達(dá)到了以下服務(wù)能力:
SKE平臺(tái)提供了一個(gè)基于統(tǒng)一的平臺(tái),可靈活定制個(gè)性化知識(shí)環(huán)境構(gòu)建的解決方案。SKE平臺(tái)根據(jù)中國(guó)國(guó)情,在系統(tǒng)中實(shí)現(xiàn)從發(fā)布管理到服務(wù)的知識(shí)資源生命周期中的管理機(jī)制,融入了以用戶(hù)為主導(dǎo)的,資源建設(shè)人員和學(xué)科館員作支撐的知識(shí)環(huán)境建設(shè)機(jī)制。SKE平臺(tái)采用“一個(gè)平臺(tái),多個(gè)門(mén)戶(hù)”體系結(jié)構(gòu),支持用戶(hù)基于SKE平臺(tái)自主建立面向重大科研項(xiàng)目、重點(diǎn)研究領(lǐng)域、特定研究機(jī)構(gòu)(研究所、實(shí)驗(yàn)室或課題組)的個(gè)性化知識(shí)環(huán)境。
在一個(gè)平臺(tái)、多個(gè)門(mén)戶(hù)的體系框架下,實(shí)現(xiàn)知識(shí)資源的動(dòng)態(tài)發(fā)布、更新,實(shí)現(xiàn)門(mén)戶(hù)與門(mén)戶(hù)之間即相互獨(dú)立,又共享合作的知識(shí)資源管理模式?;谀壳癝KE平臺(tái)能力,用戶(hù)可以動(dòng)態(tài)發(fā)布關(guān)于科研人員、科研項(xiàng)目進(jìn)展情況、科研成果等科研過(guò)程中涉及的知識(shí)資源的信息,用戶(hù)也可以隨時(shí)集成網(wǎng)絡(luò)相關(guān)資源、RSS新聞等內(nèi)容,這樣一個(gè)平臺(tái)將會(huì)成為用戶(hù)科研過(guò)程中必備的知識(shí)管理、知識(shí)交流和知識(shí)發(fā)現(xiàn)工具。
在SKE平臺(tái)中,注冊(cè)用戶(hù)可在權(quán)限范圍內(nèi)發(fā)布、共享、編輯、刪除、管理、評(píng)價(jià)資源記錄,確定資源記錄允許公開(kāi)/修改的程度及范圍,并選擇記錄是否發(fā)布至公共門(mén)戶(hù),同時(shí)可在權(quán)限允許范圍內(nèi)瀏覽、編輯、管理本門(mén)戶(hù)其他用戶(hù)發(fā)布的信息,共同管理、豐富本門(mén)戶(hù)的信息資源,構(gòu)建大家熟悉的信息交流方式,形成領(lǐng)域研究的學(xué)術(shù)社區(qū),從而實(shí)現(xiàn)團(tuán)隊(duì)內(nèi)部知識(shí)的嚴(yán)格控制與共享,領(lǐng)域知識(shí)的合作發(fā)行與交流。圖書(shū)館員可以通過(guò)SKE平臺(tái)向用戶(hù)推薦經(jīng)過(guò)評(píng)價(jià)遴選的領(lǐng)域知識(shí)資源,并通過(guò)添加RSS源,實(shí)現(xiàn)相關(guān)信息網(wǎng)站、核心期刊等資源的動(dòng)態(tài)采集,達(dá)到實(shí)時(shí)跟蹤、獲取科研最新進(jìn)展的目的。
SKE平臺(tái)是一個(gè)本體驅(qū)動(dòng)的語(yǔ)義門(mén)戶(hù),其資源組織基礎(chǔ)是底層的科研本體。科研本體涵蓋了科研人員、科研機(jī)構(gòu)、研究項(xiàng)目、學(xué)術(shù)活動(dòng)、科研成果、科學(xué)數(shù)據(jù)、[5]科技新聞、科研動(dòng)態(tài)公告、設(shè)備與技術(shù)服務(wù)、文獻(xiàn)資源、招生招聘、科技政策規(guī)劃、資助與合作等科研過(guò)程中的資源類(lèi)型??蒲斜倔w總計(jì)包括120個(gè)概念類(lèi),92個(gè)對(duì)象屬性和95個(gè)數(shù)值屬性。在科研本體的基礎(chǔ)上,SKE平臺(tái)實(shí)現(xiàn)了知識(shí)資源的關(guān)聯(lián)瀏覽、智能檢索和基于本體的結(jié)構(gòu)化呈現(xiàn),我們也初步嘗試了基于本體的知識(shí)發(fā)現(xiàn)和推理,并取得了一定的效果。
在試驗(yàn)平臺(tái)基本完成后,項(xiàng)目組與研究所圖書(shū)館和科研人員合作,開(kāi)展了試點(diǎn)應(yīng)用,建立了三個(gè)試驗(yàn)性的知識(shí)環(huán)境:中科院專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境,[6]西南生物多樣性知識(shí)環(huán)境,[7]生物醫(yī)學(xué)與健康知識(shí)環(huán)境。[8]
SKE試點(diǎn)應(yīng)用過(guò)程中,得到科研人員的很好反饋和積極參與、響應(yīng),許多科研人員都表示希望能盡早使用SKE這個(gè)信息服務(wù)工具,認(rèn)為“SKE平臺(tái)的建設(shè),能夠很好的滿(mǎn)足項(xiàng)目組進(jìn)行科學(xué)交流和項(xiàng)目展示的目的,項(xiàng)目組很需要這樣的平臺(tái)”,“SKE是一個(gè)宣傳科研人員自己工作成果的新的窗口,同時(shí)也能夠呼吁大家共享信息,是一個(gè)很好的平臺(tái)”。
隨著系統(tǒng)建設(shè)和試點(diǎn)應(yīng)用的推進(jìn),我們發(fā)現(xiàn)用戶(hù)對(duì)SKE的需求已經(jīng)從功能需求,逐漸轉(zhuǎn)變到對(duì)系統(tǒng)易用性、展示性及其他特殊的需求,這從側(cè)面反映出SKE的系統(tǒng)開(kāi)發(fā)和建設(shè)的關(guān)鍵技術(shù)研究已經(jīng)實(shí)現(xiàn)。在SKE平臺(tái)建設(shè)中,項(xiàng)目組雖然取得了一定的成果,但也有一些未能很好解決的問(wèn)題。如當(dāng)前本體距離通用科研本體的建設(shè)目標(biāo)還有一定距離;如何構(gòu)建可靠的、長(zhǎng)期的、合理的SKE應(yīng)用和推廣機(jī)制、協(xié)調(diào)機(jī)制、管理機(jī)制、建設(shè)機(jī)制;隨著應(yīng)用范圍的不斷擴(kuò)大,如何保證合理范圍內(nèi)最大限度的滿(mǎn)足科研人員的特殊功能和服務(wù)需求;如何與研究所的其他信息建設(shè)平臺(tái)/系統(tǒng)實(shí)現(xiàn)科學(xué)的定制和融合;如何更好的實(shí)現(xiàn)信息的自動(dòng)采集等等,這些方面的問(wèn)題有待繼續(xù)探索和解決。
從項(xiàng)目建設(shè)和試點(diǎn)應(yīng)用整個(gè)過(guò)程,我們深切地感受到,為用戶(hù)構(gòu)建一個(gè)健壯、穩(wěn)定、易用、智能的知識(shí)服務(wù)系統(tǒng),是科學(xué)研究的迫切需要,也是文獻(xiàn)信息機(jī)構(gòu)應(yīng)該承擔(dān)的職責(zé)。
[1]孫坦,等.知識(shí)資源的生產(chǎn)、收集、組織與利用發(fā)展趨勢(shì)[R].2008.
[2]祝智庭,胡小勇.ODL科研信息環(huán)境的概念設(shè)計(jì)框架[J].遠(yuǎn)程教育雜志,2003(4):7-10.
[3]CathyDR,etal.PerceptionsofLibrariesandInformation Resources:A Report to the OCLC Membership.[R/OL].[2009-04-06].http://www.oclc.org/re-
[4]宋文,等.院所協(xié)同機(jī)制下的專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境建設(shè)[J].圖書(shū)情報(bào)工作,2010(7):116-120.
[5]黃金霞,等.中國(guó)科學(xué)院專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境的建設(shè)與應(yīng)用[J].圖書(shū)情報(bào)工作(S2),2010:337-341,352.
[6]中科院專(zhuān)業(yè)領(lǐng)域知識(shí)環(huán)境[EB/OL].[2010-12-18].http://ske.las.ac.cn.
[7]西南生物多樣性知識(shí)環(huán)境[EB/OL].[2010-12-18].http://sbke.las.ac.cn.
[8]生物醫(yī)學(xué)與健康知識(shí)環(huán)境[EB/OL].[2010-12-18].http://health.las.ac.cn.ports/pdfs/Percept_all.pdf.