●吳云珊(廣西師范大學 圖書館,廣西 桂林 541004)
學術數(shù)字資源指與學術研究相關的數(shù)字資源。在數(shù)字資源整合實踐中,產(chǎn)生了數(shù)據(jù)整合、信息整合和知識整合三種逐次遞進的整合方式?!爸R整合”是數(shù)字資源整合體系的最高層,是以知識管理方法為指導,以數(shù)據(jù)整合、信息整合為基礎,以知識組織體系為支撐,以知識發(fā)掘、增值和創(chuàng)新為目的,組織資源中知識的一種整合方式。
鑒于學術數(shù)字資源首先表現(xiàn)為顯性知識,圖書館一般側重于對顯性知識的管理。[1]而筆者認為,知識整合方式與知識的特質、形態(tài)密切相關。圖書館對學術數(shù)字資源的知識管理應把握學術知識“組合”和“社會化”兩個階段,知識整合應包括顯性知識整合和隱性知識整合兩個方面。
自從數(shù)字資源成為主流信息媒體后,其有效獲取一直無法擺脫“孤島”和“超載”兩大困境。“整合”作為解決出路應運而生。
學術數(shù)字資源作為一種有特殊用途的資源,其利用效能如今已不僅局限于數(shù)據(jù)的集成和信息的聚合,而需要進一步進行學術挖掘和學術創(chuàng)新。因此在數(shù)據(jù)整合和信息整合的基礎上融入語義網(wǎng)的知識整合將是學術數(shù)字資源整合的方向,也是數(shù)字資源建設到一定階段的必然要求。
資源數(shù)字化、獲取網(wǎng)絡化和需求知識化是新信息環(huán)境的特征。正如美國未來學家John Naisbett所說:“我們淹沒在信息的海洋里,但卻渴求知識?!笨梢娦滦畔h(huán)境下,用戶的需求已從“信息”向“知識”悄然轉變,因此圖書館的價值定位也應從“信息服務”向“知識服務”轉移。[2]開展知識服務既是圖書館應對新信息環(huán)境壓力的需要,也是圖書館未來發(fā)展的新的生長點。[3]而知識服務需要有完善的知識整合系統(tǒng)的支持。
國外一項對學術研究者搜索行為的研究[4]發(fā)現(xiàn),大多數(shù)人開始學術研究的首選是Google Scholar,而不是圖書館的檢索引擎。原因是Google這類搜索引擎不僅搜得的信息全面,而且一站式檢索方式簡便易懂。盡管搜索到的信息冗雜,但還是比較青睞這個途徑。可見研究者在使用數(shù)字資源時,比較看重檢索的便捷性和檢索結果的全面性。
圖書館的數(shù)字資源雖然學術性強,但卻帶有語法和語義的異構性,即:資源各自擁有獨特的數(shù)據(jù)格式、訪問方法、檢索界面和語義體系,造成研究者為找到需要的資料,不得不用迥異的方法在不同數(shù)據(jù)庫中進行重復檢索,而且檢得的結果之間沒有語義關聯(lián)。數(shù)字資源的異構性使基于數(shù)據(jù)、信息和語義的知識整合成為一種迫切需要。
一站式知識搜索界面不是對Google信息搜索引擎的簡單模仿。其除了要實現(xiàn)“一站式檢索”外,還要實現(xiàn)一種更高層次的“知識搜索”。即在吸收Google易操作性的同時,還要克服其檢索結果冗雜的缺點,使檢索結果更具有學術指向性。為此,要對學術數(shù)字資源進行知識整合,才能造就基于知識元的知識查找“統(tǒng)一界面”,實現(xiàn)一站式知識搜索。
從以文獻單元為基礎的信息組織系統(tǒng)發(fā)展到以知識元為基礎的語義網(wǎng),從對文獻信息的描述轉向對知識的描述,顯性知識整合體現(xiàn)了學術數(shù)字資源知識組織管理由表及里的發(fā)展過程。
2.1.1 知識標引
“科學工作者把在科研中取得的發(fā)現(xiàn)、發(fā)明、經(jīng)驗、教訓等知識創(chuàng)新點組織成知識單元——文獻,知識標引則要從文獻中抽出這些知識創(chuàng)新點——知識元”。[5]知識標引是描述知識并生成檢索標識的過程,是實現(xiàn)知識組織與集成、跨領域知識檢索與發(fā)現(xiàn)的核心。知識元標引是知識標引的具體化,即從知識單元中挖掘知識元。
學術論文中可能有各類知識元——概念、數(shù)值等,以抽取論文創(chuàng)新點知識元為例,步驟如下:①抽取知識元名稱。從標題入手定位知識元方向,然后從小標題、文摘、段首、段尾、結論等地方找尋有具體內容的特征詞作為知識元名稱。② 抽取知識元內容。以知識元名稱作為向導信息詞,從正文抽取若干由該詞引出的特征句,并對句中該詞的詞頻、位置進行加權統(tǒng)計,分析特征句與該詞的相關度,篩選出幾個句子作為該詞的內容,也就是知識元內容。③ 將關鍵詞和知識元名稱進行比較。④ 將知識元名稱和知識元內容導入知識元庫,完成知識元標引。實踐上可以通過手工和自動兩種途徑完成知識元標引。和手工標引不同,自動標引需要把文獻轉化成機讀文獻,借助技術手段設計一種算法來對文獻進行語句分析,識別出詞與非詞,再進行詞語加權,根據(jù)權值選出標引詞,并轉換生成知識元庫。
2.1.2 借助本體組織知識元,借助鏈接確立知識元之間語義關系
本體源于哲學本體論,是適應知識整合需要的新型知識組織體系。理論上是反映特定領域知識結構的體系;方法上能準確描述知識元以及知識元之間的關聯(lián),構建知識元之間豐富的語義關系,進行知識推理,實現(xiàn)該領域知識的共享,有效解決數(shù)字資源之間語義異構問題。本體在語義網(wǎng)中的主要功能體現(xiàn)在“知識組織”和“知識檢索”兩方面?;诒倔w的知識組織是實現(xiàn)基于語義的知識檢索的基礎。
知識元名稱相同,其語義概念在不同領域會有不同內涵。例如,“采訪”在新聞領域是記者的一種新聞采集方式,而在圖書情報領域指資源的采購和訪求。因此要將知識元的類屬關系和語義環(huán)境表示出來。將知識元名稱和知識元內容導入知識元庫以后,可以借助本體組織知識元,在學科內相關知識元名稱和知識元內容、知識元內容和知識元內容之間建立鏈接,體現(xiàn)學科中知識元的學科環(huán)境、知識元之間的類屬和層級關系,從而實現(xiàn)對知識元語義的限定,確定知識元之間的語義關系。
2.1.3 構建學科微觀領域本體,最終形成學術語義網(wǎng)
語義網(wǎng)是人類知識整合的宏觀網(wǎng)絡,由各領域微觀和中觀本體組成。因此,要構建學術語義網(wǎng),首先要構建各個學科領域的微觀本體。學科領域本體作為學科知識的語義模型,是該學科術語、知識關聯(lián)、邏輯推理等的集合,也是一種能在語義和知識層次上描述學科知識系統(tǒng)的概念模型。它以一種通用的方式獲取該學科領域中的知識元,提供共同理解,從而實現(xiàn)該學科領域知識元在不同的應用程序和組織之間的共享和重復利用。如何構建學科領域本體?可以由學術部門牽頭建立學科專家組,根據(jù)完整的學科體系組織該學科知識元的初始本體信息;然后由圖情專業(yè)人員用精確術語表達知識元初始本體概念,建立關系模型,確定知識元初始本體之間的等同、等級和相關關系;再選擇軟件,用機讀語言描述學科初始本體并進行形式化編碼;最后以現(xiàn)有初始本體為基礎構造出新本體并按統(tǒng)一要求進行本體間的語義鏈接。
學術數(shù)字資源是知識的物質載體。知識的形態(tài)在顯性和隱性之間不斷轉化。對學術數(shù)字資源隱性知識的整合其實是對資源使用者使用學術數(shù)字資源后產(chǎn)生的隱性知識的整合。
2.2.1 隱性知識整合的途徑
筆者提出以“群體化”方式整合學術數(shù)字資源使用者的隱性知識。群體化就是通過群體交流共享個體隱性知識,從而產(chǎn)生新的意會性知識的過程。
(1)按“學科專業(yè)”組建學術群體?;凇皩W科專業(yè)”這個情境,將一群學科相同、專業(yè)相同、研究領域相同的研究者聚集在一起,分享對本學科本專業(yè)本領域數(shù)字資源的領悟結果。例如:導師帶研究生,通過啟發(fā)或言傳身教在直接交流中潛移默化地將其對學術資料的理解、想法以及在研究過程中默會的學術技能、經(jīng)驗傳遞給學生。同專業(yè)研究者還可以通過討論小組、學術角、研討會等形式進行定期或非定期的學術交流,分享各自的隱性知識。
(2)按“學術問題”組建研究團隊?;凇皩W術問題”這個情境,將一群學科不同、專業(yè)不同、研究領域不同,但研究同一個學術問題的研究者聚集在一起,在共同的研究實踐中,通過對具體問題的分析、解決,深度交流各自的隱性知識,激活各自潛在的隱性知識,分享研究經(jīng)驗,取長補短,產(chǎn)生創(chuàng)造性成果。這尤其有利于交叉學科課題的研究。
(3)按“學術習慣”組建交流社群?;凇皩W術習慣”這個情境,將使用相同研究工具或方法的研究者聚集在一起互通經(jīng)驗。研究中使用的數(shù)字資源和工具可以是數(shù)據(jù)庫、搜索引擎、軟件等;研究方法可以是試驗、調查等。例如:通過組織某個數(shù)據(jù)庫的培訓講座、座談會、沙龍等,將對該資源感興趣的研究者聚集起來,通過手把手地傳授、實際地操作和自由的交談等方式傳播對該數(shù)據(jù)庫的利用心得。
2.2.2 隱性知識整合的保障
用“群體化”方式整合學術隱性知識,可以幫助研究者避免在開始學術研究時或遇到研究困難時無所適從,直接進入研究目標的知識環(huán)境、學術環(huán)境、行為環(huán)境。
(1)多途徑創(chuàng)造直接交流的輕松環(huán)境。優(yōu)雅的交流場所、寬松的交流環(huán)境和直接的交流機會有利于提高隱性知識的傳播效果??梢酝ㄟ^制訂制度建立定期面對面交流的機制。也可以借助遠程視頻通訊技術和信息技術為分散在不同地區(qū)的研究者制造面對面或直接交流的機會。此外,還可以借助一些輔助工具,如:隱喻性充滿想象的語言、啟發(fā)性帶有類推的故事、形象性可視化的工具、模型、圖表、影像等克服隱性知識交流中存在的障礙,為難以表達的隱性知識增添傳播途徑。
(2)多方式鼓勵知識分享。隱性知識對于所有者說是一種資產(chǎn),只有隱性知識所有者愿意分享才能實現(xiàn)隱性知識的傳播和整合。為此,學術交流應該以肯定、互惠、組織認可為原則,配合適當獎勵以鼓勵隱性知識所有者積極與他人交流、分享。
(3)通過學科館員開展知識服務。為保證隱性知識整合的效果,圖書館的知識服務應面向學科用戶,建立高效的信息交流機制,可以嘗試建立“學科館員制度”,通過交流促進用戶利用知識并將自身隱性知識顯性化,加快知識的傳播速度。
知識整合是建立在對圖書館學術數(shù)字資源進行數(shù)據(jù)整合和信息整合基礎上的高層次整合。因此數(shù)據(jù)整合和信息整合的程度直接影響到知識整合的效果。目前的整合方案并不能從真正意義上完全實現(xiàn)圖書館所有學術數(shù)字資源的數(shù)據(jù)整合和信息整合。① 基于OPEC系統(tǒng)的目錄整合。雖然通過在MARC里增加856字段實現(xiàn)OPAC書目信息與數(shù)字資源的整合,并通過Z39.50協(xié)議實現(xiàn)世界范圍內異構館際間的開放互聯(lián),實現(xiàn)館際數(shù)字資源目錄一站式查詢,但只能檢索到目錄層次再通過數(shù)據(jù)庫檢索入口查詢篇章,不能直接提供篇章的全文鏈接。② 基于資源導航的數(shù)據(jù)整合。雖然通過數(shù)字資源的URL建立導航庫,能將不同類型數(shù)字資源的檢索入口整合在一起并提供字順、分類瀏覽等功能,但還是要進入各個資源庫進行重復性的檢索和篩選的操作,并沒有真正地將分布的資源整合在一起實現(xiàn)一站式檢索。③ 基于超級鏈接的信息整合。雖然利用超文本鏈接將資源和相關信息鏈接成具有內在聯(lián)系的有機整體,但隨著鏈接層次的深入,容易遺漏信息、迷失方向。④ 基于跨庫檢索的異構無縫整合。雖然可以借助軟件把不同來源和通信協(xié)議、不同類型和格式的數(shù)字資源無縫鏈接起來,實現(xiàn)不同檢索界面、檢索方式、檢索式構造規(guī)則、檢索字段的數(shù)據(jù)庫的跨庫統(tǒng)一檢索,但需要廣泛遵循必要的元數(shù)據(jù)標準及互操作協(xié)議。目前要對國內外所有商業(yè)數(shù)據(jù)庫實現(xiàn)無縫鏈接的異構整合仍然很困難。如果數(shù)據(jù)和信息整合不到位,一站式檢索平臺的搜全性和直鏈性就得不到保障,與語義網(wǎng)的結合就成了空中樓閣。
知識是動態(tài)發(fā)展的,表現(xiàn)為新知識不斷產(chǎn)生,舊知識在應用過程中不斷被注入新的內涵,與其他知識形成新的關聯(lián)。這些新知識、新內涵、新關聯(lián)如何被納入到原有的知識體系,實現(xiàn)本體的自我進化是知識整合要面臨的挑戰(zhàn)。
隱性知識是個體投入了巨大精力內化顯性知識后形成的專屬財富,具有個體壟斷性,凝聚了個體長期的積累和對顯性知識的深層次的領悟。一般隱性知識所有者不會主動轉移能給自己帶來收益的隱性知識。另外,相同的隱性知識對不同的個體來說,效能是不同的。某個個體的隱性知識可能對自己適用,但對于別的個體并不適用。因此隱性知識的壟斷性直接影響到隱性知識整合的效果。
知識整合需要各類技術的支持,包括:知識元抽取技術、語義標引技術、跨庫平臺檢索技術、檢索技術、網(wǎng)絡存儲管理技術、數(shù)據(jù)分享技術、數(shù)據(jù)交換技術、安全訪問控制技術、數(shù)據(jù)加工技術、搜索引擎技術等。[6]為配合知識整合的推進,新技術的開發(fā)和應用面臨嚴峻的挑戰(zhàn),尤其是自動語義標引技術,直接影響到語義網(wǎng)的構建。在海量動態(tài)的學術數(shù)字資源面前,手工語義標引顯然力不從心,計算機自動語義標引是必然趨勢。雖然目前已經(jīng)開發(fā)出許多語義標注工具,但還遠遠沒有達到能支持多語言的自動分類、自動抽取的要求。
對圖書館學術數(shù)字資源進行知識整合是圖書館數(shù)字資源建設到一定階段的必然。作為學術數(shù)字資源的管理者和知識服務的實踐者,圖書館是實施學術數(shù)字資源知識整合的重要機構。以用戶為中心,實現(xiàn)學術知識的一站式檢索和咨詢是知識整合的目的和現(xiàn)實價值。知識整合不僅奠定了圖書館知識服務的基礎,還為圖書館的可持續(xù)發(fā)展提供了新的增長點。知識的特性決定了顯性知識整合和隱性知識整合同等重要。在實踐中,知識整合目前仍面臨極大的挑戰(zhàn)。
[1]王松林.從圖書館的角度看信息組織和知識組織[J].中國圖書館學報,2006(5):61-66.
[2]方向輝.高校圖書館知識服務的運行模式探討[J].圖書館,2009(6):82-88.
[3]朱華琴.圖書館知識資源整合與知識服務[J].信息管理,2009(6):166-167.
[4] LottaHaglund and PerOlsson.The impactonuniversity librariesof changes in information behavior among academic researchers:amultiple casestudy[J].The Journal ofAcademic Librarianship,2008,34 (1):55-57.
[5]溫有奎,等.知識元挖掘[M].西安:西安電子科技大學出版社,2005:16.
[6]屈冠軍.基于實現(xiàn)跨庫檢索的數(shù)字資源整合技術探討 [J].圖書館,2009(6):86-88.