鄭昌興 劉喜文
(1.南京大學(xué)信息管理學(xué)院 江蘇南京 210093)
(2.南京政治學(xué)院基礎(chǔ)部 江蘇南京 210003)
隨著信息化社會的不斷迫近和大數(shù)據(jù)時代的到來,信息呈爆炸式增長,人類被淹沒在信息的海洋中。如何從海量的信息中獲取知識并進(jìn)行有效的組織,為用戶提供知識服務(wù)成為了情報工作者需要重點研究的問題。知識地圖作為一種知識管理的有力工具,它以可視化的方式展示知識的分布及知識之間的關(guān)系,使得知識的獲取變得更加容易,實現(xiàn)了知識的重用、共享與知識創(chuàng)新。但以往對知識地圖的研究更多是把知識地圖作為一種可視化的展示工具來對待,主要關(guān)注概念辨析、針對各領(lǐng)域的需要所進(jìn)行的構(gòu)建研究等內(nèi)容,鮮有從知識組織的角度來認(rèn)識知識地圖。
知識地圖的展示只是知識地圖的外在功能特性,更為重要的是如何從多種類型的知識資源中抽取知識,經(jīng)過處理后,采用適合的方式表示出來。知識的抽取、處理、表示是知識地圖展示功能的基礎(chǔ),本質(zhì)上就是對知識的有效組織。本文試圖在知識地圖文獻(xiàn)回顧的基礎(chǔ)上,構(gòu)建基于知識地圖的知識組織模型,并利用CSSCI學(xué)術(shù)資源進(jìn)行了實證研究。
知識地圖能夠有效地整合分散在組織內(nèi)的相關(guān)知識,使之有序化、便于管理和利用,它實際上就是把一個組織中的知識資源進(jìn)行匯集、整合、關(guān)聯(lián),形成組織的知識集合和知識流。運用知識地圖,可以按圖索驥,得到尋找知識的途徑,有效的縮短知識獲取的時間,加速知識循環(huán),實現(xiàn)知識的共享與創(chuàng)新。知識地圖的研究經(jīng)歷了一個從概念辨析、構(gòu)建方法到實際應(yīng)用的一個逐漸明晰的過程,文獻(xiàn)[1]對2008年以前的知識地圖的理論研究進(jìn)行了全面的梳理,闡述了知識地圖的概念、特點、分類、功能等方面內(nèi)容;文獻(xiàn)[2]對知識地圖及相關(guān)的概念包括知識圖譜、概念圖、主題圖進(jìn)行了辨析,對研究進(jìn)展進(jìn)行了綜述并對研究前景進(jìn)行了展望。知識地圖更多的研究集中在構(gòu)建技術(shù)和具體領(lǐng)域的應(yīng)用研究上,文獻(xiàn)[3]對知識地圖的構(gòu)建方法的理論基礎(chǔ)進(jìn)行了研究,文獻(xiàn)[4,5]分別將本體技術(shù)和社會網(wǎng)絡(luò)分析方法引入到知識地圖的構(gòu)建中并進(jìn)行了實證研究;文獻(xiàn)[6,7]關(guān)注了隱性知識地圖的構(gòu)建問題,與顯性知識相比,隱性知識的社會化無疑更具創(chuàng)新價值,相關(guān)文獻(xiàn)對于專家知識地圖的研究本質(zhì)上也是體現(xiàn)了對于隱性知識的關(guān)注;文獻(xiàn)[7-10]等從語義對等網(wǎng)環(huán)境、產(chǎn)品開發(fā)、網(wǎng)絡(luò)日志等不同的領(lǐng)域和角度研究了知識地圖的構(gòu)建和應(yīng)用。
總體來看,當(dāng)前知識地圖的研究呈現(xiàn)以下幾個特點:(1)將語義網(wǎng)的本體技術(shù)引入到知識地圖的構(gòu)建中,以期通過本體的語義描述能力建立知識單元之間的語義關(guān)聯(lián),進(jìn)而形成知識地圖網(wǎng)絡(luò)。(2)知識地圖的構(gòu)建已從早期的概念型知識地圖、流程型知識地圖、職稱型知識地圖等顯性知識地圖向以基于社會關(guān)系網(wǎng)絡(luò)的隱性知識地圖發(fā)展,這是因為隱性知識才是組織核心價值所在,隱性知識的社會化對于促進(jìn)知識創(chuàng)新具有更為重要的意義。(3)知識地圖的應(yīng)用研究從企業(yè)組織向社會圖書館、大學(xué)圖書館擴展,這一方面是圖書館等科研支撐部門對于提升知識服務(wù)的迫切需要,另一方面也反映了知識地圖的知識導(dǎo)航和方便知識獲取的優(yōu)點受到廣泛認(rèn)可和關(guān)注。通過分析,筆者認(rèn)為當(dāng)前的知識地圖研究也存在一些不足:(1)主要探討了知識地圖的理論層面的相關(guān)問題包括概念、分類、功能等和具體領(lǐng)域的構(gòu)建、應(yīng)用和展示,對于知識地圖的知識組織層面缺乏系統(tǒng)、深入的闡述。(2)知識地圖的構(gòu)建方法在宏觀上缺乏通用性,僅適用具體的應(yīng)用領(lǐng)域,即未建立知識地圖的知識組織概念模型用于指導(dǎo)通用的知識地圖的構(gòu)建。
知識組織的本質(zhì)是使知識序化,便于知識的查找、使用和共享。信息技術(shù)高速發(fā)展和大數(shù)據(jù)的時代背景下,信息量與日俱增、信息存儲分散和無序,而人們從中獲取知識的能力卻是有限的,在這種情況下,從知識層面對信息資源進(jìn)行組織并使其利于獲取使用就顯得尤為重要。以分類法、元數(shù)據(jù)、主題詞表等為代表傳統(tǒng)的知識組織方法多局限于文獻(xiàn)和信息層面,無法滿足人們對于知識的需求。知識地圖是以可視化技術(shù)實現(xiàn)的組織知識目錄及其語義關(guān)系的組合體和組織領(lǐng)域?qū)<业膶?dǎo)航系統(tǒng),使得知識的獲取更加便利。
基于知識地圖的知識組織,首先要對來自組織內(nèi)的各種類型資源進(jìn)行收集整理,對于組織需要的或者是與組織內(nèi)的資源有重要聯(lián)系的外部資源(比如Internet上的信息)也必須納入進(jìn)來,確保知識地圖的信息資源的完備性和全面性。然后從各類資源中抽取知識元,經(jīng)過處理以后,采用適合的方法進(jìn)行知識表示,建立知識元之間的關(guān)聯(lián)關(guān)系?;谝陨现R表示,采用可視化技術(shù)展示知識節(jié)點及其之間的關(guān)聯(lián)關(guān)系,形成知識地圖。知識地圖是一種有效的知識組織方式,它以直觀、便捷的方式為用戶提供知識服務(wù),以更好的實現(xiàn)知識的共享與重用,最終實現(xiàn)知識創(chuàng)新的目的 (基于知識地圖的知識組織的概念模型見圖 1)。
圖1 基于知識地圖的知識組織的概念模型
(1)信息資源層:信息資源層是基于知識地圖知識組織的基礎(chǔ),也是知識地圖的信息源。知識地圖的一個重要的特點就是不直接表達(dá)知識內(nèi)容,而是展示知識所在的位置,而知識資源層所包含的內(nèi)容就是知識的具體的存儲位置。信息資源層是知識收集的結(jié)果,它包含了組織內(nèi)所有的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),也包括了隱形知識的載體人。
(2)知識表示層:知識表示層是信息資源層和地圖展示層的中介,也是實現(xiàn)基于知識地圖知識組織的關(guān)鍵所在。知識表示層實現(xiàn)了對信息資源層所有資源中所蘊含知識的抽取,以知識元形式表示,定義它們之間的語義關(guān)系,并定量化的描述它們之間的關(guān)聯(lián)度。所有知識表示存儲在知識庫中知識表示表中。同時知識庫中還包含知識鏈接表存儲知識元所指向的具體信息資源,知識表示表與知識鏈接表通過知識元ID主鍵關(guān)聯(lián)。知識表示層和信息資源層通過知識鏈接實現(xiàn)知識元與其具體存儲位置的信息資源之間的關(guān)聯(lián)。
(3)地圖展示層:地圖展示層是根據(jù)具體應(yīng)用基于知識表示層所形成的視圖,它是基于知識地圖知識組織的外在呈現(xiàn)。地圖展示層根據(jù)具體的應(yīng)用需求通過檢索知識庫中的知識表示表中的相關(guān)知識元,根據(jù)它們之間的語義關(guān)系繪制知識地圖。地圖展示層由知識節(jié)點和知識關(guān)聯(lián)組成,這里的知識節(jié)點可以是知識元本身也可以是知識元的進(jìn)一步概括和抽象所形成的知識對象,比如:蘇新寧是作者這個知識對象的一個實例我們稱之為知識元,在建立南京大學(xué)老師之間的學(xué)術(shù)關(guān)聯(lián)知識地圖中利用的是知識元本身作為知識節(jié)點,當(dāng)建立南京大學(xué)、武漢大學(xué)、北京大學(xué)等高校老師之間的學(xué)術(shù)關(guān)聯(lián)知識地圖時,就需要對知識元進(jìn)一步的概括和抽象,以南京大學(xué)老師作為知識節(jié)點。知識關(guān)聯(lián)用于反映知識節(jié)點之間的語義關(guān)聯(lián)關(guān)系和關(guān)系度。關(guān)系度的計算則根據(jù)不同應(yīng)用的需要采用不同的算法。地圖展示層通過知識檢索獲取知識表示層存儲的關(guān)于知識節(jié)點和知識關(guān)聯(lián)的知識表示。
中國社會科學(xué)引文索引 (Chinese Social Science Citation Index,CSSCI)是由南京大學(xué)中國社會科學(xué)評價中心研發(fā)的引文數(shù)據(jù)庫,它從中文人文社會科學(xué)學(xué)術(shù)性期刊中精選出學(xué)術(shù)性強、編輯規(guī)范的期刊作為來源期刊,收錄了這些期刊1998年以來的來源文獻(xiàn)和引文文獻(xiàn)數(shù)據(jù),這些數(shù)據(jù)基本能反映當(dāng)前我國人文社科領(lǐng)域的研究進(jìn)展和研究成果。通過對CSSCI學(xué)術(shù)資源基于知識地圖進(jìn)行知識組織,可以使得我們從多角度分析CSSCI學(xué)術(shù)資源所蘊藏的隱含知識,用于幫助和指導(dǎo)我們的科學(xué)研究和科研規(guī)劃與管理。比如:通過基于主題之間的關(guān)聯(lián)關(guān)系進(jìn)行的知識組織,能夠發(fā)現(xiàn)當(dāng)前和潛在的研究熱點;通過基于學(xué)科之間關(guān)聯(lián)關(guān)系的知識組織,能夠發(fā)現(xiàn)學(xué)科交叉研究的情況;通過對作者之間關(guān)聯(lián)關(guān)系的知識組織,能夠發(fā)現(xiàn)作者之間研究的相似性,用于探索合作研究的可能性等。
由于CSSCI數(shù)據(jù)源單一,存儲在結(jié)構(gòu)化的關(guān)系數(shù)據(jù)庫中,所以CSSCI知識組織知識抽取較為容易。通過分析CSSCI數(shù)據(jù)庫中的各個字段,抽取主題、作者、機構(gòu)、期刊、學(xué)科和基金六個知識對象作為研究對象?;谥R地圖的CSSCI學(xué)術(shù)資源的知識組織的目標(biāo)如圖2所示,基于有意義的知識對象之間的關(guān)聯(lián)關(guān)系研究知識表示、知識存儲和知識展示,從而形成一個綜合的知識地圖。文獻(xiàn)[4,11,12]已從不同的角度闡述了CSSSI知識地圖的繪制與展示,本文重點論述知識映射、知識關(guān)聯(lián)、知識表示和知識存儲,即知識表示層的相關(guān)內(nèi)容。CSSCI的知識表示本質(zhì)上是建立信息資源層的文獻(xiàn)到知識表示層知識的映射,實現(xiàn)文獻(xiàn)到知識的轉(zhuǎn)化。從文獻(xiàn)中的抽取的知識對象分為兩類:一類可以從數(shù)據(jù)庫中直接提取,包括:作者、機構(gòu)、期刊、學(xué)科和基金;另外一類是主題對象,主題并不包括在CSSCI的關(guān)系數(shù)據(jù)庫中,需要對相關(guān)學(xué)科文獻(xiàn)關(guān)進(jìn)行統(tǒng)計分析結(jié)合領(lǐng)域?qū)<抑R對關(guān)鍵詞進(jìn)行歸并獲得。
圖2 CSSCI知識映射及知識關(guān)聯(lián)圖
基于有意義的知識對象之間建立的關(guān)聯(lián)關(guān)系也分為兩類:一類是同類知識對象之間的關(guān)聯(lián),包括:作者間的關(guān)聯(lián),主題間的關(guān)聯(lián),機構(gòu)間的關(guān)聯(lián),學(xué)科間的關(guān)聯(lián),期刊間的關(guān)聯(lián)。通過研究作者之間的主題共現(xiàn)、合作、互引、同被引、同機構(gòu)來建立作者之間的關(guān)聯(lián)關(guān)系,發(fā)現(xiàn)學(xué)者之間的依賴關(guān)系和處于關(guān)鍵節(jié)點的專家學(xué)者,探索學(xué)者間交叉合作的可能,促進(jìn)學(xué)術(shù)的交流和發(fā)展;文獻(xiàn)的關(guān)鍵詞能夠反映它的主要內(nèi)容同即主題,通過對關(guān)鍵詞共現(xiàn)次數(shù)的統(tǒng)計計算建立主題間的關(guān)聯(lián),以此來發(fā)現(xiàn)當(dāng)前和潛在的研究熱點;同樣,通過對機構(gòu)、學(xué)科和期刊之間的關(guān)聯(lián)研究,可以發(fā)現(xiàn)機構(gòu)之間的合作情況,學(xué)科之間的交叉研究情況和期刊之間緊密關(guān)系。另外一類是不同類知識對象之間的關(guān)聯(lián),包括:作者與主題的關(guān)聯(lián),作者與機構(gòu)之間的關(guān)聯(lián),基金與主題的關(guān)聯(lián),基金與期刊的關(guān)聯(lián),期刊與主題的關(guān)聯(lián),期刊與學(xué)科之間的關(guān)聯(lián),主題與學(xué)科的關(guān)聯(lián)(限于圖示的清晰直觀,部分不同類知識對象之間的關(guān)聯(lián)并未在圖2中顯示)。通過建立以上不同類知識對象之間的關(guān)聯(lián)關(guān)系,可以獲得一些有價值的結(jié)論,比如:通過主題和作者的關(guān)聯(lián)關(guān)系,關(guān)注領(lǐng)域?qū)<宜芯康膬?nèi)容,可以了解該領(lǐng)域的研究前沿,同樣,建立期刊與學(xué)科之間的關(guān)聯(lián),可以發(fā)現(xiàn)期刊特別是綜合性期刊相對青睞哪個學(xué)科的文章,可以用于指導(dǎo)學(xué)者的投稿。機構(gòu)與學(xué)科以及其他不同類之間的關(guān)聯(lián)并無太多實際意義,無需建立。
設(shè)G為知識元集合,它是所有知識對象實例的集合,例如:蘇新寧作者,知識地圖主題,大學(xué)圖書館學(xué)報等都是它的元素。定義三元組k=<g1,g2,d>作為CSSCI知識表示方式,其中,g1,g2∈G,d為g1與g2的關(guān)聯(lián)度,它通過統(tǒng)計計算得到,用于衡量g1,g2之間的緊密關(guān)系。以作者間的關(guān)聯(lián)度計算為例,作者間的關(guān)聯(lián)關(guān)系,主要通過合作、主題共現(xiàn)、互引和共被引來體現(xiàn),設(shè)定作者間合作的權(quán)值為0.4,非合作主題共現(xiàn)權(quán)值為0.3,互引權(quán)值為0.2,共被引權(quán)值為0.1,則d=0.4*合作的文章數(shù)+0.3*主題共現(xiàn)次數(shù)+0.2*互引次數(shù)+0.1*共被引次數(shù)。根據(jù)知識對象關(guān)聯(lián)的不同情況,分別計算出所有知識對象知識元間的關(guān)聯(lián)度,形成其知識元的三元組表示,其中作者與機構(gòu)之間的關(guān)聯(lián)較為簡單,若存在屬于或擁有關(guān)系則為1,否則為0。
定義知識表示表,將每一個知識對象間的關(guān)聯(lián)關(guān)系存儲到一個知識表示表中,共計12個知識表示表。以作者與主題關(guān)聯(lián)的知識表示表為例,Def(三元組ID(字符型),作者知識元 ID(字符型),主題知識元 ID(字符型),關(guān)聯(lián)度(數(shù)值型)),其中ID為主鍵,用于唯一定位該三元組表示。同時為每一個知識對象建立一個知識鏈接表,共計6個表。以作者知識鏈接表為例,Def(作者知識元ID(字符型),作者知識元名稱(字符型),知識所屬文獻(xiàn) ID(字符型))。CSSCI數(shù)據(jù)庫中一個文獻(xiàn)作為一條記錄文獻(xiàn)ID是其主鍵。知識存儲與知識鏈接如圖3所示。知識表示表和知識鏈接表位于知識表示層的知識庫中,文獻(xiàn)信信表位于信息資源層的數(shù)據(jù)庫中。知識表示表用于存儲知識對象間的關(guān)聯(lián)關(guān)系,地圖展示層通過檢索動態(tài)檢索知識表示表動態(tài)生成知識地圖;為提高動態(tài)生成的效率,也可以將之前生成的知識地圖進(jìn)行保存以供下一次使用。知識鏈接表用于將抽取的知識與文獻(xiàn)信息源相關(guān)聯(lián),以實現(xiàn)通過知識地圖能夠獲取具體資源信息的目的。
圖3 知識存儲及知識鏈接示意圖
當(dāng)前知識地圖的研究主要關(guān)注的是理論層面的相關(guān)問題包括概念、分類、功能等和具體領(lǐng)域的構(gòu)建、應(yīng)用和展示,對于知識地圖的知識組織層面缺乏系統(tǒng)、深入的闡述。本文在深入分析當(dāng)前知識地圖研究的基礎(chǔ)上,概括了當(dāng)前知識地圖研究的特點和存在的不足,進(jìn)而提出了由信息資源層、知識表示層和地圖展示層構(gòu)成的基于知識地圖知識組織的概念模型。并以該模型為指導(dǎo),以CSSCI學(xué)術(shù)資源為例,闡述了如何通過知識抽取、知識關(guān)聯(lián)、知識表示和知識存儲來實現(xiàn)基于知識地圖的知識組織。
[1]司莉,陳歡歡.國內(nèi)外知識地圖研究進(jìn)展[J].圖書館雜志.2008,(8):13-17.
[2]唐欽能,高峰,王金平.知識地圖相關(guān)概念辨析及其研究進(jìn)展[J].情報理論與實踐.2011,(1):121-125.
[3]葉六奇,石晶.知識地圖的構(gòu)建方法論研究[J].圖書情報工作.2012,(10):30-34.
[4]王昊,楊建林.基于本體的CSSCI學(xué)術(shù)知識地圖構(gòu)建研究[J].情報理論與實踐.2009,(12):106-111.
[5]劉彤,時艷琴.基于社會網(wǎng)絡(luò)分析的專家知識地圖應(yīng)用研究[J].情報理論與實踐.2010,(3):68-71.
[6]吳才喚.社會網(wǎng)絡(luò)分析在隱性知識地圖構(gòu)建中的應(yīng)用[J].圖書館.2010,(1):48-51.
[7]吳才喚.知識地圖研究進(jìn)展:從顯性知識地圖到隱性知識地圖[J].圖書情報知識.2012,(5):94-100.
[8]趙捧未,馮娟,竇永香.語義對等網(wǎng)環(huán)境下基于大眾標(biāo)注的社區(qū)知識地圖構(gòu)建研究[J].圖書情報工作.2013,(5):129-133.
[9]蘇海,蔣祖華,伍宏偉.面向產(chǎn)品開發(fā)的知識地圖構(gòu)建[J].上海交通大學(xué)學(xué)報.2005,(12):110-115.
[10]張梅,段建勇,徐驥超.基于網(wǎng)絡(luò)日志的知識地圖構(gòu)建與應(yīng)用[J].圖書情報工作.2012,(18):117-121.
[11]梁勇,章成志,王昊.基于CSSCI的期刊知識地圖的構(gòu)建[J].現(xiàn)代圖書情報技術(shù).2008,(2):58-63.
[12]胡元蛟,王昊.面向CSSCI的學(xué)者知識地圖構(gòu)建與分析[J].現(xiàn)代圖書情報技術(shù).2011(3):38-44.