黃桂平 陳巧瑩 何斯娜 余舒紅 葉江彬 陳金萍
1.產(chǎn)生背景
知識(shí)圖譜的起源最早可追溯到文獻(xiàn)計(jì)量學(xué)和科學(xué)計(jì)量學(xué)的誕生時(shí)期。1938年Bernal制作了早期學(xué)科圖譜;1948年Ellingham手工繪制了圖表,形象地展示自然科學(xué)和技術(shù)分支學(xué)科間的關(guān)系。同年,Price用簡單的曲線可視化科學(xué)知識(shí)指數(shù)增長規(guī)律。到20世紀(jì)50年代,Garfield創(chuàng)制《科學(xué)引文索引》。并以編年體形式手工繪制引文網(wǎng)絡(luò)圖譜;隨后“文獻(xiàn)耦合”(兩篇文獻(xiàn)同引一篇或多篇相同的文獻(xiàn))、“科學(xué)引文網(wǎng)絡(luò)”、“同被引”(與本文同時(shí)被作為參考文獻(xiàn)引用的文獻(xiàn),與本文共同作為進(jìn)一步研究的基礎(chǔ))、“共詞”(指一定頻率共現(xiàn)于同一語篇中的詞)、“引文可視化”等相繼被提出,科學(xué)知識(shí)可視化成為專門領(lǐng)域。近年來,因?yàn)榫W(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展使得網(wǎng)絡(luò)信息呈爆炸式增長,造成大量信息冗余,資源重復(fù)率高,人們對(duì)知識(shí)與信息選擇更加困難,查找精確性和效率都有了很大的影響。為了解決上述問題并能可視化的展示知識(shí)及信息,科學(xué)知識(shí)圖譜應(yīng)運(yùn)而生[1]。
2.含義
知識(shí)圖譜(Mapping Knowledge Domain)也被稱為科學(xué)知識(shí)圖譜、知識(shí)域可視化或知識(shí)域映射地圖,旨在描述真實(shí)世界中存在的各種實(shí)體或概念,是可視化地描述人類隨時(shí)間擁有的知識(shí)資源及其載體,繪制、挖掘、分析和顯示科學(xué)技術(shù)知識(shí)以及它們之間的相互聯(lián)系,在組織內(nèi)創(chuàng)造知識(shí)共享的環(huán)境以促進(jìn)科學(xué)技術(shù)知識(shí)的合作和深入[2]。具體分為傳統(tǒng)科學(xué)計(jì)量圖譜、三維構(gòu)型圖譜、多維尺度圖譜、社會(huì)網(wǎng)絡(luò)分析圖譜、自組織映射圖譜、尋徑網(wǎng)絡(luò)分析圖譜等幾個(gè)種類。
3.原理
知識(shí)圖譜的基本原理是科學(xué)文獻(xiàn)、科學(xué)家、關(guān)鍵詞等分析單位的相似性分析及測(cè)度。根據(jù)不同的方法和技術(shù)可以繪制不同類型的科學(xué)知識(shí)圖譜。該方法首先,通過計(jì)算機(jī)和互聯(lián)網(wǎng)搜索引擎強(qiáng)大的自動(dòng)查詢功能,在極短的時(shí)間里面完成對(duì)海量信息的準(zhǔn)確查詢。其次,通過計(jì)算機(jī)對(duì)已查詢到的海量零散信息進(jìn)行文獻(xiàn)計(jì)量統(tǒng)計(jì)分析,不僅可以通過量化模型將其以科學(xué)的、可視化的形式直觀地呈現(xiàn)出來,而且還可以發(fā)現(xiàn)它們之間的深層次關(guān)系和趨勢(shì),為今后在該領(lǐng)域的研究提供更有力的客觀數(shù)據(jù)和科學(xué)支持。
4.特征
知識(shí)圖譜具備動(dòng)態(tài)性、空間性、知識(shí)依賴性、關(guān)聯(lián)性四方面的特征[3]:
第一,動(dòng)態(tài)性。這是知識(shí)圖譜區(qū)別于傳統(tǒng)知識(shí)地圖的本質(zhì)特征,它以靜態(tài)的圖譜中點(diǎn)與點(diǎn)以及連線的關(guān)系形式,揭示知識(shí)間隱含的動(dòng)態(tài)結(jié)構(gòu)變化信息。
第二,空間性。知識(shí)圖譜以二維或者三維圖形展示知識(shí)之間的空間結(jié)構(gòu),通過坐落空間位置和所占據(jù)領(lǐng)域大小來標(biāo)示知識(shí)所處戰(zhàn)略位置的重要程度。
第三,知識(shí)依賴性。知識(shí)圖譜與一般圖像的區(qū)別在于,一般圖像是對(duì)原材料進(jìn)行直接加工所生成,而知識(shí)圖譜是建立在對(duì)知識(shí)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)或者文本分析后,所構(gòu)建的客觀知識(shí)綜合體的基礎(chǔ)上的再次加工處理。知識(shí)圖譜一般無法直接從原始知識(shí)材料中加工產(chǎn)生,它依賴于對(duì)原材料的再次加工。
第四,關(guān)聯(lián)性。知識(shí)圖譜可以揭示各知識(shí)點(diǎn)之間的相互關(guān)系,點(diǎn)與點(diǎn)在圖譜中所處的距離遠(yuǎn)近表示它們間關(guān)系的親疏,點(diǎn)與點(diǎn)之間連線的粗細(xì)表示它們關(guān)系連接的力度大小。
5.繪制流程
知識(shí)圖譜繪制的基本繪制流程主要有數(shù)據(jù)的收集、處理與繪制以及圖譜解讀三個(gè)階段過程。
5.1數(shù)據(jù)的收集
確定并選取合適的數(shù)據(jù)源,對(duì)數(shù)據(jù)源進(jìn)行采集。(在進(jìn)行論文研究時(shí)主要可對(duì)CNKI、CSSCI、CSCD和萬方等文獻(xiàn)數(shù)據(jù)庫中抽取數(shù)據(jù)進(jìn)行分析研究。)
5.2處理與繪制
選取繪圖工具繪制知識(shí)圖譜,揭示選取數(shù)據(jù)之間的深層次關(guān)系,常見的知識(shí)圖譜應(yīng)用的軟件有Bibexcel、Pajek、CiteSpace、BICOMB和SPSS、HistCite等。
5.3圖譜解讀
對(duì)于繪制的結(jié)果的圖表進(jìn)行專業(yè)的解讀。
6.基本方法
知識(shí)圖譜的基本方法主要包括五種,分別是引文分析法、共被引分析法、多元統(tǒng)計(jì)分析法、詞頻分析法、社會(huì)網(wǎng)絡(luò)分析法。
6.1引文分析法
引文分析法(Citation Analysis)就是利用各種數(shù)學(xué)、統(tǒng)計(jì)學(xué)的方法,以及比較、歸納、抽象、概括等邏輯方法,對(duì)科學(xué)期刊、論文、著者等各種分析對(duì)象的引用和被引用現(xiàn)象進(jìn)行分析,以便揭示其數(shù)量特征和內(nèi)在規(guī)律,達(dá)到評(píng)價(jià)、預(yù)測(cè)科學(xué)發(fā)展趨勢(shì)的一種信息計(jì)量研究方法[4]。常見的引文分析技術(shù)主要包括文獻(xiàn)合配分析法、影響因子分析法和共被引用分析法。
6.2共被引分析法
共被引分析法的含義是一種定量的情報(bào)研究方法,它以具有一定學(xué)科代表性的一批文章(著者或期刊)為分析對(duì)象,利用聚類分析、多維標(biāo)度等多元統(tǒng)計(jì)分析方法,借助電子計(jì)算機(jī),把眾多的分析對(duì)象之間錯(cuò)綜復(fù)雜的共引網(wǎng)狀關(guān)系簡化為數(shù)目相對(duì)較少的若干類群之間的關(guān)系,并直觀地表示出來,使分析對(duì)象之間相互關(guān)系的格局清晰可辨,在此基礎(chǔ)上分析研究分析對(duì)象所代表的學(xué)科及文獻(xiàn)的結(jié)構(gòu)和特點(diǎn)[5]。主要分為共詞分析法、共作者分析法、共期刊分析法、共文獻(xiàn)分析法五種類型。
6.3多元統(tǒng)計(jì)分析方法
多元統(tǒng)計(jì)分析方法包括:聚類分析、主成分分析、因子分析和多維尺度分析。
6.3.1聚類分析法
聚類分析指在沒有先驗(yàn)知識(shí)的條件下,采用定量方法,根據(jù)事物本身所固有的特性的親疏程度從數(shù)據(jù)分析的角度自動(dòng)進(jìn)行歸類,對(duì)數(shù)據(jù)給出一個(gè)更準(zhǔn)確、細(xì)致的分類結(jié)果,是研究“物以類聚”的一種科學(xué)有效的方法。
6.3.2主成分析法
主成分分析也稱主分量分析,指把多個(gè)變量(指標(biāo))化為少數(shù)幾個(gè)綜合變量(綜合指標(biāo))的一種統(tǒng)計(jì)方法。它是一種降維方法,通過找出幾個(gè)綜合變量來代表原來眾多的變量,盡可能地反映原來所有變量的信息量,而且彼此之間互不相關(guān),從而達(dá)到簡化的目的[6]。
6.3.3因子分析法
因子分析是主成分分析的推廣,是采用降維方法,從研究原始變量相關(guān)矩陣內(nèi)部結(jié)構(gòu)出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多元統(tǒng)計(jì)分析方法[7]。
6.3.4多維尺度分析法
多維尺度分析又稱多維量表分析,它是將一組個(gè)體間的相異數(shù)據(jù)經(jīng)過MDS轉(zhuǎn)換成空間構(gòu)圖,且保留原始數(shù)據(jù)的相對(duì)關(guān)系。多維尺度分析依據(jù)需要分析對(duì)象的變量,把對(duì)象映射到一個(gè)特定的空間位置上,通過分析對(duì)象位置間的距離,可以揭示對(duì)象間的親疏關(guān)系。
6.4詞頻分析法
詞頻分析法是文獻(xiàn)計(jì)量方法中的定性分析法,通過分析某一研究領(lǐng)域文獻(xiàn)中的詞出現(xiàn)的頻次高低,可以確定該領(lǐng)域發(fā)展動(dòng)向和研究熱點(diǎn)發(fā)展動(dòng)向[8]。根據(jù)對(duì)象的不同分為:關(guān)鍵詞詞頻分析法、主題詞詞頻分析法、篇名詞頻分析法。
6.5社會(huì)網(wǎng)絡(luò)分析法
社會(huì)網(wǎng)絡(luò)分析又稱社會(huì)網(wǎng)或網(wǎng)絡(luò)分析,是對(duì)社會(huì)網(wǎng)絡(luò)中行為者之間的關(guān)系進(jìn)行量化研究的一種具體工具。也就是說,社會(huì)網(wǎng)絡(luò)分析是測(cè)量與調(diào)查社會(huì)系統(tǒng)中各部分(點(diǎn))的特征與相互間的關(guān)系(連接),將其用網(wǎng)絡(luò)的形式加以表示,進(jìn)而分析其關(guān)系的模式與特征的理論、方法和技術(shù)。社會(huì)網(wǎng)絡(luò)分析可以分為兩類:一是自我中心社會(huì)網(wǎng)分析,探討個(gè)體在網(wǎng)絡(luò)中的聯(lián)結(jié)與位置;二是整體社會(huì)網(wǎng)分析,探討的是網(wǎng)絡(luò)整體的構(gòu)成與形態(tài)[9]。
7.應(yīng)用
科學(xué)知識(shí)圖譜應(yīng)用范圍廣泛,在應(yīng)用上主要分為通用知識(shí)圖譜和行業(yè)知識(shí)圖譜。通用知識(shí)圖譜面向通用領(lǐng)域,以常識(shí)性知識(shí)為主,首先考慮結(jié)構(gòu)化的百科知識(shí),強(qiáng)調(diào)知識(shí)的廣度,使用者是普通用戶。而行業(yè)知識(shí)圖譜是面向某一特定領(lǐng)域,對(duì)基于行業(yè)的數(shù)據(jù)進(jìn)行建構(gòu),優(yōu)先考慮的是基于語義技術(shù)的一些行業(yè)的知識(shí)庫,強(qiáng)調(diào)的是知識(shí)的深度,它的潛在使用者是行業(yè)的人員。知識(shí)圖譜主要是基于數(shù)據(jù)及業(yè)務(wù)的關(guān)系分析,因?yàn)槭嵌鄬W(xué)科的交叉融合,科學(xué)知識(shí)圖譜能在諸多研究領(lǐng)域中得到應(yīng)用,在行業(yè)上其廣泛用于金融、醫(yī)療、教育、證券投資等領(lǐng)域。對(duì)于研究方面,樂飛紅等在2002對(duì)知識(shí)圖譜的有效作用作了部分總結(jié):搜索導(dǎo)航,利用提供知識(shí)檢索,提高知識(shí)的復(fù)用和防止知識(shí)的冗余,從而增強(qiáng)檢索和獲取效率;隱型知識(shí)的轉(zhuǎn)化,發(fā)現(xiàn)知識(shí)孤島并建立聯(lián)系,促進(jìn)知識(shí)共享;為知識(shí)評(píng)估提供基礎(chǔ);幫助學(xué)習(xí)者快速獲取所學(xué)知識(shí);提供學(xué)習(xí)知識(shí)的機(jī)會(huì);創(chuàng)造、評(píng)價(jià)知識(shí)資產(chǎn);建立對(duì)知識(shí)進(jìn)行組織和管理的基礎(chǔ)設(shè)施等。
參考文獻(xiàn)
[1]朱游娟,《初中數(shù)學(xué)問題的全知識(shí)圖譜設(shè)計(jì)與實(shí)現(xiàn)》碩士論文
[2]劉則淵、陳悅、侯海燕等著:《科學(xué)知識(shí)圖譜:方法與應(yīng)用》人民出版社2008年版,第5頁。
[3]陳祖香:《面向科學(xué)計(jì)量分析的知識(shí)圖譜構(gòu)建與應(yīng)用研究》,2010年南京理工大學(xué)碩士學(xué)位論文,第26頁
[4]邱均平:《信息計(jì)量學(xué)》,武漢大學(xué)出版社2007年版,第315頁
[5]趙黨志:《共引分析——研究學(xué)科及其文獻(xiàn)結(jié)構(gòu)和特點(diǎn)的一種有效方法》,《情報(bào)雜志》1993年第2期,第36—42頁
[6]唐啟義、馮明光:《實(shí)用統(tǒng)計(jì)分析及其DPS數(shù)據(jù)處理系統(tǒng)》,科學(xué)出版社2002年版,第333—372頁
[7]李健生:《“引文分析法”質(zhì)疑》,《圖書情報(bào)工作》1992年第5期,第41—45、57頁
[8]馬費(fèi)成、張勤:《國內(nèi)外知識(shí)管理研究熱點(diǎn)——基于詞頻的統(tǒng)計(jì)分析》,《情報(bào)學(xué)報(bào)》2006年第2期,第163—171
[9]李新蕊.主成分分析、因子分析、聚類分析的比較與應(yīng)用[J].山東教育學(xué)院學(xué)報(bào),2007(6):23—26
(作者單位:福建師范大學(xué)福清分校應(yīng)用心理學(xué)研究所)