"/>
朱云霞 蘇新寧
(1.南京大學(xué)信息管理學(xué)院 江蘇南京 210093)
(2.南京郵電大學(xué)計(jì)算機(jī)學(xué)院 江蘇南京 210023)
文獻(xiàn)通過引用建立關(guān)聯(lián),這種關(guān)聯(lián)蘊(yùn)含著豐富的知識(shí),對(duì)引用關(guān)系進(jìn)行分析可以揭示知識(shí)的關(guān)聯(lián),幫助發(fā)現(xiàn)隱藏的知識(shí)與科學(xué)規(guī)律。信息技術(shù)的發(fā)展推動(dòng)了引文數(shù)據(jù)的開發(fā)利用,早從20世紀(jì)60年代開始,就研制出了以SCI為代表的一系列引文索引系統(tǒng)。當(dāng)前人們對(duì)知識(shí)服務(wù)的需求不斷提升,引文索引已不再是簡(jiǎn)單的檢索工具,人們希望能從中獲取更多的知識(shí)。如何借助引文索引實(shí)現(xiàn)知識(shí)服務(wù)?如何從引文索引中發(fā)現(xiàn)科學(xué)研究規(guī)律和和潛在學(xué)術(shù)價(jià)值?這就需要我們對(duì)引文索引結(jié)構(gòu)與組織進(jìn)行深入探討,使之充分體現(xiàn)引文索引價(jià)值,滿足知識(shí)服務(wù)對(duì)引文索引的要求。
文獻(xiàn)間的引證關(guān)系始于19世紀(jì)西方科學(xué)界形成的嚴(yán)格科學(xué)傳統(tǒng),引文索引正是利用這種引證關(guān)系創(chuàng)建而成。國(guó)外最早出現(xiàn)的是1961年計(jì)算機(jī)編制的《遺傳學(xué)引文索引》,其后在尤金·加菲爾德的帶領(lǐng)下,先后誕生了SCI、SSCI、A&HCI等一批優(yōu)秀的引文索引。國(guó)內(nèi)對(duì)引文索引的研究始于80年代末期,陸續(xù)誕生了CSCD、CSTPC、CSSCI等一批引文索引系統(tǒng)。郭麗芳、王婧對(duì)中外引文索引的功能進(jìn)行了比較研究。從大量文獻(xiàn)可以看到,國(guó)內(nèi)對(duì)于引用關(guān)系的研究多集中于引文數(shù)據(jù)的分析利用,而對(duì)于引文索引及其數(shù)據(jù)組織關(guān)系的研究則鳳毛麟角。南京大學(xué)蘇新寧教授撰寫多篇文章詳細(xì)介紹了CSSCI的數(shù)據(jù)組織結(jié)構(gòu)與應(yīng)用價(jià)值,為國(guó)內(nèi)引文索引的設(shè)計(jì)與研究工作奠定了良好的基礎(chǔ)。在此基礎(chǔ)之上,也陸續(xù)產(chǎn)生了一些針對(duì)專業(yè)領(lǐng)域的引文索引系統(tǒng)。
傳統(tǒng)的引文索引以文獻(xiàn)為單位,強(qiáng)調(diào)的是文獻(xiàn)的檢索,對(duì)于文獻(xiàn)內(nèi)部蘊(yùn)含的知識(shí)以及知識(shí)間的關(guān)聯(lián)不能全面、深刻的進(jìn)行反映,從而不能滿足廣大用戶的知識(shí)獲取需求。本文以知識(shí)服務(wù)為視角,闡述了新型引文索引的構(gòu)建思路,并在此基礎(chǔ)上對(duì)面向知識(shí)服務(wù)的引文索引的架構(gòu)設(shè)計(jì)、數(shù)據(jù)庫(kù)結(jié)構(gòu)以及索引編碼設(shè)計(jì)進(jìn)行了詳細(xì)的介紹。
文獻(xiàn)之間的引用本質(zhì)上是知識(shí)間的關(guān)聯(lián),這些關(guān)聯(lián)知識(shí)也正是提供知識(shí)服務(wù)的前提與基礎(chǔ)。引文索引是一種典型的關(guān)系類知識(shí)工具,在文獻(xiàn)引用過程中,各類實(shí)體間的關(guān)聯(lián)是廣泛而復(fù)雜的。知識(shí)服務(wù)是一種用戶目標(biāo)驅(qū)動(dòng)的服務(wù),是面向知識(shí)內(nèi)容、面向解決方案的服務(wù),貫穿于用戶進(jìn)行知識(shí)析取、集成、創(chuàng)新全過程的服務(wù),因此引文索引的數(shù)據(jù)組織也應(yīng)當(dāng)以科學(xué)研究的需要、學(xué)者的需求為目標(biāo)。
科學(xué)、有效的數(shù)據(jù)組織是提供知識(shí)服務(wù)的有利保證,知識(shí)服務(wù)是數(shù)據(jù)組織的最終目的。為了更深刻的理解引文索引功效,發(fā)揮引文索引在知識(shí)服務(wù)中的重要作用,我們歸納了引文索引能提供的知識(shí)服務(wù)類型(見表1)。
表1 引文索引知識(shí)服務(wù)類型及應(yīng)用說明
傳統(tǒng)的引文索引以檢索型服務(wù)為主,以文獻(xiàn)作為信息傳遞單元。雖然大多索引都具有分類統(tǒng)計(jì)功能,也提供了較多的檢索途徑,但知識(shí)服務(wù)功能相對(duì)較弱,對(duì)于更宏觀、更全面的分析、評(píng)價(jià)和預(yù)測(cè)功能則卻鮮見。
根據(jù)上述五種知識(shí)服務(wù)類型,我們按照知識(shí)需求的層次從低到高進(jìn)行劃分:檢索統(tǒng)計(jì)型提供最低級(jí)的知識(shí)服務(wù),其次是特征分析型和資源評(píng)價(jià)型,知識(shí)發(fā)現(xiàn)型和學(xué)術(shù)預(yù)測(cè)型是最高層次的知識(shí)服務(wù)類型。不同類型的知識(shí)服務(wù)對(duì)引文索引的設(shè)計(jì)要求也不同,層次高的知識(shí)服務(wù)需要有更大規(guī)模的數(shù)據(jù)和更先進(jìn)的分析技術(shù)作為支撐,同時(shí)也希望基礎(chǔ)的數(shù)據(jù)組織架構(gòu)能夠表達(dá)實(shí)體間更多的關(guān)聯(lián),為知識(shí)服務(wù)提供更好的數(shù)據(jù)基礎(chǔ)。根據(jù)對(duì)不同類型知識(shí)服務(wù)的需求分析,我們對(duì)新型引文索引系統(tǒng)的設(shè)計(jì)目標(biāo)總結(jié)為:①結(jié)構(gòu)科學(xué)合理,發(fā)揮各數(shù)據(jù)屬性功用,增加檢索途徑;②科學(xué)組織數(shù)據(jù),呈現(xiàn)科學(xué)特征、規(guī)律,為數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)打下基礎(chǔ);③實(shí)現(xiàn)數(shù)據(jù)代碼化,為科學(xué)地、多角度地統(tǒng)計(jì)分析提供精準(zhǔn)數(shù)據(jù);④注重?cái)?shù)據(jù)間的關(guān)聯(lián),為展現(xiàn)對(duì)象間的多重關(guān)聯(lián)提供途徑和實(shí)現(xiàn)手段;⑤數(shù)據(jù)的組織能夠易于系統(tǒng)功能的擴(kuò)展。
為達(dá)到上述系統(tǒng)目標(biāo),按照數(shù)據(jù)工作流程,我們將整個(gè)引文索引系統(tǒng)組織分為五大層次,依次為基本業(yè)務(wù)層、基礎(chǔ)數(shù)據(jù)層、數(shù)據(jù)模式層、知識(shí)服務(wù)層和用戶層(見圖1)。
圖1 知識(shí)服務(wù)引文索引系統(tǒng)模型
基本業(yè)務(wù)層的主要工作是相關(guān)數(shù)據(jù)的采集。包括:資源的選定(如期刊引文索引中的來源期刊的選定),對(duì)采集的數(shù)據(jù)輸入、整理、清洗、標(biāo)引和分類工作等。
基礎(chǔ)數(shù)據(jù)層是引文索引的實(shí)體部分,主要提供文獻(xiàn)檢索和一般性知識(shí)查詢服務(wù)。這一層重點(diǎn)關(guān)注數(shù)據(jù)庫(kù)的架構(gòu)、細(xì)節(jié)化的庫(kù)結(jié)構(gòu)設(shè)計(jì)以及元數(shù)據(jù)的表達(dá)等,它是整個(gè)索引系統(tǒng)提升知識(shí)服務(wù)的基礎(chǔ)數(shù)據(jù)來源,也是一般性統(tǒng)計(jì)分析的重要基礎(chǔ)。
在數(shù)據(jù)模式層中,主要建立數(shù)據(jù)中各類關(guān)聯(lián),為知識(shí)服務(wù)奠定基礎(chǔ)。該層的數(shù)據(jù)組織主要依據(jù)用戶需求,建立面向主題域的知識(shí)倉(cāng)庫(kù)。知識(shí)倉(cāng)庫(kù)的數(shù)據(jù)來自于基礎(chǔ)數(shù)據(jù)庫(kù),其數(shù)據(jù)關(guān)聯(lián)來自于用戶需求和科研領(lǐng)域的需要,并能夠充分體現(xiàn)對(duì)象間的多維關(guān)聯(lián)。
知識(shí)服務(wù)層由是完成知識(shí)服務(wù)功能的系統(tǒng)組成,它根據(jù)用戶需求,并對(duì)基礎(chǔ)數(shù)據(jù)層和數(shù)據(jù)模式層提供的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析、挖掘等工作,并提供用戶知識(shí)服務(wù)。在這一層面,要求功能模塊可以根據(jù)需要擴(kuò)展,系統(tǒng)功能的開發(fā)可以完全獨(dú)立于數(shù)據(jù)庫(kù)的物理存儲(chǔ)結(jié)構(gòu),提升系統(tǒng)的邏輯獨(dú)立性。
用戶層的作用是對(duì)用戶的信息需求進(jìn)行分析,將用戶的需求分解成對(duì)應(yīng)的知識(shí)服務(wù)功能模塊,由知識(shí)服務(wù)層啟動(dòng)相關(guān)功能模塊為用戶提供知識(shí)服務(wù)。
上述分析可以看到,引文索引必須以滿足用戶的需求為目標(biāo),以更深入的分析和輔助決策功能為特色,以良好的數(shù)據(jù)組織和架構(gòu)設(shè)計(jì)為基礎(chǔ),以信息知識(shí)化、方法科學(xué)化、分析智能化為核心動(dòng)力,是知識(shí)服務(wù)又一新型載體。
基礎(chǔ)數(shù)據(jù)的組織是整個(gè)系統(tǒng)的基礎(chǔ),它直接關(guān)系到索引系統(tǒng)的執(zhí)行效率和系統(tǒng)的穩(wěn)定性。我們將基礎(chǔ)數(shù)據(jù)分為9個(gè)組成部分,分別是:來源文獻(xiàn)庫(kù)、被引文獻(xiàn)庫(kù)、來源作者信息庫(kù)、期刊目錄庫(kù)、期刊沿革庫(kù)、機(jī)構(gòu)信息庫(kù)、機(jī)構(gòu)變化庫(kù)、關(guān)鍵詞索引庫(kù)、公共字典編碼庫(kù)(見圖2)。
圖2 基礎(chǔ)數(shù)據(jù)組織架構(gòu)圖
在引文索引系統(tǒng)的開發(fā)中,數(shù)據(jù)庫(kù)設(shè)計(jì)應(yīng)遵循必要的數(shù)據(jù)庫(kù)范式理論,以減少冗余、保證數(shù)據(jù)的完整性與正確性,如此設(shè)計(jì)的引文索引組織架構(gòu)特點(diǎn)在于:
(1)提供更多的檢索途徑。將來源文獻(xiàn)與被引文獻(xiàn)分不同的庫(kù)存放,用戶既可以從來源文獻(xiàn)角度追蹤其被引文獻(xiàn),也可以從被引文獻(xiàn)角度回溯其來源文獻(xiàn),提高了服務(wù)的靈活性。
(2)減少數(shù)據(jù)的冗余。由于一篇論文往往有多個(gè)作者,一個(gè)作者又常常會(huì)標(biāo)注多個(gè)機(jī)構(gòu),為了節(jié)約存儲(chǔ)空間,減少數(shù)據(jù)冗余,在來源文獻(xiàn)數(shù)據(jù)庫(kù)中只描述文獻(xiàn)信息,對(duì)作者及其機(jī)構(gòu)信息單獨(dú)建立作者信息庫(kù)。
(3)將機(jī)構(gòu)、期刊名稱進(jìn)行統(tǒng)一。改革開放以來,特別是近十幾年來,我國(guó)高校的機(jī)構(gòu)名稱發(fā)生了很大變化,另外很多地區(qū)的高校進(jìn)行了合并,一些原有機(jī)構(gòu)已不復(fù)存在,這對(duì)以機(jī)構(gòu)名稱為單位的統(tǒng)計(jì)工作造成了很大影響,因此特別增加了機(jī)構(gòu)變化庫(kù),詳細(xì)記錄各機(jī)構(gòu)名稱的變化情況。同樣的情況,對(duì)于期刊的歷史變遷則專門建立了期刊沿革庫(kù),以記錄期刊名稱變化的情況。
(4)編碼知識(shí)化。在設(shè)計(jì)過程中專門設(shè)置公共字典編碼庫(kù),用于存放各項(xiàng)類型的編碼,如地區(qū)編碼、機(jī)構(gòu)類型編碼、引文類型編碼等,公共字典編碼庫(kù)作為代碼化的知識(shí)工具對(duì)各數(shù)據(jù)庫(kù)數(shù)據(jù)起到統(tǒng)一、規(guī)范和關(guān)聯(lián)的作用。
(5)提供關(guān)鍵詞方面的檢索和分析。設(shè)計(jì)的關(guān)鍵詞索引能夠極大提高檢索的效率,同時(shí)對(duì)基于關(guān)鍵詞頻的學(xué)科熱點(diǎn)分析、關(guān)鍵詞共現(xiàn)分析等,均提供了良好的數(shù)據(jù)基礎(chǔ)。
(1)來源文獻(xiàn)庫(kù):用于記錄引文索引所收錄的每一篇文獻(xiàn)的詳細(xì)信息,字段包括:文獻(xiàn)號(hào)、中文篇名、英文篇名、中文關(guān)鍵詞、英文關(guān)鍵詞、期刊代號(hào)、語(yǔ)種代碼、發(fā)表年份、卷期、頁(yè)碼、各種分類號(hào)、文章類型、基金類型代碼、基金內(nèi)容、出版日期、參考文獻(xiàn)數(shù)量等。對(duì)于一些更為完善的引文索引,可能還會(huì)增加人工標(biāo)引的主題詞、中英文摘要等信息。
(2)來源作者信息庫(kù):用于記錄來源文獻(xiàn)每一位作者的基本信息,主要字段應(yīng)有:文獻(xiàn)號(hào)、作者序號(hào)、作者姓名、機(jī)構(gòu)名稱、機(jī)構(gòu)類型編碼、地區(qū)代碼、通訊地址、備注等。設(shè)置作者序號(hào),有利于進(jìn)行“第一作者”檢索,備注字段用于存儲(chǔ)作者的個(gè)人情況,比如性別、出生日期、研究方向等,這些信息都能夠?yàn)樯顚哟蔚闹R(shí)服務(wù)提供分析用數(shù)據(jù)。
(3)被引文獻(xiàn)庫(kù):用于記錄被引文獻(xiàn)的基本信息,字段包括:文獻(xiàn)號(hào)、引文序號(hào)、引文篇名、引文語(yǔ)種代碼、引文類型代碼、被引作者、引文期刊名稱、出版社、出版年、卷期、起止頁(yè)碼、被引形式、被引角色、備注等。
(4)期刊目錄庫(kù):用于記錄被收錄期刊的基本信息,該庫(kù)主要與來源文獻(xiàn)庫(kù)相關(guān)聯(lián)的關(guān)鍵字是期刊代號(hào)。主要字段有:期刊代號(hào)、期刊中文名稱、期刊英文名稱、ISSN號(hào)、國(guó)內(nèi)刊號(hào)、出版周期、出版單位、主辦單位、期刊分類、創(chuàng)刊時(shí)間、郵發(fā)代號(hào)、通信地址、郵政編碼、網(wǎng)址等。
(5)期刊沿革庫(kù):用于記錄期刊名稱變化的情況,主要用于統(tǒng)計(jì)中的數(shù)據(jù)歸并處理,也可用于期刊引用網(wǎng)絡(luò)構(gòu)建時(shí)的刊名統(tǒng)一化處理。該庫(kù)的主要字段有:期刊代號(hào)、期刊中文名稱、之前名稱、更名時(shí)間等。
(6)機(jī)構(gòu)信息庫(kù):用于記錄發(fā)文作者所在機(jī)構(gòu)的基本信息,主要與來源作者信息庫(kù)相關(guān)聯(lián),該庫(kù)的主要字段包括:機(jī)構(gòu)名稱、機(jī)構(gòu)英文名稱、機(jī)構(gòu)類型代碼、國(guó)家代碼、地區(qū)代碼、通訊地址、郵政編碼等。
(7)機(jī)構(gòu)變化庫(kù):用于記錄機(jī)構(gòu)的名稱變化信息,該庫(kù)的主要字段包括:機(jī)構(gòu)名稱、機(jī)構(gòu)類型代碼、變化原因、之前名稱、更名時(shí)間等。
(8)關(guān)鍵詞索引庫(kù):用于存儲(chǔ)所有收錄文獻(xiàn)的關(guān)鍵詞,并建立倒排索引,主要目的用于檢索和進(jìn)行關(guān)鍵詞統(tǒng)計(jì),通過對(duì)關(guān)鍵詞的統(tǒng)計(jì),可以分析學(xué)科研究熱點(diǎn)和發(fā)展趨勢(shì)。該庫(kù)的主要字段包括:關(guān)鍵詞、關(guān)鍵詞詞頻、來源文獻(xiàn)號(hào)集合等。
(9)公共字典編碼庫(kù):幾乎和引文索引中的所有庫(kù)都具有聯(lián)系,該庫(kù)包括7張編碼表(國(guó)家與地區(qū)編碼表、國(guó)內(nèi)地區(qū)編碼表、機(jī)構(gòu)類型編碼表、基金類型編碼表、語(yǔ)種類型編碼表、分類體系對(duì)照表和引用類型公共編碼表),是整個(gè)基礎(chǔ)數(shù)據(jù)架構(gòu)的連接和紐帶,同時(shí)其特有的編碼設(shè)計(jì)也為知識(shí)服務(wù)提供了有力的保證。
編碼是對(duì)數(shù)據(jù)進(jìn)行知識(shí)化和規(guī)范化的過程,編碼本質(zhì)上是對(duì)象的抽象表達(dá),優(yōu)秀的編碼規(guī)則能夠使系統(tǒng)發(fā)揮更大的效能。我們?cè)诠沧值鋷?kù)中設(shè)置了7種編碼,使各項(xiàng)數(shù)據(jù)之間建立起知識(shí)化的關(guān)聯(lián),下面介紹幾種主要的編碼。
(1)國(guó)內(nèi)地區(qū)編碼。地區(qū)編碼主要針對(duì)作者的機(jī)構(gòu)所在的地區(qū)信息進(jìn)行的編碼,編碼的目的是能夠以省或市為單位對(duì)國(guó)內(nèi)各地區(qū)進(jìn)行成果的統(tǒng)計(jì)和分析,甚至可以進(jìn)行同級(jí)別城市(如各省會(huì)城市)的科研成果數(shù)量比較。通過地區(qū)編碼,我們既可以很方便地以省為單位集中統(tǒng)計(jì),也可以很方便地對(duì)各省內(nèi)的城市進(jìn)行相關(guān)統(tǒng)計(jì)分析。更重要的是,地區(qū)編碼能夠提升地區(qū)統(tǒng)計(jì)的準(zhǔn)確性和效率。
由于目前各期刊對(duì)作者的地區(qū)標(biāo)引沒有統(tǒng)一的規(guī)定,文獻(xiàn)中作者的地區(qū)數(shù)據(jù)顯得非常凌亂,有的只標(biāo)注省份,有的標(biāo)注省和市,有的僅給出了城市名,有的甚至沒有地區(qū)標(biāo)注。另外,隨著中國(guó)城鎮(zhèn)化建設(shè)步伐的加快,地區(qū)名稱也常常出現(xiàn)變更的情況,因此編碼為解決這類地區(qū)名稱變化帶來的統(tǒng)計(jì)上的困難提供了有效途徑,它實(shí)際上起到了地區(qū)名稱規(guī)范化、統(tǒng)一化的作用。地區(qū)編碼需要注意地區(qū)間的從屬關(guān)系以及地區(qū)信息表示的粒度問題,既要能突出表現(xiàn)將省內(nèi)城市聚合成以省為單位的粗粒度,也要能夠表示省內(nèi)所轄城市為單位的細(xì)粒度。以江蘇省及其所轄市為例,既要能夠通過編碼從大量的文獻(xiàn)中提取出江蘇省作者發(fā)表的論文,也能夠統(tǒng)計(jì)江蘇省內(nèi)各地級(jí)市作者發(fā)表的論文。這樣的編碼設(shè)計(jì)可以依據(jù)不同用戶的需求,靈活的設(shè)置地區(qū)級(jí)別。此外,通過區(qū)縣級(jí)的編碼還能夠從細(xì)節(jié)上發(fā)現(xiàn)小區(qū)域的經(jīng)濟(jì)特色和優(yōu)勢(shì)產(chǎn)業(yè),為科技服務(wù)產(chǎn)業(yè)提供了良好的數(shù)據(jù)資源。
具體的地區(qū)編碼策略為:采用6位數(shù)字編碼方式,其中1-2位為省級(jí)行政區(qū)域編碼(包括省、直轄市、自治區(qū)和特別行政區(qū)),3-4位為市級(jí)編碼,省會(huì)城市的編碼統(tǒng)一為“01”,若是直轄市這兩位代表它們的區(qū)縣,第5-6位為區(qū)縣級(jí)編碼,包括下屬的縣級(jí)市、區(qū)和縣。依據(jù)這樣的編碼規(guī)則,北京的編碼為 “010000”,江蘇南京的編碼為“160100”,依次類推。
(2)機(jī)構(gòu)類型編碼。發(fā)文機(jī)構(gòu)數(shù)量龐大、類型眾多,對(duì)機(jī)構(gòu)編碼的過程,實(shí)質(zhì)上是對(duì)眾多發(fā)文機(jī)構(gòu)進(jìn)行歸類整序的過程,同時(shí)也是知識(shí)化的過程。經(jīng)過機(jī)構(gòu)編碼,引文索引可以根據(jù)用戶不同的知識(shí)需求,對(duì)編碼進(jìn)行組配查詢,來達(dá)到特殊要求的統(tǒng)計(jì)分析結(jié)果。例如欲分析對(duì)比全國(guó)“211”師范院校的科研實(shí)力,在沒有編碼前需要羅列這些學(xué)校,然后逐一檢索獲得相關(guān)數(shù)據(jù)。而科學(xué)的編碼,可使這類繁瑣的工作變得簡(jiǎn)單高效。
從科學(xué)分析角度針對(duì)科研機(jī)構(gòu)分類,我們可以將所有機(jī)構(gòu)劃分:高等院校、科研院所、黨政機(jī)關(guān)、文化團(tuán)體、企業(yè)、軍隊(duì)系統(tǒng)、非高校教育單位和其他8種類型,分別用數(shù)字1-7、9表示(我們?cè)谡麄€(gè)編碼系統(tǒng)中,對(duì)于其他類別統(tǒng)一都用數(shù)字9表示),對(duì)于每種類型再根據(jù)具體情況編制下級(jí)機(jī)構(gòu)類型代碼。
例如:對(duì)于高校,可以將其劃分為“985”工程院校、“211”院校、教育部直屬院校、中央其他部門所屬院校、地方本科院校、高職(專科)院校6種類別,分別用數(shù)字1-6表示;再下一級(jí)可以表示高校的專業(yè)特征,如:綜合性院校、師范類院校、醫(yī)學(xué)類院校、工科類院校、體育類院校、藝術(shù)類院校、軍事類院校、財(cái)經(jīng)類院校和其他專業(yè)院校9種類別,用數(shù)字1-9表示。當(dāng)然,也可以根據(jù)實(shí)際情況增加院校類別。有些高??赡軙?huì)對(duì)應(yīng)多個(gè)編碼,本編碼規(guī)定一律高靠,比如,南京大學(xué)可能對(duì)應(yīng)的機(jī)構(gòu)類型編碼有“111”“121”和“131”三種,本編碼系統(tǒng)只為南京大學(xué)取“111”作為編碼,可在進(jìn)行統(tǒng)計(jì)分析時(shí),通過一定算法來區(qū)分。在對(duì)某一類學(xué)校進(jìn)行統(tǒng)計(jì)對(duì)比時(shí),我們只要借助編碼就可以方便的進(jìn)行統(tǒng)計(jì)分析。例如,當(dāng)對(duì)全國(guó)財(cái)經(jīng)類院校進(jìn)行統(tǒng)計(jì)分析時(shí),我們就可以利用代碼“1x8”抽取相關(guān)數(shù)據(jù)完成統(tǒng)計(jì),其中“x”可以為任何數(shù)字,也可以是指定某幾個(gè)數(shù)字。
對(duì)于科研院所也可以劃分三級(jí)進(jìn)行編碼,如:國(guó)家所屬、省部所屬、專業(yè)學(xué)會(huì)所屬、其他等;然后再將其細(xì)分:自然科學(xué)類、工程科學(xué)類、醫(yī)藥學(xué)類、社會(huì)科學(xué)類、其他,等等。如,中國(guó)社會(huì)科學(xué)院為國(guó)家所屬的社會(huì)科學(xué)院科研機(jī)構(gòu);再如,江蘇省中醫(yī)藥研究院為江蘇省所屬的醫(yī)藥學(xué)類研究所。
其他類機(jī)構(gòu)都可以按縱橫兩個(gè)方面再劃分兩級(jí)編碼,縱是指行政上的上下級(jí)或所屬關(guān)系,如,國(guó)家級(jí)、省市級(jí)等等;橫是指機(jī)構(gòu)的類別或?qū)傩?,如高校按學(xué)科劃分等。所有機(jī)構(gòu)類型編碼均由三位數(shù)字組成。在實(shí)際的機(jī)構(gòu)編碼過程中,可以根據(jù)資源涉及的機(jī)構(gòu)狀況,根據(jù)實(shí)際需要來設(shè)置自己的機(jī)構(gòu)編碼。
(3)基金類型編碼。其他中研究院術(shù)情報(bào)所化論、轉(zhuǎn)化論與融合輪將用戶的需求分解成基金類型編碼用于為各類資助基金進(jìn)行編碼,以反映各類基金的科研成果狀況,進(jìn)而分析各類基金在科學(xué)研究中發(fā)揮的作用。目前,基金項(xiàng)目類型眾多,從縱向看,有國(guó)家級(jí)、部委級(jí)、省市級(jí)、以及各單位的資助項(xiàng)目;從橫向看,有攻關(guān)計(jì)劃、重大項(xiàng)目、重點(diǎn)項(xiàng)目、一般項(xiàng)目、青年項(xiàng)目、國(guó)際合作與交流項(xiàng)目等等,所以基金項(xiàng)目類型編碼同樣采用分層編碼的方式。如,縱向分別用1-3,9表示國(guó)家級(jí)、省部級(jí)、市級(jí)、其他;對(duì)國(guó)家級(jí)項(xiàng)目再劃分:國(guó)家自然科學(xué)基金項(xiàng)目、國(guó)家社會(huì)科學(xué)基金項(xiàng)目、國(guó)家863和973項(xiàng)目、國(guó)家其他項(xiàng)目計(jì)劃(如科技基礎(chǔ)條件平臺(tái)建設(shè)計(jì)劃、政策引導(dǎo)類科技計(jì)劃等),并分別用1-3,9表示;第三層再劃分重大項(xiàng)目、重點(diǎn)項(xiàng)目、專項(xiàng)項(xiàng)目、一般項(xiàng)目、青年項(xiàng)目、其他等。
同樣,部委級(jí)、省市級(jí)基金項(xiàng)目也可進(jìn)一步劃分為:自然科學(xué)基金項(xiàng)目、社會(huì)科學(xué)基金項(xiàng)目等;第三層再劃分重大項(xiàng)目、重點(diǎn)項(xiàng)目、專項(xiàng)項(xiàng)目、一般項(xiàng)目和青年項(xiàng)目等。通過分層編碼,將眾多繁雜的基金項(xiàng)目進(jìn)行了有序的歸類和標(biāo)引,為進(jìn)一步的分析比較以及深度的知識(shí)服務(wù)做好數(shù)據(jù)基礎(chǔ)。例如,通常情況下重大項(xiàng)目代表了各個(gè)研究領(lǐng)域的最前沿技術(shù)、最高的科研水準(zhǔn)或國(guó)家、地區(qū)急需解決的科研問題。
通過對(duì)基金項(xiàng)目的編碼,我們可以很方便的調(diào)出有關(guān)基金項(xiàng)目的成果。例如,若想通過引文索引查找或統(tǒng)計(jì)所有國(guó)家級(jí)重大項(xiàng)目的科研成果,只需要利用基金類型編碼“1x1”對(duì)引文索引中來源文獻(xiàn)進(jìn)行檢索即可以獲得。
任何知識(shí)的創(chuàng)新都是在前人研究基礎(chǔ)上進(jìn)一步努力的結(jié)果,沒有繼承就沒有創(chuàng)新。文獻(xiàn)間的引用填補(bǔ)了知識(shí)沿時(shí)間和空間的互補(bǔ)性需要。引文索引是對(duì)文獻(xiàn)信息資源進(jìn)行管理的有效工具之一,經(jīng)過50年的發(fā)展,引文索引對(duì)整個(gè)科學(xué)領(lǐng)域的研究產(chǎn)生了重要的影響,引文索引系統(tǒng)也逐步擺脫信息檢索的單一形象,在對(duì)期刊的評(píng)價(jià)、科研成果評(píng)價(jià)、人才的培養(yǎng)、學(xué)科的發(fā)展過程中都起到了關(guān)鍵的導(dǎo)向作用。
通過對(duì)國(guó)內(nèi)多個(gè)引文索引系統(tǒng)的使用分析可以看到,目前我國(guó)引文索引建設(shè)還存在著明顯的不足:一是功能簡(jiǎn)單,一般只提供檢索與簡(jiǎn)單的統(tǒng)計(jì)分析功能;二是數(shù)據(jù)來源不同,檢索的結(jié)果差距較大,各索引系統(tǒng)因開發(fā)單位不同,存在重復(fù)勞動(dòng)情況,沒有能夠形成類似于WOS的統(tǒng)一檢索平臺(tái);三是深層次的知識(shí)服務(wù)功能還非常稀缺,數(shù)據(jù)的統(tǒng)計(jì)分析都是以文獻(xiàn)為單位,沒有能夠深入具體引用的內(nèi)容部分,缺乏語(yǔ)義層面的分析。
有效的數(shù)據(jù)組織是進(jìn)行知識(shí)服務(wù)的前提,引用關(guān)系是文獻(xiàn)間最普遍最直接的聯(lián)系,我們的任務(wù)不僅僅是表示這種關(guān)聯(lián),更要能從引用中發(fā)現(xiàn)更多知識(shí),提供深層次的知識(shí)服務(wù)。數(shù)據(jù)的組織是知識(shí)服務(wù)的基礎(chǔ)與關(guān)鍵,引文索引的研究不僅僅是個(gè)別人、個(gè)別單位的事情,應(yīng)該是全社會(huì)集思廣益、不斷深入的過程,引文索引也不能是一個(gè)固定僵化的系統(tǒng),要能夠適應(yīng)社會(huì)的發(fā)展和人們知識(shí)需求的變化。
[1]馬智峰.參考文獻(xiàn)的引用及影響引用的因素分析[J].編輯學(xué)報(bào),2009,21(1):23-25.
[2]郭麗芳.中外五大引文索引系統(tǒng)比較分析[J].現(xiàn)代圖書情報(bào)技術(shù),2005,(1):36-39.
[3]王婧,華薇娜.國(guó)內(nèi)外文科引文索引數(shù)據(jù)庫(kù)檢索功能比較[J].新世紀(jì)圖書館,2011,(1):42-44,73.
[4]蘇新寧.中國(guó)社會(huì)科學(xué)引文索引設(shè)計(jì)[J].情報(bào)學(xué)報(bào),2000,19(4):290-295.
[5]蘇新寧.中文社會(huì)科學(xué)引文索引(CSSCI)的設(shè)計(jì)與應(yīng)用價(jià)值[J].中國(guó)圖書館學(xué)報(bào),2012,(38):95-102.
[6]紀(jì)蔚蔚.基于 Web引文索引數(shù)據(jù)庫(kù)建設(shè)方略[J].現(xiàn)代圖書情報(bào)技術(shù),2004,(12):45-50.
[7]陳建青等.中文生物醫(yī)學(xué)期刊引文數(shù)據(jù)庫(kù)(CMCI)的研制特色[J].現(xiàn)代圖書情報(bào)技術(shù),2005,(3):63-65.
[8]柴永紅.論信息服務(wù)與知識(shí)服務(wù)[J].情報(bào)雜志,2004,(4):74-75,78.