摘 要 運用關(guān)鍵詞分析原理,對1994—1996年《圖書情報工作》論文關(guān)鍵詞的特征進行統(tǒng)計分析,并著重探討關(guān)鍵詞的概念及其分布。
關(guān)鍵詞 關(guān)鍵詞分析 文獻計量學(xué)
關(guān)鍵詞分析(keywordanalysis)是文獻計量學(xué)的重要組成部分。通過對關(guān)鍵詞的分析,研究文獻的內(nèi)在規(guī)律,對期刊、人才及科研成果進行科學(xué)評價,揭示學(xué)科特點、結(jié)構(gòu)及內(nèi)在相關(guān)性;反映科研的研究熱點和發(fā)展動向,對情報學(xué)、科學(xué)學(xué)等諸多領(lǐng)域的研究有至關(guān)重要的作用。1982年日本學(xué)者曾對中文經(jīng)典著作中的關(guān)鍵詞應(yīng)用聚類分析方法進行了研究,從而查明了全文的主題結(jié)構(gòu)。1991年又用內(nèi)容詞分析和引文共引聚類分析相結(jié)合的方法對生物化學(xué)等領(lǐng)域內(nèi)重要文獻進行了研究。
一、關(guān)鍵詞分析的原理
隨著科學(xué)的發(fā)展,科學(xué)的交叉和滲透越來越明顯。科技文獻中用作關(guān)鍵詞的專業(yè)術(shù)語和詞匯越來越多。文獻關(guān)鍵詞的變化可以顯示科學(xué)發(fā)展、交叉、滲透和興衰的趨勢。通過對關(guān)鍵詞的分析,可以發(fā)現(xiàn)科學(xué)研究的熱點和發(fā)展動向。其理論依據(jù)是:①科學(xué)研究的熱點是由一系列內(nèi)容密切相關(guān)的研究課題和概念組成的,這些熱點是眾多著者共同密切關(guān)注的對象。②熱衷于某一科學(xué)熱點研究的著者對于同一課題和概念,所使用的詞匯基本趨于一致。③從事同一研究課題的不同著者的論文因使用的關(guān)鍵詞相偶合會形成一個小的集合,從而形成以某專業(yè)為核心的一個個程度不同的著者群或文獻群。著者之間或許互不相識,但他們之間卻存在潛在的聯(lián)系。④由于論文是關(guān)鍵詞的攜帶者,又能被引用作參考文獻,因而關(guān)鍵詞分析與引文分析的結(jié)果應(yīng)基本一致。
二、論文關(guān)鍵詞特征
論文關(guān)鍵詞特征主要包括:論文關(guān)鍵詞的概念及關(guān)鍵詞的數(shù)量特征;論文關(guān)鍵詞之間偶合關(guān)系的特征。此外,還有關(guān)鍵詞之間的搭配關(guān)系特征。限于篇幅,對此暫不論及,只就概念及其數(shù)量分布進行分析和研究。
(1)關(guān)鍵詞概念及其數(shù)量分布關(guān)鍵詞是指那些出現(xiàn)在文獻的篇名、摘要或正文中,對表征文獻主題內(nèi)容有實際意義的語詞,亦即對揭示和描述文獻主題內(nèi)容來說是最重要的并可作為檢索入口的那些語詞,是論文主要內(nèi)容的概括。經(jīng)過統(tǒng)計,1994—1996年《工作》中共發(fā)表論文297篇,有關(guān)鍵詞的論文290篇,共設(shè)關(guān)鍵詞851個,每篇論文平均關(guān)鍵詞為2.9個。
從篇名抽取關(guān)鍵詞作為檢索入口,就可檢索到全部論文的61.7%;研究篇名關(guān)鍵詞、摘要關(guān)鍵詞以及正文關(guān)鍵詞對情報檢索、咨詢都是很有用處的。
(2)不同數(shù)目關(guān)鍵詞的論文及其詞頻分布如上所述,關(guān)鍵詞是為文獻標(biāo)引工作從篇名、摘要、正文中選取出來的用以表示全文主題內(nèi)容、信息款目的語詞。一般要求每篇論文選取3—8個詞作為關(guān)鍵詞。
雖然關(guān)鍵詞數(shù)不能說明論文水平的高低,但可以反映論文規(guī)范化程度,也即《工作》的關(guān)鍵詞規(guī)范化程度越來越高。對少數(shù)論文關(guān)鍵詞數(shù)目偏低的現(xiàn)象,有待進一步規(guī)范。
三、關(guān)鍵詞偶的概念及其分布
(1)關(guān)鍵詞偶的概念及其相關(guān)特性1963年凱斯勒提出了文獻偶合的思想。所謂文獻偶合,是指兩篇論文共同引用了一篇或多篇受引論文,人們稱這兩篇論文發(fā)生了偶合關(guān)系。但在科學(xué)論文標(biāo)引關(guān)鍵詞時,我們經(jīng)常會看到不同論文的作者不約而同地引用了一個或數(shù)個完全相同的關(guān)鍵詞。如把引文偶合的思想普及于關(guān)鍵詞引用,那么可以認(rèn)為:兩篇論文共同引用了一個或數(shù)個完全相同的關(guān)鍵詞,則這兩篇論文便發(fā)生了偶合關(guān)系。我們不妨把這種偶合關(guān)系叫做關(guān)鍵詞偶。這個“偶”無形中把離散的論文著者聯(lián)系起來,形成以某專業(yè)為核心的一個個程度不同的著者群和論文群。如果引用了一個共同的關(guān)鍵詞,關(guān)鍵詞偶為1,引用了2個共同的關(guān)鍵詞,關(guān)鍵詞偶則為2……如果共同受引的關(guān)鍵詞數(shù)目越多,則施引論文的關(guān)鍵詞偶越大。關(guān)鍵詞偶的數(shù)量決定論文相關(guān)強度。關(guān)鍵詞偶像一條條無形的鏈把有關(guān)的著者鏈引成一個個著者群;把相關(guān)文獻鏈引成一個有機的論文群體。
(2)關(guān)鍵詞偶的分布經(jīng)統(tǒng)計:1994—1996年,《工作》中論文關(guān)鍵詞偶最多的只有3個。統(tǒng)計中看到,關(guān)鍵詞偶數(shù)相同,但不同概念的關(guān)鍵詞偶的關(guān)聯(lián)程度是不同的。
我們可以依據(jù)關(guān)鍵詞偶的數(shù)值來判定某些著者、文獻、期刊乃至學(xué)科的親疏程度,可以分析其主體結(jié)構(gòu),對文獻或著者乃至學(xué)科進行計量分析,對充實文獻計量學(xué)理論有著積極的作用。
四、結(jié)語
本文介紹的關(guān)鍵詞分析方法是國內(nèi)最新成果,是引文分析和情報檢索科學(xué)化、定量化的深化,在研究文獻主題方面具有發(fā)展前景,是文獻計量學(xué)走向定量化、精確化,宏觀和微觀相結(jié)合的突破點。
但是,任何一種分析方法都不可能沒有缺點。關(guān)鍵詞的統(tǒng)計分析也一樣,其統(tǒng)計分析的精確性往往受到著者標(biāo)引關(guān)鍵詞的人為影響,不同的標(biāo)引方法會產(chǎn)生不同的分析效果。只要能有所規(guī)范,這種影響會降低到最低限度。
參考文獻:
[1]張琪玉.情報檢索語言武漢:武漢大學(xué)出版社,1985
[2]羅式勝.篇名關(guān)鍵詞鏈特征的統(tǒng)計分析及應(yīng)用中國