頡 君
(煤炭信息研究院,北京市朝陽區(qū),100029)
★經(jīng)濟管理 ★
煤炭科技論文中關(guān)鍵詞標(biāo)引與檢索探討
頡 君
(煤炭信息研究院,北京市朝陽區(qū),100029)
闡述了關(guān)鍵詞及其作用和意義,并針對煤炭科技論文中關(guān)鍵詞標(biāo)引不合理的例子進(jìn)行了分析,敘述了關(guān)鍵詞標(biāo)引與信息資源檢索的關(guān)系以及科技論文關(guān)鍵詞標(biāo)引的方法。
科技論文 關(guān)鍵詞 標(biāo)引方法 文獻(xiàn)檢索 關(guān)系 G254.2
AbstractThe functions and meaningsof key words are described and examp lesof inadequate markings of key wo rds by coal technical papers are analyzed.The relationship in betw een the markings of key words and the searching of information resources and the ways of markings of key wo rds are depicted.
Key wordstechnical papers,key words,waysof marking,literature searching,relationship
所謂關(guān)鍵詞,是指那些從文獻(xiàn)的標(biāo)題、摘要、層次標(biāo)題和正文中選取的,對表達(dá)文獻(xiàn)主題內(nèi)容具有實質(zhì)意義的并可以作為檢索入口的詞語,是一種近似自由詞的自然語言。國家標(biāo)準(zhǔn)對于關(guān)鍵詞的描述為:“關(guān)鍵詞是為了文獻(xiàn)標(biāo)引工作從報告、論文中選取出來用以表示全文主題內(nèi)容信息款目的單詞或術(shù)語”。由此看來關(guān)鍵詞必為單詞或?qū)I(yè)術(shù)語,而且能高度概括和代表整個文獻(xiàn)的基本內(nèi)容,是文獻(xiàn)的靈魂。當(dāng)今世界每年科技論文發(fā)表數(shù)萬篇,類型繁多,出版分散,內(nèi)容交叉,相互滲透,隨著計算機技術(shù)的發(fā)展,刊載該論文的期刊進(jìn)入了各種各樣的數(shù)據(jù)庫,成為人們檢索的對象。論文中標(biāo)引的關(guān)鍵詞就成為重要的檢索標(biāo)識信息。由于關(guān)鍵詞是為了滿足文獻(xiàn)標(biāo)引或檢索工作的需要而從文獻(xiàn)中提煉出的詞語,所以關(guān)鍵詞選得是否恰當(dāng)、準(zhǔn)確,就關(guān)系到該文被檢索的利用率。所以那些不能揭示文獻(xiàn)核心內(nèi)容的詞語,就不能選作關(guān)鍵詞。
1.1 可以幫助人們理解文獻(xiàn)的主題,并獲得文獻(xiàn)的關(guān)鍵信息
關(guān)鍵詞能夠直觀地表述文獻(xiàn)的主題,并將文獻(xiàn)的重要信息點提供給讀者閱讀,讀者只要分析一下關(guān)鍵詞,就可對文獻(xiàn)的類別、主題內(nèi)容及可能提供的信息進(jìn)行判斷,從而了解該論文論述的主題,作出是否需要閱讀正文的判斷。
1.2 可以幫助人們進(jìn)行文獻(xiàn)檢索
關(guān)鍵詞是檢索文獻(xiàn)的入口之一。選擇何種詞語作為關(guān)鍵詞,實際上就是把文獻(xiàn)定位于某一特定的類別。選取和標(biāo)引關(guān)鍵詞,實際上就是做了文獻(xiàn)的歸類工作?,F(xiàn)在各種專業(yè)文獻(xiàn)庫相繼建立,在建設(shè)數(shù)據(jù)庫的過程中,數(shù)據(jù)文獻(xiàn)的處理是數(shù)據(jù)庫的主體內(nèi)容,這種處理主要是通過編寫程序和標(biāo)引來達(dá)到的,關(guān)鍵詞提供了檢索的途徑。因此,關(guān)鍵詞具有重要的檢索意義。
2.1 文獻(xiàn)主題內(nèi)容分析錯誤造成標(biāo)引錯誤
關(guān)鍵詞必須是在正確分析提煉出所標(biāo)文獻(xiàn)的主題內(nèi)容基礎(chǔ)上進(jìn)行,只有弄清其中心內(nèi)容,才可從中提煉出文獻(xiàn)主題來,不能只憑題目臆想其主題。否則造成文獻(xiàn)的誤檢,降低了檢索的查準(zhǔn)率。
例如:題名“關(guān)于槽型皮帶運輸能力計算公式中截面系數(shù)k的討論分析”,文章主要講了輸送機膠帶的運輸量的計算問題。
原關(guān)鍵詞標(biāo)為:輸送帶;斷面;系數(shù)k。
閱讀分析文章后,發(fā)現(xiàn)這里的“截面”系指槽型輸送帶物料堆積的截面,不是皮帶斷面,因此標(biāo)“輸送帶斷面”是錯標(biāo)。正確的標(biāo)引應(yīng)為:
帶式輸送機;輸送帶;槽型輸送帶;運輸能力;計算方法。
2.2 標(biāo)引的關(guān)鍵詞不能準(zhǔn)確反映主題內(nèi)容
關(guān)鍵詞的主要作用是通過這些詞的邏輯組合,揭示論文的主要內(nèi)容。但是許多論文在選用關(guān)鍵詞時沒有準(zhǔn)確把握關(guān)鍵詞的作用,選出的幾個關(guān)鍵詞并不能有效地提示論文主題內(nèi)容,因此無法判定該論文所闡述的主題內(nèi)容,造成讀者檢索時誤檢或漏檢。
例如:題名“淺談山西國有煤炭企業(yè)管理信息化”,文章闡明了信息化建設(shè)在煤炭企業(yè)安全生產(chǎn)管理、提高管理效率和提升企業(yè)的綜合競爭力等方面所起的作用。
原關(guān)鍵詞標(biāo)引為:煤炭;信息化建設(shè);解決實際問題;健康發(fā)展;統(tǒng)一規(guī)劃;實施對策。
上述標(biāo)引中,揭示主題內(nèi)容的詞“企業(yè)管理”沒有標(biāo)出,從選用的幾個關(guān)鍵詞中,無法判斷這是一篇描述信息化建設(shè)在煤炭企業(yè)管理中應(yīng)用的文稿,因此在檢索有關(guān)煤炭企業(yè)管理的文章中是無法檢索到該篇文章的。降低了文獻(xiàn)的檢索率。
正確的標(biāo)引應(yīng)為:煤炭企業(yè);企業(yè)管理;信息化建設(shè);管理效率。
2.3 標(biāo)引的關(guān)鍵詞概念大于或小于所標(biāo)文獻(xiàn)的主題內(nèi)容
標(biāo)引時選用的關(guān)鍵詞要與主題概念內(nèi)容相符,且是最專指、最恰當(dāng)?shù)脑~,不能以“大”代“小”或“小”代“大”。
例如:題名“淺議如何減少軌道電路故障”,文章介紹了如何減少露天礦煤炭運輸鐵路軌道電路故障。
原關(guān)鍵詞標(biāo)為:鐵路;電路;故障。
上述標(biāo)引中,首先主題內(nèi)容“露天礦煤炭運輸”這一詞沒有表達(dá)出來,其次“鐵路”一詞概念的范圍太大,應(yīng)選用“軌道運輸”這一專指詞。
正確的標(biāo)引應(yīng)為:露天礦運輸;煤炭運輸;軌道運輸;電路故障。
如讀者查找有關(guān)露天礦煤炭鐵路運輸軌道電路故障方面的文章即可查到,因此,提高了檢索的查準(zhǔn)率。
2.4 將研究對象的母體遺漏,造成關(guān)鍵詞漏標(biāo)
例如:題名“如何在有利的市場情況下做好煤炭銷售工作”,文章論述了在市場經(jīng)濟形勢下,煤炭銷售工作的重要性及煤炭營銷工作策略。
原關(guān)鍵詞標(biāo)為:市場細(xì)分;渠道管理;掌控資源;整合營銷。
在上述題名中很明顯最能反映文獻(xiàn)主題內(nèi)容的“煤炭銷售”一詞漏標(biāo),這樣在檢索有關(guān)煤炭銷售方面的文章時就不能檢索出此篇文章,使查閱者失去一些有價值的文獻(xiàn),而所選用的幾個詞均無法體現(xiàn)“煤炭銷售”這一主題內(nèi)容。
正確的標(biāo)引應(yīng)為:煤炭銷售;煤炭市場;營銷策略;市場細(xì)分;整合營銷。
2.5 把關(guān)鍵詞寫成短語
按照國家標(biāo)準(zhǔn)對關(guān)鍵詞的描述,選作關(guān)鍵詞的詞語,應(yīng)是單詞或術(shù)語,關(guān)鍵詞既要反映論文的主題內(nèi)容,也要具有專指性和檢索意義,不能為了強調(diào)全面反映主題內(nèi)容而把關(guān)鍵詞寫成詞組或短語。有的作者為了使每一個關(guān)鍵詞都盡可能準(zhǔn)確地表達(dá)論文某一確切的含義,將關(guān)鍵詞寫全、寫完整,進(jìn)而寫成一個短語。
還如上述題名為“淺談山西國有煤炭企業(yè)管理信息化”的一文中,關(guān)鍵詞“解決實際問題”一詞顯然不符合國家標(biāo)準(zhǔn)對關(guān)鍵詞的描述,已寫成了短語,故在選詞上屬于不正確。
2.6 將一些泛意詞、連詞選作關(guān)鍵詞
科技論文中大都有一些不具有學(xué)科性質(zhì)的通用詞,如研究、方法、分析、應(yīng)用、發(fā)展等,作為關(guān)鍵詞標(biāo)引出來,缺乏對論文主題內(nèi)容的專指性,也就失去使其在提示某一論文主題內(nèi)容的檢索作用,極大影響了論文的檢索效率。
例如:題名“提高我省煤炭外運能力的建議”,文章就陜西省運輸戰(zhàn)線存在的鐵路運輸緊張,形成煤炭積壓,而公路汽車運輸卻貨源緊張,無米下鍋的問題,提出了如何提高煤炭外運能力的建議。
原關(guān)鍵詞標(biāo)為:煤炭;能力;建議。
上述標(biāo)引像“能力”、“建議”這類通用詞如果讀者進(jìn)行檢索,將會把數(shù)據(jù)庫中包含的各學(xué)科文獻(xiàn)歸總為一類檢索出來,檢出的文章內(nèi)容會包括各個專業(yè),所指的對象千差萬別,這樣也就很難從中檢索出所需的文章,降低了文獻(xiàn)的查準(zhǔn)率。所以對一些無實際內(nèi)容的附加詞、泛意詞不能選為關(guān)鍵詞標(biāo)引。
正確的標(biāo)引應(yīng)為:煤炭運輸;鐵路運輸;公路運輸;運輸能力。
3.1 分析文獻(xiàn)主題,對主題概念進(jìn)行提煉標(biāo)引
關(guān)鍵詞的標(biāo)引應(yīng)該嚴(yán)格按照國家標(biāo)準(zhǔn)《文獻(xiàn)主題標(biāo)引規(guī)則》的規(guī)定,在審讀文獻(xiàn)題名、摘要、結(jié)論的基礎(chǔ)上,對文獻(xiàn)進(jìn)行主題分析,然后從中抽取與主題概念一致、具有檢索價值的專業(yè)性的詞和詞組作為關(guān)鍵詞進(jìn)行標(biāo)引。
例如:題名“礦井深水平煤層的瓦斯抽放”,文章介紹了采深600~1000m的煤層,采用水力爆破方法提高鉆孔抽放量的試驗情況。
進(jìn)行主題分析后,選用的關(guān)鍵詞:深部煤層;水力爆破;瓦斯抽放。
3.2 關(guān)鍵詞標(biāo)引必須符合檢索要求
從文獻(xiàn)題名、文摘或正文中抽取關(guān)鍵詞時,應(yīng)考慮用戶的檢索習(xí)慣;若使用冷僻、罕見的詞作為關(guān)鍵詞,必然導(dǎo)致被標(biāo)引文獻(xiàn)的漏檢。
3.3 分析隱含概念,切忌只按題名標(biāo)引
某些主題在題名、摘要中表達(dá)不是很明確,但是又隱含著某一主題,這時要對全文進(jìn)行主題分析并經(jīng)提煉后標(biāo)出其關(guān)鍵詞,避免直接依據(jù)題名進(jìn)行主題分析。
例如:文獻(xiàn)題名:“煤炭,黑金依舊閃爍”。從題名上看,主題內(nèi)容不是很明確,但仔細(xì)研讀全文進(jìn)行主題分析,發(fā)現(xiàn)作者對煤炭行業(yè)的產(chǎn)銷量、煤炭價格、投資價值等進(jìn)行了分析,因此該篇文章提煉出的關(guān)鍵詞:
煤炭供應(yīng);煤炭價格;投資價值;產(chǎn)銷量。
對于題名不能反映主題內(nèi)容的,如果只從題名上進(jìn)行標(biāo)引,檢索時就無法查詢到這篇文章作者寫作的真實意圖,造成漏檢。
3.4 對專業(yè)名詞、專有名詞應(yīng)直接標(biāo)引
在選取關(guān)鍵詞的過程中,常常會碰到一些詞組,特別是有些專業(yè)名詞及一些固定搭配的詞組,標(biāo)引時是不能切分的而要直接標(biāo)引。如“地理信息系統(tǒng)”,就不能切分為“地理”和“信息系統(tǒng)”兩個關(guān)鍵詞?!坝嬎銠C輔助設(shè)計”也不能切分為“計算機”“輔助設(shè)計”兩個關(guān)鍵詞。
3.5 把握好關(guān)鍵詞標(biāo)引深度
標(biāo)引深度是指對一篇文獻(xiàn)所給予的全部檢索標(biāo)識的數(shù)量。即對該文獻(xiàn)中具有檢索意義的內(nèi)容特征和外表特征,進(jìn)行分析描述所達(dá)到的深度。對關(guān)鍵詞標(biāo)引來說,則是指對該文獻(xiàn)所給予的關(guān)鍵詞數(shù)量的多少。對于科技論文文獻(xiàn)來說,從對文獻(xiàn)內(nèi)容的角度分析,一般可從生產(chǎn)設(shè)備名稱、技術(shù)性能、生產(chǎn)原理、產(chǎn)品結(jié)構(gòu)、設(shè)計方法、所用材料、工藝過程等角度抽取關(guān)鍵詞標(biāo)引。單主題文獻(xiàn)的關(guān)鍵詞可少些,多主題的關(guān)鍵詞應(yīng)多選些,一般可選取3~8個詞作為關(guān)鍵詞。
綜上所述,在信息資源檢索中,標(biāo)引具有重要的作用。在整個檢索系統(tǒng)中,標(biāo)引處在承上啟下的地位,它既是文獻(xiàn)存入檢索系統(tǒng)的依據(jù),又是從檢索系統(tǒng)中查出文獻(xiàn)的依據(jù)。從這個意義上講,標(biāo)引又成了溝通文獻(xiàn)著者和文獻(xiàn)使用者之間的橋梁,也是檢索的基本前提,沒有正確的標(biāo)引,也就不可能有正確的檢索。而關(guān)鍵詞標(biāo)引既是揭示文章主題內(nèi)容的精華,同時又是檢索所需要的詞,兩者缺一不可。如何使標(biāo)引達(dá)到直接、客觀、完整地揭示主題本質(zhì)的要求,關(guān)鍵在于對文章主題要作全面的,合乎邏輯規(guī)律的分析。關(guān)鍵詞標(biāo)引的過程實質(zhì)上是對論文內(nèi)容的提煉過程、評價過程和概括的過程。標(biāo)引質(zhì)量提高了,檢索結(jié)果才能準(zhǔn)確、實用。
(責(zé)任編輯 熊志軍)
Brief review on marking&searching of key wordsof technical papers of coal industry
Xie Jun
(Coal Info rmation Research Institute,Chaoyang District,Beijing 100029,China)
頡君 (1962-)女,漢族,北京人,畢業(yè)于北京首鋼工學(xué)院,館員。
B