摘要:目的 在文獻(xiàn)的檢索過程中,通常使用主題詞或者自由詞等進(jìn)行檢索,本節(jié)就檢索詞的有效選擇進(jìn)行探討。方法 對(duì)檢索過程匯總所用到的兩種\"詞\",包括:主題詞以及自由詞兩種,的區(qū)別進(jìn)行分析;針對(duì)兩種選此,利用實(shí)例法對(duì)其檢索的效果和結(jié)果進(jìn)行探討,檢索在Medline和CBM數(shù)據(jù)庫中進(jìn)行。結(jié)果 在Medline數(shù)據(jù)庫中,以主題詞的方式進(jìn)行檢索,其文獻(xiàn)結(jié)果明顯的好于自由詞的檢索方式;在CBM 數(shù)據(jù)庫中,以主題詞的方式進(jìn)行檢索,文獻(xiàn)檢索效果較好,但對(duì)于最新的文獻(xiàn),自由詞的檢索方式的作用更好。結(jié)論 由于檢索系統(tǒng)存在的技術(shù)問題及文獻(xiàn)標(biāo)引問題,在檢索過程中,主題詞檢索方式和自由詞檢索方式的檢索過程都有著各自的優(yōu)缺點(diǎn)。因此,采用主題詞和自由詞聯(lián)合的方法達(dá)到最佳的檢索效果。
關(guān)鍵詞:文獻(xiàn)檢索;主題詞;自由詞;Medline和CBM數(shù)據(jù)庫
在信息高度發(fā)達(dá)的今天,人們可以通過信息檢索的方式來獲得所需要的資料。信息檢索在當(dāng)前檢索的方式和性質(zhì)來看主要課分為三類。其中,學(xué)術(shù)文獻(xiàn)的檢索和信息數(shù)據(jù)的檢索是檢索中最主要的兩個(gè)方面,此外還有事實(shí)的檢索。在學(xué)術(shù)文獻(xiàn)的檢索過程中,檢索的語言決定這檢索的過程和方法。比較常用的兩種語言檢索方式為主題詞檢索法以及自由詞檢索法。本文首先對(duì)主題詞檢索法以及自由詞檢索法進(jìn)行了分析,并在此基礎(chǔ)上以實(shí)例對(duì)兩種方式的效果進(jìn)行了探討。
1主題詞檢索方式
主題詞在文獻(xiàn)檢索中也被稱作敘詞和受控詞兩種,\"詞語\"在選擇時(shí)有明確的規(guī)定,以達(dá)到\"詞語\"和檢索中概念具有很好的吻合度。美國NLM制定了當(dāng)前通用的主題詞表-MeSH。MeSH中的主題詞,是由NLM職員在對(duì)各種文獻(xiàn)進(jìn)行統(tǒng)計(jì)分類并將其主題進(jìn)行標(biāo)引來制定的。主要用做對(duì)文獻(xiàn)進(jìn)行規(guī)范話處理。MeSH在當(dāng)前的醫(yī)學(xué)文獻(xiàn)檢索過程中是最常用的一種方式。MeSH 的這種對(duì)文獻(xiàn)內(nèi)容進(jìn)行標(biāo)引和揭示的特點(diǎn),應(yīng)用于文獻(xiàn)檢索過程中,能有效的提升檢索的準(zhǔn)確性和快速性。在文獻(xiàn)檢索的過程中,還有著副主題詞以及特征詞,這兩者對(duì)于文獻(xiàn)檢索的范圍以及準(zhǔn)確率都有很好的幫助。比如:我們?cè)诓檎襖" APC和MCC的DNA缺失在胃癌臨床生物學(xué)中的作用\"時(shí),可就下列主題詞進(jìn)行文獻(xiàn)的搜索,包括:APC、MCC、DNA缺失、胃癌以及基因等主題詞。檢索中的特征詞可定義為人類。當(dāng)然也可以就物種、雌雄、文獻(xiàn)性質(zhì)等進(jìn)行限定。特征詞和限定詞在檢索的過程中,都是對(duì)檢索的內(nèi)容進(jìn)行選擇和限定,已達(dá)到提升檢索的準(zhǔn)確率的目的。
2自由詞檢索方式
自由詞檢索方式也常被稱作關(guān)鍵詞檢索法,該方式是基于電腦編制索引目的出現(xiàn)的。文獻(xiàn)檢索中的關(guān)鍵詞,通常是說那些在文獻(xiàn)的題目、摘要以及全文中,對(duì)文獻(xiàn)的內(nèi)容進(jìn)行概括性表達(dá)的詞語。比如:文獻(xiàn)\"癌DNA以及抑癌DNA在大腸癌臨床研究中的現(xiàn)狀和展望\"中,\"癌DNA\"、\"抑癌DNA\"、\"大腸癌\"這三個(gè)詞可以從整體上對(duì)該文獻(xiàn)進(jìn)行詮釋,因此,能夠作為關(guān)鍵詞進(jìn)行使用。而\"研究\"、\"現(xiàn)狀\"、\"展望\"是對(duì)該文獻(xiàn)的輔助性描述,無法被當(dāng)做檢索入口使用,所以不能被用做關(guān)鍵詞。關(guān)鍵詞在形式上沒有特定的規(guī)范,通常出現(xiàn)和存在于文獻(xiàn)的摘要中。當(dāng)前,基本上全部的期刊文獻(xiàn)都對(duì)文中的摘要進(jìn)行了要求。所以,從這一點(diǎn)來看,從摘要中以關(guān)鍵詞來進(jìn)行文獻(xiàn)的建設(shè),其檢索的全面性比僅從主體中進(jìn)行檢測(cè)要全面。此外,相比于從全文內(nèi)容進(jìn)行檢索的方式,關(guān)鍵詞檢索的速度較快且失誤率低。在關(guān)鍵詞檢索過程中,要注意詞及其符號(hào)間的改寫,比如:α也可被寫為Alpha。
3實(shí)例1及分析
以實(shí)例對(duì)兩種檢測(cè)方式的效果進(jìn)行分析。在CBM數(shù)據(jù)庫中檢索\"手術(shù)方式臨床對(duì)原發(fā)性肝癌的價(jià)值\"。采用主題詞方式進(jìn)行檢索:主題詞為肝腫瘤和外科學(xué),檢索到文獻(xiàn)有8610篇;采用關(guān)鍵詞方式進(jìn)行檢索:關(guān)鍵詞為原發(fā)性肝癌以及手術(shù),共檢索到文獻(xiàn)3571篇。由此結(jié)果可以看到,檢索中以關(guān)鍵詞方式進(jìn)行檢索,會(huì)造成大量文獻(xiàn)漏檢的狀況。這主要是在一些文獻(xiàn)中,會(huì)以\"肝癌\"或者其他概念來代替\"原發(fā)性肝癌\",這也造成了這種方式檢索的查全率較低的狀況。此外,在關(guān)鍵詞的檢索方式中,存在著一發(fā)生重大誤檢的狀況。比如上述的關(guān)鍵詞檢索就檢索到了\"藥物化療方式在臨床治療原發(fā)性肝癌的價(jià)值\"以及\"AFU 聯(lián)合AFP在原發(fā)性肝癌檢測(cè)及診斷中的價(jià)值分析\"等完全沒有任何聯(lián)系的一些文獻(xiàn)。
4實(shí)例2及分析
在數(shù)據(jù)庫中對(duì)課題\"HP 感染胃癌易感基因多態(tài)性檢測(cè)芯片的研發(fā)和應(yīng)用\"進(jìn)行檢索。該課題的研究?jī)?nèi)容主要是對(duì)IL-1B, IL-10, TNF-α等的多態(tài)性進(jìn)行研究,并進(jìn)行基因芯片的檢測(cè),以此對(duì)HP感染的胃癌患者進(jìn)行篩查。在檢索的過程中應(yīng)從下述方式進(jìn)行。
首先,以主題詞方式和關(guān)鍵詞方式在國內(nèi)數(shù)據(jù)庫中進(jìn)行檢索。其中,主題詞檢索方式中,主題詞為胃腫瘤;副主題詞包括:幽門菌,DNA,基因片段、生物芯片、白介素、腫瘤壞死等。關(guān)鍵詞檢索方式中,關(guān)鍵詞為:胃癌;幽門菌(Hp);基因芯片;白介素;腫瘤壞死因子。
對(duì)于國內(nèi)文獻(xiàn)的檢索,通常是在CBM 數(shù)據(jù)庫中進(jìn)行。對(duì)于\"基因芯片\"這種全新的概念,數(shù)據(jù)庫中還未進(jìn)行標(biāo)引。因此,在進(jìn)行該類文獻(xiàn)的檢索過程匯總,通常僅以相近、類似或上一級(jí)的主題詞來代替進(jìn)行檢索。該研究題目的檢索中,可以DNA, 互補(bǔ); 基因序列以及基因表達(dá)等作為相應(yīng)的主題詞進(jìn)行檢索。從檢索的結(jié)果看,雖然能檢索的一些相應(yīng)的關(guān)于基因芯片方面的研究文獻(xiàn),但是也存在著嚴(yán)重的漏檢狀況。而采用關(guān)鍵詞的方式進(jìn)行檢索,就能夠獲得較好的檢索結(jié)果。該檢索的對(duì)比結(jié)果表明,對(duì)于非前沿的研究,主題詞方式的檢索得到的文獻(xiàn)遠(yuǎn)比關(guān)鍵詞式的檢索結(jié)果。但對(duì)于前沿的研究或者全新的領(lǐng)域,在檢索的過程中,采用關(guān)鍵詞式的檢索方式能得到較好的檢索效果。
其次,以主題詞方式和關(guān)鍵詞方式在國外數(shù)據(jù)庫中進(jìn)行檢索。檢索的主題詞:explode \"stomach- neoplasms\"/all subheadings; oligonucleotide- array- sequence- analysis; tumor- necrosis -factor; interleukin- 1; interleukin- 10; Helicobacter pylori。檢索的關(guān)鍵詞:Gastric cancer; gene chip; dna array; gene polymorphish;interleukin-1B(IL-1B);interleukin-10(IL-10);tumornecrosis-factor-α(TNF-α);H·pylori(HP)。
對(duì)于外文文獻(xiàn)的檢索,通常是在Medline 數(shù)據(jù)庫中進(jìn)行。對(duì)該課題相關(guān)內(nèi)容:基因芯片進(jìn)行檢索。對(duì)于主題詞檢索方式,主題詞為\"oligonucleotide- array- sequence- analysis\",經(jīng)檢索共得到24713篇文獻(xiàn);對(duì)于關(guān)鍵詞檢索方式,關(guān)鍵詞為genechip和dna array,經(jīng)檢索共得到3691篇文獻(xiàn)。所以,關(guān)鍵詞的檢索方式中,文獻(xiàn)的概念及關(guān)鍵詞間并不是相對(duì)應(yīng)的,比如檢索中的\"基因芯片\"在檢索時(shí),gene chip和dna array都可以對(duì)其進(jìn)行表示。由此,采用關(guān)鍵詞檢索方式在檢索的過程中就會(huì)發(fā)生漏檢的現(xiàn)象,也就無法得到全部的文獻(xiàn)。
5結(jié)論
綜上,在文獻(xiàn)的檢索中,主題詞檢索方式以及關(guān)鍵詞檢索方式是當(dāng)前兩種最常用的檢索方法,兩種檢索的方法各有優(yōu)缺點(diǎn),在具體檢索的過程中,應(yīng)依據(jù)檢索的內(nèi)容和深度來確定所采用的檢索方法。并且最好選用一種檢索方式作為主要方式,一種作為輔助檢索方式。對(duì)于自己熟悉的領(lǐng)域以及內(nèi)容,在檢索時(shí)采用主題詞檢索方式能得到較好的效果;對(duì)于研究較為前沿的文獻(xiàn),或者專業(yè)詞匯不明確的,采用關(guān)鍵詞檢索方式能得到較好的效果。
當(dāng)前,相比與國內(nèi)的數(shù)據(jù)庫(CBM),國外數(shù)據(jù)庫(Medline) 的檢索狀況更好,文獻(xiàn)的主題詞具有更新迅速以及標(biāo)引規(guī)范的特點(diǎn)。而國內(nèi)的數(shù)據(jù)庫(CBM)中,主題詞的更新則不快,標(biāo)引也有待提高。因此,相比于CBM,在Medline中使用主題詞方法進(jìn)行檢索,能夠得到較好的檢索結(jié)果。
總之,在檢索的過程中,將兩種檢索方式進(jìn)行聯(lián)合使用能得到最佳的檢索效果。
參考文獻(xiàn):
[1]邢春國,于雙成.國外醫(yī)學(xué)科技論文摘要的內(nèi)容形式分析[J].中國醫(yī)學(xué)文摘·外科學(xué),2006, 25(2):190-192.
[2]霍仲厚,劉胡波.醫(yī)藥衛(wèi)生科技查新教程[M].北京:軍事醫(yī)學(xué)科學(xué)出版社,2005:33-36.
[3]邢春國,徐桂香,田冬梅.醫(yī)學(xué)文獻(xiàn)檢索中檢索詞的選擇[J].現(xiàn)代情報(bào),2007,27(1):136-137.
[4]葉晨,鄭家偉,徐菱.如何利用自由詞、主題詞進(jìn)行醫(yī)學(xué)文獻(xiàn)檢索[J].上海口腔醫(yī)學(xué),2005,14 (3):306-310.
[5]董建成,周曉政.醫(yī)學(xué)信息檢索教程[M].南京:東南大學(xué)出版社,2002:4-5.
編輯/哈濤