金新建
(安徽醫(yī)科大學(xué) 圖書館,安徽 合肥 230032)
生物醫(yī)學(xué)科技查新是指查新員通過(guò)分析查新委托人提供的查新點(diǎn)和科學(xué)技術(shù)要點(diǎn),提煉檢索詞,構(gòu)建檢索策略(檢索式),通過(guò)檢索生物醫(yī)學(xué)相關(guān)專業(yè)數(shù)據(jù)庫(kù),獲取與課題相關(guān)的生物醫(yī)學(xué)文獻(xiàn),閱讀文獻(xiàn)的摘要或全文,篩選出部分文獻(xiàn)進(jìn)行對(duì)比分析,并對(duì)課題的創(chuàng)新點(diǎn)進(jìn)行國(guó)內(nèi)外有無(wú)相關(guān)文獻(xiàn)報(bào)道的判斷。為生物醫(yī)學(xué)相關(guān)課題立項(xiàng)、醫(yī)學(xué)科技成果的鑒定、評(píng)估、驗(yàn)收、轉(zhuǎn)化、獎(jiǎng)勵(lì)等提供客觀依據(jù)[1],防止重復(fù)研究開發(fā)而造成國(guó)家人力、財(cái)力和物力的巨大浪費(fèi),且為生物醫(yī)學(xué)科技人員進(jìn)行研究開發(fā)提供可靠而豐富的生物醫(yī)學(xué)相關(guān)信息。
PubMed和ProQuest Dialog(簡(jiǎn)稱PQD)是生物醫(yī)學(xué)科技查新中非常重要的兩個(gè)數(shù)據(jù)庫(kù),但在各查新站實(shí)際操作中,有些查新站認(rèn)為生物醫(yī)學(xué)查新僅需要檢索PubMed,更多的查新站在進(jìn)行生物醫(yī)學(xué)查新時(shí),為了節(jié)省時(shí)間,只在PQD中進(jìn)行檢索,認(rèn)為PQD中已經(jīng)包含有Medline,不需要再單獨(dú)進(jìn)行PubMed檢索。作為醫(yī)學(xué)查新站專業(yè)查新員,筆者認(rèn)為有必要對(duì)PubMed和PQD數(shù)據(jù)庫(kù)及其在醫(yī)學(xué)查新中的應(yīng)用進(jìn)行研究。
PubMed和PQD數(shù)據(jù)庫(kù)相同點(diǎn)是都是文摘型數(shù)據(jù)庫(kù),都包含生物醫(yī)學(xué)專業(yè)非常重要的《美國(guó)生物醫(yī)學(xué)文摘》(Medline)數(shù)據(jù)庫(kù)。不同點(diǎn)是PubMed收錄的是生物醫(yī)學(xué)和生命科學(xué)的文獻(xiàn),而PQD是個(gè)包含生物醫(yī)學(xué)、化學(xué)、農(nóng)業(yè)等學(xué)科數(shù)據(jù)庫(kù)的綜合性檢索平臺(tái),還包含有大量的專利數(shù)據(jù)。
PubMed是美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)開發(fā)的基于WEB的生物醫(yī)學(xué)信息檢索系統(tǒng),PubMed是一項(xiàng)免費(fèi)資源,支持檢索生物醫(yī)學(xué)和生命科學(xué)文獻(xiàn),以改善全球和個(gè)人健康。數(shù)據(jù)主要來(lái)自生物醫(yī)學(xué)和健康領(lǐng)域,以及如生命科學(xué)、行為科學(xué)、化學(xué)科學(xué)和生物工程等相關(guān)學(xué)科。PubMed醫(yī)學(xué)文獻(xiàn)檢索服務(wù)系統(tǒng)數(shù)據(jù)來(lái)源主要有Medline、Pre-1966 citations、 In-process citations、“Ahead of Print” citations、Record Supplied by Publisher、PubMed Central(PMC)等等,可見(jiàn)PubMed數(shù)據(jù)庫(kù)的收錄范圍要遠(yuǎn)大于Medline。PubMed數(shù)據(jù)庫(kù)包含3 000萬(wàn)份生物醫(yī)學(xué)文獻(xiàn)的引文和摘要,不包括全文期刊文章,但部分文獻(xiàn)可以從其他來(lái)源(如文獻(xiàn)發(fā)表期刊網(wǎng)站或PubMed Central)獲取到全文的鏈接。PubMed數(shù)據(jù)除了來(lái)自Medline數(shù)據(jù)庫(kù),還包含一些最新的在線出版(Online)文獻(xiàn)和早于1966年的文獻(xiàn),也包括由出版商提供的非Medline收錄范圍的生物醫(yī)學(xué)方面的文獻(xiàn)和雖然是Medline收錄范圍內(nèi)的文獻(xiàn)但還沒(méi)來(lái)得及進(jìn)行主題詞標(biāo)引,Medline暫時(shí)未收錄的文獻(xiàn)。由此可見(jiàn),不能簡(jiǎn)單地認(rèn)為PubMed收錄的文獻(xiàn)一定是Medline收錄的文獻(xiàn)。
ProQuest Dialog是ProQuest公司旗下的國(guó)際聯(lián)機(jī)檢索系統(tǒng)。包含97個(gè)科技數(shù)據(jù)庫(kù)和40個(gè)專利數(shù)據(jù)庫(kù),涉及電信與計(jì)算、工程與技術(shù)、航空航天與國(guó)防、化學(xué)、金融服務(wù)、能源與環(huán)境[2]、汽車、食品與農(nóng)業(yè)、衛(wèi)生保健、診斷與醫(yī)療器械、制藥與生物醫(yī)學(xué)等行業(yè)[3],其中生物醫(yī)學(xué)相關(guān)的數(shù)據(jù)庫(kù)有BIOSIS Previews、Embase、MEDLINE、New England Journal of Medicine、Global Health、 Nucleic Acids Abstracts等;藥學(xué)方面的有BIOSIS、IMS系列、Adis系列等數(shù)據(jù)庫(kù),幾乎包含了全球主要的生物醫(yī)學(xué)與藥學(xué)方面的數(shù)據(jù)庫(kù)。ProQuest Dialog還包含SciSearch、Social SciSearch、Current Contents Search等全球重要的綜合性數(shù)據(jù)庫(kù),以及31個(gè)國(guó)家的專利全文數(shù)據(jù)庫(kù)和世界著名的Denwent World Patents Index、INPADOC等專利數(shù)據(jù)庫(kù)。
PubMed檢索語(yǔ)法包括邏輯算符(AND、OR、NOT)、截詞符(用*表示)、短語(yǔ)檢索(用雙引號(hào)“”表示)等。PubMed具有自動(dòng)轉(zhuǎn)換匹配功能,對(duì)于輸入檢索框中的檢索詞,PubMed將按照MeSH轉(zhuǎn)換表(MeSh Translation Table)、期刊刊名轉(zhuǎn)換表(Journal Translation Table)、短語(yǔ)表(Phrase List)、作者索引(Author Index)等順序進(jìn)行對(duì)照、匹配和轉(zhuǎn)換,然后再進(jìn)行檢索。要檢索某個(gè)單詞開頭的所有術(shù)語(yǔ),可以在單詞后加截詞符“*”。如果檢索包含截詞符的短語(yǔ),需要使用以下3種格式:①將短語(yǔ)用雙引號(hào)引起來(lái),如“breast feed*”;②使用字段限定檢索,如breast feed*[tiab];③使用連字符,如breast-feed*。短語(yǔ)檢索和截詞功能會(huì)關(guān)閉PubMed的自動(dòng)轉(zhuǎn)換匹配功能,也不再進(jìn)行MeSH詞的擴(kuò)檢。
ProQuest Dialog 檢索語(yǔ)法包括邏輯算符(AND、OR、NOT)、通配符和截詞符(用?和*表示)、位置算符 P/n(PRE/n)和N/n(NEAR/n)、精確檢索(用引號(hào)“”表示)。PQD對(duì)輸入檢索框中的單詞自動(dòng)進(jìn)行單復(fù)數(shù)、英美拼寫變體等形式的匹配。利用“”進(jìn)行精確短語(yǔ)檢索,如輸入 “electric vehicle”,只能檢索出 electric vehicle。在PQD中,常用的通配符為“?”,一個(gè)問(wèn)號(hào)代表一個(gè)字符,如檢索nurses或nursed ,檢索詞可用nurse?表示。截詞字符“*”用來(lái)檢索檢索詞的變體,比如復(fù)數(shù)形式、比較級(jí)、最高級(jí)、英美變體等形式,可用在檢索詞開頭、結(jié)尾或中間,可代替0-10個(gè)字符,如檢索*old 可找到:old、bold、 household等檢索結(jié)果(這些詞具有共同的詞根old)。限定截詞[*n]或$n,可替換多達(dá)指定字符數(shù)的字符,如檢索old、bold或hold,可用$1old或[*1]old,表示old前面可出現(xiàn)0-1個(gè)字符數(shù)。PQD位置算符有N/n(near/n) 和P/n (pre/n)兩種,n表示字符個(gè)數(shù)。其中P/n (pre/n)查找相鄰位置的兩個(gè)檢索詞(兩檢索詞位置不可換)的文檔,如:nursing P/0 education 兩個(gè)單詞中間一個(gè)空格或字符,nursing P/4 education 兩個(gè)單詞中間0-4個(gè)字符,兩檢索詞前后位置不能互換;N/n(near/n)查找相鄰位置的兩個(gè)檢索詞(位置可互換)的文檔,如nursing NEAR/0 education 兩個(gè)單詞中間一個(gè)空格或字符,兩檢索詞前后位置可互換。
PubMed和PQD檢索語(yǔ)法中都包含邏輯算符(AND、OR、NOT)、通用截詞符(用*表示)、精確檢索(用雙引號(hào)“”表示)等常用檢索語(yǔ)法。PubMed強(qiáng)大的檢索詞自動(dòng)轉(zhuǎn)換匹配功能,有利于查新時(shí)的查全;PQD的限定截詞和位置算符等特定檢索語(yǔ)法,有利于查新時(shí)的查準(zhǔn)。
PubMed提供多種檢索途徑,包括:基本檢索、主題詞檢索、高級(jí)檢索、限定檢索、引文匹配檢索等,支持邏輯運(yùn)算檢索和檢索詞自動(dòng)轉(zhuǎn)換匹配功能?;緳z索:在檢索框中輸入任何具有實(shí)質(zhì)意義的詞,包含自由詞、主題詞、人名和期刊名等,系統(tǒng)會(huì)自動(dòng)進(jìn)行匹配檢索,輸入多個(gè)檢索詞時(shí),系統(tǒng)會(huì)自動(dòng)識(shí)別成詞組進(jìn)行檢索,系統(tǒng)也會(huì)默認(rèn)成單個(gè)單詞,每個(gè)單詞之間的空格默認(rèn)為AND組配。如可以將Protein Disulfide Isomerase識(shí)別成一個(gè)詞組,也會(huì)將其識(shí)別成Protein AND Disulfide AND Isomerase,如果出現(xiàn)數(shù)字等符號(hào)時(shí),不易識(shí)別成詞組,對(duì)PubMed不能識(shí)別的詞組,需使用引號(hào)(半角狀態(tài)下)標(biāo)記詞組,如"t-PA"。PubMed使用美國(guó)醫(yī)學(xué)圖書館編制的醫(yī)學(xué)專題詞表(MeSH)對(duì)收錄的文獻(xiàn)進(jìn)行主題標(biāo)引,主題詞檢索是PubMed特有的檢索途徑,可選擇規(guī)范化主題詞、副主題詞、查看詞義注釋、瀏覽樹狀結(jié)構(gòu)表等。PubMed能自動(dòng)地為輸入的檢索詞尋找相應(yīng)的MeSH詞,查新員可以根據(jù)課題挑選合適的副主題詞,選擇全部副主題詞和主題詞擴(kuò)檢來(lái)擴(kuò)大查新范圍等。這種強(qiáng)大的檢索功能非常有利于科技查新中文獻(xiàn)的查全。PubMed檢索界面很友好,檢索途徑和檢索方式簡(jiǎn)單,非常容易掌握,醫(yī)學(xué)院校文獻(xiàn)檢索課中都會(huì)講授PubMed數(shù)據(jù)庫(kù),所以大多數(shù)的醫(yī)學(xué)科技工作者都會(huì)熟練運(yùn)用PubMed。醫(yī)學(xué)查新站的查新員大多具有醫(yī)學(xué)專業(yè)背景,且有些查新員本身就是醫(yī)學(xué)文獻(xiàn)檢索課教師,能非常熟練的應(yīng)用PubMed數(shù)據(jù)庫(kù)進(jìn)行科技查新。
PQD提供基本檢索、高級(jí)檢索和命令行檢索(指令檢索)。其中指令檢索最為全面:可一次輸入多個(gè)檢索式同時(shí)檢索;檢索式可換行分步檢索;檢索集可以與檢索集運(yùn)算;檢索集可以與檢索詞運(yùn)算;檢索集可以與檢索式運(yùn)算。這種指令檢索非常方便地用于檢索策略的調(diào)試和完善。PQD提供的檢索途徑和檢索語(yǔ)法較為全面,非常適合科技查新工作要求的在查全的基礎(chǔ)上查準(zhǔn),但由于PQD包含97個(gè)科技數(shù)據(jù)庫(kù)和40個(gè)專利數(shù)據(jù)庫(kù),這么多的數(shù)據(jù)庫(kù)要在一個(gè)統(tǒng)一平臺(tái)進(jìn)行檢索,且PQD收費(fèi)較高,所以對(duì)查新員的檢索能力也有相當(dāng)高的要求,特別是選擇檢索詞和構(gòu)建檢索策略的能力方面,查新員要經(jīng)過(guò)培訓(xùn)和長(zhǎng)期查新實(shí)踐后才能熟練掌握PQD。
PubMed和PQD都提供多種檢索途徑,PubMed的主題詞檢索優(yōu)勢(shì)在于其通過(guò)主題詞字順表和樹形結(jié)構(gòu)表對(duì)語(yǔ)法信息和語(yǔ)用信息的深度揭示,達(dá)到了人機(jī)對(duì)話中對(duì)語(yǔ)義信息的準(zhǔn)確把握,獲得了高效率的醫(yī)學(xué)文獻(xiàn)檢索結(jié)果[8];適合專業(yè)檢索人員的PQD指令檢索雖然看起來(lái)煩瑣和不易掌握,但作為查新員,一旦掌握,能很好地提高查新效率。
PubMed免費(fèi)提供題錄和文摘,其中PubMed Center(PMC)部分能免費(fèi)獲取全文,且不受時(shí)間和IP地址的限制,只要有互聯(lián)網(wǎng)就可以進(jìn)行免費(fèi)檢索,查看、下載題錄和摘要。
PQD一般是由查新機(jī)構(gòu)購(gòu)買的聯(lián)機(jī)檢索系統(tǒng),有并發(fā)用戶限制,由于PQD收費(fèi)較高,一般查新機(jī)構(gòu)采用的大多是包庫(kù),每年繳納固定費(fèi)用,用于免費(fèi)檢索、查看檢索結(jié)果列表、預(yù)覽題錄和部分摘要內(nèi)容。檢索結(jié)果列表僅包含題名、出版年份和來(lái)源數(shù)據(jù)庫(kù)等,如果不想產(chǎn)生額外費(fèi)用,查新員可以通過(guò)題名或來(lái)源數(shù)據(jù)庫(kù)信息再去相關(guān)數(shù)據(jù)庫(kù)檢索,獲取摘要或全文信息,但如從其他數(shù)據(jù)庫(kù)無(wú)法獲取相關(guān)信息,通過(guò)PQD查看或下載引文、摘要、全文都是要額外收費(fèi)的,PQD會(huì)根據(jù)數(shù)據(jù)庫(kù)和查看下載的格式不同,提供不同的收費(fèi)標(biāo)準(zhǔn),且每次收費(fèi)之前都會(huì)彈出價(jià)格預(yù)覽,查新員可以根據(jù)需要進(jìn)行取舍[3]。
檢索實(shí)例1 :ZSWIM3的*研究
檢索時(shí)間:2020年9月27日
檢索詞:ZSWIM/Zinc finger SWIM/Zinc-finger SWIM
檢索字段:在題名和摘要字段中檢索
PubMed檢索式:Zinc finger SWIM[Title/Abstract]OR Zinc-finger
SWIM[Title/Abstract] OR ZSWIM[Title/Abstract]
PQD檢索式:ti,ab(Zinc p/1 finger p/0 SWIM OR ZSWIM)
檢索結(jié)果:PubMed共檢出11篇文獻(xiàn);PQD共檢出19篇文獻(xiàn)
對(duì)比兩個(gè)數(shù)據(jù)庫(kù)的檢索結(jié)果,同樣的檢索詞和檢索式,都是限定在題名和摘要字段中進(jìn)行檢索,PubMed只檢出11篇文獻(xiàn),PQD則檢出19篇文獻(xiàn),對(duì)比兩個(gè)數(shù)據(jù)庫(kù)的檢索結(jié)果發(fā)現(xiàn),有10篇是重復(fù)的,PubMed中檢出的11篇文獻(xiàn)中,只有1篇2020年最新發(fā)表,出版狀態(tài)為Epub的這篇文獻(xiàn)在PQD中未檢索到,ProQuest Dialog中有的,PubMed中未檢出的,大多是另一重要的醫(yī)學(xué)數(shù)據(jù)庫(kù)《荷蘭醫(yī)學(xué)文摘》(Embase)收錄的文獻(xiàn)。經(jīng)過(guò)閱讀摘要或全文發(fā)現(xiàn),PubMed中檢出的那篇Online文獻(xiàn),與該查新課題非常相關(guān),可見(jiàn)如果查新時(shí)僅僅檢索PQD,就會(huì)漏檢部分最新文獻(xiàn)。
檢索實(shí)例2:通過(guò)全外顯子測(cè)序技術(shù)篩選特發(fā)性非梗阻性無(wú)精子癥的致病基因
檢索時(shí)間:2020年11月19日
檢索詞:Nonobstructive azoospermia/non-obstructive azoospermia/NOA/idiopathic azoospermia;idiopathic;gene;Whole exome sequencing/WES
PubMed檢索式:(Nonobstructive azoospermia[Title/Abstract] OR non-obstructive azoospermia[Title/Abstract] OR NOA[Title/Abstract] OR idiopathic azoospermia)[Title/Abstract] AND idiopathic[Title/Abstract] AND gene[Title/Abstract] AND (whole exome sequencing[Title/Abstract] OR WES)[Title/Abstract]
PQD檢索式:ti,ab((Nonobstructive p/0 azoospermia OR non p/1 obstructive p/0 azoospermia OR NOA OR idiopathic p/1 azoospermia) AND idiopathic AND gene$ AND (whole p/0 exome p/0 sequencing OR WES))
檢索結(jié)果:PubMed檢出文獻(xiàn) 4篇,其中3篇與PQD重了,只有最新的1篇出版狀態(tài)為“Online ahead of print”的在PQD中未檢索到;PQD中檢出11篇文獻(xiàn)分別來(lái)自Embase(11篇)、Medline(5篇)、SCI(2篇)、Current Contents(2篇)、Northern Light Life Sciences Conference Abstracts(1篇)等數(shù)據(jù)庫(kù)。由此可見(jiàn),PQD在醫(yī)學(xué)科技查新中的重要性。
教育部科技查新工作站查新報(bào)告撰寫規(guī)范對(duì)查新工作的文獻(xiàn)檢索范圍有明確要求:中外文數(shù)據(jù)庫(kù)檢索必查數(shù)據(jù)庫(kù)均不少于10個(gè),有些查新項(xiàng)目(如產(chǎn)品類查新)可進(jìn)行互聯(lián)網(wǎng)等其他方式的補(bǔ)充檢索,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)資源足夠豐富的查新機(jī)構(gòu),可以基于自有的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)開展查新。如果必查綜合數(shù)據(jù)庫(kù)(通用基本數(shù)據(jù)庫(kù))或?qū)I(yè)數(shù)據(jù)庫(kù)欠缺,須采用國(guó)際聯(lián)機(jī)進(jìn)行補(bǔ)充檢索[2~7]。文獻(xiàn)檢索范圍越大,查全率越高,查準(zhǔn)率必然下降,所以需要根據(jù)查新課題選擇合適的數(shù)據(jù)庫(kù)進(jìn)行檢索。
PubMed檢索方法很容易掌握,檢索途徑多,可免費(fèi)進(jìn)行檢索,免費(fèi)查看題錄和摘要等信息,部分還可免費(fèi)獲取全文,但如果醫(yī)學(xué)查新時(shí)僅僅使用PubMed檢索,課題的檢索范圍會(huì)過(guò)于狹窄,無(wú)法保證查全率,如果醫(yī)學(xué)查新時(shí)沒(méi)有對(duì)如 Inspec、BIOSIS Previews、SCI、EMBASE等這些國(guó)際知名數(shù)據(jù)庫(kù)進(jìn)行檢索,文獻(xiàn)檢索范圍得不到保證,不符合教育部科技查新工作站查新報(bào)告撰寫規(guī)范對(duì)查新工作的文獻(xiàn)檢索范圍提出的數(shù)據(jù)庫(kù)要求,無(wú)法保證查新質(zhì)量。而PQD聯(lián)機(jī)系統(tǒng)檢索費(fèi)用較為昂貴,盡管各醫(yī)學(xué)查新站團(tuán)購(gòu)了PQD,但除檢索不收費(fèi)外,其他查看和下載還是需要額外付費(fèi)。盡管現(xiàn)在PQD檢索途徑和檢索式的編寫已經(jīng)得到很好的優(yōu)化,但高昂的查看和下載費(fèi)用在一定程度上限制了它在科技查新中的應(yīng)用。另一方面,雖然在PQD和PubMed都收錄了Medline數(shù)據(jù)庫(kù),但PQD除了Medline,還包括Embase、BP等相當(dāng)多的醫(yī)學(xué)和其他相關(guān)專業(yè)數(shù)據(jù)庫(kù);PubMed除了Medline還包括了相當(dāng)部分最新文獻(xiàn)和非Medline收錄文獻(xiàn),這部分恰恰是PQD所缺乏的文獻(xiàn)。
作為教育部科技查新工作站(醫(yī)學(xué)),筆者經(jīng)過(guò)長(zhǎng)期實(shí)踐,并且在深入研究PQD和PubMed的基礎(chǔ)上,認(rèn)為在醫(yī)學(xué)科技查新工作中這兩個(gè)數(shù)據(jù)庫(kù)應(yīng)同時(shí)進(jìn)行檢索,缺一不可,必要時(shí)還需要查詢其他館藏資源和網(wǎng)絡(luò)數(shù)據(jù)庫(kù)進(jìn)行補(bǔ)充。PubMed如果限定字段檢索,系統(tǒng)就會(huì)關(guān)閉自動(dòng)轉(zhuǎn)換匹配功能,查新員可以根據(jù)檢出課題相關(guān)文獻(xiàn)的數(shù)量選擇是在全字段檢索還是在限定字段中檢索,筆者經(jīng)過(guò)長(zhǎng)期實(shí)踐摸索,在進(jìn)行PubMed檢索時(shí)通常采用在所有字段中進(jìn)行檢索,在PQD中通常采用在題名和摘要中進(jìn)行檢索,這樣互為補(bǔ)充的檢索,既可查全,又很好地兼顧了節(jié)省費(fèi)用和查準(zhǔn)。為了節(jié)省PQD的檢索費(fèi)用,通常是先在PubMed中進(jìn)行檢索,通過(guò)查看主題詞和摘要信息,選擇規(guī)范的檢索詞,構(gòu)建合適的檢索式,再按照PQD的檢索語(yǔ)法構(gòu)建檢索策略,檢索到相關(guān)文獻(xiàn)題名后再去館內(nèi)已有資源查看下載摘要等信息,根據(jù)課題的相關(guān)性選擇對(duì)比文獻(xiàn),最終完成查新報(bào)告。
內(nèi)蒙古科技與經(jīng)濟(jì)2021年23期