摘要:專利信息檢索平臺是獲取專利文獻信息、開展專利信息服務(wù)的必備工具,其數(shù)據(jù)檢出質(zhì)量是開展專利文獻信息檢索和情報分析服務(wù)的基礎(chǔ)保障。文章從數(shù)據(jù)更新、數(shù)據(jù)加工、檢索字段3個維度,考察在相同檢索條件下各專利信息檢索平臺影響查全率的因素。具體通過實際案例對比CNIPA、PSS等11種專利信息檢索平臺在數(shù)據(jù)更新周期、分類號加工、國省代碼表達、組合字段處理等方面的檢索結(jié)果差異,挖掘出導(dǎo)致差異的數(shù)據(jù)來源不同、數(shù)據(jù)加工錯誤、檢索邏輯有別等因素,進而提出相關(guān)建議,為專利信息檢索和分析人員更有效地使用各檢索平臺提供幫助。
關(guān)鍵詞:專利;檢索平臺;查全率
中圖分類號:G354 ""文獻標志碼:A
0 引言
近年來,隨著全國知識產(chǎn)權(quán)信息公共服務(wù)體系建設(shè)的推進和高校專利質(zhì)量提升及專利運營轉(zhuǎn)化需求上漲,專利信息檢索的需求也日趨活躍。專利文獻信息集技術(shù)、法律和經(jīng)濟信息于一體,是重要的科技信息資源。專利信息檢索平臺是獲取專利文獻信息、開展專利信息服務(wù)的必備工具,其數(shù)據(jù)檢出質(zhì)量是開展專利文獻信息檢索和情報分析服務(wù)的基礎(chǔ)保障。查全率是評價檢索質(zhì)量的常用指標之一,而影響查全率的諸多因素之中,除檢索詞選取、檢索策略制定等[1-2]顯要因素外,還有容易受忽視的檢索平臺自身因素。因此,深入對比分析各專利信息檢索平臺,掌握導(dǎo)致漏檢的平臺因素,對于提高檢索質(zhì)量具有重要意義。
當前,國內(nèi)專利信息檢索平臺蓬勃發(fā)展,形成了國家/地方知識產(chǎn)權(quán)管理服務(wù)部門、商業(yè)機構(gòu)并行發(fā)展的局面,為社會提供了數(shù)十種專利信息檢索平臺。本文選擇其中11種專利信息檢索平臺,從數(shù)據(jù)更新、數(shù)據(jù)加工及檢索字段等方面對比、研究各平臺之間存在的影響查全的因素,為提高專利檢索質(zhì)量提供幫助。
1 研究回顧
自1955年P(guān)erry[3]提出查全率、查準率以來,查全率一直是評價情報檢索系統(tǒng)性能的重要定量指標[4]。在專利信息檢索領(lǐng)域,有關(guān)查全率的研究主要集中在以下兩方面。
一是數(shù)據(jù)庫平臺角度研究造成漏檢的原因及提高查全率的方法,如分析文獻著錄、檢索語言等因素造成漏檢的原因[5];在專利文獻深加工中,通過對中心詞的同義詞、縮略語、中文詞、上位詞進行自由詞標引以提高查全率[6];通過正式標引詞和非正式標引詞的組配標引以提高檢索的查全率和查準率[7];提高非標準主題詞的標引比例, 挖掘?qū)@碾[含信息,提高查全率[8]。
二是從實務(wù)角度研究提高專利查全率的方法,包括通過檢索策略優(yōu)化提高查全率,如應(yīng)用領(lǐng)域本體對初始檢索表達式進行檢索擴展,在保障查準率的基礎(chǔ)上提高檢索查全率[9];通過擴展技術(shù)分支檢索、進行關(guān)鍵詞擴展等,防止漏檢[10];優(yōu)化檢索式構(gòu)造思路防止漏檢[11];從檢索需求分析、檢索要素確定、檢索策略制定、對比文件篩選對檢索全過程進行優(yōu)化以提高查全率[12]。也有研究從構(gòu)建查全樣本集合等角度分析專利檢索的查全率驗證過程及注意問題[13],針對特定領(lǐng)域或特定平臺進行專利信息漏檢的原因分析及對策研究[14-15]。
此外,也有研究者針對專利檢索平臺進行對比研究。戚敏[16]從性能指標(收錄范圍、檢索功能)及費用效果指標(檢索服務(wù)收費、學習成本、使用成本)對中國專利信息網(wǎng)、中國知識產(chǎn)權(quán)網(wǎng)、CNIPA、中國專利檢索系統(tǒng)、易信專利信息網(wǎng)、CNKI6個平臺進行比較、分析、評價。岳泉等[17]從檢索方式、檢索功能、檢索算符、檢索字段、檢索結(jié)果等方面對比了CNIPA、IBM知識產(chǎn)權(quán)網(wǎng)專利數(shù)據(jù)庫等九種網(wǎng)絡(luò)專利數(shù)據(jù)庫。李健康等[18]從文獻檢索課教學實踐需求出發(fā),從數(shù)據(jù)收錄量、檢索字段、檢索功能、檢索速度等方面對CNIPR、CNIPA、CNPAT、PATENT、NSTL、CNKI、萬方7個平臺進行比較分析。曹平[19]從數(shù)據(jù)來源及范圍、檢索功能、更新頻率、輸出結(jié)果、方便易用性等方面對比了官方專利文獻信息檢索平臺(CNIPA、USPTO、esp@cenet、JPO)、商用專利文獻信息檢索平臺(Aureka、Delphion、DII)。羅立國等[20]針對智慧芽、佰騰網(wǎng)、Ipexl、Priorsmart、CNIPA、CNIPR、Soopat、Patentics和DII9個網(wǎng)站,對其檢索功能、檢索結(jié)果、分析功能和特色功能進行比較研究。蔣凌等[21]側(cè)重專利信息平臺的深度分析功能和增值功能,就基本分析指標、組配分析功能、文本挖掘、專利預(yù)警、特色分析功能等方面開展對CNIPR、Shanghaiip、Patentics、SooPat、佰騰網(wǎng)5個平臺進行對比研究。陳海英等[22]從引文收錄范圍、引文檢索方式、前引后引查找功能、引文類型區(qū)分功能、非專利文獻查找功能、可視化呈現(xiàn)功能和引文檢索準確度等方面對比Innography、WIPS 和 Patentics 3個專利檢索系統(tǒng)的引文分析功能。黎子輝等[23]通過考察相同的檢索策略下檢索結(jié)果數(shù)量差值,從數(shù)據(jù)完整性和準確性、數(shù)據(jù)更新情況以及檢索精確度等方面對CNIPR、萬方、CNKI、IncoPat、Patsnap 5個專利數(shù)據(jù)庫進行檢索測試、評價。
綜上所述,學界對提高專利查全率的方法及專利檢索平臺功能對比已有豐富的研究,但鮮有學者從檢索平臺角度對影響專利查全率的因素進行分析。
2 研究設(shè)計
專利文獻信息檢索結(jié)果的查全率既受檢索特征提取及檢索策略制定準確與否的影響,也受專利信息檢索平臺自身因素的影響。本文從數(shù)據(jù)更新、數(shù)據(jù)加工及檢索字段等方面比對不同專利信息檢索平臺,研究各平臺存在的影響查全率的平臺因素,以促進提高專利檢索質(zhì)量。
2.1 研究對象選取
本文從國家知識產(chǎn)權(quán)局及其下屬機構(gòu)、商業(yè)性專利信息提供商、專利信息搜索引擎中選取11種國內(nèi)常用的專利信息檢索平臺為研究對象(見表1),包括:國家知識產(chǎn)權(quán)局及其下屬機構(gòu)提供的公布公告查詢系統(tǒng)(以下簡稱“CNIPA”)、CNIPR專利信息服務(wù)平臺(以下簡稱“CNIPR”)、專利檢索及分析系統(tǒng)PSS(以下簡稱“PSS”)、專利之星檢索系統(tǒng)(以下簡稱“專利之星”),商業(yè)性專利數(shù)據(jù)庫商提供的合享incoPat、智慧芽以及提供免費檢索服務(wù)的專利信息搜索引擎INNOJOY、專利匯、萬象云、佰騰、潤桐。
2.2 研究方法設(shè)計
從文獻存儲來看,影響查全率的因素主要有文獻庫收錄文獻不全、索引詞匯缺乏控制和專指性、標引不詳、標引前后不一致等[24]。本文從數(shù)據(jù)更新、數(shù)據(jù)加工、檢索字段3個維度,考察在相同檢索條件下各專利信息檢索平臺在專利數(shù)據(jù)更新周期、分類號、國省代碼、組合字段處理、公開公告日字段等方面的異同,并針對檢索結(jié)果數(shù)據(jù)差異進行探究,力求找出原因,為專利信息檢索和分析人員更有效地使用各檢索平臺提供幫助。
3 專利信息檢索平臺漏檢因素實證分析
3.1 數(shù)據(jù)更新周期因素分析
國家知識產(chǎn)權(quán)局(專利局)于每周二、周五以專利公報方式公布專利公開、公告數(shù)據(jù),各專利信息檢索平臺也定期通過接收或爬取國家知識產(chǎn)權(quán)局(專利局)的公報數(shù)據(jù)對其數(shù)據(jù)進行更新,更新周期是影響查全率的因素之一。各檢索平臺的數(shù)據(jù)更新頻率不一,在時間敏感性強的專利查新等服務(wù)中,及時獲取最新公開公告信息具有很強的現(xiàn)實意義。
本文從2024年11月8日、12日的發(fā)明、實用新型、外觀設(shè)計專利公報中各選取頭尾兩件數(shù)據(jù),共得12件專利數(shù)據(jù)作為測試集。于2024年11月9日至14日每天通過公開/公告號檢索。經(jīng)測試,CNIPA、CNIPR、PSS、專利之星、incoPat、智慧牙、專利匯和佰騰的數(shù)據(jù)更新及時,在專利公報發(fā)布第2天即可檢索到最新專利數(shù)據(jù)。相比較而言,INNOJOY滯后2天,潤桐滯后4天,萬象云更新頻率則較慢,滯后一周左右,且數(shù)據(jù)更新周期較為不規(guī)則,存在部分舊數(shù)據(jù)比新數(shù)據(jù)更遲收錄現(xiàn)象(見表2)。
3.2 數(shù)據(jù)加工質(zhì)量因素
3.2.1 分類號因素
采用抽樣方式,選取IPC號H02K11的專利數(shù)據(jù)進行數(shù)據(jù)量測試,并以CNIPA檢索結(jié)果為基準值,通過差值直觀體現(xiàn)各平臺的數(shù)據(jù)差異(見表3)。從檢出數(shù)據(jù)看,智慧芽、incoPat檢出結(jié)果基本一致,數(shù)量也最多;PSS、專利之星、佰騰、潤桐則有不同程度的數(shù)據(jù)缺失,其中佰騰的缺失數(shù)據(jù)量占比達2.4%。
為進一步分析各平臺數(shù)據(jù)差異原因,本文選取2005年、2020年的兩個時間段對數(shù)據(jù)進行逐一比對,發(fā)現(xiàn)導(dǎo)致各平臺檢出數(shù)據(jù)差異的原因主要有兩個。
一是IPC分類號來源不同導(dǎo)致的差異。《國際專利分類表》從2006年1月1日實施第8版,并要求所有專利文獻均根據(jù)基本版和高級版的修訂進行重新分類,使檢索人員在利用國際專利分類號進行檢索時,不必再考慮以前國際專利分類版本的情況。但由于過去的專利文獻數(shù)量巨大,目前互聯(lián)網(wǎng)上的許多專利文獻檢索數(shù)據(jù)庫中還沒有對以前文獻的IPC分類號全部進行更新[25],做得較好的是歐洲專利局,除提供原專利分類號數(shù)據(jù)外,還提供IPC版本8的分類號數(shù)據(jù),因而每件專利的分類號數(shù)據(jù)更為豐富。通過2005年的數(shù)據(jù)比對發(fā)現(xiàn),incoPat、智慧芽均綜合了中國專利局和歐洲專利局的分類號數(shù)據(jù),故而檢出結(jié)果明顯多于CNIPA等平臺。如,專利“電機起動繼電器和使用該電機起動繼電器的電動壓縮機(CN1607719A)”,其在incoPat的數(shù)據(jù)顯示,分類號有:H02P1/00; H01C7/02; H01H45/02; H01C1/02; H01C1/022; H01H45/00; H02H9/02; H02K11/00。經(jīng)比對,H02P1/00; H01C7/02; H01H45/02為原專利IPC1-7版數(shù)據(jù),H01C1/022; H01H45/00; H02H9/02; H02K11/00為歐專局增加的IPC-8版數(shù)據(jù),而H01C1/02則來源于PSS系統(tǒng)中該件專利的英文版CN:200410095118:A。
二是檢索平臺數(shù)據(jù)加工錯誤所致。如在2005年的抽樣數(shù)據(jù)中,CNIPR檢出66件,其結(jié)果與incoPat、智慧芽相比,漏檢了以下3件:CN1595766A、CN1607713A、CN1193481C(申請日均在2003-09-11以前),進一步檢索可知,CNIPR系統(tǒng)中該3件專利的IPC分類號中均沒有H02K11,推測是2003年09月11日以前的IPC數(shù)據(jù)沒有更新到IPC(8)所致。而在2020年的抽樣數(shù)據(jù)中,佰騰未檢出的12件數(shù)據(jù)中,CN109256927B、CN109038910B等均可在佰騰網(wǎng)中通過申請?zhí)柣蚬_公告號檢出,且授權(quán)公告日期、IPC符合檢索條件,推測是因為分類號處理問題導(dǎo)致未檢出。
3.2.2 國省代碼因素
檢索、分析某一區(qū)域的專利數(shù)據(jù)也是常見專利信息服務(wù)之一。通過省市代碼檢索是獲取區(qū)域?qū)@麛?shù)據(jù)的快捷途徑,其檢索結(jié)果也比通過專利申請人地址窮盡檢索更為全面和準確。本文以檢索“2020年5月1日至15日公開公告的福建省專利數(shù)據(jù)”為測試對象,分析各專利信息檢索平臺國省代碼的查全情況(見表4)。
從檢索結(jié)果看,除CNIPA、潤桐不支持國省代碼字段檢索外,CNIPR、incoPat、INNOJOY、專利匯檢出結(jié)果相同,與之相比,PSS、專利之星、智慧芽、佰騰均有不同程度的漏檢。此外,萬象云檢出的發(fā)明、實用新型數(shù)據(jù)多于CNIPR等平臺,選取2020年5月5日公開公告的發(fā)明申請/授權(quán)數(shù)據(jù)進一步比對發(fā)現(xiàn),與CNIPR、incoPat、智慧芽等相比,萬象云多檢出的專利數(shù)據(jù)有兩類:① 聯(lián)合申請,且福建申請人非第一位的專利數(shù)據(jù),如CN111105962A、CN105325676B;② 原始申請人非福建的,經(jīng)過轉(zhuǎn)讓后,現(xiàn)專利權(quán)人為福建的,如CN108124107B、CN107386383B。進一步比對發(fā)現(xiàn),如CNIPR、incoPat等缺的是①類數(shù)據(jù);智慧芽缺的是①、②兩類數(shù)據(jù)。
需注意的是,各平臺對國省代碼的檢索詞表達及范圍界定是有差異的。如針對福建,CNIPR、incoPat、智慧芽、INNOJOY、佰騰、萬象云用省市代碼數(shù)字35或福建表示,其中萬象云用表達式“apcp=福建 or apcp=cn35”表示,否則會漏檢。PSS則用漢字“福建”表示,專利匯用漢字“福建省”表示。專利之星也用數(shù)字35表示,但不包含計劃單列市廈門(省市代碼為92)。因此,在專利之星中檢索福建省專利時需用“35+92”表示,否則造成漏檢。
3.3 檢索字段因素
3.3.1 文本組合字段
跨字段檢索是提高查全率的常用方法,多數(shù)專利信息檢索平臺均通過提供“名稱/摘要”、“名稱/摘要/權(quán)利要求書”等組合字段為用戶提供較為滿意的檢索體驗(見表5)。如表5所示,除CNIPA、萬象云外,其他檢索平臺均提供名稱/摘要、名稱/摘要/權(quán)利要求書等組合字段。而組合字段的邏輯運算關(guān)系直接關(guān)系檢索結(jié)果。為此,本文選取一專利申請數(shù)據(jù)“一種μLED巨量轉(zhuǎn)移方法(CN111128813A)”為檢索對象,通過檢索式“標題/摘要/權(quán)利要求書=(μLED AND 光學膠 AND 減黏膠)”的檢出結(jié)果情況對比各平臺組合字段的邏輯運算關(guān)系。
通過檢索發(fā)現(xiàn),PSS、專利之星、incoPat、智慧芽、INNOJOY、專利匯、佰騰可順利檢出目標專利,即真正支持跨字段檢索。而CNIPR、潤桐則不能檢出,其中,CNIPR中在“名稱,摘要,權(quán)利要求書”字段中檢索時,默認采用“+=”算符連接,檢索式為“名稱,摘要,權(quán)利要求書+=(μLED AND 光學膠 AND 減黏膠)”,要求檢索任意字段上同時滿足條件的記錄,即檢索式實為:(名稱=(μLED AND 光學膠 AND 減黏膠) AND 摘要=(μLED AND 光學膠 AND 減黏膠) AND 權(quán)利要求書=(μLED AND 光學膠 AND 減黏膠)) ?!?=”算符也可手動改為“*=”(檢索各個字段上滿足同一條件的記錄)、“^=”(檢索只有一個字段上滿足條件的記錄)。潤桐亦不能檢出目標專利,其組合字段內(nèi)的運算方式是+=,即檢索任意字段上同時滿足條件的記錄。
此外,萬象云在其“技術(shù)主題”檢索欄中支持專利名稱、摘要、權(quán)利要求、說明書的復(fù)選框,本文復(fù)選名稱、摘要、權(quán)利要求3項字段,看到其生成的檢索式為:(ti=(μLED AND 光學膠 AND 減黏膠) AND ab=(μLED AND 光學膠 AND 減黏膠) AND cl=(μLED AND 光學膠 AND 減黏膠))即相當于CNIPR的“+=”連接算符。
3.3.2 公開公告日字段
發(fā)明申請的公開日期及發(fā)明、實用新型、外觀設(shè)計的授權(quán)公告日期是開展專利統(tǒng)計分析工作的基準條件之一,在本文所選平臺中,除專利之星將公開日、公告日分開為兩個檢索字段外,其他平臺均將公開日期和授權(quán)公告日期合并為一個檢索字段。本文以“分類號=(H02K11) AND 公開(公告)日=(20200101 TO 20200501)”為檢索條件,考察各平臺的查全率(見表6)。
通過檢索結(jié)果可看出,CNIPA、CNIPR、PSS、incoPat、INNOJOY、潤桐檢出結(jié)果一致,共1005件,其中,發(fā)明申請416件,發(fā)明授權(quán)120件,實用新型469件。專利之星、智慧芽、萬象云檢出1004件,看似漏檢1件,實則不然,因檢出結(jié)果集中的發(fā)明專利“電機端部電壓采集電路及其應(yīng)用(CN110763904B)”的公開日期為2020年2月7日,授權(quán)日期為2020年4月7日,均符合公開、公告日條件,故而能檢出其申請公開(A文檔)和授權(quán)公告(B文檔)兩項數(shù)據(jù),專利之星、智慧芽、萬象云自動合并簡單同族后記為1件,故而只有1004件。
佰騰檢出結(jié)果中,發(fā)明授權(quán)只有1件。經(jīng)比對,其高級檢索頁面中的“公開(公告)日”實際只包含發(fā)明申請的公開日和實用新型、外觀設(shè)計的授權(quán)公告日,但未包含發(fā)明授權(quán)的公告日,因而造成發(fā)明授權(quán)的漏檢;其檢出的1件發(fā)明授權(quán)是 “電機端部電壓采集電路及其應(yīng)用(CN110763904B)”,公開日期為2020年2月7日,授權(quán)日期為2020年4月7日,其實是通過公開日檢出的。
專利匯檢出結(jié)果為1046件,比CNIPA等平臺多出41件,經(jīng)比對,多出的41件專利數(shù)據(jù)的公開公告日均為2020年5月5日,如CN111108668A、CN107078620B、CN210469150U等,應(yīng)是平臺數(shù)據(jù)處理有誤導(dǎo)致。
此外,進一步在佰騰中修改檢索式,增加授權(quán)公告日字段apd,檢索式為:ic1,ic2:(H02K11) AND ((pd:[20200101 TO 20200501]) OR (apd:[20200101 TO 20200501])) ,則可檢出109件發(fā)明授權(quán)。與CNIPA等相比,仍然漏檢11件。經(jīng)進一步比對發(fā)現(xiàn),其漏檢的數(shù)據(jù),如“一種省去霍爾位置傳感器調(diào)試過程的直流無刷電機(CN109256927B)”、“塑封電機(CN109038910B)”等均可在佰騰中通過申請?zhí)柣蚬_公告號檢出,且授權(quán)公告日期、IPC符合檢索條件,推測是因為分類號處理問題,導(dǎo)致漏檢。
4 結(jié)論與建議
本文以查全為視角,深入考察各檢索平臺的漏檢因素可得出以下結(jié)論與建議。
(1)多數(shù)專利信息平臺數(shù)據(jù)更新及時,在國家知識產(chǎn)權(quán)局(專利局)發(fā)布專利公報數(shù)據(jù)的第二天即完成數(shù)據(jù)收錄入庫,這可能得益于國家知識產(chǎn)權(quán)局大力提升公共服務(wù)能力,強化知識產(chǎn)權(quán)數(shù)據(jù)資源供給的扶持政策。但也有部分平臺存在數(shù)據(jù)更新不及時、更新周期不規(guī)則等問題,建議在專利查新、新公開專利檢索等時敏性服務(wù)中留意檢索平臺的數(shù)據(jù)更新時間,避免漏檢近期公開專利。
(2)分類號是檢索專利技術(shù)的重要途徑,也是較難察覺的漏檢因素。上述測試表明,部分檢索平臺未有效整合歐洲專利局等平臺的IPC分類號數(shù)據(jù),而自身又不具備及時大規(guī)模更新數(shù)據(jù)的情況下,難以跟上國際專利分類號(IPC)的周期性更新,導(dǎo)致數(shù)據(jù)漏檢。還有部分平臺因為分類號處理問題導(dǎo)致未檢出。建議在涉及專利技術(shù)檢索的應(yīng)用場景中,應(yīng)在多平臺進行試檢,并通過檢出結(jié)果的比對了解不同平臺在分類號處理、表達之間的細微差異,進而針對性優(yōu)化檢索策略,提高查全率。
(3)在省市區(qū)域性專利數(shù)據(jù)檢索中,國省代碼字段比地址窮舉的檢索方式具有更高的檢索效率和更小的檢索誤差,但各平臺在國省代碼的檢索詞表達及范圍界定上存在差異,檢索時應(yīng)參照檢索平臺的字段說明編制檢索式,避免漏檢。同時,不同平臺在合作申請及轉(zhuǎn)讓專利的專利權(quán)人地域認定規(guī)則不盡相同,相關(guān)檢索中應(yīng)根據(jù)檢索要求和平臺規(guī)則制定相應(yīng)的檢索策略,減少遺漏。
(4)部分檢索字段名稱相似,如“名稱/摘要/權(quán)利要求書”組合字段、公開公告日字段等,但在不同平臺中,其含義及檢索規(guī)則存在差別,容易導(dǎo)致漏檢,是影響查全率的隱蔽因素。建議檢索人員通過對比不同平臺間相似字段,尤其是組合字段的檢索結(jié)果差異,了解組合字段背后檢索規(guī)則及數(shù)據(jù)范圍的細微差別,并采取相應(yīng)的措施優(yōu)化檢索策略,避免漏檢。
參考文獻
[1]沈艷紅.信息檢索中檢索詞的選擇對查全率的影響[J].情報探索,2006(11):73-74.
[2]俞平.信息檢索中文獻漏檢誤檢因素分析[J].情報科學,2011(8):1234-1237,1243.
[3]PERRY J W.[J].Operational criteria designing information rettrival systems[J]. American Documentation,1955(2):93-101.
[4]邱黎雯.關(guān)于查全率和查準率問題研究概況[J].情報科學,1984(5):5-11.
[5]黃瑞芬.文獻數(shù)據(jù)庫檢索中的漏檢與誤檢原因及對策[J].國防技術(shù)基礎(chǔ),2004(6):43-44.
[6]馬琦.淺析專利文獻深度加工中標引詞的發(fā)展趨勢[J].中國發(fā)明與專利,2015(9):34-35.
[7]王彩霞,魏健波.淺談中國藥物專利數(shù)據(jù)庫建設(shè)中的藥物專利標引工作[J].中國發(fā)明與專利,2019(5):82-86.
[8]李宏芳,鄒小筑.中國專利數(shù)據(jù)庫標引質(zhì)量測評[J].現(xiàn)代情報,2010(12):58-61.
[9]張杰,張海超,翟東升,等.基于領(lǐng)域本體的專利信息檢索研究[J].情報科學,2014(10):9-14.
[10]趙娟,潘薇,劉會景.基于中國專利數(shù)據(jù)庫的專題技術(shù)檢索策略:以循環(huán)腫瘤細胞技術(shù)為例[J].情報工程,2016(4):49-55.
[11]王吉霞.專利防侵權(quán)調(diào)查的檢索方法探究[J].現(xiàn)代情報,2014(6):95-98.
[12]吳宏霞,胡曉佳.淺析專利檢索中如何避免漏檢[J].中國發(fā)明與專利,2018(11):87-91.
[13]周美霞,付占海,麗娜.淺談專利檢索中查全查準率驗證過程及注意問題[J].中國發(fā)明與專利,2017(9):91-93.
[14]賈鈞琳,孫海燕,李征,等.化學領(lǐng)域發(fā)明專利申請檢索的漏檢原因淺析[J].中國發(fā)明與專利,2012(增刊1):148-151.
[15]馬莉.從S系統(tǒng)漏檢案例淺談Patentics降噪效果[J].中國新通信,2019(10):145.
[16]戚敏.國內(nèi)專利網(wǎng)站專利檢索的比較評析[J].情報雜志,2002(12):59-61.
[17]岳泉,晏一平.中外專利信息網(wǎng)絡(luò)檢索工具的比較研究[J].圖書情報工作,2005(9):86-90.
[18]李健康,許四洋,張政寶.九個常用中國專利檢索網(wǎng)站比較研究[J].圖書館論壇,2010(6):191-200.
[19]曹平.中外專利文獻信息檢索平臺比較研究[J].情報探索,2011(7):67-69.
[20]羅立國,余翔,鄭婉婷,等.專利檢索網(wǎng)站比較研究[J].情報雜志,2012(3):163-167.
[21]蔣凌,鐘永恒,劉佳.我國專利信息平臺分析與增值服務(wù)對比研究[J].情報雜志,2013(9):163-166.
[22]陳海英,文禹衡.Innography、WIPS和Patentics專利引文分析比較研究[J].圖書情報工作,2015(18):117-126.
[23]黎子輝,劉亞娟.常用中國專利數(shù)據(jù)庫評析[J].圖書館研究,2020(1):43-49.
[24]王云.電腦網(wǎng)絡(luò)信息檢索方法[M].北京:國防工業(yè)出版社,1999.
[25]孟俊娥.專利檢索策略及應(yīng)用[M].北京:知識產(chǎn)權(quán)出版社,2010.
Research on the factors of retrieval platforms affecting the recall ratio of patents:taking
domestic patent information retrieval platforms as an example
Abstract: Patent information retrieval platforms are essential tools for obtaining patent literature information and carrying out patent information services. The quality of data retrieval is the fundamental guarantee for conducting patent literature information retrieval and intelligence analysis services. This paper examines the factors that affect the recall ratio of various patent information retrieval platforms under the same retrieval conditions from three dimensions: data update, data processing, and retrieval fields. Specifically, through actual cases, it compares the differences in retrieval results of 11 patent information retrieval platforms such as CNIPA and PSS in terms of data update cycle, classification number processing, expression of national and provincial codes, combination field processing, etc., and uncovers the reasons for the differences such as different data sources, data processing errors, and different retrieval logics, and then puts forward relevant suggestions to help patent information retrieval and analysis personnel use each retrieval platform more effectively.
Key words: patent; retrieval platform; recall ratio