黃云雪 孫瑞生
(國家知識產(chǎn)權局專利局專利審查協(xié)作天津中心,天津 300304)
專利審查過程中,審查員需要通過關鍵詞、分類號匹配的方式來進行檢索。但是在檢索時,對于方法的具體步驟、步驟與步驟之間的邏輯關系、結構部件的位置描述、結構與結構之間的邏輯關系等經(jīng)常出現(xiàn)難以提煉關鍵詞、關鍵詞擴展不全面、分類號不準確等情形,給檢索帶來較大困難。而且,傳統(tǒng)的檢索工具是S系統(tǒng),使用S系統(tǒng)進行檢索獲得檢索結構后,通常需要進行全文瀏覽來獲取對比文件,瀏覽檢索結果獲取對比文件的時間較長,不能較快地找到可用的對比文件。
近些年隨著人工智能和大數(shù)據(jù)技術的發(fā)展,智能化檢索應運而生,例如廣泛使用的PATENTICS智能檢索平臺[1-2]。智能化檢索是指在檢索過程中,平臺不再拘泥于用戶所輸入請求語句的字面本身,而是透過現(xiàn)象看本質,準確地捕捉用戶輸入語句后面的真正意圖,自動將用戶輸入的內容進行同義詞、近義詞以及其他語種擴展,并以此進行搜索,從而更準確地向用戶反饋最符合其需要的搜索結果[3]。
基于智能化檢索的理念,國家知識產(chǎn)權局于2022年7月上線了智能化檢索系統(tǒng),為專利申請的檢索帶來了很大的便利。
新的智能化檢索系統(tǒng)以語義檢索為核心,以“快、準、全”為目標,對文獻數(shù)據(jù)資源進行重新整合并新增智能檢索功能。在對專利文獻進行整合時,將文摘數(shù)據(jù)庫和全文數(shù)據(jù)庫進行整合避免轉庫操作,同時,將外文數(shù)據(jù)庫的數(shù)據(jù)翻譯為中文,審查員可使用中文進行檢索并瀏覽中文檢索結果,避免了由于語言障礙導致外文專利數(shù)據(jù)庫檢索不充分的問題。新增智能檢索功能包括融合檢索功能,通過簡易的人機交互界面實現(xiàn)選庫、檢索、概覽、輔助工具一體化;在融合檢索時,用戶只要輸入案件的申請?zhí)柣蛳嚓P文本就可以進行純語義檢索并將檢索結果基于語義相關度進行排序輸出,并且還提供先布爾檢索后語義排序以及先語義檢索后布爾篩選的檢索方式,將語義檢索和人工干預相結合,進一步提高了檢索效能;此外,新的智能化檢索系統(tǒng)還具有特色功能——一站式瀏覽功能,一站式檢索功能在獲得檢索結果后可以基于技術特征畫像實現(xiàn)對比文件的快速瀏覽及篩選,幫助審查員在眾多檢索結果中快速命中相關對比文件。
本研究通過三個實際案例在國家知識產(chǎn)權局自主開發(fā)的智能化檢索系統(tǒng)中的檢索過程,探究如何通過智能化檢索系統(tǒng)提高專利申請的檢索效能。
當使用智能化檢索系統(tǒng)進行檢索時,除了最簡單地通過申請?zhí)栠M行純語義檢索之外,還需要充分利用人工干預手段來提高檢索效率。由于智能化檢索系統(tǒng)在純語義檢索時,將本申請與數(shù)據(jù)庫中的文獻進行全文相似度計算,其排名在前的文獻與本申請技術方案的相關度較大,因而,可利用相關度較大的文獻中所記載的內容對關鍵詞進行擴展,降低關鍵詞表達的難度。
案例一。本案例的權利要求1請求保護一種信息推薦方法。其特征在于,根據(jù)目標用戶的目標用戶標簽,確定多個推薦信息;確定所述多個推薦信息中每個推薦信息的預設優(yōu)先級和預測優(yōu)先級;根據(jù)所述預設優(yōu)先級和所述預測優(yōu)先級,確定所述每個推薦信息的加權優(yōu)先級;根據(jù)所述多個推薦信息和所述每個推薦信息的加權優(yōu)先級,向所述目標用戶進行信息推薦。
本案針對現(xiàn)有推薦方法獲得的推薦信息轉化率不高的問題,提出基于推薦信息的預設優(yōu)先級和預測優(yōu)先級確定推薦信息的加權優(yōu)先級進行推薦,從而有效提高推薦信息的轉化率。在說明書中具體說明了預設優(yōu)先級為:運營人員基于特定營銷需求和/或運營人員的營銷經(jīng)驗,設置排序規(guī)則,進而營銷推薦系統(tǒng)根據(jù)預設排序規(guī)則,為信息數(shù)據(jù)庫中的信息確定預設優(yōu)先級;對預測優(yōu)先級的定義為:為目標用戶確定多個推薦信息之后,營銷推薦系統(tǒng)根據(jù)每個推薦信息的歷史點擊數(shù)據(jù),確定每個推薦信息的預測點擊率,進而根據(jù)每個推薦信息的預測點擊率,通過預設排序算法,實時計算每個推薦信息的預測優(yōu)先級。根據(jù)權利要求記載的技術方案以及說明書中所記載的內容可知,本申請的關鍵技術手段為通過預設優(yōu)先級和預測優(yōu)先級確定推薦信息的加權優(yōu)先級進行推薦,因而,可以提煉出“預測優(yōu)先級、預設優(yōu)先級,推薦,加權”等關鍵詞作為檢索要素。然而,由于“預測優(yōu)先級”和“預設優(yōu)先級”并非本領域常用的表達方式,并且“推薦”和“加權”帶來的檢索噪聲十分大,因而,本案在檢索時的難點在于對“預測優(yōu)先級”和“預設優(yōu)先級”如何擴展以及檢索噪聲大的問題。
利用智能化檢索系統(tǒng)對本案進行檢索,檢索過程如下。
第一步:進行純語義檢索,檢索結果默認設置為400篇;對檢索結果進行初步瀏覽發(fā)現(xiàn)多篇對比文件中公開了對多種推薦方式的推薦結果進行融合獲得推薦結果,本案中將預測優(yōu)先級和預設優(yōu)先級進行加權也是一種融合的方式。
第二步:對關鍵詞進行擴展,利用關鍵詞“加權,融合”對初步語義檢索結果進行布爾篩選,在前10個檢索結果中獲得可評述本申請創(chuàng)造性的兩篇對比文件CN107729542A、CN106997374A,整個檢索過程不需要對“預測優(yōu)先級”和“預設優(yōu)先級”進行擴展,檢索過程簡單高效。
智能化檢索系統(tǒng)在使用申請?zhí)栠M行純語義檢索時,系統(tǒng)基于申請文件的全文進行語義匹配,語義排序的結果取決于提取的關鍵詞的質量,如果關鍵技術手段的描述重點和篇幅不夠突出時,語義排序的結果可能受到方案中其他不是關鍵技術手段的技術特征的影響,導致檢索結果不佳。智能化檢索系統(tǒng)在進行語義檢索時,除了可以使用申請?zhí)栕鳛檎Z義排序基準,還可以使用文本作為語義排序基準,通過改寫發(fā)明構思作為語義檢索的基礎,排除其他無關技術特征的影響。
案例二。本案例涉及一種信息推薦方法。其特征在于,包括:接收到針對信息項集合的推薦指令;響應于所述推薦指令,從所述信息項集合包含的多個信息項中篩選出至少兩個信息項,其中,所述推薦指令中未對所述至少兩個信息項進行指定;對所述至少兩個信息項進行對比,得到對比信息;將所述對比信息和所述至少兩個信息項作為推薦結果進行展示。
本案針對現(xiàn)有在進行推薦結果顯示時,需要用戶分別點擊查看多個列表項的具體內容進行查看來選擇最終的推薦信息,該過程耗費用戶大量精力且效率較低,因而本申請?zhí)岢鐾ㄟ^點擊預定按鈕等簡單操作下達針對列表的推薦指令,自動為用戶篩選出兩個列表項進行對比得到對比信息,再將至少兩個列表項和對比信息作為推薦結果展示給用戶以減少用戶選擇的精力和提高效率。通過上述對技術方案的理解,可以確定其關鍵技術手段為篩選推薦結果進行比較得到比較信息進行顯示。
本案的檢索難點在于:描述本申請關鍵技術手段篩選、信息項、對比的表達方式太多且不準確,在進行檢索時擴展的關鍵詞難以做到全面,并且涉及推薦的分類號有多個,例如G06F17/30、G06Q30的下位點組等,可預估若使用關鍵詞和分類號進行檢索,檢索噪聲將會比較大,很難獲得合適的對比文件。
利用智能化檢索系統(tǒng)對本案進行檢索的過程如下。
第一步:進行純語義檢索,檢索結果默認設置為400篇,考慮到本案申請日為2016年,申請時間較早且在其后推薦類相關申請數(shù)量較大,因而采用申請日限定進行初步語義檢索。通過閱讀前40條檢索結果均為對推薦信息顯示的技術方案,均沒有公開本申請中的選擇信息項進行對比。
第二步:為了提高命中效率,使用“對比”的同義詞“對比、比較、相比”進行人工干預,獲得82條檢索結果,然而也并未獲得本申請中選擇信息項進行對比的對比文件。
第三步:對檢索結果進行分析并調整檢索思路,未檢索到可用對比文件的原因一方面可能是本申請技術方案在描述時由于涉及推薦信息篩選顯示,而只要是與推薦信息相關的案件,大多都會有篩選推薦信息進行顯示的過程,即使使用“對比、比較、相比”進行布爾篩選,由于上述詞語在專利文件中普遍存在,因而也無法在眾多對比文件中篩選出可用對比文件;另一方面考慮在進行語義檢索時,是否能準確表達關鍵技術手段十分關鍵,由于中文語法表達的多樣化以及一詞多義性,直接基于申請文件中的表達方式進行機器檢索,使得語義檢索不能很好地對關鍵技術手段進行有效的檢索,導致檢索結果不理想。此時,可以對技術方案進行重新表達,使得技術方案的表達方式更容易讓機器理解;針對本案,將其方案表達為:自動為用戶篩選出兩個結果,以及對至少兩個結果進行對比,得到對比信息,再將所述至少兩個結果和對比信息作為推薦結果展示給用戶;檢索獲得兩篇對比文件CN105469274A、CN104699843A,均公開了本申請中從推薦結果中選擇至少兩個信息項進行比較獲得比較結果并顯示。
S檢索系統(tǒng)在外文庫進行檢索時,需要將中文關鍵詞翻譯為英文關鍵詞,由于語言文化的不同,經(jīng)常出現(xiàn)英文關鍵詞表達不準確、英文文獻閱讀困難等問題;智能化檢索系統(tǒng)對專利文獻數(shù)據(jù)進行了整合,將外文專利翻譯為中文,使得審查員在檢索時可以跨越語言障礙,提高外文文件檢出率。并且,智能化檢索系統(tǒng)支持同時檢索多個數(shù)據(jù)庫,減少跨庫操作。
案例三。本案例涉及一種指紋識別的方法,其特征在于,包括:獲取目標按壓指紋傳感器的指紋圖像;對所述指紋圖像進行處理,得到所述指紋圖像的梯度信息;根據(jù)所述指紋圖像的梯度信息,確定所述目標是否為真實手指。
本案針對現(xiàn)有技術區(qū)分真假指紋的方法是在指紋傳感器外增加額外傳感器的缺陷,提出一種能夠不增加額外傳感器的情況下,根據(jù)指紋圖像的梯度信息,確定按壓指紋傳感器的手指是否為真實手指的方法,具體方案如權利要求1所記載的部分。提煉本案關鍵為通過指紋圖像的梯度信息判斷手指是否為真實手指,關鍵詞為“指紋、圖像、梯度、手指、梯度、真實”。
本案的檢索難點在于:本案涉及的是指紋識別方法,中文和外文庫均可能存在對比文件,而關于指紋識別的外文文獻數(shù)據(jù)量大,且“真實”屬于功能性限定,關鍵詞難以擴展,且外文文獻量大時瀏覽效率較低。
利用智能化檢索系統(tǒng)對本案進行檢索,步驟如下。
第一步:選取CNTXT和USTXTC兩個數(shù)據(jù)庫,使用“梯度S(指紋or手指)S(真or假)”進行布爾檢索,檢索到較多計算計算指紋梯度的方案。第二步:為了提高命中效率,即獲得計算手指梯度信息是用于判斷目標手指是真實手指,使用權利要求1的技術方案作為語義排序基準進行排序,檢索獲得X對比文件US2018129857A。
本研究通過三個案例的檢索過程,闡述了在檢索過程中如何利用智能檢索系統(tǒng)提高檢索效能。在利用智能檢索系統(tǒng)進行檢索時,需要審查員充分利用其純語義檢索、先語義檢索后布爾篩選、先布爾篩選后語義排序、語義改寫等功能,并基于檢索結果調整檢索策略。檢索工具并非萬能的,檢索能力的提高過程也并非一蹴而就,審查員需要針對各個領域的案件特點充分利用智能檢索系統(tǒng)提供的各項功能,不斷積累檢索經(jīng)驗和技巧,進一步提高檢索效能。