DOI:10.19327/j.cnki.zuaxb.1007-1199.2025.01.007
摘 要:2023年人工智能領(lǐng)域?qū)06F18分類號(hào)納入了審查范圍,G06F18分類號(hào)描述為模式識(shí)別,模式識(shí)別是人工智能領(lǐng)域一個(gè)重要的分支,該類分類號(hào)在IPC分類表2023年1月版本中首次出現(xiàn)。介紹G06F18及其下屬條目分類號(hào)的含義,對(duì)G06F18分類號(hào)的分類位置進(jìn)行解析。利用共現(xiàn)分析方法分析模式識(shí)別交叉領(lǐng)域的分類號(hào),有助于審查員對(duì)G06F18領(lǐng)域以及交叉領(lǐng)域申請(qǐng)分類號(hào)的了解、使用,提高本領(lǐng)域與跨領(lǐng)域分類、檢索效率。
關(guān)鍵詞:模式識(shí)別;人工智能;G06F18;共現(xiàn)分析
中圖分類號(hào):G255.53" 文獻(xiàn)標(biāo)識(shí)碼:A" "文章編號(hào):1007-1199(2025)01-0039-09
近些年來,隨著人工智能算法尤其是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的提出、計(jì)算機(jī)設(shè)備算力的增強(qiáng),人工智能技術(shù)及其相關(guān)產(chǎn)業(yè)飛速發(fā)展,從而使得人工智能領(lǐng)域的專利申請(qǐng)呈爆發(fā)式增長。模式識(shí)別是人工智能領(lǐng)域的基礎(chǔ),它同樣取得了令人矚目的成就。
模式識(shí)別是指對(duì)表征事物或現(xiàn)象的各種形式的信息進(jìn)行處理和分析,對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分[1]。模式識(shí)別可對(duì)語音、地震波、心/腦電圖、圖像、文字、符號(hào)、生物傳感器等對(duì)象的具體模式進(jìn)行辨識(shí)和分類,它廣泛應(yīng)用于圖像識(shí)別、語音識(shí)別、生物信息學(xué)等多領(lǐng)域中,作為人工智能技術(shù)基礎(chǔ)學(xué)科的模式識(shí)別技術(shù)的專利申請(qǐng)量也在不斷地增長。
在國際專利分類表(IPC)2022.01[2]及以前的版本中,模式識(shí)別并未有專門的分類號(hào),常被劃分在分類號(hào)G06K9/00、G06V等下,如G06K9/00識(shí)別模式的方法或裝置,G06V30/00面向文檔的基于圖像的模式識(shí)別,都是針對(duì)特定技術(shù)領(lǐng)域進(jìn)行模式識(shí)別,且未進(jìn)行技術(shù)細(xì)分,不利于模式識(shí)別相關(guān)專利的分類和檢索。2023年發(fā)布的國際專利分類表(IPC)2023.01 [3]對(duì)模式識(shí)別的分類標(biāo)準(zhǔn)進(jìn)行了較大幅度的修訂,在修訂過程中,新增了G06F18/00模式識(shí)別大組分類號(hào),在該分類號(hào)下增加了大量技術(shù)分支,可有效提高本領(lǐng)域文獻(xiàn)檢索分類的準(zhǔn)確性和效率。
本文針對(duì)IPC分類表在這次修訂中新增的G06F18分類設(shè)置進(jìn)行解析,并對(duì)G06F18領(lǐng)域分類號(hào)進(jìn)行共現(xiàn)分析,結(jié)合相關(guān)案例探討G06F18分類號(hào)在人工智能領(lǐng)域及跨領(lǐng)域分類、檢索中的有效性。
1 模式識(shí)別IPC分類修訂情況
1.1 修訂前后IPC分類位置比對(duì)
在國際專利分類表(IPC)2022.01中,模式識(shí)別分類位置比較分散,大都劃分在分類號(hào)G06K9(識(shí)別模式的方法或裝置)、G06T7(圖像分析)、G06V(圖像或視頻識(shí)別或理解)、A61B5(用于診斷目的的測量;人的辨識(shí))下,涉及模式分類、對(duì)象識(shí)別、客體識(shí)別等,但并未對(duì)其進(jìn)行技術(shù)細(xì)分,在實(shí)際分類和檢索中,上述分類位置并不能精準(zhǔn)地體現(xiàn)發(fā)明點(diǎn)和發(fā)明構(gòu)思,不利于文獻(xiàn)的有效分類和檢索。
修訂后的國際專利分類表(IPC)2023.01中將分類號(hào)G06K9刪除,新增了大組G06F18/00以及其下位點(diǎn)組,專門用于對(duì)模式識(shí)別進(jìn)行分類。其包含了4個(gè)一點(diǎn)組、9個(gè)二點(diǎn)組、8個(gè)三點(diǎn)組、21個(gè)四點(diǎn)組、2個(gè)五點(diǎn)組,涉及預(yù)處理、分析、后處理、特別適用于模式識(shí)別的軟件裝置等各類模式識(shí)別的技術(shù)主題。
1.2 G06F18分類位置
模式識(shí)別通常包括數(shù)據(jù)的獲取和預(yù)處理、特征提取與選擇、分類或聚類、后處理四個(gè)主要部分。修訂后的國際專利分類表(IPC)2023.01以技術(shù)方案涉及的功能對(duì)模式識(shí)別分類號(hào)進(jìn)行劃分,在大組G06F18/00模式識(shí)別下設(shè)置了三個(gè)一點(diǎn)組,詳見圖1,分別為G06F18/10預(yù)處理、數(shù)據(jù)清理,G06F18/20分析,G06F18/30后處理。涉及模式識(shí)別的主要流程步驟:G06F18/10預(yù)處理、數(shù)據(jù)清理對(duì)應(yīng)了模式識(shí)別流程的最初階段;G06F18/20分析對(duì)應(yīng)了模式識(shí)別流程的特征提取與選擇、分類或聚類;G06F18/30后處理對(duì)應(yīng)了模式識(shí)別流程的最后一個(gè)環(huán)節(jié)。
另外,還根據(jù)技術(shù)方案涉及的應(yīng)用劃分了一點(diǎn)組G06F18/40特別適用于模式識(shí)別的軟件裝置,例如用戶界面或工具箱。對(duì)檢索有利的技術(shù)主題都應(yīng)該被分類,2023.01版IPC基于模式識(shí)別關(guān)鍵手段對(duì)IPC分類表進(jìn)行了擴(kuò)充,增設(shè)了大量細(xì)分條目,具體為:
1.2.1 G06F18/10
G06F18/10為2023.01版IPC新增的技術(shù)主題,其分類含義為:預(yù)處理;數(shù)據(jù)清理。其下包含了1個(gè)二點(diǎn)組G06F18/15統(tǒng)計(jì)預(yù)處理,例如標(biāo)準(zhǔn)化或恢復(fù)缺失數(shù)據(jù)的技術(shù),詳見表1。預(yù)處理是模式識(shí)別的最初階段,原始數(shù)據(jù)常需要經(jīng)過預(yù)處理,以消除數(shù)據(jù)噪聲,減少數(shù)據(jù)的維度,或者將數(shù)據(jù)轉(zhuǎn)換為更適合后續(xù)處理的形式,數(shù)據(jù)預(yù)處理的方法有很多,例如歸一化、標(biāo)準(zhǔn)化等。
雖然模式識(shí)別可對(duì)各種形式數(shù)據(jù)(主要是感知數(shù)據(jù),如圖像、視頻、語音等)進(jìn)行處理和分析,但對(duì)于圖像、視頻識(shí)別的預(yù)處理,有專門的分類位置:G06V10/20(圖像預(yù)處理)、G06V10/72(數(shù)據(jù)準(zhǔn)備,例如 圖像或視頻特征的統(tǒng)計(jì)預(yù)處理)、G06V30/16(字符識(shí)別下的圖像預(yù)處理);對(duì)于語音識(shí)別的預(yù)處理,其專門的分類位置為G10L17/02(預(yù)處理操作,例如:片斷選擇;模式表示或模擬,例如基于線性判別式分
析(LDA)或主要部件;特征選擇或提?。R虼?,可以確定G06F18/10所涉及的預(yù)處理對(duì)象是除圖像、語音的數(shù)據(jù),如故障數(shù)據(jù)、振動(dòng)信號(hào)、時(shí)序數(shù)據(jù)等,在實(shí)際分類和檢索時(shí)可針對(duì)專利申請(qǐng)預(yù)處理數(shù)據(jù)的不同將其分類到合適的預(yù)處理位置。另外,在專利申請(qǐng)同時(shí)涉及多種形式數(shù)據(jù)時(shí),為了便于檢索,可進(jìn)行多重分類。如專利申請(qǐng)同時(shí)涉及故障信號(hào)檢測和故障圖像檢測的預(yù)處理,可將其分類到G06F18/10和G06V10/20下。
1.2.2 G06F18/20
G06F18/20為2023.01版IPC分類表新增的技術(shù)主題,其分類含義為:分析。該技術(shù)主題是模式識(shí)別的核心,包括了G06F18/21(識(shí)別系統(tǒng)或技術(shù)的設(shè)計(jì)與設(shè)置;特征空間中的特征提??;盲源分離)、G06F18/22(匹配標(biāo)準(zhǔn),例如相鄰性測量)、G06F18/23(聚類技術(shù))、G06F18/24(分類技術(shù))、G06F18/25(融合技術(shù))、G06F18/26(發(fā)現(xiàn)頻繁模式)、G06F18/27(回歸,例如線性或邏輯回歸)、G06F18/28(確定有區(qū)分的參考模式,如平均或變形模式;產(chǎn)生字典)。其中特征提取、分類、聚類是模式識(shí)別分析中的關(guān)鍵技術(shù),下面重點(diǎn)針對(duì)上述三個(gè)分類號(hào)進(jìn)行著重分析。
1)G06F18/21
特征提取是模式識(shí)別的核心環(huán)節(jié)之一,修訂后的IPC分類號(hào)對(duì)G06F18/21進(jìn)行了進(jìn)一步細(xì)分,增加了更多的技術(shù)分支,可根據(jù)相關(guān)技術(shù)方案進(jìn)行精準(zhǔn)的下位劃分,詳見圖2。
在2023.01版IPC分類表中,關(guān)于特征提取的分類位置還包括:G06V10/46(形狀、輪廓或點(diǎn)相關(guān)描述符的描述符,例如 尺度不變特征變換 [SIFT] 或詞袋 [BOW];顯著區(qū)域特征(顏色特征提取G06V10/56))、
G06V10/62(與時(shí)間維度相關(guān),例如基于時(shí)間的特征提??; 模式跟蹤)、G10L15/02(語音識(shí)別的特征提取;識(shí)別單位的選擇)。由于G06V10大組的含義為圖像或視頻識(shí)別或理解的安排,G10L15大組的含義為語音識(shí)別,因此,在實(shí)際分類和檢索時(shí)可針對(duì)專利申請(qǐng)?zhí)卣魈崛?shù)據(jù)的不同將其分類到合適的預(yù)處理位置。
2)G06F18/23和G06F18/24
模式識(shí)別從處理問題的性質(zhì)和解決問題的方法等角度,可分為有監(jiān)督分類(分類)和無監(jiān)督分類(聚類),分類和聚類是模式識(shí)別的關(guān)鍵環(huán)節(jié)。修訂后的IPC分類號(hào)增設(shè)了G06F18/23聚類技術(shù)和G06F18/24分類技術(shù)的分類位置,并對(duì)相關(guān)技術(shù)分支進(jìn)行了多級(jí)擴(kuò)展,覆蓋了模式識(shí)別中常用的分類和聚類方法,詳見圖3、圖4。
在2023.01版IPC分類表中,關(guān)于聚類和分類的分類位置還包括G06F16/35、G06F16/45、G06F16/55、G06F16/65、G06F16/75,其分類含義為聚類;分類。僅從類名和分類定義上容易將其與模式識(shí)別的聚類技術(shù)和分類技術(shù)混淆,但是小組范圍的確定限于其大組和其上面任何一級(jí)小組的有效范圍內(nèi),從G06F16/00大組的分類含義信息檢索、數(shù)據(jù)庫結(jié)構(gòu)、文件系統(tǒng)結(jié)構(gòu)可知,上述分類號(hào)分別針對(duì)的是數(shù)據(jù)對(duì)象為非結(jié)構(gòu)文本數(shù)據(jù)、多媒體數(shù)據(jù)、靜態(tài)圖像數(shù)據(jù)、音頻數(shù)據(jù)、視頻數(shù)據(jù),其分類和聚類均是為數(shù)據(jù)庫檢索非結(jié)構(gòu)文本數(shù)據(jù)等特定對(duì)象服務(wù)的。
另外,G06V小類中對(duì)于圖像或視頻也給出了分類、聚類的分類號(hào),其在小類索引中指出:在本小類中,下列術(shù)語或表述的使用具有指明的含義:模式識(shí)別是指通過獲取、預(yù)處理或提取顯著特征并對(duì)這些特征進(jìn)行匹配、聚類或分類,對(duì)模式進(jìn)行檢測、分類、認(rèn)證和識(shí)別,以用于解釋目的從圖像或視頻中推導(dǎo)出某種含義;特征提取是指從圖像或視頻中得出描述性或定量的度量;聚類是指根據(jù)模式的不同與相似性或接近程度對(duì)模式進(jìn)行分組或分離;分類是指通過分配標(biāo)簽將對(duì)象/特征識(shí)別為屬于一類對(duì)象/特征。其下包含G06V10/26(圖像區(qū)域中的圖案分割;切割或合并圖像元素以建立圖案區(qū)域,例如基于聚類的技術(shù);遮擋檢測)、G06V10/762(使用聚類,例如 社交網(wǎng)絡(luò)中的相似面孔)、G06V10/764(使用分類,例如視頻對(duì)象)、G06V30/413(內(nèi)容分類,例如文字、照片或表格)。由此可見,G06V小類下關(guān)于分類、聚類的分類號(hào)是針對(duì)特定數(shù)據(jù)對(duì)象進(jìn)行分類的,如圖像、視頻、文字等。因此,可以確定G06F18/20中所涉及的分類、聚類處理對(duì)象是針對(duì)除圖像、文字等的數(shù)據(jù),在進(jìn)行分類和檢索時(shí),可針對(duì)專利申請(qǐng)?zhí)幚頂?shù)據(jù)的選擇不同的分類號(hào)。另外,在專利申請(qǐng)同時(shí)涉及多種形式數(shù)據(jù)的分類和聚類時(shí),為了便于檢索,基于多重分類原則,可同時(shí)將其分類到G06F18/23、G06F18/24和G06V下。
1.2.3 G06F18/30
G06F18/30為2023.01版IPC新增的技術(shù)主題,其分類含義為:后處理。IPC中未對(duì)其進(jìn)一步細(xì)分。模式識(shí)別中的后處理是利用對(duì)象模式與周圍模式的相關(guān)性驗(yàn)證模式類別的過程[4]。在分類和檢索的過程中,要注意分類號(hào):G06V30/26(后處理技術(shù),例如 修正識(shí)別結(jié)果),單從分類含義上容易與模式識(shí)別的后處理相混淆,查看G06V30/26的上位點(diǎn)組G06V30/10(字符識(shí)別)可知,G06V30/26是針對(duì)字符識(shí)別的后處理,在分類和檢索實(shí)踐中還是需要根據(jù)處理對(duì)象將其分類到相應(yīng)的位置。
2 G06F18領(lǐng)域IPC跨領(lǐng)域分類號(hào)共現(xiàn)分析
模式識(shí)別技術(shù)作為對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程被廣泛應(yīng)用于不同的領(lǐng)域,如圖像識(shí)別和計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等,并且其應(yīng)用領(lǐng)域一直在不斷拓展。模式識(shí)別的專利申請(qǐng)也常常涉及各種應(yīng)用領(lǐng)域,相關(guān)專利的分類號(hào)不僅要根據(jù)模式識(shí)別涉及的功能和應(yīng)用將其分類到G06F18下各分支,還常常根據(jù)處理的數(shù)據(jù)類型、涉及的具體領(lǐng)域?qū)Ψ诸愄?hào)進(jìn)行多維度分類。因此,技術(shù)交叉融合案件難以在分類表中確定準(zhǔn)確位置。
共現(xiàn)分析是將各種信息載體中的共現(xiàn)信息用定量化的分析方法,以揭示信息的內(nèi)容關(guān)聯(lián)和特征項(xiàng)所隱含的寓意,科技論文中的共現(xiàn)是指相同或不同類型特征項(xiàng)共同出現(xiàn)的現(xiàn)象,如多篇論文之間共同共現(xiàn)的主題(關(guān)鍵詞)、合作者、合作機(jī)構(gòu),以及論文與關(guān)鍵詞、機(jī)構(gòu)與作者共同出現(xiàn)等[5]。當(dāng)一件專利擁有兩個(gè)或兩個(gè)以上的分類號(hào)時(shí),可以將這種情況稱為分類號(hào)的共現(xiàn)。分類號(hào)共現(xiàn)反映了兩個(gè)專利分類號(hào)所代表的技術(shù)領(lǐng)域交叉[6]。為了得到模式識(shí)別與其他領(lǐng)域間的關(guān)聯(lián)性,可以基于VOSviewer軟件通過分類號(hào)共現(xiàn)分析方法得到與G06F18領(lǐng)域相關(guān)聯(lián)的交叉領(lǐng)域,并進(jìn)行可視化分析。
2.1 樣本數(shù)據(jù)
選擇HimmPat專利數(shù)據(jù)庫,以“G06F18/+/icm”(G06F18/+為主分類)為關(guān)鍵詞在國內(nèi)庫進(jìn)行檢索,得到26 664條記錄,下載每個(gè)專利的分類號(hào)信息,導(dǎo)入Excel中進(jìn)行匯總。經(jīng)過數(shù)據(jù)去重、清洗得到19 689條記錄,按照申請(qǐng)日排序選取最近的6050條數(shù)據(jù)進(jìn)行專利分類號(hào)共現(xiàn)分析。
2.2 數(shù)據(jù)轉(zhuǎn)換
本文進(jìn)行專利分類號(hào)共現(xiàn)分析是基于VOSviewer可視化軟件工具進(jìn)行。VOSviewer是一款通過網(wǎng)絡(luò)數(shù)據(jù)的關(guān)系構(gòu)建可視化分析,實(shí)現(xiàn)科學(xué)知識(shí)圖譜的繪制,展現(xiàn)知識(shí)領(lǐng)域的結(jié)構(gòu)、進(jìn)化、合作等關(guān)系的軟件工具,可支持從Web of Science、Scopus、Dimensions和Lens中下載的數(shù)據(jù),因目前不支持對(duì)Excel格式直接分析,需要對(duì)獲取的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換。利用Python將獲取到的數(shù)據(jù)轉(zhuǎn)換為refworks格式。
2.3 數(shù)據(jù)分析
將轉(zhuǎn)換后的refworks格式數(shù)據(jù)導(dǎo)入到VOSviewer軟件中,選擇關(guān)鍵詞出現(xiàn)頻次的閾值,閾值越高,出現(xiàn)在共現(xiàn)網(wǎng)絡(luò)圖中的關(guān)鍵詞就會(huì)越少。經(jīng)查看待分析數(shù)據(jù)的分類號(hào),大多數(shù)數(shù)據(jù)涉及多個(gè)分類號(hào),且待分析數(shù)據(jù)中的分類號(hào)數(shù)量超過一千個(gè),因此,設(shè)置關(guān)鍵詞最小次數(shù)為63,選擇前70位的IPC分類號(hào)進(jìn)行共現(xiàn)分析,可得到如圖5所示的共現(xiàn)網(wǎng)絡(luò)圖。
共現(xiàn)網(wǎng)絡(luò)圖中圓圈和標(biāo)簽組成一個(gè)元素,每個(gè)元素表示一個(gè)IPC分類號(hào),元素的大小取決于節(jié)點(diǎn)的度、連線的強(qiáng)度等,圓圈越大則代表該IPC分類號(hào)出現(xiàn)的頻次越高,兩個(gè)圓圈之間的距離表示了兩個(gè)IPC分類號(hào)之間的關(guān)聯(lián)性,圓圈間的連線表示分類號(hào)間具有共現(xiàn)情況?;陉P(guān)鍵詞出現(xiàn)的頻次(Occurrences)統(tǒng)計(jì),G06F18領(lǐng)域排名靠前的分類號(hào)分別為:G06F18/214(生成訓(xùn)練模式;自引導(dǎo)方法,如捕獲,促進(jìn))、G06F18/213(特征提取,例如通過變換特征空間;概括;映射,例如空間方法)、G06F18/25(融合技術(shù))、G06F18/10(預(yù)處理;數(shù)據(jù)清理)、G06F18/22(匹配標(biāo)準(zhǔn),例如相鄰性測量)、G06F18/24(分類技術(shù))。從共現(xiàn)網(wǎng)絡(luò)圖中可以清晰地看出,模型的訓(xùn)練、特征提取方法、多技術(shù)融合、數(shù)據(jù)的預(yù)處理、匹配和分類方法在待分析數(shù)據(jù)中出現(xiàn)的頻次較高,屬于G0618領(lǐng)域的熱門技術(shù)主題。本領(lǐng)域和跨領(lǐng)域人員在進(jìn)行G06F18領(lǐng)域?qū)彶闀r(shí),可以重點(diǎn)關(guān)注上述分類號(hào)下的相關(guān)技術(shù)知識(shí)。
當(dāng)一個(gè)分類號(hào)與其他分類號(hào)共現(xiàn)的頻次越高,則表明該分類號(hào)所屬領(lǐng)域與其他分類號(hào)所屬領(lǐng)域存在的技術(shù)交叉越多。從圖5中可以看出,G06F18領(lǐng)域除了本領(lǐng)域內(nèi)的分類號(hào),還存在與其他多個(gè)分類號(hào)相關(guān)。VOSviewer中的總連接強(qiáng)度(Total link Strength)代表關(guān)鍵詞與其他關(guān)鍵詞總的共現(xiàn)次數(shù),為了分析與G06F18領(lǐng)域存在技術(shù)交叉的領(lǐng)域,基于總連接強(qiáng)度統(tǒng)計(jì),獲得排名前10的分類號(hào)如表2所示。
另外,基于70個(gè)分類號(hào)所屬大組進(jìn)行統(tǒng)計(jì),得到除G06F18領(lǐng)域外排名靠前的大組為:G06N3(22個(gè))、G06F17(5個(gè))、G06N5(5個(gè))、G06Q10(5個(gè))、G06Q50(4個(gè))。由上述統(tǒng)計(jì)分析可知,G06F18領(lǐng)域與G06N3、G06F17、G06Q10、G06Q50等領(lǐng)域存在交叉,即在模式識(shí)別的過程中會(huì)與基于生物模型的計(jì)算機(jī)系統(tǒng)(如:神經(jīng)網(wǎng)絡(luò)、粒子群優(yōu)化等算法)、特定數(shù)據(jù)處理、行政管理(如旅行路線優(yōu)化、項(xiàng)目管理等)、特定商業(yè)行業(yè)(如農(nóng)業(yè)、電力、制造業(yè)等行業(yè))等領(lǐng)域交叉,交叉領(lǐng)域分類號(hào)的擴(kuò)展也是檢索中的關(guān)鍵。因此,在進(jìn)行模式識(shí)別分類、檢索時(shí),基于交叉領(lǐng)域適當(dāng)?shù)臄U(kuò)展分類號(hào)可以有效提高檢索效率。
3 模式識(shí)別修訂后分類和檢索應(yīng)用示例
2022.01版的IPC分類表中,模式識(shí)別常常劃分在多個(gè)分類位置中,且未對(duì)其進(jìn)行細(xì)分。修訂后的2023.01版的IPC分類表中新增模式識(shí)別G06F18分類小組,并在該小組下按照功能和應(yīng)用新增了大量分支,分類位置范圍變得更加明確。分類的目的是為了檢索,分類位置的更加明確將大大提高檢索效率,下面結(jié)合實(shí)際案例進(jìn)行舉例說明。
3.1 案例一
一種基于部件特性的航空發(fā)動(dòng)機(jī)多故障并發(fā)診斷方法,包括如下步驟:
步驟1:根據(jù)發(fā)動(dòng)機(jī)對(duì)象子部件數(shù)目確定總體標(biāo)簽數(shù)目l,利用標(biāo)簽之間的關(guān)聯(lián)性建立非光滑凸優(yōu)化的目標(biāo)函數(shù);
步驟2:求解目標(biāo)函數(shù),得到權(quán)重重構(gòu)矩陣,即得到多標(biāo)簽分類所需的標(biāo)簽指定特征子集;
步驟3:將總體分類目標(biāo)分解為l個(gè)獨(dú)立的子問題;
步驟4:對(duì)于每個(gè)子問題,利用二分類算法訓(xùn)練子分類器,其所需的特征由相應(yīng)的標(biāo)簽來決定;
步驟5:將未知樣本分別代入l個(gè)子分類器模型得到l個(gè)樣本標(biāo)簽,構(gòu)成未知樣本的預(yù)測標(biāo)簽向量。[7]
IPC原分類號(hào):G06K9/62(應(yīng)用電子設(shè)備進(jìn)行識(shí)別的方法或裝置)、G07C5/08(登記或指示除駕駛、運(yùn)行、空轉(zhuǎn)或等候時(shí)間以外的性能數(shù)據(jù),其中登記或不登記駕駛、運(yùn)行、空轉(zhuǎn)或等候時(shí)間)、G07C5/00(登記或指示車輛的運(yùn)行)。
本案涉及航空發(fā)動(dòng)機(jī)部件特征的多故障并發(fā)診斷識(shí)別,因此按照2023.01版以前的IPC分類表,只能將其分類到G06K9/62。
發(fā)明構(gòu)思:為突破傳統(tǒng)的故障診斷技術(shù)只借助單標(biāo)簽學(xué)習(xí)方法來解決問題的局限,通過多標(biāo)簽學(xué)習(xí)改進(jìn)binary relevance策略的多標(biāo)簽學(xué)習(xí)算法MLFS-SVM(Multi-label classification using label-specific features),可以借助多標(biāo)簽策略來解決航空發(fā)動(dòng)機(jī)多故障并發(fā)診斷難題,且利用標(biāo)簽之間的關(guān)聯(lián)性和基于標(biāo)簽的特性來提升預(yù)測結(jié)果。
通過分析2023.01版的IPC分類表和案例一技術(shù)方案可知,其技術(shù)主題涉及基于MLFS-SVM算法的多故障識(shí)別,可分類到G06F18/2411;涉及多故障分類,可分類到G06F18/2431;還基于二分類學(xué)習(xí)算法訓(xùn)練分類器,可分類到G06F18/214;方案中還將多標(biāo)簽學(xué)習(xí)中改進(jìn)的binary relevance策略和二分類機(jī)器學(xué)習(xí)算法融合建立模型,可分類到G06F18/25,具體分類含義參見表3。對(duì)比修訂前后的IPC分類結(jié)果可知,修訂后的對(duì)模式識(shí)別技術(shù)進(jìn)行了更為細(xì)致的分解,可以準(zhǔn)確地反映該技術(shù)方案的主題與附加信息,更有利于針對(duì)性地進(jìn)行檢索。
通過上述分類實(shí)例可以看出,修訂后的G06F18分類號(hào)對(duì)模式識(shí)別技術(shù)進(jìn)行了更為細(xì)致的分解,可進(jìn)行多重分類,即能夠根據(jù)模式識(shí)別涉及的關(guān)鍵步驟進(jìn)行多方面分類,擴(kuò)展了方案附加信息的分類數(shù)量,也更加準(zhǔn)確地反映了方案的技術(shù)主題和技術(shù)細(xì)節(jié)。
3.2 案例二
一種海洋漁船電力系統(tǒng)異常監(jiān)測方法,所述監(jiān)測方法包括以下步驟:
步驟1:獲取監(jiān)測對(duì)象的多種電力數(shù)據(jù),其中,所述監(jiān)測對(duì)象包括部署于電力系統(tǒng)中的發(fā)電機(jī)、配電柜和負(fù)載,且對(duì)于每種電力數(shù)據(jù)的采集布置有至少兩個(gè)監(jiān)測設(shè)備;
步驟2:基于至少兩個(gè)所述監(jiān)測設(shè)備采集的電力數(shù)據(jù),加權(quán)計(jì)算得到電力數(shù)據(jù)的綜合值;
步驟3:將所述綜合值作為輸入量輸入預(yù)先構(gòu)建的異常判定模型中,并對(duì)所述綜合值進(jìn)行分析,輸出判定結(jié)果;
步驟4:基于所述判定結(jié)果對(duì)所述電力系統(tǒng)進(jìn)行異常監(jiān)測,并在所述電力系統(tǒng)異常時(shí)進(jìn)行警報(bào)。
案例二是將利用模式識(shí)別對(duì)電力領(lǐng)域數(shù)據(jù)進(jìn)行識(shí)別分析,其申請(qǐng)文件中給出的主分類號(hào)為G06F18/2433,副分類號(hào)為G01R31/00,上述分類號(hào)及其類名如表4所示:
發(fā)明構(gòu)思:電力系統(tǒng)在漁業(yè)生產(chǎn)中的地位越來越重要,海洋漁業(yè)電力系統(tǒng)的異常情況時(shí)有發(fā)生,異常情況對(duì)漁業(yè)生產(chǎn)造成嚴(yán)重影響。通過布置多個(gè)監(jiān)測設(shè)備獲取電力系統(tǒng)中監(jiān)測對(duì)象的同一電力數(shù)據(jù),在剔除出現(xiàn)異常的監(jiān)測設(shè)備監(jiān)測的電力數(shù)據(jù)后加權(quán)計(jì)算得到更加準(zhǔn)確和可靠的電力數(shù)據(jù)綜合值,將綜合值輸入到預(yù)先構(gòu)建的異常判定模型中進(jìn)行綜合分析和處理,并基于判定結(jié)果對(duì)電力系統(tǒng)進(jìn)行實(shí)時(shí)異常監(jiān)測和警報(bào),提高了監(jiān)測效率。
通過分析案例二發(fā)明構(gòu)思,其發(fā)明點(diǎn)在于將電力數(shù)據(jù)的綜合值作為輸入量輸入預(yù)先構(gòu)建的異常判定模型中,并對(duì)綜合值進(jìn)行分析,輸出電力系統(tǒng)的監(jiān)測結(jié)果。由上述分析可知,案例二給出的分類號(hào)G06F18/2433、G01R31/00均為與申請(qǐng)技術(shù)方案相關(guān)的分類號(hào),可首先在CNTXT數(shù)據(jù)庫中利用案例二給出的分類號(hào)進(jìn)行布爾檢索,檢索過程如表5所示:
經(jīng)查看,并未命中對(duì)比文件。因本案例屬于人工智能模式識(shí)別與電力數(shù)據(jù)的交叉領(lǐng)域,根據(jù)模式識(shí)別共現(xiàn)分析中的交叉領(lǐng)域分類號(hào),可擴(kuò)展其分類號(hào)得到G06Q50/06,其分類含義如表6所示:
在CNTXT數(shù)據(jù)庫中利用擴(kuò)展分類號(hào)進(jìn)行布爾檢索,檢索過程如表7所示:
將檢索得到的411條檢索結(jié)果按照申請(qǐng)?zhí)栠M(jìn)行語義排序,在排名第一的位置獲得對(duì)比文件(D1)。
通過上述檢索實(shí)例可以看出,對(duì)于模式識(shí)別與其他領(lǐng)域的交叉領(lǐng)域?qū)彶闀r(shí),對(duì)于跨領(lǐng)域人員而言,不能很好地提取檢索要素,特別是模式識(shí)別中的關(guān)鍵詞常涉及特征提取、分類、聚類、訓(xùn)練、模型等,使用上述關(guān)鍵詞進(jìn)行檢索時(shí)噪聲很大。修訂后的G06F18分類號(hào)按照模式識(shí)別的主要過程,特別是特征提取、分類技術(shù)、聚類技術(shù)進(jìn)行了大量細(xì)分,可按照具體的技術(shù)手段對(duì)其進(jìn)行分類,避免使用籠統(tǒng)的關(guān)鍵詞對(duì)檢索要素進(jìn)行表達(dá)。使用準(zhǔn)確表示發(fā)明信息的分類號(hào)和智能檢索系統(tǒng)的語義檢索相結(jié)合,可以有效解決跨領(lǐng)域檢索中的難題。另外,需要注意的是,模式識(shí)別領(lǐng)域仍有大量文獻(xiàn)沒有完成再分類,在利用G06F18分類時(shí),新舊分類號(hào)可以同時(shí)使用,避免漏檢。
4 總 結(jié)
本文對(duì)國際專利分類表(IPC)2023.01中人工智能領(lǐng)域G06F18的分類號(hào)修訂情況進(jìn)行了介紹,分析了新增G06F18分類號(hào)的特點(diǎn),基于模式識(shí)別的特點(diǎn)對(duì)G06F18分類號(hào)進(jìn)行共現(xiàn)分析,得到模式識(shí)別與其他領(lǐng)域間的關(guān)聯(lián)性。最后結(jié)合實(shí)際案例分析得到修訂后的分類號(hào)可以提供更準(zhǔn)確的分類信息,基于交叉領(lǐng)域分類號(hào)的擴(kuò)展可有效提高檢索效率?;诒疚牡姆治銎谕麨楸绢I(lǐng)域和跨領(lǐng)域?qū)彶閱T提供一定的幫助,以促進(jìn)檢索質(zhì)量和檢索效率的提升。
參考文獻(xiàn):
[1]王永琦,楊洋.基于MATLAB的機(jī)器視覺處理技術(shù)[M].南京:東南大學(xué)出版社,2022:211.
[2]《國際專利分類號(hào)》2022年1月.
[3]《國際專利分類號(hào)》2023年1月.
[4]李艷坤,等.模式識(shí)別方法及在復(fù)雜體系中的應(yīng)用 第2版[M].秦皇島:燕山大學(xué)出版社,2022:4.
[5]楊良斌.信息分析方法與實(shí)踐[M].長春:東北師范大學(xué)出版社,2017:179.
[6]盧潔,等.計(jì)算機(jī)視覺領(lǐng)域的分類號(hào)分析與應(yīng)用[J].專利文獻(xiàn)研究增刊:專利分類研究,2022,增刊(2):1-11.
[7]南京航空航天大學(xué).一種基于部件特征的航空發(fā)動(dòng)機(jī)多故障并發(fā)診斷方法:201911361513.4[P].2019.12.25.
責(zé)任編校:杜寶花,張 靜
Classification Symbols for Pattern Recognition and Classification Retrieval in Patent Application
SU Xiaoyan,XIE Wanwan,ZHANG Yang
(Patent Examination Cooperation Henan Center of the Patent Office,Zhengzhou 450046,China)
Abstract:In 2023, the International Patent Classification (IPC) introduced classification symbol G06F18,which pertains to pattern recognition,a significant branch of artificial intelligence.This classification symbol was included in the IPC system for the first time in the 2023.01 version.This paper introduces the contents of G06F18 and its subordinate symbols,and analyzes its classification position.The co-occurrence analysis method is used to analyze the pattern recognition classification symbols in related cross-domains,which can help patent examiners understand and use the classification symbols in G06F18 and other cross-domains,thus improving the efficiency of classification and retrieval in the field of patent application.
Key words:pattern recognition;artificial intelligence;G06F18;co-occurrence analysis
收稿日期:2024-10-09
作者簡介:蘇曉燕,女,河南周口人,碩士,助理研究員,研究方向?yàn)槿斯ぶ悄埽瑢@麑彶榕c檢索。
謝婉婉,女,河南南陽人,碩士,助理研究員,研究方向?yàn)閷@麑彶榕c檢索。