孫麗偉,楊 筱,胡 婷,陳印政
(1.中國專利信息中心,北京 102206;2.國家知識產(chǎn)權(quán)戰(zhàn)略實(shí)施(天津大學(xué))研究基地,天津 300072;3.天津大學(xué)大學(xué)文化與校史研究所,天津 300072)
數(shù)據(jù)作為現(xiàn)代生活的基礎(chǔ)媒介和重要資源,其價(jià)值已被社會充分肯定,并日益深刻地改變著人們的生活方式和思維觀念[2]。近年來,無論是國家、各級知識產(chǎn)權(quán)管理部門,還是創(chuàng)新主體、社會公眾,對知識產(chǎn)權(quán)信息都越來越重視。高質(zhì)量的數(shù)據(jù)是知識產(chǎn)權(quán)信息服務(wù)的核心引擎,數(shù)據(jù)標(biāo)準(zhǔn)化是提高數(shù)據(jù)質(zhì)量的重要手段。知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系是促進(jìn)知識產(chǎn)權(quán)信息高效利用、提升信息服務(wù)水平的基石。中國《知識產(chǎn)權(quán)強(qiáng)國建設(shè)綱要(2021—2035 年)》和《“十四五”國家知識產(chǎn)權(quán)保護(hù)和運(yùn)用規(guī)劃》都再次強(qiáng)調(diào),要加強(qiáng)知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)制定和數(shù)據(jù)資源供給,提高知識產(chǎn)權(quán)公共服務(wù)能力,促進(jìn)知識產(chǎn)權(quán)信息的高效利用。
當(dāng)前,知識產(chǎn)權(quán)治理正進(jìn)入互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代。世界范圍內(nèi),知識產(chǎn)權(quán)行政管理呈現(xiàn)集中化趨勢[3]。從面向知識產(chǎn)權(quán)數(shù)據(jù)未來應(yīng)用的視角分析,為了用好知識產(chǎn)權(quán)數(shù)據(jù)這座“金礦”,無論是促進(jìn)數(shù)據(jù)的國際交流、深化國內(nèi)外數(shù)據(jù)共享,還是加強(qiáng)各類知識產(chǎn)權(quán)數(shù)據(jù)庫之間的深度互聯(lián),從而滿足創(chuàng)新主體和社會公眾對高質(zhì)量數(shù)據(jù)服務(wù)的需求,都迫切需要中國整合數(shù)據(jù)資源,并遵循統(tǒng)一的知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn),形成覆蓋面廣、收錄全面、智能高效、服務(wù)便捷、開放共贏、能夠互聯(lián)互通的知識產(chǎn)權(quán)標(biāo)準(zhǔn)數(shù)據(jù),進(jìn)而增強(qiáng)數(shù)據(jù)的互操作性和實(shí)現(xiàn)數(shù)據(jù)的深度互聯(lián),驅(qū)動數(shù)據(jù)獲取、加工與綜合利用的便捷與高效。這不但是知識產(chǎn)權(quán)強(qiáng)國建設(shè)的重要組成部分,也是知識產(chǎn)權(quán)制度能否高效運(yùn)行的重要支柱。
知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)必須基于能夠獲得的知識產(chǎn)權(quán)數(shù)據(jù)。知識產(chǎn)權(quán)數(shù)據(jù)是指創(chuàng)新主體在從事智力創(chuàng)造、獲取知識產(chǎn)權(quán)過程中所形成的各種數(shù)據(jù),主要包括知識產(chǎn)權(quán)權(quán)利主體、客體、內(nèi)容、權(quán)利變更、權(quán)利轉(zhuǎn)移和運(yùn)用以及法律狀態(tài)等信息[4]。從內(nèi)容來看,知識產(chǎn)權(quán)數(shù)據(jù)包括專利、商標(biāo)、地理標(biāo)志、版權(quán)等諸多類型的數(shù)據(jù)。知識產(chǎn)權(quán)數(shù)據(jù)內(nèi)涵豐富、數(shù)量巨大、涉及領(lǐng)域?qū)拸V,這給知識產(chǎn)權(quán)數(shù)據(jù)的管理與應(yīng)用帶來巨大挑戰(zhàn)。參與知識產(chǎn)權(quán)全球治理體系建構(gòu)已成為知識產(chǎn)權(quán)國際保護(hù)的新動力[5],因此,通過對世界知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)和中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)的系統(tǒng)梳理,分析知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)的現(xiàn)狀及發(fā)展趨勢,能夠?yàn)橹袊掷m(xù)提升知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)水平提供有益的參考。
為了增強(qiáng)知識產(chǎn)權(quán)信息在各國家(地區(qū))知識產(chǎn)權(quán)管理局間的互操作性,促進(jìn)知識產(chǎn)權(quán)信息的處理和傳播,提高知識產(chǎn)權(quán)信息的利用效率,世界知識產(chǎn)權(quán)組織(WIPO)標(biāo)準(zhǔn)委員會制定了一系列知識產(chǎn)權(quán)數(shù)據(jù)、信息和文獻(xiàn)領(lǐng)域的標(biāo)準(zhǔn)、建議或指南,其中對知識產(chǎn)權(quán)數(shù)據(jù)處理領(lǐng)域影響較大的是ST.96標(biāo)準(zhǔn)和JavaScript 對象表示法(JSON)標(biāo)準(zhǔn)。
2.1.1 ST.96 標(biāo)準(zhǔn)及其發(fā)展
世界知識產(chǎn)權(quán)組織推薦使用的ST.96 標(biāo)準(zhǔn),使用可擴(kuò)展標(biāo)記語言(XML)對專利、商標(biāo)、工業(yè)設(shè)計(jì)、地理標(biāo)志和版權(quán)等類型的知識產(chǎn)權(quán)信息進(jìn)行提交、發(fā)布、處理和交換[6]。ST.96 標(biāo)準(zhǔn)是使用XML 處理知識產(chǎn)權(quán)信息的集大成者,旨在增進(jìn)各國家(地區(qū))知識產(chǎn)權(quán)局之間的互操作性、加強(qiáng)各類型知識產(chǎn)權(quán)信息的協(xié)調(diào)、促進(jìn)數(shù)據(jù)兼容性(尤其是與WIPO 標(biāo)準(zhǔn)ST.36/66/86 的數(shù)據(jù)可轉(zhuǎn)換性)、提高知識產(chǎn)權(quán)信息的一致性和促進(jìn)XML Schemas 的普遍實(shí)施,具有模塊化、互用性、兼容性和復(fù)用性等優(yōu)點(diǎn)[7]。最新版的ST.96 標(biāo)準(zhǔn)包括主體文件和7 個(gè)附件,它們對標(biāo)準(zhǔn)的范圍、要求、設(shè)計(jì)規(guī)則、數(shù)據(jù)實(shí)體、架構(gòu)組件等詳細(xì)地進(jìn)行了約定,并提供了不同XML 標(biāo)準(zhǔn)間轉(zhuǎn)換的指導(dǎo)及具體的符合ST.96 標(biāo)準(zhǔn)的樣例。
我反正抓住一點(diǎn):是她做長輩的先“黑”我,本來婚前婚后我就有好些不滿意,比如每次我們夫妻吵架她表面勸和,實(shí)際背地里和她兒子嘰里呱啦;我爸媽從老家來看我,送給她自家產(chǎn)的農(nóng)產(chǎn)品,她卻說那土雞不正宗;我結(jié)婚什么彩禮也沒要,她還嫌我娘家給的壓箱錢太少……
(1)ST.96 標(biāo)準(zhǔn)的設(shè)計(jì)理念。ST.96 標(biāo)準(zhǔn)建議在組件級別使用模塊化語言架構(gòu),在文檔級別使用扁平化語言架構(gòu)。ST.96 標(biāo)準(zhǔn)對所有的類型、元素和屬性都定義為全局組件[8]。該標(biāo)準(zhǔn)的模塊化架構(gòu)組件分為通用組件和業(yè)務(wù)組件,通用組件針對公共屬性進(jìn)行定義,與具體知識產(chǎn)權(quán)類型的關(guān)聯(lián)性不強(qiáng),并且由兩種或兩種以上的業(yè)務(wù)類型共享;業(yè)務(wù)組件包括專利組件、商標(biāo)組件、工業(yè)設(shè)計(jì)組件、地理標(biāo)志組件、版權(quán)組件等具體知識產(chǎn)權(quán)類型的組件。通用組件和各業(yè)務(wù)組件按照層級包括基本組件、集合組件和文檔組件3 種類型[9]。
(2)ST.96 標(biāo)準(zhǔn)的發(fā)展變化。自2012 年WIPO標(biāo)準(zhǔn)委員會發(fā)布第1 版ST.96 標(biāo)準(zhǔn)以來,該標(biāo)準(zhǔn)持續(xù)修訂和完善,截至2022 年年底已經(jīng)發(fā)布了10 個(gè)版本[10]。隨著版本的更新和完善,ST.96 標(biāo)準(zhǔn)的適用范圍已經(jīng)擴(kuò)展到專利、商標(biāo)、工業(yè)設(shè)計(jì)、地理標(biāo)志和版權(quán)等,其通用組件和業(yè)務(wù)組件的類別及數(shù)據(jù)元素也越來越豐富(見表1)。從數(shù)量看,XML 組件的總數(shù)從最初的387 個(gè)逐漸擴(kuò)充到3 333 個(gè);從類別看,自4.0 版本開始,XML 組件涵蓋通用組件以及專利、商標(biāo)、外觀設(shè)計(jì)、地理標(biāo)志和版權(quán)等業(yè)務(wù)組件。
表1 ST.96 標(biāo)準(zhǔn)各版本包含的XML 組件情況
相較于早期版本,ST.96 V4.0 版本除了新增地理標(biāo)志(216 個(gè)組件)和版權(quán)(88 個(gè)組件)架構(gòu)外,還納入了審查報(bào)告相關(guān)數(shù)據(jù)(約80 個(gè)組件)和專利法律狀態(tài)數(shù)據(jù)(約120 個(gè)組件)的XML 架構(gòu)。ST.96 V5.0 的附件五納入了用于確定 ST.96 架構(gòu)合規(guī)性的XSD Validator 工具的改進(jìn)版本,以及能夠以標(biāo)準(zhǔn)化的方式從 ST.96 設(shè)計(jì)架構(gòu)中生成扁平架構(gòu)的新工具。在最新版本ST.96 V6.0 中,包含了新的合金成分架構(gòu)(alloy composition schemas)組件以捕捉專利和非專利文獻(xiàn)中的合金成分?jǐn)?shù)據(jù),并修訂了與版權(quán)和地理標(biāo)志有關(guān)的現(xiàn)有組件。此外,根據(jù)XML4IP工作隊(duì)于2022 年9 月公布的未來工作計(jì)劃,專利記錄和專利業(yè)務(wù)架構(gòu)的開發(fā)已經(jīng)相當(dāng)成熟,商標(biāo)和外觀設(shè)計(jì)法律狀態(tài)架構(gòu)的開發(fā)也將繼續(xù)推進(jìn),這些組件有望納入ST.96 的下一個(gè)版本中[11]。
(3)ST.96 標(biāo)準(zhǔn)的實(shí)施狀況。根據(jù)WIPO 標(biāo)準(zhǔn)的使用狀況調(diào)查,截至2018 年4 月,已有23 個(gè)國家(地區(qū))的知識產(chǎn)權(quán)局部分或者完全地實(shí)施了ST.96 標(biāo)準(zhǔn)[12]。根據(jù)XML4IP 工作隊(duì)于2020 年9 月在其內(nèi)部進(jìn)行的ST.96 標(biāo)準(zhǔn)實(shí)施情況的調(diào)查,在給出答復(fù)的11 個(gè)國家(地區(qū))的知識產(chǎn)權(quán)局中,有7個(gè)實(shí)施了ST.96 標(biāo)準(zhǔn),主要用于馬德里和海牙體系通信;有6 個(gè)表示希望未來以ST.96 的格式與國際局進(jìn)行PCT 數(shù)據(jù)通信[13]。WIPO 標(biāo)準(zhǔn)委員會第八屆會議指出,在海牙體系電子通信方面,從2021 年3月31 日起,ST.96 格式成為各局同國際局進(jìn)行海牙雙邊數(shù)據(jù)交換的唯一權(quán)威格式[14]。
為了便于ST.96 標(biāo)準(zhǔn)的實(shí)施,XML4IP 工作隊(duì)組織開發(fā)了用于確定ST.96 架構(gòu)合規(guī)性的XSD Validator工具,以及以標(biāo)準(zhǔn)化方式從ST.96 設(shè)計(jì)架構(gòu)中生成扁平結(jié)構(gòu)的新工具;國際局創(chuàng)建了集中存儲庫試點(diǎn),集中存儲庫用于共享基于各種ST.96 實(shí)施情況的XML 樣例,包括其他各局定制的XML 架構(gòu),此外還計(jì)劃建立外部開發(fā)者論壇,為其他各局和XML開發(fā)者提供合作工作平臺,以共享實(shí)施ST.96 標(biāo)準(zhǔn)的經(jīng)驗(yàn)和知識。
(4)ST.96 標(biāo)準(zhǔn)的發(fā)展趨勢。ST.96 標(biāo)準(zhǔn)各類組件復(fù)用性強(qiáng)。ST.96 標(biāo)準(zhǔn)根據(jù)元素/類型分別制成schema 文件,各文件之間可以按需形成相互調(diào)用關(guān)系,各國家(地區(qū))知識產(chǎn)權(quán)局也可以利用ST.96的組件進(jìn)行按需組合。此外,XML4IP 工作隊(duì)還提出了以ST.96 標(biāo)準(zhǔn)為基礎(chǔ)管理產(chǎn)權(quán)組織其他XML 標(biāo)準(zhǔn)的方案,將其他XML 標(biāo)準(zhǔn)(如ST.37 等)中可重復(fù)利用的組件納入ST.96 標(biāo)準(zhǔn)的代碼庫[13]。在全球范圍內(nèi)實(shí)施ST.96 標(biāo)準(zhǔn),能夠提升數(shù)據(jù)的互操作性和可獲取性,促進(jìn)數(shù)據(jù)共享和數(shù)據(jù)交易,使數(shù)據(jù)結(jié)果更易被理解,將有助于提高知識產(chǎn)權(quán)數(shù)據(jù)管理效率,提升數(shù)據(jù)傳播的準(zhǔn)確性和及時(shí)性[15]。
2.1.2 JSON 標(biāo)準(zhǔn)及其發(fā)展
WIPO 的JSON 標(biāo)準(zhǔn)是為適應(yīng)數(shù)據(jù)傳播和交換的新需求制定的,與ST.96標(biāo)準(zhǔn)相兼容,使用JSON資源,提交、處理、公布和/或交換知識產(chǎn)權(quán)信息的新標(biāo)準(zhǔn)。JSON 標(biāo)準(zhǔn)的目標(biāo)是:為JSON 格式的數(shù)據(jù)標(biāo)記提供指導(dǎo);通過提供基于WIPO 標(biāo)準(zhǔn)ST.96 的JSON Schemas 和實(shí)例用于交換知識產(chǎn)權(quán)數(shù)據(jù),以確保一致性;建議擴(kuò)展JSON Schemas 或創(chuàng)建兼容的新JSON Schemas 的設(shè)計(jì)原則;通過促進(jìn)各國家(地區(qū))知識產(chǎn)權(quán)局之間JSON 資源的重復(fù)使用以及向公眾提供的數(shù)據(jù),提高數(shù)據(jù)交換效率。
(1)JSON 標(biāo)準(zhǔn)的制定歷程。2019 年7 月,在WIPO 標(biāo)準(zhǔn)委員會第七屆會議上,標(biāo)準(zhǔn)委員會注意到提交供其審議的JSON 規(guī)范工作草案,并認(rèn)識到使用JSON 格式進(jìn)行數(shù)據(jù)傳播的國家(地區(qū))知識產(chǎn)權(quán)局日益增多,認(rèn)為需要構(gòu)建新標(biāo)準(zhǔn)來支持各國家(地區(qū))知識產(chǎn)權(quán)局使用這種格式通信,因此創(chuàng)建了第64 號任務(wù)——編制提案,建議使用與產(chǎn)權(quán)組織標(biāo)準(zhǔn)ST.96相兼容的JSON 資源,以用于提交、處理、公布和/或交換知識產(chǎn)權(quán)信息,并將該項(xiàng)任務(wù)分配給XML4IP工作隊(duì)。
2019—2022 年間,XML4IP 工作隊(duì)致力于制定將ST.96 XML 架構(gòu)變換成等效的JSON 架構(gòu)的成套變換規(guī)則,并不斷地討論和改進(jìn)變換規(guī)則及架構(gòu),先后發(fā)布了十余個(gè)JSON 標(biāo)準(zhǔn)草案。2022 年10 月,XML4IP 工作隊(duì)向WIPO 標(biāo)準(zhǔn)委員會第十屆會議提交了JSON 新標(biāo)準(zhǔn)的最終草案。該草案是在WIPO ST.96 V5.0 的基礎(chǔ)上編制的,其內(nèi)容包括一系列設(shè)計(jì)規(guī)則以及一套基于WIPO 標(biāo)準(zhǔn)ST.96 XML Schemas 的JSON Schemas 和JSON 實(shí)例的樣例[16]。該草案旨在為創(chuàng)建或修改知識產(chǎn)權(quán)數(shù)據(jù)作為 JSON 資源的各國家(地區(qū))知識產(chǎn)權(quán)局和其他組織提供指導(dǎo),并明確指出各國家(地區(qū))知識產(chǎn)權(quán)局將 JSON 用作應(yīng)用程序編程接口(API)的負(fù)載交換數(shù)據(jù)時(shí),必須遵守該標(biāo)準(zhǔn)。
(2)JSON 標(biāo)準(zhǔn)的發(fā)展趨勢。在編制JSON 標(biāo)準(zhǔn)草案的過程中,XML4IP 工作隊(duì)發(fā)現(xiàn)并解決了許多問題,然而JSON Schema 規(guī)范的演變過程中仍然有一些問題懸而未決。這些問題包括:(1)需要根據(jù)JSON 行業(yè)慣例簡化JSON Schemas 的結(jié)構(gòu),例如從ST.96 XML Schemas 轉(zhuǎn)換而來的JSON Schemas 需要?jiǎng)h除不必要的嵌套;(2)需要通過業(yè)務(wù)專家分析來改進(jìn)數(shù)據(jù)設(shè)計(jì),從而進(jìn)一步實(shí)現(xiàn)更精確的數(shù)據(jù)驗(yàn)證,同時(shí)根據(jù)ST.96 V6.0 對JSON Schemas 進(jìn)行更新;(3)需要為XML 和JSON 之間的實(shí)例添加轉(zhuǎn)換規(guī)則和相關(guān)工具等??梢姡琂SON 標(biāo)準(zhǔn)將隨著WIPO ST.96 標(biāo)準(zhǔn)的修訂和JSON Schema 規(guī)范的演變而持續(xù)進(jìn)行修訂和更新。為此,WIPO 標(biāo)準(zhǔn)委員會制定了快速通道程序,供XML4IP 工作隊(duì)審議和/或通過該標(biāo)準(zhǔn)的修訂文本。因此,在JSON 標(biāo)準(zhǔn)的最終草案中,XML4IP 工作隊(duì)也建議建立另一個(gè)快速通道程序,以考慮和/或采用新JSON 標(biāo)準(zhǔn)的修訂。
與XML 相比,JSON 是一種輕量級的數(shù)據(jù)交換格式,資源消耗更少,數(shù)據(jù)交換和傳輸效率更高。近年來,隨著使用JSON 格式傳播數(shù)據(jù)的國家(地區(qū))知識產(chǎn)權(quán)局的數(shù)量日益增多,XML4IP 工作隊(duì)以ST.96 標(biāo)準(zhǔn)為基礎(chǔ)編制了新的JSON 標(biāo)準(zhǔn),包括從ST.96 的XML 架構(gòu)向JSON 架構(gòu)的轉(zhuǎn)換規(guī)則,因此,未來的知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)將能夠兼容JSON 和XML架構(gòu)。
中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)始于21 世紀(jì)初,目前最為完善、使用最為廣泛的是2012 年發(fā)布的《中國專利數(shù)據(jù)元素標(biāo)準(zhǔn)》(ZC 0012—2012)和《專利文獻(xiàn)數(shù)據(jù)規(guī)范》(ZC 0014—2012)。上述標(biāo)準(zhǔn)主要是以WIPO 的ST.36 數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ)制定的,同時(shí)兼具中國特色的專利數(shù)據(jù)規(guī)范,對專利文獻(xiàn)數(shù)據(jù)元素、文件名和外部實(shí)體進(jìn)行了規(guī)范,在當(dāng)時(shí)具有一定的前瞻性[17]。近年來,為了促進(jìn)知識產(chǎn)權(quán)基礎(chǔ)信息的數(shù)據(jù)規(guī)范化和標(biāo)準(zhǔn)化,提高知識產(chǎn)權(quán)基礎(chǔ)信息的采集加工、共享交換和運(yùn)用管理水平,中國國家知識產(chǎn)權(quán)局于2019 年12 月印發(fā)《知識產(chǎn)權(quán)基礎(chǔ)信息數(shù)據(jù)規(guī)范(試行)》,后于2020 年更新發(fā)布《知識產(chǎn)權(quán)基礎(chǔ)信息數(shù)據(jù)規(guī)范(試行2020 版)》(以下簡稱《2020 版數(shù)據(jù)規(guī)范》)?!?020 版數(shù)據(jù)規(guī)范》首次將商標(biāo)、地理標(biāo)志、集成電路布圖設(shè)計(jì)、知識產(chǎn)權(quán)主體和知識產(chǎn)權(quán)綜合應(yīng)用等知識產(chǎn)權(quán)基礎(chǔ)信息納入中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系,規(guī)定了知識產(chǎn)權(quán)基礎(chǔ)信息的數(shù)據(jù)元素規(guī)范、知識產(chǎn)權(quán)基礎(chǔ)信息的文件名規(guī)范、知識產(chǎn)權(quán)基礎(chǔ)信息的外部實(shí)體規(guī)范及應(yīng)用與維護(hù)。然而,《2020 版數(shù)據(jù)規(guī)范》的基礎(chǔ)元素和專利業(yè)務(wù)元素沿用《專利文獻(xiàn)數(shù)據(jù)規(guī)范》,未抽取商標(biāo)、地理標(biāo)志、集成電路布圖設(shè)計(jì)等各類型知識產(chǎn)權(quán)公用元素,也未對公用元素進(jìn)行統(tǒng)一和規(guī)范[18]。
鑒于JSON 標(biāo)準(zhǔn)是基于ST.96 標(biāo)準(zhǔn)制定的,并隨著ST.96 的修訂和JSON Schema 規(guī)范的演變而持續(xù)進(jìn)行修訂和更新,因此,中外知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)的比較主要以WIPO 的ST.96 標(biāo)準(zhǔn)(V6.0)和《2020版數(shù)據(jù)規(guī)范》為基準(zhǔn)展開。
首先,兩者都采用了XML Schema 的設(shè)計(jì)模式,但WIPO 的ST.96 標(biāo)準(zhǔn)的適用范圍更為廣泛,除了專利、商標(biāo)、地理標(biāo)志等,還適用于版權(quán);而《2020版數(shù)據(jù)規(guī)范》沒有涵蓋版權(quán)。其次,就通用組件而言(見表2),WIPO 的ST.96 標(biāo)準(zhǔn)所涉及的元素類別和元素總量均比《2020 版數(shù)據(jù)規(guī)范》更豐富,除了時(shí)間、地址、名稱、表格、圖像、文檔、列表、化學(xué)、數(shù)學(xué)、引用、簽名等基本信息外,還包括了申請、分類、許可、支付等信息。再次,就專利組件而言,ST.96 標(biāo)準(zhǔn)涉及的元素類別較《2020 版數(shù)據(jù)規(guī)范》更豐富,但元素總量較少,原因可能是《2020版數(shù)據(jù)規(guī)范》未充分抽取專利與其他類型知識產(chǎn)權(quán)的公用元素并將它們納入相應(yīng)的通用組件。具體而言,ST.96 標(biāo)準(zhǔn)涵蓋了著錄項(xiàng)目、文摘、權(quán)利要求、說明書及附圖、法律狀態(tài)、檢索報(bào)告、許可、專利族、生物序列、專利審查、專利申請表、專利交易等信息;《2020 版數(shù)據(jù)規(guī)范》主要涉及著錄項(xiàng)目、摘要、權(quán)利要求、說明書及附圖、法律狀態(tài)、檢索報(bào)告、被許可人、專利族、生物序列、專利審查等信息,而專利申請表、專利交易等信息有所欠缺。
表2 不同知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)涉及元素的比較
此外,ST.96 標(biāo)準(zhǔn)建立了較為完善的標(biāo)準(zhǔn)修訂與更新機(jī)制,設(shè)立專門的工作隊(duì)負(fù)責(zé)修訂與更新,每年最多發(fā)布兩個(gè)版本。并且,隨著使用JSON 格式進(jìn)行數(shù)據(jù)傳播的國家(地區(qū))知識產(chǎn)權(quán)局的數(shù)量越來越多,XML4IP 工作隊(duì)還承擔(dān)了以ST.96 標(biāo)準(zhǔn)為基礎(chǔ)編制新的JSON 標(biāo)準(zhǔn)的新任務(wù),并建議建立快速通道程序以便于考慮標(biāo)準(zhǔn)的后續(xù)修訂。可見,WIPO 對于相關(guān)標(biāo)準(zhǔn)的修訂與更新十分重視,會根據(jù)技術(shù)發(fā)展情況以及實(shí)際應(yīng)用需求對標(biāo)準(zhǔn)進(jìn)行及時(shí)修訂與更新;而中國雖然制定了基于XML 的中國專利文獻(xiàn)數(shù)據(jù)格式標(biāo)準(zhǔn),但是自這一標(biāo)準(zhǔn)頒布和實(shí)施以來,較長一段時(shí)期內(nèi)尚未進(jìn)行必要的更新和完善。
長期以來,中國知識產(chǎn)權(quán)體制機(jī)制的形成主要依附于科技管理和市場監(jiān)督等,缺乏整體性、自主性和主體意識[19],知識產(chǎn)權(quán)信息存在多部門管理的問題,各單位之間的信息加工標(biāo)準(zhǔn)和數(shù)據(jù)標(biāo)注粒度也不統(tǒng)一,缺少國家層面的、統(tǒng)一的知識產(chǎn)權(quán)信息處理標(biāo)準(zhǔn),不便于數(shù)據(jù)獲取與綜合利用,制約著知識產(chǎn)權(quán)強(qiáng)國建設(shè)的速度。基于相關(guān)文獻(xiàn)梳理和調(diào)研發(fā)現(xiàn),中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)主要存在四方面問題。
中國在數(shù)據(jù)產(chǎn)業(yè)發(fā)展方面尚未建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),對數(shù)據(jù)的流動性和可獲取性構(gòu)成較大的障礙,使數(shù)據(jù)對經(jīng)濟(jì)發(fā)展的創(chuàng)新效應(yīng)和乘數(shù)效應(yīng)大打折扣[20]。近年來,中國國家知識產(chǎn)權(quán)局積極運(yùn)用數(shù)字技術(shù)助力專利審查和檢索的提質(zhì)增效,并著手建設(shè)智能化專利審查和檢索系統(tǒng),但通用數(shù)據(jù)作為智能化專利審查和檢索系統(tǒng)的基礎(chǔ)性公共信息資源,目前暫缺完善而規(guī)范的標(biāo)準(zhǔn)構(gòu)建[21]。其中,數(shù)據(jù)標(biāo)準(zhǔn)頂層設(shè)計(jì)的不完善主要體現(xiàn)在知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)范圍的不全面。首先,中國當(dāng)前的知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)尚未涉及版權(quán),對于專利、商標(biāo)、地理標(biāo)志、集成電路布圖設(shè)計(jì)的公用元素也未進(jìn)行充分抽取、統(tǒng)一和規(guī)范,造成跨數(shù)據(jù)庫調(diào)用業(yè)務(wù)元素的障礙,限制了大數(shù)據(jù)等技術(shù)處理數(shù)據(jù)的優(yōu)勢,并進(jìn)一步制約了創(chuàng)新主體對知識產(chǎn)權(quán)數(shù)據(jù)的利用效率。其次,中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)只有基于XML 架構(gòu)設(shè)計(jì)的知識產(chǎn)權(quán)基礎(chǔ)信息數(shù)據(jù)規(guī)范,尚無資源消耗更少、數(shù)據(jù)交換和傳輸效率更高的基于JSON 架構(gòu)的數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)。在WIPO 已經(jīng)明確指出各國家(地區(qū))知識產(chǎn)權(quán)局將 JSON 用作應(yīng)用程序編程接口(API)的負(fù)載彼此交換數(shù)據(jù)時(shí)必須遵守JSON 標(biāo)準(zhǔn)草案的背景下,中國理應(yīng)將使用與知識產(chǎn)權(quán)XML 標(biāo)準(zhǔn)相兼容的JSON 標(biāo)準(zhǔn)提上議程。
知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)中所涉及的數(shù)據(jù)元素需要囊括各類知識產(chǎn)權(quán)生命周期中的所有數(shù)據(jù),但中國現(xiàn)有相關(guān)標(biāo)準(zhǔn)中的數(shù)據(jù)元素不夠豐富,給數(shù)據(jù)檢索、加工與利用帶來諸多不便。主要表現(xiàn)在:(1)通用元素的定義不全面。中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)對各類知識產(chǎn)權(quán)數(shù)據(jù)中的分類、許可、支付機(jī)構(gòu)、身份等相關(guān)的通用數(shù)據(jù)元素定義不全面,不利于知識產(chǎn)權(quán)數(shù)據(jù)的標(biāo)準(zhǔn)化管理和共享,進(jìn)而影響知識產(chǎn)權(quán)數(shù)據(jù)價(jià)值的發(fā)揮。(2)業(yè)務(wù)元素覆蓋度有限。以專利業(yè)務(wù)元素為例,ST.96 標(biāo)準(zhǔn)不僅包含著錄項(xiàng)目、文摘等元素的相關(guān)組件,還開發(fā)了專利申請表、專利交易等組件,專利記錄和專利業(yè)務(wù)相關(guān)組件的開發(fā)也已經(jīng)相當(dāng)成熟,有望納入ST.96標(biāo)準(zhǔn)的下一個(gè)版本之中;而《2020 版數(shù)據(jù)規(guī)范》對于專利申請表、專利記錄、專利交易等相關(guān)的數(shù)據(jù)元素還有所欠缺。
標(biāo)準(zhǔn)制定過程中難免存在不完善之處,而且隨著科學(xué)技術(shù)的進(jìn)步、實(shí)際應(yīng)用需求的變化,也有必要對標(biāo)準(zhǔn)進(jìn)行及時(shí)的訂與更新,因此,對大多數(shù)類型的標(biāo)準(zhǔn)來說,版本控制是一個(gè)需求[22]134。WIPO的ST.96 標(biāo)準(zhǔn)由專門的工作隊(duì)負(fù)責(zé)修訂與更新,且每年的4 月和/或10 月為固定的新版本發(fā)布時(shí)間。自其首次發(fā)布以來,ST.96 標(biāo)準(zhǔn)現(xiàn)已經(jīng)更新到了第10 個(gè)版本,每個(gè)版本對發(fā)現(xiàn)的錯(cuò)誤或缺陷給予及時(shí)糾正,或者根據(jù)新的需求對標(biāo)準(zhǔn)進(jìn)行擴(kuò)展與更新[9]。而中國在2012 年制定了在當(dāng)時(shí)較為完善的、以XML為基礎(chǔ)的中國專利文獻(xiàn)數(shù)據(jù)格式標(biāo)準(zhǔn)[23],但是自其頒布和實(shí)施以來,較長一段時(shí)期內(nèi)沒有進(jìn)行必要的更新和完善。
中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)主要聚焦于專利領(lǐng)域,商標(biāo)、地理標(biāo)志相關(guān)的數(shù)據(jù)標(biāo)準(zhǔn)剛剛起步,版權(quán)數(shù)據(jù)標(biāo)準(zhǔn)尚有缺位。而且,中國將本國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)化的成功經(jīng)驗(yàn)向世界知識產(chǎn)權(quán)組織推廣的力度不足,在世界知識產(chǎn)權(quán)組織數(shù)據(jù)標(biāo)準(zhǔn)的制定和修訂的歷屆會議中,中國也較少主動提交相關(guān)提案,未發(fā)揮與中國國際地位相匹配的影響力。此外,從世界各國制定知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)的發(fā)展趨勢來看,加強(qiáng)國家之間的數(shù)據(jù)交流與國際合作、實(shí)現(xiàn)知識產(chǎn)權(quán)數(shù)據(jù)的全球共享成為發(fā)展的必然趨勢。因此,中國需要順應(yīng)發(fā)展趨勢,持續(xù)完善知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系,并主動對標(biāo)國際標(biāo)準(zhǔn),積極參與有關(guān)國際標(biāo)準(zhǔn)的制修訂,持續(xù)提升中國在知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)領(lǐng)域的影響力。
滿足用戶對數(shù)據(jù)質(zhì)量的期望是知識產(chǎn)權(quán)管理部門義不容辭的責(zé)任[24]。伴隨著中國創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略的實(shí)施和知識產(chǎn)權(quán)強(qiáng)國建設(shè)的穩(wěn)步推進(jìn),充分借鑒國際先進(jìn)經(jīng)驗(yàn),以現(xiàn)有的數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ),在實(shí)踐過程中持續(xù)提升中國的知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)水平已經(jīng)成為普遍共識。具體而言,未來可以著重在4 個(gè)層面作出努力。
為了促進(jìn)知識產(chǎn)權(quán)數(shù)據(jù)的高效利用,實(shí)現(xiàn)數(shù)據(jù)加工與分析的便利化,提升國際交往能力,首先需要加強(qiáng)基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)的頂層設(shè)計(jì)。一是要認(rèn)真分析國際基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)的發(fā)展趨勢,超前布局中國數(shù)據(jù)標(biāo)準(zhǔn)體系,并為未來發(fā)展留下余地。二是深度整合現(xiàn)有的各類型知識產(chǎn)權(quán)基礎(chǔ)數(shù)據(jù),構(gòu)建既能夠滿足國際交往、開放共享的需要,又能夠貫通融合、集中統(tǒng)一的知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系。三是實(shí)現(xiàn)知識產(chǎn)權(quán)數(shù)據(jù)與科技文獻(xiàn)、技術(shù)標(biāo)準(zhǔn)、商業(yè)信息、法律文書等數(shù)據(jù)的深度整合,實(shí)現(xiàn)相關(guān)數(shù)據(jù)的標(biāo)準(zhǔn)化與規(guī)范化,促進(jìn)知識產(chǎn)權(quán)信息利用便捷、智能和高效。此外,還需要繼續(xù)搭建標(biāo)準(zhǔn)化、可兼容、可擴(kuò)展的知識產(chǎn)權(quán)數(shù)據(jù)共享平臺,實(shí)現(xiàn)各類型知識產(chǎn)權(quán)數(shù)據(jù)的有效關(guān)聯(lián)、互通共享與深度融合,并滿足國際交往、國家發(fā)展以及各類群體對知識產(chǎn)權(quán)數(shù)據(jù)的多樣化需求,提升知識產(chǎn)權(quán)數(shù)據(jù)服務(wù)經(jīng)濟(jì)社會發(fā)展與科技創(chuàng)新的能力[25]。
國內(nèi)知識產(chǎn)權(quán)基礎(chǔ)信息數(shù)據(jù)標(biāo)準(zhǔn)涉及的字段較少,例如審查信息只有申請?zhí)枴⑸暾埲?,不便于?shù)據(jù)庫之間建立數(shù)據(jù)聯(lián)系,限制了數(shù)據(jù)的加工與利用潛力。以專利檢索系統(tǒng)為例,中國專利檢索與分析系統(tǒng)設(shè)置了涵蓋申請、公開、發(fā)明人、申請人、發(fā)明名稱、摘要、說明書、分類、代理人相關(guān)的36 個(gè)檢索字段[26]。相比較而言,美國專利檢索系統(tǒng)的可檢索字段多達(dá)390 個(gè),除了申請、公開、發(fā)明、代理、分類等基本信息外,還涵蓋了優(yōu)先權(quán)、專利族、引文、相關(guān)專利、生物序列表、審查員等信息有關(guān)的字段[27],能夠檢索到更加豐富的知識產(chǎn)權(quán)信息。從WIPO 關(guān)于ST.96 標(biāo)準(zhǔn)的制定情況來看,也是希望將知識產(chǎn)權(quán)申請相關(guān)數(shù)據(jù)和轉(zhuǎn)移轉(zhuǎn)化信息納入數(shù)據(jù)標(biāo)準(zhǔn)當(dāng)中,但目前中國的這些信息仍然存在過于分散的現(xiàn)狀,急需補(bǔ)充這一領(lǐng)域的短板。針對通用元素不全面、業(yè)務(wù)元素覆蓋度有限等問題,建議借鑒ST.96 標(biāo)準(zhǔn)的設(shè)計(jì)理念,抽取各類型知識產(chǎn)權(quán)的公用元素作為通用元素,提高各類數(shù)據(jù)元素復(fù)用和調(diào)用的便捷性;同時(shí),拓展專利數(shù)據(jù)的可檢索項(xiàng),增加專利申請表、專利記錄、專利交易等有關(guān)的數(shù)據(jù)元素。此外,要充分考慮未來技術(shù)發(fā)展和創(chuàng)新主體的數(shù)據(jù)需求,從便于數(shù)據(jù)互操作和可獲取的視角,擴(kuò)展數(shù)據(jù)元素。
標(biāo)準(zhǔn)制定過程中也難免存在不完善之處,隨著科學(xué)技術(shù)的發(fā)展與進(jìn)步,知識產(chǎn)權(quán)信息加工和處理能力將發(fā)生改變,促使知識產(chǎn)權(quán)的數(shù)據(jù)來源、利用與呈現(xiàn)方式更加多樣化,標(biāo)準(zhǔn)的應(yīng)用場景和應(yīng)用需求也會發(fā)生變化,因此,對大多數(shù)類型的標(biāo)準(zhǔn)而言,建立修訂及更新機(jī)制是必需的。為了進(jìn)一步解決信息資源共享不充分問題,調(diào)和知識產(chǎn)權(quán)信息供需之間的矛盾,提高知識產(chǎn)權(quán)數(shù)據(jù)的運(yùn)用水平和促進(jìn)知識產(chǎn)權(quán)事業(yè)發(fā)展,中國應(yīng)借鑒WIPO 的相關(guān)標(biāo)準(zhǔn)的制定與修訂機(jī)制,建立更為有效的標(biāo)準(zhǔn)修訂與更新機(jī)制,根據(jù)技術(shù)發(fā)展情況以及實(shí)際應(yīng)用需求,及時(shí)、持續(xù)優(yōu)化和完善知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)。
如果掌握了國際標(biāo)準(zhǔn)制定的話語權(quán),就能夠在國際競爭中獲取更大的優(yōu)勢,但當(dāng)前中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)在國際上的影響力明顯不足,需要持續(xù)重視知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn),并不斷提高標(biāo)準(zhǔn)研究能力。首先需要增強(qiáng)與國際組織及其他國家(地區(qū))知識產(chǎn)權(quán)局之間的交流與合作,主動參與國際標(biāo)準(zhǔn)的制定與修訂,發(fā)揮與國際地位相匹配的作用。其次是要在充分借鑒國際經(jīng)驗(yàn)的基礎(chǔ)上,盡快結(jié)合中國實(shí)際,提升自身的數(shù)據(jù)標(biāo)準(zhǔn)制定能力,完善數(shù)據(jù)收集與加工機(jī)制。再次,充分發(fā)揮中國在大數(shù)據(jù)分析等領(lǐng)域的技術(shù)優(yōu)勢,超前謀劃布局信息處理前沿技術(shù),獲得在國際競爭中的戰(zhàn)略優(yōu)勢。最后,提升公眾對數(shù)據(jù)標(biāo)準(zhǔn)的認(rèn)知與應(yīng)用能力,通過定期舉辦專題培訓(xùn)和經(jīng)驗(yàn)交流會等多種形式,靈活運(yùn)用多種媒介,加強(qiáng)對數(shù)據(jù)標(biāo)準(zhǔn)相關(guān)信息的宣傳和普及,幫助政府管理者、企業(yè)負(fù)責(zé)人、科研人員熟練掌握國際規(guī)則的新變化和新趨勢[28]。
知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系是知識產(chǎn)權(quán)數(shù)據(jù)處理的基礎(chǔ)。中國的知識產(chǎn)權(quán)數(shù)據(jù)由于長期分散于多個(gè)部門進(jìn)行管理,導(dǎo)致數(shù)據(jù)之間缺乏必要的聯(lián)系,阻礙了數(shù)據(jù)共享與互聯(lián)互通。為促進(jìn)知識產(chǎn)權(quán)基礎(chǔ)信息的采集加工、共享交換和運(yùn)用管理水平,中國自2019 年開始持續(xù)提升知識產(chǎn)權(quán)基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn),但目前仍存在數(shù)據(jù)標(biāo)準(zhǔn)的頂層設(shè)計(jì)有待完善、元素豐富性有待擴(kuò)展、標(biāo)準(zhǔn)修訂與更新機(jī)制不夠健全、國際影響力有待提升等諸多問題。為進(jìn)一步提升中國知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)水平,亟須加強(qiáng)基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)頂層設(shè)計(jì)、擴(kuò)展數(shù)據(jù)標(biāo)準(zhǔn)的元素、持續(xù)更新數(shù)據(jù)標(biāo)準(zhǔn)、并不斷爭取中國標(biāo)準(zhǔn)的國際話語權(quán)。
數(shù)據(jù)標(biāo)準(zhǔn)是解決數(shù)據(jù)共享障礙最直接的方法[22]305。隨著數(shù)字技術(shù)的應(yīng)用與發(fā)展,數(shù)據(jù)加工與處理能力迅速提升,知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)的重要性更加凸顯。為促進(jìn)知識產(chǎn)權(quán)的國際交往,滿足國家、社會和創(chuàng)新主體對知識產(chǎn)權(quán)數(shù)據(jù)的多樣化需求,以適應(yīng)大數(shù)據(jù)分析技術(shù)需求和提升基礎(chǔ)數(shù)據(jù)加工應(yīng)用能力為目標(biāo),構(gòu)建統(tǒng)一、高效的知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系是促進(jìn)國際交往,滿足國家、社會和創(chuàng)新主體對知識產(chǎn)權(quán)數(shù)據(jù)的樣化需求的客觀需要,也是提升知識產(chǎn)權(quán)數(shù)據(jù)處理和治理能力的基礎(chǔ)。建設(shè)知識產(chǎn)權(quán)強(qiáng)國,持續(xù)提升整個(gè)國家的科技創(chuàng)新能力,需要便捷高效的知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系作為基礎(chǔ)。知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)水平的提升,既涉及眾多部門的高效協(xié)同,又涉及不同數(shù)據(jù)之間的標(biāo)準(zhǔn)統(tǒng)一與高效管理,是一個(gè)宏大的系統(tǒng)工程。以知識產(chǎn)權(quán)強(qiáng)國建設(shè)為契機(jī),持續(xù)提升知識產(chǎn)權(quán)數(shù)據(jù)標(biāo)準(zhǔn)的制定能力,進(jìn)而完善數(shù)據(jù)管理水平與應(yīng)用能力,發(fā)揮知識產(chǎn)權(quán)信息服務(wù)于科技創(chuàng)新和新興產(chǎn)業(yè)發(fā)展的優(yōu)勢,具有重要的現(xiàn)實(shí)意義。