張明倩,趙彥云
(1.上海外國(guó)語(yǔ)大學(xué) 國(guó)際金融貿(mào)易學(xué)院,上海 201620;2.中國(guó)人民大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100872)
以人工智能、大數(shù)據(jù)和云計(jì)算等新一代信息技術(shù)的系統(tǒng)性突破和應(yīng)用為主要特征的數(shù)字化轉(zhuǎn)型正在成為重要的時(shí)代特征[1]。各領(lǐng)域資源數(shù)字化形成數(shù)據(jù)資源、數(shù)據(jù)生產(chǎn)要素、數(shù)據(jù)資產(chǎn)或資本化,是互聯(lián)網(wǎng)技術(shù)革命過(guò)程的系統(tǒng)收斂[2]。在科學(xué)技術(shù)領(lǐng)域,《科學(xué)、技術(shù)與創(chuàng)新數(shù)字化——關(guān)鍵進(jìn)展和政策》指出數(shù)字化正在成為科技創(chuàng)新活動(dòng)最顯著的特征,如何應(yīng)對(duì)數(shù)字化轉(zhuǎn)型為科技統(tǒng)計(jì)工作帶來(lái)的機(jī)遇和挑戰(zhàn),是亟待探索的現(xiàn)實(shí)問(wèn)題,也是統(tǒng)計(jì)現(xiàn)代化改革的重要內(nèi)容[3]。本文聚焦科技統(tǒng)計(jì)的重要組成部分——專利統(tǒng)計(jì)(1)科學(xué)技術(shù)作為統(tǒng)計(jì)對(duì)象,至少要分為三個(gè)方面:一是投入;二是過(guò)程;三是產(chǎn)出。與之相對(duì)應(yīng),當(dāng)前科技統(tǒng)計(jì)大體有三個(gè)關(guān)注點(diǎn)。第一是R&D投入統(tǒng)計(jì);第二是創(chuàng)新統(tǒng)計(jì);第三是知識(shí)產(chǎn)權(quán)統(tǒng)計(jì),主要是指專利統(tǒng)計(jì)(高敏雪,2019)。,嘗試基于全面量化的廣義統(tǒng)計(jì)思維,探索政府專利統(tǒng)計(jì)現(xiàn)代化改革的方向,即面向互聯(lián)網(wǎng)云平臺(tái)的專利數(shù)字化統(tǒng)計(jì)設(shè)計(jì)和服務(wù)應(yīng)用[4]。
作為連接科技創(chuàng)新和產(chǎn)業(yè)化實(shí)踐的關(guān)鍵節(jié)點(diǎn),專利數(shù)據(jù)是科技創(chuàng)新活動(dòng)伴生的戰(zhàn)略性數(shù)據(jù)資源,匯集了全球企業(yè)、高校和科研機(jī)構(gòu)的研究開(kāi)發(fā)動(dòng)向、產(chǎn)業(yè)和市場(chǎng)趨勢(shì),專利導(dǎo)航產(chǎn)業(yè)發(fā)展與創(chuàng)新實(shí)踐已成為新時(shí)代宏觀經(jīng)濟(jì)政策與規(guī)劃的重要舉措[5-6]。專利數(shù)字化統(tǒng)計(jì)面向網(wǎng)絡(luò)化、數(shù)字化和智能化,形成專利數(shù)據(jù)及相關(guān)數(shù)據(jù)資源互聯(lián)互通的數(shù)據(jù)網(wǎng)絡(luò),實(shí)現(xiàn)專利創(chuàng)造、運(yùn)用和保護(hù)過(guò)程的數(shù)字孿生,伴隨數(shù)據(jù)的全生命周期流轉(zhuǎn),利用人工智能、大數(shù)據(jù)等相關(guān)技術(shù)挖掘有價(jià)值的顯性和隱性信息,有機(jī)嵌入云計(jì)算、區(qū)塊鏈等技術(shù)實(shí)現(xiàn)數(shù)據(jù)安全共享,通過(guò)有效對(duì)接供需,實(shí)現(xiàn)科技創(chuàng)新資源的高效配置,最大化專利數(shù)據(jù)的價(jià)值增值,推動(dòng)專利統(tǒng)計(jì)服務(wù)從“數(shù)庫(kù)”向“智庫(kù)”到“力庫(kù)(2)“力庫(kù)”指生產(chǎn)力庫(kù),具體內(nèi)涵是知識(shí)轉(zhuǎn)化形成生產(chǎn)力的名錄技術(shù)產(chǎn)權(quán)庫(kù)?!鞭D(zhuǎn)變轉(zhuǎn)化,并成為國(guó)家統(tǒng)計(jì)云平臺(tái)的有機(jī)組成部分[7]。
科學(xué)技術(shù)創(chuàng)新領(lǐng)域數(shù)字化轉(zhuǎn)型已成為國(guó)際組織、國(guó)內(nèi)外政府統(tǒng)計(jì)機(jī)構(gòu)和學(xué)者們關(guān)注的焦點(diǎn),數(shù)字化轉(zhuǎn)型使知識(shí)產(chǎn)生、擴(kuò)散和應(yīng)用發(fā)生了根本性改變,同時(shí)也對(duì)統(tǒng)計(jì)體系和測(cè)量工具帶來(lái)一系列挑戰(zhàn)[8-9]。
OECD“走向數(shù)字化(Going Digital)”項(xiàng)目的系列研究成果指出科技創(chuàng)新互聯(lián)網(wǎng)云平臺(tái)是科技創(chuàng)新全要素連接的樞紐和資源配置的中心,面向科技創(chuàng)新互聯(lián)網(wǎng)云平臺(tái)的數(shù)字化統(tǒng)計(jì)是科學(xué)技術(shù)創(chuàng)新數(shù)字化轉(zhuǎn)型的統(tǒng)計(jì)量化方向[3,9]。通過(guò)制定和細(xì)化國(guó)際通用的統(tǒng)計(jì)分類和編碼標(biāo)準(zhǔn),開(kāi)發(fā)跨領(lǐng)域和學(xué)科的數(shù)據(jù)收集方法和單元,推動(dòng)科技創(chuàng)新資源及其供需主體數(shù)字化形成數(shù)字創(chuàng)新生態(tài)系統(tǒng),利用數(shù)字化平臺(tái)推動(dòng)科技創(chuàng)新數(shù)據(jù)資源傳導(dǎo)、優(yōu)化、配置、競(jìng)爭(zhēng)、匹配成新的生產(chǎn)力[10]。圍繞科技創(chuàng)新互聯(lián)網(wǎng)云平臺(tái)的搭建,OECD、歐盟和聯(lián)合國(guó)統(tǒng)計(jì)委員會(huì)等國(guó)外統(tǒng)計(jì)機(jī)構(gòu)不斷完善統(tǒng)計(jì)分類和編碼標(biāo)準(zhǔn),推動(dòng)專門統(tǒng)計(jì)的貫通和數(shù)據(jù)收集的標(biāo)準(zhǔn)化。Michela Bello (2020)公布了OECD國(guó)際科學(xué)作者調(diào)查(ISSA2)的最新設(shè)計(jì)方案和實(shí)現(xiàn)代碼,旨在推動(dòng)科學(xué)研究相關(guān)領(lǐng)域在線調(diào)查的數(shù)字化轉(zhuǎn)型。研發(fā)數(shù)據(jù)跨領(lǐng)域連接也是學(xué)者關(guān)注的重要方向[11]。歐盟組建“歐洲開(kāi)放科學(xué)云平臺(tái)(ESOC)”整合歐洲共享科研數(shù)據(jù)的云結(jié)構(gòu)基礎(chǔ)設(shè)施聯(lián)盟,并持續(xù)推出開(kāi)放數(shù)據(jù)、開(kāi)放存取、數(shù)據(jù)共享和數(shù)據(jù)治理等項(xiàng)目部署。美國(guó)開(kāi)放科學(xué)中心、英國(guó)數(shù)據(jù)典藏中心等機(jī)構(gòu)和美國(guó)“從大數(shù)據(jù)到知識(shí)”、歐盟“地平線2020”等計(jì)劃項(xiàng)目均聚焦數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新的范式變革,對(duì)數(shù)字化轉(zhuǎn)型中科學(xué)數(shù)據(jù)的開(kāi)發(fā)和使用進(jìn)行有益探索。針對(duì)科學(xué)數(shù)據(jù)的過(guò)程披露落后于成果披露的非均衡現(xiàn)象,專門從事數(shù)字科學(xué)的數(shù)據(jù)技術(shù)公司Digital Science面向科研全流程,創(chuàng)造覆蓋數(shù)據(jù)、證據(jù)、工具與智慧服務(wù)的新型科研生態(tài)和智能數(shù)據(jù)開(kāi)發(fā)工具[9]。
中國(guó)同樣重視數(shù)字化轉(zhuǎn)型中科學(xué)數(shù)據(jù)的開(kāi)發(fā)與使用,且已初步形成政府主導(dǎo)的科學(xué)數(shù)據(jù)開(kāi)發(fā)共享模式[12]。國(guó)務(wù)院發(fā)布的《科學(xué)數(shù)據(jù)管理辦法》(2018)從多個(gè)方面規(guī)范了科學(xué)數(shù)據(jù)的管理與共享。但受發(fā)展階段所限,中國(guó)對(duì)數(shù)字化轉(zhuǎn)型推動(dòng)的創(chuàng)新范式變革認(rèn)識(shí)不足,科學(xué)數(shù)據(jù)多局限于科學(xué)研究過(guò)程的非文本事實(shí)記錄,覆蓋范圍局限在科學(xué)研究的投入產(chǎn)出過(guò)程,對(duì)其與生產(chǎn)力連接的部分關(guān)注不足,在某種程度上阻礙了科技創(chuàng)新實(shí)踐向現(xiàn)實(shí)生產(chǎn)力的高效轉(zhuǎn)化[13-15]。隨著數(shù)字技術(shù)加速普及,尤其是(工業(yè))互聯(lián)網(wǎng)云平臺(tái)的使用越來(lái)越廣泛,科技創(chuàng)新向產(chǎn)業(yè)化實(shí)踐轉(zhuǎn)移過(guò)程中數(shù)據(jù)資源的開(kāi)發(fā)和使用需要在新理論和新方法的指引下進(jìn)行設(shè)計(jì)和完善。
為了順應(yīng)數(shù)字化轉(zhuǎn)型向經(jīng)濟(jì)社會(huì)各領(lǐng)域全方位滲透的新形勢(shì)、新趨勢(shì)和新特征,中國(guó)政府部門和學(xué)術(shù)界不斷加強(qiáng)研究數(shù)字化轉(zhuǎn)型的系統(tǒng)化新理論和新方法,探索設(shè)計(jì)符合中國(guó)實(shí)際的跨行業(yè)、跨領(lǐng)域數(shù)據(jù)收集方式,建立協(xié)調(diào)、連貫的政府跨部門工作組織形式[16]。其中,鞏固拓展聯(lián)網(wǎng)直報(bào)平臺(tái),探索區(qū)塊鏈、人工智能、物聯(lián)網(wǎng)等新技術(shù)在統(tǒng)計(jì)工作中的應(yīng)用場(chǎng)景,建設(shè)國(guó)家統(tǒng)計(jì)云平臺(tái),實(shí)現(xiàn)統(tǒng)計(jì)工作的數(shù)字化轉(zhuǎn)型是中國(guó)政府統(tǒng)計(jì)部門的重要舉措和統(tǒng)計(jì)現(xiàn)代化改革的重要方向。
專利統(tǒng)計(jì)是科技統(tǒng)計(jì)的組成部分,自《測(cè)度科學(xué)技術(shù)活動(dòng):用作科技指標(biāo)的專利數(shù)據(jù)》(1994)出版以來(lái),在世界知識(shí)產(chǎn)權(quán)組織、OECD、歐盟統(tǒng)計(jì)局以及各國(guó)知識(shí)產(chǎn)權(quán)局的共同推動(dòng)下,已形成一套有關(guān)專利指標(biāo)編制和使用的規(guī)范。中國(guó)也已形成由國(guó)家知識(shí)產(chǎn)權(quán)局主導(dǎo),國(guó)家、區(qū)域和地方專利信息服務(wù)中心以及大量提供專利信息服務(wù)的商業(yè)機(jī)構(gòu)組成的多層次專利信息服務(wù)系統(tǒng),專利統(tǒng)計(jì)公報(bào)與專利專題數(shù)據(jù)庫(kù)相結(jié)合的專利數(shù)據(jù)發(fā)布和獲取模式[17]。就專利數(shù)據(jù)采集而言,一是面向?qū)@?圍繞專利申請(qǐng)和審查流程采集的有關(guān)專利申請(qǐng)、授權(quán)、執(zhí)法狀態(tài)等審核流程管理數(shù)據(jù);二是面向?qū)@麢?quán)人(企業(yè)、高校、科研院所和個(gè)人),覆蓋專利創(chuàng)造、運(yùn)用、保護(hù)、管理和服務(wù)等方面的調(diào)查數(shù)據(jù)。就專利統(tǒng)計(jì)標(biāo)準(zhǔn)而言,《公共專利信息統(tǒng)計(jì)數(shù)據(jù)項(xiàng)表》(國(guó)家知識(shí)產(chǎn)權(quán)局,2003)規(guī)范了77項(xiàng)專利統(tǒng)計(jì)數(shù)據(jù)項(xiàng)的定義、統(tǒng)計(jì)范圍、統(tǒng)計(jì)時(shí)點(diǎn)和統(tǒng)計(jì)公式。不難看出,中國(guó)政府專利統(tǒng)計(jì)在組織實(shí)施、數(shù)據(jù)采集、數(shù)據(jù)整理和數(shù)據(jù)發(fā)布等方面已形成較為成熟的做法。
但隨著數(shù)字化轉(zhuǎn)型升級(jí)和開(kāi)放式創(chuàng)新范式變革,新技術(shù)、千變?nèi)f化的商業(yè)需求以及不斷發(fā)展的人才市場(chǎng)等各種力量不斷改變專利數(shù)據(jù)的消費(fèi)和使用狀況[18]。數(shù)字技術(shù)和數(shù)據(jù)生產(chǎn)要素的引入,顯著提升了專利創(chuàng)造和運(yùn)用過(guò)程中主體和要素交互作用的復(fù)雜性,同時(shí)也加劇了專利使用與產(chǎn)業(yè)化實(shí)踐融合路徑及可能結(jié)果的不確定性,數(shù)字化轉(zhuǎn)型和創(chuàng)新范式變革不斷挑戰(zhàn)傳統(tǒng)專利統(tǒng)計(jì),具體可歸結(jié)為以下問(wèn)題。
首先,專利文本統(tǒng)計(jì)缺位。古典專利創(chuàng)新理論強(qiáng)調(diào)專利的獨(dú)占性,專利權(quán)人憑借專利權(quán)將競(jìng)爭(zhēng)者排擠出市場(chǎng)以獲得競(jìng)爭(zhēng)優(yōu)勢(shì)[19]。世界知識(shí)產(chǎn)權(quán)組織將專利理解為“專有權(quán)利”?!秾@y(tǒng)計(jì)手冊(cè)》(OCED,2009)定義專利為“保護(hù)由企業(yè)、機(jī)構(gòu)或個(gè)人所作發(fā)明創(chuàng)造的手段,是經(jīng)濟(jì)生活的法律工具”。相對(duì)而言,傳統(tǒng)專利統(tǒng)計(jì)是對(duì)專利申請(qǐng)、授權(quán)、交易和法律狀態(tài)等顯性信息在特定統(tǒng)計(jì)分類標(biāo)準(zhǔn)下的計(jì)數(shù)過(guò)程,針對(duì)專利文本內(nèi)容的統(tǒng)計(jì)缺位。然而,專利文本才是科技創(chuàng)新生產(chǎn)要素和核心技術(shù)創(chuàng)新方法的集合,是科技創(chuàng)新與生產(chǎn)力連接的重要部分,專利文本內(nèi)容的量化缺失在一定程度上限制了進(jìn)一步創(chuàng)新[23]。尤其是隨著知識(shí)圖譜技術(shù)被越來(lái)越多地應(yīng)用于工業(yè)界,并成為互聯(lián)網(wǎng)時(shí)代數(shù)據(jù)知識(shí)化組織和智能化應(yīng)用的有效解決方案[20]。作為知識(shí)圖譜的重要數(shù)據(jù)來(lái)源,專利文本的統(tǒng)計(jì)缺位削弱了知識(shí)圖譜技術(shù)從文本中挖掘信息的能力,降低了知識(shí)圖譜(特別是行業(yè)知識(shí)圖譜)對(duì)領(lǐng)域知識(shí)進(jìn)行追蹤和預(yù)測(cè)的性能[21]。因此,打破專利文本內(nèi)容的封閉性,提高專利文本內(nèi)容的可識(shí)別性,通過(guò)語(yǔ)義識(shí)別等自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)專利文本的數(shù)據(jù)化,并與技術(shù)背景、市場(chǎng)狀況等非專利信息映射互聯(lián),形成可拓展的數(shù)據(jù)鏈條和服務(wù)網(wǎng)絡(luò),是專利數(shù)字化統(tǒng)計(jì)的重要內(nèi)容。
其次,專利需求統(tǒng)計(jì)缺位。開(kāi)放式創(chuàng)新范式強(qiáng)調(diào)科技創(chuàng)新過(guò)程的網(wǎng)絡(luò)化和生態(tài)化,認(rèn)為科技創(chuàng)新過(guò)程是多方開(kāi)放互動(dòng)、協(xié)作共享形成的動(dòng)態(tài)結(jié)構(gòu)系統(tǒng),重視科學(xué)發(fā)現(xiàn)的供給過(guò)程,同時(shí)快速響應(yīng)需求和變化的交互創(chuàng)新更是其重要特征。然而,傳統(tǒng)科技統(tǒng)計(jì)的底層設(shè)計(jì)邏輯并未完全擺脫科技創(chuàng)新過(guò)程的傳統(tǒng)線性模型,將科技創(chuàng)新活動(dòng)視作“投入”和“產(chǎn)出”的線性生產(chǎn)過(guò)程[22]。作為科技“產(chǎn)出”統(tǒng)計(jì)的部分,專利統(tǒng)計(jì)主要是圍繞科技創(chuàng)新供給端對(duì)專利及相關(guān)數(shù)據(jù)進(jìn)行采集和加工,面向?qū)@枨蟮慕y(tǒng)計(jì)缺位,因此很難全面且敏銳地捕捉科技創(chuàng)新過(guò)程中產(chǎn)生的新知識(shí)、新產(chǎn)品和新技術(shù)。如何全面客觀地刻畫科技創(chuàng)新生態(tài)體系,實(shí)現(xiàn)專利需求與供給直接對(duì)接,其中,面向?qū)@枨蟮慕y(tǒng)計(jì)及其數(shù)字化成為關(guān)鍵。
再次,專利數(shù)據(jù)互聯(lián)互通缺乏組織保障。面向網(wǎng)絡(luò)化、數(shù)字化和智能化,實(shí)現(xiàn)數(shù)據(jù)互聯(lián)、互通、互動(dòng)是統(tǒng)計(jì)應(yīng)用價(jià)值提升的重要體現(xiàn)[4]。傳統(tǒng)專利統(tǒng)計(jì)工作中,針對(duì)專利權(quán)人開(kāi)展的專利調(diào)查,是專利統(tǒng)計(jì)工作從單一的專利數(shù)據(jù)采集向?qū)@跋嚓P(guān)數(shù)據(jù)共同采集的轉(zhuǎn)變,也是實(shí)現(xiàn)專利數(shù)據(jù)與非專利數(shù)據(jù)互聯(lián)互通的重要途徑。但現(xiàn)行統(tǒng)計(jì)制度下,專門數(shù)據(jù)的采集、開(kāi)發(fā)和管理分別由不同的政府主管部門承擔(dān),面向?qū)@麢?quán)人開(kāi)展的專利調(diào)查和統(tǒng)計(jì)工作就是由國(guó)家知識(shí)產(chǎn)權(quán)局、國(guó)家統(tǒng)計(jì)局、教育部、科技部等政府主管部門共同參與完成,盡管建立部門統(tǒng)計(jì)的共享機(jī)制已成為服務(wù)型政府的應(yīng)有之義,但部門利益壁壘、數(shù)據(jù)共享平臺(tái)組織者缺位現(xiàn)象仍然存在,部門統(tǒng)計(jì)的獨(dú)立性和封閉性仍然較強(qiáng)[24]。這種條塊化、封閉式的數(shù)據(jù)采集系統(tǒng)限制了專利數(shù)據(jù)資源的深度挖掘,事實(shí)上形成大量“數(shù)據(jù)孤島”,導(dǎo)致專利數(shù)據(jù)資源嚴(yán)重浪費(fèi)。如何連通這些“孤島”,把孤立的數(shù)據(jù)模塊關(guān)聯(lián)組合為互聯(lián)互通的數(shù)據(jù)網(wǎng)絡(luò),極大化專利統(tǒng)計(jì)的外延,使更有價(jià)值的隱性信息浮出水面是專利數(shù)字化統(tǒng)計(jì)需要解決的另一個(gè)重要問(wèn)題。
最后,專利統(tǒng)計(jì)服務(wù)滯后于專利信息需求。統(tǒng)計(jì)服務(wù)是統(tǒng)計(jì)工作最基本和關(guān)鍵的能力,專利統(tǒng)計(jì)服務(wù)是通過(guò)收集、整理、分析和發(fā)布專利相關(guān)的數(shù)據(jù)與信息以匹配用戶(政府、企業(yè)、高校院所和社會(huì)公眾等)的需求。和其他部門政府統(tǒng)計(jì)一樣,傳統(tǒng)的專利統(tǒng)計(jì)工作流程清晰固定且具有明確的目的和對(duì)象,即針對(duì)專利文件披露的有關(guān)技術(shù)、權(quán)屬時(shí)效、專利許可等法律和經(jīng)濟(jì)信息進(jìn)行采集、加工、整理并生成統(tǒng)計(jì)指標(biāo),再按照事先設(shè)定的格式或模型進(jìn)行有針對(duì)性的計(jì)算和分析,是典型的“定義式的現(xiàn)象特征描述+常規(guī)的歸納推理分析”思路[25]。毋庸置疑,傳統(tǒng)專利統(tǒng)計(jì)在客觀反映發(fā)明創(chuàng)造活動(dòng)的形成和結(jié)果、服務(wù)科學(xué)決策的過(guò)程中發(fā)揮過(guò)重要作用,但伴隨數(shù)字化轉(zhuǎn)型升級(jí)和開(kāi)放式創(chuàng)新范式變革,科技創(chuàng)新活動(dòng)過(guò)程中主體與要素的復(fù)雜性和科技創(chuàng)新成果使用的不確定性顯著提升,用戶對(duì)專利信息的需求更趨于定制化和實(shí)時(shí)化,傳統(tǒng)專利統(tǒng)計(jì)目標(biāo)單一、實(shí)施和發(fā)布流程僵化、分析方法單調(diào)的不足日益突出,直接表現(xiàn)為專利數(shù)據(jù)信息傳導(dǎo)遲緩,專利統(tǒng)計(jì)信息的供給滯后于用戶提出的新問(wèn)題和新需要,阻礙了專利統(tǒng)計(jì)服務(wù)功能的極大化發(fā)揮,難以滿足專利導(dǎo)航深度嵌入產(chǎn)業(yè)發(fā)展和創(chuàng)新實(shí)踐的政策要求。優(yōu)化專利統(tǒng)計(jì)服務(wù)就要求增加專利統(tǒng)計(jì)數(shù)據(jù)的維度、格式、結(jié)構(gòu)多樣性和細(xì)化數(shù)據(jù)粒度、擴(kuò)大數(shù)據(jù)獲取途徑并最大化數(shù)據(jù)價(jià)值,提升專利統(tǒng)計(jì)服務(wù)對(duì)專利信息需求的實(shí)時(shí)響應(yīng)能力[26]。推動(dòng)面向全連接、全場(chǎng)景、全智能的專利數(shù)字化統(tǒng)計(jì)服務(wù),是優(yōu)化專利統(tǒng)計(jì)服務(wù)的關(guān)鍵。
綜上,在專利創(chuàng)造、運(yùn)用和保護(hù)的現(xiàn)實(shí)物理過(guò)程向數(shù)字世界遷移,進(jìn)而升華為人類認(rèn)知世界有效知識(shí)的過(guò)程中,傳統(tǒng)專利統(tǒng)計(jì)所提供的統(tǒng)計(jì)內(nèi)容和統(tǒng)計(jì)服務(wù)無(wú)法滿足充分解析和有效支撐數(shù)字創(chuàng)新生態(tài)系統(tǒng)生成和運(yùn)行的要求。
人工智能、大數(shù)據(jù)和云計(jì)算等新一代信息技術(shù)驅(qū)動(dòng)的新一輪科技革命在挑戰(zhàn)傳統(tǒng)統(tǒng)計(jì)的同時(shí),也在不斷重構(gòu)統(tǒng)計(jì)數(shù)據(jù)生產(chǎn)、采集、加工、分析和應(yīng)用的模式,不斷催生時(shí)間、空間、維度、主題、過(guò)程及網(wǎng)絡(luò)關(guān)系一體化社會(huì)活動(dòng)復(fù)雜生態(tài)系統(tǒng)的統(tǒng)計(jì)理論方法的新變革。新一代信息技術(shù)在不斷融合、疊加和迭代升級(jí)的過(guò)程中,為專利統(tǒng)計(jì)工作的數(shù)字化轉(zhuǎn)型提供了高經(jīng)濟(jì)性、高可用性、高可靠性的技術(shù)底座,構(gòu)建起一個(gè)數(shù)據(jù)驅(qū)動(dòng)的平臺(tái)化、生態(tài)化的基礎(chǔ)設(shè)施群[27]。
5G技術(shù)的高可靠性、超低時(shí)延性、廣泛覆蓋性和大連接特性不斷推動(dòng)人與物、物與物、人與人的連接和數(shù)據(jù)交換以更大量級(jí)發(fā)生,疊加傳感器技術(shù)的發(fā)展,數(shù)據(jù)采集的全面性、準(zhǔn)確性和及時(shí)性迅速提升,多模態(tài)海量數(shù)據(jù)的采集方式已由被動(dòng)手工記錄轉(zhuǎn)變?yōu)橹鲃?dòng)感知記錄,采集范圍也由傳統(tǒng)的調(diào)查數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、技術(shù)數(shù)據(jù)、軟數(shù)據(jù)、文本數(shù)據(jù)向?qū)崟r(shí)數(shù)據(jù)和空間數(shù)據(jù)拓展,數(shù)據(jù)采集的顆粒度不斷細(xì)化、頻度不斷提高;數(shù)據(jù)湖存儲(chǔ)架構(gòu)和分布式計(jì)算技術(shù)為海量、實(shí)時(shí)、多模態(tài)數(shù)據(jù)提供了存儲(chǔ)方案和算力儲(chǔ)備,推動(dòng)數(shù)據(jù)存儲(chǔ)與使用開(kāi)發(fā)的有效分離,為打破數(shù)據(jù)孤島、增強(qiáng)數(shù)據(jù)應(yīng)用的可拓展性提供了可能;人工智能技術(shù)的升級(jí)與融合為深度挖掘數(shù)據(jù)價(jià)值,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)增值提供了強(qiáng)有力的技術(shù)支撐。
新一代信息技術(shù)不斷衍生發(fā)展為統(tǒng)計(jì)數(shù)據(jù)的生產(chǎn)、采集、存儲(chǔ)、管理和應(yīng)用提供全新模式的同時(shí),也推動(dòng)統(tǒng)計(jì)方法不斷創(chuàng)新,從經(jīng)典統(tǒng)計(jì)到現(xiàn)代大數(shù)據(jù)統(tǒng)計(jì),再發(fā)展為立足于互聯(lián)網(wǎng)大數(shù)據(jù)、滿足全面量化和全面統(tǒng)計(jì)要求的廣義統(tǒng)計(jì)理論和方法,傳統(tǒng)專利統(tǒng)計(jì)也正在向面向互聯(lián)網(wǎng)云平臺(tái),涵蓋新統(tǒng)計(jì)內(nèi)容、新統(tǒng)計(jì)標(biāo)準(zhǔn)、新統(tǒng)計(jì)調(diào)查、新統(tǒng)計(jì)管理和新統(tǒng)計(jì)方法的數(shù)字化統(tǒng)計(jì)轉(zhuǎn)變。
圍繞打造科技創(chuàng)新互聯(lián)網(wǎng)云平臺(tái),推動(dòng)科學(xué)技術(shù)創(chuàng)新領(lǐng)域數(shù)字化形成數(shù)字創(chuàng)新生態(tài)系統(tǒng)(DIE),2008年《國(guó)家知識(shí)產(chǎn)權(quán)戰(zhàn)略綱要》提出構(gòu)建國(guó)家基礎(chǔ)知識(shí)產(chǎn)權(quán)信息公共服務(wù)平臺(tái),2011年重慶啟動(dòng)建設(shè)了全球首個(gè)“專利云”平臺(tái),利用云計(jì)算技術(shù)整合全球知識(shí)產(chǎn)權(quán)數(shù)據(jù)和服務(wù)資源,打造知識(shí)產(chǎn)權(quán)數(shù)字化服務(wù)生態(tài),形成完整的知識(shí)產(chǎn)權(quán)服務(wù)產(chǎn)業(yè)鏈[28]。期間,互聯(lián)網(wǎng)云平臺(tái)的技術(shù)架構(gòu)一直是學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注和重點(diǎn)推進(jìn)的領(lǐng)域,然而相較于技術(shù)、算法和模型,數(shù)據(jù)的重要性卻被低估[29]。數(shù)據(jù)化才是互聯(lián)網(wǎng)云平臺(tái)最主要的運(yùn)行機(jī)制,直接關(guān)系到互聯(lián)網(wǎng)云平臺(tái)的性能、安全性、穩(wěn)健性和拓展性,作為數(shù)據(jù)的重要解析工具,數(shù)字化統(tǒng)計(jì)是保障互聯(lián)網(wǎng)云平臺(tái)順暢運(yùn)行的統(tǒng)計(jì)服務(wù)體系。本文將從新統(tǒng)計(jì)內(nèi)容、新統(tǒng)計(jì)標(biāo)準(zhǔn)、新統(tǒng)計(jì)調(diào)查、新統(tǒng)計(jì)管理和新統(tǒng)計(jì)方法5個(gè)方面具體闡釋面向互聯(lián)網(wǎng)云平臺(tái)的專利數(shù)字化統(tǒng)計(jì)設(shè)計(jì)和發(fā)展。
表1梳理了傳統(tǒng)政府專利統(tǒng)計(jì)的實(shí)施單位、統(tǒng)計(jì)對(duì)象和統(tǒng)計(jì)內(nèi)容等信息,一是國(guó)家知識(shí)產(chǎn)權(quán)局組織的專利統(tǒng)計(jì)年(月)報(bào),以申請(qǐng)審核的專利為統(tǒng)計(jì)對(duì)象,統(tǒng)計(jì)內(nèi)容主要涵蓋專利的申請(qǐng)、授權(quán)、時(shí)效和法律狀態(tài)等信息,數(shù)據(jù)采集的顆粒度匹配專利審查的分類需求[19];二是國(guó)家知識(shí)產(chǎn)權(quán)局組織的年度專利調(diào)查,以擁有有效專利的專利權(quán)人(企業(yè)、高校、科研單位和個(gè)人)為統(tǒng)計(jì)對(duì)象,統(tǒng)計(jì)內(nèi)容覆蓋專利的創(chuàng)造、運(yùn)用、保護(hù)、管理和服務(wù)等方面;三是其他科技統(tǒng)計(jì)中涉及專利的部分,如國(guó)家統(tǒng)計(jì)局開(kāi)展的企業(yè)創(chuàng)新調(diào)查,教育部、科技部和國(guó)防科工局組織的高校和科研機(jī)構(gòu)科技成果填報(bào)工作等。
表1 傳統(tǒng)政府專利統(tǒng)計(jì)涉及的主要統(tǒng)計(jì)內(nèi)容
第一,數(shù)字化統(tǒng)計(jì)內(nèi)容需要滿足互聯(lián)互通的要求。傳統(tǒng)專利統(tǒng)計(jì)由多個(gè)政府部門參與完成,而政府部門統(tǒng)計(jì)往往以各自職權(quán)為界,服務(wù)于本部門管理的需要,雖便于搜集數(shù)據(jù),但條塊分割現(xiàn)象突出[30]。由不同政府部門主導(dǎo)的專利統(tǒng)計(jì)在統(tǒng)計(jì)口徑和計(jì)算方法上存在較大差異,數(shù)據(jù)標(biāo)準(zhǔn)、接口和結(jié)果不能實(shí)現(xiàn)對(duì)接,導(dǎo)致了專利數(shù)據(jù)的“碎片化”和“孤島化”,一邊是不斷累積但閑置的專利數(shù)據(jù),一邊是社會(huì)各領(lǐng)域?qū)@畔⑷找鎮(zhèn)€性化、協(xié)同化和復(fù)雜化的多向度需求無(wú)法滿足[31]。因此,數(shù)字化統(tǒng)計(jì)需要“大”政府統(tǒng)計(jì)的組織保障,統(tǒng)一部署打破條塊分割的部門統(tǒng)計(jì)壁壘,統(tǒng)一統(tǒng)計(jì)口徑、數(shù)據(jù)標(biāo)準(zhǔn)和計(jì)算方法,實(shí)現(xiàn)專利統(tǒng)計(jì)自身以及專利統(tǒng)計(jì)與外部相關(guān)統(tǒng)計(jì)的統(tǒng)計(jì)內(nèi)容互聯(lián)互通。具體而言,首先通過(guò)專利與專利權(quán)人的充分關(guān)聯(lián),實(shí)現(xiàn)專利統(tǒng)計(jì)內(nèi)容本身的互聯(lián)互通;其次借助專利和專利權(quán)人的統(tǒng)計(jì)標(biāo)志,做好專利統(tǒng)計(jì)與其他經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)的互聯(lián)互通,以保障專利數(shù)字化統(tǒng)計(jì)內(nèi)容從生產(chǎn)、交換、分配和消費(fèi)等多個(gè)環(huán)節(jié)有機(jī)嵌入社會(huì)生產(chǎn)總過(guò)程數(shù)字(生態(tài))系統(tǒng)的拓展性和開(kāi)放性,通過(guò)激活“碎片化”的靜默信息,關(guān)聯(lián)生成新的數(shù)據(jù)應(yīng)用。
圖1 專利數(shù)字化統(tǒng)計(jì)內(nèi)容的設(shè)計(jì)
第二,數(shù)字化統(tǒng)計(jì)內(nèi)容需要滿足完整性和全面性要求。傳統(tǒng)專利統(tǒng)計(jì)服務(wù)目標(biāo)相對(duì)單一,統(tǒng)計(jì)工作相對(duì)封閉,主要記錄專利在創(chuàng)造、運(yùn)用、保護(hù)以及審核過(guò)程中的非文本事實(shí),而針對(duì)與生產(chǎn)力連接最緊密的專利文本內(nèi)容卻存在統(tǒng)計(jì)缺位。數(shù)字化統(tǒng)計(jì)需要在改善專利文本內(nèi)容的清晰性和可識(shí)別性的基礎(chǔ)上,增加針對(duì)專利文本內(nèi)容的統(tǒng)計(jì),實(shí)現(xiàn)專利文本內(nèi)容的數(shù)據(jù)化,以滿足知識(shí)圖譜技術(shù)對(duì)文本內(nèi)容深度挖掘的需求;另外,數(shù)字化轉(zhuǎn)型使科技創(chuàng)新供給與需求的邊界日益模糊,以用戶需求為核心的交互創(chuàng)新是科學(xué)技術(shù)進(jìn)一步迭代升級(jí)的重要途徑[21]。而傳統(tǒng)專利統(tǒng)計(jì)基本都是從供給端對(duì)專利及相關(guān)數(shù)據(jù)進(jìn)行采集和加工,對(duì)專利需求存在統(tǒng)計(jì)缺位,無(wú)法敏銳地捕捉外部動(dòng)態(tài)需求并高效響應(yīng)。而技術(shù)需求數(shù)字化形成數(shù)據(jù)生產(chǎn)要素,正是數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新的重要模式之一。因此,專利數(shù)字化統(tǒng)計(jì)需要增加對(duì)專利創(chuàng)造、使用和保護(hù)等全生命周期過(guò)程中的需求統(tǒng)計(jì)以及用戶與專利的交互統(tǒng)計(jì),增強(qiáng)針對(duì)用戶在專利活動(dòng)中的角色和行為(創(chuàng)造和申請(qǐng)、所有權(quán)變更、閱讀和評(píng)價(jià)等)的數(shù)字化。實(shí)現(xiàn)科技創(chuàng)新需求與供給直接對(duì)接,形成對(duì)科技創(chuàng)新生態(tài)體系的數(shù)字孿生。專利數(shù)字化統(tǒng)計(jì)內(nèi)容的設(shè)計(jì)見(jiàn)圖1。
數(shù)據(jù)標(biāo)準(zhǔn)化和規(guī)范化是實(shí)現(xiàn)數(shù)據(jù)資源互聯(lián)互通的前提和基本保障。目前,中國(guó)專利數(shù)據(jù)標(biāo)準(zhǔn)主要包括《專利數(shù)據(jù)元素標(biāo)準(zhǔn)》(ZC0012)、《專利文獻(xiàn)數(shù)據(jù)規(guī)范》(ZC0014—2012),而專利數(shù)據(jù)的分類、編碼和元數(shù)據(jù)等基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)存在缺失和不足,導(dǎo)致針對(duì)同一業(yè)務(wù)的多來(lái)源數(shù)據(jù)難以形成互聯(lián)互通[32]。表2梳理了傳統(tǒng)政府專利統(tǒng)計(jì)的主要分類標(biāo)準(zhǔn),一類是針對(duì)專利的直接分類標(biāo)準(zhǔn),如國(guó)際專利分類(IPC)體系(3)其他常見(jiàn)的專利分類體系還包括美國(guó)專利分類(USPC)、歐洲專利分類(ECLA)、日本專利分類(FI/FT)和美歐聯(lián)合開(kāi)發(fā)的聯(lián)合專利分類(CPC)。等,以及通過(guò)與IPC等專利分類體系關(guān)聯(lián)映射形成的間接分類標(biāo)準(zhǔn),如專利的產(chǎn)業(yè)分類(4)國(guó)際專利分類(IPC)與國(guó)際標(biāo)準(zhǔn)產(chǎn)業(yè)分類體系(ISIC)、美國(guó)專利分類(USPC)與北美工業(yè)分類體系、國(guó)際專利分類(IPC)與中國(guó)國(guó)民經(jīng)濟(jì)行業(yè)分類體系。、技術(shù)領(lǐng)域分類和國(guó)際貿(mào)易標(biāo)準(zhǔn)分類(5)目前,專利與國(guó)際貿(mào)易標(biāo)準(zhǔn)分類對(duì)照的研究尚處于探索階段,Lybbert等(2014)嘗試建立國(guó)際專利分類(IPC)與國(guó)際標(biāo)準(zhǔn)貿(mào)易分類(SITC)的映射關(guān)系。等;另外一類則是針對(duì)專利權(quán)人進(jìn)行的分類,主要包括組織機(jī)構(gòu)分類(6)主要包括經(jīng)合組織的《弗拉斯卡蒂手冊(cè)》的機(jī)構(gòu)部分分類和歐盟統(tǒng)計(jì)局的機(jī)構(gòu)部門分類等。和空間位置劃分等。
表2 傳統(tǒng)政府專利統(tǒng)計(jì)涉及的主要統(tǒng)計(jì)分類
傳統(tǒng)政府專利統(tǒng)計(jì)的分類體系已在一定程度上起到了支撐探討國(guó)家、區(qū)域和產(chǎn)業(yè)層面的技術(shù)變革,科學(xué)評(píng)估科技創(chuàng)新政策的作用,但以專利為產(chǎn)出形式的科技創(chuàng)新實(shí)踐,其主要目的是應(yīng)用先于產(chǎn)業(yè)(或行業(yè))的技術(shù)能力,使產(chǎn)品和服務(wù)區(qū)別于同行同類的產(chǎn)品和服務(wù),在市場(chǎng)上更有競(jìng)爭(zhēng)力,可以說(shuō)專利的運(yùn)用和產(chǎn)業(yè)化實(shí)踐直接體現(xiàn)為產(chǎn)品和服務(wù)的升級(jí),但傳統(tǒng)政府專利統(tǒng)計(jì)尚缺少細(xì)化到產(chǎn)品和服務(wù)層面的統(tǒng)計(jì)分類,盡管中國(guó)制定有對(duì)社會(huì)經(jīng)濟(jì)活動(dòng)中實(shí)物產(chǎn)品和服務(wù)進(jìn)行分類和編碼的《統(tǒng)計(jì)用產(chǎn)品分類目錄》(國(guó)家統(tǒng)計(jì)局,2010),但由于中國(guó)政府統(tǒng)計(jì)多以企業(yè)的綜合價(jià)值為起點(diǎn),政府部門主導(dǎo)的專利統(tǒng)計(jì)數(shù)據(jù)系統(tǒng)中尚缺少反映業(yè)務(wù)和技術(shù)特征的產(chǎn)品服務(wù)分類依據(jù),難以解析以業(yè)務(wù)和技術(shù)特征為主體的產(chǎn)業(yè)鏈和供應(yīng)鏈信息。因此,重新設(shè)計(jì)和修訂能夠充分反映數(shù)字化轉(zhuǎn)型以及更加細(xì)分的行業(yè)分類編碼標(biāo)準(zhǔn)和超越10位碼的產(chǎn)品服務(wù)分類編碼標(biāo)準(zhǔn)是專利數(shù)字化統(tǒng)計(jì)標(biāo)準(zhǔn)最重要的基礎(chǔ)性統(tǒng)計(jì)工作。通過(guò)形成細(xì)化到產(chǎn)品和服務(wù)層面的專利統(tǒng)計(jì)分類標(biāo)準(zhǔn)和編碼,一方面可以形成專利權(quán)人(法人單位)與專利的創(chuàng)造、使用和保護(hù)等活動(dòng)(業(yè)務(wù)活動(dòng))充分地互聯(lián)互通,另一方面有助于專利用戶更敏銳地捕捉市場(chǎng)信息,使科技創(chuàng)新實(shí)踐與市場(chǎng)需求保持高效聯(lián)動(dòng),增強(qiáng)專利相關(guān)業(yè)務(wù)活動(dòng)的市場(chǎng)顯示度,提升專利數(shù)據(jù)對(duì)科技創(chuàng)新資源的市場(chǎng)化配置能力。
此外,隨著專利數(shù)據(jù)規(guī)模激增且來(lái)源不斷拓展,既有國(guó)家、區(qū)域和地方的多級(jí)專利信息服務(wù)平臺(tái),也有其他科技統(tǒng)計(jì)中涉及專利的數(shù)據(jù)采集和分析工作,其他國(guó)家和組織(7)美國(guó)專利商標(biāo)局、歐洲專利局、日本特許廳和韓國(guó)知識(shí)產(chǎn)權(quán)局等。的專利數(shù)據(jù)庫(kù)也是重要的專利數(shù)據(jù)來(lái)源。專利數(shù)據(jù)呈現(xiàn)出海量、多源、異構(gòu)的大數(shù)據(jù)特征(8)不同來(lái)源的專利數(shù)據(jù)在采集、加工、分析和應(yīng)用模式等方面存在的差異導(dǎo)致數(shù)據(jù)的異構(gòu)性。,為了便于管理以及實(shí)現(xiàn)關(guān)聯(lián)與共享,目前已經(jīng)存在多種專利元數(shù)據(jù),但現(xiàn)有專利元數(shù)據(jù)標(biāo)準(zhǔn)往往各自為陣、缺乏統(tǒng)一的規(guī)范,這在很大程度上限制了專利數(shù)據(jù)及相關(guān)資源之間以及專利數(shù)據(jù)本身的互操作和內(nèi)部深層關(guān)系的揭示。因此,探索統(tǒng)一的專利元數(shù)據(jù)規(guī)范和標(biāo)準(zhǔn),是實(shí)現(xiàn)專利數(shù)字化統(tǒng)計(jì)服務(wù)平臺(tái)不同節(jié)點(diǎn)的元數(shù)據(jù)交互,推動(dòng)專利數(shù)據(jù)服務(wù)便捷化、智能化和高效化的另一項(xiàng)基礎(chǔ)性統(tǒng)計(jì)工作。
綜上,細(xì)化統(tǒng)計(jì)分類和編碼標(biāo)準(zhǔn)、建立統(tǒng)一的元數(shù)據(jù)規(guī)范是專利數(shù)字化統(tǒng)計(jì)標(biāo)準(zhǔn)的重要內(nèi)容,按照“全面量化、開(kāi)放融合、動(dòng)態(tài)擴(kuò)展”的原則,圍繞專利及相關(guān)外部數(shù)據(jù),建立細(xì)化到專利技術(shù)知識(shí)內(nèi)容的標(biāo)準(zhǔn)化統(tǒng)計(jì)分類、編碼標(biāo)準(zhǔn)和元數(shù)據(jù)規(guī)范,銜接科技創(chuàng)新活動(dòng)的各個(gè)階段,將圍繞專利開(kāi)展的科技創(chuàng)新實(shí)踐信息化、透明化和可視化,為實(shí)現(xiàn)專利數(shù)據(jù)系統(tǒng)的全域打通、形成全面對(duì)接相應(yīng)社會(huì)經(jīng)濟(jì)互聯(lián)網(wǎng)云平臺(tái)的專利數(shù)據(jù)服務(wù)體系、提升政府基于專利數(shù)據(jù)導(dǎo)航產(chǎn)業(yè)發(fā)展和創(chuàng)新實(shí)踐的治理能力奠定基礎(chǔ)。
表3梳理了傳統(tǒng)政府專利統(tǒng)計(jì)的主要調(diào)查范圍、內(nèi)容和方式等信息,除專利統(tǒng)計(jì)年(月)報(bào)工作采用實(shí)時(shí)登記的專利文件作為數(shù)據(jù)來(lái)源,中國(guó)傳統(tǒng)政府專利統(tǒng)計(jì)均采用周期性調(diào)查,綜合運(yùn)用全面調(diào)查、抽樣調(diào)查和重點(diǎn)調(diào)查方法,采用統(tǒng)計(jì)報(bào)表、網(wǎng)絡(luò)調(diào)查平臺(tái)填報(bào)和行政記錄登記的方式獲取專利數(shù)據(jù)。其中,專利統(tǒng)計(jì)年(月)報(bào)直接以提交審核的專利文件為數(shù)據(jù)來(lái)源,為便于審查管理,專利文件具有結(jié)構(gòu)嚴(yán)謹(jǐn)、分類科學(xué)、格式規(guī)范的特點(diǎn),是傳統(tǒng)專利統(tǒng)計(jì)重要的數(shù)據(jù)來(lái)源,但隨著專利導(dǎo)航被納入國(guó)家宏觀政策及規(guī)劃的決策視野,局限于專利文件的數(shù)據(jù)采集方式已不能滿足專利數(shù)據(jù)深度挖掘的需求[6]。一方面,專利文件具有時(shí)延性,專利從受理到公開(kāi)約需要18個(gè)月,直接從專利文件中獲取信息無(wú)法滿足實(shí)時(shí)追蹤并導(dǎo)引創(chuàng)新實(shí)踐的目的;另一方面,專利文件著重對(duì)專利成果進(jìn)行披露,而忽視了專利創(chuàng)造、使用、保護(hù)等生命周期過(guò)程的信息,僅基于成果披露的專利統(tǒng)計(jì)對(duì)科技創(chuàng)新活動(dòng)的認(rèn)識(shí)不可避免地帶有片面性,專利成果數(shù)據(jù)只有與專利創(chuàng)造、使用、保護(hù)等生命周期的全過(guò)程信息以及產(chǎn)業(yè)、市場(chǎng)、法律、學(xué)術(shù)、產(chǎn)品、時(shí)間和空間等外部相關(guān)數(shù)據(jù)源有機(jī)融合,才能為產(chǎn)業(yè)發(fā)展和創(chuàng)新實(shí)踐提供更有價(jià)值的信息。全國(guó)專利調(diào)查以擁有有效專利的專利權(quán)人為調(diào)查對(duì)象,調(diào)查內(nèi)容涵蓋專利創(chuàng)造、運(yùn)用、保護(hù)、管理和服務(wù)等專利生命周期的全過(guò)程信息,為政府決策和政策研究提供了有效的數(shù)據(jù)服務(wù),但專利調(diào)查以專利權(quán)人(企業(yè)、高校、科研機(jī)構(gòu)和個(gè)人)為調(diào)查單元,數(shù)據(jù)粒度過(guò)粗,而且采用以年間隔的周期性調(diào)查,調(diào)查頻度偏低,無(wú)法滿足數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新模式對(duì)數(shù)據(jù)規(guī)模和復(fù)雜度的要求。
表3 傳統(tǒng)政府專利統(tǒng)計(jì)調(diào)查的內(nèi)容
圖2 專利數(shù)字化統(tǒng)計(jì)調(diào)查的設(shè)計(jì)
數(shù)字化轉(zhuǎn)型背景下,創(chuàng)新形式已經(jīng)由串行向并行發(fā)展,創(chuàng)新過(guò)程由個(gè)體向協(xié)同演變,上述衍生于政府管理職能的傳統(tǒng)專利統(tǒng)計(jì)調(diào)查,其內(nèi)容、頻率和數(shù)據(jù)顆粒度均難以滿足專利技術(shù)創(chuàng)新活動(dòng)數(shù)字化和價(jià)值共創(chuàng)的要求,全量信息采集應(yīng)該是數(shù)字化統(tǒng)計(jì)調(diào)查最突出的特點(diǎn),具體表現(xiàn)為:采用標(biāo)準(zhǔn)化、規(guī)范化的抽取模式,實(shí)現(xiàn)“一點(diǎn)采集,多點(diǎn)共享”;采集范圍拓寬,從來(lái)源單一的專利文獻(xiàn)數(shù)據(jù)發(fā)展為種類繁雜、領(lǐng)域豐富的專利大數(shù)據(jù),除了專利文獻(xiàn)中直接獲取的數(shù)據(jù),還包括與行政記錄、監(jiān)管數(shù)據(jù)等外部相關(guān)數(shù)據(jù)的對(duì)接;采集顆粒度縮小,從滿足專利審查要求的分類粒度細(xì)化為滿足提取專利技術(shù)知識(shí)內(nèi)容的要求;采集頻率提高,通過(guò)數(shù)據(jù)采集引擎驅(qū)動(dòng)實(shí)時(shí)數(shù)據(jù)采集、定時(shí)任務(wù)采集、API接口數(shù)據(jù)推送等多種數(shù)據(jù)采集操作以滿足對(duì)專利數(shù)據(jù)實(shí)時(shí)性和定制性的需求;采集維度拓展,從對(duì)客觀存在事物進(jìn)行的測(cè)量的封閉硬數(shù)據(jù)拓展為反映主觀態(tài)度評(píng)價(jià)的開(kāi)放軟數(shù)據(jù),不同主題下的文本、圖像等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的量化逐漸成為重要內(nèi)容,網(wǎng)絡(luò)化的統(tǒng)計(jì)數(shù)據(jù)資源成為重要的生產(chǎn)要素,充分實(shí)現(xiàn)專利在產(chǎn)生、運(yùn)營(yíng)、轉(zhuǎn)化和應(yīng)用過(guò)程中所涉及的“物物”“物人”和“人人”信息在網(wǎng)絡(luò)層面上的橫向互聯(lián)。
數(shù)字化統(tǒng)計(jì)管理需要解決數(shù)據(jù)的存儲(chǔ)、整理和共享三個(gè)問(wèn)題:改變面向應(yīng)用的數(shù)據(jù)存儲(chǔ)方式,實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)和使用有效分離;給出多模態(tài)數(shù)據(jù)的整理方案,支撐專利數(shù)據(jù)共享;給出安全的數(shù)據(jù)共享方案,為專利數(shù)據(jù)的極大化應(yīng)用創(chuàng)造可能。
首先是數(shù)據(jù)存儲(chǔ)問(wèn)題。傳統(tǒng)政府專利統(tǒng)計(jì)多采用數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù),即根據(jù)固定的分析目的對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換、加載和存儲(chǔ)。面對(duì)專利數(shù)字化統(tǒng)計(jì)海量、高頻和多模態(tài)數(shù)據(jù),數(shù)據(jù)庫(kù)存儲(chǔ)模式的低靈活性無(wú)法應(yīng)對(duì)數(shù)據(jù)實(shí)時(shí)更新、數(shù)據(jù)網(wǎng)絡(luò)節(jié)點(diǎn)全域互聯(lián)互通以及數(shù)據(jù)供給與應(yīng)用場(chǎng)景實(shí)時(shí)對(duì)接的要求,尤其當(dāng)數(shù)據(jù)無(wú)法及時(shí)被使用,就產(chǎn)生了“數(shù)據(jù)孤島”,造成數(shù)據(jù)資源的價(jià)值損失。以數(shù)據(jù)原始形態(tài)進(jìn)行分布式存儲(chǔ)的數(shù)據(jù)湖架構(gòu)應(yīng)需而生,一方面,數(shù)據(jù)湖通過(guò)延遲面向應(yīng)用的數(shù)據(jù)清洗和規(guī)范化處理,實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)和使用的有效分離,存儲(chǔ)架構(gòu)擁有更高的靈活性和敏捷性,為專利數(shù)字化統(tǒng)計(jì)針對(duì)個(gè)性化和智能化需求的有效開(kāi)發(fā)提供可能;另一方面,數(shù)據(jù)湖存儲(chǔ)架構(gòu)可以為專利數(shù)字化統(tǒng)計(jì)接入不同數(shù)據(jù)源,包括傳統(tǒng)專利數(shù)據(jù)庫(kù)中的表、各種格式的文件、數(shù)據(jù)流和應(yīng)用API獲取的數(shù)據(jù),并根據(jù)統(tǒng)一的專利元數(shù)據(jù)標(biāo)準(zhǔn)自動(dòng)生成元數(shù)據(jù)信息,以確保應(yīng)用元數(shù)據(jù)對(duì)專利數(shù)字化統(tǒng)計(jì)數(shù)據(jù)進(jìn)行高效治理。
圖3 專利數(shù)字化統(tǒng)計(jì)管理的設(shè)計(jì)
其次是數(shù)據(jù)整理問(wèn)題。整理是從數(shù)據(jù)上升到理論認(rèn)知的關(guān)鍵階段,傳統(tǒng)政府專利統(tǒng)計(jì)的整理工作是根據(jù)事先確定的研究目的和任務(wù),對(duì)全面調(diào)查的數(shù)據(jù)直接審核、匯總、加工處理和對(duì)抽樣調(diào)查的數(shù)據(jù)放大推算,為專利統(tǒng)計(jì)分析提供準(zhǔn)確系統(tǒng)綜合資料的過(guò)程。一方面,專利數(shù)字化統(tǒng)計(jì)數(shù)據(jù)具有多源、異構(gòu)、海量、高頻和可變性強(qiáng)的大數(shù)據(jù)特征,統(tǒng)計(jì)整理的對(duì)象由有限量、靜態(tài)和結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)楹A?、高頻和多模態(tài)數(shù)據(jù),數(shù)字化統(tǒng)計(jì)整理需要依賴各種算法來(lái)實(shí)現(xiàn)數(shù)據(jù)源質(zhì)量評(píng)估、數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換、數(shù)據(jù)清洗和異常值檢測(cè)等處理過(guò)程。另一方面,專利數(shù)字化統(tǒng)計(jì)的非結(jié)構(gòu)化數(shù)據(jù)具有更高的規(guī)模占比和信息含量,數(shù)字化統(tǒng)計(jì)整理將更側(cè)重非結(jié)構(gòu)化數(shù)據(jù)的數(shù)字化:針對(duì)文本等非結(jié)構(gòu)化數(shù)據(jù)既可以采用不同的編碼形式進(jìn)行數(shù)字化,也可以運(yùn)用監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等技術(shù)進(jìn)行分類和打標(biāo)以實(shí)現(xiàn)數(shù)字化;針對(duì)圖像、聲音、視頻等模擬信號(hào)可以通過(guò)轉(zhuǎn)換成二進(jìn)制形式實(shí)現(xiàn)數(shù)字化。多模態(tài)數(shù)據(jù)的數(shù)字化推動(dòng)專利統(tǒng)計(jì)數(shù)據(jù)網(wǎng)絡(luò)的節(jié)點(diǎn)端和信息流的全面量化,進(jìn)行數(shù)據(jù)的合理切割使其以保障提取專利技術(shù)知識(shí)內(nèi)容要求的最小顆粒度存在,并通過(guò)賦予所有數(shù)據(jù)元素唯一的標(biāo)識(shí)符和統(tǒng)一的元數(shù)據(jù)描述,對(duì)元數(shù)據(jù)進(jìn)行標(biāo)簽和分類,建立統(tǒng)一的數(shù)據(jù)目錄,建立數(shù)據(jù)血緣,梳理上下游的脈絡(luò)關(guān)系,跟蹤數(shù)據(jù)時(shí)間旅行,提供不同版本的數(shù)據(jù),便于進(jìn)行數(shù)據(jù)回溯,為后續(xù)基于專利數(shù)字化統(tǒng)計(jì)的便捷化、智能化和高效化統(tǒng)計(jì)分析創(chuàng)造可能。
最后是數(shù)據(jù)共享問(wèn)題。憑借獨(dú)占性保障專利權(quán)人競(jìng)爭(zhēng)優(yōu)勢(shì)的傳統(tǒng)專利使用模式會(huì)阻礙社會(huì)整體的創(chuàng)新實(shí)踐,推動(dòng)專利數(shù)據(jù)共享是數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新模式的重要特征,而專利數(shù)字化統(tǒng)計(jì)往往又面臨邊界模糊、安全監(jiān)控管理缺乏、端點(diǎn)增多供給面增大、安全態(tài)勢(shì)可視化不足等諸多安全性挑戰(zhàn)。因此,數(shù)據(jù)安全性和易訪問(wèn)性是專利數(shù)字化統(tǒng)計(jì)數(shù)據(jù)共享過(guò)程中首先要解決的問(wèn)題,也是集中式的傳統(tǒng)統(tǒng)計(jì)管理方式難以突破的困境,專利數(shù)字化統(tǒng)計(jì)管理工作需要引入?yún)^(qū)塊鏈技術(shù)支持專利數(shù)據(jù)的安全共享,經(jīng)區(qū)塊鏈驗(yàn)證的加密ID可以確保專利權(quán)的安全歸屬和軌跡追蹤,形成更安全、更可靠的專利技術(shù)知識(shí)內(nèi)容的傳播路徑,推升社會(huì)整體創(chuàng)新水平。
圖4 專利數(shù)字化統(tǒng)計(jì)分析流程和工具箱
數(shù)據(jù)是催生統(tǒng)計(jì)方法的土壤,傳統(tǒng)專利統(tǒng)計(jì)分析的數(shù)據(jù)容量有限、采集不連續(xù),且多為結(jié)構(gòu)化數(shù)據(jù),即便是專利文本,也是面向?qū)徍艘?格式和結(jié)構(gòu)都相對(duì)固定的文本文件。專利數(shù)字化統(tǒng)計(jì)生產(chǎn)和流轉(zhuǎn)的數(shù)據(jù),具有海量、高頻、多模態(tài)等大數(shù)據(jù)特征,既包括專利申請(qǐng)量、授權(quán)量、交易額、技術(shù)領(lǐng)域和法律狀態(tài)等結(jié)構(gòu)化數(shù)據(jù),也包括專利文本、專利檢索和查詢?nèi)罩?、專利關(guān)聯(lián)以及專利用戶評(píng)價(jià)等非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)的量級(jí)往往是結(jié)構(gòu)化數(shù)據(jù)的幾十倍甚至上百倍,且分辨率精細(xì)、信息含量高,具有關(guān)系屬性和靈活性,具有可擴(kuò)展性和可伸縮性,專利數(shù)字化統(tǒng)計(jì)的數(shù)據(jù)特征倒逼數(shù)字化統(tǒng)計(jì)分析方法和技術(shù)不斷創(chuàng)新和轉(zhuǎn)變。首先,專利數(shù)字化統(tǒng)計(jì)分析技術(shù)需要從主要面向結(jié)構(gòu)化數(shù)據(jù)的方法和技術(shù)轉(zhuǎn)變?yōu)槊嫦蚨嗄B(tài)數(shù)據(jù)的統(tǒng)計(jì)方法和技術(shù);其次,專利數(shù)字化統(tǒng)計(jì)分析技術(shù)需要從面向固定目標(biāo)和服務(wù)對(duì)象的常態(tài)化分析轉(zhuǎn)變?yōu)槊嫦騻€(gè)性化和多向度需求的協(xié)同分析;最后,專利數(shù)字化統(tǒng)計(jì)分析需要由分散式模塊的統(tǒng)計(jì)分析轉(zhuǎn)變?yōu)橹悄芑K的統(tǒng)計(jì)分析。圖4呈現(xiàn)了專利數(shù)字化統(tǒng)計(jì)分析流程和工具箱。
針對(duì)專利元數(shù)據(jù)和數(shù)據(jù)表等結(jié)構(gòu)化數(shù)據(jù),可以采用基于文獻(xiàn)計(jì)量學(xué)和統(tǒng)計(jì)學(xué)的方法和技術(shù)。目前這些方法和技術(shù)已成為包括國(guó)家知識(shí)產(chǎn)權(quán)局在內(nèi)的各級(jí)政府專利服務(wù)平臺(tái)和各類市場(chǎng)化專利服務(wù)平臺(tái)(中國(guó)科學(xué)院專利在線分析系統(tǒng)、專利搜索引擎(SooPAT)、incoPat全球?qū)@麛?shù)據(jù)庫(kù)和合享匯智(IncoShare)等)的標(biāo)準(zhǔn)配置;除了具備標(biāo)準(zhǔn)數(shù)據(jù)格式的結(jié)構(gòu)化數(shù)據(jù),專利數(shù)據(jù)通常是以專利文本的原始形態(tài)呈現(xiàn),且占比更高、信息含量更大。因此,目前也有相當(dāng)數(shù)量的專利分析技術(shù)把重點(diǎn)聚焦到文本挖掘方面,針對(duì)非結(jié)構(gòu)化的專利文本直接進(jìn)行信息提取;與此同時(shí),互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)技術(shù)將計(jì)算嵌入專利數(shù)字化統(tǒng)計(jì)數(shù)據(jù)網(wǎng)絡(luò)的各種聯(lián)網(wǎng)對(duì)象,產(chǎn)生大量動(dòng)態(tài)的、索引性的、相互關(guān)聯(lián)的專利數(shù)據(jù)流和數(shù)據(jù)鏈,可以反映專利創(chuàng)新實(shí)踐的多種聯(lián)系,如專利引用、專利關(guān)鍵詞共現(xiàn)、專利權(quán)人合作以及專利技術(shù)關(guān)聯(lián)等,復(fù)雜網(wǎng)絡(luò)分析技術(shù)通過(guò)構(gòu)建測(cè)度專利關(guān)系的復(fù)雜網(wǎng)絡(luò),對(duì)各種復(fù)雜關(guān)聯(lián)進(jìn)行分析與解構(gòu),將成為專利數(shù)字化統(tǒng)計(jì)重要的分析技術(shù);此外,專利創(chuàng)造、使用和保護(hù)的生命周期過(guò)程中不同類型的用戶與專利的交互行為(發(fā)明人與專利、專利權(quán)人與專利、使用者與專利、讀者與專利以及評(píng)價(jià)者與專利等),可以被客觀記錄并抽象為數(shù)據(jù),當(dāng)這些交互行為持續(xù)進(jìn)行并被連續(xù)記錄時(shí)將產(chǎn)生大量有價(jià)值的信息。智能體交互分析技術(shù)可以充分提取和識(shí)別大量交互行為中涌現(xiàn)的共性特征以及連接或群體規(guī)律,是提供個(gè)性化、智能化專利信息服務(wù)的另一類重要分析技術(shù)。
綜上,專利數(shù)字化統(tǒng)計(jì)分析一方面需要進(jìn)一步強(qiáng)化和發(fā)展目前比較成熟的文獻(xiàn)計(jì)量學(xué)、統(tǒng)計(jì)學(xué)和文本挖掘技術(shù)和方法,另一方面需要進(jìn)一步推進(jìn)復(fù)雜網(wǎng)絡(luò)和智能體交互分析等方法和技術(shù)在專利數(shù)據(jù)挖掘中的廣泛應(yīng)用。
數(shù)字化轉(zhuǎn)型通過(guò)推動(dòng)科學(xué)技術(shù)的融合發(fā)展和網(wǎng)絡(luò)化的協(xié)同研發(fā),加速將科學(xué)研究成果轉(zhuǎn)化為創(chuàng)新和社會(huì)經(jīng)濟(jì)效益,已經(jīng)成為科技創(chuàng)新活動(dòng)最顯著的特征之一。數(shù)字化改變科學(xué)研究過(guò)程的同時(shí),也為新統(tǒng)計(jì)發(fā)展提出了更高要求,專利數(shù)字化統(tǒng)計(jì)實(shí)時(shí)、共享和融合的特征契合了科技創(chuàng)新活動(dòng)數(shù)字化轉(zhuǎn)型對(duì)新統(tǒng)計(jì)發(fā)展的要求。首先,專利數(shù)字化統(tǒng)計(jì)擁有海量高頻的超大數(shù)據(jù)容量,可以滿足各類型科技創(chuàng)新主體的專利信息使用需求,促進(jìn)科技成果轉(zhuǎn)移轉(zhuǎn)化和科學(xué)技術(shù)進(jìn)步,更重要的是專利數(shù)字化統(tǒng)計(jì)內(nèi)容融合了專利與非專利數(shù)據(jù)、技術(shù)與非技術(shù)信息,在維度上從單一結(jié)構(gòu)化數(shù)據(jù)拓展為多模態(tài)高頻數(shù)據(jù),數(shù)字化統(tǒng)計(jì)分析技術(shù)面向包括數(shù)據(jù)流和特征流的多模態(tài)海量專利數(shù)據(jù),挖掘數(shù)據(jù)對(duì)象之間復(fù)雜且演化的關(guān)聯(lián),加速實(shí)現(xiàn)碎片化知識(shí)有效融合,衍生新的科技創(chuàng)新動(dòng)機(jī),提升社會(huì)整體的創(chuàng)新效率;其次,專利數(shù)字化統(tǒng)計(jì)提供更安全的專利信息共享模式和技術(shù)保障,構(gòu)建以專利為媒介的科技創(chuàng)新生態(tài)鏈,推動(dòng)科技創(chuàng)新范式向開(kāi)放科學(xué)轉(zhuǎn)變,降低社會(huì)整體科技研發(fā)和知識(shí)發(fā)現(xiàn)成本;最后,專利數(shù)字化統(tǒng)計(jì)是統(tǒng)計(jì)數(shù)字化轉(zhuǎn)型的重要表現(xiàn),科技創(chuàng)新活動(dòng)以數(shù)字形式進(jìn)行表達(dá),各種數(shù)字化設(shè)備以“數(shù)”為基礎(chǔ),以更便捷的方式推動(dòng)科學(xué)技術(shù)的融合發(fā)展和網(wǎng)絡(luò)化的協(xié)同研發(fā),從制定工作規(guī)劃到開(kāi)展實(shí)驗(yàn)活動(dòng),從知識(shí)共享到與公眾交互,推動(dòng)科技創(chuàng)新活動(dòng)全流程、各環(huán)節(jié)的數(shù)字化轉(zhuǎn)型。
互聯(lián)網(wǎng)時(shí)代企業(yè)科技創(chuàng)新越來(lái)越依賴于數(shù)據(jù)。專利數(shù)據(jù)中包含了大量獨(dú)有的技術(shù)資料與信息,是對(duì)企業(yè)科技創(chuàng)新活動(dòng)非常有價(jià)值的信息資源,專利的生產(chǎn)和運(yùn)營(yíng)貫穿企業(yè)整個(gè)創(chuàng)新實(shí)踐過(guò)程,是企業(yè)科技創(chuàng)新的另一條生命線[33]。專利數(shù)字化統(tǒng)計(jì)是企業(yè)專利創(chuàng)造、使用和保護(hù)等全生命周期的數(shù)字孿生,在導(dǎo)引企業(yè)創(chuàng)新實(shí)踐方面發(fā)揮著重要作用。首先,專利數(shù)字化統(tǒng)計(jì)實(shí)現(xiàn)了技術(shù)與市場(chǎng)、價(jià)值等非技術(shù)信息并重,有效克服了傳統(tǒng)專利服務(wù)中創(chuàng)造環(huán)節(jié)外活力不足和效能短板的問(wèn)題[34]。實(shí)現(xiàn)動(dòng)態(tài)協(xié)同創(chuàng)新機(jī)制,打破專利信息孤島,企業(yè)利用專利數(shù)字化統(tǒng)計(jì)數(shù)據(jù)可以更敏銳地探索產(chǎn)品和服務(wù)發(fā)展的方向,洞悉市場(chǎng)趨勢(shì)、了解競(jìng)爭(zhēng)對(duì)手的行為、優(yōu)化開(kāi)發(fā)生產(chǎn)和分銷流程,并針對(duì)特定或不斷變化的需求量身定制產(chǎn)品和服務(wù);其次,專利數(shù)字化統(tǒng)計(jì)分析通過(guò)智能調(diào)度和分配系統(tǒng),保障專利統(tǒng)計(jì)服務(wù)的敏感性、動(dòng)態(tài)性和協(xié)同性,面向更復(fù)雜的應(yīng)用場(chǎng)景搭建企業(yè)級(jí)知識(shí)圖譜,對(duì)企業(yè)的屬性、工商、專利、市場(chǎng)等多渠道數(shù)據(jù)進(jìn)行抽取和融合,調(diào)取分析模塊、進(jìn)行算法選擇、模型訓(xùn)練等,實(shí)現(xiàn)面向應(yīng)用場(chǎng)景的業(yè)務(wù)系統(tǒng)二次開(kāi)發(fā),保障企業(yè)創(chuàng)新實(shí)踐的質(zhì)量和時(shí)效性;再次,專利數(shù)字化統(tǒng)計(jì)實(shí)現(xiàn)了由單一環(huán)節(jié)服務(wù)向全過(guò)程服務(wù)轉(zhuǎn)變,從驅(qū)動(dòng)企業(yè)創(chuàng)新實(shí)踐、提高企業(yè)創(chuàng)新應(yīng)用的質(zhì)量,到保護(hù)企業(yè)創(chuàng)新成果,每個(gè)科技創(chuàng)新的節(jié)點(diǎn)都離不開(kāi)專利數(shù)字化統(tǒng)計(jì)的有力支撐。
技術(shù)市場(chǎng)是國(guó)家創(chuàng)新體系的重要組成部分[35]。完善專利交易市場(chǎng)是建設(shè)統(tǒng)一開(kāi)放的技術(shù)市場(chǎng)和加快全國(guó)技術(shù)交易平臺(tái)建設(shè)的重要內(nèi)容。傳統(tǒng)集市化專利交易模式存在諸如交易雙方信息不對(duì)稱、交易信息搜尋成本高效率低、交易專利價(jià)值難以評(píng)估以及線上線下對(duì)接機(jī)制不完善的問(wèn)題。而專利數(shù)字化統(tǒng)計(jì)通過(guò)集成同一專利相關(guān)信息的數(shù)據(jù)系統(tǒng),推動(dòng)實(shí)現(xiàn)專利交易主體與相關(guān)市場(chǎng)主體的互聯(lián)互通,為構(gòu)建專利市場(chǎng)化交易網(wǎng)絡(luò)平臺(tái)提供數(shù)據(jù)系統(tǒng)支撐和技術(shù)便利,從客觀上減少專利交易環(huán)節(jié),降低交易信息的搜尋成本,克服傳統(tǒng)專利交易的成本和效率難題。此外,依托專利數(shù)字化統(tǒng)計(jì)的實(shí)時(shí)采集、分布式存儲(chǔ)和云計(jì)算功能,可以形成針對(duì)專利交易主體資質(zhì)、專利交易客體法律狀態(tài)和專利質(zhì)量的動(dòng)態(tài)監(jiān)管系統(tǒng),運(yùn)用人工智能深度運(yùn)算功能對(duì)交易專利進(jìn)行實(shí)時(shí)智能化質(zhì)量分析,建立專利的質(zhì)量認(rèn)證和市場(chǎng)準(zhǔn)入機(jī)制,從而形成對(duì)專利交易市場(chǎng)以及專利自身全生命周期的有效監(jiān)管。因此,專利數(shù)字化統(tǒng)計(jì)可以加速推動(dòng)中國(guó)專利交易模式從傳統(tǒng)的集市化交易模式向基于互聯(lián)網(wǎng)的在線交易模式轉(zhuǎn)變。
數(shù)字經(jīng)濟(jì)時(shí)代,社會(huì)各領(lǐng)域的數(shù)字化轉(zhuǎn)型已經(jīng)成為顯著的時(shí)代特征和必然的發(fā)展趨勢(shì)。如何應(yīng)對(duì)數(shù)字化轉(zhuǎn)型對(duì)統(tǒng)計(jì)工作帶來(lái)的機(jī)遇和挑戰(zhàn),更大效力地發(fā)揮統(tǒng)計(jì)在客觀測(cè)度和科學(xué)認(rèn)知世界過(guò)程中的作用,是統(tǒng)計(jì)現(xiàn)代化改革需要關(guān)注的現(xiàn)實(shí)問(wèn)題。本文聚焦專利數(shù)字化統(tǒng)計(jì)設(shè)計(jì)和服務(wù)應(yīng)用對(duì)上述問(wèn)題進(jìn)行探索和求解,針對(duì)上述內(nèi)容可作以下三點(diǎn)總結(jié):
第一,統(tǒng)計(jì)現(xiàn)代化改革需要重視數(shù)字化統(tǒng)計(jì)的深度開(kāi)發(fā)。以專利技術(shù)創(chuàng)新實(shí)踐的數(shù)字化轉(zhuǎn)型為例,互聯(lián)網(wǎng)云平臺(tái)是以專利為產(chǎn)出形式的科技創(chuàng)新實(shí)踐數(shù)字化轉(zhuǎn)型的重要載體,推動(dòng)全社會(huì)科技資源高效高質(zhì)的供給釋放。數(shù)據(jù)化是專利互聯(lián)網(wǎng)云平臺(tái)最主要的運(yùn)行機(jī)制,直接關(guān)系到互聯(lián)網(wǎng)云平臺(tái)的性能、安全性、穩(wěn)健性和拓展性,作為數(shù)據(jù)的重要解析工具,數(shù)字化統(tǒng)計(jì)是互聯(lián)網(wǎng)云平臺(tái)順暢運(yùn)行的統(tǒng)計(jì)服務(wù)保障體系,也是推動(dòng)科學(xué)技術(shù)領(lǐng)域數(shù)字化轉(zhuǎn)型升級(jí)的基礎(chǔ)性統(tǒng)計(jì)工作,自然應(yīng)該是統(tǒng)計(jì)現(xiàn)代化改革的重要方向之一。
第二,以數(shù)字化統(tǒng)計(jì)為方向的統(tǒng)計(jì)現(xiàn)代化改革已具備扎實(shí)的技術(shù)底座。人工智能、大數(shù)據(jù)和云計(jì)算等新一代信息技術(shù)驅(qū)動(dòng)的新一輪科技革命不斷重構(gòu)統(tǒng)計(jì)數(shù)據(jù)生產(chǎn)、采集、加工、分析和應(yīng)用的模式,不斷催生時(shí)間、空間、維度、主題、過(guò)程及網(wǎng)絡(luò)關(guān)系一體化社會(huì)活動(dòng)復(fù)雜生態(tài)系統(tǒng)的統(tǒng)計(jì)理論方法的新變革。與此同時(shí),也為傳統(tǒng)(專利)統(tǒng)計(jì)工作的數(shù)字化轉(zhuǎn)型提供了高經(jīng)濟(jì)性、高可用性、高可靠性的技術(shù)底座,構(gòu)建起一個(gè)數(shù)據(jù)驅(qū)動(dòng)的平臺(tái)化、生態(tài)化的基礎(chǔ)設(shè)施群[27]。
第三,數(shù)字化統(tǒng)計(jì)是對(duì)傳統(tǒng)統(tǒng)計(jì)工作的優(yōu)化和補(bǔ)充。以專利技術(shù)創(chuàng)新實(shí)踐的數(shù)字化轉(zhuǎn)型為例,數(shù)字技術(shù)和數(shù)據(jù)生產(chǎn)要素的加速融入,顯著提升了專利創(chuàng)造和運(yùn)用過(guò)程中主體和要素交互作用的復(fù)雜性,同時(shí)也加劇了專利使用與產(chǎn)業(yè)化實(shí)踐融合路徑及可能結(jié)果的不確定性。傳統(tǒng)專利統(tǒng)計(jì)所提供的統(tǒng)計(jì)內(nèi)容和服務(wù)無(wú)法滿足充分解析和有效支撐數(shù)字創(chuàng)新生態(tài)系統(tǒng)生成和運(yùn)行的要求。專利數(shù)字化統(tǒng)計(jì)作為保障數(shù)字化轉(zhuǎn)型與應(yīng)用的科學(xué)理論和方法,是從統(tǒng)計(jì)內(nèi)容、統(tǒng)計(jì)標(biāo)準(zhǔn)、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)管理到統(tǒng)計(jì)分析5個(gè)方面對(duì)傳統(tǒng)專利統(tǒng)計(jì)工作的優(yōu)化和補(bǔ)充。