王雅 杜濤 賈鑫
摘要:大數(shù)據(jù)技術作為人工智能的核心要素,受到各領域越來越多專家學者的重點關注。利用Baiten專利檢索數(shù)據(jù)庫和INNOJOY專利搜索引擎針對國內及國際大數(shù)據(jù)技術專利進行信息檢索,通過對中國及世界主要國家的專利數(shù)據(jù)進行統(tǒng)計,分析大數(shù)據(jù)技術領域的專利研究現(xiàn)狀,預測大數(shù)據(jù)技術未來專利競爭態(tài)勢,就中國企業(yè)大數(shù)據(jù)發(fā)展戰(zhàn)略提出應對策略。
關鍵詞:大數(shù)據(jù),信息檢索,專利分析
中圖分類號:G350?文獻標志碼:A?文章編號:2095-5383(2020)01-0069-04
Abstract:Big data technology as a key factor of artificial intelligence is becoming increasingly focused by the experts and scholars in different fields.?Using the Chinese patent database of BaiTen web and the world patent search engine of INNOJOY,the patent competition situation of big data technology in China and some other countries in the world was discussed in this paper,and the patent-related statistics in the field of big data technology was analyzed,and the conclusions about the big data technology status and its future development were drawn,and finally the countermeasures on the development strategy of big data technology for Chinese enterpriseswere given.
Keywords:big data,information retrieval,patent analysis
大數(shù)據(jù)是指利用常規(guī)軟件工具無法在一定時間跨度內進行捕獲、管理以及處理的數(shù)據(jù)集合,是需要新的處理模式以獲得更強的決策力、洞察力及流程優(yōu)化能力的海量、多樣化和高增長率的信息資產[1]。
Viktor Meyer-Schnberg在其著作《Big data:A revolution that will transform how we live,work,and think》[2]中指出,與采用隨機分析法只針對抽樣數(shù)據(jù)不同,大數(shù)據(jù)是對全量數(shù)據(jù)進行的分析處理。IBM公司歸納出大數(shù)據(jù)所具有的5V特點,分別是Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)和Veracity(真實性)。
早在2008年《Nature》就推出了“Big Data”專刊[3]。2011年2月《Science》推出了“Dealing With Data”??痆4],由此說明學術界率先展開對大數(shù)據(jù)技術的科學研究。2011年6月,McKinsey公司發(fā)布了 《Big data:The next frontier for innovation,competition,and productivity》報告[5],針對大數(shù)據(jù)的關鍵技術、應用領域及潛在影響等方面進行了詳盡分析。自2012年以來,社會各界對大數(shù)據(jù)的關注與日俱增。
目前,大數(shù)據(jù)技術已經得到各領域越來越多專家學者的重視。孟小峰等[6]剖析了大數(shù)據(jù)的演變歷程,闡釋了大數(shù)據(jù)技術的基本框架,并對大數(shù)據(jù)在集成、分析、軟硬件協(xié)同、易用性、測試基準等方面提出見解。程學旗等 [7]闡述了國內外大數(shù)據(jù)政策動態(tài)及中國大數(shù)據(jù)產業(yè)界發(fā)展態(tài)勢,并提出了多學科融合、大數(shù)據(jù)可視化、深度分析等發(fā)展趨勢。此外,劉煒、陶雪嬌、劉智慧、韓晶等[8-11]也分別就大數(shù)據(jù)關鍵技術的研究提出思考。以上科學研究主要從大數(shù)據(jù)技術綜述角度出發(fā),而從專利視角進行探討的文章較少。本文主要從情報分析的角度,研究大數(shù)據(jù)相關專利的進展情況,預測大數(shù)據(jù)技術的專利競爭態(tài)勢,并就中國企業(yè)大數(shù)據(jù)發(fā)展戰(zhàn)略提出應對策略。
1?數(shù)據(jù)來源
相關研究[12-15]表明,專利數(shù)據(jù)是進行產業(yè)技術競爭態(tài)勢研究的有效信息來源,專利分析為企業(yè)技術研發(fā)、發(fā)展戰(zhàn)略研究以及科學決策提供強有力的支撐。
本文使用Baiten專利檢索數(shù)據(jù)庫對國內大數(shù)據(jù)技術相關專利進行檢索,檢索式為ti:(大數(shù)據(jù) or Hadoop or MapReduce) AND ab:(大數(shù)據(jù) or Hadoop or MapReduce) AND (ad:[20020101 TO 20181118]),使用INNOJOY專利搜索引擎對國際大數(shù)據(jù)技術相關專利進行檢索,輸入智能關鍵詞“big data”。
2?國內競爭態(tài)勢分析
2.1?年度專利申請量分析
年度專利申請量分布數(shù)據(jù)可以反映出大數(shù)據(jù)技術從萌芽、發(fā)展到成熟及衰落的發(fā)展歷程與演變態(tài)勢。檢索結果顯示,截至2018年11月18日,國內有關大數(shù)據(jù)技術的專利共計6 783件,其中發(fā)明專利6 037件(公開專利5 286件,授權專利751件),實用新型707件,外觀設計39件??梢妵鴥扔嘘P大數(shù)據(jù)技術的發(fā)明專利數(shù)量約占專利總數(shù)量的89%。該分布數(shù)據(jù)充分表明,目前大數(shù)據(jù)技術同時具備新穎性、創(chuàng)造性和實用性的特點,為推動科學發(fā)展及科技進步起著至關重要的作用。
同時,專利申請量分布側面反映了專利技術的發(fā)展歷程,從其申請量變化數(shù)據(jù)中可以了解各階段技術創(chuàng)新情況,國內大數(shù)據(jù)技術專利數(shù)量分布數(shù)據(jù),如圖1所示。
可以看出,國內大數(shù)據(jù)技術的發(fā)展歷程可以大致分為3個階段。第1階段為2002—2004年,首件大數(shù)據(jù)技術專利于2002年出現(xiàn),其后2年沒有專利出現(xiàn),該階段屬于大數(shù)據(jù)技術的萌芽期,第2階段為2005—2011年,年度專利申請量不超過25件,專利申請量呈現(xiàn)出緩慢增長的趨勢,該階段屬于大數(shù)據(jù)技術的初步發(fā)展期,第3階段為2012年至今,專利申請量呈現(xiàn)出急劇增長的趨勢,前景可觀,該階段屬于大數(shù)據(jù)技術的蓬勃發(fā)展期。此外注意到,2013年的年增長率為161%,2014年的年增長率為113%,2015年的年增長率為108%,2016年的年增長率為93%,2017年的年增長率為43%。不難看出隨著專利數(shù)量逐年增大,年增長率也隨之逐年放緩,表明大數(shù)據(jù)關鍵技術進行穩(wěn)定發(fā)展期,其創(chuàng)新性有待突破。
2.2?重要技術專家分析
參與專利申請的發(fā)明人在一定程度上代表了該領域技術創(chuàng)新的重要專家,其參與的專利申請量的多寡能夠反映出其科研能力水平,因此該專利分析數(shù)據(jù)可為技術人才的引進提供指導與參考。
根據(jù)國內大數(shù)據(jù)技術發(fā)明人專利量檢索結果,如圖2所示。
除去99件不公告發(fā)明人作為發(fā)明人參與的專利申請,王振宇、石楊、張鵬分列國內大數(shù)據(jù)技術專利發(fā)明人的前3名,圖2中的發(fā)明人均可視為國內大數(shù)據(jù)技術領域專家,在學術交流及引進技術人才時應當予以優(yōu)先考慮。
2.3?重要申請人分析
通過了解專利申請人的專利申請量,可以掌握當前技術創(chuàng)新的核心領軍人物及所屬機構,判斷該領域的技術競爭現(xiàn)狀并發(fā)現(xiàn)潛在競爭對手,對于領域內的領軍機構可重點關注其研發(fā)動態(tài)。根據(jù)國內大數(shù)據(jù)專利申請人專利量相關數(shù)據(jù),得到其分布情況如圖3所示。
其中國家電網公司申請專利數(shù)量最為突出,申請專利數(shù)量總計210件,浪潮集團有限公司與華南理工大學分列第2、3位。根據(jù)檢索數(shù)據(jù)可知,專利申請量排名前10的申請人中,5個為企業(yè),4個為高校,1個為研究院,可見大數(shù)據(jù)技術已得到了產業(yè)界、學術界的高度重視與關注。究其原因,首先,大數(shù)據(jù)技術在提高企業(yè)效能、增強企業(yè)核心競爭力等方面能夠為企業(yè)帶來可觀利益和發(fā)展優(yōu)勢。其次,由于國家對人工智能學科的統(tǒng)籌規(guī)劃以及大數(shù)據(jù)技術發(fā)展的迅猛態(tài)勢,國內高校、科研院所也對大數(shù)據(jù)技術的愈發(fā)重視,與之相關的科研活動也逐步深入。
2.4?專利技術布局分析
通過統(tǒng)計專利技術分類情況可以了解當前專利檢索領域的技術分布狀況,從而找到專利技術申請熱點與空白點,對于了解專利技術布局找到研發(fā)方向非常有幫助。
對國內大數(shù)據(jù)技術相關專利的研究方向進行IPC專利分類檢索,檢索結果如圖4所示。容易看出,目前大數(shù)據(jù)技術研究方向較為統(tǒng)一,主要集中在G物理和H電學相關領域。根據(jù)大組分類編號可以看出,目前針對大數(shù)據(jù)技術的研究主要基于計算機處理技術,例如數(shù)據(jù)挖掘、數(shù)據(jù)處理及通信控制等方面。根據(jù)具體IPC分類號可以看出,當前大數(shù)據(jù)領域的技術研究熱點為信息檢索及其數(shù)據(jù)庫結構。
3?國際競爭態(tài)勢分析
3.1?年度專利申請量分析
根據(jù)國際大數(shù)據(jù)技術相關專利檢索結果數(shù)據(jù),世界首件涉及“big data”的專利是1985年由日本率先提出的,盡管當時其所代表的含義與目前主流的含義并不完全相同,但它的確是國際上在字面上首個包含“big data”術語的專利。國際大數(shù)據(jù)技術專利申請量檢索數(shù)據(jù)如圖5所示。
將圖5的國際大數(shù)據(jù)技術專利申請量檢索數(shù)據(jù)與圖1的國內檢索數(shù)據(jù)進行比較,不難發(fā)現(xiàn)大數(shù)據(jù)技術相關國際專利同樣也可以分為3個階段。第1階段為2002年以前,該階段只有少數(shù)專利出現(xiàn),大數(shù)據(jù)相關技術還未得到長足發(fā)展,該階段屬于技術萌芽期,第2個階段為2002—2011年,相關專利申請量呈現(xiàn)緩慢增長的趨勢,該階段是大數(shù)據(jù)技術的初步發(fā)展期,第3階段從2012年開始,專利申請量呈現(xiàn)倍數(shù)級增長,該階段為大數(shù)據(jù)技術的蓬勃發(fā)展期。此外,2018年國際、國內大數(shù)據(jù)相關專利申請數(shù)量均有不同程度的回落。由此可見,國內大數(shù)據(jù)技術相關專利雖然起步較晚,但在蓬勃發(fā)展期與國際發(fā)展水平接軌,發(fā)展態(tài)勢良好。
3.2?專利授權國家和組織數(shù)據(jù)分析
根據(jù)國際大數(shù)據(jù)專利授權國家和組織檢索數(shù)據(jù),結果如圖6所示。專利數(shù)量排名前3的授權國家和組織分別為中國、美國和韓國,其中中國專利數(shù)量占比約為70%,遠超世界上其他國家和組織。由此表明,目前中國已在大數(shù)據(jù)技術領域具備一定的實力,對大數(shù)據(jù)技術的專利研究受到廣泛關注和重視。
另一方面,雖然中國大數(shù)據(jù)技術相關專利數(shù)量遠超世界上其他國家和組織,但中國大數(shù)據(jù)相關授權專利數(shù)量為559件,而美國大數(shù)據(jù)相關授權專利數(shù)量為1 028件。因此不難看出,美國是世界第一的專利授權國家和組織,同時也說明美國對大數(shù)據(jù)技術領域的相關研究具有更強的核心競爭力。
3.3?國際專利申請人排行榜
根據(jù)國際大數(shù)據(jù)專利申請人檢索數(shù)據(jù),可以得到國際大數(shù)據(jù)專利申請人排行榜,如表1所示。根據(jù)檢索結果,在排名前20的專利申請人中,申請人主要來自美國、中國和韓國。其中,15個來自中國,4個來自美國,1個來自韓國。所有申請人中,有5個為中國高校,其余15個均為產業(yè)界科技龍頭企業(yè)。由此表明,中國高等學校對大數(shù)據(jù)技術的高度重視與緊密關注,也說明中國高校的科研力量正在逐步提升,同時也表明大數(shù)據(jù)技術在國際上得到了眾多電子信息類公司的密切關注。
4?結語
通過對國內、國際大數(shù)據(jù)技術專利檢索數(shù)據(jù)對比分析可以得出,目前我國對大數(shù)據(jù)技術領域的研究水平與美國先進水平相比仍存在一定差距,尚未掌握核心技術,但是我國大數(shù)據(jù)技術產業(yè)呈現(xiàn)出良好的發(fā)展態(tài)勢。
目前我國高校和電子信息類企業(yè)成為大數(shù)據(jù)技術相關專利的主要申請主體。對大數(shù)據(jù)技術領域的研究主題主要集中在計算機處理技術,當前研究熱點為信息檢索及其數(shù)據(jù)庫結構。同時大數(shù)據(jù)技術已逐步向各個應用領域滲透,國家電網、浪潮集團等龍頭企業(yè)成為大數(shù)據(jù)技術應用的領跑者。隨著人工智能領域快速崛起、智能制造產業(yè)發(fā)展如火如荼,大數(shù)據(jù)技術作為人工智能的核心技術將會被應用在越來越多的研究領域。
基于分析研究,我們對中國企業(yè)的大數(shù)據(jù)發(fā)展戰(zhàn)略提出以下應對策略:
1)充分發(fā)揮大數(shù)據(jù)資源優(yōu)勢,建立健全數(shù)據(jù)披露、數(shù)據(jù)共享機制,形成行業(yè)間數(shù)據(jù)透明、數(shù)據(jù)共享的良性發(fā)展態(tài)勢。
2)靈活運用大數(shù)據(jù)技術,積極引導企業(yè)技術發(fā)展與科技創(chuàng)新,加速企業(yè)轉型升級。
3)進一步增強企業(yè)知識產權保護意識,優(yōu)化企業(yè)戰(zhàn)略布局,加強企業(yè)風險防范,及時有效維護企業(yè)合法權益。
4)密切關注發(fā)達國家的前沿技術發(fā)展動向,避免在新一輪國際競爭中陷入被動,力爭取得關鍵技術上的重大突破。
5)抓住人工智能、智能制造等國家重大戰(zhàn)略契機,充分發(fā)揮民營經濟體的巨大能量,助力大數(shù)據(jù)智能制造飛速前進。
盡管我國大數(shù)據(jù)技術發(fā)展歷程與國際發(fā)展態(tài)勢基本吻合,但在核心技術的創(chuàng)新上仍缺乏重大突破。因此,應大力加強工業(yè)大數(shù)據(jù)與人工智能核心技術研發(fā)能力,積極參與相關國際標準制定,力爭在新興技術領域的國際標準化進程中占據(jù)有利地形。
參考文獻:
[1]知乎.?大數(shù)據(jù)[EB/OL].(2008-08-15)[2018-11-30].https://www.zhihu.com/topic/19740929/intro.
[2]?MAYER-SCHNBERGER V,CUKIER K.Big data:a revolution that will transform how we live,work,and think[M].London:John Murray Publisher,2013.
[3]Nature.?Big Data[EB/OL].?(2008-09-03)[2018-11-30].http://www.nature.com/news/specials/bigdata/index.html.
[4]Science.?Special online collection:dealing with data[EB/OL].?(2011-02-11)[2018-11-30].http://www.scie ncemag.org/site/special/data/.
[5]MANYIKA J,CHUI M,BROWN B,et al.?Big data:the next frontier for innovation,competition and productivity [R/OL].(2011-05-18)[2018-11-30].https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation.
[6]孟小峰,慈祥.?大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J].?計算機研究與發(fā)展.2013,50(1):146-169.
[7]程學旗,靳小龍,楊婧,等.?大數(shù)據(jù)技術進展與發(fā)展趨勢[J].科技導報.2016,34(14):49-59.
[8]劉煒,夏翠娟,張春景.?大數(shù)據(jù)與關聯(lián)數(shù)據(jù):正在到來的數(shù)據(jù)技術革命[J].?現(xiàn)代圖書情報技術,2013(4):2-9.
[9]陶雪嬌,胡曉峰,劉洋.?大數(shù)據(jù)研究綜述[J].?系統(tǒng)仿真學報,2013(S1):142-146.
[10]劉智慧,張泉靈.?大數(shù)據(jù)技術研究綜述[J].?浙江大學學報(工學版),2014,48(6):957-972.
[11]韓晶.?大數(shù)據(jù)服務若干關鍵技術研究[D].?北京:北京郵電大學,2013.
[12]李鵬飛,盧瑾,辛一.?基于專利的大數(shù)據(jù)技術發(fā)展情報分析及戰(zhàn)略研究[J].?情報雜志,2014(9):45-50.
[13]李文娟,劉桂鋒,盧章平.?基于專利分析的我國大數(shù)據(jù)產業(yè)技術競爭態(tài)勢研究[J].?情報雜志,2015(7):65-70.
[14]沈瀅,張倩.?大數(shù)據(jù)關鍵技術專利態(tài)勢研究[J].?電信網技術,2017(3):43-49.
[15]任成梅,馬麗儀,洪成,等.?大數(shù)據(jù)技術專利發(fā)展情況分析[J].?科技經濟導刊,2018(1):7-11.