陸平 侯雪 曹茜芮
通過對截至2018年底全球深度學(xué)習(xí)領(lǐng)域?qū)@谋緮?shù)據(jù)的分析,賽迪智庫規(guī)劃研究所發(fā)現(xiàn),我國雖在深度學(xué)習(xí)技術(shù)應(yīng)用層具有較強的拓展能力,但基礎(chǔ)層深耕不足成為制約發(fā)展的重大短板。為此,本文提出三點建議:打造平臺以統(tǒng)籌協(xié)調(diào)促進研發(fā)資源聚合,引導(dǎo)計算、存儲、傳輸?shù)裙残约夹g(shù)發(fā)展,加快建設(shè)人工智能新基礎(chǔ)設(shè)施,輻射未來更廣的應(yīng)用領(lǐng)域。
人工智能的應(yīng)用和落地場景越來越寬泛,圖像識別、語音識別、機器翻譯、AI醫(yī)療、自動駕駛等領(lǐng)域不斷有新產(chǎn)品落地,深度學(xué)習(xí)技術(shù)則是促進這些產(chǎn)品落地的關(guān)鍵。以深度學(xué)習(xí)領(lǐng)域相關(guān)技術(shù)術(shù)語為關(guān)鍵詞進行12門語種跨語言檢索,獲取截至2019年3月底的中、美、韓、日、德等17個國家專利局及PCT(國際專利合作協(xié)定)相關(guān)專利信息,形成深度學(xué)習(xí)領(lǐng)域包括16335項專利文本數(shù)據(jù)集。通過對該樣本數(shù)據(jù)集進行LDA主題挖掘,可分析把握全球深度學(xué)習(xí)技術(shù)的創(chuàng)新態(tài)勢。
全球深度學(xué)習(xí)技術(shù)創(chuàng)新態(tài)勢分析
從新增專利數(shù)量看,目前全球深度學(xué)習(xí)領(lǐng)域技術(shù)創(chuàng)新正處于蓬勃發(fā)展期。2018年全球深度學(xué)習(xí)領(lǐng)域新增專利7429項,是2017年的2.34倍。2018年P(guān)CT新增專利429項,是2017年的3.67倍。中國、美國與韓國專利局的新增專利數(shù)量居于全球前三,其中,2018年中國為5638項,美國為736項,韓國為315項。從深度學(xué)習(xí)領(lǐng)域新增專利數(shù)量的變化看,中國目前是深度學(xué)習(xí)創(chuàng)新全球最活躍的國家。
從申請主體構(gòu)成看,企業(yè)與科研院所的研發(fā)能力大致相當(dāng)。2018年,全球以公司為申請主體的深度學(xué)習(xí)技術(shù)專利有3496項,人工智能的應(yīng)用和落地場景越來越寬泛,圖像識別、語音識別、機器翻譯、AI醫(yī)療、自動駕駛等領(lǐng)域不斷有新產(chǎn)品落地,深度學(xué)習(xí)技術(shù)則是促進這些產(chǎn)品落地的關(guān)鍵。以深度學(xué)習(xí)領(lǐng)域相關(guān)技術(shù)術(shù)語為關(guān)鍵詞進行12門語種跨語言檢索,獲取截至2019年3月底的中、美、韓、日、德等17個國家專利局及PCT(國際專利合作協(xié)定)相關(guān)專利信息,形成深度學(xué)習(xí)領(lǐng)域包括16335項專利文本數(shù)據(jù)集。通過對該樣本數(shù)據(jù)集進行LDA主題挖掘,可分析把握全球深度學(xué)習(xí)技術(shù)的創(chuàng)新態(tài)勢。
全球深度學(xué)習(xí)技術(shù)創(chuàng)新態(tài)勢分析
從新增專利數(shù)量看,目前全球深度學(xué)習(xí)領(lǐng)域技術(shù)創(chuàng)新正處于蓬勃發(fā)展期。2018年全球深度學(xué)習(xí)領(lǐng)域新增專利7429項,是2017年的2.34倍。2018年P(guān)CT新增專利429項,是2017年的3.67倍。中國、美國與韓國專利局的新增專利數(shù)量居于全球前三,其中,2018年中國為5638項,美國為736項,韓國為315項。從深度學(xué)習(xí)領(lǐng)域新增專利數(shù)量的變化看,中國目前是深度學(xué)習(xí)創(chuàng)新全球最活躍的國家。
從申請主體構(gòu)成看,企業(yè)與科研院所的研發(fā)能力大致相當(dāng)。2018年,全球以公司為申請主體的深度學(xué)習(xí)技術(shù)專利有3496項,以高??蒲性核鶠樯暾堉黧w的有3416項,大致呈現(xiàn)平衡格局。根據(jù)專利數(shù)量排名,2018年全球排名前五的企業(yè)主要有IBM、平安科技、三星電子、谷歌和英特爾,分別新增62、53、52、46和45項相關(guān)發(fā)明專利。全球排名前五的科研院所主要有華南理工大學(xué)、電子科技大學(xué)、天津大學(xué)、浙江工業(yè)大學(xué)和清華大學(xué),分別新增140、114、93、79和78項相關(guān)發(fā)明專利。
從算法角度上看,卷積神經(jīng)網(wǎng)絡(luò)算法占比最高,生成式對抗網(wǎng)絡(luò)算法使用量快速增長。從深度學(xué)習(xí)算法角度看,卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、生成式對抗網(wǎng)絡(luò)(GAN)、長短期記憶網(wǎng)絡(luò)(LSTM)等成為深度學(xué)習(xí)熱門算法,使用頻率逐年增高。2018年,全球涉及CNN、RNN、GAN、LSTM算法專利數(shù)量為3061、239、38和31項,分別比上年增長122.7%、94.3%、533.3%和416.7%。可見,卷積神經(jīng)網(wǎng)絡(luò)算法占絕大部分比重,生成式對抗網(wǎng)絡(luò)(GAN)算法增長勢頭迅猛。
從技術(shù)應(yīng)用領(lǐng)域看,深度學(xué)習(xí)技術(shù)在機器視覺領(lǐng)域的應(yīng)用比重較大,自動駕駛領(lǐng)域應(yīng)用創(chuàng)新熱度較高。深度學(xué)習(xí)技術(shù)目前主要應(yīng)用于機器視覺、自然語言、自動駕駛等領(lǐng)域,其中機器視覺創(chuàng)新熱度最高。在機器視覺領(lǐng)域,2018年全球涉及圖像、視頻等機器視覺領(lǐng)域的深度學(xué)習(xí)技術(shù)專利分別有3674項和673項,兩者合計約占2018年全球深度學(xué)習(xí)技術(shù)專利總量的58.5%。在自然語言領(lǐng)域,2018年相關(guān)專利技術(shù)有495項,比上年增長約104.5%,充分表明自然語言領(lǐng)域應(yīng)用深度學(xué)習(xí)技術(shù)的創(chuàng)新熱度較高。在自動駕駛領(lǐng)域,深度學(xué)習(xí)技術(shù)應(yīng)用創(chuàng)新最熱,2018年相關(guān)專利技術(shù)有133項,比上年增長約182.9%。
我國深度學(xué)習(xí)技術(shù)創(chuàng)新現(xiàn)狀分析
我國在深度學(xué)習(xí)技術(shù)應(yīng)用層具有較強的拓展能力,但基礎(chǔ)層深耕不足。我國創(chuàng)新涉及的應(yīng)用方向較為廣泛,已涉及行人識別、能耗預(yù)測、中醫(yī)文本命名實體識別,以及眼底圖像的視網(wǎng)膜血管分割等很多不同的領(lǐng)域。例如,百度在線公司把深度學(xué)習(xí)技術(shù)應(yīng)用于語音識別、圖像生成、人臉圖像識別、端到端自動駕駛系統(tǒng)等領(lǐng)域,商湯科技公司把深度學(xué)習(xí)技術(shù)應(yīng)用于人物識別、三維人體姿態(tài)預(yù)測、實例分割、圖像分割神經(jīng)網(wǎng)絡(luò)、視線追蹤等領(lǐng)域。而美國在深度學(xué)習(xí)領(lǐng)域的技術(shù)創(chuàng)新大多聚焦于基礎(chǔ)層的效率提升。例如,IBM公司研發(fā)了一種應(yīng)用于大規(guī)模深度學(xué)習(xí)的多方向縮減技術(shù),能夠較大限度地減少系統(tǒng)節(jié)點間通信所需的傳輸數(shù)據(jù)量,從而提高計算效率。整體而言,我國更偏向于應(yīng)用創(chuàng)新,做計算、存儲與傳輸優(yōu)化方面的專利相對較少。
我國深度學(xué)習(xí)專利增長迅速,但以企業(yè)為主體的創(chuàng)新較少。從增速上看,2016-2018年,我國深度學(xué)習(xí)領(lǐng)域的新增專利數(shù)量分別為701、2487和5638項,平均年增速達到183.6%。從構(gòu)成上看,中國的研發(fā)力量集中于高??蒲性核?,而美國主要集中于企業(yè)。2018年,美國以企業(yè)為申請主體的新增專利數(shù)占其總量的81.5%,而中國以企業(yè)為申請主體的占比僅為40.8%。
我國使用深度學(xué)習(xí)技術(shù)的企業(yè)高度聚集于廣東省、北京市等地,區(qū)域分化差距拉大。從空間分布格局看,京津冀地區(qū)和珠三角地區(qū)創(chuàng)新活躍度最為顯著。2018年,我國深度學(xué)習(xí)領(lǐng)域技術(shù)創(chuàng)新最活躍的前30家企業(yè)(按新增專利數(shù)排序),分布在北京市、廣東省的數(shù)量占比分別為46.7%和20%。從空間分布變化看,對比2017年和2018年最活躍的前30家企業(yè)分布格局,廣東省從4家上升至6家,北京市從13家上升至14家,上海市從4家下降至0家??梢?,廣東省、北京市在人工智能(深度學(xué)習(xí)技術(shù)領(lǐng)域)領(lǐng)域的活躍度在上升,而上海等地的活躍度有所下降。
發(fā)展建議
打造平臺,統(tǒng)籌協(xié)調(diào)促進研發(fā)資源聚合。美國近81.5%的人工智能(深度學(xué)習(xí)方向)研發(fā)創(chuàng)新力量集中在企業(yè),有很強的商業(yè)目標(biāo)性。我國研發(fā)主力則大多集中于科研院所,且研究力量比較分散,研發(fā)方向不夠聚焦(多數(shù)是技術(shù)在某些新領(lǐng)域的應(yīng)用),研發(fā)經(jīng)費也碎片化,難以聚集力量解決重點問題。建議借鑒美國成立國防部高級研究計劃局、Google X 實驗室、Facebook 人工智能研究院的經(jīng)驗,成立我國的人工智能國家實驗室和人工智能產(chǎn)學(xué)研協(xié)同創(chuàng)新中心,以打通政產(chǎn)學(xué)研用各環(huán)節(jié),促進研發(fā)資源聚合,聚焦難點環(huán)節(jié)重點攻關(guān)。
加強導(dǎo)向,引導(dǎo)計算、存儲、傳輸?shù)裙残约夹g(shù)發(fā)展。不管人工智能應(yīng)用如何拓展,其數(shù)據(jù)存儲、信息傳輸、高性能計算等共性技術(shù)還是相通的。美國很多企業(yè)已經(jīng)看到了這一點,谷歌、IBM、英特爾、英偉達等企業(yè),大多圍繞計算效率、數(shù)據(jù)傳輸?shù)热斯ぶ悄艿幕A(chǔ)層進行專利布局,而把應(yīng)用創(chuàng)新交給了研發(fā)社區(qū)。這種做法既抓住了人工智能產(chǎn)業(yè)的關(guān)鍵核心,又能夠確保創(chuàng)新活躍度。從我國專利布局看,目前還主要集中于深度學(xué)習(xí)技術(shù)應(yīng)用層,只有通過引導(dǎo)資源投入通用與共性技術(shù)領(lǐng)域,才能使我國人工智能產(chǎn)業(yè)走出“專利成果數(shù)量多但關(guān)鍵技術(shù)少”的怪圈。
構(gòu)建產(chǎn)業(yè)生態(tài),加強人工智能新基礎(chǔ)設(shè)施建設(shè),輻射更多應(yīng)用領(lǐng)域。從谷歌公司的專利創(chuàng)新看,一些是圍繞TPU云服務(wù)方向布局。其近期開源的Tensorflow框架、云化TPU計算資源,就降低了深度學(xué)習(xí)模型部署難度,大大促進了人工智能的大眾化與普及。不管未來應(yīng)用如何變化,計算和存儲都是核心領(lǐng)域,只有掌握這些領(lǐng)域,才能成為智能時代的基石。目前我國仍然缺乏完整的人工智能產(chǎn)業(yè)生態(tài),特別是在基礎(chǔ)硬件(芯片)領(lǐng)域。未來,一方面要加快補齊基礎(chǔ)層軟硬件短板,圍繞一些特定應(yīng)用場景(如智能手機、無人機、智能駕駛等),從硬件實現(xiàn)角度顛覆性地突破類腦神經(jīng)芯片,如深度卷積神經(jīng)網(wǎng)絡(luò)芯片等。另一方面,加快建設(shè)人工智能新基礎(chǔ)設(shè)施,發(fā)展高性能、高安全的異構(gòu)計算服務(wù)集群及邊緣計算,通過開源深度學(xué)習(xí)框架、云化計算資源等,促進人工智能普及,輻射更廣更深的應(yīng)用領(lǐng)域。