李夢薇 高 芳 徐 峰
(中國科學(xué)技術(shù)信息研究所 北京 100038)
近年來,得益于場景需求的日益多樣化和人工智能技術(shù)的快速迭代升級,人工智能應(yīng)用驅(qū)動的特征愈加明顯。特別是新冠肺炎疫情以來,以智能醫(yī)療、智能教育和智能辦公等為代表的人工智能應(yīng)用場景需求加快涌現(xiàn),大量細分領(lǐng)域場景快速落地應(yīng)用,進而推動相關(guān)技術(shù)不斷迭代升級,形成“需求牽引-場景開發(fā)-技術(shù)升級-場景升級”的研發(fā)應(yīng)用閉環(huán)。在這樣的態(tài)勢下,誰在人工智能應(yīng)用場景的開發(fā)上率先走向成熟,誰就有可能在人工智能技術(shù)、應(yīng)用、產(chǎn)業(yè)等方面占據(jù)領(lǐng)先優(yōu)勢。近期以來,全球主要國家紛紛布局人工智能應(yīng)用場景開發(fā),我國也高度重視人工智能在經(jīng)濟社會領(lǐng)域的應(yīng)用,科技部《國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設(shè)工作指引》倡導(dǎo)各地積極開展人工智能技術(shù)應(yīng)用示范、政策試驗、社會實驗和基礎(chǔ)設(shè)施建設(shè),在推動人工智能創(chuàng)新發(fā)展方面先行先試、發(fā)揮引領(lǐng)帶動作用。其中已批復(fù)設(shè)立的國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)北京[1]、上海[2]、杭州[3]、天津[4]等地先后征集人工智能應(yīng)用場景,以開放場景需求、開放數(shù)據(jù)資源、開展應(yīng)用示范等舉措推動場景的開發(fā)落地進程。總體來看,對同一應(yīng)用場景,由于各地資源稟賦和發(fā)展基礎(chǔ)不同,其場景發(fā)展所處的階段會有一定差異,例如有些地區(qū)雖然擁有較好的政策環(huán)境,但基礎(chǔ)設(shè)施存在短板;有些地區(qū)雖然科研院所集聚、具備良好的研究與創(chuàng)新能力,但高技術(shù)企業(yè)占比不高、技術(shù)應(yīng)用基礎(chǔ)薄弱。如果能研判某一場景在哪些地區(qū)更具備優(yōu)先成熟的條件,就可以更好地從資源傾斜、短板彌補等方面進行統(tǒng)籌。同理,對于同一地區(qū),不同場景的發(fā)展條件、所處階段也有所不同,識別優(yōu)先成熟可能性更高的場景,才能讓地方場景的布局更合理高效。
本文研究提出了人工智能應(yīng)用場景成熟度評價模型,以期對同一場景在不同地區(qū)的成熟度、同一地區(qū)不同場景的成熟度進行研判。具體從人工智能應(yīng)用場景發(fā)展成熟所需的因素入手,將場景成熟度劃分為人因成熟度、技術(shù)成熟度和環(huán)境成熟度三個維度,構(gòu)建了包括10個二級指標(biāo)和21個三級指標(biāo)在內(nèi)的評價指標(biāo)體系。以智能醫(yī)療場景為例,對10個國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)所在省市的智能醫(yī)療場景成熟度進行計算對比,并據(jù)此識別各省市智能醫(yī)療場景開發(fā)落地的優(yōu)劣之處。
成熟度評價的研究對象范圍很廣,如產(chǎn)業(yè)成熟度(IML)[5]、技術(shù)成熟度[6]、航天設(shè)備的制造成熟度[7]、產(chǎn)品成熟度[8]、企業(yè)管理成熟度[9]等,但尚未有針對人工智能應(yīng)用場景進行成熟度評價的研究,甚至對應(yīng)用場景進行成熟度評價的研究也較少,因此本文在研究方法上主要借鑒廣義上的成熟度評價方法。從研究方法來看,成熟度評價大體可以分為以下三種思路。
一是“研發(fā)過程”視角,即劃分研發(fā)的各階段并描述關(guān)鍵特征,然后將比較對象與各特征比對,從而確定比較對象所處的階段。美國國家航空航天局(NASA)的“技術(shù)成熟度(TRL,又稱技術(shù)完備等級)”[6]〗就是通過分析技術(shù)研發(fā)的過程來劃分等級,即通過劃分從基礎(chǔ)技術(shù)研究到可行性證明、技術(shù)研發(fā)、系統(tǒng)開發(fā)等的研發(fā)各階段,描述各階段的關(guān)鍵特征,據(jù)此對比技術(shù),從而達到“定級”的目標(biāo)。這種通過過程分析進行等級劃分的思想還見于美國卡內(nèi)基-梅隆大學(xué)軟件工程研究所(SEI)提出軟件能力成熟度模型(CMM)[10]、我國工業(yè)信息化部的《新材料技術(shù)成熟度等級劃分及定義》國家標(biāo)準(zhǔn)等。我國王禮恒院士2016年提出的產(chǎn)業(yè)成熟度方法[5]〗綜合了TRL與美國國防部的制造成熟度(MRL)[11],對產(chǎn)業(yè)誕生到發(fā)展成熟整個演變形態(tài)進行識別,從而描述核心技術(shù)、產(chǎn)品、制造和市場等方面發(fā)展的成熟程度。
二是“影響因素”視角,即直接面向評價對象本身分析其達到成熟所需的因素,進而評價這種因素是否具備、有何缺陷。例如葛毅等[12]從技術(shù)性能、產(chǎn)業(yè)配套、市場環(huán)境、政策環(huán)境、社會影響等五個方面建立了智能電網(wǎng)產(chǎn)業(yè)成熟度標(biāo)準(zhǔn)綜合評價指標(biāo)體系,建立基于多層次模糊綜合評價的智能電網(wǎng)產(chǎn)業(yè)成熟度評估模型;黃魯成等[13]綜合比較了基于TRL、專利、文獻計量學(xué)、顧客需求的滿足程度等的技術(shù)成熟度評價方法,指出局限性,并嘗試在研究產(chǎn)品技術(shù)自身發(fā)展的過程中,同時考慮經(jīng)濟、社會、環(huán)境等影響因素以及及這些因素之間等對產(chǎn)品技術(shù)發(fā)展的影響;孫旭東等[14]從多技術(shù)和多產(chǎn)品角度構(gòu)建能源產(chǎn)業(yè)成熟度評價體系,給出成熟度等級及其評價標(biāo)準(zhǔn),并基于模糊數(shù)學(xué)方法和層次分析法建立能源產(chǎn)業(yè)成熟度評價模型。
三是“外界感知”視角,即參考外界如媒體、公眾的看法來分析評價對象的成熟度,實際采用的是輿情分析的方法。世界知名信息技術(shù)咨詢公司Gartner的技術(shù)成熟度曲線(Hype Cycle)[15]就是采用這種視角,其核心思想是大多數(shù)技術(shù)都必然經(jīng)歷“膨脹期”、“低谷期”然后達到“最終成熟期“的發(fā)展模式,因此可以結(jié)合新技術(shù)、新概念在媒體上的曝光度(在市場上的可見度或普及性)繪制時間曲線,以此來反映技術(shù)所處的發(fā)展階段。Gartner技術(shù)成熟度曲線也因此被稱為“炒作周期曲線”。在具體評價時,Gartner界定了技術(shù)萌芽期、期望膨脹期等五個階段,分析各項技術(shù)分別處于哪一階段,還界定了創(chuàng)新觸發(fā)事件(導(dǎo)致技術(shù)快速發(fā)展和公眾興趣增長的事件)。這種技術(shù)成熟度曲線本質(zhì)上是運用時間軸和公眾期望制作的一個評價工具。
考慮到第三種外界看法視角的評價方法難以從本質(zhì)上回答和分析場景成熟度的原因,本研究主要借鑒的是第二種視角,即分析影響人工智能應(yīng)用場景本身走向成熟的因素(“人-技術(shù)-環(huán)境”三大維度)。在影響因素的提取過程中借鑒第一種視角的“研發(fā)過程”分析思想,即著眼于研發(fā)過程所涉及的各主體,分析各主體的哪些因素能對場景成熟產(chǎn)生驅(qū)動作用,進而構(gòu)建人工智能應(yīng)用場景的成熟度評價模型(見表1)。本研究的創(chuàng)新點在于開創(chuàng)性地構(gòu)建人工智能應(yīng)用場景的成熟度評價模型,并將該模型在典型人工智能應(yīng)用場景——智能醫(yī)療場景——中進行了實際應(yīng)用與分析。
表1 人工智能應(yīng)用場景成熟度評價模型
人工智能應(yīng)用場景(如無特殊說明,本文下述“場景”均指“人工智能應(yīng)用場景”)由技術(shù)、環(huán)境、人三個維度的要素組成,是指人與具有人工智能的機器之間,基于人工智能等信息技術(shù),融合實現(xiàn)智能型的“超鏈接”,并通過人與人工智能的交互關(guān)系構(gòu)成的智能化、社會化的產(chǎn)品所處的動態(tài)調(diào)整的場域[16]。這種界定本質(zhì)上是根據(jù)人工智能應(yīng)用場景可能涉及的幾個主體進行分析。其中,“人”主要從消費者視角出發(fā),關(guān)注“使用主體”,強調(diào)需求的提出以及為了滿足個性化需求而倒逼研發(fā)者實現(xiàn)的產(chǎn)品差異化?!凹夹g(shù)”主要從研發(fā)者視角出發(fā),關(guān)注“研發(fā)主體”,包括研發(fā)機構(gòu)及科技企業(yè),強調(diào)所需的軟件、算法的可獲得、可行性、經(jīng)濟性等?!碍h(huán)境”主要從維護者視角出發(fā),關(guān)注“維護主體”,包括政府及部分企業(yè),強調(diào)數(shù)據(jù)、設(shè)施等“硬環(huán)境”以及政策等“軟環(huán)境”。基于該解構(gòu),對人工智能應(yīng)用場景的成熟度評價同樣應(yīng)當(dāng)從這三個主體維度進行評價,需要解構(gòu)可能影響每個主體是否支持場景發(fā)展、推動場景發(fā)展力度大小的因素。以下是對各維度影響因素的分析。
首先是“人”的維度,“人因”,即從消費者角度分析影響因素。一方面,對某一場景的需求程度如何、市場前景如何,必然是投資方(政府、企業(yè)等)決定資金分配及流向的重要考量。另一方面,消費者(包括個體以及政府、企業(yè)等可能使用人工智能方案的組織)的購買力高低、受教育程度如何,也決定該場景的商業(yè)化進程——經(jīng)濟發(fā)展較好的地區(qū),不僅有較好的購買力采納人工智能方案,而且普遍對新事物的接受程度高,加之具備高等教育水平的使用者能更好地使用人工智能方案,因而場景更易落地推廣。
其次是“技術(shù)”維度,即從研發(fā)者角度分析。研發(fā)能力直接影響場景的開發(fā)能力。這種能力不僅體現(xiàn)在開發(fā)效率上——指當(dāng)前的開發(fā)能力,與論文、專利、人才、機構(gòu)等密切相關(guān)——而且這種開發(fā)能力的可持續(xù)性(往往取決于人才流向、經(jīng)費支持)。需要注意的是,在實際情況中,這種研發(fā)能力可以遷移,例如A地區(qū)研發(fā)能力差,但其他條件已經(jīng)成熟,則可以去研發(fā)強的B地區(qū)引入技術(shù)支持。但本文在構(gòu)建體系時,本著全面性原則,加之可能出現(xiàn)的國家之間、地區(qū)之間的技術(shù)隔閡、技術(shù)壟斷等,因而不考慮研發(fā)能力遷移的情況。但在建議部分,會指出研發(fā)能力弱勢地區(qū)可以從人才引入、技術(shù)引入等方面尋求發(fā)展。
最后是“環(huán)境”維度,即環(huán)境方面分析整個開發(fā)周期涉及的因素,包括制度等“軟”環(huán)境和設(shè)施等“硬”環(huán)境。政策的支持、基礎(chǔ)設(shè)施的完備都是推動場景落地成熟的重要驅(qū)動力量,而活躍的市場、較好的倫理制度環(huán)境則確保人工智能方案較為成熟后、可以順利走向市場、推廣應(yīng)用、讓場景得以健康地發(fā)展落地,例如自動駕駛技術(shù)已經(jīng)較為成熟,但由于倫理規(guī)制尚不成熟,影響了該場景的最終落地。環(huán)境的保障是讓場景不止步于實驗室階段、真正走向成熟的重要因素。
本文構(gòu)建的通用的人工智能應(yīng)用場景成熟度評價模型見表1,三個維度共21個指標(biāo)。這套評價體系既可用于同一場景在不同區(qū)域成熟度的評價,也可用于同一地區(qū)的不同場景成熟度的評價(但在技術(shù)成熟度維度還需要增加對應(yīng)技術(shù)的分析)。本文主要聚焦前者,并在第3節(jié)的實證中將該評價方法進行了實現(xiàn)。
本模型的總評價結(jié)果的數(shù)值越高,代表該地區(qū)的該場景越有可能優(yōu)先成熟,即“走向成熟的能力更高”。各級指標(biāo)在計算時分為正向指標(biāo)和負向指標(biāo)兩種,“正向”表示該指標(biāo)代表的影響因素能夠驅(qū)動人工智能應(yīng)用場景走向成熟,即數(shù)值越高、場景成熟度的可能性越高;“負向”表示指標(biāo)代表的影響因素不利于人工智能應(yīng)用場景成熟,即數(shù)值越高、場景成熟的可能性越低。
人因成熟度從消費者角度進行考量,回答“市場是否成熟(購買力是否高、產(chǎn)品是否具備差異化以滿足消費者需求)”“需求是否成熟(購買欲望是否強)”“應(yīng)用是否成熟(是否具備較好的使用能力)”三個問題。
回答“市場是否成熟”,可以用該地區(qū)的區(qū)域投資能力(用國民生產(chǎn)總值,GDP來代表)、國民儲蓄凈額以及人工智能在該領(lǐng)域的企業(yè)數(shù)量判斷。GDP越高,該地區(qū)經(jīng)濟實力越強,投資能力、購買力越高;國民儲蓄凈額越高,購買力同樣越強;相關(guān)企業(yè)數(shù)量越多,越趨于完全競爭市場,越能滿足消費者的差異化需求。三者處于高數(shù)值時,都有利于推動人工智能應(yīng)用場景發(fā)展成熟,因而三者均為正向指標(biāo)。
回答“需求是否成熟”,即測度該地區(qū)對某一人工智能應(yīng)用場景需求的迫切程度。導(dǎo)致需求迫切的原因一方面可能是該場景對應(yīng)的領(lǐng)域?qū)I(yè)人員少,因而無法滿足需求;另一方面有可能是該領(lǐng)域本身負擔(dān)重,例如因老齡化導(dǎo)致的醫(yī)護負擔(dān)增加等。專業(yè)人員越少,需求越強烈,因而對應(yīng)的指標(biāo)應(yīng)為負向指標(biāo);負擔(dān)越重,需求越強烈,因而對應(yīng)的指標(biāo)應(yīng)為正向指標(biāo)。需要注意的是,由于領(lǐng)域負擔(dān)度的影響因素較多,因而是復(fù)合指標(biāo),其衡量方式需要考慮具體領(lǐng)域引起負擔(dān)的因素(詳見第3節(jié))。
回答“應(yīng)用是否成熟”,即衡量該地區(qū)對人工智能應(yīng)用場景的接受程度和使用能力,用社會文明度進行衡量。社會文明程度越高,則該地區(qū)越容易接受人工智能應(yīng)用場景這種新興事物,使用人工智能產(chǎn)品與服務(wù)的能力也越強,人工智能應(yīng)用場景在該地落地發(fā)展的阻力越小,越容易成熟,因而是正向指標(biāo)。本模型用高等教育人數(shù)比例進行衡量。
“技術(shù)成熟度”從研發(fā)者角度進行考量,回答“當(dāng)前開發(fā)能力是否強(現(xiàn)有研發(fā)人員能力、現(xiàn)有研發(fā)機構(gòu)數(shù)量)”“當(dāng)前開發(fā)能力是否具有可持續(xù)性(經(jīng)費支持、吸引人才)”兩個問題。
回答“當(dāng)前開發(fā)能力是否強”,需要從研發(fā)人員的能力(高被引論文、專利)與研發(fā)機構(gòu)(AI人員數(shù)量占比、AI機構(gòu)數(shù)量)情況兩方面考量。專利申請量體現(xiàn)研發(fā)的活躍度,專利授權(quán)量、高被引論文量、研發(fā)機構(gòu)數(shù)量則體現(xiàn)研發(fā)能力。本部分指標(biāo)均為正向指標(biāo)。
回答“當(dāng)前開發(fā)能力是否具有可持續(xù)性”,主要用R&D經(jīng)費占GDP比例、人工智能人才凈流入率判斷。研發(fā)投入的占比越高,該地區(qū)對研發(fā)活動的重視程度越高,長期來看有利于場景在該地的落地成熟;凈流入率越高,該地區(qū)對人工智能人才的吸引力越強、維持高研發(fā)能力的可能性越高,因此本部分指標(biāo)也為正向指標(biāo)。
“環(huán)境成熟度”關(guān)注人工智能應(yīng)用場景開發(fā)落地所需要的基礎(chǔ)設(shè)施等硬件環(huán)境以及市場、政策法規(guī)等軟件環(huán)境,回答“政策法規(guī)是否可以支持并維護人工智能應(yīng)用場景的健康發(fā)展”“市場是否適合場景的推廣”“設(shè)施是否可以支撐場景的開發(fā)落地”。
回答“政策法規(guī)是否可以支持并維護人工智能應(yīng)用場景的健康發(fā)展”,既要關(guān)注該地區(qū)在既定場景上的政策布局(即“政策支持”),也要關(guān)注該地區(qū)對場景風(fēng)險的把控,包括倫理法規(guī)的相關(guān)研究與政策出臺、人工智能有關(guān)的執(zhí)法司法能力(即“維護能力”)。政策支持方面,可以通過人工智能在所研究的場景領(lǐng)域相關(guān)的法律法規(guī)數(shù)量、支持所研究場景相關(guān)的人工智能領(lǐng)域發(fā)展的政策數(shù)量來衡量;維護能力則可以通過人工智能類審理或執(zhí)行案件數(shù),以及人工智能倫理原則、標(biāo)準(zhǔn)規(guī)范、測試監(jiān)管相關(guān)文件數(shù)量來衡量。二者都是數(shù)量越多越有利于場景成熟,因而均為正向指標(biāo)。
回答“市場是否適合場景的推廣”,關(guān)注市場本身的狀態(tài),用固定資產(chǎn)投資指數(shù)、流動資產(chǎn)周轉(zhuǎn)次數(shù)(主營業(yè)務(wù)收入/平均流動資產(chǎn))、區(qū)域開放度(外貿(mào)總額/GDP)等經(jīng)濟學(xué)指標(biāo)進行度量。穩(wěn)定發(fā)展的市場有利于場景的推廣,因而這幾個指標(biāo)也是正向指標(biāo)。
回答“基礎(chǔ)設(shè)施是否可以支撐場景的開發(fā)落地”,關(guān)注人工智能應(yīng)用場景開發(fā)落地所需的設(shè)施環(huán)境,例如大數(shù)據(jù)中心、智能計算中心的數(shù)量,以及支持建設(shè)相關(guān)基礎(chǔ)設(shè)施或支撐平臺的文件數(shù)量。二者同樣為正向指標(biāo)。
本節(jié)采取10個省市的智能醫(yī)療應(yīng)用場景相關(guān)數(shù)據(jù),對十省市智能醫(yī)療應(yīng)用場景成熟度進行對比。由于以智能醫(yī)療場景為例,因而本節(jié)建立的成熟度評價模型的場景相關(guān)類指標(biāo)全部為智能醫(yī)療場景相關(guān)的指標(biāo),例如指標(biāo)“1.4”原為“場景類負擔(dān)指標(biāo)”,在智能醫(yī)療語境下指標(biāo)“1.4”即為“醫(yī)療負擔(dān)指標(biāo)”。同理,表1中的“領(lǐng)域相關(guān)”指標(biāo)在此語境下特指“智能醫(yī)療領(lǐng)域相關(guān)”。
在評價主體范圍的選取上,本節(jié)選取國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)所在省市。國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)是貫徹落實國務(wù)院2017年7月《新一代人工智能發(fā)展規(guī)劃》(國發(fā)〔2017〕35號)的重大抓手,按照“應(yīng)用牽引、地方主體、政策先行、突出特色”的建設(shè)原則,在體制機制、政策法規(guī)等方面先行先試,著重拓展應(yīng)用場景,加快推進人工智能與實體經(jīng)濟深度融合,促進人工智能在社會民生領(lǐng)域的廣泛應(yīng)用。本文按時間順序選取前12個支持建設(shè)的試驗區(qū)——北京、上海、深圳、杭州、天津、合肥、德清、重慶、成都、西安、濟南、廣州——所在省市,即北京、上海、廣東、天津、安徽、浙江、重慶、四川、陜西、山東共10個省市,進行模型實現(xiàn)。
在評價指標(biāo)的細化上,大部分指標(biāo)與表1一致,但指標(biāo)1.3.1“領(lǐng)域?qū)I(yè)人員-居民數(shù)量比”、指標(biāo)1.3.2“領(lǐng)域負擔(dān)度”這兩個三級指標(biāo)進行了進一步細化。其中,指標(biāo)1.3.1“領(lǐng)域?qū)I(yè)人員-居民數(shù)量比”細化為“千人擁有專業(yè)衛(wèi)生人員數(shù)”,擁有專業(yè)衛(wèi)生人員的數(shù)量越多,對智能醫(yī)療的需求越不迫切,依然是負向指標(biāo);指標(biāo)1.3.2“領(lǐng)域負擔(dān)度”細化為“撫養(yǎng)比”“居民醫(yī)療保健支出占總支出比例”“衛(wèi)生費用占比”“醫(yī)療保險覆蓋率”四個四級指標(biāo),即原三級指標(biāo)“領(lǐng)域負擔(dān)度”在醫(yī)療領(lǐng)域由以上四個四級指標(biāo)進行計算。其中,撫養(yǎng)比是非勞動年齡人口對勞動年齡人口數(shù)的比值,撫養(yǎng)比越大,表明勞動力人均承擔(dān)的撫養(yǎng)人數(shù)就越多,勞動力的撫養(yǎng)負擔(dān)就越嚴重,對醫(yī)療機器人、護理機器人等的需求也越強烈;醫(yī)療保健支出比例越高,醫(yī)療衛(wèi)生負擔(dān)越重,對醫(yī)療的需求越旺盛,醫(yī)療領(lǐng)域的市場越大、智能醫(yī)療越有發(fā)展空間;同理,衛(wèi)生費用包括政府衛(wèi)生支出、社會衛(wèi)生支出、個人衛(wèi)生支出,衛(wèi)生費用占GDP的比重、以及醫(yī)療保險率越高,越不會抑制居民的醫(yī)療需求,即對醫(yī)療的需求越旺盛,智能醫(yī)療越容易發(fā)展推廣。
本節(jié)數(shù)據(jù)來源主要為國家統(tǒng)計局、國家統(tǒng)計年鑒、中國經(jīng)濟景氣月報、知識產(chǎn)權(quán)局、工信部、Web of science數(shù)據(jù)庫、加拿大Element AI歷年發(fā)布的《全球AI人才報告》等。政策類指標(biāo)數(shù)據(jù)通過人工統(tǒng)計獲得,審理執(zhí)行案件數(shù)據(jù)則通過裁判文書網(wǎng)人工統(tǒng)計,以“人工智能”為關(guān)鍵詞進行搜索,再按省市進行計數(shù)(最高法的數(shù)據(jù)不計入北京)。一些指標(biāo)、尤其是經(jīng)濟類指標(biāo)獲得的是年度數(shù)據(jù),另一些指標(biāo)、尤其是政策類指標(biāo)則需要及時更新。為了讓評價結(jié)果與現(xiàn)實情況形成一定的對比,本節(jié)在計算時采用“預(yù)判”的思想。將指標(biāo)劃分為“基礎(chǔ)型指標(biāo)”與“加速型指標(biāo)”,以我國新一代人工智能發(fā)展規(guī)劃的出臺年份(2017年)為基礎(chǔ)年份,全部“基礎(chǔ)型指標(biāo)”均采用2017年的數(shù)據(jù);而“加速型指標(biāo)”采用可獲得的最新數(shù)據(jù)(其中政策類數(shù)據(jù)的統(tǒng)計截止時間是2021年4月),這樣評價的結(jié)果即為“各省市基于2017年的基礎(chǔ)條件,經(jīng)過發(fā)展后其對應(yīng)場景可以達到的成熟度次序”。事實上,“基礎(chǔ)型指標(biāo)”代表一個地區(qū)發(fā)展人工智能應(yīng)用場景的基礎(chǔ)能力,往往具備普遍性、而非僅與人工智能相關(guān),例如市場活躍性、市場購買力、需求迫切性等,是場景能夠落地成熟的基礎(chǔ)條件。“加速型指標(biāo)”往往和人工智能直接相關(guān)、且常常是人工智能專有的指標(biāo),例如人工智能相關(guān)的企業(yè)數(shù)量、政策數(shù)量、高被引論文數(shù)量等,是場景走向成熟的核心驅(qū)動因素。
本節(jié)考慮到本節(jié)側(cè)重于評價模型的實現(xiàn)與驗證,不對各指標(biāo)做進一步的重要性考量,因而在計算時采用“等權(quán)法”,即認為各指標(biāo)相同重要,賦予相同的權(quán)重。具體計算方式如下,計算模型的符號對照見表2。
表2 符號對照表
首先通過0-1標(biāo)準(zhǔn)化對三級指標(biāo)進行異質(zhì)指標(biāo)同質(zhì)化處理,注意處理時需要考慮指標(biāo)方向,即
由于本節(jié)采用等權(quán)思想,即各指標(biāo)同等重要、權(quán)重相當(dāng),因而二級指標(biāo)計算方法為
獲得一級指標(biāo)矩陣
則總得分為
此后對總分及一級指標(biāo)得分分別進行排名,得到如下結(jié)果分析。
如表3,綜合總體成熟度、人因成熟度、技術(shù)成熟度、環(huán)境成熟度來看,在前三名出現(xiàn)過的城市有四個,分別為:廣東省(4次,且總體成熟度第一)、浙江省(3次,僅人因成熟度非前三、居第四)、北京市(3次,僅技術(shù)成熟度非前三、居第四)、上海(2次,總排名非前三、居第四,環(huán)境成熟度居第7)。成熟度總得分(表3前三列)排在前四位的依次是廣東、浙江、北京與上海,這四個省市在學(xué)術(shù)實力、科技實力、經(jīng)濟資本、政策層面具有先天優(yōu)勢,能快速應(yīng)對人工智能大潮并做出反應(yīng);而且,智能醫(yī)療相關(guān)企業(yè)大多也分布在這四個省市,對應(yīng)試驗區(qū)也已出臺了相應(yīng)的智能醫(yī)療資金支持政策,既有按項目、團隊的直接支持,也有創(chuàng)業(yè)和產(chǎn)業(yè)基金[17]。
表3 10省市智能醫(yī)療場景成熟度排名
進一步進行比較分析,如圖1僅展示總分排名前五名省市的各維度得分對比雷達圖。廣東省各維度排名都在前兩位,尤其是環(huán)境成熟度排名第一、且得分遠高于第二名的浙江。結(jié)合實際情況分析,早在2016年,廣州婦女兒童醫(yī)療中心就上線了兒科門診智能診斷系統(tǒng);2020年,廣州全面上線基于大數(shù)據(jù)的醫(yī)院精細化管理和醫(yī)療服務(wù)監(jiān)管平臺。2021年3月,廣州打造中國內(nèi)地首家全場景智能醫(yī)院“廣東省第二人民醫(yī)院”。深圳市智能藥品全閉環(huán)管理、醫(yī)療影像輔助診斷系統(tǒng)、“騰訊醫(yī)療影像”國家新一代人工智能開放創(chuàng)新平臺、“智慧醫(yī)療”廣東省新一代人工智能開放創(chuàng)新平臺,以及圍繞鯤鵬生態(tài)開展智慧醫(yī)療等重點領(lǐng)域智能應(yīng)用示范,具備很強的代表性。
圖1 10省市各維度得分對比雷達圖
浙江省的技術(shù)成熟度排名第一,“開發(fā)持續(xù)性”得分尤其高。浙江人工智能人才政策布局早、投入力度大,2017年就制定十二條政策集聚人工智能人才[18],包括設(shè)立10億元人工智能人才產(chǎn)業(yè)發(fā)展母基金、5 000萬元人工智能天使基金等。數(shù)據(jù)等資源共享方面也做出一定成績,杭州推進醫(yī)療等重點領(lǐng)域數(shù)據(jù)向人工智能企業(yè)有序開放,杭州多中心智能醫(yī)學(xué)信息技術(shù)平臺打破不同醫(yī)療機構(gòu)數(shù)據(jù)共享壁壘,德清圍繞智慧醫(yī)療建成全國首個縣域醫(yī)共體統(tǒng)一支付平臺、遠程會診工作平臺。但值得注意的是,浙江的人因成熟度指標(biāo)得分居第四位,并未進入前三,這主要是由于其醫(yī)療負擔(dān)較輕,需求迫切性指標(biāo)得分低,且高等教育人數(shù)比例處于中游,低于陜西。但另一方面,浙江人工智能相關(guān)企業(yè)數(shù)量僅次于北京、廣東、上海,因此雖然市場需求存疑,但依然具備較強的發(fā)展能力。
北京市的人因成熟度排名第一,產(chǎn)品差異性與社會文明度得分尤其高,這與北京智能醫(yī)療場景開發(fā)主體的多樣性以及教育資源的豐富性分不開。不僅如此,北京還是我國教育高地,清華大學(xué)、中國科學(xué)院、協(xié)和醫(yī)院等國內(nèi)領(lǐng)先的人工智能、醫(yī)療等領(lǐng)域的科研院所扎根于此,這些都為智能醫(yī)療場景在北京的落地成熟提供了基本保障。但是,北京人工智能人才凈流入率較低,對人工智能人才的吸引力遠低于浙江、安徽,僅高于天津、山東,這可能會影響北京未來智能醫(yī)療應(yīng)用場景的后續(xù)發(fā)展。
除了個整體得分較高的省市外,山東省同樣值得關(guān)注,其總體成熟度、人因和技術(shù)成熟度排第五,環(huán)境成熟度居第四位。山東需求迫切性和醫(yī)療負擔(dān)指標(biāo)得分較高,且市場購買力和區(qū)域潛力指標(biāo)居中,因此雖然社會文明度指標(biāo)較低,但其對智能醫(yī)療的需求旺盛、智能醫(yī)療應(yīng)用場景發(fā)展的市場廣闊,有較強的市場潛力亟待發(fā)掘。但是,山東的人工智能人才數(shù)量、高被引論文數(shù)量相對較低,人工智能專利申請量與授權(quán)量和北京、浙江、安徽相比差距都較大,未來在人才政策方面有較大的引導(dǎo)與提升空間。
圖2 代表性省市各維度得分對比雷達圖
進一步選取前三名的廣東、北京、浙江,和末三名的重慶、陜西、四川進行分析,如圖2,可以看到后三名與前三名在各維度的差距都較大。其中,人因成熟度的差距最大,第三位的浙江比倒數(shù)第三位的重慶高39.97%;環(huán)境成熟度差距相對較小(第三位比倒數(shù)第三位高29.94%)。這反映出各地在推動智能醫(yī)療場景的過程中,該地的資金實力、市場需求迫切性、對智能醫(yī)療產(chǎn)品的使用能力等條件相對而言對結(jié)果的區(qū)分性更強,其次是智能醫(yī)療場景相關(guān)的技術(shù)(如利用圖像識別、深度學(xué)習(xí)進行靶區(qū)自動勾畫,利用卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)網(wǎng)絡(luò)進行的影像三維重建技術(shù)等),最后是智能醫(yī)療相關(guān)的政策環(huán)境(如政策支持部署智能醫(yī)療產(chǎn)品與服務(wù)等)及其可能需要的計算中心等設(shè)施設(shè)備的影響。
圖3 代表性省市人因成熟度得分對比雷達圖
進一步聚焦對于各地智能醫(yī)療場景成熟度差距影響最大的人因成熟度進行比較分析,如圖3,可以看到廣東和北京的人因成熟度各維度的總體覆蓋面積明顯遠大于其他省市。其中,北京的主要優(yōu)勢是社會文明度和產(chǎn)品差異性,而廣東的主要優(yōu)勢是市場購買力?;厮莺蟀l(fā)現(xiàn),北京高等教育人數(shù)比例為所有省市中最高,遠高于其他省市,這與北京作為我國文化中心的定位和教育中心的現(xiàn)狀相符;北京智能醫(yī)療相關(guān)企業(yè)的數(shù)量也最多,尤其根據(jù)憶歐智庫等的統(tǒng)計,我國醫(yī)療人工智能企業(yè)中北京的占比超過1/3,在2017年甚至接近一半(全國登記的智能醫(yī)療企業(yè)131家,其中北京占56家,占比43%,遠高于第二名上海的27家);且北京醫(yī)院眾多,2019年11月北京醫(yī)院管理中心主辦的第四屆科技創(chuàng)新大賽(醫(yī)療人工智能方向)就有來自22家北京市屬三級醫(yī)院的85個參賽項目參加。而廣東市場購買力之所以最高,主要是源于其地方GDP和居民人均儲蓄年末余額都是最高,這意味著經(jīng)濟實力極強的地區(qū),發(fā)展智能醫(yī)療場景可能具備更強的先天優(yōu)勢。
浙江覆蓋面積明顯小于廣東與北京,但其在產(chǎn)品差異性、市場購買力方面依然遠高于末三名城市。值得一提的是,末三位的需求迫切性普遍高于前三位,包括醫(yī)療保健支出占總支出的比例、撫養(yǎng)比等數(shù)據(jù),雖然一定程度上與其經(jīng)濟社會發(fā)展程度有關(guān),但也說明這些省市具備較好的市場發(fā)展?jié)摿Α?/p>
本文構(gòu)建了人工智能應(yīng)用場景的成熟度評價模型,并以智能醫(yī)療應(yīng)用場景為例進行了實證分析,對所選擇的10個省市智能醫(yī)療總體發(fā)展情況進行了評價,并結(jié)合實例剖析了各維度排名前列省市的優(yōu)劣之處。該成熟度評價體系可以幫助發(fā)現(xiàn)某場景具備發(fā)展?jié)摿Φ氖∈校绲?節(jié)中提到的山東?。灰部梢詭椭辉u價省市發(fā)現(xiàn)問題,例如,從第3節(jié)的得分可以看到,安徽自身的三個維度中,技術(shù)成熟度排名相對較高,進一步深挖可以發(fā)現(xiàn)其技術(shù)方面的短板主要是開發(fā)效率較低,進一步而言,其人工智能專利申請量較低,已有的人工智能技術(shù)基礎(chǔ)在比較省市中較弱,有巨大的提升空間,因而在專利研發(fā)方面可以給予適當(dāng)鼓勵,推動技術(shù)進一步走向成熟。此外,對于技術(shù)維度的成熟度較低、但其他維度成熟度較高的地區(qū),可以考慮直接引入所需技術(shù)對應(yīng)的團隊、甚至直接引入所需技術(shù)等,以此彌補技術(shù)缺口。
隨著智能醫(yī)療各場景逐步落地應(yīng)用,市場對智能醫(yī)療的認知越發(fā)清晰,對智能醫(yī)療場景的開發(fā)提出更明確的要求,這將令智能醫(yī)療場景更加貼合實際需求,助力中國醫(yī)療服務(wù)水平升級革新。目前,智能醫(yī)療產(chǎn)業(yè)正處在通過人工智能改善民生、帶動產(chǎn)業(yè)升級和助推經(jīng)濟轉(zhuǎn)型的階段,研究成果的轉(zhuǎn)化應(yīng)用至關(guān)重要,而地方政府通過成熟度評價發(fā)現(xiàn)優(yōu)劣勢,從而“對癥下藥”,補短板、拉長板,發(fā)布適宜的政策、營造適合場景發(fā)展的環(huán)境,對于推動智能醫(yī)療場景從研發(fā)到落地應(yīng)用到商業(yè)化推廣、最終實現(xiàn)產(chǎn)業(yè)化、規(guī)?;?,有重要意義。
本評價體系同樣可以用于不同場景在同一地區(qū)的成熟度評價,但限于篇幅本文沒有對此展開進行實證研究。同一地區(qū)對于不同場景的需求迫切性等條件不同,因而“人因成熟度”有所區(qū)分;同理,不同場景的研發(fā)與創(chuàng)新能力、相關(guān)政策環(huán)境也有不同,因此地方可以借此識別不同場景的發(fā)展優(yōu)先級。此外,本研究的重點是建立評價體系,在模型實現(xiàn)方面還有兩點改進空間。一是在模型算法上采用了等權(quán)法,即認為各指標(biāo)相同重要,賦予相同的權(quán)重,在未來研究中,考慮到不同場景的各要素發(fā)揮的重要性可能不同,因而可以根據(jù)不同場景的特征探討權(quán)重,例如引入學(xué)界與業(yè)界專家共同打分定權(quán)重等方式進行調(diào)整。二是在結(jié)果與各影響因素之間的具體關(guān)聯(lián)關(guān)系,限于篇幅沒有詳細展開,在未來可以專門分析闡述其內(nèi)在邏輯,進一步論證評價體系的合理性。