唐 娜,王 浩,鐘代笛*
(1.重慶大學(xué)生物工程學(xué)院,重慶 400044;2.中國(guó)食品藥品檢定研究院醫(yī)療器械檢定所,北京 102629)
人工智能(artificial intelligence,AI)在醫(yī)療健康領(lǐng)域中的應(yīng)用越來(lái)越廣泛,人工智能醫(yī)療器械(artificial intelligence medical device,AIMD)常以醫(yī)療器械獨(dú)立軟件(software as a medical device,SaMD)或醫(yī)療器械軟件組件(software in a medical device,SiMD)的形式呈現(xiàn),其被廣泛地應(yīng)用于影像、病理等領(lǐng)域以及臨床輔助診斷、治療、篩查等場(chǎng)景[1-7]。
AIMD的發(fā)展面臨2個(gè)突出問(wèn)題。一是如何建立臨床用戶對(duì)產(chǎn)品的信任。AI技術(shù)具有黑盒特性,特別是基于深度學(xué)習(xí)的AI算法,其輸出結(jié)果往往難以解釋,利益相關(guān)方對(duì)產(chǎn)品安全有效的評(píng)價(jià)還不夠直接和深入[8-9]。在從技術(shù)到產(chǎn)品的轉(zhuǎn)化過(guò)程中,如何保障AIMD的安全有效性,不僅需要從技術(shù)層面采取措施,還需要監(jiān)管層面的控制。二是AI技術(shù)本身處于飛速發(fā)展階段,AIMD產(chǎn)品的迭代更新也在加速,需要在更短的周期內(nèi)對(duì)產(chǎn)品的安全有效性進(jìn)行評(píng)價(jià),對(duì)監(jiān)管和測(cè)試提出了新的挑戰(zhàn),也推動(dòng)著質(zhì)量管理體系的調(diào)整。
為了解決上述問(wèn)題,各國(guó)均在研究針對(duì)AIMD的監(jiān)管政策,加強(qiáng)對(duì)AIMD安全性和有效性的評(píng)價(jià),保障使用者及相關(guān)人員的安全。目前AIMD監(jiān)管工作處于發(fā)展變革階段,多個(gè)國(guó)家/地區(qū)/組織已陸續(xù)發(fā)布相關(guān)指導(dǎo)性文件和規(guī)范[10]。本文以問(wèn)題為導(dǎo)向,對(duì)AIMD的監(jiān)管現(xiàn)狀進(jìn)行總結(jié),簡(jiǎn)要分析相關(guān)技術(shù)指導(dǎo)文件/標(biāo)準(zhǔn)的作用和適用范圍,聚焦中國(guó)和美國(guó)目前的監(jiān)管動(dòng)態(tài)和監(jiān)管思路,旨在為AIMD產(chǎn)業(yè)提供參考信息,并展望標(biāo)準(zhǔn)規(guī)范發(fā)展的趨勢(shì)。
近年來(lái),AI技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用越來(lái)越廣泛,相關(guān)算法模型也逐漸轉(zhuǎn)化為產(chǎn)品并獲批上市。從美國(guó)食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)[11]以及我國(guó)國(guó)家藥品監(jiān)督管理局(National Medical Products Administration,NMPA)[12]官方網(wǎng)站查詢獲批上市的AIMD的相關(guān)資料(截至2021年底),整理結(jié)果如圖1~3所示。
圖1 1997—2021年美國(guó)和中國(guó)獲批上市的AIMD產(chǎn)品數(shù)量
從圖1中可以看出,2015年以前,每年在美國(guó)FDA獲批上市的AIMD不超過(guò)6個(gè),2015年以后,申請(qǐng)上市并獲得批準(zhǔn)的AIMD數(shù)量快速增長(zhǎng),2020年單年獲批的AIMD產(chǎn)品數(shù)量已達(dá)100個(gè),受新型冠狀病毒肺炎疫情影響,2021年通過(guò)申請(qǐng)的AIMD產(chǎn)品數(shù)量有所下降。按照學(xué)科分類,70.3%的AIMD產(chǎn)品屬于放射影像類產(chǎn)品,其次是心血管類產(chǎn)品和血液學(xué)相關(guān)產(chǎn)品,占比分別為12.5%和4.1%,可見放射影像類AIMD產(chǎn)品是目前研發(fā)的主要方向,如圖2所示。
圖2 美國(guó)AIMD產(chǎn)品臨床適用方向分布情況
通過(guò)篩選,目前查到我國(guó)已取得Ⅲ類注冊(cè)證的AIMD產(chǎn)品共有26個(gè)。我國(guó)在2020年批準(zhǔn)第一款Ⅲ類AIMD,2021年拿到注冊(cè)證的Ⅲ類AIMD產(chǎn)品數(shù)穩(wěn)步上升,發(fā)展勢(shì)頭良好,其中,肺部影像類和心血管相關(guān)的產(chǎn)品占比分別約為42.3%和26.9%,眼底圖像和骨骼相關(guān)的AIMD產(chǎn)品也各有3個(gè),如圖3所示。在加速審評(píng)的同時(shí),藥品監(jiān)管部門對(duì)產(chǎn)品的分類界定也做了大量工作,依據(jù)《醫(yī)療器械分類目錄》[13]和新制定的《人工智能醫(yī)用軟件產(chǎn)品分類界定指導(dǎo)原則》[14]對(duì)新產(chǎn)品進(jìn)行分類界定,再依據(jù)管理類別對(duì)產(chǎn)品進(jìn)行監(jiān)管。
圖3 中國(guó)AIMD產(chǎn)品臨床適用方向分布情況
有許多國(guó)家、組織正在研討制定適用于AIMD監(jiān)管的指導(dǎo)原則、指南和標(biāo)準(zhǔn),從不同角度、不同層面為提高AIMD產(chǎn)品質(zhì)量和保障其安全有效性提供規(guī)范要求和指導(dǎo)意見。表1總結(jié)了部分國(guó)家和標(biāo)準(zhǔn)組織正在制定/已頒布的標(biāo)準(zhǔn)/技術(shù)指導(dǎo)文件及其關(guān)注問(wèn)題。
表1中所涉及醫(yī)療領(lǐng)域的標(biāo)準(zhǔn)/技術(shù)指導(dǎo)文件分別從術(shù)語(yǔ)、數(shù)據(jù)集、測(cè)試方法、可信賴性等方面對(duì)產(chǎn)品及其說(shuō)明文檔進(jìn)行規(guī)范。AI醫(yī)療領(lǐng)域中有關(guān)術(shù)語(yǔ)定義的規(guī)范[17,24,26-27]既統(tǒng)一了行業(yè)內(nèi)人員的表述,又為未來(lái)AIMD標(biāo)準(zhǔn)的制定建立了通用的詞匯表。在AIMD研發(fā)過(guò)程中使用的數(shù)據(jù)集在很大程度上影響著AIMD的性能,因此建立高質(zhì)量的數(shù)據(jù)集有利于開發(fā)性能良好的AIMD。相關(guān)標(biāo)準(zhǔn)[18-19,25]旨在規(guī)范數(shù)據(jù)集的建立流程、加強(qiáng)數(shù)據(jù)集質(zhì)量的管理控制和評(píng)價(jià),以提高數(shù)據(jù)集的質(zhì)量。針對(duì)上市數(shù)量較多、預(yù)期用途相近的AIMD產(chǎn)品,相關(guān)標(biāo)準(zhǔn)[20]關(guān)注對(duì)其性能的客觀量化評(píng)價(jià),對(duì)性能指標(biāo)、測(cè)試方法、測(cè)試流程、測(cè)試環(huán)境、測(cè)試集等內(nèi)容進(jìn)行規(guī)范。此外,國(guó)外的標(biāo)準(zhǔn)組織[28]還比較關(guān)注AI在醫(yī)療領(lǐng)域的可信賴性問(wèn)題,從人類信任(human trust)、技術(shù)信任(technical trust)、監(jiān)管信任(regulatory trust)3個(gè)方面討論如何建立和維護(hù)最終用戶對(duì)AI的信任。由于AI技術(shù)本身的黑盒特性降低了人們對(duì)AI技術(shù)應(yīng)用的信任度,提高AIMD的可信賴性在一定程度上可以讓更多人相信AIMD的輸出結(jié)果。
表1 部分國(guó)家/標(biāo)準(zhǔn)組織的技術(shù)指導(dǎo)文件/標(biāo)準(zhǔn)
監(jiān)管活動(dòng)可按照醫(yī)療器械的全生命周期進(jìn)行劃分,對(duì)前期研發(fā)、上市審批、上市后監(jiān)測(cè)(例如不良事件監(jiān)測(cè)和再評(píng)價(jià))等方面直到最后產(chǎn)品退役各個(gè)環(huán)節(jié)的合規(guī)性進(jìn)行考量,具體的監(jiān)管要素包括數(shù)據(jù)集質(zhì)控、數(shù)據(jù)標(biāo)注規(guī)范、算法評(píng)估驗(yàn)證、臨床評(píng)估、上市前審批、軟件更新、風(fēng)險(xiǎn)管理等。注冊(cè)審批是決定技術(shù)能否產(chǎn)品化、獲得市場(chǎng)準(zhǔn)入并進(jìn)行規(guī)?;R床應(yīng)用的前提條件[29-30],同時(shí),鑒于AIMD的更新頻率加快,對(duì)已通過(guò)上市前審批的AIMD,如何控制產(chǎn)品的變更,使其在一定范圍變更后保持性能不變且不需要再次審批,從而節(jié)約監(jiān)管資源,這也是亟待解決的問(wèn)題。本章將重點(diǎn)介紹美國(guó)和中國(guó)在審批和變更控制方面的監(jiān)管方式,并介紹美國(guó)FDA聯(lián)合其他監(jiān)管機(jī)構(gòu)提出的良好的機(jī)器學(xué)習(xí)實(shí)踐(good machine learning practice,GMLP)概念。
依據(jù)產(chǎn)品風(fēng)險(xiǎn)程度將醫(yī)療器械分為Ⅰ、Ⅱ、Ⅲ類[31],不同管理類別的醫(yī)療器械上市途徑也不同,包括上市前批準(zhǔn)(pre-market approval,PMA)、上市前通告(pre-market notification,PMN)即510(k)以及美國(guó)FDA針對(duì)高風(fēng)險(xiǎn)以外的醫(yī)療器械新品種提供的審批通道De Novo[32-33]。表2總結(jié)了2018—2021年美國(guó)AIMD產(chǎn)品的上市途徑。
表2 2018—2021年美國(guó)AIMD產(chǎn)品的上市途徑統(tǒng)計(jì)單位:個(gè)
從表2可以看出,2018—2021年,美國(guó)上市的AIMD絕大多數(shù)是進(jìn)行510(k)審批的,少數(shù)新產(chǎn)品經(jīng)過(guò)De Novo審批通道獲批上市。目前美國(guó)已上市的AIMD大多數(shù)屬于Ⅱ類醫(yī)療器械。
在我國(guó),依據(jù)新頒布的《人工智能醫(yī)用軟件產(chǎn)品分類界定指導(dǎo)原則》[14],需要結(jié)合產(chǎn)品的預(yù)期用途、算法成熟度等來(lái)界定產(chǎn)品的管理類別,不同的管理類別在審評(píng)上市等環(huán)節(jié)會(huì)有差異。我國(guó)絕大部分AIMD屬于Ⅲ類醫(yī)療器械,需要在上市前進(jìn)行臨床試驗(yàn)。在注冊(cè)審批方面,我國(guó)也在加緊研究適合我國(guó)醫(yī)療器械行情的指導(dǎo)原則和技術(shù)指導(dǎo)文件。2019年,國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中心(以下簡(jiǎn)稱“審評(píng)中心”)發(fā)布了《深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評(píng)要點(diǎn)》[15],該審評(píng)要點(diǎn)適用于深度學(xué)習(xí)輔助決策醫(yī)療器械軟件(含獨(dú)立軟件、軟件組件)的注冊(cè)申報(bào),采用基于風(fēng)險(xiǎn)的全生命周期管理方法,考慮軟件技術(shù)審評(píng)要求,審評(píng)要點(diǎn)重點(diǎn)關(guān)注軟件的數(shù)據(jù)質(zhì)量控制、算法泛化能力、臨床使用風(fēng)險(xiǎn)?;谠搶徳u(píng)要點(diǎn),結(jié)合產(chǎn)品審評(píng)積累的經(jīng)驗(yàn)和監(jiān)管科學(xué)研究成果,2020年3月,為應(yīng)對(duì)新型冠狀病毒肺炎疫情,按照科學(xué)審評(píng)的原則和確保產(chǎn)品安全、有效、質(zhì)量可控的要求,審評(píng)中心制定了《肺炎CT影像輔助分診與評(píng)估軟件審評(píng)要點(diǎn)(試行)》[21]。2022年3月,審評(píng)中心發(fā)布了《人工智能醫(yī)療器械注冊(cè)審查指導(dǎo)原則》[16],該指導(dǎo)原則是AIMD的通用指導(dǎo)原則,囊括的內(nèi)容更全面,仍然基于AIMD生存周期過(guò)程,涉及對(duì)數(shù)據(jù)、算法、驗(yàn)證與確認(rèn)、更新控制等方面的考察,還有一些其他技術(shù)考量,適用于AIMD的注冊(cè)申報(bào),旨在指導(dǎo)注冊(cè)人準(zhǔn)備AIMD注冊(cè)申報(bào)資料,同時(shí)規(guī)范AIMD技術(shù)審評(píng)要求。我國(guó)針對(duì)AIMD的審核重在梳理清楚審評(píng)要點(diǎn)以指導(dǎo)注冊(cè)人準(zhǔn)備注冊(cè)申報(bào)資料。為了加速AI醫(yī)療產(chǎn)品的審核速度,國(guó)家藥品監(jiān)督管理局開辟綠色通道,重大創(chuàng)新產(chǎn)品可以通過(guò)此綠色通道更快地進(jìn)行審批。
AI算法更新迭代快,為了保障算法迭代后產(chǎn)品仍然能保持安全性和有效性,從監(jiān)管的角度要加強(qiáng)對(duì)AIMD產(chǎn)品的變更控制。
2019年4月,美國(guó)FDA發(fā)布了《人工智能/機(jī)器學(xué)習(xí)獨(dú)立軟件更新監(jiān)管框架—討論稿及征求意見》(“Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning(AI/ML)-Based Software as a Medical Device(SaMD)-Discussion Paper and Request for Feedback”)[34](以下簡(jiǎn)稱《更新監(jiān)管框架》),該討論稿依賴國(guó)際醫(yī)療器械監(jiān)管者論壇(International Medical Device Regulators Forum,IMDRF)風(fēng)險(xiǎn)分類原則、FDA的利益-風(fēng)險(xiǎn)框架、風(fēng)險(xiǎn)管理原則以及預(yù)認(rèn)證計(jì)劃中設(shè)想的基于組織的產(chǎn)品全生命周期管理(total product life cycle,TPLC)方法,引入了一個(gè)“預(yù)先確定的變更控制計(jì)劃”。這個(gè)擬議的獨(dú)立軟件更新監(jiān)管框架構(gòu)想把變更控制提前,預(yù)想可能的變更類型以及用于完成這些變更用到的相關(guān)方法學(xué),提早對(duì)可能的產(chǎn)品變更做審查[35-36]。2021年1月,F(xiàn)DA發(fā)布《基于人工智能/機(jī)器學(xué)習(xí)的醫(yī)療器械軟件行動(dòng)計(jì)劃》(“Artificial Intelligence/Machine Learning(AI/ML)-Based Software as a Medical Device(SaMD)Action Plan”)[22](以下簡(jiǎn)稱《行動(dòng)計(jì)劃》),該《行動(dòng)計(jì)劃》回應(yīng)了2019年《更新監(jiān)管框架》發(fā)布后收到的反饋,并從監(jiān)管框架、GMLP、透明度、算法偏見和魯棒性、真實(shí)世界性能等方面概述了FDA打算采取的5項(xiàng)行動(dòng)[37]。
我國(guó)對(duì)AIMD產(chǎn)品的更新控制也有相應(yīng)要求,在《深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評(píng)要點(diǎn)》[15]和《人工智能醫(yī)療器械注冊(cè)審查指導(dǎo)原則》[16]中規(guī)定,產(chǎn)品更新屬于重大軟件更新,為保證產(chǎn)品的安全有效性以及變更后算法泛化能力還能滿足需求,在發(fā)生變更時(shí),應(yīng)當(dāng)開展算法性能評(píng)估、臨床評(píng)價(jià)等驗(yàn)證與確認(rèn)活動(dòng)。相比之下,我國(guó)比較看重變更后產(chǎn)品的重新評(píng)估。
美國(guó)、加拿大和英國(guó)的相關(guān)機(jī)構(gòu)共同確定了10項(xiàng)指導(dǎo)原則,為GMLP的發(fā)展提供信息,進(jìn)而促進(jìn)使用人工智能/機(jī)器學(xué)習(xí)(artificial intelligence/machine learning,AI/ML)的醫(yī)療器械的安全性和有效性[23]。這10項(xiàng)指導(dǎo)原則從模型設(shè)計(jì)、數(shù)據(jù)集、臨床測(cè)試、性能監(jiān)控以及人員(研發(fā)人員、用戶)等方面給出架構(gòu)性的指導(dǎo),涉及醫(yī)療器械的全生命周期,指出了IMDRF、國(guó)際標(biāo)準(zhǔn)組織以及其他合作機(jī)構(gòu)可以努力推進(jìn)GMLP的領(lǐng)域。
與2019年FDA發(fā)布的《更新監(jiān)管框架》相比,10項(xiàng)指導(dǎo)原則更多地從全生命周期的角度進(jìn)行考量,更加注重產(chǎn)品研發(fā)設(shè)計(jì)過(guò)程中涉及的相關(guān)要素以及性能測(cè)試等階段的監(jiān)管,關(guān)注點(diǎn)會(huì)更加多元化。盡管現(xiàn)在10項(xiàng)指導(dǎo)原則還是架構(gòu)性的描述,相信通過(guò)不斷地探索和實(shí)踐,未來(lái)會(huì)有對(duì)10項(xiàng)原則更細(xì)化的具體介紹和描述。
AI技術(shù)在醫(yī)療行業(yè)不同疾病中的應(yīng)用研究越來(lái)越多,隨著各種疾病數(shù)據(jù)集的建立和算法模型的持續(xù)迭代研發(fā),預(yù)計(jì)會(huì)有更多的AIMD申請(qǐng)上市。國(guó)內(nèi)外的標(biāo)準(zhǔn)組織以及監(jiān)管機(jī)構(gòu)都在積極探索適用于AIMD的監(jiān)管思路和標(biāo)準(zhǔn)規(guī)范。根據(jù)已發(fā)布的技術(shù)指導(dǎo)文件,國(guó)內(nèi)監(jiān)管機(jī)構(gòu)對(duì)AIMD的分類界定、審評(píng)審批進(jìn)行了梳理,起草了相關(guān)的行業(yè)標(biāo)準(zhǔn)。在落地過(guò)程中,還需要繼續(xù)深化細(xì)節(jié),例如在進(jìn)行同類產(chǎn)品比對(duì)時(shí),明確不同的性能測(cè)試方法是否會(huì)影響對(duì)比結(jié)果以及何種性能測(cè)試方法能更加準(zhǔn)確地反映產(chǎn)品性能。
目前,AIMD的算法都是鎖定的,不允許在臨床使用階段從數(shù)據(jù)中自適應(yīng)地進(jìn)行自我更新。但隨著AI技術(shù)的發(fā)展和國(guó)外GMLP思想的演化,基于自適應(yīng)算法的AIMD可能會(huì)走進(jìn)現(xiàn)實(shí),這需要我國(guó)監(jiān)管機(jī)構(gòu)提前關(guān)注對(duì)此類產(chǎn)品的性能評(píng)價(jià)和監(jiān)管模式,在未來(lái)的監(jiān)管框架中進(jìn)行布局。
除了關(guān)注廠商聲稱的功能和性能,國(guó)外相關(guān)組織也十分關(guān)注倫理、可信賴性、可解釋性等方面,這在一定程度上是為了讓最終用戶能放心地使用AIMD產(chǎn)品。目前,我國(guó)在這方面的考量還不夠具體,建議從醫(yī)生等最終用戶的角度,關(guān)注其與AIMD之間的人機(jī)交互,一方面提高最終用戶對(duì)AIMD的信任度,讓更多的人愿意采用AIMD,另一方面廠商也可以根據(jù)用戶反饋的意見優(yōu)化產(chǎn)品設(shè)計(jì),從而提高產(chǎn)品質(zhì)量。
綜上所述,AIMD的監(jiān)管政策處于發(fā)展演化階段,強(qiáng)調(diào)科學(xué)化、體系化,一方面圍繞產(chǎn)品的安全有效,不斷形成新方法、新工具、新標(biāo)準(zhǔn),提升質(zhì)量評(píng)價(jià)能力;另一方面也在轉(zhuǎn)變理念,從管理體系的角度應(yīng)對(duì)產(chǎn)業(yè)的變化,覆蓋全生命周期。