文/Mario Holl
符合嚴(yán)格的監(jiān)管框架條件并不斷追求更高的藥品質(zhì)量——這是制藥行業(yè)在加工和生產(chǎn)過程中需要嚴(yán)苛遵守的特殊要求,以充分確保產(chǎn)品和患者的安全。有些過程尤其如此,如產(chǎn)品裝入注射器、小瓶或安瓿瓶等初級包裝物后的質(zhì)量控制過程,制藥企業(yè)需要識別出每個產(chǎn)品中可能存在的產(chǎn)品缺陷、雜質(zhì)甚至污染,實現(xiàn)100%的監(jiān)控。而現(xiàn)在,InspectifAI 公司副總裁Mario Holl 指出,機(jī)器學(xué)習(xí)可以給這些視覺檢測工作帶來巨大飛躍。
質(zhì)量檢測主要有三種形式:人工完成所有產(chǎn)品的檢測、人在機(jī)器幫助下完成產(chǎn)品的半自動檢測以及全部由機(jī)器完成的全自動檢測。其中,全自動檢測會設(shè)置多個相機(jī)來為每個產(chǎn)品拍攝照片,然后再通過軟件實時評估這些照片,由此分揀出有缺陷的產(chǎn)品。
不過這種方法目前還存在技術(shù)限制,尤其是在產(chǎn)品無法簡單地被分為“好”或“壞”時,原因是現(xiàn)在的圖像評估依然基于一些傳統(tǒng)方法,如灰度值分析,這種方法有時會增加誤剔率,即“好產(chǎn)品”卻被錯誤剔除掉。結(jié)果就是往往需要對這些產(chǎn)品進(jìn)行第二次的人工比對,以確保真正區(qū)分出好產(chǎn)品和壞產(chǎn)品,這一耗時耗力的過程會給制藥企業(yè)增添高達(dá)數(shù)百萬的成本。采用合適的自主學(xué)習(xí)系統(tǒng),可以有效避免上述問題的發(fā)生。
機(jī)器學(xué)習(xí)系統(tǒng)可以記錄人類的專業(yè)知識并將其反映在技術(shù)結(jié)構(gòu)中。機(jī)器學(xué)習(xí)可大致分為“監(jiān)督學(xué)習(xí)”和“無監(jiān)督學(xué)習(xí)”兩種形式,在無監(jiān)督學(xué)習(xí)中,無需事先費(fèi)力地進(jìn)行分類即可呈現(xiàn)數(shù)據(jù)集。這種學(xué)習(xí)系統(tǒng)可以識別模式、群組或類似結(jié)構(gòu),但不會因?qū)W得的內(nèi)容獲得任何“獎勵”,因此學(xué)習(xí)過程很難受到影響,因為它的學(xué)習(xí)純粹基于自己的“觀察”。而在監(jiān)督學(xué)習(xí)中,數(shù)據(jù)集是分類的,即有效數(shù)據(jù)的相關(guān)信息在學(xué)習(xí)之前就已存在,這些數(shù)據(jù)可用于學(xué)習(xí)過程,為學(xué)習(xí)系統(tǒng)提供正確學(xué)習(xí)內(nèi)容的“獎勵”,使學(xué)習(xí)行為能夠被控制。
因此,“監(jiān)督學(xué)習(xí)”為視覺檢測提供了一種可能的解決方案——由檢測專家對圖像進(jìn)行預(yù)分類,系統(tǒng)使用這些圖像來學(xué)習(xí),做出決策。對于難以檢測的產(chǎn)品,這種方案的優(yōu)勢尤其明顯,因為系統(tǒng)事先“學(xué)習(xí)”了人工檢測專家的評估經(jīng)驗和知識。
“InspectifAI”系統(tǒng)為自己設(shè)定了將高質(zhì)量神經(jīng)網(wǎng)絡(luò)引入視覺檢測設(shè)備的目標(biāo),同時考慮了所有的監(jiān)管框架條件,此外它是“與設(shè)備無關(guān)”的,即不依賴于特定的檢測設(shè)備制造商。不僅如此,這一系統(tǒng)還使用了邊緣計算平臺作為檢測設(shè)備和云軟件之間連接的“橋梁”。
為了優(yōu)化視覺檢測系統(tǒng),可以先將邊緣設(shè)備連接至檢測設(shè)備,這使得設(shè)備能夠在云環(huán)境中系統(tǒng)地獲取和存儲圖像數(shù)據(jù),以及實現(xiàn)神經(jīng)網(wǎng)絡(luò)的本地上傳和高效運(yùn)行。相關(guān)圖像數(shù)據(jù)經(jīng)過一次性采集后便會由檢測專家在軟件的幫助下進(jìn)行分類。
完成相關(guān)圖像集的分類后,下一步是進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,首先圖像集會被劃分為子集,其次在訓(xùn)練過程中,訓(xùn)練數(shù)據(jù)集會被用來形成節(jié)點權(quán)重、層數(shù)等。模型在這一過程中會學(xué)習(xí)圖像特征和模式,最終形成神經(jīng)網(wǎng)絡(luò)的決策。
獨(dú)立統(tǒng)計的測試數(shù)據(jù)集為神經(jīng)網(wǎng)絡(luò)展示了未知的圖像,并檢查了它們的分類和映射保真度,這樣人們最終就會得到一個能夠根據(jù)正確圖像特征做出正確決策的模型。為了確保這一點,系統(tǒng)除了設(shè)定了訓(xùn)練和測試集的分類參數(shù)外,還設(shè)定了許多其他參數(shù),它們共同構(gòu)建了一個高維參數(shù)空間。
InspectifAI 的數(shù)據(jù)專家在系統(tǒng)中還應(yīng)用了多種技術(shù),包括模型訓(xùn)練和深入的模型及數(shù)據(jù)分析技術(shù)。憑借這些技術(shù),人們能夠控制模型的“學(xué)習(xí)”過程,并最終獲得符合制藥行業(yè)監(jiān)管要求的高質(zhì)量模型。同時模型訓(xùn)練技術(shù)還具有能夠保證質(zhì)量的作用,如果在模型訓(xùn)練中出現(xiàn)了錯誤分類的圖像數(shù)據(jù),數(shù)據(jù)專家就會了解由此產(chǎn)生的模型弱點,并可以通過重新分類進(jìn)行補(bǔ)救。模型只有在分類質(zhì)量滿足所有要求,并進(jìn)行版本化后才會上傳至邊緣設(shè)備。
通過由檢測專家主動對圖像進(jìn)行分類,并將這些數(shù)據(jù)記錄并結(jié)合至技術(shù)結(jié)構(gòu)中,人類的知識才能“傳授”給檢測設(shè)備。將人類的知識與機(jī)器學(xué)習(xí)相結(jié)合,可以做出更好的檢測決策、保證更低的誤剔率。
機(jī)器學(xué)習(xí)系統(tǒng)在視覺檢測領(lǐng)域具有巨大的潛力,甚至超出了人們的預(yù)估。它的一個巨大優(yōu)勢是以神經(jīng)網(wǎng)絡(luò)形式“綁定的知識”可以很容易地進(jìn)行轉(zhuǎn)移,這使得神經(jīng)網(wǎng)絡(luò)能夠不受機(jī)器和場所限制,多次使用,這大幅減少了反復(fù)創(chuàng)建模型的工作量。
同時,為特定藥品開發(fā)的神經(jīng)網(wǎng)絡(luò)也可用于其他物理性質(zhì)類似的產(chǎn)品,兩種產(chǎn)品的好/壞定義越相似,效果就越好。只需很少的工作量和圖像就可以通過重復(fù)訓(xùn)練為現(xiàn)有模型提供額外的知識,由此產(chǎn)生的新模型便可以為新產(chǎn)品做出高質(zhì)量的可靠決策。
簡而言之,機(jī)器學(xué)習(xí)能夠為視覺檢測工作帶來巨大的飛躍,配置工作減少、性能大幅提高以及擴(kuò)展?jié)摿薮髢H僅只是它在制藥行業(yè)視覺質(zhì)量控制方面的幾個明顯優(yōu)勢,它的更多潛力還有待人們?nèi)ネ诰颉?/p>