梁川 曹樂
(1、華潤江中制藥集團有限責任公司,江西 南昌330096 2、上海工程技術大學,上海201620)
中醫(yī)藥行業(yè)是我國生物醫(yī)學業(yè)的重要組成部分,推動醫(yī)藥新行業(yè)創(chuàng)新升級迫在眉睫,其在我國經(jīng)濟和社會發(fā)展的全局中有著重要的地位,近年來國家大力扶持中藥產(chǎn)業(yè),特別是中藥現(xiàn)代化戰(zhàn)略的實施,使得我國中醫(yī)藥產(chǎn)業(yè)在知識創(chuàng)新、藥品創(chuàng)新和技術創(chuàng)新等方面取得了長足的進步。國家老齡化的不斷加深的背景下,國民對中藥的需求越來越大,中醫(yī)藥大健康行業(yè)將成21 世紀最有發(fā)展活力的產(chǎn)業(yè)[1]。但是目前我國中藥現(xiàn)代化仍處于初級階段,中藥理論雖然先進,但技術落后,尤其是在中藥生產(chǎn)領域,少部分中藥生產(chǎn)線從國外引進,國產(chǎn)化水平較低且設備難以及時更新?lián)Q代,品質(zhì)把控要求低,大部分生產(chǎn)線是實現(xiàn)了機械化或半機械化,自動化水平偏低[2]。本文針對中藥包衣制粒機設備,提出了基于物聯(lián)網(wǎng)與大數(shù)據(jù)分析的智能中藥設備健康監(jiān)測方法。該方法是通過在中藥包衣制粒機設備上定點安裝多種傳感器采集設備運行數(shù)據(jù)和建立LSTM故障預測模型對中藥設備進行健康預測,傳感器安裝部位是通過對設備機理的研究,安裝于設備的故障發(fā)生后有狀態(tài)變化明顯的部位[3]。傳感器實時采集的數(shù)據(jù)通過無線通訊方式將數(shù)據(jù)遠程至大數(shù)據(jù)平臺,并以數(shù)據(jù)驅(qū)動為主的機器學習算法對數(shù)據(jù)進行預處理、故障實時預測,可有效在故障發(fā)生前期實現(xiàn)故障的預測,進一步提高設備安全運行的可靠度,有效減少故障所導致的經(jīng)濟損失和維修難度,對中藥設備智能化設計與實現(xiàn)具有重要作用。
圖1 系統(tǒng)組成部分結(jié)構圖
數(shù)據(jù)采集模塊主要對中藥生產(chǎn)設備進行數(shù)據(jù)采集,通過物聯(lián)網(wǎng)技術實現(xiàn)對中藥工業(yè)設備數(shù)據(jù)進行上傳與保存,如要實現(xiàn)對生產(chǎn)設備運行狀態(tài)進行診斷與預測,就涉及到對采集的大數(shù)據(jù)進行綜合的分析。故障預測與健康管理(PHM)技術,其主要特點是使用多種傳感器設備采集大量設備全壽命運行數(shù)據(jù)并利用機器學習構建數(shù)學或物理模型等智能算法實現(xiàn)對系統(tǒng)或設備在發(fā)生故障前進行故障預測,并通過建立模型解決問題[4]。
智能中藥設備健康監(jiān)測系統(tǒng)結(jié)構如圖1 所示,其硬件設備包括4G 無線數(shù)據(jù)發(fā)送模塊(DTU)、模擬量采集模塊、電壓電流振動等傳感器和阿里云服務器等。系統(tǒng)每個模塊的具體功能如下:
a.DTU 收發(fā)模塊:通過485 接口實現(xiàn)數(shù)據(jù)接收,通過DTU 模塊處理后通過SIM7600CE 模塊將數(shù)據(jù)通過基站上傳。
b.數(shù)據(jù)采集模塊:主要包括各類傳感器及傳感器供電設備,通過交流轉(zhuǎn)直流模塊給傳感器供電,傳感器采集設備運行實時數(shù)據(jù)。
c.數(shù)據(jù)處理模塊:通過該模塊將傳感器的數(shù)據(jù)進行預處理,轉(zhuǎn)換成4-20mA 的模擬量數(shù)據(jù),方便DTU 模塊的數(shù)據(jù)處理及上傳。
d.數(shù)據(jù)存儲模塊:主要包括阿里云服務器,通過阿里云服務器的ECS(阿里云服務器)處理后將數(shù)據(jù)收發(fā)至RDS 數(shù)據(jù)庫進行存儲,方便后續(xù)數(shù)據(jù)的調(diào)用及處理。
故障預測是通過對當前中藥設備當前狀態(tài)數(shù)據(jù)以及歷史大數(shù)據(jù)來研判設備或系統(tǒng)出現(xiàn)潛在故障的可能性。目前設備故障預測主要分為三大類:基于數(shù)據(jù)驅(qū)動的預測方法、基于物理模型的預測方法和混合預測方法。不同模型的方法與其優(yōu)缺點分別為:
2.1.1 物理預測模型是在對系統(tǒng)的物理特性有充分的了解下構建的一種描述該物理特性的失效模型,介于對系統(tǒng)物理特性的了解,該模型具有較高的精確度,主要應用在零部件剩余壽命預測、軸承等裂紋位置及損傷程度、設備疲勞壽命預測等,但對于復雜設備,要想構建起精確度高精確描述其物理特性的模型是十分困難的。
2.1.2 數(shù)據(jù)驅(qū)動預測模型是基于大數(shù)據(jù)采集與分析而直接建模來表現(xiàn)設備或零件損傷過程的模型,不需要考慮具有復雜物理特性的數(shù)學模型,根據(jù)采集的設備實時狀態(tài)數(shù)據(jù)預測涉筆健康狀況,是一種可用于神經(jīng)網(wǎng)絡的智能模型,通常設計一種融合機制將不同模型組合起來提高預測精度。其優(yōu)點是過程簡單,不需花費大量時間構建模型,可通過各種預測方法實現(xiàn)各方法之間的優(yōu)劣互補,準確率高。
2.1.3 混合預測模型主要用于復雜系統(tǒng)的故障診斷預測,是一種非迭代的解卷積方法,將物理或數(shù)據(jù)驅(qū)動模型進行一定程度的融合,實現(xiàn)對設備故障的預測,由于具體參數(shù)需要根據(jù)具體采集的信號確定,不同的模型之間差距較大,所耗費的時間和集約計算成本均不同,這也導致混合模型發(fā)展緩慢的重要因素。
本文采用了數(shù)據(jù)驅(qū)動預測模型來對中藥設備的健康情況進行預測,與物理預測模型相比,該模型不需要構建具有復雜物理特性的數(shù)學模型,模型易構建且耗時短。且隨著基于物聯(lián)網(wǎng)和大數(shù)據(jù)的不斷發(fā)展,可滿足數(shù)據(jù)驅(qū)動模型建立所需的大量的數(shù)據(jù)支撐[5]。本文采用了長短期記憶人工神經(jīng)網(wǎng)(LSTM)模型的方法進行了中藥設備的健康預測。
圖2 LSTM 網(wǎng)絡中長期狀態(tài)C 的控制
圖3 基于LSTM 模型的部分數(shù)據(jù)預測效果
長短期記憶人工神經(jīng)網(wǎng)絡(Long Short-Term Memory),是一種RNN 網(wǎng)絡中能夠?qū)W習長期依賴的特殊的類型,LSTM 有通過精心設計的稱作為“門”的結(jié)構,是一種時間序列自我調(diào)用神經(jīng)網(wǎng)絡模型,主要應用在延遲較長模型或時間序列的中間間隔的預測模型。LSTM 與RNN 具有相似的形式,即具有鏈式形式的重復神經(jīng)網(wǎng)絡模塊,以一種特殊的形式交互,但LSTM 不同的是重復模塊中具有一個不同的結(jié)構,即所謂的“門”結(jié)構。LSTM 可以增加或刪除神經(jīng)元狀態(tài)中的信息,門限包含一個sigmoid 神經(jīng)網(wǎng)絡層和一個逐點相乘器乘法,信息通過門限時被選擇性通過[6]。LSTM 擁有輸入門、遺忘門和輸出門三個門,來保護和控制神經(jīng)元細胞狀態(tài)信息[7]。根據(jù)算法規(guī)則判定當信息進入LSTM 時,該信息是否有用,循環(huán)結(jié)構之間保持一個持久單元狀態(tài)不斷傳遞下去,當信息滿足算法規(guī)則時則被保留,反之遺忘[8]。LSTM 中的第一步是通過一個被稱為遺忘門的門來決定哪些信息應該被神經(jīng)元細胞遺忘,該門讀取前一個隱藏狀態(tài)和當前輸入,每個神經(jīng)元狀態(tài)輸出0 或1,“1”表示保留,“0”表示遺忘。下一步包含兩個部分,第一,確定要更新的數(shù)值,這一步由sigmoid 層完成,由其計算哪些值更重要并傳遞給tanh 層,sigmoid 層又被稱為輸入門層。第二,tanh 層生成一個新的候選值向量加入到神經(jīng)元狀態(tài)中參與后續(xù)運算[9]。最后,確定輸出值。sigmoid 層來確定細胞狀態(tài)的哪個部分將輸出出去,接著細胞狀態(tài)通過tanh 層進行處理,得到一個在-1 到1 之間的值,并將它和sigmoid 門的輸出相乘,組合這兩步生成一個更新狀態(tài)值,這樣僅僅會輸出確定輸出的那部分[10]。
由于設備在運行中并未發(fā)生故障,采集到的數(shù)據(jù)全部都是正常數(shù)據(jù),本文只計算其準確率,公式如下:
TP:實際是正例,預測為正例
FP:實際為負例,預測為正例
TN:實際為負例,預測為負例
FN:實際為正例,預測為負例
計算得到準確率PRE=96.54%[11]。
選取部分數(shù)據(jù)對LSTM 進行模型訓練和預測,其中訓練數(shù)據(jù)的數(shù)量為40,測試數(shù)據(jù)的數(shù)量為40,設置最多迭代250 次,設置梯度閾值位1,可有效防止梯度爆炸。設置初始學習率為0.005,經(jīng)過125輪次訓練后通過乘以因子0.2 可降低學習率。如圖3 所示為少量數(shù)據(jù)預測和實際的結(jié)果圖。LSTM 預測模型的均方根誤差(RMSE)為4.5764。模型預測的效果如圖4 所示,其訓練集是前90%的數(shù)據(jù),測試集是后10%的數(shù)據(jù),對RMSE 的分布圖分析可知,隨著預測時間的增長,誤差會逐漸增大。而此時平均RMSE 為4.1827,相較于對少量數(shù)據(jù)的預測,誤差會明顯降低,說明訓練集的數(shù)量對模型訓練的準確度有一定的影響。
圖4 基于LSTM 模型的預測效果
故障預測技術是一門交叉性學科,近年來在航天、化工、石油和冶金等領域發(fā)揮著越來越重要的作用。本文根據(jù)流化床制粒包衣機的工作特點,通過使用傳感器采集設備運行的振動數(shù)據(jù),根據(jù)此數(shù)據(jù)分析設備的運行狀態(tài),在此基礎上建立中藥設備LSTM 健康預測模型,實現(xiàn)故障預測。LSTM 預測模型的準確率,對準確率的影響因素(訓練集,預測時間)訓練數(shù)據(jù)量為40,測試數(shù)據(jù)量為40 時,LSTM 預測模型的均方根誤差為4.5764,且訓練集的數(shù)量對模型訓練的準確度有一定的影響,研究結(jié)果表明,基于物聯(lián)網(wǎng)和LSTM 的中藥設備故障預測系統(tǒng)具有較高的精確度和較快的處理速度,能夠及時的判斷出可能發(fā)生的故障,提前做好備品備件管理,最大程度的降低企業(yè)的損失,加上算法本身的高魯棒性,可以將此系統(tǒng)推廣到其他的設備上,為全過程監(jiān)測生產(chǎn)情況和工業(yè)系統(tǒng)互聯(lián)互通提供了新的思路。