范志文, 光翠娥*, 干建平
(1. 食品科學(xué)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,江南大學(xué),江蘇 無(wú)錫214122;2. 黃岡師范學(xué)院 經(jīng)濟(jì)林木種質(zhì)改良與資源綜合利用湖北省重點(diǎn)實(shí)驗(yàn)室/大別山特色資源開發(fā)湖北省協(xié)同創(chuàng)新中心,湖北 黃岡438000)
醬牛肉是我國(guó)歷史悠久的佳肴, 因色澤鮮嫩、味道鮮美,營(yíng)養(yǎng)價(jià)值高而深受人們喜愛。 醬牛肉的制作大多采用傳統(tǒng)手工制作, 導(dǎo)致醬牛肉在生產(chǎn)、加工、運(yùn)輸、銷售過(guò)程中極易被食源性病原菌污染,從而引發(fā)食品安全問(wèn)題,給消費(fèi)者的健康帶來(lái)不可估量的安全隱患。 金黃色葡萄球菌廣泛存在于自然界中,是造成細(xì)菌性食物中毒的主要原因,極易造成食品污染[1]。 曹軍等[2]人對(duì)無(wú)錫市場(chǎng)的醬鹵肉進(jìn)行監(jiān)測(cè),1186 件熟制品中有61 件檢出金黃色葡萄球菌,檢出率高達(dá)5.14%;許振偉等[3]人對(duì)上海市場(chǎng)所監(jiān)測(cè)的396 份散裝熟食肉制品進(jìn)行金黃色葡萄球菌及腸毒素分析,樣品中金黃色葡萄球菌陽(yáng)性數(shù)70份檢出率為17.70%;2015年在三門峽市監(jiān)測(cè)的60份網(wǎng)店食品中,30 份自制熟肉中金黃色葡萄球菌3份,檢出率為10.00%[4]。由此可見醬鹵肉制品中金黃色葡萄球菌的污染比較嚴(yán)重。
預(yù)測(cè)微生物學(xué)是運(yùn)用微生物學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)及計(jì)算機(jī)學(xué)建立數(shù)學(xué)模型,用數(shù)學(xué)語(yǔ)言預(yù)測(cè)和描述食源性微生物在特定環(huán)境條件下的生長(zhǎng)和死亡規(guī)律的學(xué)科[5-6]。由Whiting 等[7]提出的基于變量類型的分類方法將預(yù)測(cè)微生物數(shù)學(xué)模型分為一級(jí)模型、二級(jí)模型和三級(jí)模型,其中一級(jí)模型描述了微生物數(shù)量與時(shí)間的函數(shù)關(guān)系。在眾多初級(jí)模型中,Gompertz方程能有效描述微生物生長(zhǎng),在腐敗細(xì)菌生長(zhǎng)動(dòng)力學(xué)研究中被廣泛使用[8-11]。但由于模型中的參數(shù)是憑經(jīng)驗(yàn)建立并無(wú)實(shí)際意義,使得模型在復(fù)雜的環(huán)境因子中很難確切地進(jìn)行預(yù)測(cè)[12-13]。
人工神經(jīng)網(wǎng)絡(luò)是模擬大腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,將多個(gè)處理單元相互連接,進(jìn)行自組織、自適應(yīng)、自學(xué)習(xí),從而模擬人類的學(xué)習(xí)、認(rèn)知、智能的過(guò)程[14]。 誤差反向傳播神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前饋網(wǎng)絡(luò),它采用典型的有教師學(xué)習(xí)方式來(lái)進(jìn)行預(yù)測(cè)和分類問(wèn)題的處理。 一個(gè)訓(xùn)練好的反向傳播神經(jīng)網(wǎng)絡(luò),能夠逼近任何自變量和因變量之間的函數(shù)關(guān)系[15]。 不需要考慮自變量是否滿足正態(tài)性及變量間獨(dú)立等條件, 可識(shí)別變量間復(fù)雜的非線性關(guān)系,尤其是用現(xiàn)有統(tǒng)計(jì)方法無(wú)法達(dá)到目的或效果不好時(shí),采用此模型往往收到很好的效果[16-17]。 作者將預(yù)測(cè)微生物學(xué)應(yīng)用到醬牛肉制品中,利用人工神經(jīng)網(wǎng)絡(luò)建立模型, 揭示金黃色葡萄球菌的生長(zhǎng)變化規(guī)律, 為醬牛肉中的金黃色葡萄球菌控制提供依據(jù),從而降低食源性疾病發(fā)生的可能性。
金黃色葡萄球菌:(CMCC26003): 北納創(chuàng)聯(lián)生物技術(shù)有限公司產(chǎn)品; 醬牛肉: 市售;Baird-Parker平板、亞碲酸鉀卵黃菌增液:上海谷研實(shí)業(yè)有限公司產(chǎn)品。
CHP-80 培養(yǎng)箱: 上海市三發(fā)科學(xué)儀器有限公司產(chǎn)品;DSX-280B 手提式壓力蒸汽滅菌器:上海申安醫(yī)療器械廠產(chǎn)品;GZX-9070 MBE 電熱鼓風(fēng)干燥箱:上海博訊實(shí)業(yè)有限公司醫(yī)療設(shè)備廠產(chǎn)品;SF-CJ-1A凈化工作臺(tái):上海三發(fā)科學(xué)儀器有限公司產(chǎn)品。
1.3.1 菌種的活化和醬牛肉的預(yù)處理在無(wú)菌條件下將于4 ℃冷藏的凍干菌粉去除標(biāo)簽,用體積分?jǐn)?shù)75%乙醇擦拭管壁,將0.3 mL 左右無(wú)菌水注入凍干管中,吹打,充分溶解成菌懸液。取0.2 mL 菌懸液加入50 mL 的滅菌營(yíng)養(yǎng)肉湯在36 ℃下培養(yǎng)48 h,然后進(jìn)行平板劃線分離置于36 ℃培養(yǎng)箱中培養(yǎng),傳代2次。
醬牛肉的預(yù)處理:將醬牛肉除去筋骨,分割成約1 cm3的小塊,置于培養(yǎng)皿中,每份10 g,滅菌,用無(wú)菌封口膜密封培養(yǎng)皿貯藏待用。
1.3.2 不同溫度下生長(zhǎng)曲線的測(cè)定挑取一環(huán)金黃色葡萄球菌菌落,浸入裝有10 mL 滅菌生理鹽水試管中振蕩, 制成濃度為107~108CFU/mL 的菌懸液。 用生理鹽水稀釋菌懸液,制成染菌濃度分別為102、103、104CFU/mL 的菌懸液, 取不同接種濃度的菌液1 mL 勻噴灑在處理好的醬牛肉中, 分別置于15、25、36 ℃下培養(yǎng)。 其中36 ℃下2 h 取樣測(cè)量一次,25 ℃下3 h 取樣一次,15 ℃下12 h 取樣一次。每次10 g 樣品置于裝有90 mL 無(wú)菌生理鹽水的錐形瓶中振蕩,依次進(jìn)行10 倍稀釋。 選取2個(gè)稀釋度適宜的樣品, 每次吸取2個(gè)100 μL 樣品加入Baird-Parker 平板中,用涂布棒涂布[18]。 倒置于36 ℃培養(yǎng)箱中培養(yǎng)24~48 h。
1.3.3 反向傳播神經(jīng)網(wǎng)絡(luò)的建立反向傳播神經(jīng)網(wǎng)絡(luò)是一種基于在誤差面上尋找最小誤差原理設(shè)計(jì)的算法,它通過(guò)激活函數(shù)產(chǎn)生輸出信號(hào),據(jù)定義的損失函數(shù)計(jì)算真實(shí)值和預(yù)測(cè)值之間的誤差來(lái)進(jìn)行權(quán)值的修正[19]。 第一層為輸入層,含有3個(gè)神經(jīng)元,分別代表溫度、接菌量及保存時(shí)間;第二層為隱含層, 用于處理輸入信息與輸出結(jié)果的非線性關(guān)系;第三層為輸出層,含有一個(gè)神經(jīng)節(jié)點(diǎn),代表輸入層設(shè)定條件下的細(xì)菌量。
1) 訓(xùn)練集的選取 反向傳播神經(jīng)網(wǎng)絡(luò)在使用前對(duì)它進(jìn)行訓(xùn)練,根據(jù)訓(xùn)練數(shù)據(jù)調(diào)整神經(jīng)網(wǎng)絡(luò)中的權(quán)值矩陣,直到迭代一定的次數(shù)后停止學(xué)習(xí)。對(duì)于1個(gè)參數(shù),至少要10個(gè)以上訓(xùn)練樣本,訓(xùn)練集太小,無(wú)法被網(wǎng)絡(luò)學(xué)習(xí)[20]。 本實(shí)驗(yàn)3個(gè)參數(shù)有117個(gè)樣本滿足要求。 在輸入前將樣本隨機(jī)打亂,并按照8∶8∶1的比例隨機(jī)分配到訓(xùn)練、測(cè)試和驗(yàn)證集中。
2) 數(shù)據(jù)歸一化 不同評(píng)價(jià)指標(biāo)的量綱常處于不同的數(shù)量級(jí), 為消除特征數(shù)據(jù)之間的量綱影響,引入歸一化。 原始數(shù)據(jù)經(jīng)歸一化處理后,各指標(biāo)處于同一數(shù)量級(jí),范圍在0~1 內(nèi)。 計(jì)算如公式(1):
式中:t' 為歸一化數(shù)值;t 為實(shí)際測(cè)定值;tmin為實(shí)際測(cè)定中最小的一組數(shù)值;tmax為實(shí)際測(cè)定中最大的一組數(shù)值。
3) 隱藏層個(gè)數(shù)和神經(jīng)元節(jié)點(diǎn)數(shù)的確定 隱藏層結(jié)點(diǎn)數(shù)取決于輸入、輸出的非線性程度,節(jié)點(diǎn)數(shù)如過(guò)多會(huì)導(dǎo)致過(guò)擬合現(xiàn)象,降低模型的準(zhǔn)確性。 根據(jù)樣本容量選擇隱藏層數(shù)測(cè)試范圍為1~3,其中,隱藏層個(gè)數(shù)為1 時(shí),第一層神經(jīng)元個(gè)數(shù)為10~30,步長(zhǎng)為2,共15個(gè)網(wǎng)絡(luò)模型;隱藏層為2 時(shí),第一層神經(jīng)元個(gè)數(shù)為20~40,第二層神經(jīng)元為10~35,步長(zhǎng)為5,共30個(gè)網(wǎng)絡(luò)模型;隱藏層為3 時(shí),第一層、第二層神經(jīng)元個(gè)數(shù)分別為20~35,第三層神經(jīng)元為10~25,步長(zhǎng)為5,共64個(gè)網(wǎng)絡(luò)模型。 比較驗(yàn)證集上均方誤差(MSE) 的大小來(lái)確定隱藏層個(gè)數(shù)和神經(jīng)元節(jié)點(diǎn)數(shù),每個(gè)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行3次平行測(cè)試,結(jié)果取平均值。
4) 模型參數(shù)的確定 利用Python 軟件建立反向傳播神經(jīng)網(wǎng)絡(luò)。 為防止反向更新時(shí)梯度消失,采用Relu 為網(wǎng)絡(luò)結(jié)構(gòu)隱藏層的激活函數(shù),歸一化的結(jié)果在0~1 之間, 輸出層的激活函數(shù)采用Sigmoid,Dropout 概率為0.5,學(xué)習(xí)率為0.001,每一輪迭代次數(shù)為1500, 每5個(gè)樣本更新一次梯度。 其中公式(2)為Relu 函數(shù),公式(3)為Sigmoid 激活函數(shù):
式中:x 為神經(jīng)元單元的輸出值。
1.3.4 修正的Gompertz 模型的建立利用Matlab軟件分析不同溫度和初始接菌量下金黃色葡萄球菌在醬牛肉中的生長(zhǎng)數(shù)據(jù),建立生長(zhǎng)模型。 修正的Gompertz 模型被廣泛應(yīng)用于擬合微生物量與時(shí)間之間的關(guān)系。 修正的Gompertz 模型[21]如公式(4):
式中:lg(Nt)為t 時(shí)刻細(xì)菌的對(duì)數(shù)值;lg(N0)為初始細(xì)菌的對(duì)數(shù)值;lg(Nmax)為穩(wěn)定期時(shí)最大細(xì)菌數(shù)的對(duì)數(shù)值;tlog為延滯期;μmax為最大比生長(zhǎng)速率。
1.3.5 模型的評(píng)估與驗(yàn)證采用MSE、平方根誤差(RMSE)、偏差因子(Bf)和準(zhǔn)確因子(Af)來(lái)評(píng)價(jià)模型的可靠性。 其中:
式中:pre 為用模型擬合出的生長(zhǎng)數(shù)據(jù),即預(yù)測(cè)值;obs 為實(shí)際實(shí)驗(yàn)中所測(cè)的數(shù)據(jù)值,即實(shí)際值;n 為樣本數(shù)量。
MSE 評(píng)價(jià)數(shù)據(jù)變化程度,值越小,說(shuō)明模型擬合實(shí)驗(yàn)數(shù)據(jù)的能力強(qiáng);RMSE 衡量預(yù)測(cè)準(zhǔn)確度,說(shuō)明模型預(yù)測(cè)值的離散程度;Af衡量預(yù)測(cè)值和實(shí)際值之間的接近程度,Af>1, 越接近于1 表示模型越準(zhǔn)確;Bf表示預(yù)測(cè)值和實(shí)際值之間的偏差,Bf>1,說(shuō)明預(yù)測(cè)值偏高,Bf<1,說(shuō)明預(yù)測(cè)值偏低。
人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,為獲得最優(yōu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),需確定隱含層的層數(shù)和神經(jīng)元節(jié)點(diǎn)數(shù)。 依次將訓(xùn)練數(shù)據(jù)代入隱含層為1~3、節(jié)點(diǎn)數(shù)為10 到35 的不同的隱藏層網(wǎng)絡(luò)中,選擇驗(yàn)證集上MSE 最小時(shí)的節(jié)點(diǎn)數(shù)作為最優(yōu)結(jié)構(gòu)。隱 藏 層 數(shù)1、2、3 分 別 對(duì) 應(yīng) 的MSE 值 為0.0120、0.0026、0.0029,由此可知當(dāng)隱藏層數(shù)為2 時(shí),MSE值最小, 預(yù)測(cè)效果優(yōu)于隱藏層數(shù)為1 和3 的模型,故確定該模型的隱藏層數(shù)為2。從表1 可看出,當(dāng)?shù)谝粚印?第二層神經(jīng)元節(jié)點(diǎn)分別為35、30 時(shí),MSE 值最小,模型預(yù)測(cè)效果最好。 因此最終的反向傳播網(wǎng)絡(luò)模型結(jié)構(gòu)為2-35-30,網(wǎng)絡(luò)模型結(jié)構(gòu)見圖1。
表1 不同神經(jīng)元個(gè)數(shù)的MSE 值Table1 MSE value of different neurons
圖1 預(yù)測(cè)醬牛肉中金黃色葡萄球菌生長(zhǎng)的人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig. 1 Artificial neural network structure for predicting the growth of Staphylococcus aureus in sauce beef
圖2 為不同溫度(15、25、36℃)和初始菌數(shù)(102、103、104CFU/mL) 組合條件下金黃色葡萄球菌在醬牛肉中生長(zhǎng)的一級(jí)模型和人工神經(jīng)網(wǎng)絡(luò)模型擬合曲線。 可以看出,隨著培養(yǎng)時(shí)間的延長(zhǎng),金黃色葡萄球菌的濃度也隨之增加,且遵循S 形曲線,培養(yǎng)一定時(shí)間后金黃色葡萄球菌的生長(zhǎng)都趨于穩(wěn)定。 以修正的Gompertz 模型為基礎(chǔ),得到組合條件下醬牛肉中金黃色葡萄球菌的生長(zhǎng)動(dòng)力學(xué)參數(shù)最大比生長(zhǎng)速率μmax和延滯期tlag,如表2 所示。而神經(jīng)網(wǎng)絡(luò)沒(méi)有確定的函數(shù)表達(dá)式,無(wú)法得到μmax和tlag的值,只能從圖中直觀表現(xiàn)出細(xì)菌的生長(zhǎng)狀態(tài)。 從表2 可以看出,同一初始接菌量條件下,隨著溫度升高,μmax逐漸增大,15 ℃(0.0524、0.0231、0.0137 h-1)<25 ℃(0.3591、0.2449、0.1488 h-1)<36 ℃(0.4895、0.4459、0.2958 h-1),而延滯期tlag的大小隨著溫度上升呈現(xiàn)下降趨勢(shì),15 ℃(49.67、47.74、46.62 h)>25 ℃(8.5894、7.5110、7.2930 h)>36 ℃(6.4820、6.2551、5.2020 h)這說(shuō)明溫度越高金黃色葡萄球菌的生長(zhǎng)速度越快,延滯期越短;同一溫度條件下,最大生長(zhǎng)速率和延滯期均隨著初始接菌量濃度的增加而降低,但變動(dòng)的幅度小于不同溫度組合條件下的最大生長(zhǎng)速率和延滯期的數(shù)值,這說(shuō)明不同溫度和初始接菌量濃度均影響了醬牛肉中的金黃色葡萄球菌的生長(zhǎng),但溫度的影響更大。
圖2 不同溫度和初始接菌量條件下金黃色葡萄球的生長(zhǎng)Fig. 2 Growth of Staphylococcus aureus under different temperatures and initial inoculation conditions
2.3.1 模型評(píng)估在利用訓(xùn)練數(shù)據(jù)建模的過(guò)程中,傳統(tǒng)模型和人工神經(jīng)網(wǎng)絡(luò)模型都獲得較好的擬合度,RMSE、Af及Bf均在理想范圍。 與人工神經(jīng)網(wǎng)絡(luò)模型相比,傳統(tǒng)模型偏差較大,由表3 可以看出,反向傳播神經(jīng)網(wǎng)絡(luò)模型的RMSE 值均比傳統(tǒng)模型的RMSE 值小,這些在Af及Bf上也表現(xiàn)出來(lái),反向傳播神經(jīng)網(wǎng)絡(luò)模型與修正的Gompertz 模型的Af均大于1 且反向傳播神經(jīng)網(wǎng)絡(luò)模型的Af相比更接近1,說(shuō)明前者預(yù)測(cè)的更接近實(shí)際值; 從得到的Bf值看出,反向傳播神經(jīng)網(wǎng)絡(luò)模型與修正的Gompertz 模型的預(yù)測(cè)值均在真實(shí)值附近上下波動(dòng), 由修正的Gompertz 模型得到的預(yù)測(cè)值比實(shí)際值偏小,由反向傳播神經(jīng)網(wǎng)絡(luò)模型得到的預(yù)測(cè)值偏差更小,說(shuō)明該模型的預(yù)測(cè)效果較修正的Gmopertz 模型更好。
2.3.2 模型驗(yàn)證結(jié)合在22、29 ℃條件下獲得的實(shí)驗(yàn)數(shù)據(jù),對(duì)建立的反向傳播神經(jīng)網(wǎng)絡(luò)模型進(jìn)一步驗(yàn)證其準(zhǔn)確性,結(jié)果如表4 所示。 從表中可以看出,驗(yàn)證值與預(yù)測(cè)值的誤差均在可接受范圍,說(shuō)明建立的反向傳播神經(jīng)網(wǎng)絡(luò)模型可預(yù)測(cè)金黃色葡萄球菌在醬牛肉中的生長(zhǎng)。
表2 修正的Gompertz 模型擬合得到的金黃色葡萄球菌生長(zhǎng)參數(shù)Table 2 Growth parameters of Staphylococcus aureus obtained by modified Gompertz model
作者建立的預(yù)測(cè)模型適合預(yù)測(cè)多種環(huán)境條件下金黃色葡萄球菌在醬牛肉中的生長(zhǎng)情況。 在預(yù)測(cè)準(zhǔn)確性方面, 反向傳播神經(jīng)網(wǎng)絡(luò)優(yōu)于修正的Gompertz 模型。這是因?yàn)樾拚腉ompertz 模型是經(jīng)驗(yàn)?zāi)P停?通常需要進(jìn)行校準(zhǔn)避免誤差的不確定性,當(dāng)影響金黃色葡萄球菌的生長(zhǎng)因素增多時(shí),傳統(tǒng)模型會(huì)變得復(fù)雜,準(zhǔn)確率也會(huì)降低,因此很難準(zhǔn)確地反映環(huán)境因素對(duì)生長(zhǎng)預(yù)測(cè)的影響。 雖然反向傳播神經(jīng)網(wǎng)絡(luò)模型無(wú)法給出最大比生長(zhǎng)速率和延滯期,但該模型在存在不確定數(shù)據(jù)和測(cè)量誤差的情況下,會(huì)比經(jīng)驗(yàn)?zāi)P彤a(chǎn)生更準(zhǔn)確地預(yù)測(cè)。 在通用性方面,修正的Gompertz 模型局限性很大,多個(gè)影響因素需要多次建模,而反向傳播神經(jīng)網(wǎng)絡(luò)只需要在模型的輸入值中添加所研究的影響因素即可實(shí)現(xiàn)預(yù)測(cè),大大提高了模型的適用性。 由于醬牛肉的生產(chǎn)、運(yùn)輸、銷售過(guò)程中溫度并非一成不變,在以后的研究中可以考慮在波動(dòng)溫度條件下運(yùn)用人工神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)更加精確的預(yù)測(cè)。
表3 修正的Gompertz 模型與反向傳播神經(jīng)網(wǎng)絡(luò)比較與評(píng)價(jià)Table 3 Comparisonand assessment of modified Gompertz model with back propagation neural network
表4 反向傳播神經(jīng)網(wǎng)絡(luò)模型驗(yàn)證的擬合度指標(biāo)Table 4 Goodness of fit of verified back propagation neural network models