袁彥彥,王興芬,楊 浩
(北京信息科技大學 信息管理學院,北京 100192)
基于關(guān)聯(lián)規(guī)則技術(shù)的肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)及質(zhì)量安全預警模型
袁彥彥,王興芬,楊 浩
(北京信息科技大學 信息管理學院,北京 100192)
針對多種影響冷鏈物流過程食品質(zhì)量安全的因素,結(jié)合關(guān)聯(lián)規(guī)則挖掘技術(shù),提出了一種肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)及質(zhì)量安全預警模型。該模型通過關(guān)聯(lián)規(guī)則技術(shù)首先從肉類食品冷鏈物流數(shù)據(jù)庫中的數(shù)據(jù)發(fā)現(xiàn)食品質(zhì)量安全保障因素,確定權(quán)重后進行了食品質(zhì)量安全預警。實驗結(jié)果表明,該模型能準確發(fā)現(xiàn)肉類冷鏈物流質(zhì)量安全因素以及質(zhì)量安全預警,給管理者提供良好的決策支持,同時有助于加強食品質(zhì)量安全的管理。
肉類食品;冷鏈物流;質(zhì)量安全因素發(fā)現(xiàn);關(guān)聯(lián)規(guī)則技術(shù);質(zhì)量安全預警
在食品安全管理領(lǐng)域,建立食品冷鏈物流跟蹤與追溯體系,是生鮮食品安全的有效保障。目前,國內(nèi)外學者就冷鏈物流管理展開了廣泛的研究。國外學者結(jié)合歐美等發(fā)達國家冷鏈物流的發(fā)展現(xiàn)狀,提出建立高度協(xié)調(diào)的一體化冷鏈物流體系,國內(nèi)學者分析了我國冷鏈物流發(fā)展的特點,指出應完善冷鏈基礎設施,整合冷鏈上下游各環(huán)節(jié),從而實現(xiàn)冷鏈的協(xié)調(diào)控制[1-6]。然而冷鏈物流系統(tǒng)是一類典型的復雜的分布式系統(tǒng),它需要各環(huán)節(jié)之間的高度配合、協(xié)調(diào),而這正是傳統(tǒng)冷鏈物流體系無法實現(xiàn)的,除此之外,各環(huán)節(jié)采集的大量監(jiān)控數(shù)據(jù)沒有得到有效利用,導致大量有價值的信息沒有被發(fā)現(xiàn)[2,5]。
關(guān)聯(lián)規(guī)則挖掘技術(shù)能夠發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系,是數(shù)據(jù)挖掘中的一個重要的課題,被業(yè)界廣泛研究及應用。以往的研究學者在食品質(zhì)量安全方面主要是從宏觀或微觀的角度建立質(zhì)量安全指標體系,然后采用層析分析法、時間序列法等進行質(zhì)量安全預警[8-10],主觀性因素比較大,而本文則旨在充分利用肉類食品冷鏈物流監(jiān)控數(shù)據(jù),采用關(guān)聯(lián)規(guī)則技術(shù)挖掘有價值的信息,建立模型,發(fā)現(xiàn)肉類食品冷鏈物流過程質(zhì)量安全保障因素以及進行質(zhì)量安全預警,這樣發(fā)現(xiàn)的因素更貼合實際的肉類食品安全管理因素,預警效果更能反映實際情況。
挖掘肉類食品冷鏈物流訂單流(如從工廠A到分銷商B)與端到端的聯(lián)系(如運輸模式、產(chǎn)品類型、配送周期等)數(shù)據(jù)庫中記錄了每次配送的所有物流相關(guān)的數(shù)據(jù),如圖1所示:
圖1 冷鏈物流數(shù)據(jù)流
整個冷鏈物流數(shù)據(jù)流包括產(chǎn)品信息(如產(chǎn)品類型、數(shù)量、重量等)和運行信息(如運輸模式、業(yè)務事件時間、所處業(yè)務階段、環(huán)境數(shù)據(jù)等)。通過關(guān)聯(lián)規(guī)則和食品質(zhì)量的限制條件就可以挖掘出某些內(nèi)在聯(lián)系,構(gòu)建基于規(guī)則技術(shù)的肉類食品冷鏈物流質(zhì)量安全保障因素以及質(zhì)量安全預警總體模型,如圖2所示:
圖2 基于關(guān)聯(lián)規(guī)則的肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)及預警模型
該模型主要分為兩步:
第一步:關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)質(zhì)量安全保障因素,并確定權(quán)重。標準的關(guān)聯(lián)規(guī)則由前置條件(如X)和結(jié)果(如Y)組成,表示如下:X->Y(X,Y包含于I,I是一個項目集),在我們的系統(tǒng)中,X就是案例的相關(guān)屬性集合,比如產(chǎn)品數(shù)量、產(chǎn)品重量、產(chǎn)品類型、溫度等,而Y就是質(zhì)量安全保障屬性;而是否是感興趣的規(guī)則由支持度(前置條件和結(jié)果在知識庫中同時發(fā)生的概率)和置信度(條件概率)決定。
支持度(X->Y)=所有包含X、Y案例的數(shù)目/總案例的數(shù)目
置信度(X->Y)=所有包含X、Y案例的數(shù)目/包含X案例的數(shù)目
通過關(guān)聯(lián)規(guī)則挖掘算法得到質(zhì)量保證屬性的權(quán)重:
Wj=Max{置信度(a1->dj),置信度(a2->dj),置信度(a3->dj),…,置信度(am->dj)},即尋找最大關(guān)聯(lián)規(guī)則的過程。比如:(0.95)產(chǎn)品類型->溫度,(0.65)產(chǎn)品數(shù)量->溫度,(0.70)產(chǎn)品重量->溫度,那么溫度的權(quán)重就是0.95。
第二步:質(zhì)量安全預警。
整合第一步中發(fā)現(xiàn)的質(zhì)量安全保障因素,對其各因素的權(quán)重標準化處理:Ni=Wi/(W1+…+Wj)。然后新將案例中各項相應的質(zhì)量安全保障因素屬性值歸一化預處理即為與各因素的權(quán)值進行加權(quán)計算,得質(zhì)量安全預警值Y,并將結(jié)果發(fā)送給相關(guān)管理人員,根據(jù)預警信息,案例檢索異常事件處理源案例庫,尋找相似度最大的異常事件所對應的異常處理策略或行為,為相關(guān)管理人員決策提供支持。
在第一步尋找規(guī)則的過程中,采用的是Apriori算法,該算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法[7]。算法使用頻繁項集性質(zhì)的先驗知識,首先找出頻繁1-項集的集合,記作L1。L1用于找頻繁2-項集的集合L2,而L2用于找L3,如此下去,直到不能找到頻繁k-項集。
為了提高頻繁項目集逐層產(chǎn)生的效率,Apriori算法利用了兩個重要的性質(zhì)用于壓縮搜索空間:
(1)若X是頻繁項集,則x的所有子集都是頻繁項集。
(2)若x是非頻繁項集,則X的所有超集都是非頻繁項集。
Apriori核心算法分析
算法:Apriori算法,使用逐層迭代找出頻繁項集。
輸入:事務數(shù)據(jù)庫D;最小支持度閾值min_sup。
輸出:D中的頻繁項集L。
算法描述:
L1={large1-itemsets};
for(k=2;Lk-1≠?;k++)do begin
Ck=apriori-gen(Lk-1);//新的候選集
for all transactions t∈D do begin
Ct=subset(Ck,t);//事務t中包含的候選集
for all candidates c∈Ct do
c.count++;
end
Lk={c∈Ck|c.count≥minsup}
end
Answer=∪kLk;
首先產(chǎn)生頻繁1-項集L1,然后是頻繁2-項集L2,直到有某個r值使得Lr為空,這時算法停止。在第k次循環(huán)中,過程先產(chǎn)生候選k-項集的集合Ck,Ck中的每一個項集是對兩個只有一個項不同的屬于Lk-1的頻集做一個(k-2)-連接來產(chǎn)生的。Ck中的項集是用來產(chǎn)生頻集的候選集,最后的頻集Lk必須是Ck的一個子集。
頻繁1-項集可以是食品的溫度、濕度、微生物含量以及冷鏈運輸時間等。
通過關(guān)聯(lián)規(guī)則技術(shù),從大量的已經(jīng)采集的質(zhì)量安全信息挖掘出有價值的信息,比如某類產(chǎn)品安全運輸?shù)臏囟葪l件、濕度條件、微生物含量等,這樣就能給管理者提供決策支持,從而間接實現(xiàn)對冷鏈質(zhì)量安全的提前預防。
本文涉及的肉類食品冷鏈物流數(shù)據(jù)是來源于某肉類食品冷鏈物流追溯系統(tǒng)(CCQSM)的溯源數(shù)據(jù)庫中的數(shù)據(jù),包括了肉類食品冷鏈物流過程中運輸、配送、倉儲所產(chǎn)生的相關(guān)數(shù)據(jù),抽取、清洗所需要的數(shù)據(jù),得到產(chǎn)品從產(chǎn)地到達目的地所包含的部分數(shù)據(jù)記錄,見表1。
表1 原始數(shù)據(jù)表
根據(jù)本文所建立的模型,挖掘感興趣的規(guī)則,最后根據(jù)挖掘的規(guī)則進行整合尋找保證食品冷鏈物流質(zhì)量安全的因素,并向食品冷鏈物流相關(guān)管理者提供質(zhì)量安全保障的決策支持。具體操作如下:
4.1 發(fā)現(xiàn)食品冷鏈物流中感興趣的規(guī)則
根據(jù)表1,我們先將數(shù)據(jù)表中的某些字段值進行定性化。通過觀察數(shù)據(jù),將根據(jù)臨界值進行定性處理,見表2。
表2 字段屬性值離散化
根據(jù)表2,將表1的數(shù)據(jù)處理后得到表3所示的數(shù)據(jù)定性表:
然后,采用Weka軟件連接MySQL數(shù)據(jù)庫,直接獲取數(shù)據(jù)庫中的預處理數(shù)據(jù),然后對產(chǎn)品重量、產(chǎn)品數(shù)量、平均溫度、微生物含量、重金屬含量、運輸時間進行基于Apriori算法的多維關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)肉類食品冷鏈物流質(zhì)量安全保障因素。取最小支持度=0.2,最小置信度=0.9,最大規(guī)則數(shù)=500,實驗進行了16輪的搜索,產(chǎn)生11個頻繁1項集和184條關(guān)聯(lián)規(guī)則。選取置信度最大的部分關(guān)聯(lián)規(guī)則,見表4。
那么滿足條件的且可以作為此肉類食品冷鏈物流的質(zhì)量安全保障因素只有溫度、重金屬含量、微生物含量和運輸時間,而產(chǎn)品重量和產(chǎn)品數(shù)量作為規(guī)則的后件,其相關(guān)規(guī)則的置信度不滿足條件,不包含在所發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則中。另外,通過查看整理國家食品藥品監(jiān)管總局公布的2015年第1-3期食品安全監(jiān)督抽檢結(jié)果,造成肉類食品出現(xiàn)質(zhì)量安全問題的主要因素見表5。
表3 數(shù)據(jù)定性表
表4 關(guān)聯(lián)規(guī)則
表5 國家食品安全監(jiān)督抽檢結(jié)果統(tǒng)計(2015:1-3)
這些因素與本文所發(fā)現(xiàn)的因素(微生物含量、重金屬含量)相對應,說明本文采用關(guān)聯(lián)規(guī)則技術(shù)來發(fā)現(xiàn)肉類食品冷鏈物流質(zhì)量安全保障因素是可行的。這些因素中,重金屬含量是不可逆的,如果超標,產(chǎn)品就需要被召回;運輸時間會影響銷售商或分銷商對產(chǎn)品的滿意度,時間的長短又與運輸配送路徑有關(guān),如果運輸配送過程中出現(xiàn)路徑異常,延長了時間,除增加額外的成本外,還會使得其他因素出現(xiàn)異常,比如微生物的含量、溫度異常等,進而增加食品變質(zhì)的風險;微生物含量直接影響產(chǎn)品的品質(zhì),并且一般肉類產(chǎn)品的腐敗變質(zhì)都與微生物存在很大的關(guān)系;溫度的波動影響微生物含量的變化,溫控不當會使得食品的腐爛變質(zhì)加快,間接影響著食品的品質(zhì)。所以加強對這些內(nèi)在因素的安全控制,可以使得肉類食品的質(zhì)量安全得以保障。
根據(jù)前面模型步驟一所述,確定這些質(zhì)量安全保障因素對應的權(quán)重,并將進行標準化處理,見表6。
表6 因素權(quán)重及標準化
從表6可以看出因素權(quán)重的大小,說明肉類產(chǎn)品質(zhì)量安全各保障因素重要性程度,可以根據(jù)重要程度對食品的質(zhì)量安全進行重點防控。
4.2 質(zhì)量安全預警
在進行上述分析后,確定了肉類食品冷鏈物流質(zhì)量安全保障因素,以及它們相應的權(quán)重值,接下來進行食品的質(zhì)量安全預警:
(1)歸一化。由表2中的劃分標準,將本文數(shù)據(jù)中的微生物含量、溫度值按下式進行歸一化處理:
時間因素、重金屬含量的歸一化處理:根據(jù)運輸距離和以往的運輸經(jīng)驗史,當產(chǎn)品在規(guī)定時間之內(nèi)送達,則為0;超過規(guī)定時間,則為1。因為重金屬含量是食品安全中重要因素之一,一旦超標,那么產(chǎn)品就需要處理掉或者召回[6],當其含量在標準范圍內(nèi)即不超過0.03,為0,超出標準范圍即為異常狀態(tài)為1。
(2)預警計算。當接收到新案例后,將案例中各因素的值進行歸一化處理后,求質(zhì)量安全預警值隨機選取數(shù)據(jù)庫中的5條原始數(shù)據(jù),包含異常數(shù)據(jù)和正常數(shù)據(jù),計算每條數(shù)據(jù)的質(zhì)量安全預警值,結(jié)果見表7。
表7 風險預警結(jié)果
表8 異常事件處理源案例
表7中結(jié)果分為兩種情況:如果預警值為0,說明未出現(xiàn)任何異常;若果預警值為大于0,說明出現(xiàn)異常,需要向相關(guān)人員進行預警,這樣相關(guān)人員針對異常數(shù)據(jù),通過案例檢索CCQSM系統(tǒng)中的異常事件處理源案例庫,為其決策提供支持,表8所示為異常處理源案例:
通過計算出該異常事件與案例庫中所有事件的相似度[6],選擇相似度最大的異常案例所對應的策略或者行為。例如當新案例出現(xiàn)異常:溫度、微生物出現(xiàn)異常,根據(jù)檢索相似度最大的異常事件所對應的策略,相關(guān)人員可以檢查冷藏車制冷器,及時將溫度調(diào)整到正常范圍;運輸時間超時,則通知車主,檢測運輸路徑是否正確等。這樣,一方面可以保障肉類食品冷鏈物流的質(zhì)量安全,另一方面可以規(guī)范冷鏈物流操作,加強安全管理。
本文分析了冷鏈物流過程的數(shù)據(jù)流,提出基于關(guān)聯(lián)規(guī)則技術(shù)的肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)以及質(zhì)量安全預警模型,該模型分為兩步,第一步是關(guān)聯(lián)規(guī)則挖掘,通過關(guān)聯(lián)規(guī)則算法Apriori發(fā)現(xiàn)冷鏈質(zhì)量安全保障因素,并確定權(quán)重;第二步質(zhì)量安全預警,預警之后相關(guān)人員可以案例檢索系統(tǒng)中的異常事件處理源案例庫,尋找相似度最大的相似案例,為其決策提供支持。最后通過實證研究表明該模型能有效發(fā)現(xiàn)肉類食品冷鏈質(zhì)量安全保障因素以及預警,給管理者提供決策支持,達到有效加強食品質(zhì)量安全管理的目的。
[1]Ting S L,TseY K,HoGTS,et al.Mining logistics data to assure the quality in a sustainable food supply chain:A case in the red wine industry[J]. International Journal of Production Economics,2014,(6):200-209.
[2]張智勇,劉承,楊磊.基于MAS的冷鏈物流系統(tǒng)協(xié)調(diào)機制研究[J].食品工業(yè)科技,2010,(5):387-389.
[3]朱劍鋒.基于多Agent的供應鏈協(xié)同信息系統(tǒng)研究[J].中國商貿(mào),2013, (32).
[4]Kang Y S,Lee Y H.Development of generic RFID traceability services[J]. Computers in Industry,2013,64(5):609-623.
[5]Yu X.A research about the tracing technology and system designing of food cold chain[A].Artificial Intelligence,Management Science and Electronic Commerce(AIMSEC)[C].2011.
[6]楊浩,王興芬,莫立民.基于多Agent的食品冷鏈物流質(zhì)量安全管理模型[J].物流技術(shù),2015,34(1):137-140.
[7]Anekritmongkol,Somboon.The comparative of Boolean Algebra compress and Apriori rule techniques for new theoretic association rule mining model[J].International Journal of Advancements in Computing Technology,2011,(3):58-67.
[8]李鵬,章力建.綠色食品質(zhì)量安全預警體系構(gòu)建研究[J].中國農(nóng)業(yè)資源與區(qū)劃,2013,34(5):92-94.
[9]安珺.基于層次分析法的乳品質(zhì)量安全預警系統(tǒng)研究[D].哈爾濱:東北農(nóng)業(yè)大學,2012.
[10]許世衛(wèi).畜產(chǎn)品質(zhì)量安全預警研究[D].北京:中國農(nóng)業(yè)科學院, 2008.
Quality and Safety Supporting Factor Discovery and Forewarning Model of Meat Product Cold Chain Logistics Based on Association Rule Mining Technology
Yuan Yanyan,Wang Xingfen,Yang Hao
(School of Information Management,Beijing Information&Technology University,Beijing 100192,China)
In this paper,in view of the multiple factors influencing the food quality in the cold chain logistics process and in connection with the association rule mining technology,we proposed a quality and safety supporting factor discovery and forewarning model for a type of meat product cold chain logistics system,then elaborated on the working mechanism of the model,and at the end,in connection with a numerical case,demonstrated the validity of the model.
meat food;cold chain logistics;quality and safety factor discovery;association rule technology;quality and safety forewarning
F762;F253.9
A
1005-152X(2015)11-0182-04
10.3969/j.issn.1005-152X.2015.11.049
2015-08-16
北京市教委科技重點項目“電子商務平臺交易糾紛規(guī)避的若干支撐技術(shù)研究”(KZ201411232036)
袁彥彥(1988-),女,山東人,北京信息科技大學信息管理學院碩士研究生,研究方向:物流工程;王興芬(1968-),女,教授,博士,研究方向:物流管理、電子商務與WEB安全;楊浩(1989-),男,湖南岳陽人,北京信息科技大學信息管理學院碩士研究生,研究方向:物流工程。