周妍 張然 楊斌
(銅陵學院,安徽銅陵244000)
一種基于數(shù)據(jù)挖掘的面條品質(zhì)綜合評價方法
周妍 張然 楊斌
(銅陵學院,安徽銅陵244000)
為了準確評價面條品質(zhì),文章以46種不同品牌的市售面條為材料,通過實驗采集面條樣本的力學性能數(shù)據(jù)和其他屬性數(shù)據(jù),對構建的數(shù)據(jù)集進行主成分分析,并借助其結果進行聚類分析,樣本最終被劃分成5個類,對面條樣本進行感官評價。參考感官評價的指標再對每一個簇中的樣本進行評價,描述出每個簇中面條樣本的品質(zhì)特性。該方法融合了多種數(shù)據(jù)分析和評價方法,既具備數(shù)據(jù)分析的客觀性,又不失主觀評價的優(yōu)勢。
評價方法;面條品質(zhì);聚類分析;感官評價;主成分分析
面條是我國傳統(tǒng)的主食面制品,對其品質(zhì)進行有效的評價很有必要,而評價方法的選取則是其中的關鍵問題。目前國內(nèi)外對面條品質(zhì)的評價尚未建立嚴格統(tǒng)一的標準,專門的研究并不多見,很多關于面條的評價方法大都借鑒了通心粉的評價方法[1-4]。多年來,國內(nèi)外有關專家學者一直致力于研究客觀鑒定面條品質(zhì)的方法[5-8]。這些方法大致可分為感官評價方法(主觀評價)、儀器測量評價(客觀方法)以及它們相結合的方法。感官評價結果主觀性強,而且往往在信息交流、定量表達、科學再現(xiàn)性等方面難以滿足食品工業(yè)化生產(chǎn)的要求。但另一方面,評價員憑借該領域的專業(yè)知識和大量經(jīng)驗,對評價結果做出判斷,這是儀器無法做到的。特別是在嗜好評價方面,目前其地位是任何儀器檢測也無法取代的。因此,感官評價方法常作為校對其他化學和儀器測量評價的參考標準,以感官評價結果為主要依據(jù),可以為其他評價方法的可行性與可靠性提供一定的依據(jù)。
對于儀器測量評價,利用質(zhì)構儀進行評價是其主要手段,此方法在我國也取得了一定的進展。該方法操作簡單,再現(xiàn)性較高,評價時需要根據(jù)不同的物性要求設計模型,屬于傳統(tǒng)的手工建模方法。但是采用儀器測定面條的性質(zhì)較難,且有很多難以發(fā)現(xiàn)的因素無法綜合考慮,精度和敏感性在某些情況下還不如感官檢測[9]。也有學者從食品的單一特性或指標研究它們與面條品質(zhì)的關系[10-14],其操作過程比較繁瑣。
綜上所述,儀器測量評價操作簡單易行,可再現(xiàn)性高,但是在食品嗜好等方面無法取代感官分析。本文將數(shù)據(jù)挖掘方法納入到面條品質(zhì)評價方法中,以儀器測量的各種數(shù)據(jù)為基礎,采用數(shù)據(jù)挖掘算法進行數(shù)據(jù)處理和分析,并結合感官評價的結果,充分利用評價員的經(jīng)驗知識修正評價結果,從而得到對面條品質(zhì)客觀、有效的評價。
試驗材料為市面購置各種品牌面條共46種,具體名稱見表1。
1.2.1 力學性能數(shù)據(jù)的測量
對于每一種面條樣本,取干面條20根放入恒溫水浴鍋中,煮至最佳煮制時間[15],立刻將面條撈出,置于漏網(wǎng)容器中,用自來水沖淋3秒鐘。
將煮制好的面條裝夾在便攜式食品力學性能檢測儀(安徽農(nóng)業(yè)大學研制)上,對其進行拉伸、剪切操作,在PC機上采集得到的拉力、剪切力變化情況以及面條被拉斷、剪斷時的數(shù)據(jù)。把最大值作為拉力、剪切力的測量值,并予以記錄。
1.2.2 物理屬性數(shù)據(jù)和其他環(huán)境數(shù)據(jù)的測量
物理屬性數(shù)據(jù)包括面條樣本如下屬性:(1)橫截面尺寸。對于圓形截面的面條,用卡尺測量其直徑;對于矩形截面的面條,用卡尺測量其寬度和厚度。(2)延伸度。將煮制好的面條進行拉伸處理,記錄原始長度和剛剛斷裂時的長度,計算其延伸度。(3)糊化時間。記錄面條樣本煮至糊化的時間。另外,其他環(huán)境數(shù)據(jù)包括各個面條樣本是否含鹽以及是否有添加成分,可以通過面條的外包裝獲得。
1.2.3 感官評價
感官評價參照國家企業(yè)標準SB/T10068-92,分別從色澤(10分)、表觀狀態(tài)(10分)、適口性(20分)、韌性(25分)、粘性(25分)、光滑性(5分)、食味(5分)共7個方面對面條樣本進行打分。評價小組由5名評價員組成。面條樣本各項指標的得分為5個評價員打分的平均值,總分為各項指標得分之和。由于在感官評價方法中對不同的質(zhì)地剖面設定的分值有差別,實際上,感觀評價的總得分就是面條樣本各個質(zhì)地剖面的加權平均總得分。感官評價得分越高,說明該樣本的筋道感、韌性及口感等食用品質(zhì)越好。
1.2.4 統(tǒng)計分析
將上述各測量指標作為屬性組成面條樣本模式:面條名稱(拉力最大值,剪切力最大值,直徑,寬度,厚度,是否含鹽,延伸度,糊化時間)。面條名稱和各屬性具體的值共同組成了面條樣本數(shù)據(jù)。
對每個屬性的值進行歸一化處理,以消除量綱的影響,即把每個面條樣本看作超空間中的一個點。
通過主成分分析、聚類分析對面條品質(zhì)進行分析,并對其結果進行綜合評價。
(1)主成分分析
利用SPSS軟件對46個面條樣本進行主成分分析,計算出主成分表達式如下:
其中A1~A8對應于面條樣本模式中的8個屬性,即拉力最大值,剪切力最大值,直徑,寬度,厚度,是否含鹽,延伸度,糊化時間。由上述公式可計算出46種面條品質(zhì)的主成分得分,利用Z=0.51807Z1+0.18974Z2+0.14222Z3得到各種試樣面條品質(zhì)的主成分總得分(表1)。
(2)聚類分析
用k-means算法對數(shù)據(jù)集進行聚類分析,利用PCA的結果指導初始聚類個數(shù)k。從主成分得分(表1)可以看出,同一系列的面條品質(zhì)較相近,不同品牌,特別是不同系列的面條品質(zhì)有較大的差異,因此可將這些樣本大致分為5類,故取k=5。然后以PCA劃分出的五個類中樣本的均值作為初始聚類中心。
為了方便起見,將主成分得分、感官評價得分和聚類分析的結果列在同一個表內(nèi)(表1)。樣本按照其主成分得分由低到高的順序排列,并按此順序進行編號??紤]得到評價結果可能對面條生產(chǎn)企業(yè)產(chǎn)生不可預知的影響,故將各面條樣本名稱中的品牌部分略去。
圖1 聚類結果
表1 樣本及主成分得分、感官評價總得分和簇
從表1中可以看出,感官評價的得分和主成分分析的得分基本一致;聚類結果中,每個類中樣本的感官評價得分也相近。這說明聚類的結果是有意義的模式,同一個類中的樣本具有相似性,可以從中提取有價值的信息。因此,由參與感官評價的專業(yè)人員對聚類結果進行評價,即描述出同一類面條樣本的品質(zhì)特征,結果如下:
第一類:營養(yǎng)面條,筋道感、韌性、彈性一般,口感好。因為該類面條中多數(shù)添加了鹽和其他物質(zhì),如雞蛋、綠豆等,以改善其口感,而恰恰削弱了面條的筋道感。
第二類:精加工干白面條,筋道感、韌性、彈性好,口感一般。該類面條大都模仿了手工面條的特點,制作工藝注重提高面條的筋道感等品質(zhì)。但是延伸度和糊化時間這兩個指標略低于第三類,因此影響了其口感。
第三類:優(yōu)質(zhì)干白面條,筋道感、韌性、彈性較好,口感滑爽。該類面條大都是干白面條,在制作工藝上也模仿了手工面條的特點,這些手工工藝對其力學性能指標有直接的貢獻。
第四類:營養(yǎng)面條,筋道感、韌性、彈性較差,口感一般。該類面條樣本中大部分添加了雜糧、雞蛋等添加物,且面條的較細,因此其力學性能指標,如拉力、剪切力,大大被削弱,延伸度、糊化時間也明顯受到了影響。
第五類:優(yōu)等面條,筋道感、韌性、彈性好,口感好??紤]到該類面條的制作工藝有異于其他類別,其各項指標均很好,屬于食用品質(zhì)最好的一類。
步驟一:構造數(shù)據(jù)集。通過實驗采集面條樣本的屬性數(shù)據(jù),包括力學性能屬性和其他屬性并對采集的原始數(shù)據(jù)進行適當?shù)念A處理,便于數(shù)據(jù)分析。對面條樣本各屬性的采集應盡可能準確,必要的時候,可以采用適當?shù)臄?shù)據(jù)預處理算法處理原始數(shù)據(jù)集。
步驟二:主成分分析。對數(shù)據(jù)集進行主成分分析,根據(jù)得分得到面條樣本的大致分類,用于指導k-means算法的初始參數(shù)k。主成分分析可以利用成熟的軟件輔助計算(本文即采用SPSS軟件),如果主成分分析的得分對于指導k存在模糊,可以嘗試取多個k值進行試驗。
步驟三:聚類分析。對數(shù)據(jù)集進行聚類分析,收集聚類結果。
步驟四:感官評價。對面條樣本進行針對質(zhì)地剖面的感官測定與分析。感官評價指標的選取要盡可能直接反映面條的品質(zhì)特征,以便于下一步的評價。
步驟五:形成最終評價結果。對每一個聚類簇中的樣本進行評價,評價的過程參考感官評價的指標,描述出每個簇中面條樣本的品質(zhì)特性。評價結果要精練,既要能準確描述出面條樣本的品質(zhì)特征,又要利于相關人員閱讀理解。
從表1中可以看出,聚類分析的結果和主成分得分、感官評價得分基本一致。具體表現(xiàn)在:主成分得分和感官評價的得分基本一致;屬于同一個聚簇中的樣本的主成分得分和感官評價得分也相近。
但是,有個別樣本,如14號、16號、39號樣本,雖然主成分得分和感官評價得分與序號相鄰的樣本相近,但卻被聚類分析劃分到了不同的類別。k-means算法根據(jù)數(shù)據(jù)集進行處理,得到的是隱含在數(shù)據(jù)集中的信息,這些信息往往是難以通過普通方法得到的。得分相近卻最終被劃分到不同的聚簇中,這一現(xiàn)象恰恰說明了主成分分析和感官評價方法中可能存在的某些不客觀、不合理的問題,這也正是使用數(shù)據(jù)挖掘算法的優(yōu)勢和目的所在。
若單獨使用主成分分析方法進行評價,數(shù)據(jù)處理的過程較簡單,而且有成熟的軟件可以使用。但主成分分析是通過對屬性集中“主要成分”的線性組合,從而達到降維、壓縮的目的,在這個過程中原始數(shù)據(jù)中隱含的信息會有損耗。鑒于該特性,會導致最終結果和實際情況有一定的偏差。但由于其得分是根據(jù)數(shù)據(jù)的“主要成分”得到的,因此也具有指導意義,可以通過PCA的得分得到樣本大致的分類。
若單獨使用k-means算法實現(xiàn)也很簡單。聚類結果對于一般人(或機器)來說,可能難以有效地提取出簇中有價值的信息,但對于專業(yè)人士或業(yè)務知識豐富的人員,憑借他們豐富的專業(yè)知識和大量的實踐經(jīng)驗,可以迅速理解聚類結果的含義。k-means算法的關鍵問題是初始聚類個數(shù)k的設定問題??梢酝ㄟ^PCA的結果予以指導k的取值。與PCA類似,聚類也是建立在面條樣本的力學性能數(shù)據(jù)及其他環(huán)境數(shù)據(jù)的基礎之上,這些數(shù)據(jù)無法顯式地描述與面條樣本品質(zhì)特征相關的指標(如韌性),例如通過數(shù)據(jù)直接反映出與韌性相關的屬性,或得到韌性和某些屬性之間的函數(shù)關系。因此給最終的評價過程帶來了困難。
若單獨使用感官分析方法,如前所述,主觀性較強,評價過程易受干擾。但由于其評價的指標與面條樣本的品質(zhì)特征較接近,因此可以利用感官評價中得分高的或權重高的指標直接形成最終的評價,比較方便和簡單。
綜上所述,以上各種評價方法各有優(yōu)缺點,單獨使用均存在缺陷。而本文提出的方法以聚類分析為核心,利用主成分分析指導初始聚類個數(shù),結合感官評價的指標和結果,對每一個聚簇中的樣本進行評價,從而形成面條品質(zhì)的最終評價。
本文提出的面條品質(zhì)綜合評價方法有一定的實用價值,如對于某一種面條,可以根據(jù)其評價結果,突出其品質(zhì)特征,制定相應的生產(chǎn)、宣傳和營銷策略。但如何從聚類的結果中提取面條品質(zhì)的形式化描述(例如物理屬性和評價得分之間的函數(shù)關系),用于指導面條的生產(chǎn),將是下一步將要研究的問題。
[1]Matuso R R,Irvine GN.spaghetti tenderness testing apparatus[J].Cereal Chem,1969,46:1-6.
[2]Dexter J E.Grain reseach laboratory compression tester,Instrumentral measurement of cooked spaghetti stickiness[J].Cereal Chem,1983,60:139-142.
[3]Oh N H,Seib P A,Deyoe C M,et al.Noodles I.Measuring the texture characteristics of cooked noodles[J].Cereal Chem,1983,60(6):433-438.
[4]遠山良·種谷真一.Relationship between sensory evaluation and tensipressor analysis of reimen(Korean noodle)[J].日本食品科學工學會志,1999,46(3):155-164.
[5]李夢琴,張劍,馮志強,等.面條品質(zhì)評價指標及評價方法的研究[J].麥類作物學報,2007,27(4):625-629.
[6]張艷,閻俊,H.Yashida,等.中國面條的標準化實驗室制作與評價方法研究[J].麥類作物學報,2007,27(1):158-165.
[7]雷激,劉仲齊.面條品質(zhì)評價方法研究[J].中國食品學報,2003,3(4):21-26.
[8]王靈昭,陸啟玉,袁傳光.用質(zhì)構儀評價面條質(zhì)地品質(zhì)的研究[J].鄭州工程學院學報.2003.24(3):29-33.
[9]屠康,姜松,朱文學.食品物性學[M].南京:東南大學出版社,2006,137-139.
[10]劉建軍,何中虎,趙振東,等.小麥品質(zhì)性狀與干白面條品質(zhì)參數(shù)關系的研究[J].作物學報,2002,28(6):738-743.
[11]宋建民,劉建,等.濟麥19面團流變學和淀粉特性與面條品質(zhì)分析[J].麥類作物學報,2004,24(1):15-17.
[12]楊秀改,陸啟玉,尹壽偉.面筋蛋白與面條品質(zhì)關系研究[J].糧食與油脂,2005,26(5):26-28.
[13]雷昌貴,盧大新,陳錦平.小麥蛋白質(zhì)的特性與面條品質(zhì)[J].食品與藥品,2006,8(6):27-30.
[14]雷激,劉仲齊,秦文.蛋白質(zhì)、淀粉、硬度和色澤與小麥面條品質(zhì)的關系[J].西南農(nóng)業(yè)學報,2003,16(4):122-125.
[15]師俊玲.蛋白質(zhì)和淀粉對掛面及方便面品質(zhì)影響機理研究[D].楊凌:西北農(nóng)林科技大學,2001.
An Integrated Evaluation Approach of Noodles Quality Based on Data Mining
Zhou Yan,Zhang Ran,Yang Bin
(Tongling University,Tongling Anhui 244000,China)
To evaluate the noodles quality accurately,an integrated evaluation approach of noodles quality based on data mining was proposed in this paper.The dataset was composed of noodles mechanical performance data and other attribute data through experiment by using 46 different noodles in various brands as material.Principle Component Analysis(PCA)was used on this dataset.Than clustering analysis was used on this dataset based on PCA’s result.At last,dataset was divided into 5 clusters.Sense evaluation was used on noodles samples at the same time.Than the quality character of each cluster was described by evaluating noodles samples in each cluster referred to sense evaluate indexes.This approach integrated several data analysis methods and evaluation approaches,which not only had objectivity in data analysis,but also had advantage in sense evaluation.
evaluation method;noodles quality;clustering analysis;sense evaluation;principle component analysis
TP311
A
1672-0547(2011)01-0086-03
2010-08-11
周妍(1979-),女,安徽銅陵人,銅陵學院機械工程系講師,碩士,研究方向:數(shù)據(jù)分析與處理;張然(1981-),男,安徽銅陵人,銅陵學院數(shù)學與計算機科學系講師,碩士,研究方向:群體智能,數(shù)據(jù)挖掘。
安徽省高校自然科學研究項目《融合智能算法的面條品質(zhì)評價方法研究》(編號:KJ2010B233),安徽省高校自然科學研究項目《結合群體智能的混合文化算法研究》(編號:KJ2010B234)成果。