謝艷云(重慶水利電力職業(yè)技術(shù)學(xué)院,重慶402160)
?
基于大數(shù)據(jù)分析的茶葉質(zhì)量評(píng)估
謝艷云
(重慶水利電力職業(yè)技術(shù)學(xué)院,重慶402160)
摘要:隨著網(wǎng)絡(luò)技術(shù)的不斷成熟,數(shù)據(jù)信息變得更加龐大,大數(shù)據(jù)的應(yīng)用范圍越來(lái)越廣闊。茶葉的數(shù)據(jù)信息包含茶葉種植面積、氣候、濕度、質(zhì)量等多方面信息,通過(guò)大數(shù)據(jù)分析技術(shù),可以更加精準(zhǔn)地了解茶葉的各項(xiàng)信息。本文主要探討大數(shù)據(jù)分析在茶葉質(zhì)量評(píng)估方面的應(yīng)用技術(shù)。
關(guān)鍵詞:茶葉;質(zhì)量評(píng)估;大數(shù)據(jù);數(shù)據(jù)分析
中國(guó)的茶葉已有幾千年的發(fā)展歷史,由茶葉開(kāi)發(fā)出來(lái)的產(chǎn)品種類(lèi)豐富多樣。我國(guó)是世界上最大的茶葉生產(chǎn)國(guó)和消費(fèi)國(guó),茶葉種植區(qū)域廣闊,從南到北,從東到西已有20個(gè)省市區(qū)有種植。我國(guó)產(chǎn)有紅茶、烏龍茶、黑茶、白茶、綠茶、黃茶等六大茶類(lèi),受地理環(huán)境、氣候等的影響,不同茶類(lèi)、不同茶葉產(chǎn)品的質(zhì)量千差萬(wàn)別。影響茶葉質(zhì)量的因素很多,包括種植區(qū)的氣候環(huán)境、土壤、采摘及后期加工等。為了保障茶葉質(zhì)量安全,傳統(tǒng)的方法有現(xiàn)場(chǎng)采樣和現(xiàn)場(chǎng)檢測(cè),該檢驗(yàn)方法消耗大量的人力物力,但反饋的信息量少;隨著技術(shù)的不斷發(fā)展,先后衍生出化學(xué)檢驗(yàn)法、指紋圖譜檢驗(yàn)法等新的檢驗(yàn)鑒別方法,但這些檢驗(yàn)方法無(wú)一不是針對(duì)成片特定的茶葉進(jìn)行的檢驗(yàn),信息量也非常有限;以大數(shù)據(jù)平臺(tái)來(lái)分析茶葉質(zhì)量已經(jīng)逐漸進(jìn)入人們的視線(xiàn),通過(guò)互聯(lián)網(wǎng)技術(shù),將茶葉從種植、生長(zhǎng)氣候環(huán)境、病蟲(chóng)害、土壤成分、采摘及加工等全方位信息進(jìn)行數(shù)據(jù)信息化并進(jìn)行分析,可以很好地把控并保障茶葉質(zhì)量。
隨著信息技術(shù)的快速發(fā)展,針對(duì)大數(shù)據(jù)的研究越來(lái)越多,對(duì)于大數(shù)據(jù)的定義也不盡相同,麥肯錫全球研究所指出大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面都大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類(lèi)型和價(jià)值密度低四大特征。百度百科認(rèn)為大數(shù)據(jù)是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。美國(guó)政府認(rèn)為一個(gè)國(guó)家擁有數(shù)據(jù)的規(guī)模和運(yùn)用數(shù)據(jù)的能力是構(gòu)成綜合國(guó)力的重要組成部分。隨著政府和企業(yè)對(duì)大數(shù)據(jù)發(fā)展和應(yīng)用的關(guān)注度越來(lái)越高,國(guó)內(nèi)外學(xué)者對(duì)大數(shù)據(jù)也進(jìn)行了大量研究,格雷布林克認(rèn)為大數(shù)據(jù)具有多樣性、大量性、高速性三大特點(diǎn),布萊恩·霍普金斯認(rèn)為除了該三個(gè)特點(diǎn)外,還具有易變性等特點(diǎn);國(guó)內(nèi)學(xué)者劉念真認(rèn)為大數(shù)據(jù)除了以上特點(diǎn)外,還具有真實(shí)性的特點(diǎn),即大數(shù)據(jù)有五大特點(diǎn)?,F(xiàn)實(shí)社會(huì)中對(duì)大數(shù)據(jù)的應(yīng)用也越來(lái)越多,美國(guó)最大的西奈山醫(yī)療中心使用Ayasdi大數(shù)據(jù)公司的技術(shù)來(lái)分析大腸桿菌的全部基因序列及其菌株對(duì)抗生素的抗藥性。與國(guó)外相比,國(guó)內(nèi)大數(shù)據(jù)的研究和應(yīng)用還處在起步階段,2012年6月中國(guó)計(jì)算機(jī)科技論壇舉辦了“大數(shù)據(jù)時(shí)代,智謀未來(lái)”學(xué)術(shù)報(bào)告會(huì),對(duì)大數(shù)據(jù)平臺(tái)開(kāi)發(fā)、數(shù)據(jù)挖掘、體系理論框架以及數(shù)據(jù)安全等進(jìn)行了討論。國(guó)內(nèi)企業(yè)對(duì)大數(shù)據(jù)也越來(lái)越重視,阿里巴巴集團(tuán)提供的云計(jì)算服務(wù),百度提供的百度云等,通過(guò)對(duì)大數(shù)據(jù)平臺(tái)對(duì)數(shù)據(jù)進(jìn)行預(yù)分析和預(yù)處理,讓大數(shù)據(jù)處理更便捷、更快速、更貼近用戶(hù),而且更容易實(shí)現(xiàn)和操作。
大數(shù)據(jù)具有信息規(guī)模大、數(shù)據(jù)種類(lèi)繁多、流動(dòng)速度快及價(jià)值密度低等特征。信息規(guī)模大表現(xiàn)在數(shù)據(jù)規(guī)模已經(jīng)不能用G 或T來(lái)衡量,數(shù)據(jù)的計(jì)量單位從PB到EB再到ZB,高度發(fā)達(dá)的互聯(lián)網(wǎng)技術(shù),以及存儲(chǔ)數(shù)據(jù)的電腦、手機(jī)、U盤(pán)等工具的不斷普及,都在不斷適應(yīng)數(shù)據(jù)信息快速增長(zhǎng)的步伐,國(guó)際數(shù)據(jù)公司的研究指出,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,到了2011年已經(jīng)達(dá)到了1.8ZB。數(shù)據(jù)種類(lèi)的多樣性,表現(xiàn)在數(shù)據(jù)不僅包括以文本資料為主的結(jié)構(gòu)化數(shù)據(jù),還包括音頻、視頻、圖片等半結(jié)構(gòu)或非半結(jié)構(gòu)化的數(shù)據(jù)信息,隨著人們對(duì)數(shù)據(jù)信息的要求層次越來(lái)越高,而且數(shù)據(jù)信息處理技術(shù)也不再是難題,數(shù)據(jù)信息也就更加具有多樣性。流動(dòng)速度快表現(xiàn)在信息處理能力方面,人們對(duì)數(shù)據(jù)信息具有實(shí)時(shí)性的要求,但是數(shù)據(jù)信息量規(guī)模龐大,需要在短時(shí)間內(nèi)從海量信息中提取到有價(jià)值的信息,這對(duì)數(shù)據(jù)處理技術(shù)要求很高。價(jià)值密度低指數(shù)據(jù)的價(jià)值具有稀缺性、不確定性和多樣性,大數(shù)據(jù)中包含了人們生產(chǎn)、消費(fèi)以及心理活動(dòng)等各方面有價(jià)值的信息,但是數(shù)據(jù)規(guī)模的量非常巨大,而且數(shù)據(jù)信息不斷更新變動(dòng),這些有價(jià)值的信息就可能轉(zhuǎn)瞬即逝,一般而言,數(shù)據(jù)的價(jià)值密度高低與數(shù)據(jù)規(guī)模大小成反比,數(shù)據(jù)規(guī)模越大,則數(shù)據(jù)價(jià)值密度越低,反之則越高。
茶葉是我國(guó)重要的經(jīng)濟(jì)作物,產(chǎn)量豐富而且品質(zhì)揚(yáng)名海內(nèi)外市場(chǎng),茶葉不同于其他農(nóng)作物,需要經(jīng)過(guò)種植生長(zhǎng)過(guò)程和加工過(guò)程,茶葉采摘以后,只有經(jīng)過(guò)加工以后才能成為商品,加工過(guò)程同樣也是茶葉增值的一個(gè)過(guò)程。茶葉的生長(zhǎng)過(guò)程和加工過(guò)程都關(guān)系到茶葉品質(zhì)的高低、質(zhì)量的好壞,下面分別就這兩個(gè)過(guò)程進(jìn)行論述。
3.1 茶葉種植生長(zhǎng)過(guò)程中影響茶葉質(zhì)量的因素
茶葉在生長(zhǎng)環(huán)節(jié)內(nèi)影響茶葉質(zhì)量的因素有三方面:產(chǎn)地環(huán)境、農(nóng)資使用和采摘標(biāo)準(zhǔn)。產(chǎn)地環(huán)境的好壞又細(xì)分為溫度、濕度、土壤鹽堿度等多方面,茶園周邊空氣質(zhì)量,土壤中重金屬含量、PH值高低都將直接影響到茶葉中鉛的含量,茶葉中重金屬超標(biāo)將直接影響茶葉的質(zhì)量。農(nóng)資使用標(biāo)準(zhǔn)是指農(nóng)藥、化肥等在茶葉中的殘留,農(nóng)藥噴灑過(guò)量、化肥使用過(guò)量、激素不正當(dāng)使用等都將影響到茶葉的原料質(zhì)量。采摘是在茶葉生長(zhǎng)過(guò)程中進(jìn)行的,采摘的標(biāo)準(zhǔn)不同也同樣影響茶葉中重金屬含量,采摘的原料過(guò)老,甚至夾入老葉或修剪枝葉,會(huì)導(dǎo)致茶葉中氟含量過(guò)高,名優(yōu)茶采摘夾帶鱗片、成熟葉,同樣會(huì)導(dǎo)致茶葉中鉛、汞等重金屬超標(biāo)。
3.2 茶葉加工過(guò)程中影響茶葉質(zhì)量的因素
加工過(guò)程中影響茶葉質(zhì)量的因素分三個(gè)方面:首先,我國(guó)茶葉市場(chǎng)上的茶葉加工企業(yè)一般為中小企業(yè)或是家庭作坊,茶葉加工工序不統(tǒng)一,管理水平和硬件條件良莠不齊,生產(chǎn)、加工、包裝、儲(chǔ)藏及運(yùn)輸過(guò)程中存在被污染的風(fēng)險(xiǎn),而且難以形成有效的監(jiān)管。其次,茶葉加工過(guò)程中存在二次污染,由于茶葉加工鏈條比較長(zhǎng),加工過(guò)程中如果沒(méi)有規(guī)范的流程標(biāo)準(zhǔn)和質(zhì)量監(jiān)督,就會(huì)容易受到灰塵以及機(jī)器的污染,而灰塵中含有鉛等重金屬,機(jī)器則包含銅、鋁、鎳等重金屬,此外,還有加工人員的衛(wèi)生狀況、燃煤使用過(guò)程等都會(huì)引起硫、磷等污染。最后,茶葉包裝過(guò)程中的包裝材料的不達(dá)標(biāo)也會(huì)影響茶葉的質(zhì)量,包裝材料包含油墨、粘合劑、工業(yè)塑料等,如果這些包裝沒(méi)有按照國(guó)家要求的標(biāo)準(zhǔn)進(jìn)行生產(chǎn),那么包裝本身就是有害的,不僅對(duì)茶葉造成了三次污染,還影響了茶葉的色香味等品相。
在國(guó)內(nèi)市場(chǎng)上,茶葉質(zhì)量安全事件時(shí)有發(fā)生,茶葉質(zhì)量安全隱患一直都存在!要保障茶葉市場(chǎng)中的茶葉質(zhì)量,國(guó)家需要在規(guī)范茶葉市場(chǎng)的同時(shí),加強(qiáng)對(duì)茶葉質(zhì)量的監(jiān)督,不斷運(yùn)用最新技術(shù)來(lái)加強(qiáng)對(duì)茶葉質(zhì)量的檢測(cè),只有保障了茶葉衛(wèi)生質(zhì)量才能保障茶葉市場(chǎng)的健康發(fā)展。
隨著互聯(lián)網(wǎng)、云計(jì)算和物聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)信息規(guī)模不斷的膨脹,要處理的數(shù)據(jù)信息種類(lèi)也越來(lái)越多,這對(duì)數(shù)據(jù)信息處理的實(shí)時(shí)性和有效性提出了新的挑戰(zhàn),需要更加快速,更加便捷,更加多樣性的技術(shù)來(lái)處理不同的數(shù)據(jù),來(lái)滿(mǎn)足不同的業(yè)務(wù)需求。大數(shù)據(jù)技術(shù)是一系列收集、存儲(chǔ)、管理、分析、共享和可視化技術(shù)的集合,包含了遺傳算法、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘、回歸分析、分類(lèi)分析、聚類(lèi)分析、網(wǎng)絡(luò)分析、情感分析、應(yīng)用實(shí)踐序列分析、關(guān)聯(lián)規(guī)則學(xué)習(xí)、分布式數(shù)據(jù)庫(kù)、可視化技術(shù)以及其他的一些數(shù)據(jù)處理技術(shù)等。大數(shù)據(jù)分析茶葉質(zhì)量包含茶葉質(zhì)量數(shù)據(jù)的積累與整理和茶葉質(zhì)量數(shù)據(jù)的分析、開(kāi)發(fā)與應(yīng)用兩個(gè)過(guò)程,大數(shù)據(jù)相關(guān)技術(shù)也將在這兩個(gè)基本過(guò)程之中得以運(yùn)用。
4.1 茶葉質(zhì)量數(shù)據(jù)的積累與整理
數(shù)據(jù)的積累與整理過(guò)程是對(duì)原始數(shù)據(jù)進(jìn)行搜集,并將原始數(shù)據(jù)中的重要信息提取出來(lái)并進(jìn)行簡(jiǎn)單的分析,數(shù)據(jù)的提取過(guò)程就應(yīng)用到了數(shù)據(jù)挖掘技術(shù),初步分析則可以包含大量統(tǒng)計(jì)分析方法。要挖掘茶葉質(zhì)量的原始數(shù)據(jù),首先就要建立茶葉質(zhì)量監(jiān)控體系,從茶葉的種植生長(zhǎng)過(guò)程到茶葉加工過(guò)程各個(gè)環(huán)節(jié)都建立檢測(cè)指標(biāo),例如茶葉生長(zhǎng)過(guò)程中對(duì)土壤酸堿度、重金屬含量的每天測(cè)量,溫度、濕度、日照時(shí)間等的每天記錄,病害蟲(chóng)的監(jiān)控等多方面立體式信息監(jiān)測(cè)。其次是茶葉加工環(huán)節(jié)的監(jiān)測(cè)數(shù)據(jù),企業(yè)加工過(guò)程中對(duì)茶葉質(zhì)量的檢測(cè),包含茶葉色澤、形狀、氣味、重金屬含量、口感等。最后,將所有數(shù)據(jù)匯總整理,提取出有效的數(shù)據(jù),為分析做準(zhǔn)備。茶葉質(zhì)量的把控不是針對(duì)一種茶葉或一個(gè)地區(qū)的茶葉進(jìn)行檢測(cè),而是要針對(duì)整個(gè)茶葉市場(chǎng)和茶葉種植區(qū)的所有信息進(jìn)行收集,只有大量的數(shù)據(jù)信息才能形成有效的檢測(cè)結(jié)果。
4.2 茶葉質(zhì)量數(shù)據(jù)的分析、開(kāi)發(fā)和應(yīng)用
數(shù)據(jù)分析具有時(shí)效性,即對(duì)數(shù)據(jù)必須是最新的,而且分析的結(jié)果是有效的,對(duì)下一階段工作安排有預(yù)測(cè)作用。茶葉質(zhì)量數(shù)據(jù)的分析需要對(duì)茶葉生長(zhǎng)過(guò)程和加工過(guò)程等信息及時(shí)做出反應(yīng),將茶葉質(zhì)量控制在標(biāo)準(zhǔn)允許的范圍之內(nèi)。由于數(shù)據(jù)具有流動(dòng)性,并隨著時(shí)間的推移而不斷壯大,其價(jià)值被利用之后還會(huì)源源不斷產(chǎn)生新的價(jià)值,因此數(shù)據(jù)開(kāi)發(fā)至關(guān)重要。茶葉質(zhì)量數(shù)據(jù)同樣可以開(kāi)發(fā),應(yīng)用于其他方面如茶葉衍生產(chǎn)品之中。傳統(tǒng)數(shù)據(jù)的應(yīng)用是以解釋現(xiàn)狀和預(yù)測(cè)未來(lái)為目的的,但是大數(shù)據(jù)時(shí)代,數(shù)據(jù)的可視化可將大型數(shù)據(jù)以圖像形式實(shí)時(shí)表示出來(lái)。茶葉質(zhì)量數(shù)據(jù)的可視化不但能夠方便監(jiān)測(cè)人員把控茶葉質(zhì)量,而且可以將數(shù)據(jù)呈現(xiàn)給消費(fèi)者,讓消費(fèi)者直接了解到茶葉的質(zhì)量,從而對(duì)茶葉質(zhì)量有更深入的了解。
大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨,云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的不斷應(yīng)用引發(fā)了數(shù)據(jù)信息規(guī)模的快速增長(zhǎng),讓數(shù)據(jù)滲透到了各行各業(yè),成為重要的生產(chǎn)因素。茶葉作為歷史悠久的傳統(tǒng)行業(yè),茶葉質(zhì)量一直都是備受關(guān)注的重心,如何把控好茶葉品質(zhì)也一直都是行業(yè)努力的方向,通過(guò)大數(shù)據(jù)分析技術(shù)可以逐漸改善茶葉質(zhì)量監(jiān)測(cè)的現(xiàn)狀,通過(guò)大量數(shù)據(jù)的有效分析,可以更加科學(xué)合理地保障茶葉的質(zhì)量,從而為茶葉市場(chǎng)的健康發(fā)展奠定良好基礎(chǔ)。
參考文獻(xiàn)
[1]陳宗懋.我國(guó)茶產(chǎn)業(yè)質(zhì)量安全和環(huán)境安全問(wèn)題研究[J].農(nóng)產(chǎn)品質(zhì)量與安全,2011(3):5-7.
[2]張文錦,王峰,翁伯琦.中國(guó)茶葉質(zhì)量安全的現(xiàn)狀、問(wèn)題及保障體系構(gòu)建[J].福建農(nóng)林大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2011,14(4):27-31.
[3]嚴(yán)霄鳳,張德馨.大數(shù)據(jù)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013(4):168-172.
[4]林烈青.企業(yè)數(shù)據(jù)中心的研究與設(shè)計(jì)[J].制造業(yè)自動(dòng)化,2011(15):22-25.
作者簡(jiǎn)介:謝艷云(1980-),女,湖南婁底人,碩士,講師,研究方向:非線(xiàn)性理論研究與數(shù)學(xué)建模。