• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)挖掘在食品藥品監(jiān)管中的應(yīng)用

      2017-09-29 20:56:25郭承湘韋宇巍張國(guó)飛黃星儒莫?dú)g倩
      軟件導(dǎo)刊 2017年9期
      關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘信息系統(tǒng)

      郭承湘 韋宇巍 張國(guó)飛 黃星儒 莫?dú)g倩

      摘 要:食品藥品監(jiān)管中存在著海量信息。關(guān)聯(lián)規(guī)則挖掘技術(shù)是分析信息系統(tǒng)數(shù)據(jù)關(guān)聯(lián)性的有力工具,將關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用到食品藥品的投訴舉報(bào)系統(tǒng)中,可以充分挖掘出與投訴舉報(bào)相關(guān)的關(guān)聯(lián)信息,并得到其中有用的關(guān)聯(lián)規(guī)則。以廣西壯族自治區(qū)食品藥品監(jiān)管系統(tǒng)為例,通過(guò)提取投訴舉報(bào)相關(guān)的數(shù)據(jù)信息,組成食品藥品投訴舉報(bào)信息數(shù)據(jù)庫(kù),為食品藥品監(jiān)管提供決策支持,提高食品藥品監(jiān)管效率。

      關(guān)鍵詞:食品藥品監(jiān)管;信息系統(tǒng);關(guān)聯(lián)規(guī)則;數(shù)據(jù)挖掘

      DOI:10.11907/rjdk.171472

      中圖分類(lèi)號(hào):TP319 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2017)009-0148-03

      Abstract:There are a lot of useful information in the food and drug regulation. By taking example of food and drug regulation system of Guangxi province and extracting data information about complaint reporting, the complaint reporting information system was composed. Association rules mining technology is a useful tool for analyzing the data correlation of information system. We can fully mine the correlation information about complaint reporting and obtain useful association rules when applying association rules mining technology to food and drug regulation system, which can provide decision making for food and drug regulation, but also mprove the efficiency of the food and drug supervision.

      Key Words:food and drug supervision; information system; association rules; data mining

      0 引言

      隨著互聯(lián)網(wǎng)等信息技術(shù)的快速發(fā)展,食品藥品監(jiān)管系統(tǒng)中的數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),如何挖掘出潛藏的大量有用信息對(duì)提高食品藥品的監(jiān)管效率具有重要意義。

      數(shù)據(jù)挖掘(Data Mining)[1-3]作為數(shù)據(jù)分析的一個(gè)分支,可從大量不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取出隱含在其中事先不知道但又是潛在有用的信息和知識(shí)。關(guān)聯(lián)規(guī)則可反映出數(shù)據(jù)中各個(gè)項(xiàng)集之間的聯(lián)系,數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘可以挖掘出大量數(shù)據(jù)項(xiàng)集之間的相關(guān)聯(lián)系。將關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用于食品藥品監(jiān)管研究已取得了一些成果[4-10]。

      晁鳳英等[4]提出了一種基于關(guān)聯(lián)規(guī)則的食品安全數(shù)據(jù)挖掘方法。從食品安全檢測(cè)數(shù)據(jù)的特點(diǎn)出發(fā),研究了關(guān)聯(lián)規(guī)則在食品安全檢測(cè)數(shù)據(jù)分析中的應(yīng)用。文獻(xiàn)[5]從研究食品安全問(wèn)題入手,描述了關(guān)聯(lián)規(guī)則挖掘、分類(lèi)與預(yù)測(cè)、聚類(lèi)、復(fù)雜數(shù)據(jù)挖掘幾個(gè)研究方向,對(duì)數(shù)據(jù)挖掘應(yīng)用進(jìn)行了探討。文獻(xiàn)[6]在關(guān)聯(lián)規(guī)則挖掘的背景下著重研究了增量式關(guān)聯(lián)規(guī)則更新技術(shù)在食品安全檢測(cè)數(shù)據(jù)集上的應(yīng)用。文獻(xiàn)[7]設(shè)計(jì)了一個(gè)以食品安全數(shù)據(jù)分析為基礎(chǔ)的決策系統(tǒng),實(shí)現(xiàn)了數(shù)據(jù)的即時(shí)更新,以及對(duì)多個(gè)數(shù)據(jù)庫(kù)并行操作,可對(duì)不同數(shù)據(jù)之間相互影響關(guān)系進(jìn)行高效挖掘。

      本文研究關(guān)聯(lián)規(guī)則挖掘在食品藥品安全監(jiān)管中的應(yīng)用,以某食品藥品投訴舉報(bào)數(shù)據(jù)系統(tǒng)為例,通過(guò)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、統(tǒng)計(jì)分析,應(yīng)用關(guān)聯(lián)規(guī)則挖掘技術(shù)對(duì)投訴舉報(bào)系統(tǒng)進(jìn)行關(guān)聯(lián)性分析,從而對(duì)食品藥品監(jiān)管提供決策支持,提高食品藥品監(jiān)管效率。

      1 數(shù)據(jù)挖掘算法

      1.1 數(shù)據(jù)挖掘算法分類(lèi)

      數(shù)據(jù)挖掘通常分為兩大類(lèi),一類(lèi)是統(tǒng)計(jì)型,常用的技術(shù)有概率分析、相關(guān)性、聚類(lèi)分析和判別分析等;另一類(lèi)是人工智能中的機(jī)器學(xué)習(xí)型,通過(guò)訓(xùn)練和學(xué)習(xí)大量的樣品集得出需要的模式或參數(shù)。數(shù)據(jù)挖掘的最終目標(biāo)是發(fā)現(xiàn)有價(jià)值的知識(shí)和信息,各種方法有共同的思路和步驟,但也存在很大區(qū)別,表1給出了各種方法詳細(xì)的對(duì)比結(jié)果。

      1.2 Apriori算法

      1.2.1 Apriori介紹

      Apriori算法使用頻繁項(xiàng)集的先驗(yàn)知識(shí),使用一種稱(chēng)作逐層搜索的迭代方法,k項(xiàng)集用于探索(k+1)項(xiàng)集。首先,通過(guò)掃描事務(wù)(交易)記錄,找出所有的頻繁1項(xiàng)集,該集合記作L1,然后利用L1找頻繁2項(xiàng)集的集合L2,利用L2找L3,如此下去,直到不能找到任何頻繁k項(xiàng)集。最后在所有的頻繁集中找出強(qiáng)規(guī)則,即產(chǎn)生用戶(hù)感興趣的關(guān)聯(lián)規(guī)則。

      Apriori算法具有任一頻繁項(xiàng)集的所有非空子集也必須是頻繁的性質(zhì)。假如P(I)(最小支持度閾值),當(dāng)有元素A添加到I中時(shí),結(jié)果項(xiàng)集(A∩I)不可能比I出現(xiàn)的次數(shù)更多,因此A∩I也不是頻繁的。

      1.2.2 連接步和剪枝步

      在上述關(guān)聯(lián)規(guī)則挖掘的兩個(gè)步驟中,第一步往往是總體性能的瓶頸。Apriori算法采用連接步和剪枝步兩種方式找出所有頻繁項(xiàng)集。

      (1)連接步。為找出Lk(所有頻繁k項(xiàng)集的集合),通過(guò)將Lk-1(所有頻繁k-1項(xiàng)集的集合)與自身連接產(chǎn)生候選k項(xiàng)集的集合,候選集合記作Ck。設(shè)l1和l2是Lk-1中的成員,記li[j]表示li中的第j項(xiàng)。假設(shè)Apriori算法對(duì)事務(wù)或項(xiàng)集中的項(xiàng)按字典次序排序,即對(duì)于(k-1)項(xiàng)集li,li[1]

      (2)剪枝步。CK是LK的超集,也就是說(shuō),CK的成員可能是也可能不是頻繁的。通過(guò)掃描所有的事務(wù)(交易),確定CK中每個(gè)候選的計(jì)數(shù),判斷是否小于最小支持度計(jì)數(shù)。如果不是,則認(rèn)為該候選是頻繁的。為了壓縮Ck,可以利用Apriori性質(zhì):任一頻繁項(xiàng)集的所有非空子集也必須是頻繁的。反之,如果某個(gè)候選的非空子集不是頻繁的,那么該候選肯定不是頻繁的,從而可以將其從CK中刪除。

      2 數(shù)據(jù)挖掘應(yīng)用

      2.1 數(shù)據(jù)來(lái)源

      收集到廣西省食品藥品投訴舉報(bào)平臺(tái)從2013年1月份到2015年12月共3年的數(shù)據(jù)。

      2.2 研究工具

      通過(guò)調(diào)用Orale數(shù)據(jù)庫(kù)的關(guān)鍵數(shù)據(jù)進(jìn)行提取,采用Matlab對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析。數(shù)據(jù)處理流程如圖1所示。

      2.3 數(shù)據(jù)預(yù)處理

      表2為數(shù)據(jù)庫(kù)中按投訴時(shí)間順序排列的投訴表,對(duì)這些數(shù)據(jù)進(jìn)行挖掘。

      為了使該數(shù)據(jù)適用關(guān)聯(lián)規(guī)則Apriori算法處理,需對(duì)其進(jìn)行一些預(yù)處理,由數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)歸約等構(gòu)成。傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)中總存在冗余空缺數(shù)據(jù)、不完整和含噪聲等信息的“臟數(shù)據(jù)”,數(shù)據(jù)預(yù)處理就是在不丟失重要信息的情況下達(dá)到提高數(shù)據(jù)挖掘質(zhì)量的目的。

      原始數(shù)據(jù)通過(guò)變化規(guī)則表3進(jìn)行變化得到預(yù)處理后的數(shù)據(jù)表4,這些數(shù)據(jù)可以達(dá)到數(shù)據(jù)格式一致、數(shù)據(jù)類(lèi)型相同、數(shù)據(jù)存儲(chǔ)集中以及數(shù)據(jù)信息精練的要求,為后續(xù)高效進(jìn)行數(shù)據(jù)挖掘提供了良好基礎(chǔ)。

      2.4 不同投訴情況統(tǒng)計(jì)分析

      本文對(duì)3年間不同地區(qū)進(jìn)行投訴量統(tǒng)計(jì),統(tǒng)計(jì)表明:3年間總投訴量為11 460件,涉及到81個(gè)地區(qū),圖2為投訴量排名最大的前15個(gè)地區(qū)。

      研究發(fā)現(xiàn):前4個(gè)地區(qū)投訴量之和占總投訴量的68.60%;其中,南食藥4420,柳食藥1 948,桂林食藥791,欽食藥703。說(shuō)明前4個(gè)地區(qū)的數(shù)據(jù)在數(shù)據(jù)挖掘中起主導(dǎo)作用。為了簡(jiǎn)化挖掘數(shù)據(jù)分析,本文選擇4個(gè)關(guān)鍵因素:地區(qū)、年份、投訴舉報(bào)產(chǎn)品分類(lèi)和投訴舉報(bào)來(lái)源作為有價(jià)值的相關(guān)聯(lián)因素,將南食藥、柳食藥、桂林食藥和欽食藥作為選擇的地區(qū)。

      圖3為不同地區(qū)隨年份投訴量變化情況 ,發(fā)現(xiàn)area_48,area_37,area_56三個(gè)投訴量是逐年增加,投訴量增加最大的地區(qū)為area_48,area_21地區(qū)的投訴量2013年到2014年增加, 2014年到2015年減少。圖4為不同地區(qū)投訴量舉報(bào)產(chǎn)品分類(lèi)情況 ,發(fā)現(xiàn)4個(gè)地區(qū)全部是type_6的投訴量最大,且area_48地區(qū)的type_6最大,其它類(lèi)型的投訴量都不大。圖5為不同地區(qū)投訴舉報(bào)來(lái)源情況,發(fā)現(xiàn)4個(gè)地區(qū)全部是way_5的投訴量最大,且area_48地區(qū)的way_5最大,其它類(lèi)型的投訴量都不大。

      2.5 Apriori算法關(guān)聯(lián)分析

      通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行清理、集成、轉(zhuǎn)換等預(yù)處理,達(dá)到數(shù)據(jù)格式一致、數(shù)據(jù)類(lèi)型相同、數(shù)據(jù)存儲(chǔ)集中以及數(shù)據(jù)信息精練的目的,為以后的高效數(shù)據(jù)挖掘提供良好基礎(chǔ)。

      從表5中的挖掘結(jié)果分析可知:type_6和way_5的支持度最大,area_48→way_5的置信度最大,說(shuō)明政府要加大對(duì)藥品食品投訴的整改力度,重點(diǎn)關(guān)注南食藥地區(qū)的投訴情況,增加投訴舉報(bào)來(lái)源地工作人員數(shù)量,對(duì)食品類(lèi)投訴記錄加快辦理,弄清食品的分布業(yè)態(tài),增加同類(lèi)事件違反法律法規(guī)的處理頻次。

      3 結(jié)語(yǔ)

      數(shù)據(jù)挖掘技術(shù)是近年熱門(mén)的研究方向之一,關(guān)聯(lián)規(guī)則挖掘技術(shù)是解決很多日常數(shù)據(jù)挖掘的一種可靠方法。本文利用投訴信息數(shù)據(jù)庫(kù)進(jìn)行初步統(tǒng)計(jì)分析,在此基礎(chǔ)上借助關(guān)聯(lián)規(guī)則算法Apriori對(duì)投訴舉報(bào)信息進(jìn)行深入挖掘。從地區(qū)、年份、投訴舉報(bào)產(chǎn)品、投訴舉報(bào)來(lái)源分類(lèi)4個(gè)關(guān)鍵因素中挖掘出有用信息,得出政府有關(guān)部門(mén)必須重點(diǎn)關(guān)注南食藥地區(qū),及時(shí)解決熱點(diǎn)投訴問(wèn)題,采取切實(shí)有效措施的結(jié)論。

      參考文獻(xiàn):

      [1] AGRAWAL R, IMIELINSKI T, SWAMI A N. Mining association rules between sets of items in large databases[C]. In Proceedings of the 1993 ACM SIGMOD International Conference on Managemennt of Data (SIGMOD'93), Washington, D.C. ,1993:207-216.

      [2] AGRAWAL R, SRIKANT R. Mining sequential patterns[C]. In Proceedings of the 11th International Conference on Data Engineering (ICDE'96), Taipei,1995:3-14.

      [3] HAN J, KAMBER M.數(shù)據(jù)挖掘-概念與技術(shù)[M].北京:高等教育出版社,2001:1-449.

      [4] 晁鳳英,杜樹(shù)新.基于關(guān)聯(lián)規(guī)則的食品安全數(shù)據(jù)挖掘方法[J].食品與發(fā)酵工業(yè),2007,33(4):107-109.

      [5] 晁鳳英.食品安全監(jiān)管中的關(guān)聯(lián)規(guī)則挖掘[D].杭州:浙江大學(xué),2007.

      [6] 徐燕偉.增量關(guān)聯(lián)規(guī)則挖掘算法及其在食品安全監(jiān)管中的應(yīng)用[D].杭州:浙江大學(xué),2007.

      [7] 彭佳琪,肖毅,聶笑一.食品安全數(shù)據(jù)分析決策系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代計(jì)算機(jī),2013(9):80-83.

      [8] 王雅潔,楊冰,羅艷.大數(shù)據(jù)挖掘在食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2015,43(8):332-334.

      [9] 丁亦岑,杜子平,李楊.基于數(shù)據(jù)挖掘技術(shù)的我國(guó)食品安全領(lǐng)域前沿探究[J].食品工業(yè),2013,34(11):184-186.

      [10] 邊春娜,趙春青,鄧云嵐.數(shù)據(jù)挖掘方法在食品安全數(shù)據(jù)中的應(yīng)用[J].科學(xué)大眾,2014(7):84-85.

      (責(zé)任編輯:杜能鋼)endprint

      猜你喜歡
      關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘信息系統(tǒng)
      企業(yè)信息系統(tǒng)安全防護(hù)
      哈爾濱軸承(2022年1期)2022-05-23 13:13:18
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      基于區(qū)塊鏈的通航維護(hù)信息系統(tǒng)研究
      電子制作(2018年11期)2018-08-04 03:25:54
      信息系統(tǒng)審計(jì)中計(jì)算機(jī)審計(jì)的應(yīng)用
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評(píng)價(jià)體系中的應(yīng)用
      關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
      基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測(cè)方法
      基于SG-I6000的信息系統(tǒng)運(yùn)檢自動(dòng)化診斷實(shí)踐
      黎平县| 弋阳县| 通山县| 肇州县| 兴海县| 长宁区| 河曲县| 垣曲县| 庄浪县| 北川| 吉林省| 揭西县| 祁连县| 雅安市| 宁国市| 南溪县| 万山特区| 塔河县| 平陆县| 棋牌| 昌乐县| 海安县| 盐池县| 安西县| 浦县| 廊坊市| 灵璧县| 个旧市| 务川| 上虞市| 康马县| 咸宁市| 含山县| 彭阳县| 满洲里市| 西乌| 大城县| 永清县| 利川市| 祥云县| 安义县|