• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    關(guān)聯(lián)改進(jìn)算法在煤礦隱患挖掘中的應(yīng)用

    2016-09-28 02:19:44貴州六盤(pán)水師范學(xué)院計(jì)算機(jī)科學(xué)與信息技術(shù)系胡廣勤孫國(guó)營(yíng)
    河北農(nóng)機(jī) 2016年5期
    關(guān)鍵詞:項(xiàng)集事務(wù)隱患

    貴州六盤(pán)水師范學(xué)院計(jì)算機(jī)科學(xué)與信息技術(shù)系  胡廣勤 孫國(guó)營(yíng)

    關(guān)聯(lián)改進(jìn)算法在煤礦隱患挖掘中的應(yīng)用

    貴州六盤(pán)水師范學(xué)院計(jì)算機(jī)科學(xué)與信息技術(shù)系胡廣勤孫國(guó)營(yíng)

    我國(guó)煤礦事故頻發(fā),煤礦安全生產(chǎn)形勢(shì)嚴(yán)峻,為了能夠根據(jù)煤礦隱患參數(shù)數(shù)據(jù)挖掘有效信息,指導(dǎo)煤礦安全生產(chǎn),根據(jù)關(guān)聯(lián)算法中常用的Apriori算法在時(shí)間效率上的不足,提出改進(jìn)算法,并通過(guò)實(shí)驗(yàn)驗(yàn)證了改進(jìn)算法的合理性,然后通過(guò)改進(jìn)算法挖掘煤礦安全隱患數(shù)據(jù),得到強(qiáng)關(guān)聯(lián)規(guī)則,對(duì)煤礦安全生產(chǎn)起到較好的促進(jìn)作用。

    煤礦事故;隱患參數(shù);關(guān)聯(lián)算法;Apriori算法;改進(jìn)算法;強(qiáng)關(guān)聯(lián)規(guī)則

    1 我國(guó)煤炭安全生產(chǎn)綜述

    煤炭行業(yè)關(guān)系國(guó)計(jì)民生,是影響我國(guó)經(jīng)濟(jì)運(yùn)行的基礎(chǔ)產(chǎn)業(yè)[1]。然而,我國(guó)煤礦安全事故頻發(fā),每年因?yàn)槊旱V事故死亡的人數(shù)排在世界前列[2]。煤礦安全生產(chǎn)事故中最常見(jiàn)的是瓦斯問(wèn)題導(dǎo)致的瓦斯爆炸等事故,而礦井內(nèi)的瓦斯?jié)舛?、瓦斯壓力、通風(fēng)量以及溫度等因素都有可能導(dǎo)致瓦斯事故的發(fā)生,煤礦安全監(jiān)測(cè)系統(tǒng)能夠?qū)崟r(shí)地監(jiān)測(cè)這些參數(shù)信息,而這些參數(shù)信息之間也是會(huì)相互影響的,通過(guò)關(guān)聯(lián)算法挖掘瓦斯?jié)舛?、瓦斯壓力、通風(fēng)量以及溫度之間隱含的關(guān)聯(lián)知識(shí),可以對(duì)煤礦安全生產(chǎn)起到較好的指導(dǎo)性作用[3]。

    2 關(guān)聯(lián)算法綜述

    2.1關(guān)聯(lián)規(guī)則概念

    設(shè)I={i1,i2,i3,i4,…,ip}是由p個(gè)不同項(xiàng)目組成的集合,對(duì)于一個(gè)給定的事務(wù)數(shù)據(jù)庫(kù)DB,假設(shè)事物集合O由很多具有唯一標(biāo)示的事務(wù)Oid組合而成,每一條包含于事物集合O的事務(wù)Oid所處理的項(xiàng)目集都和I上的一個(gè)子集相互對(duì)應(yīng),就被稱(chēng)為項(xiàng)集Io,也叫作模式Io。如果同時(shí)滿(mǎn)足事務(wù)o∈O以及模式XI的條件,那么就稱(chēng)X包含于事務(wù)O。

    對(duì)于模式X,若X中包含q個(gè)項(xiàng)目,記為|X|=q(1≤q≤p),那么,我們就稱(chēng)X為q-模式,也稱(chēng)X的長(zhǎng)度為q。例如下面的項(xiàng)集X={i1,i2,i3,i4,i5,i6}就是一個(gè)6-項(xiàng)集。

    包含X的事務(wù)在事務(wù)數(shù)據(jù)庫(kù)DB中占的百分比數(shù)被稱(chēng)為模式X在事務(wù)數(shù)據(jù)庫(kù)中的支持?jǐn)?shù),記為X.s;事務(wù)數(shù)據(jù)庫(kù)DB中含有模式X事務(wù)Oid的數(shù)目被稱(chēng)為模式X在事務(wù)數(shù)據(jù)庫(kù)中的支持?jǐn)?shù),記為X.c。

    通過(guò)用戶(hù)提前設(shè)定支持度閾值以及置信度閾值的值能夠達(dá)到更好地實(shí)現(xiàn)關(guān)聯(lián)規(guī)則挖掘的目的,如果關(guān)聯(lián)規(guī)則能夠達(dá)到支持度和置信度均大于預(yù)習(xí)設(shè)定的閾值的要求,那么就把稱(chēng)為強(qiáng)關(guān)聯(lián)規(guī)則。滿(mǎn)足這一條件的支持度閾值叫作最小支持度,記為minsup,滿(mǎn)足這一條件的置信度閾值叫作最小置信度,記為minconf。

    2.2關(guān)聯(lián)規(guī)則挖掘算法

    作為商業(yè)和學(xué)術(shù)應(yīng)用范圍最廣的關(guān)聯(lián)知識(shí)發(fā)現(xiàn)方法,關(guān)聯(lián)規(guī)則挖掘算法已經(jīng)被開(kāi)發(fā)出多種比較成熟的算法,在這些算法中,被應(yīng)用最廣的是由Agrawal等研究人員提出的Apriori以及隨后其他研究人員提出的Apriori改進(jìn)算法[4]。成功運(yùn)用這一算法需要注意兩點(diǎn)問(wèn)題,也就是兩個(gè)閾值的設(shè)定:最小支持度(minimumsupport)以及最小可信度(minimumconfidence)。算法挖掘出的最終結(jié)果都是要滿(mǎn)足最先設(shè)定的閾值的大小范圍,尤其是一定要小于最小支持度閾值。這個(gè)值反應(yīng)了關(guān)聯(lián)算法中的最低可靠度,基于這一層含義,數(shù)據(jù)挖掘系統(tǒng)也可以看成是從設(shè)定好的數(shù)據(jù)庫(kù)中,運(yùn)用挖掘算法獲取滿(mǎn)足設(shè)定的兩個(gè)支持度閾值要求的關(guān)聯(lián)規(guī)則[5]。

    3  Apriori算法存在的缺陷及改進(jìn)措施

    3.1算法缺陷

    對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘非常有效的手段是采用Apriori算法的頻繁項(xiàng)集方法,但是在實(shí)際生產(chǎn)和應(yīng)用中,這一算法還存在一些不足之處:

    應(yīng)用Apriori算法處理大量候選項(xiàng)集時(shí)會(huì)產(chǎn)生巨大的開(kāi)銷(xiāo),如果算法產(chǎn)生大量的頻繁1-項(xiàng)集,那么在由頻繁1-項(xiàng)集產(chǎn)生頻繁2-項(xiàng)集時(shí)就會(huì)產(chǎn)生大量的2-項(xiàng)候選集,由于生成的2-項(xiàng)候選集沒(méi)有剪枝,因此要對(duì)每一個(gè)2-項(xiàng)候選集進(jìn)行檢驗(yàn),另外,頻繁模式的尺寸過(guò)大也會(huì)導(dǎo)致大量需要檢驗(yàn)的候選項(xiàng)集的產(chǎn)生。由于根據(jù)候選項(xiàng)集方法所決定的開(kāi)銷(xiāo)和采用的實(shí)現(xiàn)技術(shù)無(wú)關(guān),因此,在算法會(huì)產(chǎn)生大量候選集的情況下,Apriori類(lèi)的算法運(yùn)行起來(lái)會(huì)非常吃力。例如,假設(shè)算法得到104個(gè)1-頻繁集,根據(jù)Apriori算法,生成的2-頻繁集會(huì)超過(guò)107個(gè),所有生成的2-頻繁集都需要進(jìn)行檢驗(yàn),這樣就會(huì)消耗大量的內(nèi)存,嚴(yán)重增加時(shí)間消耗量。

    3.2算法改進(jìn)

    3.2.1改進(jìn)思想

    在生成候選項(xiàng)集Ck+1之前,判斷Lk中所有項(xiàng)集的數(shù)目m以及總的事務(wù)屬性項(xiàng)數(shù)n,如果m>n,再判斷Lk中所有項(xiàng)出現(xiàn)的次數(shù)是否相同,如果Lk中所有項(xiàng)出現(xiàn)的次數(shù)并不完全相同,獲取Lk中所有項(xiàng)中次數(shù)最小的項(xiàng)的次數(shù)值j,裁剪掉Lk中次數(shù)值為j的項(xiàng)得到Lk’,然后通過(guò)Lk’連接Lk’的操作得到Ck+1。改進(jìn)后的算法的偽代碼為:

    (1) L1={large 1-itemsets};

    (2)FOR(k=1;Lk≠Φ;k++)DOBEGIN

    (3)CutOut(Lk);//對(duì)Lk進(jìn)行裁剪

    (4)Ck+1=apriori-gen(Lk);//Ck+1是k個(gè)元素的候選集

    (5)FOR all transactions t∈DDOBEGIN

    (6)Ct=subset(Ck+1,t);//Ct是所有t包含的候選集元素

    (7)FOR all candidates c∈CtDO

    (8)c.count++;

    (9)END

    (10)Lk+1={c∈Ck+1|c.count≥minsup_count}

    (11)END

    (12)Answer=∪kLk;

    上述算法調(diào)用了CutOut(Lk),是為了對(duì)Lk進(jìn)行裁剪。下面是CutOut(Lk)的偽代碼:

    (1)if(k>2)Then

    (2) for all itemset li∈Lk;

    (3)m=count(li);

    (4)if(m>n)//n是總的事務(wù)屬性項(xiàng)數(shù)

    (5){

    (6)min=count(l1);

    (7)ifexist(count(li)<min)then

    (8)min=count(li);//得到最小次數(shù)值

    (9)}

    (10)delete all ljfromLk(count(lj)=min);

    (11)return Lk’

    3.2.2算法評(píng)價(jià)

    通過(guò)對(duì)改進(jìn)算法的理論分析和實(shí)例介紹,我們能夠看出改進(jìn)以后的算法在思路上和Apriori算法仍然是一致的,也就是通過(guò)循環(huán)掃描數(shù)據(jù)庫(kù)獲得支持度不小于給定的最小支持度的頻繁項(xiàng)集,但是,改進(jìn)算法在生成Ck+1之前,如果Lk中所有項(xiàng)集的數(shù)目大于總的事務(wù)屬性項(xiàng)數(shù),并且Lk中所有項(xiàng)出現(xiàn)的次數(shù)并不完全相同,那么就會(huì)對(duì)Lk進(jìn)行一次裁剪,這樣就可以減少候選項(xiàng)集Ck+1中候選項(xiàng)的數(shù)量,大大降低算法的時(shí)間消耗量。但是,這一改進(jìn)算法也有不足之處,那就是在對(duì)Lk進(jìn)行裁剪的過(guò)程中是需要消耗一定的時(shí)間的,但是就大型數(shù)據(jù)庫(kù)來(lái)說(shuō),這些時(shí)間是可以忽略不計(jì)的,使用改進(jìn)的Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘的效率也是明顯提高的。

    4 基于Apriori改進(jìn)算法的煤礦隱患數(shù)據(jù)挖掘

    4.1數(shù)據(jù)獲取

    本文根據(jù)某礦2012年1月至2015年1月的煤礦隱患監(jiān)測(cè)系統(tǒng)中持續(xù)監(jiān)測(cè)的數(shù)據(jù)作為研究對(duì)象,選取瓦斯?jié)舛?、瓦斯壓力、通風(fēng)量以及溫度為研究目標(biāo),得到的結(jié)果如表1所示。

    4.2數(shù)據(jù)預(yù)處理

    設(shè)定瓦斯?jié)舛?、瓦斯壓力、通風(fēng)量以及溫度的屬性分別為C、P、V、T。根據(jù)瓦斯?jié)舛鹊闹档那闆r可以將其分為(0-0.16),(0.16-0.32),(0.32-)三組,對(duì)應(yīng)的標(biāo)志分別為:C1,C2,C3;根據(jù)瓦斯壓力的值的情況可以將其分為(0-8),(8-19),(19-)三組,對(duì)應(yīng)的標(biāo)志分別為:P1,P2,P3;根據(jù)通風(fēng)量的值的情況可以將其分為(0-1100),(1100-1300),(1300-)三組,對(duì)應(yīng)的標(biāo)志分別為:V1,V2,V3;根據(jù)溫度的值的情況可以將其分為 (-12),(12-16),(16-)三組,對(duì)應(yīng)的標(biāo)志分別為:T1,T2,T3。表2為表1中的數(shù)據(jù)經(jīng)過(guò)預(yù)處理以后的數(shù)據(jù):

    表1 煤礦隱患參數(shù)數(shù)據(jù)

    表2 預(yù)處理后的數(shù)據(jù)

    4.3關(guān)聯(lián)規(guī)則挖掘

    4.3.1實(shí)驗(yàn)環(huán)境

    進(jìn)行煤礦隱患數(shù)據(jù)挖掘的軟硬件環(huán)境如下:

    硬件環(huán)境:處理器為AMDA-10,內(nèi)存為3G,硬盤(pán)為250G。

    軟件環(huán)境:數(shù)據(jù)庫(kù)為SQLServer2008。

    采用的編程語(yǔ)言是C#,開(kāi)發(fā)環(huán)境為Visual Studio2010。

    4.3.2挖掘結(jié)果

    設(shè)置最小支持度為0.4,最小置信度為0.6,同時(shí),運(yùn)用改進(jìn)后的算法,求得挖掘結(jié)果如表3所示。

    4.3.3挖掘結(jié)果分析

    從表3中可以看出,運(yùn)用改進(jìn)后的挖掘算法對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行挖掘,一共挖掘出了六條強(qiáng)關(guān)聯(lián)規(guī)則,總結(jié)如下:

    表3 挖掘結(jié)果

    將這些強(qiáng)關(guān)聯(lián)規(guī)則轉(zhuǎn)化為瓦斯?jié)舛?、瓦斯壓力、通風(fēng)量以及溫度得到的實(shí)際意義如下:

    通過(guò)參考礦井內(nèi)隱患參數(shù)數(shù)據(jù)的實(shí)際情況可以看出,利用改進(jìn)后的算法得到的強(qiáng)關(guān)聯(lián)規(guī)則均是符合客觀事實(shí)的,利用挖掘出來(lái)的有效信息,可以對(duì)礦井安全生產(chǎn)起到較好的指導(dǎo)性作用。

    [1]劉雙躍,彭麗.基于Apriori改進(jìn)算法的煤礦隱患關(guān)聯(lián)性分析[J].內(nèi)蒙古煤炭經(jīng)濟(jì),2013,10(11):92-97.

    [2]朱翼.基于數(shù)組的Apriori算法的改進(jìn)研究[D].哈爾濱:哈爾濱師范大學(xué),2014.

    [3]楊國(guó)英.泛在網(wǎng)下基于Apriori算法的移動(dòng)群組的位置預(yù)測(cè)[D].南京:南京郵電大學(xué),2013.

    [4]邵天會(huì).基于改進(jìn)的Apriori算法的Web日志研究[D].昆明:昆明理工大學(xué),2013.

    [5]馮舸.基于云計(jì)算的數(shù)據(jù)挖掘關(guān)聯(lián)算法研究與實(shí)現(xiàn)[D].成都:成都理工大學(xué),2013.

    猜你喜歡
    項(xiàng)集事務(wù)隱患
    “事物”與“事務(wù)”
    基于分布式事務(wù)的門(mén)架數(shù)據(jù)處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    隱患隨手拍
    隱患隨手拍
    互聯(lián)網(wǎng)安全隱患知多少?
    隱患隨手拍
    河湖事務(wù)
    關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
    卷宗(2014年5期)2014-07-15 07:47:08
    一種頻繁核心項(xiàng)集的快速挖掘算法
    SQLServer自治事務(wù)實(shí)現(xiàn)方案探析
    凤台县| 长白| 舒城县| 吉隆县| 沛县| 江孜县| 泰州市| 旬邑县| 芮城县| 湖北省| 乐至县| 旅游| 武汉市| 丰镇市| 三门县| 洞口县| 平塘县| 荃湾区| 凤阳县| 长垣县| 炉霍县| 禄丰县| 尼玛县| 喜德县| 达孜县| 元氏县| 阿拉善盟| 睢宁县| 沅陵县| 唐河县| 万荣县| 邵阳市| 神木县| 儋州市| 涡阳县| 襄垣县| 陇西县| 兴山县| 鄂托克旗| 昌吉市| 澜沧|