• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Clementine的數(shù)據(jù)挖掘技術(shù)對學科隱形關聯(lián)的研究

      2013-04-29 00:44:03張靜端
      現(xiàn)代情報 2013年9期
      關鍵詞:關聯(lián)規(guī)則學科建設數(shù)據(jù)挖掘

      張靜端

      〔摘要〕借助數(shù)據(jù)挖掘軟件Clementine 120,以Apriori模型和GRI模型為數(shù)據(jù)挖掘方法,對東華大學近五年來紡織學院博士研究生的借閱記錄進行分析。通過分析數(shù)據(jù)挖掘的結(jié)果,尋找學科領域中相互關聯(lián)的知識,輔助教師的教學工作,優(yōu)化學科建設。

      〔關鍵詞〕數(shù)據(jù)挖掘;關聯(lián)規(guī)則;學科建設;學科關聯(lián)

      DOI:10.3969/j.issn.1008-0821.2013.09.029

      〔中圖分類號〕G250.13〔文獻標識碼〕A〔文章編號〕1008-0821(2013)09-0145-05

      隨著現(xiàn)代社會的不斷發(fā)展,知識更新的速度日漸加快,各個學科之間的聯(lián)系程度也越來越緊密,出現(xiàn)了許多新的交叉學科及邊緣學科。與此同時,社會對學生的知識面要求也越來越高。在本科教學過程中,教學大綱雖然定期更新,卻仍明顯滯后于社會的發(fā)展和要求。高校圖書館,作為向高校師生提供信息服務的部門,有其自身特有的信息優(yōu)勢和特點。由于目前所有高校都采用了數(shù)據(jù)庫技術(shù)對圖書館進行管理,在圖書的流通過程中,產(chǎn)生了大量的借閱數(shù)據(jù)。學生尤其是碩博研究生的借閱書刊信息在一定程度上能夠代表學科的發(fā)展方向和各學科之間的關聯(lián)程度。因此,充分利用這些數(shù)據(jù),不僅可以分析不同類型讀者的需求內(nèi)容,以便及時調(diào)整藏書結(jié)構(gòu)與購書投資方向,并且能夠從借閱信息中挖掘出學科間的關聯(lián)關系及特點,以便為學科課程設置及內(nèi)容調(diào)整進行有效合理的建議。這將成為高校圖書館信息服務的一個重要課題[1]。

      數(shù)據(jù)挖掘(Data Mining),是指從大量的結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)中提取有用的信息和知識的過程[2]。數(shù)據(jù)挖掘技術(shù)是近年來熱門的研究領域,它可以發(fā)掘潛藏在資料中的大量可用或未知的信息,以為管理者提供決策參考。在圖書館管理中,最值得進行數(shù)據(jù)挖掘的是圖書流通資料。因為圖書館借閱記錄向來是讀者實際使用圖書館資源的證據(jù),也是讀者滿足個人信息需求的行為結(jié)果,其中潛藏了大量有意義的關系和規(guī)則[1,3]。

      圖書館在業(yè)務流通中產(chǎn)生的數(shù)據(jù)屬于結(jié)構(gòu)化數(shù)據(jù)。目前,有關對圖書館業(yè)務流通數(shù)據(jù)進行數(shù)據(jù)挖掘的文獻研究主要集中在以下兩個方面:

      (1)讀者借閱習慣的偏好及行為特征分析;

      (2)通過聚類分析對新進書籍與歷史書籍進行聚類,以判斷其價值。

      可以看出,目前在圖書館領域中,運用數(shù)據(jù)挖掘的關聯(lián)規(guī)則方法來對學科隱性關聯(lián)和學科動向進行的研究還是不多見的。本文將采用Apriori和GRI關聯(lián)規(guī)則模型,對近五年來東華大學紡織學院博士研究生的借閱記錄進行挖掘和分析。博士生一般具有一定的科研水平,并有較為明確的研究方向,利用博士研究生的借閱數(shù)據(jù)找出學科之間的關聯(lián)程度,有助于發(fā)現(xiàn)學科間的隱形關聯(lián),以此為依據(jù)來為本科學生選修課程以及教學內(nèi)容和教學計劃的補充與制定提供一定的參考[4]。

      2013年9月1第33卷第9期1現(xiàn)?代?情?報1Journal of Modern Information1Sep,20131Vol.33No92013年9月1第33卷第9期1基于Clementine的數(shù)據(jù)挖掘技術(shù)對學科隱形關聯(lián)的研究1Sep,20131Vol.33No91挖掘模型及軟件簡介

      1.1關聯(lián)規(guī)則的定義

      關聯(lián)規(guī)則是數(shù)據(jù)挖掘的主要技術(shù)之一[5]。所謂關聯(lián)規(guī)則,就是描述數(shù)據(jù)庫中數(shù)據(jù)項(屬性、變量)之間存在(潛在)的規(guī)則。利用關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術(shù),可以找出大量數(shù)據(jù)之間未知的依賴關系。

      關聯(lián)規(guī)則定義如下:

      設I={i1,i2,…,im}為所有項目的集合,D為事務數(shù)據(jù)庫,事務T是一個項目子集(TI)。每一個事務具有惟一的事務標識Tid。設A是一個由項目構(gòu)成的集合,稱為項集。事務T包含項集A,當且僅當AT。

      關聯(lián)規(guī)則是形如X→Y的邏輯蘊含式,其中XI,YI且X∩Y=。如果事務數(shù)據(jù)庫D中有s%的事務包含X∪Y,則成關聯(lián)規(guī)則X→Y的支持度為s%。

      1.2關聯(lián)規(guī)則挖掘算法的步驟

      關聯(lián)規(guī)則的任務就是在事務數(shù)據(jù)庫D中找出具有用戶給定的最小支持度minsp和最小置信度的強關聯(lián)規(guī)則,關聯(lián)規(guī)則挖掘可分解為2個步驟:

      猜你喜歡
      關聯(lián)規(guī)則學科建設數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      關聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學質(zhì)量評價體系中的應用
      加強黨建教學改革和學科建設
      武警院校應急救援學科建設存在的問題及對策
      人間(2016年24期)2016-11-23 16:46:30
      論七年一貫制體系下本科學科建設中職業(yè)教育的重要性
      職業(yè)(2016年10期)2016-10-20 21:57:21
      關聯(lián)規(guī)則挖掘Apriori算法的一種改進
      中國市場(2016年36期)2016-10-19 04:10:44
      基于關聯(lián)規(guī)則的計算機入侵檢測方法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      长丰县| 博乐市| 凤阳县| 西城区| 星子县| 吉林市| 高安市| 五峰| 漠河县| 马尔康县| 合山市| 晴隆县| 夏邑县| 溆浦县| 雅江县| 海兴县| 芦溪县| 印江| 昌平区| 崇礼县| 图们市| 濉溪县| 武平县| 章丘市| 北碚区| 成都市| 察雅县| 福安市| 广东省| 龙岩市| 朝阳市| 诸暨市| 龙井市| 长阳| 文化| 漯河市| 黄浦区| 仪陇县| 营山县| 宁阳县| 洱源县|