• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用研究

      2014-12-30 11:13:56劉玫
      科技創(chuàng)新導(dǎo)報 2014年31期
      關(guān)鍵詞:數(shù)字圖書館數(shù)據(jù)挖掘應(yīng)用研究

      劉玫

      摘 要:21世紀(jì)是數(shù)字化、科技化的時代,數(shù)據(jù)挖掘技術(shù)在為實現(xiàn)數(shù)字化提供了有力支持,該文不僅對數(shù)據(jù)挖掘技術(shù)、數(shù)字圖書館的基本概念做出了闡述,而且研討了數(shù)據(jù)挖掘在數(shù)字化圖書館運營管理當(dāng)中的應(yīng)用問題,表明數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中應(yīng)用的重要性。

      關(guān)鍵詞:數(shù)據(jù)挖掘 ?數(shù)字圖書館 ?應(yīng)用研究

      中圖分類號:G25 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2014)11(a)-0193-01

      在現(xiàn)代科技帶動下,圖書館也向信息化、自動化與數(shù)字化的方向邁進(jìn)。數(shù)據(jù)挖掘就是在這個時代應(yīng)運而生的,如今,它已經(jīng)在金融業(yè)、銷售業(yè)、建筑業(yè)等行業(yè)取得了許多成功,為這些領(lǐng)域的更快更好發(fā)展立下了汗馬功勞。目前,互聯(lián)網(wǎng)上的數(shù)字圖書館數(shù)量與日俱增,因此數(shù)字圖書館的數(shù)據(jù)挖掘技術(shù)就具有很重要的意義。數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中的應(yīng)用,將為數(shù)字圖書館在圖書資源組織管理、服務(wù)質(zhì)量的提升與服務(wù)方式的擴展等方面提供有力的技術(shù)支持。

      1 數(shù)據(jù)挖掘概述

      數(shù)據(jù)挖掘這個技術(shù)是近幾年來從計算機科學(xué)研究中發(fā)展出來的一個分支學(xué)科。具體是指從海量數(shù)據(jù)中提取或挖掘出隱藏的信息。所有信息載體或信息存儲上都可以使用數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘的整個過程是由準(zhǔn)備數(shù)據(jù)、數(shù)據(jù)采集、顯示結(jié)果與解釋分三個部分組成的。整個采集過程是對數(shù)據(jù)的循環(huán)精練過程,離不開人為的操作。數(shù)據(jù)挖掘技術(shù)大大降低了從大型數(shù)據(jù)庫中挖掘出有用信息的難度,采集人員并不需要有很強的數(shù)據(jù)分析和數(shù)據(jù)統(tǒng)計的能力。數(shù)據(jù)挖掘與知識挖掘既存在一定聯(lián)系,同時又有一些差別。通常認(rèn)為數(shù)據(jù)挖掘是知識挖掘過程的一個基本過程,它采用特定算法把數(shù)據(jù)從數(shù)據(jù)庫中采集出來的模式,最后再經(jīng)過系統(tǒng)解釋與翻譯功能把這種模式變換成用戶能夠理解的信息。另外,數(shù)據(jù)挖掘的過程是隨機發(fā)生的,用戶預(yù)先不能知道結(jié)果;信息檢索的初衷是幫助用戶從大量數(shù)據(jù)中挖掘出滿足其查詢條件的信息,而數(shù)據(jù)挖掘是把文檔內(nèi)隱藏的知識提取出來。這兩個系統(tǒng)是相輔相成的。因此可以利用數(shù)據(jù)挖掘的研究結(jié)果來提高信息檢索的效率與準(zhǔn)確度,優(yōu)化檢索結(jié)果的顯示,使信息檢索系統(tǒng)更優(yōu)良、更全面。

      2 數(shù)字圖書館的定義

      如今對掘數(shù)字圖書館的定義有很多,總體概括起來,數(shù)字圖書館就是依靠計算機互聯(lián)網(wǎng)絡(luò)、信息檢索技術(shù)、圖書分類技術(shù)、管理等技術(shù),把圖書整理、保存、保護、數(shù)字信息收集與使用等功能融于一體的綜合智能數(shù)字信息管理與服務(wù)中心,這里包含了計算機網(wǎng)絡(luò)、人工智能、數(shù)據(jù)庫、圖書情報學(xué)等最新技術(shù)。數(shù)字圖書館是基于本著盡最大可能滿足用戶的所有需要,方便用戶使用的宗旨,向用戶提供能夠滿足特定需求的優(yōu)質(zhì)服務(wù),同時它又能夠培養(yǎng)用戶個性,引導(dǎo)用戶的需求,這種方式大大促進(jìn)的現(xiàn)代圖書館的發(fā)展。促進(jìn)人類文明的進(jìn)步。如今國內(nèi)外數(shù)字圖書館的數(shù)量顯著增加,對信息服務(wù)系統(tǒng)的研究也越來越深入,信息服務(wù)的應(yīng)用也更加廣泛。

      3 數(shù)據(jù)挖的功能特性

      (1)聚類。聚類就是把所有數(shù)據(jù)個體根據(jù)它們所具有的相同特點歸納在一起,形成一組具有特定屬性的數(shù)據(jù)群組,同種類聚類就是把同一種類的數(shù)據(jù)放在一起,不同類聚類則是把不同種類的數(shù)據(jù)放在一起。,這樣就能反映出同種事物的共同屬性與不同事物間的差異屬性。通過這種方式,數(shù)據(jù)庫中的數(shù)據(jù)就會被劃分成許多有特定屬性的子集。

      (2)關(guān)聯(lián)分析。它反映了各數(shù)據(jù)單元間關(guān)聯(lián)的信息,如果一組數(shù)據(jù)多項屬性都存在關(guān)聯(lián),那么其中某一項的屬性就可根據(jù)其他一些屬性來判斷分析。

      (3)概念描述。概念描述就是對某類對象的本質(zhì)進(jìn)行探討分析,并總結(jié)這類對象的相關(guān)特點,概念描述有區(qū)別描述與特征描述兩種,前者描述不同類對象間的差別,后者則是描述某類對象的相同特征,最后形成一個類的特征性描述,并且只涉及這類對象中全部對象的共同特性。

      (4)預(yù)測趨勢與行為。數(shù)據(jù)挖掘系統(tǒng)能夠以時間為依據(jù),從過去或當(dāng)前的大型數(shù)據(jù)庫中自動挖掘未知信息來預(yù)測以后的信息。

      (5)偏差檢測。數(shù)據(jù)庫中的數(shù)據(jù)也會發(fā)生錯誤,從數(shù)據(jù)庫中檢測這些錯誤是非常重要的,因為錯誤中也包括許多隱藏的信息。

      4 數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用

      數(shù)字圖書館旨在將不同區(qū)域不同屬性的數(shù)字信息資源進(jìn)行整合從而達(dá)到用戶共享的效果。它主要是一種通過數(shù)字技術(shù)將信息進(jìn)行整合處理從而使得用戶方便瀏覽。根據(jù)處理對象的屬性差異,可以把數(shù)字圖書館數(shù)據(jù)挖掘基本分為三類:結(jié)構(gòu)挖掘、內(nèi)容挖掘與用戶使用記錄挖掘。結(jié)構(gòu)挖掘是從web文檔中結(jié)構(gòu)下手,除文檔中的超鏈接結(jié)構(gòu),更對文檔內(nèi)部結(jié)構(gòu)以及目錄路徑結(jié)構(gòu)進(jìn)行挖掘。內(nèi)容挖掘即對web文檔中的內(nèi)容信息進(jìn)行挖掘。而用戶使用記錄挖掘則是對于一些服務(wù)器上的用戶注冊信息購買記錄等數(shù)據(jù)進(jìn)行挖掘。

      4.1 進(jìn)行結(jié)構(gòu)挖掘

      對數(shù)字圖書館等結(jié)構(gòu)挖掘主要是通過網(wǎng)頁的鏈接和組織結(jié)構(gòu)從而能夠發(fā)現(xiàn)圖書館頁面的結(jié)構(gòu)模式并且對此進(jìn)行分類和聚類并加以分析,這樣可以使得更好的對網(wǎng)絡(luò)建設(shè)提供指導(dǎo)以及方便通過超鏈接等方式從而分析各學(xué)術(shù)未來發(fā)展。

      4.2 進(jìn)行內(nèi)容挖掘

      內(nèi)容挖掘主要包含如下幾點,首先是組織文獻(xiàn)數(shù)據(jù)。通過對數(shù)字圖書館內(nèi)文件的組織分類,將其分為若干個組,充分區(qū)分好各個組所涉及的內(nèi)容。這樣就可以大大縮短用戶搜索所需時間,用更短的時間找到更準(zhǔn)確的內(nèi)容。第二是對特征的自動提取和描述。可以由一個內(nèi)容分析器來從中分析并且提取充相關(guān)的內(nèi)容特征,用戶采取提取特征后才能更加準(zhǔn)確快速的實現(xiàn)信息定位。其三是自動采集整理專題信息。這主要是通過對圖書管內(nèi)的海量信息進(jìn)行了解,并且能夠從中挖掘到一些有規(guī)律的信息反映給用戶,從而使得用戶無需瀏覽大量無用信息,能夠自動捕捉提取概要信息。

      4.3 進(jìn)行用戶使用記錄挖掘

      由數(shù)字圖書館的海量訪問信息中歸納出圖書館用戶的訪問規(guī)律信息,運用關(guān)聯(lián)性法則與聚類法則,將不同類型用戶需求進(jìn)行分類總結(jié),提供針對服務(wù),從而提高瀏覽速度優(yōu)化用戶體驗。同時還應(yīng)當(dāng)鼓勵用戶建立自己的Web站點從而更好的了解到使用數(shù)字圖書用戶的了解意向,更能由此推析出未來發(fā)展趨勢,進(jìn)而研究出其行為規(guī)律。

      5 結(jié)語

      通過將數(shù)據(jù)挖掘技術(shù)引入數(shù)字圖書館這一舉措,能夠大大提高數(shù)字圖書館的信息資源量,優(yōu)化圖書館的信息服務(wù)的質(zhì)量,用戶可以更方便、更多的獲取想要的知識,同時圖書館的業(yè)務(wù)范圍也將得到大幅度擴展,為圖書館帶來巨大的經(jīng)濟與社會效益,達(dá)到雙贏的效果。但數(shù)據(jù)挖掘終究是一種新興的智能科技產(chǎn)物,它的發(fā)展還是有很多挑戰(zhàn)與難題需要面對。如何將數(shù)據(jù)挖掘系統(tǒng)更好的應(yīng)用到數(shù)字圖書館中還需要進(jìn)一步的探討與研究。

      參考文獻(xiàn)

      [1] 周文云.數(shù)據(jù)挖掘在數(shù)字圖書館個性化服務(wù)中的研究與應(yīng)用[J].軍民兩用技術(shù)與產(chǎn)品,2012(1):56.

      [2] 田瑞雪.國內(nèi)圖書館數(shù)據(jù)挖掘技術(shù)應(yīng)用研究述評[J].科技信息,2014(1):167.

      [3] 付紅偉,盧春,周楊.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書館中的應(yīng)用[J].軟件導(dǎo)刊,2013(1).endprint

      猜你喜歡
      數(shù)字圖書館數(shù)據(jù)挖掘應(yīng)用研究
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      高校數(shù)字圖書館資源整合的初探
      商情(2016年39期)2016-11-21 09:27:10
      基于云計算的數(shù)字圖書館建設(shè)與服務(wù)模式研究
      從谷歌案析數(shù)字圖書館對作品的使用行為
      “黑農(nóng)”大豆育種技術(shù)及應(yīng)用研究
      進(jìn)駐數(shù)字課堂的新興教學(xué)媒體
      AG接入技術(shù)在固網(wǎng)NGN的應(yīng)用研究
      分層教學(xué),兼顧全體
      考試周刊(2016年76期)2016-10-09 08:38:18
      芻議數(shù)字圖書館計算機網(wǎng)絡(luò)的安全技術(shù)及其防護策略
      鄂伦春自治旗| 额尔古纳市| 延庆县| 哈巴河县| 新民市| 顺昌县| 信丰县| 蛟河市| 沛县| 天气| 湛江市| 虎林市| 壶关县| 淳化县| 宣化县| 精河县| 仁化县| 兴国县| 邳州市| 丁青县| 晋中市| 南岸区| 同心县| 铜鼓县| 渭源县| 西城区| 阜新市| 互助| 专栏| 巴南区| 桑植县| 东海县| 承德市| 丰县| 沁水县| 白水县| 靖州| 达州市| 曲靖市| 蒲江县| 梓潼县|