• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于大數(shù)據(jù)的圖書(shū)館學(xué)術(shù)資源深度挖掘 與個(gè)性化推送服務(wù)研究

      2017-07-01 08:59:34周紅磊王扣潘婉秋蓋琳張立娜
      現(xiàn)代交際 2017年12期
      關(guān)鍵詞:高校圖書(shū)館大數(shù)據(jù)

      周紅磊+王扣+潘婉秋+蓋琳++張立娜

      摘要:在大數(shù)據(jù)迅速發(fā)展的浪潮下,用戶對(duì)圖書(shū)館智能化要求愈加明顯,本文通過(guò)對(duì)學(xué)術(shù)資源的深度挖掘和個(gè)性化推送服務(wù)的深入研究,探討了如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用到圖書(shū)館個(gè)性化推送服務(wù)中,希望為讀者提供更高質(zhì)量的信息服務(wù)。

      關(guān)鍵詞:大數(shù)據(jù) 高校圖書(shū)館 深度挖掘 個(gè)性化推送服務(wù)

      中圖分類(lèi)號(hào):G2507文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-5349(2017)12-0095-02

      當(dāng)前,高校圖書(shū)館在提升智能化服務(wù)程度的基礎(chǔ)上,逐漸加強(qiáng)了針對(duì)知識(shí)信息的傳播、挖掘服務(wù)功能,就目前文獻(xiàn)主題搜索情況來(lái)看,高校圖書(shū)館還存在著一些不足,它沒(méi)有主動(dòng)挖掘師生的需求,缺乏針對(duì)用戶的需求信息的深度推薦以及沒(méi)有全面考慮用戶的個(gè)性化需求。因此,圖書(shū)館未來(lái)的重點(diǎn)研究方向應(yīng)為如何進(jìn)行個(gè)性化的推送服務(wù),并將其與數(shù)據(jù)挖掘技術(shù)緊密聯(lián)系起來(lái),使其在幫助師生快速找到自己所需的知識(shí)和信息的同時(shí),還能夠提高學(xué)生的學(xué)習(xí)效率。

      一、大數(shù)據(jù)時(shí)代圖書(shū)館信息資源深度挖掘關(guān)鍵技術(shù)

      (一)基于 Hadoop 的分布式數(shù)據(jù)挖掘技術(shù)

      Hadoop 主要是由編程模型MapReduce和分布式文件系統(tǒng) HDFS兩個(gè)核心部分組成,分布式文件系統(tǒng)HDFS為大規(guī)模數(shù)據(jù)集上的應(yīng)用提供可靠的分布式文件訪問(wèn)。HDFS 與 MapReduce 緊密配合,構(gòu)成了Hadoop 的基礎(chǔ),使它能夠?qū)⒊绦蚍指畛啥鄠€(gè)獨(dú)立的單元,并分發(fā)到不同的節(jié)點(diǎn),通過(guò)各個(gè)節(jié)點(diǎn)的計(jì)算能力完成整個(gè)程序的運(yùn)作。[1]

      (二)向量空間模型

      在信息服務(wù)中計(jì)算資源相似度時(shí)使用了向量空間模型。該模型是60年代末Salton等人最先提出的, 是計(jì)算兩個(gè)文檔相似度較為經(jīng)典的模型,文檔在該模型中被表示為向量,因此,文檔相似度的計(jì)算問(wèn)題也就可以轉(zhuǎn)變成為歐式空間中向量的計(jì)算問(wèn)題。向量空間模型是應(yīng)用于信息過(guò)濾,信息擷取,索引以及評(píng)估相關(guān)性的代數(shù)模型,主要的計(jì)算思想是對(duì)所有的信息內(nèi)容先采用分詞處理,然后把信息資源細(xì)分為獨(dú)立的詞語(yǔ)組合。

      (三)聚類(lèi)分析

      聚類(lèi)分析就是從一個(gè)聚類(lèi)變量中提取N種特征,并將這N種特征存放到一個(gè)N維向量之中,利用得到的N維向量空間與其他聚類(lèi)向量做相似性對(duì)比,逐漸形成按照某種規(guī)則進(jìn)行分類(lèi)的方式,使得在同一規(guī)則下的一組聚類(lèi)變量成為同類(lèi),同類(lèi)之間的特征最為相近,不同類(lèi)之間的特征相距較遠(yuǎn)。聚類(lèi)算法常應(yīng)用于高校圖書(shū)館分析讀者行為特征的模塊,在對(duì)讀者訪問(wèn)的同一類(lèi)期刊資源數(shù)據(jù)時(shí),往往需要用聚類(lèi)的方法進(jìn)行相似性聚合。

      (四)關(guān)聯(lián)規(guī)則算法

      關(guān)聯(lián)規(guī)則是通過(guò)發(fā)現(xiàn)事物之間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)從一件事情的發(fā)生來(lái)預(yù)測(cè)另一件事件的發(fā)生,從而能夠更好地了解和掌握事物發(fā)展的規(guī)律等。算法通過(guò)對(duì)所提供的數(shù)據(jù)進(jìn)行多次掃描,根據(jù)所指定的支持度而產(chǎn)生頻繁項(xiàng)集,之后根據(jù)指定的置信度來(lái)產(chǎn)生關(guān)聯(lián)規(guī)則集。圖書(shū)館建設(shè)已經(jīng)開(kāi)始進(jìn)入資源整合與面向用戶的數(shù)字化服務(wù)階段,通過(guò)關(guān)聯(lián)規(guī)則挖掘能夠進(jìn)行更高層次的分析,以便更好地為讀者服務(wù)。

      二、大數(shù)據(jù)時(shí)代圖書(shū)館個(gè)性化推送服務(wù)

      對(duì)高校圖書(shū)館而言,數(shù)字資源的積累經(jīng)歷了傳統(tǒng)的數(shù)字化到原生數(shù)字資源的發(fā)展過(guò)程[2],在這一過(guò)程中,大部分學(xué)生僅是利用搜索工具查找目的書(shū)籍的位置所在,學(xué)生在閱讀各類(lèi)文獻(xiàn)書(shū)籍沒(méi)有過(guò)多經(jīng)驗(yàn),其瀏覽文獻(xiàn)質(zhì)量好壞的評(píng)定就是如何運(yùn)用關(guān)鍵字和相關(guān)數(shù)據(jù)處理技術(shù)從大量的差異化的數(shù)據(jù)中,既省時(shí)省力又可以精確地獲得自己想要的高質(zhì)量文獻(xiàn)書(shū)籍。

      (一)建立用戶個(gè)性化分析模型

      根據(jù)學(xué)生的信息搜索以及借書(shū)記錄,對(duì)其個(gè)性化服務(wù)需求進(jìn)行進(jìn)一步剖析,利用先進(jìn)的數(shù)據(jù)挖掘和分析處理技術(shù)深度挖掘大量豐富的網(wǎng)上資源,充分采集用戶需要的信息,在用戶登錄圖書(shū)館網(wǎng)站上及時(shí)推送出相關(guān)高質(zhì)量書(shū)籍,提高用戶所需書(shū)籍的獲取效率。

      (二)為圖書(shū)館規(guī)劃提供數(shù)據(jù)支持

      為用戶提供滿意、高效的閱讀體驗(yàn),始終是高校圖書(shū)館的服務(wù)理念。但高校圖書(shū)館可能存在人員分配不足、數(shù)據(jù)調(diào)研不全面等相關(guān)問(wèn)題,不能及時(shí)了解到多數(shù)學(xué)生所關(guān)注的書(shū)籍,以至于達(dá)到一個(gè)書(shū)籍資源豐富仍舊不能滿足用戶的閱讀需求。建立高校個(gè)性化推送服務(wù),通過(guò)分析用戶借閱書(shū)籍?dāng)?shù)據(jù),可以判斷學(xué)生閱讀文獻(xiàn)書(shū)籍的總體趨勢(shì),為圖書(shū)館挖掘出大部分用戶所關(guān)注的書(shū)籍、近期的熱門(mén)書(shū)籍,從而對(duì)圖書(shū)館館藏書(shū)籍進(jìn)行有效判斷和書(shū)籍的及時(shí)更新,并合理采購(gòu)各式文獻(xiàn)書(shū)籍和熱門(mén)網(wǎng)絡(luò)文獻(xiàn),能夠提高讀者對(duì)圖書(shū)館館藏資源的利用率。

      (三)建立專(zhuān)業(yè)文獻(xiàn)數(shù)據(jù)庫(kù)

      同一專(zhuān)業(yè),研究課題相似的用戶有著共同的專(zhuān)業(yè)文獻(xiàn)需求,因此高校圖書(shū)館可以為不同專(zhuān)業(yè)的學(xué)生提供更為細(xì)化的個(gè)性化推送服務(wù)。我們可以建立關(guān)于不同專(zhuān)業(yè)的文獻(xiàn)存儲(chǔ)數(shù)據(jù)庫(kù),專(zhuān)業(yè)教師均可登錄校內(nèi)網(wǎng)上圖書(shū)館,在各自專(zhuān)業(yè)的數(shù)據(jù)庫(kù)目錄內(nèi)容下構(gòu)建專(zhuān)業(yè)化的、課題化的閱讀內(nèi)容,為用戶推薦與其所學(xué)專(zhuān)業(yè)相關(guān)的、實(shí)用度更高的專(zhuān)業(yè)書(shū)籍。

      三、數(shù)據(jù)深度挖掘在圖書(shū)館個(gè)性化推送服務(wù)中的應(yīng)用

      (一)在讀者個(gè)性化推送內(nèi)容上的應(yīng)用

      為使這種服務(wù)變得更加便利與快速,可以利用深度挖掘技術(shù)收集讀者的相關(guān)信息,并對(duì)這些大數(shù)據(jù)進(jìn)行深度挖掘,分析讀者的喜好以及需求,利用關(guān)聯(lián)規(guī)則等算法將這一龐大數(shù)據(jù)分解成不同的小數(shù)據(jù),進(jìn)而運(yùn)用聚類(lèi)分析等算法分析讀者所需要的信息,建立完善的讀者專(zhuān)屬的數(shù)據(jù)庫(kù),并在此過(guò)濾掉無(wú)用的信息,使得信息的利用率達(dá)到最大,從而為讀者推送所需要、具有針對(duì)性的信息,為讀者在圖書(shū)館這一龐大的數(shù)據(jù)庫(kù)中尋找所需信息提供了便利。

      (二)圖書(shū)館學(xué)術(shù)資源信息化的應(yīng)用

      隨著大數(shù)據(jù)時(shí)代的發(fā)展,對(duì)信息化的需求也越來(lái)越高,而圖書(shū)館不僅僅有館藏資源,還有豐富的網(wǎng)絡(luò)資源,為使數(shù)據(jù)龐大的圖書(shū)館信息獲取變得快速、準(zhǔn)確,這就需要利用深度挖掘中的向量空間模型與聚類(lèi)分析等算法對(duì)圖書(shū)館中的數(shù)據(jù)進(jìn)行整合,為讀者用戶提供快速精確的檢索服務(wù),并根據(jù)讀者用戶的檢索與借閱記錄等,通過(guò)關(guān)聯(lián)分析,為用戶推送所期望的信息與服務(wù),使得圖書(shū)館學(xué)術(shù)資源的信息化變得更加豐富完善。

      (三)個(gè)性化服務(wù)質(zhì)量與多元化發(fā)展的應(yīng)用

      在滿足讀者用戶需求的同時(shí),也使得圖書(shū)館的學(xué)術(shù)資源得以改進(jìn)與完善,但在收集讀者信息的同時(shí),有許多無(wú)用的噪聲信息,需要將這些噪聲信息排除在每個(gè)用戶信息的數(shù)據(jù)庫(kù)之外,這就需要利用數(shù)據(jù)的深度挖掘技術(shù),將大數(shù)據(jù)中的數(shù)據(jù)進(jìn)行分析,處理掉噪聲數(shù)據(jù)。在數(shù)據(jù)收集過(guò)程中,每個(gè)用戶所需的內(nèi)容也不同,這就需要將這些大數(shù)

      據(jù)整合處理為具有針對(duì)性的小數(shù)據(jù)庫(kù)。正是這些小數(shù)據(jù)庫(kù)為每個(gè)用戶進(jìn)行個(gè)性化的推送服務(wù),并且這些小數(shù)據(jù)庫(kù)的容量有限,可以更好地保護(hù)讀者用戶的隱私信息。其次,利用深度挖掘的關(guān)聯(lián)規(guī)則等算法分析整合讀者用戶對(duì)推送內(nèi)容的反饋,及時(shí)更新數(shù)據(jù)庫(kù),為讀者提供更貼心的服務(wù),并不斷豐富數(shù)字圖書(shū)館的資源,使其向多元化發(fā)展。

      四、結(jié)語(yǔ)

      通過(guò)研究我們發(fā)現(xiàn),在大數(shù)據(jù)時(shí)代下,圖書(shū)館仍然存在著用戶個(gè)性化信息需求與大量信息資源之間信息不對(duì)稱(chēng)的矛盾,即用戶個(gè)性化閱讀服務(wù)質(zhì)量需求高,而數(shù)據(jù)深度挖掘和發(fā)現(xiàn)用戶需求方面研究少等問(wèn)題。所以圖書(shū)館必須及時(shí)轉(zhuǎn)變服務(wù)角色與技術(shù),在依托數(shù)據(jù)挖掘平臺(tái)的支持,根據(jù)深度數(shù)據(jù)挖掘的關(guān)鍵技術(shù),建立用戶個(gè)性化分析模型,為圖書(shū)館提供數(shù)據(jù)支持,建立專(zhuān)業(yè)文獻(xiàn)數(shù)據(jù)庫(kù)等方式來(lái)最大限度地提高用戶滿意度和圖書(shū)館服務(wù)性能。高校圖書(shū)館應(yīng)以數(shù)據(jù)挖掘技術(shù)為工具,用戶個(gè)性化需求和服務(wù)為核心,實(shí)現(xiàn)具有特色化、智能化、多元化、主動(dòng)化的新型圖書(shū)館,為廣大讀者用戶帶來(lái)更高效、更便利、更精確的服務(wù)。

      參考文獻(xiàn):

      [1]李浩.基于Hadoop的分布式數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D].電子科技大學(xué),2015.

      [2]蔡新紅.大數(shù)據(jù)時(shí)代圖書(shū)館信息資源個(gè)性化服務(wù)模式研究[J].科技創(chuàng)新導(dǎo)報(bào),2014(17):195-196.

      責(zé)任編輯:楊國(guó)棟

      猜你喜歡
      高校圖書(shū)館大數(shù)據(jù)
      高校圖書(shū)館閱讀推廣案例分析
      科技視界(2016年21期)2016-10-17 19:32:37
      微信公眾平臺(tái)在高校圖書(shū)館信息服務(wù)中的應(yīng)用研究
      科技視界(2016年21期)2016-10-17 19:25:20
      高校圖書(shū)館閱讀推廣活動(dòng)研究
      商(2016年27期)2016-10-17 06:38:27
      試論高校圖書(shū)館在網(wǎng)絡(luò)環(huán)境沖擊下的人文建設(shè)
      商(2016年27期)2016-10-17 06:30:59
      大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      新聞世界(2016年10期)2016-10-11 20:13:53
      高校圖書(shū)館閱讀推廣實(shí)踐探討
      科技視界(2016年20期)2016-09-29 13:17:57
      高校圖書(shū)館電子資源的宣傳與推廣
      科技視界(2016年20期)2016-09-29 11:22:45
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      玛纳斯县| 信阳市| 新津县| 乐业县| 长宁县| 扶余县| 定日县| 遵化市| 灵武市| 开远市| 南靖县| 伊宁市| 濉溪县| 平顺县| 兴义市| 绵阳市| 枞阳县| 酉阳| 青川县| 曲麻莱县| 贡嘎县| 同江市| 酒泉市| 桑植县| 楚雄市| 原平市| 云南省| 建始县| 苍山县| 东兰县| 阿城市| 竹山县| 白沙| 治多县| 灵武市| 麦盖提县| 西林县| 湟中县| 巧家县| 彭水| 承德县|