• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    數(shù)字圖書館用戶信息獲取行為研究

    2015-03-03 02:58:23陳越都平平王靜
    中國教育網(wǎng)絡(luò) 2015年5期
    關(guān)鍵詞:應(yīng)用層原型報文

    文/陳越 都平平 王靜 等

    數(shù)字圖書館用戶信息獲取行為研究

    文/陳越都平平王靜等

    隨著數(shù)字圖書館的發(fā)展,用戶對文獻(xiàn)資源的利用方式逐漸轉(zhuǎn)向在線形式。據(jù)教育部圖工委統(tǒng)計, 國內(nèi)高校2012年館均電子文獻(xiàn)采購經(jīng)費180萬元,是2007年的2.2倍。在電子文獻(xiàn)資源的使用大幅增加的情況下,如何獲取數(shù)字圖書館用戶信息行為的相關(guān)信息,以便為數(shù)字圖書館信息平臺建設(shè)、電子資源配置提供依據(jù),成為值得研究的問題。

    對網(wǎng)絡(luò)用戶信息行為的定量研究方法有日志數(shù)據(jù)挖掘、系統(tǒng)軟件計數(shù)及網(wǎng)絡(luò)數(shù)據(jù)采集等途徑。這些方法在改善現(xiàn)有評估手段的同時,也不同程度的存在一定局限性,主要有以下幾點:

    1.數(shù)據(jù)獲取對業(yè)務(wù)環(huán)境的依賴性強(qiáng)。日志挖掘方法中,用戶端和服務(wù)器端緩存(Cache)、代理(Proxy)及防火墻地址轉(zhuǎn)換(NAT)等技術(shù)都會影響對數(shù)據(jù)的獲取和處理,從而削弱挖掘效果。獲取系統(tǒng)軟件計數(shù)數(shù)據(jù)時一般依賴電子資源數(shù)據(jù)庫廠商提供,實時性較差且有時難以獲得完整數(shù)據(jù)。

    2.行為信息提取內(nèi)容較少?;诜?wù)端系統(tǒng)軟件計數(shù)或日志挖掘的方法很難收集到用戶端個體信息,現(xiàn)行的基于網(wǎng)絡(luò)層統(tǒng)計的方法又側(cè)重于用戶行為模式的判斷,忽略行為內(nèi)容的分析。如基于snort的過量下載檢測方法,其處理的數(shù)據(jù)層次局限于網(wǎng)絡(luò)層,沒有對應(yīng)用層數(shù)據(jù)作進(jìn)一步處理,基于DPI的pdf文件下載檢測方法僅對特定類型進(jìn)行捕獲,同樣也沒有針對應(yīng)用層信息進(jìn)行分析和處理。

    針對上述局限性,本文利用應(yīng)用層特征分析技術(shù)對數(shù)字圖書館用戶信息獲取報文進(jìn)行分解處理,討論了相應(yīng)處理過程并用算法予以實現(xiàn),最終設(shè)計了系統(tǒng)原型并進(jìn)行了開發(fā)與測試。

    用戶信息獲取行為報文的應(yīng)用層特征分析與檢測

    報文的特征分析

    針對文獻(xiàn)獲取行為,利用Fiddler軟件,我們進(jìn)行了報文截取和分析。一個典型的下載請求如圖1所示。

    圖1 用戶請求報文結(jié)構(gòu)

    在該請求報文的首部字段中,即可獲取提供下載報文的主機(jī)域名或IP地址,如:Host: libvip.cumt.edu.cn

    對起始行中的Get請求進(jìn)行分析,其中包含如下信息:

    1.該下載請求的文件存放路徑:

    file=R1388765X

    巴彦县| 云霄县| 肇庆市| 子洲县| 宜君县| 青州市| 丹棱县| 乌什县| 三原县| 乾安县| 灯塔市| 新丰县| 库尔勒市| 蚌埠市| 安乡县| 紫阳县| 新乐市| 抚顺市| 分宜县| 沅江市| 伊金霍洛旗| 天峻县| 台州市| 珠海市| 普格县| 翼城县| 阿鲁科尔沁旗| 遂平县| 儋州市| 玉林市| 莱西市| 项城市| 仙游县| 颍上县| 宿迁市| 海林市| 临城县| 潼关县| 神农架林区| 定陶县| 临海市|