• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大數(shù)據(jù)下MongoDB數(shù)據(jù)庫檔案文檔存儲(chǔ)去重研究

    2015-11-17 16:47:46賀建英
    現(xiàn)代電子技術(shù) 2015年16期
    關(guān)鍵詞:大數(shù)據(jù)

    賀建英

    摘 要: 針對(duì)大數(shù)據(jù)下檔案存儲(chǔ)的現(xiàn)狀,通過分析存儲(chǔ)檔案文檔存在重復(fù)的原因,提出一種MongoDB存儲(chǔ)檔案文檔的方法,利用MongoDB的GridFs統(tǒng)一處理不同類型和大小的文件,定義3個(gè)集合分別存儲(chǔ)上傳者記錄、文件信息記錄和分塊文件內(nèi)容,提出存儲(chǔ)中通過文件MD5校驗(yàn)碼值是否相同來進(jìn)行去重研究,并實(shí)現(xiàn)去重的程序代碼,有一定的實(shí)際意義。采用的分布式存儲(chǔ)數(shù)據(jù)庫增強(qiáng)了檔案文檔存儲(chǔ)系統(tǒng)的可擴(kuò)展性。實(shí)驗(yàn)表明,該方法能有效地去除重復(fù)的檔案文檔,提高查詢效率。

    關(guān)鍵詞: MongoDB; MD5; 大數(shù)據(jù); 檔案文檔去重; GridFs

    中圖分類號(hào): TN911?34; TP311 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)16?0051?05

    Research on duplicated document removal in big data archive storage of MongoDB database

    HE Jianying

    (College of Computer, Sichuan University of Arts and Science, Dazhou 635000, China)

    Abstract: In allusion to the present situation in document storage in case of big data, the MongoDB method to save documents is proposed according to the reason analysis of duplication in document storage. GridFs of MongoDB is used to store different type documents. Three different assemblages are definited to store the uploader record, document information record and content of blocked documents respectively. A research is proposed for removing the duplication by checking whether MD5 check code is same or not. It is significant to realize program code for duplicated document removal. The distributive memory database was used to enhance the expandability of the document saving system. The experimental result shows that this method can remove the duplicated documents effectively and improve the efficiency of inquiry.

    Keywords: MongoDB; MD5; big data; file document duplicate removal; GridFs

    0 引 言

    隨著信息技術(shù)的飛躍發(fā)展,各國(guó)各地都在大力發(fā)展電子政務(wù)建設(shè)。在此環(huán)境下檔案局的檔案文檔也跨入了信息化存儲(chǔ)的行列。但檔案局的檔案類型種類較多,除了純文本的之外,還有圖片、聲音、視頻、PDF等各種類型的文檔,這些文檔都是非結(jié)構(gòu)化的數(shù)據(jù),在傳統(tǒng)的信息系統(tǒng)中,存放這些數(shù)據(jù)是比較困難的。因此在大數(shù)據(jù)環(huán)境下,設(shè)計(jì)信息化檔案存儲(chǔ)系統(tǒng)會(huì)首選非結(jié)構(gòu)化的數(shù)據(jù)庫,即NoSQL數(shù)據(jù)庫。利用NoSQL家族中的MongoDB數(shù)據(jù)庫作為存放檔案文檔的非結(jié)構(gòu)化數(shù)據(jù)是較為理想的。MongoDB對(duì)存放大量的非結(jié)構(gòu)化數(shù)據(jù)有很大的優(yōu)勢(shì),但因MongoDB本身就是非結(jié)構(gòu)化的,故在存放信息時(shí)會(huì)產(chǎn)生重復(fù)的數(shù)據(jù)。有人提出了像在關(guān)系數(shù)據(jù)庫中一樣建立關(guān)鍵索引來解決重復(fù)數(shù)據(jù)的問題,但在以文檔方式存儲(chǔ)的數(shù)據(jù)而言,當(dāng)數(shù)據(jù)很大時(shí),這種方式將會(huì)有弊端。本文研究的是在存儲(chǔ)檔案文檔之前就重復(fù)的數(shù)據(jù)進(jìn)行去重處理,然后再存入MongoDB數(shù)據(jù)庫中,這樣在數(shù)據(jù)庫中存放的將是非重復(fù)的數(shù)據(jù)。

    1 傳統(tǒng)的檔案存儲(chǔ)分析

    在原有的存儲(chǔ)檔案文檔信息系統(tǒng)中,主要是把文檔以文件的形式存放在文件系統(tǒng)中,然后用原數(shù)據(jù)信息建立一個(gè)檔案文件和數(shù)據(jù)庫的鏈接,并把該鏈接的路徑存儲(chǔ)在關(guān)系數(shù)據(jù)庫中,如表1和表2所示。

    通過表1和表2的分析可知,表2中filePathId與表1中的filePathId中的字段關(guān)聯(lián) ,這樣在訪問表1中的某個(gè)文件時(shí),只需要訪問表2中與filePathId字段關(guān)聯(lián)的記錄的fileRealPath的值即可訪問該文件。對(duì)于以文件系統(tǒng)方式存放的檔案文件會(huì)產(chǎn)生大量的重復(fù)文件。即使在存儲(chǔ)的時(shí)候能簡(jiǎn)單的通過人工的方式來檢查是否有重復(fù)的文件存放,但也不能大面積的檢查是否有重復(fù)的文件,在這種方式下,存儲(chǔ)空間很快會(huì)被耗盡,要靠不斷的增加存儲(chǔ)設(shè)備來解決大量檔案數(shù)據(jù)存放的問題,而且不利于管理,數(shù)據(jù)極其不安全,擴(kuò)展性較差。人們對(duì)此已有逐步的認(rèn)識(shí),也進(jìn)行了相應(yīng)的研究。本文的重點(diǎn)是利用MongoDB數(shù)據(jù)庫來存儲(chǔ)這些非結(jié)構(gòu)化的數(shù)據(jù),并且在存放之前就完成對(duì)重復(fù)檔案文檔的去重操作。

    表1 文件基本信息表

    表2 文件存儲(chǔ)路徑映射表

    2 基于MongoDB的文檔存儲(chǔ)模型

    2.1 MongoDB的存儲(chǔ)機(jī)制

    MongoDB是NoSql家族中的一員,具有模式自由等特性。它與關(guān)系數(shù)據(jù)庫一樣具有3個(gè)層次:分別是數(shù)據(jù)庫層、集合層、文檔對(duì)象層。分別對(duì)應(yīng)關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)庫、表和記錄。在MongoDB中文檔類似于JSON的鍵/值對(duì),集合則是一組文檔的集合,它們是無模式限制的。MongoDB數(shù)據(jù)庫非常適合實(shí)時(shí)數(shù)據(jù)的插入、查詢、更新、刪除及數(shù)據(jù)備份等操作。尤其適合充當(dāng)由幾十臺(tái)或者幾百臺(tái)服務(wù)器組成的集群數(shù)據(jù)庫?,F(xiàn)在大多數(shù)的地理規(guī)劃等領(lǐng)域都在利用MongoDB數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲(chǔ)。MongoDB數(shù)據(jù)庫不僅支持分布式系統(tǒng),它本身還支持分片存儲(chǔ)數(shù)據(jù)(Mongod)、客戶端請(qǐng)求(Clients)、集群配置(Config Server)和路由協(xié)議(Mongos)[1]。它采用的是內(nèi)存映射的方式作為存儲(chǔ)引擎,能有效地提高輸入/輸出的效率[2]。endprint

    2.2 MongoDB數(shù)據(jù)庫中重復(fù)數(shù)據(jù)來源

    目前的檔案管理系統(tǒng)還處于信息孤島的層面,各個(gè)省市的數(shù)據(jù)結(jié)構(gòu)不同,存放的方式也不同,惟一能統(tǒng)一的是從市級(jí)單位及其下級(jí)單位,如區(qū)、縣、鄉(xiāng)、鎮(zhèn)單位。利用檔案管理系統(tǒng)上傳檔案文件進(jìn)行存儲(chǔ)的也是這些相關(guān)單位。如果同一份檔案文檔被市級(jí)單位分發(fā)到其他單位,其他單位會(huì)把它作為重要檔案文檔給上傳到檔案管理系統(tǒng)中存儲(chǔ)起來,這樣就會(huì)產(chǎn)生多個(gè)重復(fù)的檔案文檔。而有部門在不知道的情況下,同一個(gè)人上傳了幾份相同的檔案文檔;或者利用shp文件批量上傳檔案文檔時(shí)遇到其他異常情況,沒有一次性的上傳完,下次再上傳的時(shí)候,又是從頭開始上傳,導(dǎo)致以前的檔案文檔被重復(fù)存儲(chǔ);或者在批量上傳的shp文檔本身被人為的不小心做成了含有重復(fù)的檔案文檔記錄,這樣導(dǎo)入shp文件時(shí)也會(huì)產(chǎn)生重復(fù)記錄。通過對(duì)以上情況的分析可知,檔案文檔存儲(chǔ)時(shí)在MongoDB數(shù)據(jù)庫中產(chǎn)生重復(fù)數(shù)據(jù)的來源主要有以下幾點(diǎn):同一個(gè)檔案文檔被不同的單位、部門重復(fù)上傳;同一個(gè)人對(duì)同一個(gè)檔案文檔上傳多次;批量檔案文檔準(zhǔn)備過程中人為的產(chǎn)生了重復(fù)文檔;批量上傳時(shí),中斷上傳,下次再上傳時(shí)將產(chǎn)生重復(fù)文檔。

    2.3 檔案存儲(chǔ)模型的建立

    檔案存儲(chǔ)時(shí)采用分布式的方式進(jìn)行上傳存儲(chǔ)的,各個(gè)市、區(qū)、縣、鄉(xiāng)、鎮(zhèn)的不同部門可能在不同的時(shí)間和地點(diǎn)對(duì)檔案文檔進(jìn)行上傳操作。數(shù)據(jù)庫采用MongoDB數(shù)據(jù)庫,其分布式存儲(chǔ)結(jié)構(gòu)如圖1所示。

    圖1 分布式數(shù)據(jù)庫存儲(chǔ)圖

    從圖1可以看出,各市、縣、鄉(xiāng)、鎮(zhèn)的用戶可以隨時(shí)在不同地點(diǎn)上傳檔案文檔到不同的MongoDB服務(wù)器中,操作方便。檔案文檔不同于一般的文檔,將遵循“誰操作誰負(fù)責(zé)”的原則。故將設(shè)置上傳者的權(quán)限,且將記錄上傳者的詳細(xì)信息:如上傳時(shí)間、地點(diǎn)等的一些信息。而對(duì)于檔案文檔本身而言其文件大小不能統(tǒng)一標(biāo)準(zhǔn)化,且檔案文檔的格式有差異,考慮到要處理數(shù)據(jù)大小和類型都可能不同的檔案文檔,本文將借助于MongoDB的GridFs來處理,GridFs是一種處理大文件的規(guī)范,可以存儲(chǔ)上百萬的文件而不用擔(dān)心其擴(kuò)容性[3]。在MongoDB中存放數(shù)據(jù)時(shí)將涉及到3個(gè)集合:userInfo.users,fileInfo.files,fileContent.chunks。

    userInfo.users集合用來存放上傳檔案文檔的上傳者信息,其結(jié)構(gòu)如下:

    {

    “_ID”: //惟一值

    “UserID”: //用戶的ID值

    “UploadGeography”: //上傳的地理位置

    “GeoType”: //地址位置的類型,如城//鎮(zhèn)、居民點(diǎn)等

    “UploadGeoName”: //地理名稱

    “UploadGeoNameID”:< String > //地理名稱主鍵值

    “UploadGeoAddress”: //上傳的城鎮(zhèn)地址等

    “CityName”: //城鎮(zhèn)名稱

    “CountyName”:< String > //縣級(jí)名稱

    “TownName”:< String > //鄉(xiāng)鎮(zhèn)名稱

    “StreetName”:< String > //街道名稱

    “GeoPts”: //地理坐標(biāo)

    “Type”:< String > //坐標(biāo)類型

    “GeoCoordinates”:< String > //坐標(biāo)位置

    “UploadFileID”:< objectID> //上傳存放文件信息的ID編號(hào)

    “UploadTime”:< timestamp > //上傳者操作的

    //體時(shí)間

    “UploadCount”: //同一文檔上傳的次數(shù)

    }

    fileInfo.files集合中存放信息的結(jié)構(gòu)為:

    {

    “fileID”:

    //存放文件ID值與userInfo.users集合中upLoadFileID對(duì)應(yīng)

    “fileLength”:< num > //文件的大小

    “fileChuckSize”:< num > //文件分塊存儲(chǔ)的分塊數(shù)

    “fileName”:< String > //上傳文件的名稱

    “fileMD5”:< hash > //文件內(nèi)容的MD5校驗(yàn)碼值

    “fileCountType”:< String > //文件的類型

    }

    fileContent.chucks集合中存放上傳文檔的結(jié)構(gòu)如下:

    {

    “f_ID”:< objectID > //惟一的值

    “fileID”:< objectID > //與fileInfo.files集

    //合中的fileID對(duì)應(yīng)

    “countOrder”:< num > //存放上傳文件的第幾個(gè)分塊

    “countData”:< binary > //存放文檔對(duì)應(yīng)分塊部分//的二進(jìn)制內(nèi)容

    }

    集合fileInfo.files中的fileID與集合userInfo.users集合中的upLaodfileID相同,用來關(guān)聯(lián)上傳的文件信息。集合fileContent.chucks中的fileID與集合fileInfo.files中的fileID相同,用來關(guān)聯(lián)文件存放的具體內(nèi)容,根據(jù)上面3個(gè)集合中結(jié)構(gòu)的設(shè)計(jì),當(dāng)一個(gè)具有操作權(quán)限的用戶在某一地點(diǎn)上傳了某個(gè)檔案文件后,將記錄該用戶上傳的詳細(xì)信息:如操作者,上傳的具體區(qū)、縣、鄉(xiāng)的詳細(xì)地址,上傳的日期、文件名、文件的大小、長(zhǎng)度、類型等。當(dāng)該用戶再次上傳相同的檔案文檔時(shí),根據(jù)表的關(guān)聯(lián)查找,將會(huì)做出已在同一地點(diǎn)或不同地點(diǎn)已經(jīng)上傳了相同的檔案文件的提示信息。

    3 MongoDB中的去重算法

    本算法的設(shè)計(jì)思想是,根據(jù)上傳的檔案文檔判斷,無論是否已經(jīng)被上傳過,都會(huì)存儲(chǔ)上傳檔案文檔操作者的相關(guān)信息,即生成一個(gè)userInfo.users集合中的一條記錄。上傳檔案文件時(shí)為了節(jié)省服務(wù)器的開銷和資源,所上傳文檔的MD5 校驗(yàn)碼值的計(jì)算都會(huì)在客戶端進(jìn)行。在客戶端計(jì)算并上傳檔案文檔的MD5校驗(yàn)碼值后再在分布式存儲(chǔ)數(shù)據(jù)庫中查找遍歷fileInfo.files中的每一條記錄,查看每條記錄中存儲(chǔ)的檔案文檔的MD5碼值是否與將要上傳的檔案文檔的MD5碼值相同,如果不同,則將在userInfo.user集合中存儲(chǔ)一條上傳者信息的記錄,并且把該記錄中的“UploadCount”值設(shè)置為1。同時(shí)生成集合fileInfo.files中的一條記錄,在該記錄中通過“fileMD5”存儲(chǔ)檔案文檔的MD5碼值。獲得要上傳的檔案文檔的大小fileSize,確定檔案分塊存儲(chǔ)的總塊數(shù)fileChuckSize。在算法中為了規(guī)范,不管文件的大小和類型,均采用統(tǒng)一大?。╢ixedSize)的分塊對(duì)檔案文檔進(jìn)行存放,即總分塊數(shù)如下所示:

    fileChuckSize=(fileSize%fixedSize)?(fileSize/fixedSize):

    (fileSize/fixedSize+1)

    并把該值記錄到fileInfo.files集合中對(duì)應(yīng)記錄中。然后對(duì)檔案文檔進(jìn)行上傳并對(duì)文檔內(nèi)容按固定的分塊大小存放到fileContent.chucks集合中,在該集合里會(huì)存儲(chǔ)fileChuckSize條記錄。如果要上傳的檔案文檔的MD5碼值和分布式數(shù)據(jù)庫中存儲(chǔ)的fileInfo.files集合中存儲(chǔ)的某個(gè)記錄的fileMD5值相同,則取出該條記錄對(duì)應(yīng)的fileID值并把該值存放到一個(gè)臨時(shí)存儲(chǔ)字段tempFileID中,已備后期使用。然后提取上傳者的信息和tempFileID的值組合成userInfo.users集合中的一條記錄,并與集合中的其他記錄進(jìn)行比較,如果有相同的記錄,則在該條記錄的UploadCount值加1。而組合的這條記錄將不再存儲(chǔ)在userInfo.users集合中。其中UploadCount值加1是判斷該用戶是否經(jīng)常在同一個(gè)地點(diǎn)上傳相同的檔案文檔。

    如果在該集合中沒有相同的記錄,則存儲(chǔ)該組合好的記錄。下次在訪問這個(gè)檔案文檔時(shí),通過userInfo.users集合中的upLoadfileID關(guān)聯(lián)到fileInfo.files集合,再通過fileInfo.files集合中的fileID關(guān)聯(lián)到fileContent.chucks集合,則順利訪問到需要的檔案文檔,其過程流程圖如圖2所示。

    根據(jù)算法流程圖,定義幾個(gè)類UserInfo,F(xiàn)ileInfo,F(xiàn)ileContent分別對(duì)應(yīng)3個(gè)集合,定義操作數(shù)據(jù)庫的類DBObj,定義去重的類RemoveRepeat。

    圖2 算法流程圖

    去重的關(guān)鍵代碼實(shí)現(xiàn)如下:

    / *在fileInfo.files集合中查找有沒有與指定的hashMD5碼相同的記錄存在*/

    private String findByFileMD5(hash fileMD5) {

    String tempFileID=null;

    List repeatList = new ArrayList();

    GeoEntiy ge = null;

    /*取得傳遞的fileMD5參數(shù) */

    String json = "{fileMD5 : \"" + fileMD5 + "\"}";

    DBObj fileMD5 = (DBObj) JSON.parse(json);

    DBCursor dbcursor = getDBColl().find(fileMD5);

    /* 根據(jù)坐標(biāo)點(diǎn)查詢的記錄數(shù)量*/

    int rowCount = dbcursor.count();

    /*如果結(jié)果大于0則說明有相同的MD5碼存在,則存放該記錄的fileID值*/

    if (rowCount > 0) {

    tempFileID= rowCount.get("fileID").toString();

    }

    }

    return tempFileID;

    }

    public List findRepeatData() {

    /* 構(gòu)建數(shù)據(jù)查重的MongoDB語句,并進(jìn)行查重 */

    DBObj groupObj = new BasicDBObj("$group", JSON.parse(" {_ID: { "

    + " UserID : \"$UserID\" , "

    + " UploadGeography : \"$UploadGeography\" "

    + " GeoType : \"$GeoType\" , "

    + " UploadGeoName : \"$UploadGeoName\" , "

    + " UploadGeoNameID: \"$UploadGeoNameID\" , "

    + " UploadGeoAddress : \"$UploadGeoAddress\" , "

    + " CityName : \"$CityName\" , "

    + " CountyName : \"$CountyName\" , "

    + " TownName : \"$TownName\" , "

    + " StreetName : \"$StreetName\" , "

    + " GeoPts : \"$GeoPts\" , "+ " Type : \"$Type\" , "

    + " GeoCoordinates: \"$UploadFileID\" , "

    + " UploadTime : \"$UploadTime\" , "

    + " UploadCount: \"$UploadCount\");

    // 排序條件 ?? 按照關(guān)鍵字_ID降序排列

    DBObj sortObj = new BasicDBObj("$sort",JSON.parse("{ _ID:?1 }"));

    // 確定疑似重復(fù)數(shù)據(jù)的條件返回的結(jié)果為1

    DBObj matchObj = new BasicDBObj("$match",JSON.parse("{ _ID:?1 });

    // key code

    AggregationOutput output = getDBColl().aggregate(groupObj, sortObj,matchObj);

    Iterator iter = output.results().iterator();

    //獲取查詢結(jié)果集

    List list = new ArrayList();

    while (iter.hasNext()) {

    DBObj dbo = iter.next();

    String _idValue = dbo.get("_ID").toString();

    //通過key,獲取對(duì)應(yīng)的value

    if (_idValue != null) {//如果查詢結(jié)果不為空,則將結(jié)

    果轉(zhuǎn)換

    JSONObj pointJson = com.alibaba.fastjson.JSON.parseObject(_idValue);

    // 如果存在坐標(biāo)點(diǎn)或有想太多 其他值,則獲取

    if (pointJson.get("GeoPts") != null) {

    list.addAll(findByPoints(pointJson.get("GeoPts").toString()));

    }

    }

    }

    return list;

    }

    在代碼中定義了findByFileMD5()方法判斷在已經(jīng)存儲(chǔ)的fileInfo.files集合的記錄中有沒有與將要上傳的檔案文檔的MD5校驗(yàn)碼相同的記錄存在。定義方法findRepeatData()用來檢查有無重復(fù)上傳檔案文檔上傳者信息,即判斷在usersInfo.user中有沒有重復(fù)的數(shù)據(jù)記錄,這些方法在批量導(dǎo)入數(shù)據(jù)記錄時(shí)也會(huì)調(diào)用逐一判斷。

    4 實(shí)驗(yàn)結(jié)果與分析

    本實(shí)驗(yàn)使用Hadoop作為分布式文件系統(tǒng)運(yùn)行在不同地理位置的10臺(tái)主機(jī)組成的集群上,在Window7系統(tǒng)中,采用MyEclipse8.5做Java代碼開發(fā),分布式數(shù)據(jù)庫MongoDB作數(shù)據(jù)存儲(chǔ),采用的是8核CPU,8 GB內(nèi)存,320 GB硬盤。批量導(dǎo)入使用的是shp文件。shp文件的格式定義同集合文件的格式。對(duì)單個(gè)的文檔上傳進(jìn)行驗(yàn)證無誤外,為了對(duì)更多的數(shù)據(jù)進(jìn)行驗(yàn)證,在shp文件中模擬產(chǎn)生10萬,20萬,30萬數(shù)據(jù)。結(jié)果如圖3所示。

    圖3 實(shí)驗(yàn)數(shù)據(jù)測(cè)試結(jié)果圖

    該方法在數(shù)據(jù)去重中達(dá)到90%以上,去重效果還比較理想。算法采用的是分布式文件系統(tǒng),對(duì)文件去重效率較高,且系統(tǒng)具有相應(yīng)的擴(kuò)展性。

    5 結(jié) 語

    本算法中采用分布式文件系統(tǒng)和分布式數(shù)據(jù)庫MongoDB對(duì)檔案文檔進(jìn)行存儲(chǔ)和去重,利用MongoDB數(shù)據(jù)庫的GridFs來處理不同類型和大小的檔案文檔,統(tǒng)一對(duì)檔案文檔進(jìn)行處理。提出利用了去重的算法思想,并通過實(shí)驗(yàn)?zāi)M測(cè)試去重效果較為理性。該方法具有一定的可行性。為以后大數(shù)據(jù)的存儲(chǔ)的去重有一定的借鑒性。

    參考文獻(xiàn)

    [1] 雷德龍,郭殿升,陳崇成,等.基于MongoDB的矢量空間數(shù)據(jù)云存儲(chǔ)與處理系統(tǒng)[J].地理信息科學(xué),2014(7):508?514.

    [2] 吳秀君.面向電子政務(wù)的MongoDB與MySQL混合存儲(chǔ)策略[J].計(jì)算機(jī)與現(xiàn)代化,2014(8):62?65.

    [3] CHODOROW Kristina.MongoDB 權(quán)威指南[M].北京:人民郵電出版社,2010.

    [4] 郭武士.基于MongoDB GridFS的圖片存儲(chǔ)方案的實(shí)現(xiàn)[J].四川工程職業(yè)技術(shù)學(xué)院學(xué)報(bào),2011(4):41?43.

    [5] 衛(wèi)啟云,渠偉勇,黃鴻,等.城市地理編碼的部門信息共享與應(yīng)用實(shí)踐[J].測(cè)繪通報(bào),2014(10):101?104.

    [6] 陳超,王亮,閆浩文,等.一種基于NoSQL 的地圖瓦片數(shù)據(jù)存儲(chǔ)技術(shù)[J].測(cè)繪科學(xué),2013(1):142?143.

    [7] MANBER U. Finding similar files in a large file system [C]// Proceedings of the Winter 1994 USENIX Technical Conference. San Fransisco, CA, USA: [s.n.], 1994: 1?10.

    [8] BRODER A Z. On the resemblance and containment of documents [C]// Proceedings of the International Conference on Compression and Complexity of Sequences. Salerno, Italy: [s.n.], 1997: 21?29.

    [9] 孫有軍,張大興.海量圖片文件存儲(chǔ)去重技術(shù)研究[J].計(jì)算機(jī)應(yīng)用與軟件,2014(4):56?57.

    [10] RIVEST R. The MD5 message?digest algorithm [J]. RFC 1321, Internet Engineering Task Force, 1992, 22(1) : 15?26.

    [11] 成功,李小正,趙全軍.一種網(wǎng)絡(luò)爬蟲系統(tǒng)中URL去重方法的研究[J].中國(guó)新技術(shù)新產(chǎn)品,2014(12):23?24.

    [12] 楊祥清.存儲(chǔ)系統(tǒng)數(shù)據(jù)去重策略研究[J].信息通信,2014(8):132?133.

    [13] 高翔,李兵.中文短文本去重方法研究[J].計(jì)算機(jī)工程與應(yīng)用,2014(16):196?201.

    猜你喜歡
    大數(shù)據(jù)
    基于在線教育的大數(shù)據(jù)研究
    “互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
    基于大數(shù)據(jù)的小微電商授信評(píng)估研究
    大數(shù)據(jù)時(shí)代新聞的新變化探究
    商(2016年27期)2016-10-17 06:26:00
    淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
    今傳媒(2016年9期)2016-10-15 23:35:12
    “互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書出版的影響和推動(dòng)作用
    今傳媒(2016年9期)2016-10-15 22:09:11
    大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
    新聞世界(2016年10期)2016-10-11 20:13:53
    基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
    科技視界(2016年20期)2016-09-29 10:53:22
    數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
    黄色毛片三级朝国网站| 亚洲,欧美精品.| 亚洲精品久久成人aⅴ小说| 黑丝袜美女国产一区| www.www免费av| 久久久国产成人精品二区| 丁香六月欧美| 久久欧美精品欧美久久欧美| 国产精品av久久久久免费| 国产亚洲av嫩草精品影院| 人成视频在线观看免费观看| 亚洲专区国产一区二区| 日日夜夜操网爽| 午夜成年电影在线免费观看| 国产精品 欧美亚洲| 午夜激情福利司机影院| 精品免费久久久久久久清纯| 免费高清视频大片| 国产av一区二区精品久久| 一进一出好大好爽视频| 国产在线观看jvid| 欧美av亚洲av综合av国产av| 黄网站色视频无遮挡免费观看| 黄色成人免费大全| 午夜激情av网站| 一级a爱视频在线免费观看| 成人特级黄色片久久久久久久| 波多野结衣高清无吗| 琪琪午夜伦伦电影理论片6080| 亚洲成av片中文字幕在线观看| 一个人观看的视频www高清免费观看 | 好看av亚洲va欧美ⅴa在| 伊人久久大香线蕉亚洲五| 长腿黑丝高跟| 99热6这里只有精品| 一级毛片精品| 婷婷精品国产亚洲av在线| 99在线人妻在线中文字幕| 国产精华一区二区三区| 欧美一级a爱片免费观看看 | 亚洲精品粉嫩美女一区| 午夜精品久久久久久毛片777| xxx96com| 每晚都被弄得嗷嗷叫到高潮| 久久久国产精品麻豆| 在线观看日韩欧美| 看片在线看免费视频| av免费在线观看网站| 日韩 欧美 亚洲 中文字幕| 欧美成人性av电影在线观看| 国产片内射在线| 黄色成人免费大全| 亚洲熟妇中文字幕五十中出| 国产日本99.免费观看| 色播在线永久视频| 亚洲av成人不卡在线观看播放网| 成人亚洲精品一区在线观看| 老司机午夜福利在线观看视频| 无限看片的www在线观看| 亚洲自拍偷在线| 俄罗斯特黄特色一大片| 亚洲精品国产一区二区精华液| 岛国在线观看网站| 日本 av在线| 久久精品91无色码中文字幕| 午夜免费鲁丝| 欧美又色又爽又黄视频| а√天堂www在线а√下载| 亚洲第一欧美日韩一区二区三区| 久热爱精品视频在线9| 国产又爽黄色视频| 亚洲成av片中文字幕在线观看| 国产野战对白在线观看| 成人18禁高潮啪啪吃奶动态图| 精品一区二区三区四区五区乱码| x7x7x7水蜜桃| x7x7x7水蜜桃| 在线看三级毛片| 亚洲一区高清亚洲精品| www.精华液| 50天的宝宝边吃奶边哭怎么回事| 国产在线精品亚洲第一网站| 真人做人爱边吃奶动态| 搡老熟女国产l中国老女人| 亚洲国产精品合色在线| 色老头精品视频在线观看| 99久久久亚洲精品蜜臀av| 免费av毛片视频| 久久精品成人免费网站| 成人一区二区视频在线观看| 无遮挡黄片免费观看| 99国产综合亚洲精品| 首页视频小说图片口味搜索| 日本成人三级电影网站| 国产午夜精品久久久久久| 在线观看免费午夜福利视频| 国产免费男女视频| 免费av毛片视频| 99riav亚洲国产免费| 国产成人av激情在线播放| 亚洲国产欧美日韩在线播放| 日本免费a在线| 欧美一级毛片孕妇| 在线观看www视频免费| 亚洲精品美女久久久久99蜜臀| 国产熟女午夜一区二区三区| 中文资源天堂在线| 午夜a级毛片| 久久久久九九精品影院| 99久久99久久久精品蜜桃| 日韩成人在线观看一区二区三区| 黑丝袜美女国产一区| 男人的好看免费观看在线视频 | 国产极品粉嫩免费观看在线| 国产成+人综合+亚洲专区| 欧美在线黄色| 欧美乱妇无乱码| 波多野结衣巨乳人妻| 村上凉子中文字幕在线| 亚洲精品久久国产高清桃花| 欧美一级a爱片免费观看看 | 日本a在线网址| 亚洲男人的天堂狠狠| 亚洲五月色婷婷综合| 亚洲熟妇中文字幕五十中出| 亚洲成a人片在线一区二区| 国产精品乱码一区二三区的特点| 免费在线观看完整版高清| 免费在线观看黄色视频的| 99久久99久久久精品蜜桃| 午夜福利18| 极品教师在线免费播放| 国产精品美女特级片免费视频播放器 | 88av欧美| 亚洲成国产人片在线观看| 欧美精品亚洲一区二区| 亚洲精品久久成人aⅴ小说| 91麻豆精品激情在线观看国产| 亚洲精品国产精品久久久不卡| 黄频高清免费视频| 欧美日韩一级在线毛片| 亚洲在线自拍视频| 少妇熟女aⅴ在线视频| 伊人久久大香线蕉亚洲五| 中文字幕另类日韩欧美亚洲嫩草| 成人18禁高潮啪啪吃奶动态图| 午夜福利高清视频| 国产精品久久久久久人妻精品电影| 制服人妻中文乱码| 国产亚洲av高清不卡| 亚洲精品国产精品久久久不卡| 国产97色在线日韩免费| 婷婷精品国产亚洲av| 精品久久久久久久久久久久久 | 搡老妇女老女人老熟妇| 男女那种视频在线观看| 波多野结衣av一区二区av| 亚洲五月天丁香| xxx96com| 美女午夜性视频免费| 日韩高清综合在线| 国产熟女xx| 男人舔女人下体高潮全视频| 一进一出抽搐动态| 女同久久另类99精品国产91| 香蕉丝袜av| 国产久久久一区二区三区| 国产午夜福利久久久久久| 日韩视频一区二区在线观看| 最近最新中文字幕大全电影3 | 后天国语完整版免费观看| 亚洲午夜理论影院| 日韩欧美三级三区| 婷婷丁香在线五月| 亚洲全国av大片| 51午夜福利影视在线观看| 91大片在线观看| 此物有八面人人有两片| 久久精品成人免费网站| 一本大道久久a久久精品| 色综合亚洲欧美另类图片| 日韩有码中文字幕| 国产视频一区二区在线看| 国产精品日韩av在线免费观看| 男人操女人黄网站| 人妻丰满熟妇av一区二区三区| 少妇 在线观看| 波多野结衣av一区二区av| 国产av不卡久久| 大型av网站在线播放| 精品熟女少妇八av免费久了| 久久人妻av系列| 变态另类成人亚洲欧美熟女| 国产精品影院久久| 男女床上黄色一级片免费看| 亚洲一码二码三码区别大吗| x7x7x7水蜜桃| 怎么达到女性高潮| 亚洲欧美精品综合一区二区三区| 久久久国产欧美日韩av| 国内揄拍国产精品人妻在线 | 午夜激情福利司机影院| 国产在线精品亚洲第一网站| 欧美绝顶高潮抽搐喷水| 婷婷精品国产亚洲av| 精品国产超薄肉色丝袜足j| 亚洲成人免费电影在线观看| 国产精品1区2区在线观看.| 亚洲精品一区av在线观看| 亚洲激情在线av| or卡值多少钱| 日本 欧美在线| 首页视频小说图片口味搜索| 9191精品国产免费久久| 黄网站色视频无遮挡免费观看| 婷婷六月久久综合丁香| 国产日本99.免费观看| 变态另类成人亚洲欧美熟女| 日本a在线网址| 怎么达到女性高潮| 亚洲激情在线av| 国产亚洲欧美98| 国产亚洲精品久久久久久毛片| 日韩视频一区二区在线观看| 窝窝影院91人妻| 日韩精品免费视频一区二区三区| 国产区一区二久久| 午夜两性在线视频| 男女视频在线观看网站免费 | 麻豆久久精品国产亚洲av| 日本a在线网址| 窝窝影院91人妻| 午夜福利一区二区在线看| 免费在线观看成人毛片| 亚洲 欧美 日韩 在线 免费| 免费观看人在逋| 一级毛片女人18水好多| 1024香蕉在线观看| 欧美中文综合在线视频| 97碰自拍视频| av福利片在线| 国产午夜福利久久久久久| 国产高清有码在线观看视频 | 在线国产一区二区在线| 午夜影院日韩av| 日韩视频一区二区在线观看| 非洲黑人性xxxx精品又粗又长| 亚洲av中文字字幕乱码综合 | 午夜精品在线福利| 日本三级黄在线观看| 又黄又粗又硬又大视频| 男人舔奶头视频| 变态另类丝袜制服| 欧美日韩一级在线毛片| 久久青草综合色| 女同久久另类99精品国产91| 日韩欧美一区视频在线观看| 亚洲黑人精品在线| 国产麻豆成人av免费视频| 真人做人爱边吃奶动态| 一进一出抽搐gif免费好疼| av有码第一页| 午夜久久久久精精品| 精品久久久久久,| 欧美色视频一区免费| 国产精品一区二区精品视频观看| 亚洲精品中文字幕一二三四区| 久久 成人 亚洲| 国产91精品成人一区二区三区| 美女 人体艺术 gogo| 美国免费a级毛片| 亚洲自拍偷在线| 日韩大码丰满熟妇| 一本大道久久a久久精品| 国产精品久久久人人做人人爽| 99在线视频只有这里精品首页| 日韩国内少妇激情av| 亚洲国产欧洲综合997久久, | 国产一区在线观看成人免费| 日韩视频一区二区在线观看| 欧美中文日本在线观看视频| 一级黄色大片毛片| 99在线人妻在线中文字幕| 女人被狂操c到高潮| 国产精品亚洲美女久久久| 一a级毛片在线观看| 欧美在线一区亚洲| 精品国产乱子伦一区二区三区| 精品久久久久久久毛片微露脸| 午夜福利成人在线免费观看| 国产一级毛片七仙女欲春2 | 黑人操中国人逼视频| 一级a爱片免费观看的视频| 成年人黄色毛片网站| 色综合婷婷激情| 久久人人精品亚洲av| 中亚洲国语对白在线视频| 亚洲天堂国产精品一区在线| 日韩欧美 国产精品| 香蕉丝袜av| 久久热在线av| 午夜福利在线在线| 欧美zozozo另类| 色av中文字幕| 成人一区二区视频在线观看| 动漫黄色视频在线观看| 亚洲av成人av| 99久久国产精品久久久| 欧美日本视频| 国产免费av片在线观看野外av| 母亲3免费完整高清在线观看| 婷婷丁香在线五月| 好看av亚洲va欧美ⅴa在| 欧美av亚洲av综合av国产av| 中国美女看黄片| 免费在线观看日本一区| 老熟妇仑乱视频hdxx| av在线天堂中文字幕| 热99re8久久精品国产| 搞女人的毛片| 日韩欧美三级三区| 99热这里只有精品一区 | 亚洲av中文字字幕乱码综合 | 免费一级毛片在线播放高清视频| 欧美激情极品国产一区二区三区| 国产成人欧美在线观看| 久久国产乱子伦精品免费另类| 热99re8久久精品国产| 每晚都被弄得嗷嗷叫到高潮| 99精品久久久久人妻精品| 久久久久久免费高清国产稀缺| 欧美激情极品国产一区二区三区| 国产视频内射| 午夜成年电影在线免费观看| 中文资源天堂在线| 亚洲 欧美 日韩 在线 免费| 国产一区二区在线av高清观看| 国产精品精品国产色婷婷| 两性夫妻黄色片| 午夜日韩欧美国产| ponron亚洲| 日韩视频一区二区在线观看| 国产视频内射| 欧美日韩瑟瑟在线播放| 久久精品国产亚洲av香蕉五月| 日日干狠狠操夜夜爽| 国产私拍福利视频在线观看| 亚洲精华国产精华精| 久久久久久久久免费视频了| 好男人电影高清在线观看| 这个男人来自地球电影免费观看| 国产视频一区二区在线看| 中国美女看黄片| 亚洲精品一卡2卡三卡4卡5卡| 色播亚洲综合网| 少妇熟女aⅴ在线视频| 久久久精品欧美日韩精品| 精品高清国产在线一区| 欧美性猛交╳xxx乱大交人| 午夜免费鲁丝| 美女高潮到喷水免费观看| 国内精品久久久久精免费| 亚洲精品美女久久久久99蜜臀| 黄色a级毛片大全视频| 国产精品二区激情视频| 一级毛片精品| 国产一区二区激情短视频| 国产区一区二久久| 午夜免费成人在线视频| 国产精品亚洲av一区麻豆| 午夜免费成人在线视频| www国产在线视频色| 美女大奶头视频| 我的亚洲天堂| 黄片小视频在线播放| 最近最新中文字幕大全电影3 | 亚洲一卡2卡3卡4卡5卡精品中文| 国产高清视频在线播放一区| 日本一区二区免费在线视频| 女人高潮潮喷娇喘18禁视频| 国产麻豆成人av免费视频| 18禁观看日本| bbb黄色大片| 男人舔女人的私密视频| 国产视频内射| 美女大奶头视频| 成人三级做爰电影| 他把我摸到了高潮在线观看| 久久国产精品人妻蜜桃| 黄色视频不卡| 一进一出好大好爽视频| www.熟女人妻精品国产| 黄片小视频在线播放| 我的亚洲天堂| videosex国产| 国产亚洲精品一区二区www| 欧美日韩福利视频一区二区| 少妇粗大呻吟视频| 在线观看免费午夜福利视频| 亚洲精品一区av在线观看| xxxwww97欧美| 日韩 欧美 亚洲 中文字幕| 国产成人啪精品午夜网站| 国产蜜桃级精品一区二区三区| 黄色丝袜av网址大全| 欧美激情 高清一区二区三区| www.熟女人妻精品国产| 亚洲国产欧洲综合997久久, | av视频在线观看入口| 波多野结衣高清无吗| 一本一本综合久久| 曰老女人黄片| 国产91精品成人一区二区三区| 91麻豆精品激情在线观看国产| 99riav亚洲国产免费| 99国产精品99久久久久| 日韩欧美三级三区| 两人在一起打扑克的视频| 日韩中文字幕欧美一区二区| 90打野战视频偷拍视频| 国产激情欧美一区二区| a级毛片a级免费在线| 成人永久免费在线观看视频| 欧美在线一区亚洲| 精品国产亚洲在线| 日韩有码中文字幕| 亚洲欧美日韩无卡精品| 成人18禁在线播放| 哪里可以看免费的av片| 麻豆一二三区av精品| 日韩视频一区二区在线观看| 激情在线观看视频在线高清| 国产亚洲av嫩草精品影院| 欧美一区二区精品小视频在线| 日韩一卡2卡3卡4卡2021年| 国产在线观看jvid| 中文字幕最新亚洲高清| 午夜精品久久久久久毛片777| 亚洲国产高清在线一区二区三 | 久久人妻av系列| 亚洲国产欧洲综合997久久, | 欧美在线一区亚洲| 动漫黄色视频在线观看| 久久久精品国产亚洲av高清涩受| 天天躁狠狠躁夜夜躁狠狠躁| 99热这里只有精品一区 | 国产精品99久久99久久久不卡| 久久久久九九精品影院| 大型黄色视频在线免费观看| 国产v大片淫在线免费观看| 黄色女人牲交| 免费观看精品视频网站| 人妻久久中文字幕网| 一a级毛片在线观看| 国产人伦9x9x在线观看| 欧美激情极品国产一区二区三区| 欧美乱色亚洲激情| 母亲3免费完整高清在线观看| 国产视频一区二区在线看| 国产真实乱freesex| 欧美又色又爽又黄视频| 国产精品久久电影中文字幕| 亚洲熟妇中文字幕五十中出| 国产伦在线观看视频一区| 夜夜爽天天搞| 黄色 视频免费看| 99久久精品国产亚洲精品| 久久国产精品男人的天堂亚洲| 天堂影院成人在线观看| 女生性感内裤真人,穿戴方法视频| 国产熟女xx| 亚洲国产欧美一区二区综合| 老司机靠b影院| av片东京热男人的天堂| 久久精品夜夜夜夜夜久久蜜豆 | 欧美日本视频| 日本 欧美在线| 免费在线观看影片大全网站| 国产单亲对白刺激| 久久中文看片网| 99国产精品99久久久久| 久久久久久久精品吃奶| 亚洲va日本ⅴa欧美va伊人久久| 免费观看人在逋| 中文字幕精品免费在线观看视频| 性色av乱码一区二区三区2| 欧美激情久久久久久爽电影| 日韩欧美免费精品| 亚洲av片天天在线观看| 日韩视频一区二区在线观看| 成人永久免费在线观看视频| 99国产综合亚洲精品| 美国免费a级毛片| 黑丝袜美女国产一区| netflix在线观看网站| 欧美黑人欧美精品刺激| 91老司机精品| 亚洲成人国产一区在线观看| 午夜久久久久精精品| 国产欧美日韩一区二区三| 久久久久精品国产欧美久久久| 欧美黑人精品巨大| 法律面前人人平等表现在哪些方面| av欧美777| 久久伊人香网站| 午夜福利一区二区在线看| 久久伊人香网站| 久久天堂一区二区三区四区| 日韩欧美国产在线观看| 日韩欧美三级三区| 亚洲在线自拍视频| 天堂动漫精品| 啦啦啦韩国在线观看视频| 国产黄a三级三级三级人| 中文字幕av电影在线播放| 国产亚洲欧美在线一区二区| 可以在线观看毛片的网站| 琪琪午夜伦伦电影理论片6080| 中文字幕高清在线视频| 国产精品爽爽va在线观看网站 | 巨乳人妻的诱惑在线观看| 特大巨黑吊av在线直播 | 欧洲精品卡2卡3卡4卡5卡区| 亚洲片人在线观看| svipshipincom国产片| 国产欧美日韩一区二区三| 亚洲在线自拍视频| 十八禁网站免费在线| 精品熟女少妇八av免费久了| 我的亚洲天堂| 国产成年人精品一区二区| 亚洲欧美日韩高清在线视频| 亚洲精品美女久久av网站| 亚洲欧美日韩高清在线视频| 亚洲熟妇熟女久久| 国产激情偷乱视频一区二区| 免费高清在线观看日韩| 亚洲五月色婷婷综合| 亚洲欧美激情综合另类| 日韩欧美一区二区三区在线观看| 91在线观看av| 18美女黄网站色大片免费观看| 亚洲精品在线观看二区| 成人18禁高潮啪啪吃奶动态图| 国产精品av久久久久免费| 日本黄色视频三级网站网址| 久久草成人影院| 亚洲精品美女久久av网站| 曰老女人黄片| 非洲黑人性xxxx精品又粗又长| 欧美午夜高清在线| 国产成+人综合+亚洲专区| 成年人黄色毛片网站| 啦啦啦免费观看视频1| 国产精品电影一区二区三区| 啪啪无遮挡十八禁网站| 欧美又色又爽又黄视频| 观看免费一级毛片| 51午夜福利影视在线观看| 12—13女人毛片做爰片一| 99热这里只有精品一区 | 亚洲人成网站在线播放欧美日韩| 夜夜夜夜夜久久久久| 男女床上黄色一级片免费看| 岛国在线观看网站| 黄色片一级片一级黄色片| 国产欧美日韩一区二区三| 好看av亚洲va欧美ⅴa在| 制服诱惑二区| 日本 av在线| 黑人操中国人逼视频| 青草久久国产| 国产精品香港三级国产av潘金莲| 看黄色毛片网站| www.www免费av| 成人三级黄色视频| 日韩大尺度精品在线看网址| 日韩av在线大香蕉| 婷婷精品国产亚洲av在线| 久久久久久久久免费视频了| 国产成人精品无人区| 久久精品人妻少妇| 中文在线观看免费www的网站 | 校园春色视频在线观看| 国产亚洲欧美在线一区二区| 亚洲人成网站在线播放欧美日韩| 可以免费在线观看a视频的电影网站| 99在线人妻在线中文字幕| 亚洲专区国产一区二区| 久久久国产成人精品二区| 亚洲精品粉嫩美女一区| 黑人巨大精品欧美一区二区mp4| 性欧美人与动物交配| 久久香蕉国产精品| 久久香蕉精品热| 精品日产1卡2卡| 国产精品爽爽va在线观看网站 | 麻豆av在线久日| 精品久久久久久,| 国产激情偷乱视频一区二区| 俺也久久电影网| 久久国产精品男人的天堂亚洲| 一级毛片高清免费大全| 国产精华一区二区三区| 一区福利在线观看| av电影中文网址| 在线观看日韩欧美| 久久婷婷人人爽人人干人人爱| 亚洲一区二区三区不卡视频| av福利片在线| 久久中文看片网| 老熟妇乱子伦视频在线观看| e午夜精品久久久久久久| 19禁男女啪啪无遮挡网站| 熟女电影av网|