• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于改進(jìn)HDFS的冠字號(hào)小文件分布式存儲(chǔ)研究

    2014-07-28 18:38:57徐俊王慶華趙云龍
    電腦知識(shí)與技術(shù) 2014年17期

    徐俊 王慶華 趙云龍

    摘要:針對(duì)冠字號(hào)小圖片存儲(chǔ)到HDFS系統(tǒng)中帶來(lái)的訪問(wèn)瓶頸問(wèn)題,改進(jìn)了原有的HDFS系統(tǒng),新提出的分布式系統(tǒng)機(jī)制是充分基于文件相關(guān)性(File Correlation)進(jìn)行合并處理的HDFS(FCHDFS)。由于HDFS中所有的文件都是由單一的主節(jié)點(diǎn)服務(wù)器托管-NameNode,每個(gè)存儲(chǔ)到HDFS的文件在NameNode主存儲(chǔ)器中都需要存儲(chǔ)它的元數(shù)據(jù),這必然導(dǎo)致小文件數(shù)量越大HDFS性能就越差。存儲(chǔ)和管理大量的小文件,對(duì)NameNode是一個(gè)沉重的負(fù)擔(dān)??梢源鎯?chǔ)在HDFS的文件數(shù)量是受到NameNode的內(nèi)存大小約束。為了提高存儲(chǔ)和訪問(wèn)HDFS上的冠字號(hào)小文件的效率,該文提出了一個(gè)基于文件關(guān)聯(lián)性的小文件高效處理機(jī)制。在這種方法中,按照客戶(hù)和時(shí)間區(qū)分,一組相關(guān)的文件相結(jié)合為一個(gè)大文件,從而減少文件數(shù)目。而新建的索引機(jī)制能從相應(yīng)的聯(lián)合文件中訪問(wèn)單個(gè)文件。實(shí)驗(yàn)結(jié)果表明,F(xiàn)CHDFS大大減少主節(jié)點(diǎn)內(nèi)存中元數(shù)據(jù)數(shù)量,也提高了存儲(chǔ)和訪問(wèn)大量小文件的效率。

    關(guān)鍵詞:Hadoop;小文件;HDFS;文件合并

    中圖分類(lèi)號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)17-3980-06

    Research on Distributed Memory of Crown Size Small Files Based on Improved HDFS

    XU Jun1,2, WANG Qing-hua1, ZHAO Yun-long1

    ( 1. ATM Research Institute, GRGBanking,Guangzhou Radio Group, Guangzhou 510663, China; 2. College of Computer, South China Normal University, Guangzhou 510631, China )

    Abstract: Aiming at the access bottleneck problem caused by storage crown size small picture to the HDFS system, improved the existing HDFS system, new mechanism of distributed system is fully based on files correlation (File Correlation) and combined these correlated files. Because of all the files in HDFS are made by the master node server hosting the -NameNode single, each stored in the HDFS file needs to store the metadata it in NameNode main memory, which is bound to lead to a larger number of small file HDFS performance worse. For small file storage and management, NameNode is a heavy burden. The number of HDFS stored documents is constrainted by NameNode memory size. In addition, HDFS does not consider the correlation between files. In order to improve the efficiency of small file storage and access of HDFS, this paper proposes an efficient mechanism for handling small files based on crown size file association. In this method, according to differentiate customer and time, a group of related files are combined into one big file, thereby reducing the number of files. To access a single file from the file corresponding to the new index mechanism. The experimental results show that, FCHDFS greatly reduce the number of master nodes in data memory, and also improve the efficiency of storage and access to a large number of small files.

    Key words: Hadoop; small file; HDFS; file merge

    根據(jù)目前各大銀行總行的需求,冠字號(hào)信息需要集中到總行管理,冠字號(hào)圖像采用網(wǎng)點(diǎn)節(jié)點(diǎn)機(jī)保存,支持保存至少3個(gè)月的全行數(shù)據(jù),數(shù)據(jù)量達(dá)幾十億上百億條。需求分析表明,記錄的產(chǎn)生速度和記錄的數(shù)量都滿(mǎn)足典型的大數(shù)據(jù)特征[1,2],已經(jīng)接近或超過(guò)傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)的處理能力,而隨著系統(tǒng)的持久運(yùn)行和業(yè)務(wù)擴(kuò)大,記錄數(shù)量還有持續(xù)增長(zhǎng)的趨勢(shì)。因此分析系統(tǒng)的架構(gòu)應(yīng)以成熟的大數(shù)據(jù)系統(tǒng)架構(gòu)為基礎(chǔ)才能良好的實(shí)現(xiàn)其業(yè)務(wù)能力的要求。因此需要用到Hadoop[3]的分布時(shí)文件存儲(chǔ)系統(tǒng)(HDFS)[4],然而采集的鈔票冠字號(hào)圖片是平均大小只有幾K的小文件,但存儲(chǔ)大量的小文件到HDFS中,NameNode節(jié)點(diǎn)需要存儲(chǔ)元數(shù)據(jù)將需要較大內(nèi)存開(kāi)銷(xiāo)。在這種情況下,當(dāng)應(yīng)用程序訪問(wèn)大量的這些小文件時(shí),單個(gè)NameNode節(jié)點(diǎn)成為處理元數(shù)據(jù)請(qǐng)求的瓶頸。此外,NameNode節(jié)點(diǎn)的內(nèi)存大小限制HDFS可以存儲(chǔ)的文件數(shù)量。對(duì)于科學(xué)和許多其他需要產(chǎn)生了大量小文件應(yīng)用而言,正因?yàn)榇讼拗屏薍DFS被用來(lái)作為一個(gè)主要的數(shù)據(jù)存儲(chǔ)方式,也無(wú)法收益于Hadoop的數(shù)據(jù)處理能力,小文件處理問(wèn)題[5-7]也逐漸成為并行分布系統(tǒng)研究的一個(gè)熱點(diǎn)。endprint

    Hadoop是一個(gè)開(kāi)源項(xiàng)目,開(kāi)發(fā)可靠性和可擴(kuò)展的分布式計(jì)算軟件。Hadoop框架已被廣泛應(yīng)用在各種集群構(gòu)建的大型高性能的系統(tǒng)中。Hadoop架構(gòu)由Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce[8,9]編程模型,在商業(yè)的計(jì)算機(jī)集群中執(zhí)行數(shù)據(jù)密集型計(jì)算。Hadoop集群通過(guò)簡(jiǎn)單地增加商業(yè)機(jī)器,擴(kuò)充了計(jì)算能力、存儲(chǔ)容量和I/O帶寬。

    Hadoop分布式文件系統(tǒng)(HDFS)是Hadoop文件系統(tǒng)組件的核心子項(xiàng)目。靈感來(lái)自谷歌的分布式文件系統(tǒng)(GFS)[10],HDFS為寫(xiě)一次讀很多次的模式。HDFS是主從式架構(gòu),一個(gè)單一的主節(jié)點(diǎn)-NameNode和多個(gè)從數(shù)據(jù)節(jié)點(diǎn)-DataNode。NameNode節(jié)點(diǎn)管理HDFS元數(shù)據(jù)和文件系統(tǒng)配置數(shù)據(jù)。元數(shù)據(jù)是保存在NameNode的主內(nèi)存中,保證客戶(hù)端快速訪問(wèn)和讀寫(xiě)請(qǐng)求。在HDFS中,數(shù)據(jù)節(jié)點(diǎn)DataNode存儲(chǔ)文件和滿(mǎn)足讀/寫(xiě)請(qǐng)求,并按照NameNode節(jié)點(diǎn)指令進(jìn)行。每個(gè)存儲(chǔ)到HDFS文件都會(huì)在任何一個(gè)數(shù)據(jù)節(jié)點(diǎn)做備份,以確保數(shù)據(jù)可靠性和可用性,這些分布在集群中的副本能確保被快速訪問(wèn)。

    在本文中,針對(duì)冠字號(hào)小圖片存儲(chǔ)到HDFS系統(tǒng)中帶來(lái)的訪問(wèn)瓶頸問(wèn)題,改進(jìn)了原有的HDFS系統(tǒng),通過(guò)考慮每次交易產(chǎn)生的一組冠字號(hào)圖片文件的關(guān)聯(lián)性,通過(guò)合并小文件操作,該文的FCHDFS提供一個(gè)解決方案來(lái)減少節(jié)點(diǎn)的內(nèi)存元數(shù)據(jù)。這需要一種在HDFS存儲(chǔ)小文件的有效方式?;镜姆椒ㄊ菍蝹€(gè)客戶(hù)相關(guān)的小文件合成一個(gè)大文件。這有助于減少文件數(shù)量,從而減少元數(shù)據(jù)的存儲(chǔ)。新的索引機(jī)制能夠從合并的文件訪問(wèn)單個(gè)文件。此外,基于文件的相關(guān)性合并操作將有助于減少NameNode元數(shù)據(jù)請(qǐng)求負(fù)載,相關(guān)文件的索引也被緩存到客戶(hù)端,達(dá)到更好的讀請(qǐng)求的性能。

    1 背景

    Hadoop是一個(gè)開(kāi)源框架,為數(shù)據(jù)密集型的應(yīng)用提供分布式的數(shù)據(jù)存儲(chǔ)和處理能力。它包括兩個(gè)主要部分組成:Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce分布式計(jì)算。

    1)Hadoop分布式文件系統(tǒng)

    Hadoop分布式文件系統(tǒng)提供了在集群中對(duì)文件全局統(tǒng)一訪問(wèn)。HDFS由兩類(lèi)服務(wù)器節(jié)點(diǎn)組成,即NameNode節(jié)點(diǎn)和DataNode節(jié)點(diǎn)。NameNode是集中式單一的服務(wù)器,負(fù)責(zé)維護(hù)文件在HDFS中的元數(shù)據(jù)。它也維護(hù)了配置數(shù)據(jù),比如對(duì)文件每一塊的副本數(shù)量稱(chēng)為備份參數(shù),塊的大小和其它HDFS參數(shù)等。每個(gè)塊作為一個(gè)單獨(dú)的文件存儲(chǔ)在節(jié)點(diǎn)的本地文件系統(tǒng)中。作為數(shù)據(jù)節(jié)點(diǎn)抽象了底層的文件系統(tǒng)的細(xì)節(jié),所有節(jié)點(diǎn)的特征不需要是相同的。數(shù)據(jù)節(jié)點(diǎn)負(fù)責(zé)按照NameNode要求存儲(chǔ),檢索和刪除數(shù)據(jù)塊。在HDFS中文件被分成塊,每個(gè)塊的大小默認(rèn)是64 MB,被復(fù)制和存儲(chǔ)在多個(gè)數(shù)據(jù)節(jié)點(diǎn)中。NameNode在主存儲(chǔ)器里維護(hù)了每個(gè)存儲(chǔ)在HDFS中的文件的元數(shù)據(jù)。這包括存儲(chǔ)文件名之間的映射,相應(yīng)每個(gè)文件在數(shù)據(jù)節(jié)點(diǎn)中的塊。因此,客戶(hù)創(chuàng)建、寫(xiě)入、讀取或刪除文件的每個(gè)請(qǐng)求都需要通過(guò)NameNode節(jié)點(diǎn)。使用元數(shù)據(jù)存儲(chǔ),NameNode節(jié)點(diǎn)必須為來(lái)自客戶(hù)的每次請(qǐng)求導(dǎo)向到適當(dāng)?shù)臄?shù)據(jù)節(jié)點(diǎn)集合上。然后客戶(hù)端直接與數(shù)據(jù)節(jié)點(diǎn)通信來(lái)執(zhí)行文件操作。

    單個(gè)NameNode節(jié)點(diǎn),在主存儲(chǔ)器中存儲(chǔ)元數(shù)據(jù),當(dāng)它必須處理大量的小文件時(shí)將成為一個(gè)瓶頸。小文件指的是任何尺寸小于HDFS塊大小的文件。這個(gè)問(wèn)題,稱(chēng)為小文件的問(wèn)題,阻礙了許多潛在的應(yīng)用使用Hadoop框架的好處。

    2)小文件的問(wèn)題

    為了滿(mǎn)足客戶(hù)端快捷、高效的請(qǐng)求服務(wù),NameNode在主內(nèi)存中存儲(chǔ)整個(gè)元數(shù)據(jù)。文件的每個(gè)塊都需要對(duì)應(yīng)元數(shù)據(jù)被存儲(chǔ)。當(dāng)一個(gè)存儲(chǔ)的文件大小大于塊大小時(shí),存儲(chǔ)的元數(shù)據(jù)量由文件大小決定。然而當(dāng)大量小于塊大小的小文件需要存儲(chǔ)時(shí),每個(gè)文件都需要以塊的形式存儲(chǔ),因此相應(yīng)存儲(chǔ)的元數(shù)據(jù)數(shù)量也是相當(dāng)高的。例如假設(shè)每一個(gè)元數(shù)據(jù)占用150個(gè)字節(jié),那么對(duì)于一個(gè)1 GB的文件,分為16個(gè)不同64MB塊,就需要2.4KB的空間存儲(chǔ)元數(shù)據(jù)。然而對(duì)于10500個(gè)大小為100KB的文件(共1 GB),大約需要1.5MB空間存儲(chǔ)元數(shù)據(jù)。因此大量的小文件占用文件系統(tǒng)的空間小,但相應(yīng)的元數(shù)據(jù)卻需要占用較大的NameNode節(jié)點(diǎn)的主內(nèi)存量空間。這樣的情況是對(duì)集群的可用空間不合理的應(yīng)用。此外,訪問(wèn)大量的這些小文件的結(jié)果是會(huì)造成NameNode訪問(wèn)瓶頸的。這有礙于HDFS在各種應(yīng)用的最佳使用。

    2 本文小文件處理機(jī)制

    本文提出的考慮文件關(guān)聯(lián)性的分布式文件系統(tǒng)(FCHDFS)提供了一種小文件合并操作和改進(jìn)的索引機(jī)制。為提高HDFS處理小文件的效率,F(xiàn)CHDFS中四項(xiàng)技術(shù)發(fā)揮了重要的作用。它們分別是文件合并,文件映射,文件提取。如圖1所示系統(tǒng)的總體架構(gòu)描述處理這些業(yè)務(wù)模塊的位置。

    下面的部分詳細(xì)描述了這些技術(shù)。

    1)文件合并

    HDFS小文件的主要問(wèn)題是NameNode節(jié)點(diǎn)需要較大的內(nèi)存空間用于管理這些小文件。HDFS不會(huì)從一個(gè)大的文件中區(qū)分小的文件,因此無(wú)論文件大小都需要存儲(chǔ)相同大小的元數(shù)據(jù)。NameNode節(jié)點(diǎn)在HDFS中維護(hù)兩種類(lèi)型的元數(shù)據(jù)即文件的元數(shù)據(jù)和文件塊的元數(shù)據(jù)。文件的元數(shù)據(jù)包括了文件的文件名、文件在名稱(chēng)空間樹(shù)中的位置、文件大小、修改時(shí)間、訪問(wèn)時(shí)間、所有的細(xì)節(jié)和文件權(quán)限等信息。塊的元數(shù)據(jù)包括關(guān)于這些塊的信息和存儲(chǔ)位置。

    文件合并技術(shù)減少了NameNode節(jié)點(diǎn)處理小文件需要存儲(chǔ)的文件元數(shù)據(jù)和塊元數(shù)據(jù)。該技術(shù)是基于這個(gè)事實(shí),客戶(hù)端把文件合并到一起上傳到HDFS系統(tǒng)與每一個(gè)文件單獨(dú)上傳到HDFS,所需要的文件元數(shù)據(jù)大小是相同的。文件合并保證NameNode節(jié)點(diǎn)只保存組合文件的元數(shù)據(jù)并不是所有存在于它的小文件的元數(shù)據(jù)。組成文件的名稱(chēng)和塊信息作為一個(gè)特殊的數(shù)據(jù)結(jié)構(gòu)在NameNode節(jié)點(diǎn)里維護(hù)處理。

    使用FCHDFS創(chuàng)建文件時(shí),文件合并過(guò)程在客戶(hù)端進(jìn)行。在創(chuàng)建組合文件時(shí),客戶(hù)端說(shuō)明了小文件的名稱(chēng)和每個(gè)文件相關(guān)的數(shù)據(jù)。這個(gè)數(shù)據(jù)在客戶(hù)端緩存,直到?jīng)]有不超過(guò)HDFS塊大小的文件數(shù)據(jù)需要添加。這確保了沒(méi)有小文件在塊之間分割存儲(chǔ)。endprint

    隨著文件數(shù)據(jù),索引表放在每個(gè)數(shù)據(jù)塊的開(kāi)始。該表包含每個(gè)小文件的入口,這一塊的一部分。每個(gè)表項(xiàng)是一個(gè)(偏移量,長(zhǎng)度)對(duì)。在塊和文件,索引表中的第i項(xiàng)指定的小文件的第一個(gè)字節(jié)的偏移量從開(kāi)始的塊長(zhǎng)度的小文件的字節(jié)數(shù)。在索引表中的信息可以被用來(lái)確定相應(yīng)的文件的開(kāi)始和結(jié)束位置。所產(chǎn)生的塊結(jié)構(gòu),稱(chēng)為擴(kuò)展塊,如圖2所示。

    擴(kuò)展塊代表組合文件的一部分。在HDFS DataNode節(jié)點(diǎn)中,這些塊像任何其他正常文件塊一樣存儲(chǔ)。

    2)文件映射

    文件映射是將小文件名映射到包含該文件的組合文件塊的過(guò)程。這是由NameNode節(jié)點(diǎn)執(zhí)行的。用戶(hù)要從組合文件中讀取一個(gè)小文件,文件映射技術(shù)就起作用了。啟動(dòng)讀操作時(shí),用戶(hù)必須明確指定組合文件和小文件的名稱(chēng)。一個(gè)請(qǐng)求發(fā)送到NameNode節(jié)點(diǎn),根據(jù)這兩個(gè)文件名,能獲取所需的小文件的位置

    對(duì)于每個(gè)組合文件,NameNode節(jié)點(diǎn)維護(hù)一個(gè)數(shù)據(jù)結(jié)構(gòu)叫做組合文件映射表。它包含一個(gè)小的文件名稱(chēng)和包含該小文件的合并文件的邏輯塊號(hào)之間的映射。針對(duì)邏輯塊號(hào)和數(shù)據(jù)節(jié)點(diǎn)的信息,NameNode還提供了一個(gè)“索引號(hào)”。對(duì)應(yīng)于請(qǐng)求的小文件,這種“索引號(hào)”指定了索引表存儲(chǔ)在塊開(kāi)始的入口地址,從而避免了線(xiàn)性搜索。

    圖4顯示了一個(gè)組合文件File的組合文件映射表數(shù)據(jù)結(jié)構(gòu)。此文件包含分布在2個(gè)塊中的5個(gè)小文件。塊1包含文件F1和F2。塊2保存從F3到F5的3個(gè)文件。文件名被散列到組合文件映射表中。除了文件的名稱(chēng),還存儲(chǔ)了有關(guān)塊的排序信息。這個(gè)排序信息是存儲(chǔ)在“索引號(hào)”字段里。

    “索引號(hào)”值1表示這是在給定的塊和它的索引表中的相應(yīng)條目出現(xiàn)在從塊開(kāi)始的偏移量為零的第一個(gè)文件。在文件合并過(guò)程中,索引號(hào)碼以類(lèi)似的方式分配給塊中的每個(gè)文件。塊如圖3所示。

    相比傳統(tǒng)所使用的技術(shù),該文的映射技術(shù)具有更好的可擴(kuò)展性。它也不會(huì)保持邏輯塊號(hào)映射為文件名的一部分的任何文件。這使該解決方案與領(lǐng)域無(wú)關(guān)。

    3)文件提取

    文件提取涉及到從一個(gè)塊中提取所需的文件內(nèi)容的過(guò)程。這個(gè)操作由DataNode數(shù)據(jù)節(jié)點(diǎn)完成。當(dāng)讀取文件時(shí),用戶(hù)需要指明小文件名和組合文件名。此信息是用于獲得包含文件的塊,存儲(chǔ)塊的DataNode和NameNode 的“索引號(hào)”。所得的“索引號(hào)”發(fā)送到存儲(chǔ)數(shù)據(jù)塊的DataNode節(jié)點(diǎn)。DataNode然后使用此值去尋求所需放置在塊開(kāi)始的索引表中入口地址。索引表中的條目包含從塊開(kāi)始文件數(shù)據(jù)的偏移和數(shù)據(jù)文件的長(zhǎng)度。DataNode然后尋找所需的偏移量和讀取文件數(shù)據(jù)并將數(shù)據(jù)發(fā)送到客戶(hù)端。同時(shí)把整個(gè)數(shù)據(jù)塊發(fā)送回客戶(hù)端,此操作大大降低了網(wǎng)絡(luò)負(fù)載。

    4)文件訪問(wèn)操作

    以下各節(jié)描述文件的讀寫(xiě)操作在FCHDFS是如何進(jìn)行的。

    1) 寫(xiě)操作:使用FCHDFS創(chuàng)建組合文件時(shí),寫(xiě)操作被啟動(dòng)。在客戶(hù)端,用戶(hù)使用FCHDFS模塊調(diào)用創(chuàng)建操作。然后將請(qǐng)求發(fā)送到NameNode節(jié)點(diǎn),通過(guò)RPC為所需存儲(chǔ)的組合文件創(chuàng)建和初始化數(shù)據(jù)結(jié)構(gòu)。從NameNode節(jié)點(diǎn)創(chuàng)建一個(gè)特殊的inode表示文件被創(chuàng)建的是一個(gè)組合文件并保存到命名空間樹(shù)。NameNod節(jié)點(diǎn)初始化一個(gè)組合文件映射。該映射是保存為代表的文件的inode部分認(rèn)為條目表示形式的聯(lián)合文件的部分的小的文件。

    客戶(hù)端被提供了一個(gè)輸出流和一些額外的輔助方法,有助于關(guān)聯(lián)文件數(shù)據(jù)到組合文件中一個(gè)入口地址。寫(xiě)入輸出流數(shù)據(jù)最初在客戶(hù)端的緩存執(zhí)行文件合并。緩沖區(qū)可容納的數(shù)據(jù)塊的值。一個(gè)索引表是由目前在緩沖區(qū)中的所有文件構(gòu)成。該表包含每個(gè)文件的元組作為在合并過(guò)程中的解釋。緩沖區(qū)的內(nèi)容附加上索引表被發(fā)送到數(shù)據(jù)節(jié)點(diǎn)。表中被計(jì)算的每個(gè)項(xiàng)的偏移量,也包括在塊開(kāi)始的表的大小。

    該索引表的目的是快速定位所需的塊的文件開(kāi)始位置而不需要掃描整個(gè)塊。隨著邏輯塊號(hào)所需文件元組在NameNode節(jié)點(diǎn)存儲(chǔ),使得速度更快。

    成功地寫(xiě)入數(shù)據(jù)塊到數(shù)據(jù)節(jié)點(diǎn),客戶(hù)端發(fā)送一個(gè)更新請(qǐng)求到NameNode節(jié)點(diǎn),指明被寫(xiě)入最近的塊文件名列表,以及每個(gè)文件的索引條目編號(hào)。這被NameNode節(jié)點(diǎn)使用來(lái)構(gòu)造組合文件的映射。重復(fù)此過(guò)程,直到用戶(hù)關(guān)閉被創(chuàng)建的組合文件。

    2) 讀操作:用戶(hù)啟動(dòng)讀操作直接訪問(wèn)合并文件中的小文件。在文件系統(tǒng)中的文件的路徑是通過(guò)指定文件名的組合含有小文件的文件夾名來(lái)表示。換句話(huà)說(shuō),如果“ABC”是組合文件和“file1”是小文件的名稱(chēng),然后用戶(hù)可以指定“file1”“路徑為“組合文件的位置/ ABC / file1”。

    客戶(hù)端模塊從給定的路徑提取組合的文件名和小文件名,并從NameNode請(qǐng)求對(duì)應(yīng)于小文件元數(shù)據(jù)。這是一個(gè)基于RPC的請(qǐng)求,NameNode節(jié)點(diǎn)響應(yīng)它通過(guò)存儲(chǔ)在指定的組合文件的組成文件映射查找小文件名。塊的位置(列表的數(shù)據(jù)節(jié)點(diǎn))、邏輯塊號(hào)和索引號(hào)為響應(yīng)發(fā)送回客戶(hù)端。

    請(qǐng)求文件的元數(shù)據(jù)從緩存或NameNode節(jié)點(diǎn)中獲取后,將在客戶(hù)端和存儲(chǔ)該塊的數(shù)據(jù)節(jié)點(diǎn)之間建立流連接。在這階段,請(qǐng)求文件的索引號(hào)發(fā)送到數(shù)據(jù)節(jié)點(diǎn),并且數(shù)據(jù)節(jié)點(diǎn)在塊索引表中讀取到指定的項(xiàng)。在未來(lái)的讀操作中,它將使用該偏移量和長(zhǎng)度值。

    客戶(hù)可以通過(guò)文件讀入指定偏移相對(duì)于文件的開(kāi)始,即第一個(gè)字節(jié)的文件偏移零從文件的開(kāi)始。這個(gè)偏移然后轉(zhuǎn)換為它添加在數(shù)據(jù)節(jié)點(diǎn)的索引表中的塊的偏移值計(jì)算等效。讀取操作,然后委托給現(xiàn)有的API,允許原HDFS讀取塊開(kāi)始在指定的偏移量。整個(gè)閱讀過(guò)程如圖7所示。

    3 實(shí)驗(yàn)仿真及結(jié)果分析

    本文提出的文件小文件處理技術(shù)方案需要在Hadoop集群上進(jìn)行相關(guān)實(shí)驗(yàn)。通過(guò)實(shí)驗(yàn),該文針對(duì)完成讀寫(xiě)操作所占用的內(nèi)存和花費(fèi)時(shí)間等指標(biāo)參數(shù),對(duì)比了傳統(tǒng)HDFS與FCHDFS系統(tǒng)性能。實(shí)驗(yàn)測(cè)試平臺(tái)包含3臺(tái)普通PC機(jī),其中一臺(tái)作為名稱(chēng)服務(wù)器節(jié)點(diǎn)NameNode,其它兩臺(tái)作為數(shù)據(jù)服務(wù)器節(jié)點(diǎn)DataNode。這些機(jī)器都具有以下配置:Intel酷睿2雙核2.10 GHz,2GB的內(nèi)存,320 GB/5400硬盤(pán)。在每一臺(tái)機(jī)器安裝Linux操作系統(tǒng)。開(kāi)發(fā)環(huán)境是Hadoop版本0.20.1分布式系統(tǒng)、Eclipse4.2.1和Java版本1.6.0。endprint

    對(duì)于NameNode內(nèi)存使用的測(cè)量,該試驗(yàn)測(cè)試工作共包含200000個(gè)文件。這些文件從20KB到300kb大小范圍。所有文件的累積大小約為12.35gb。采取的讀寫(xiě)操作時(shí)的工作量是用于內(nèi)存使用實(shí)驗(yàn)工作量的一個(gè)子集的分布,包含1000個(gè)文件。

    基于以下參數(shù)測(cè)定集群性能:

    1)使用NameNode節(jié)點(diǎn)存儲(chǔ)元數(shù)據(jù)的內(nèi)存量

    2)完成讀寫(xiě)操作使用時(shí)間量

    采用內(nèi)存分析器工具包測(cè)量NameNode節(jié)點(diǎn)存儲(chǔ)元數(shù)據(jù)所使用的內(nèi)存情況。Jmap工具被用來(lái)獲取所有目前在Java NameNode進(jìn)程內(nèi)存中活對(duì)象的堆轉(zhuǎn)儲(chǔ)。內(nèi)存分析器工具包進(jìn)行分析所得到的堆轉(zhuǎn)儲(chǔ)。完成讀寫(xiě)操作的時(shí)間使用操作系統(tǒng)Linux命令以毫秒測(cè)量。

    實(shí)驗(yàn)是在原有的HDFS和FCHDFS上進(jìn)行。通過(guò)放置2000批文件在HDFS后分析堆轉(zhuǎn)儲(chǔ),測(cè)定節(jié)點(diǎn)的內(nèi)存使用情況。共有2000000個(gè)文件被放置和100次讀寫(xiě)(以每2000個(gè)放置到HDFS的文件),重復(fù)3次及三個(gè)讀數(shù),并計(jì)算平均值。FCHDFS采用同樣的步驟,比較了兩種情況下內(nèi)存使用情況,如圖5所示。

    圖5 NameNode內(nèi)存使用

    圖5顯示了兩種情況下內(nèi)存的使用模式。三角形標(biāo)記的曲線(xiàn)對(duì)應(yīng)的原始沒(méi)做任何更改的HDFS內(nèi)存使用情況。隨著文件的數(shù)量增加,內(nèi)存使用也線(xiàn)性增加。這是預(yù)期的結(jié)果,因?yàn)樽鳛镹ameNode節(jié)點(diǎn)必須保存文件和塊的元數(shù)據(jù)。第二條是正方形標(biāo)記的曲線(xiàn)代表FCHDFS,為了有效的文件訪問(wèn),NameNode必須保存額外的數(shù)據(jù)結(jié)構(gòu)。存儲(chǔ)相同數(shù)量的文件,通過(guò)FCHDFS使用的內(nèi)存明顯小于使用HDFS。FCHDFS只維護(hù)每個(gè)小文件的文件元數(shù)據(jù),而不用維護(hù)它們的塊元數(shù)據(jù)。NameNode只維護(hù)單個(gè)聯(lián)合文件的塊元數(shù)據(jù),而不為每一個(gè)小文件維護(hù)它們的塊元數(shù)據(jù),所以FCHDFS將占用更少的內(nèi)存。

    在這個(gè)實(shí)驗(yàn)中,對(duì)HDFS和FCHDFS測(cè)試寫(xiě)操作的結(jié)果如圖6所示。

    圖6 寫(xiě)操作所耗時(shí)間

    FCHDFS的寫(xiě)操作是大大快于HDFS的寫(xiě)操作。通過(guò)圖6實(shí)驗(yàn)分析結(jié)果清楚地顯示這一點(diǎn)。10000個(gè)文件寫(xiě)到HDFS的時(shí)間是非常高的,因?yàn)镹ameNode節(jié)點(diǎn)必須為每個(gè)寫(xiě)入HDFS的文件創(chuàng)建和分配塊空間。FCHDFS避免了這種繁瑣的操作,文件的創(chuàng)建NameNode 節(jié)點(diǎn)被訪問(wèn)一次,并且只有再加入一新塊到合并文件中才調(diào)用寫(xiě)操作。另一個(gè)發(fā)揮作用的重要因素是用于客戶(hù)端合并文件的緩沖機(jī)制。添加一個(gè)新塊的請(qǐng)求發(fā)送到NameNode節(jié)點(diǎn)前,數(shù)據(jù)塊是先緩存到客戶(hù)端。只為每個(gè)64MB的數(shù)據(jù)發(fā)送一個(gè)請(qǐng)求到NameNode節(jié)點(diǎn),而不是每一個(gè)小的文件。

    4 結(jié)束語(yǔ)

    HDFS最初被設(shè)計(jì)為存儲(chǔ)大文件的。當(dāng)它是用來(lái)存儲(chǔ)大量的小文件時(shí),I/O性能成為瓶頸。在本文中,針對(duì)冠字號(hào)小圖片存儲(chǔ)到HDFS系統(tǒng)中帶來(lái)的訪問(wèn)瓶頸問(wèn)題,改進(jìn)了原有的HDFS系統(tǒng),提出了基于文件關(guān)聯(lián)性合并機(jī)制的FCHDFS,它把大量的小文件合并成一個(gè)單一的聯(lián)合文件。從性能進(jìn)行分析,對(duì)于小文件的存儲(chǔ)和管理,F(xiàn)CHDFS提高了對(duì)小文件的訪問(wèn)效率和減少節(jié)點(diǎn)的內(nèi)存元數(shù)據(jù)數(shù)量。FCHDFS通過(guò)提供更高效的小文件元數(shù)據(jù)管理,允許更充分的利用HDFS的資源。該文對(duì)于2000000個(gè)小文件進(jìn)行試驗(yàn)測(cè)試,結(jié)果證實(shí)內(nèi)存的使用量大大減少了。相比原來(lái)的HDFS,F(xiàn)CHDFS寫(xiě)操作時(shí)間也有較明顯的縮短。

    參考文獻(xiàn):

    [1] 覃雄派,王會(huì)舉,王珊,等.大數(shù)據(jù)分析-RDBMS與MapReduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.

    [2] 王珊,王會(huì)舉,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,34(10):1742-1752.

    [3] Chuck Lam.Hadoop實(shí)戰(zhàn)[M].北京:人民郵電出版社,2012.

    [4] Shvachko K,Hairong Kuang,Radia S.The Hadoop Distributed File System,Mass Storage Systems and Technologies(MSST)[C].2010 IEEE 26th Symposium, 2010:1-10, 3-7.

    [5] Li xiu-qiao,Dong bin,Xiao Li-min,et al.Small Files Problem inParallel File System[J].Network Computing and Information Security,New York: IEEE Computer Society,2011:227-232.

    [6] Carns P,Lang S,Ross R,et al.Small-file access in parallel file systems[C].International Parallel and Distributed Processing Symposium,New York:IEEE Computer Society,2009:1-11.

    [7] Faraz Shaikh,Mikhil Chainani.A case for small file packing in parallel virtual file system (pvfs2)[C].Advanced and Distributed Operating Systems Fall 07, 2007.

    [8] Grant Mackey,Saba Sehrish,Julio LopezIntroducing Map-Reduce to High End Computing. InPetascale Data Storage Workshop at SC08, Austin, Texas, November 2008.

    [9] Michael C Schatz.CloudBurst:Highly Sensitive Read Mapping with MapReduce[J].Bioinformatics,2009.

    [10] Ghemawat S,Gobioff H,Leung S.The Google file system[C].Symposium on Operating Systems Principles 2003.New York:ACM.2003:29-43.endprint

    對(duì)于NameNode內(nèi)存使用的測(cè)量,該試驗(yàn)測(cè)試工作共包含200000個(gè)文件。這些文件從20KB到300kb大小范圍。所有文件的累積大小約為12.35gb。采取的讀寫(xiě)操作時(shí)的工作量是用于內(nèi)存使用實(shí)驗(yàn)工作量的一個(gè)子集的分布,包含1000個(gè)文件。

    基于以下參數(shù)測(cè)定集群性能:

    1)使用NameNode節(jié)點(diǎn)存儲(chǔ)元數(shù)據(jù)的內(nèi)存量

    2)完成讀寫(xiě)操作使用時(shí)間量

    采用內(nèi)存分析器工具包測(cè)量NameNode節(jié)點(diǎn)存儲(chǔ)元數(shù)據(jù)所使用的內(nèi)存情況。Jmap工具被用來(lái)獲取所有目前在Java NameNode進(jìn)程內(nèi)存中活對(duì)象的堆轉(zhuǎn)儲(chǔ)。內(nèi)存分析器工具包進(jìn)行分析所得到的堆轉(zhuǎn)儲(chǔ)。完成讀寫(xiě)操作的時(shí)間使用操作系統(tǒng)Linux命令以毫秒測(cè)量。

    實(shí)驗(yàn)是在原有的HDFS和FCHDFS上進(jìn)行。通過(guò)放置2000批文件在HDFS后分析堆轉(zhuǎn)儲(chǔ),測(cè)定節(jié)點(diǎn)的內(nèi)存使用情況。共有2000000個(gè)文件被放置和100次讀寫(xiě)(以每2000個(gè)放置到HDFS的文件),重復(fù)3次及三個(gè)讀數(shù),并計(jì)算平均值。FCHDFS采用同樣的步驟,比較了兩種情況下內(nèi)存使用情況,如圖5所示。

    圖5 NameNode內(nèi)存使用

    圖5顯示了兩種情況下內(nèi)存的使用模式。三角形標(biāo)記的曲線(xiàn)對(duì)應(yīng)的原始沒(méi)做任何更改的HDFS內(nèi)存使用情況。隨著文件的數(shù)量增加,內(nèi)存使用也線(xiàn)性增加。這是預(yù)期的結(jié)果,因?yàn)樽鳛镹ameNode節(jié)點(diǎn)必須保存文件和塊的元數(shù)據(jù)。第二條是正方形標(biāo)記的曲線(xiàn)代表FCHDFS,為了有效的文件訪問(wèn),NameNode必須保存額外的數(shù)據(jù)結(jié)構(gòu)。存儲(chǔ)相同數(shù)量的文件,通過(guò)FCHDFS使用的內(nèi)存明顯小于使用HDFS。FCHDFS只維護(hù)每個(gè)小文件的文件元數(shù)據(jù),而不用維護(hù)它們的塊元數(shù)據(jù)。NameNode只維護(hù)單個(gè)聯(lián)合文件的塊元數(shù)據(jù),而不為每一個(gè)小文件維護(hù)它們的塊元數(shù)據(jù),所以FCHDFS將占用更少的內(nèi)存。

    在這個(gè)實(shí)驗(yàn)中,對(duì)HDFS和FCHDFS測(cè)試寫(xiě)操作的結(jié)果如圖6所示。

    圖6 寫(xiě)操作所耗時(shí)間

    FCHDFS的寫(xiě)操作是大大快于HDFS的寫(xiě)操作。通過(guò)圖6實(shí)驗(yàn)分析結(jié)果清楚地顯示這一點(diǎn)。10000個(gè)文件寫(xiě)到HDFS的時(shí)間是非常高的,因?yàn)镹ameNode節(jié)點(diǎn)必須為每個(gè)寫(xiě)入HDFS的文件創(chuàng)建和分配塊空間。FCHDFS避免了這種繁瑣的操作,文件的創(chuàng)建NameNode 節(jié)點(diǎn)被訪問(wèn)一次,并且只有再加入一新塊到合并文件中才調(diào)用寫(xiě)操作。另一個(gè)發(fā)揮作用的重要因素是用于客戶(hù)端合并文件的緩沖機(jī)制。添加一個(gè)新塊的請(qǐng)求發(fā)送到NameNode節(jié)點(diǎn)前,數(shù)據(jù)塊是先緩存到客戶(hù)端。只為每個(gè)64MB的數(shù)據(jù)發(fā)送一個(gè)請(qǐng)求到NameNode節(jié)點(diǎn),而不是每一個(gè)小的文件。

    4 結(jié)束語(yǔ)

    HDFS最初被設(shè)計(jì)為存儲(chǔ)大文件的。當(dāng)它是用來(lái)存儲(chǔ)大量的小文件時(shí),I/O性能成為瓶頸。在本文中,針對(duì)冠字號(hào)小圖片存儲(chǔ)到HDFS系統(tǒng)中帶來(lái)的訪問(wèn)瓶頸問(wèn)題,改進(jìn)了原有的HDFS系統(tǒng),提出了基于文件關(guān)聯(lián)性合并機(jī)制的FCHDFS,它把大量的小文件合并成一個(gè)單一的聯(lián)合文件。從性能進(jìn)行分析,對(duì)于小文件的存儲(chǔ)和管理,F(xiàn)CHDFS提高了對(duì)小文件的訪問(wèn)效率和減少節(jié)點(diǎn)的內(nèi)存元數(shù)據(jù)數(shù)量。FCHDFS通過(guò)提供更高效的小文件元數(shù)據(jù)管理,允許更充分的利用HDFS的資源。該文對(duì)于2000000個(gè)小文件進(jìn)行試驗(yàn)測(cè)試,結(jié)果證實(shí)內(nèi)存的使用量大大減少了。相比原來(lái)的HDFS,F(xiàn)CHDFS寫(xiě)操作時(shí)間也有較明顯的縮短。

    參考文獻(xiàn):

    [1] 覃雄派,王會(huì)舉,王珊,等.大數(shù)據(jù)分析-RDBMS與MapReduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.

    [2] 王珊,王會(huì)舉,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,34(10):1742-1752.

    [3] Chuck Lam.Hadoop實(shí)戰(zhàn)[M].北京:人民郵電出版社,2012.

    [4] Shvachko K,Hairong Kuang,Radia S.The Hadoop Distributed File System,Mass Storage Systems and Technologies(MSST)[C].2010 IEEE 26th Symposium, 2010:1-10, 3-7.

    [5] Li xiu-qiao,Dong bin,Xiao Li-min,et al.Small Files Problem inParallel File System[J].Network Computing and Information Security,New York: IEEE Computer Society,2011:227-232.

    [6] Carns P,Lang S,Ross R,et al.Small-file access in parallel file systems[C].International Parallel and Distributed Processing Symposium,New York:IEEE Computer Society,2009:1-11.

    [7] Faraz Shaikh,Mikhil Chainani.A case for small file packing in parallel virtual file system (pvfs2)[C].Advanced and Distributed Operating Systems Fall 07, 2007.

    [8] Grant Mackey,Saba Sehrish,Julio LopezIntroducing Map-Reduce to High End Computing. InPetascale Data Storage Workshop at SC08, Austin, Texas, November 2008.

    [9] Michael C Schatz.CloudBurst:Highly Sensitive Read Mapping with MapReduce[J].Bioinformatics,2009.

    [10] Ghemawat S,Gobioff H,Leung S.The Google file system[C].Symposium on Operating Systems Principles 2003.New York:ACM.2003:29-43.endprint

    對(duì)于NameNode內(nèi)存使用的測(cè)量,該試驗(yàn)測(cè)試工作共包含200000個(gè)文件。這些文件從20KB到300kb大小范圍。所有文件的累積大小約為12.35gb。采取的讀寫(xiě)操作時(shí)的工作量是用于內(nèi)存使用實(shí)驗(yàn)工作量的一個(gè)子集的分布,包含1000個(gè)文件。

    基于以下參數(shù)測(cè)定集群性能:

    1)使用NameNode節(jié)點(diǎn)存儲(chǔ)元數(shù)據(jù)的內(nèi)存量

    2)完成讀寫(xiě)操作使用時(shí)間量

    采用內(nèi)存分析器工具包測(cè)量NameNode節(jié)點(diǎn)存儲(chǔ)元數(shù)據(jù)所使用的內(nèi)存情況。Jmap工具被用來(lái)獲取所有目前在Java NameNode進(jìn)程內(nèi)存中活對(duì)象的堆轉(zhuǎn)儲(chǔ)。內(nèi)存分析器工具包進(jìn)行分析所得到的堆轉(zhuǎn)儲(chǔ)。完成讀寫(xiě)操作的時(shí)間使用操作系統(tǒng)Linux命令以毫秒測(cè)量。

    實(shí)驗(yàn)是在原有的HDFS和FCHDFS上進(jìn)行。通過(guò)放置2000批文件在HDFS后分析堆轉(zhuǎn)儲(chǔ),測(cè)定節(jié)點(diǎn)的內(nèi)存使用情況。共有2000000個(gè)文件被放置和100次讀寫(xiě)(以每2000個(gè)放置到HDFS的文件),重復(fù)3次及三個(gè)讀數(shù),并計(jì)算平均值。FCHDFS采用同樣的步驟,比較了兩種情況下內(nèi)存使用情況,如圖5所示。

    圖5 NameNode內(nèi)存使用

    圖5顯示了兩種情況下內(nèi)存的使用模式。三角形標(biāo)記的曲線(xiàn)對(duì)應(yīng)的原始沒(méi)做任何更改的HDFS內(nèi)存使用情況。隨著文件的數(shù)量增加,內(nèi)存使用也線(xiàn)性增加。這是預(yù)期的結(jié)果,因?yàn)樽鳛镹ameNode節(jié)點(diǎn)必須保存文件和塊的元數(shù)據(jù)。第二條是正方形標(biāo)記的曲線(xiàn)代表FCHDFS,為了有效的文件訪問(wèn),NameNode必須保存額外的數(shù)據(jù)結(jié)構(gòu)。存儲(chǔ)相同數(shù)量的文件,通過(guò)FCHDFS使用的內(nèi)存明顯小于使用HDFS。FCHDFS只維護(hù)每個(gè)小文件的文件元數(shù)據(jù),而不用維護(hù)它們的塊元數(shù)據(jù)。NameNode只維護(hù)單個(gè)聯(lián)合文件的塊元數(shù)據(jù),而不為每一個(gè)小文件維護(hù)它們的塊元數(shù)據(jù),所以FCHDFS將占用更少的內(nèi)存。

    在這個(gè)實(shí)驗(yàn)中,對(duì)HDFS和FCHDFS測(cè)試寫(xiě)操作的結(jié)果如圖6所示。

    圖6 寫(xiě)操作所耗時(shí)間

    FCHDFS的寫(xiě)操作是大大快于HDFS的寫(xiě)操作。通過(guò)圖6實(shí)驗(yàn)分析結(jié)果清楚地顯示這一點(diǎn)。10000個(gè)文件寫(xiě)到HDFS的時(shí)間是非常高的,因?yàn)镹ameNode節(jié)點(diǎn)必須為每個(gè)寫(xiě)入HDFS的文件創(chuàng)建和分配塊空間。FCHDFS避免了這種繁瑣的操作,文件的創(chuàng)建NameNode 節(jié)點(diǎn)被訪問(wèn)一次,并且只有再加入一新塊到合并文件中才調(diào)用寫(xiě)操作。另一個(gè)發(fā)揮作用的重要因素是用于客戶(hù)端合并文件的緩沖機(jī)制。添加一個(gè)新塊的請(qǐng)求發(fā)送到NameNode節(jié)點(diǎn)前,數(shù)據(jù)塊是先緩存到客戶(hù)端。只為每個(gè)64MB的數(shù)據(jù)發(fā)送一個(gè)請(qǐng)求到NameNode節(jié)點(diǎn),而不是每一個(gè)小的文件。

    4 結(jié)束語(yǔ)

    HDFS最初被設(shè)計(jì)為存儲(chǔ)大文件的。當(dāng)它是用來(lái)存儲(chǔ)大量的小文件時(shí),I/O性能成為瓶頸。在本文中,針對(duì)冠字號(hào)小圖片存儲(chǔ)到HDFS系統(tǒng)中帶來(lái)的訪問(wèn)瓶頸問(wèn)題,改進(jìn)了原有的HDFS系統(tǒng),提出了基于文件關(guān)聯(lián)性合并機(jī)制的FCHDFS,它把大量的小文件合并成一個(gè)單一的聯(lián)合文件。從性能進(jìn)行分析,對(duì)于小文件的存儲(chǔ)和管理,F(xiàn)CHDFS提高了對(duì)小文件的訪問(wèn)效率和減少節(jié)點(diǎn)的內(nèi)存元數(shù)據(jù)數(shù)量。FCHDFS通過(guò)提供更高效的小文件元數(shù)據(jù)管理,允許更充分的利用HDFS的資源。該文對(duì)于2000000個(gè)小文件進(jìn)行試驗(yàn)測(cè)試,結(jié)果證實(shí)內(nèi)存的使用量大大減少了。相比原來(lái)的HDFS,F(xiàn)CHDFS寫(xiě)操作時(shí)間也有較明顯的縮短。

    參考文獻(xiàn):

    [1] 覃雄派,王會(huì)舉,王珊,等.大數(shù)據(jù)分析-RDBMS與MapReduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.

    [2] 王珊,王會(huì)舉,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,34(10):1742-1752.

    [3] Chuck Lam.Hadoop實(shí)戰(zhàn)[M].北京:人民郵電出版社,2012.

    [4] Shvachko K,Hairong Kuang,Radia S.The Hadoop Distributed File System,Mass Storage Systems and Technologies(MSST)[C].2010 IEEE 26th Symposium, 2010:1-10, 3-7.

    [5] Li xiu-qiao,Dong bin,Xiao Li-min,et al.Small Files Problem inParallel File System[J].Network Computing and Information Security,New York: IEEE Computer Society,2011:227-232.

    [6] Carns P,Lang S,Ross R,et al.Small-file access in parallel file systems[C].International Parallel and Distributed Processing Symposium,New York:IEEE Computer Society,2009:1-11.

    [7] Faraz Shaikh,Mikhil Chainani.A case for small file packing in parallel virtual file system (pvfs2)[C].Advanced and Distributed Operating Systems Fall 07, 2007.

    [8] Grant Mackey,Saba Sehrish,Julio LopezIntroducing Map-Reduce to High End Computing. InPetascale Data Storage Workshop at SC08, Austin, Texas, November 2008.

    [9] Michael C Schatz.CloudBurst:Highly Sensitive Read Mapping with MapReduce[J].Bioinformatics,2009.

    [10] Ghemawat S,Gobioff H,Leung S.The Google file system[C].Symposium on Operating Systems Principles 2003.New York:ACM.2003:29-43.endprint

    18在线观看网站| 精品久久蜜臀av无| 亚洲av美国av| 另类精品久久| 王馨瑶露胸无遮挡在线观看| 18禁裸乳无遮挡动漫免费视频| 亚洲黑人精品在线| 国产伦理片在线播放av一区| 纯流量卡能插随身wifi吗| 一本久久精品| 日本猛色少妇xxxxx猛交久久| 久久99精品国语久久久| 视频区欧美日本亚洲| 丝袜喷水一区| 国产精品免费视频内射| 一级毛片女人18水好多 | 精品久久久精品久久久| 中文字幕色久视频| 纵有疾风起免费观看全集完整版| 亚洲精品久久成人aⅴ小说| 日韩 亚洲 欧美在线| 男女高潮啪啪啪动态图| 久久99精品国语久久久| 中文字幕人妻丝袜一区二区| 丝袜在线中文字幕| 真人做人爱边吃奶动态| 一级片'在线观看视频| 免费观看a级毛片全部| 精品国产一区二区三区久久久樱花| 久久精品熟女亚洲av麻豆精品| 亚洲三区欧美一区| 99国产精品99久久久久| xxx大片免费视频| 欧美日韩成人在线一区二区| 成人亚洲精品一区在线观看| 久久久国产欧美日韩av| 欧美日韩av久久| 日韩av免费高清视频| 色精品久久人妻99蜜桃| 熟女av电影| 国产高清视频在线播放一区 | 一本—道久久a久久精品蜜桃钙片| 欧美日韩亚洲综合一区二区三区_| av在线app专区| 欧美国产精品va在线观看不卡| 一级片'在线观看视频| 一区二区三区精品91| av网站免费在线观看视频| 国产男女超爽视频在线观看| 亚洲精品久久成人aⅴ小说| 侵犯人妻中文字幕一二三四区| 亚洲欧美日韩高清在线视频 | 不卡av一区二区三区| 日本猛色少妇xxxxx猛交久久| 国产精品国产三级专区第一集| 国产欧美日韩精品亚洲av| 一区在线观看完整版| 999久久久国产精品视频| 啦啦啦视频在线资源免费观看| 性少妇av在线| 51午夜福利影视在线观看| 国产av一区二区精品久久| 一边摸一边做爽爽视频免费| xxxhd国产人妻xxx| 成人国语在线视频| a级毛片在线看网站| 在线天堂中文资源库| tube8黄色片| 午夜两性在线视频| 丁香六月欧美| 国产激情久久老熟女| 在线观看免费午夜福利视频| 美女大奶头黄色视频| 女性生殖器流出的白浆| 亚洲视频免费观看视频| 欧美97在线视频| 亚洲精品国产区一区二| av电影中文网址| 青春草亚洲视频在线观看| 免费观看a级毛片全部| 国产成人精品久久久久久| 中文字幕人妻丝袜一区二区| 亚洲国产毛片av蜜桃av| 婷婷成人精品国产| 欧美精品亚洲一区二区| 美女福利国产在线| 丰满人妻熟妇乱又伦精品不卡| 女警被强在线播放| 亚洲激情五月婷婷啪啪| 波野结衣二区三区在线| 久久久精品免费免费高清| 亚洲国产精品国产精品| 国产亚洲一区二区精品| 9热在线视频观看99| 久久精品亚洲熟妇少妇任你| 久久精品国产综合久久久| 国产视频首页在线观看| 女警被强在线播放| 一级片免费观看大全| 美女高潮到喷水免费观看| 精品一品国产午夜福利视频| 国产亚洲av片在线观看秒播厂| 久久久久久免费高清国产稀缺| 欧美国产精品va在线观看不卡| 91精品伊人久久大香线蕉| 亚洲国产精品一区三区| 日本猛色少妇xxxxx猛交久久| 国产成人91sexporn| 欧美日韩一级在线毛片| 国产精品成人在线| 丝袜人妻中文字幕| 亚洲欧美精品自产自拍| 看免费成人av毛片| 欧美黑人欧美精品刺激| 国产精品国产av在线观看| 黑人欧美特级aaaaaa片| 亚洲免费av在线视频| 成年人黄色毛片网站| 国产成人精品无人区| 人人妻人人澡人人爽人人夜夜| 成人午夜精彩视频在线观看| 欧美日韩黄片免| 亚洲午夜精品一区,二区,三区| 午夜91福利影院| 亚洲精品av麻豆狂野| 精品第一国产精品| 国产高清videossex| 免费不卡黄色视频| 波多野结衣一区麻豆| 伊人亚洲综合成人网| 视频区欧美日本亚洲| 欧美黄色片欧美黄色片| 一区二区日韩欧美中文字幕| 国产在线观看jvid| 国产亚洲av片在线观看秒播厂| 自线自在国产av| 国产高清视频在线播放一区 | 国产精品免费大片| 亚洲成国产人片在线观看| 国产一区二区在线观看av| 国产极品粉嫩免费观看在线| 麻豆国产av国片精品| 日韩大码丰满熟妇| 精品福利永久在线观看| 看免费成人av毛片| 久久毛片免费看一区二区三区| 国产真人三级小视频在线观看| 亚洲国产毛片av蜜桃av| 人人妻,人人澡人人爽秒播 | 国产精品久久久av美女十八| 国产欧美日韩一区二区三区在线| 妹子高潮喷水视频| 建设人人有责人人尽责人人享有的| 狂野欧美激情性bbbbbb| 国产精品免费视频内射| 又紧又爽又黄一区二区| 亚洲欧美日韩另类电影网站| 亚洲专区国产一区二区| 国产精品一区二区精品视频观看| 老司机深夜福利视频在线观看 | 久久国产精品人妻蜜桃| 成人影院久久| 亚洲精品国产色婷婷电影| 丰满人妻熟妇乱又伦精品不卡| 国产精品三级大全| 又黄又粗又硬又大视频| 欧美 亚洲 国产 日韩一| 日韩免费高清中文字幕av| 热re99久久国产66热| 50天的宝宝边吃奶边哭怎么回事| www.熟女人妻精品国产| www.熟女人妻精品国产| 欧美精品av麻豆av| 黄片播放在线免费| 久久99热这里只频精品6学生| 国精品久久久久久国模美| 国产成人免费无遮挡视频| xxxhd国产人妻xxx| 久久人人爽av亚洲精品天堂| 成人影院久久| 成人18禁高潮啪啪吃奶动态图| 国产精品一区二区在线不卡| 久久久久久久久免费视频了| 精品一区二区三区av网在线观看 | 欧美日韩国产mv在线观看视频| 在线观看免费高清a一片| 99久久综合免费| 午夜福利影视在线免费观看| 热99国产精品久久久久久7| a 毛片基地| 午夜两性在线视频| 在线观看www视频免费| 热re99久久精品国产66热6| 亚洲五月色婷婷综合| 久久国产精品影院| 韩国高清视频一区二区三区| 婷婷成人精品国产| 久久人人97超碰香蕉20202| 精品亚洲成a人片在线观看| 国产成人系列免费观看| 美女午夜性视频免费| 天天影视国产精品| 欧美精品高潮呻吟av久久| 天天躁狠狠躁夜夜躁狠狠躁| 日韩视频在线欧美| 国产午夜精品一二区理论片| 中文字幕人妻丝袜一区二区| 九草在线视频观看| 美女脱内裤让男人舔精品视频| 肉色欧美久久久久久久蜜桃| 免费观看人在逋| 中文字幕人妻丝袜制服| 大型av网站在线播放| 18在线观看网站| 99精品久久久久人妻精品| 99久久精品国产亚洲精品| 久久久久国产一级毛片高清牌| 黑人猛操日本美女一级片| 丰满人妻熟妇乱又伦精品不卡| 国产精品一区二区在线不卡| 精品少妇久久久久久888优播| 热re99久久国产66热| 免费在线观看视频国产中文字幕亚洲 | 大陆偷拍与自拍| 亚洲国产精品一区二区三区在线| 日韩人妻精品一区2区三区| 男人操女人黄网站| 老司机午夜十八禁免费视频| 大码成人一级视频| 国产视频首页在线观看| 男男h啪啪无遮挡| 亚洲一区中文字幕在线| 国产亚洲一区二区精品| 成年av动漫网址| 精品亚洲成a人片在线观看| 国产在线观看jvid| 亚洲精品久久成人aⅴ小说| 亚洲国产精品999| 欧美日韩综合久久久久久| 亚洲欧美精品自产自拍| 免费人妻精品一区二区三区视频| 又大又黄又爽视频免费| 成人国产av品久久久| 欧美乱码精品一区二区三区| 国产免费一区二区三区四区乱码| 精品卡一卡二卡四卡免费| 中文字幕精品免费在线观看视频| 精品少妇一区二区三区视频日本电影| 欧美 日韩 精品 国产| 欧美av亚洲av综合av国产av| 亚洲第一青青草原| 老司机影院毛片| 电影成人av| 日本wwww免费看| 国产精品欧美亚洲77777| 真人做人爱边吃奶动态| 亚洲午夜精品一区,二区,三区| 国产一级毛片在线| 91成人精品电影| 人妻 亚洲 视频| 国产在线免费精品| 精品福利永久在线观看| 免费在线观看黄色视频的| 丁香六月欧美| 亚洲精品日本国产第一区| 超碰97精品在线观看| 搡老岳熟女国产| av视频免费观看在线观看| 精品久久久久久久毛片微露脸 | 精品国产超薄肉色丝袜足j| 波多野结衣av一区二区av| 亚洲男人天堂网一区| 欧美日韩综合久久久久久| 男女边摸边吃奶| 国产国语露脸激情在线看| 免费av中文字幕在线| 国产免费一区二区三区四区乱码| 亚洲五月色婷婷综合| 日本五十路高清| 国产午夜精品一二区理论片| 黄色一级大片看看| 男的添女的下面高潮视频| 黄色片一级片一级黄色片| 夫妻午夜视频| 久久精品国产综合久久久| 午夜激情av网站| 中文字幕制服av| av欧美777| 国产男女超爽视频在线观看| 在线观看免费日韩欧美大片| 婷婷丁香在线五月| 国产精品一区二区免费欧美 | 日本av手机在线免费观看| 老司机深夜福利视频在线观看 | 老司机影院成人| 欧美日韩亚洲高清精品| 亚洲国产看品久久| 黄色一级大片看看| 日韩人妻精品一区2区三区| e午夜精品久久久久久久| 人人妻人人添人人爽欧美一区卜| 丝袜美足系列| 亚洲精品第二区| 波多野结衣av一区二区av| 成人免费观看视频高清| 嫁个100分男人电影在线观看 | 久久精品久久久久久久性| videos熟女内射| 国产伦理片在线播放av一区| 51午夜福利影视在线观看| 午夜老司机福利片| 久久国产精品人妻蜜桃| 曰老女人黄片| 亚洲国产精品国产精品| 宅男免费午夜| 亚洲国产精品一区二区三区在线| 亚洲欧美成人综合另类久久久| 久久人人爽av亚洲精品天堂| 9热在线视频观看99| 日本五十路高清| 人人妻人人爽人人添夜夜欢视频| 国产免费福利视频在线观看| 精品久久久久久电影网| 啦啦啦中文免费视频观看日本| 久热爱精品视频在线9| videos熟女内射| 看免费成人av毛片| 在线观看免费日韩欧美大片| 国产精品 欧美亚洲| 超碰成人久久| 老熟女久久久| 国产精品二区激情视频| 交换朋友夫妻互换小说| 国产成人欧美在线观看 | 免费av中文字幕在线| 久久 成人 亚洲| 久久久久久免费高清国产稀缺| 国产午夜精品一二区理论片| 亚洲一码二码三码区别大吗| 一本色道久久久久久精品综合| 亚洲精品av麻豆狂野| 亚洲三区欧美一区| 久久毛片免费看一区二区三区| 欧美在线一区亚洲| 又粗又硬又长又爽又黄的视频| 99九九在线精品视频| 好男人电影高清在线观看| 成年人免费黄色播放视频| 国产一区二区三区av在线| 777米奇影视久久| 精品久久久精品久久久| 成年动漫av网址| 亚洲国产欧美一区二区综合| 各种免费的搞黄视频| 欧美人与性动交α欧美软件| 亚洲国产毛片av蜜桃av| 日本a在线网址| 一边亲一边摸免费视频| 亚洲欧美中文字幕日韩二区| 国产精品一区二区在线观看99| 国产高清国产精品国产三级| videos熟女内射| 老鸭窝网址在线观看| 国产人伦9x9x在线观看| 国产精品99久久99久久久不卡| 欧美精品高潮呻吟av久久| 老司机影院毛片| 少妇人妻久久综合中文| 久久精品国产综合久久久| 自线自在国产av| 美女高潮到喷水免费观看| 亚洲熟女精品中文字幕| 国产精品一区二区在线不卡| 亚洲精品成人av观看孕妇| 欧美在线黄色| 国产成人精品无人区| 国产亚洲欧美精品永久| 少妇 在线观看| 国产在线一区二区三区精| 亚洲人成77777在线视频| 视频区图区小说| 国产1区2区3区精品| 好男人电影高清在线观看| 五月开心婷婷网| av福利片在线| 久久国产亚洲av麻豆专区| 丝袜在线中文字幕| 黄色视频不卡| 国产成人一区二区三区免费视频网站 | 黄色一级大片看看| 免费在线观看黄色视频的| 高清不卡的av网站| 91字幕亚洲| 19禁男女啪啪无遮挡网站| 91精品三级在线观看| 在线天堂中文资源库| 后天国语完整版免费观看| av国产精品久久久久影院| 好男人电影高清在线观看| 黑丝袜美女国产一区| 国产一区二区在线观看av| 91精品伊人久久大香线蕉| 极品少妇高潮喷水抽搐| 黄频高清免费视频| xxx大片免费视频| 一级a爱视频在线免费观看| 欧美激情 高清一区二区三区| 亚洲激情五月婷婷啪啪| 熟女少妇亚洲综合色aaa.| 777久久人妻少妇嫩草av网站| 欧美黑人精品巨大| 最新的欧美精品一区二区| 精品第一国产精品| 婷婷成人精品国产| 五月开心婷婷网| 一级毛片 在线播放| 精品卡一卡二卡四卡免费| 男女午夜视频在线观看| 亚洲欧美一区二区三区黑人| 夫妻午夜视频| 丰满饥渴人妻一区二区三| 精品人妻熟女毛片av久久网站| bbb黄色大片| 一级毛片我不卡| av欧美777| 欧美亚洲 丝袜 人妻 在线| 国产成人av激情在线播放| 久久久久久久国产电影| 欧美日韩亚洲综合一区二区三区_| 中文字幕色久视频| 美女国产高潮福利片在线看| 午夜免费男女啪啪视频观看| 一区在线观看完整版| 大片免费播放器 马上看| 国产日韩欧美亚洲二区| 欧美在线一区亚洲| 国产精品一区二区免费欧美 | 国产精品熟女久久久久浪| 精品人妻在线不人妻| 中文字幕人妻熟女乱码| 亚洲精品国产av成人精品| 久久精品aⅴ一区二区三区四区| 久久99精品国语久久久| 国产免费视频播放在线视频| 欧美精品高潮呻吟av久久| 亚洲av欧美aⅴ国产| 日韩中文字幕视频在线看片| 一二三四在线观看免费中文在| 欧美黑人欧美精品刺激| 女警被强在线播放| 在现免费观看毛片| 亚洲成av片中文字幕在线观看| 日韩伦理黄色片| 老司机深夜福利视频在线观看 | 亚洲国产成人一精品久久久| 天天添夜夜摸| 国产精品 欧美亚洲| 久久久久久久大尺度免费视频| 亚洲九九香蕉| 国产人伦9x9x在线观看| av线在线观看网站| cao死你这个sao货| 日本av手机在线免费观看| 丝袜喷水一区| 免费看十八禁软件| 热99国产精品久久久久久7| 90打野战视频偷拍视频| 一边亲一边摸免费视频| 蜜桃国产av成人99| 少妇裸体淫交视频免费看高清 | 99香蕉大伊视频| 热99国产精品久久久久久7| 国产成人一区二区在线| 最新在线观看一区二区三区 | 久久精品熟女亚洲av麻豆精品| 欧美日韩视频精品一区| 亚洲欧美清纯卡通| 亚洲av美国av| 一本色道久久久久久精品综合| 日韩一区二区三区影片| 99精国产麻豆久久婷婷| 国产精品一区二区在线不卡| 亚洲伊人色综图| 这个男人来自地球电影免费观看| 99久久综合免费| 午夜免费男女啪啪视频观看| 国产成人av教育| 精品少妇一区二区三区视频日本电影| 国产免费现黄频在线看| 欧美国产精品一级二级三级| 天天躁夜夜躁狠狠躁躁| 天天躁夜夜躁狠狠久久av| 99久久综合免费| 18禁国产床啪视频网站| 最新在线观看一区二区三区 | 日本一区二区免费在线视频| 日韩免费高清中文字幕av| 午夜福利,免费看| 国产一区亚洲一区在线观看| 老汉色∧v一级毛片| 99国产精品一区二区蜜桃av | 免费在线观看日本一区| 久久狼人影院| 亚洲国产av新网站| 一区二区三区激情视频| 男女之事视频高清在线观看 | 欧美成人午夜精品| 久久人妻福利社区极品人妻图片 | 欧美黑人精品巨大| 精品国产一区二区久久| 秋霞在线观看毛片| 久久人妻熟女aⅴ| 日日摸夜夜添夜夜爱| 亚洲人成网站在线观看播放| 一级毛片 在线播放| 老汉色∧v一级毛片| 久久久亚洲精品成人影院| 精品久久久精品久久久| 精品少妇黑人巨大在线播放| 熟女少妇亚洲综合色aaa.| 国产深夜福利视频在线观看| 欧美日韩成人在线一区二区| 在现免费观看毛片| 人人妻人人澡人人爽人人夜夜| 制服人妻中文乱码| 欧美97在线视频| 老司机午夜十八禁免费视频| 欧美日韩黄片免| 亚洲国产欧美一区二区综合| 国语对白做爰xxxⅹ性视频网站| 久久鲁丝午夜福利片| 国产高清videossex| 国产免费又黄又爽又色| 国产一区二区在线观看av| 国产无遮挡羞羞视频在线观看| cao死你这个sao货| 一级毛片我不卡| 女人久久www免费人成看片| 午夜福利视频精品| 少妇裸体淫交视频免费看高清 | 老司机午夜十八禁免费视频| 999精品在线视频| 这个男人来自地球电影免费观看| www日本在线高清视频| 大陆偷拍与自拍| 日日爽夜夜爽网站| 一本一本久久a久久精品综合妖精| www.精华液| 天天影视国产精品| 99热网站在线观看| 91字幕亚洲| 国产熟女午夜一区二区三区| 99热全是精品| 一级片免费观看大全| 色婷婷久久久亚洲欧美| 99精国产麻豆久久婷婷| 精品高清国产在线一区| 亚洲国产日韩一区二区| 青青草视频在线视频观看| 蜜桃在线观看..| 欧美国产精品一级二级三级| 亚洲国产看品久久| 日韩中文字幕视频在线看片| 女人高潮潮喷娇喘18禁视频| 视频区图区小说| 中文字幕制服av| 69精品国产乱码久久久| 国产无遮挡羞羞视频在线观看| 丝袜人妻中文字幕| 亚洲专区国产一区二区| av网站免费在线观看视频| 女性被躁到高潮视频| 男女之事视频高清在线观看 | 纯流量卡能插随身wifi吗| 亚洲熟女精品中文字幕| 丰满饥渴人妻一区二区三| 最新的欧美精品一区二区| 久热爱精品视频在线9| 老鸭窝网址在线观看| 精品福利观看| 男的添女的下面高潮视频| 亚洲午夜精品一区,二区,三区| 中国美女看黄片| 国产成人欧美| bbb黄色大片| 亚洲成人免费av在线播放| 高清av免费在线| av视频免费观看在线观看| 我的亚洲天堂| 亚洲中文av在线| 中文字幕精品免费在线观看视频| 高清黄色对白视频在线免费看| 建设人人有责人人尽责人人享有的| 精品一区二区三区四区五区乱码 | 国产黄频视频在线观看| 天天躁夜夜躁狠狠躁躁| 99久久精品国产亚洲精品| 日韩视频在线欧美| www.熟女人妻精品国产| 午夜福利,免费看| 久久 成人 亚洲| 久久人妻福利社区极品人妻图片 | 国产一区二区三区av在线| 乱人伦中国视频| 久久久久视频综合| 国产主播在线观看一区二区 | 少妇被粗大的猛进出69影院| 国产日韩一区二区三区精品不卡| 精品人妻熟女毛片av久久网站| 真人做人爱边吃奶动态| 国产熟女欧美一区二区| 亚洲欧美中文字幕日韩二区| 18在线观看网站| 欧美日韩亚洲高清精品| 色婷婷av一区二区三区视频|