陳志華 劉曉勇
摘 要: 傳統(tǒng)的云計(jì)算Hadoop 分布式多層體系架構(gòu)數(shù)據(jù)檢索模塊難以滿(mǎn)足云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索需求,因此采用需要結(jié)合存儲(chǔ)非結(jié)構(gòu)化大數(shù)據(jù)的特點(diǎn),塑造新的集群的基礎(chǔ)環(huán)境,通過(guò)云、端并重的形式,實(shí)現(xiàn)大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索。引入一種非結(jié)構(gòu)大數(shù)據(jù)索引框架,作為非結(jié)構(gòu)化數(shù)據(jù)庫(kù),當(dāng)成數(shù)據(jù)檢索引擎,改進(jìn)云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的檢索服務(wù),給出檢索技術(shù)在檢索非結(jié)構(gòu)化大數(shù)據(jù)過(guò)程中的關(guān)鍵代碼。實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)系統(tǒng)在檢索云計(jì)算下非結(jié)構(gòu)大數(shù)據(jù)的過(guò)程中,具有較高的查準(zhǔn)率和較低的檢索時(shí)間,可實(shí)現(xiàn)非結(jié)構(gòu)云數(shù)據(jù)的穩(wěn)定性檢索。
關(guān)鍵詞: 云計(jì)算; 大數(shù)據(jù); 非結(jié)構(gòu)穩(wěn)定性檢索; 數(shù)據(jù)檢索引擎
中圖分類(lèi)號(hào): TN911?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)06?0058?04
Methods of unstructured big data stability retrieval in cloud computing
CHEN Zhihua, LIU Xiaoyong
(Guangdong Polytechnic Normal University, Guangzhou 510665, China)
Abstract: It is difficult for the traditional cloud computing Hadoop distributed multi?layer architecture data retrieval module to meet the demand of the unstructured big?data stability retrieval in the cloud computing, so it is necessary to combine the characteristics of the unstructured large data storage, shape a new clustering basic environment, and pay equal attention to the form of cloud and end, to realize the stability retrieval of the unstructured big data. A big data index framework is taken as a unstructured database and as a data retrieval engine to improve the unstructured data retrieval service in cloud computing, and give the key code of the retrieval in the process of unstructured big data retrieval. Experiment result shows that the designed system, in the process of unstructured big data retrieval in the cloud computing, has high precision and short retrieval time, and can realize the stability retrieval of the structured cloud data.
Keywords: cloud computing; big data; unstructured stability retrieve; data retrieval engine
0 引 言
隨著云計(jì)算技術(shù)的快速發(fā)展,不同類(lèi)型服務(wù)器數(shù)據(jù)信息呈現(xiàn)爆炸式增長(zhǎng),市場(chǎng)迫切需要先進(jìn)的大規(guī)模云計(jì)算數(shù)據(jù)存儲(chǔ)和檢索技術(shù)[1?3]。云計(jì)算下大數(shù)據(jù)檢索的研究和應(yīng)用順應(yīng)了市場(chǎng)的發(fā)展需求。當(dāng)前的云計(jì)算下海量數(shù)據(jù)中,有高于80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),但是,當(dāng)前的信息關(guān)聯(lián)檢索主要依靠的是建立結(jié)構(gòu)化的關(guān)聯(lián)規(guī)則,無(wú)法滿(mǎn)足云信息檢索需求,尋求有效方法快速?gòu)闹袡z索到有價(jià)值信息,成為相關(guān)學(xué)者研究的熱點(diǎn)[4]。
文獻(xiàn)[5]提出了熱度敏感的非結(jié)構(gòu)化數(shù)據(jù)檢索排名算法,但是該方法對(duì)數(shù)據(jù)的屬性特征具有較高的敏感性,存在較高的局限性。文獻(xiàn)[6]分析了基于Lucene算法的文件全文檢索解決方案,可快速有效地分析出不同結(jié)構(gòu)數(shù)據(jù)的信息,但是存在耗能高和檢索效率低的缺陷。文獻(xiàn)[7]分析的分布式索引方法采用多節(jié)點(diǎn)備份實(shí)現(xiàn)系統(tǒng)檢索,但是當(dāng)備份的節(jié)點(diǎn)同時(shí)發(fā)生故障,則無(wú)法恢復(fù)失效節(jié)點(diǎn)上的索引,導(dǎo)致檢索精度降低。文獻(xiàn)[8]提出了以索引服務(wù)為基礎(chǔ)的本地索引方法,直接為檢索服務(wù)的方法,確保檢索同索引集群緊密結(jié)合,極大提高了該種方法的容錯(cuò)性,但是同時(shí)也增加了該種方法的復(fù)雜性。
為了解決上述分析的問(wèn)題,本文以云計(jì)算Hadoop 分布式多層體系架構(gòu)為基礎(chǔ),分析存儲(chǔ)非結(jié)構(gòu)化大數(shù)據(jù)的特點(diǎn),將非結(jié)構(gòu)大數(shù)據(jù)索引框架當(dāng)成非結(jié)構(gòu)化數(shù)據(jù)庫(kù),提供云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的檢索服務(wù)。實(shí)驗(yàn)結(jié)果說(shuō)明,所設(shè)計(jì)系統(tǒng)在檢索云計(jì)算下非結(jié)構(gòu)大數(shù)據(jù)的過(guò)程中,具有較高的查準(zhǔn)率和較低的檢索時(shí)間,可實(shí)現(xiàn)大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索。
1 云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的架構(gòu)分析
1.1 Hadoop架構(gòu)的非結(jié)構(gòu)化分析
云計(jì)算下存儲(chǔ)的大數(shù)據(jù)種類(lèi)較多,都是以非結(jié)構(gòu)檢索關(guān)系存在的,總體架構(gòu)如圖1所示。該檢索平臺(tái)依托云計(jì)算,云平臺(tái)采用了 Hadoop 分布式多層體系架構(gòu)存儲(chǔ)非結(jié)構(gòu)化大數(shù)據(jù),并塑造集群的基礎(chǔ)環(huán)境,通過(guò)云、端并重的形式,實(shí)現(xiàn)大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索。
當(dāng)前的云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)檢索系統(tǒng)通過(guò)互聯(lián)網(wǎng)采集云計(jì)算下的海量數(shù)據(jù),通過(guò)后臺(tái)系統(tǒng)實(shí)現(xiàn)大數(shù)據(jù)非結(jié)構(gòu)的自主加工和統(tǒng)計(jì)操作。該平臺(tái)還能夠統(tǒng)計(jì)分析熱點(diǎn)信息。在獲得大量非結(jié)構(gòu)數(shù)據(jù)后,系統(tǒng)根據(jù)檢索業(yè)務(wù)策略定義,在檢索引擎的配合下,完成大數(shù)據(jù)非結(jié)構(gòu)檢索的存儲(chǔ)服務(wù)。
1.2 云存儲(chǔ)下數(shù)據(jù)的非結(jié)構(gòu)特點(diǎn)分析
上述系統(tǒng)總體架構(gòu)采用多層體系架構(gòu)設(shè)計(jì),并依據(jù)多層架構(gòu)的基礎(chǔ)服務(wù)進(jìn)行塑造。在多層體系架構(gòu)下,通過(guò)云、端并重的形式,實(shí)現(xiàn)大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性存儲(chǔ),存儲(chǔ)過(guò)程程序非結(jié)構(gòu)的特點(diǎn)如下:
(1) 用戶(hù)檢索終端數(shù)據(jù)的非結(jié)構(gòu)化。面向終端檢索用戶(hù),通過(guò)Web門(mén)戶(hù)應(yīng)用以及移動(dòng)終端 APP為用戶(hù)提供大數(shù)據(jù)檢索的服務(wù)中,因?yàn)橛脩?hù)信息的多樣性,無(wú)法形成穩(wěn)定的結(jié)構(gòu)。
(2) 業(yè)務(wù)應(yīng)用層數(shù)據(jù)的非結(jié)構(gòu)化。業(yè)務(wù)應(yīng)用層服務(wù)為系統(tǒng)提供各種應(yīng)用程序,系統(tǒng)以服務(wù)的方式對(duì)外提供大數(shù)據(jù)業(yè)務(wù)支撐,同時(shí)將該部分的服務(wù)部署在云平臺(tái)中。用戶(hù)檢索終端應(yīng)用通過(guò)訪問(wèn)云平臺(tái)中的業(yè)務(wù)應(yīng)用層服務(wù),完成云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索業(yè)務(wù)。但是,由于應(yīng)用程序在種類(lèi)和開(kāi)發(fā)過(guò)程中的差異性愈來(lái)愈大,導(dǎo)致該層數(shù)據(jù)也存在較大的非結(jié)構(gòu)化的特點(diǎn)。
(3) 平臺(tái)服務(wù)層數(shù)據(jù)的非結(jié)構(gòu)化。平臺(tái)服務(wù)層為業(yè)務(wù)應(yīng)用層和基礎(chǔ)資源層提供相關(guān)的服務(wù),包括媒體處理服務(wù)和調(diào)度、流程引擎服務(wù)。平臺(tái)服務(wù)層中包含關(guān)鍵的大數(shù)據(jù)檢索引擎。但是隨著檢索模式的不斷增加,該層數(shù)據(jù)也存在較大的非結(jié)構(gòu)化的特點(diǎn)。
(4) 基礎(chǔ)資源層數(shù)據(jù)的非結(jié)構(gòu)化?;A(chǔ)資源服務(wù)層是云平臺(tái)的基礎(chǔ)設(shè)備層,通過(guò)計(jì)算資源服務(wù)、存儲(chǔ)資源服務(wù)以及網(wǎng)絡(luò)資源服務(wù),通過(guò)邏輯資源池的方式實(shí)現(xiàn)云平臺(tái)的調(diào)控。該檢索平臺(tái)中的基礎(chǔ)資源服務(wù),主要指云平臺(tái)的基礎(chǔ)資源,包括云存儲(chǔ)、虛擬計(jì)算資源以及操作系統(tǒng)等基礎(chǔ)部件,隨著基礎(chǔ)設(shè)備的不斷增加,設(shè)備數(shù)據(jù)之間也無(wú)法形成穩(wěn)定的結(jié)構(gòu)特征,形成非結(jié)構(gòu)化的特點(diǎn)。
2 云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的檢索實(shí)現(xiàn)
在云計(jì)算下,差異大數(shù)據(jù)非結(jié)構(gòu)檢索是一個(gè)復(fù)雜的過(guò)程,通過(guò)第1節(jié)的分析可以看出,平臺(tái)中存儲(chǔ)著海量非結(jié)構(gòu)化數(shù)據(jù)。傳統(tǒng)的依據(jù)結(jié)構(gòu)化索引的方法無(wú)法滿(mǎn)足非結(jié)構(gòu)數(shù)據(jù)穩(wěn)定的檢索要求。本文通過(guò)構(gòu)建非結(jié)構(gòu)化大數(shù)據(jù)的分布式索引系統(tǒng),可滿(mǎn)足云計(jì)算下非結(jié)構(gòu)大數(shù)據(jù)的穩(wěn)定性檢索需求。
2.1 設(shè)計(jì)非結(jié)構(gòu)化數(shù)據(jù)的索引框架
通過(guò)塑造分布式非結(jié)構(gòu)化大數(shù)據(jù)索引框架可以對(duì)非結(jié)構(gòu)數(shù)據(jù)建立類(lèi)似于結(jié)構(gòu)化的框架,設(shè)計(jì)的框架如圖2所示。該分布式索引框架包括索引集群、檢索集群以及分布式文件系統(tǒng)。
2.2 索引集群的引入
在非結(jié)構(gòu)框架下,設(shè)計(jì)索引集群可塑造分布式大數(shù)據(jù)非結(jié)構(gòu)檢索的索引。索引集群采用Master?Slave結(jié)構(gòu),由一個(gè)索引主節(jié)點(diǎn)以及多個(gè)索引節(jié)點(diǎn)構(gòu)成。通過(guò)該結(jié)構(gòu)能夠?qū)⑺饕蝿?wù)分割到不同的索引節(jié)點(diǎn)中,確保不同的索引節(jié)點(diǎn)能夠并行塑造索引,增強(qiáng)系統(tǒng)對(duì)云計(jì)算下非結(jié)構(gòu)數(shù)據(jù)的操作性能。索引集群服務(wù)于批量和增量索引模式。系統(tǒng)保存非結(jié)構(gòu)數(shù)據(jù)后會(huì)向索引主節(jié)點(diǎn)傳遞增量式索引任務(wù)的消息。索引主節(jié)點(diǎn)按照該消息中的數(shù)據(jù)特征以及內(nèi)容,使用索引分片方案,判斷相應(yīng)的數(shù)據(jù)歸屬于索引分片,再在分布式索引消息隊(duì)列中存儲(chǔ)相關(guān)的消息。
不同結(jié)構(gòu)的數(shù)據(jù)索引節(jié)點(diǎn)相互獨(dú)立,并從消息隊(duì)列中采集消息。若采集的消息屬于相應(yīng)索引節(jié)點(diǎn),則對(duì)消息進(jìn)行相關(guān)的檢索,否則將消息反饋到對(duì)應(yīng)的索引節(jié)點(diǎn)再進(jìn)行操作。若對(duì)應(yīng)的操作索引節(jié)點(diǎn)無(wú)法正常運(yùn)行,則通過(guò)索引主節(jié)點(diǎn)完成消息的操作,并將新的索引節(jié)點(diǎn)配置給對(duì)應(yīng)消息。索引集群能夠增強(qiáng)總體系的吞吐量。
2.3 非結(jié)構(gòu)化下的檢索集群的設(shè)計(jì)
在非結(jié)構(gòu)數(shù)據(jù)框架下,檢索集群包含檢索主節(jié)點(diǎn)、檢索節(jié)點(diǎn)以及檢索客戶(hù)端。檢索集群通過(guò)Master?Slave結(jié)構(gòu)確保索引文件高效率的部署到不同的檢索節(jié)點(diǎn)中,增強(qiáng)數(shù)據(jù)檢索服務(wù)效率。檢索節(jié)點(diǎn)依據(jù)Master?Slave結(jié)構(gòu)能夠獲取總體檢索集群中不同檢索節(jié)點(diǎn)的負(fù)載情況。當(dāng)用戶(hù)通過(guò)檢索客戶(hù)端發(fā)出數(shù)據(jù)檢索申請(qǐng)后,檢索主節(jié)點(diǎn)將按照不同檢索節(jié)點(diǎn)的負(fù)載情況,獲取一個(gè)節(jié)點(diǎn)列表,并將該列表反饋給檢索客戶(hù)端,檢索客戶(hù)端依據(jù)獲取的檢索節(jié)點(diǎn)列表進(jìn)行檢索。用戶(hù)采用檢索客戶(hù)端可申請(qǐng)檢索,并獲取相應(yīng)的檢索結(jié)果。
2.4 云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)化的檢索代碼
當(dāng)前多使用SQL全文檢索技術(shù)實(shí)現(xiàn)云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)化的檢索設(shè)計(jì),詳細(xì)過(guò)程為:?jiǎn)?dòng)SQL Server的full text search全球檢索服務(wù),設(shè)置數(shù)據(jù)庫(kù)服務(wù)器的默認(rèn)語(yǔ)言為2052(中文);運(yùn)行SQL語(yǔ)句啟用全文檢索:Executesp_fulltext_StructDabase‘enable;選擇“全文索引”中的“定義全文索引”,融入全文檢索向?qū)?duì)話(huà)框,選擇將要對(duì)其進(jìn)行全文索引的字段和全文目錄。
重新啟動(dòng)SQL Server則能夠采用檢索語(yǔ)句CONTAINS以及FREETEXT對(duì)所設(shè)置的表進(jìn)行查詢(xún)。其中,CONTAINS語(yǔ)句可在表的全部列中搜索,詞或短語(yǔ)以及同對(duì)應(yīng)詞相近的詞等;FREETEXT語(yǔ)句可在一個(gè)表的全部列或指定列中搜索一個(gè)自由文本各種的字符串,并返回同該字符串匹配的數(shù)據(jù)行。
如在Doc表中查找文件內(nèi)容中包含“暴恐”,所采用的SQL語(yǔ)句為:
SELECT*FROM Doc Where CONTAINS(DocumentConnotation ,′暴恐′)
檢索非結(jié)構(gòu)化數(shù)據(jù)的界面中,輸入關(guān)鍵字,單擊“檢索”按鈕,則可將文件內(nèi)容中包含該關(guān)鍵字的文件名、文件類(lèi)型顯示處理。實(shí)現(xiàn)文檔中關(guān)鍵字檢索的主要代碼為:
Public StructDaTable StructDaSearch(string keyword,string steConn){string sql= "select * from doc where CONTAINS (DocumentConten,""+key?word+"")";
SqlStructDaAdaper da=new SqlStructDaAdaper(sql,strConn);
StructDaSer da=new StructDaSet();
da.Fill(da); return da.Tables[0];}
若需打開(kāi)某文檔,則對(duì)總體文檔進(jìn)行詳細(xì)分析,在.net環(huán)境中,通過(guò)設(shè)置Response的ConnotationSpecies屬性和調(diào)用BinaryWrite方法則能夠站在瀏覽器中顯示相關(guān)的文檔內(nèi)容。顯示W(wǎng)ord文檔以及Excel文檔內(nèi)容的關(guān)鍵代碼為:
3 實(shí)驗(yàn)分析
實(shí)驗(yàn)采用云計(jì)算非結(jié)構(gòu)NUS數(shù)據(jù)集,將該數(shù)據(jù)集中低維特征提取出來(lái)的視覺(jué)單詞特征,當(dāng)成測(cè)試集合。本實(shí)驗(yàn)從該非結(jié)構(gòu)數(shù)據(jù)集中隨機(jī)抽取100萬(wàn)個(gè)特征作為樣本訓(xùn)練集合。實(shí)驗(yàn)采用檢索時(shí)間和查準(zhǔn)率兩個(gè)指標(biāo)評(píng)估本文系統(tǒng)和平均分配檢索系統(tǒng)的優(yōu)劣。
查準(zhǔn)率=檢索結(jié)果中相關(guān)的結(jié)果總數(shù)/檢索結(jié)果的總數(shù)
為了得到比較全面的實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)選擇了10組實(shí)驗(yàn),每組實(shí)驗(yàn)的文件數(shù)分別為10萬(wàn),20萬(wàn),30萬(wàn),40萬(wàn),50萬(wàn),60萬(wàn),70萬(wàn),80萬(wàn),90萬(wàn)以及100萬(wàn)。再計(jì)算出檢索時(shí)間的平均值以及查準(zhǔn)率的平均值對(duì)各個(gè)系統(tǒng)進(jìn)行評(píng)價(jià)。
3.1 以查準(zhǔn)率為評(píng)估指標(biāo)
實(shí)驗(yàn)先以查準(zhǔn)率作為評(píng)價(jià)指標(biāo)進(jìn)行實(shí)驗(yàn)。在每種實(shí)驗(yàn)系統(tǒng)中,依次輸入不同檢索目標(biāo)進(jìn)行檢索,并設(shè)置最長(zhǎng)搜索時(shí)間為3 s進(jìn)行實(shí)驗(yàn)。統(tǒng)計(jì)不同檢索目標(biāo)的查準(zhǔn)率,并運(yùn)算平均值。再比較各系統(tǒng)的查準(zhǔn)率。本文方法下系統(tǒng)和平均分配系統(tǒng)的查準(zhǔn)率對(duì)比如圖3所示。
分析圖3可得,本文方法下的查準(zhǔn)率明顯好于平均分配檢索系統(tǒng),說(shuō)明使用的本文方法進(jìn)行大數(shù)據(jù)非結(jié)構(gòu)的檢索具有較強(qiáng)的優(yōu)勢(shì)。
3.2 以檢索時(shí)間為評(píng)估指標(biāo)
實(shí)驗(yàn)依據(jù)檢索平均時(shí)間為指標(biāo)評(píng)估不同的檢索系統(tǒng)。在兩個(gè)實(shí)驗(yàn)系統(tǒng)中,分別輸入不同的檢索目標(biāo)進(jìn)行檢索,同時(shí)設(shè)置不同的檢索結(jié)果數(shù)進(jìn)行多次實(shí)驗(yàn)。運(yùn)算不同系統(tǒng)中差異結(jié)果下的檢索平均時(shí)間,再比較兩個(gè)系統(tǒng)的檢索時(shí)間。在本文系統(tǒng)和平均分配系統(tǒng)中對(duì)10 個(gè)實(shí)驗(yàn)?zāi)繕?biāo)進(jìn)行檢索,統(tǒng)計(jì)各目標(biāo)在兩個(gè)系統(tǒng)中的檢索時(shí)間,運(yùn)算出平均檢索時(shí)間,如圖4所示。
從圖4中可以看出,平均分配檢索系統(tǒng)在平均搜索時(shí)間上高于本文系統(tǒng),則證實(shí)應(yīng)用了本文檢索系統(tǒng)在查詢(xún)時(shí)間和查準(zhǔn)率這兩個(gè)評(píng)價(jià)指標(biāo)上,都優(yōu)于傳統(tǒng)的平均分配系統(tǒng)。
上面的實(shí)驗(yàn)比較可以看出,本文檢索系統(tǒng)對(duì)非結(jié)構(gòu)數(shù)據(jù)的性能優(yōu)于傳統(tǒng)的平均分配系統(tǒng)。說(shuō)明本文系統(tǒng)可實(shí)現(xiàn)云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索,具有較高的應(yīng)用價(jià)值。
4 結(jié) 語(yǔ)
本文以云計(jì)算為基礎(chǔ),采用Hadoop 分布式多層體系架構(gòu)存儲(chǔ)非結(jié)構(gòu)化大數(shù)據(jù),并塑造集群的基礎(chǔ)環(huán)境,通過(guò)云、端并重的形式,實(shí)現(xiàn)大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索。將非結(jié)構(gòu)大數(shù)據(jù)索引框架作為非結(jié)構(gòu)化數(shù)據(jù)庫(kù),當(dāng)成數(shù)據(jù)檢索引擎,提供云計(jì)算下大數(shù)據(jù)非結(jié)構(gòu)的檢索服務(wù),該分布式索引框架包括索引集群、檢索集群以及分布式文件系統(tǒng)。給出SQL Server 2008的全文檢索技術(shù)在檢索非結(jié)構(gòu)化大數(shù)據(jù)過(guò)程中的關(guān)鍵代碼。實(shí)驗(yàn)結(jié)果說(shuō)明,所設(shè)計(jì)系統(tǒng)在檢索云計(jì)算下非結(jié)構(gòu)大數(shù)據(jù)的過(guò)程中,具有較高的查準(zhǔn)率和較低的檢索時(shí)間,可實(shí)現(xiàn)大數(shù)據(jù)非結(jié)構(gòu)的穩(wěn)定性檢索。
參考文獻(xiàn)
[1] 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[R].北京:CNNIC,2014.
[2] 車(chē)曉蕙,周立民,陳鋼,等.大數(shù)據(jù)為王第三次流通革命在望[N].經(jīng)濟(jì)參考報(bào),2013?09?11(5).
[3] 李淑芝,劉鋒,楊書(shū)新.基于云仿真的Web服務(wù)選擇研究[J].計(jì)算機(jī)應(yīng)用研究,2013,30(4):1069?1071.
[4] 杜蕓蕓.一種面向糾刪碼技術(shù)的云存儲(chǔ)可靠性機(jī)制[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(2):312?316.
[5] 林菲,張萬(wàn)軍,孫勇.一種分布式非結(jié)構(gòu)化數(shù)據(jù)副本管理模型[J].計(jì)算機(jī)工程,2013,39(4):36?38.
[6] 翟巖龍,羅壯,楊凱,等.基于Hadoop的高性能海量數(shù)據(jù)處理平臺(tái)研究[J].計(jì)算機(jī)科學(xué),2013,40(3):100?103.
[7] 韓晶,宋美娜,鄂海紅,等.HotRank:熱度敏感的非結(jié)構(gòu)化數(shù)據(jù)檢索排名算法[J].計(jì)算機(jī)應(yīng)用研宄,2013,30(5):1306?1308.
[8] 郭永利,盧穎穎.基于Lucene對(duì)文件全文檢索的研究與應(yīng)用[J].微型電腦應(yīng)用,2014,31(1):51?54.