摘 要:為了很好的解決P2P2網(wǎng)絡(luò)檢索算法的低效率問題,提出了信息量聲譽(yù)激勵的P2P和節(jié)點(diǎn)興趣域聚類的一種網(wǎng)絡(luò)檢索機(jī)制。在這個機(jī)制當(dāng)中,首先對于網(wǎng)絡(luò)節(jié)點(diǎn)的信息量進(jìn)行了分類,然后根據(jù)節(jié)點(diǎn)數(shù)據(jù)的聲譽(yù)激勵法對相鄰節(jié)點(diǎn)進(jìn)行以興趣為基礎(chǔ)的構(gòu)造模式,與此同時用戶輸入關(guān)鍵字進(jìn)行個性化輔助選擇。通過試驗(yàn)仿真設(shè)計證明,這個網(wǎng)絡(luò)檢索算法構(gòu)建的動態(tài)結(jié)構(gòu),可以很好的避免結(jié)構(gòu)化P2P網(wǎng)絡(luò)對中心節(jié)點(diǎn)的依賴性。
關(guān)鍵詞:P2P網(wǎng)絡(luò)檢索算法;設(shè)計仿真
中圖分類號:TP393.02
P2P網(wǎng)絡(luò)是對網(wǎng)絡(luò)邊緣資源的利用,它的能力被廣泛應(yīng)用到現(xiàn)代化的信息檢索機(jī)構(gòu)當(dāng)中,其中對于網(wǎng)頁緩存資源的利用,提出了以節(jié)點(diǎn)所擁有的信息通過廣播和共享模式傳輸?shù)木褪锹酚赡J?。接下來本位以信息量聲譽(yù)激勵方法和節(jié)點(diǎn)興趣域聚類方法為進(jìn)行,對P2P網(wǎng)絡(luò)中的興趣域和非結(jié)構(gòu)化進(jìn)行研究分析,然后構(gòu)造相對應(yīng)的動態(tài)結(jié)構(gòu)模式。在分析的時候我們結(jié)合輔助信息量,對網(wǎng)絡(luò)系統(tǒng)的節(jié)點(diǎn)數(shù)據(jù)進(jìn)行綜合評價和分析,最終通過仿真實(shí)驗(yàn)證明了P2P網(wǎng)絡(luò)檢索方法的有效性和科學(xué)性。
1 P2P網(wǎng)絡(luò)檢索算法
定義:P2P網(wǎng)絡(luò)檢索算法主要由以下幾個基本點(diǎn)構(gòu)成,首先是信息量,通過節(jié)點(diǎn)信息量讓系統(tǒng)在最短時間內(nèi)進(jìn)行興趣度的計算;信息量的相似程度,通過公式反映就是 ,公式中的( )決定了網(wǎng)絡(luò)信息量的好壞程度,同時Sim(Ni,Nj)所得值越小,相近程度也高;還有節(jié)點(diǎn)興趣和節(jié)點(diǎn)興趣的相近程度,利用興趣相近度的方法,可以把節(jié)點(diǎn)信息量以興趣為基準(zhǔn)進(jìn)行分類。其中還有興趣域的定義、語義分析和用戶個性化設(shè)置等。通過這些信息和數(shù)據(jù)都可以將搜索得到的數(shù)據(jù)進(jìn)行非常細(xì)致、準(zhǔn)確的劃分和組合,最終目的就是為用戶提供一條非常準(zhǔn)確的消息值。
P2P網(wǎng)絡(luò)檢索算法由以下幾部分構(gòu)成,第一部分:人機(jī)互換。用戶在登陸之后,輸入相對應(yīng)的關(guān)鍵字詞,系統(tǒng)就會根據(jù)用戶提供的關(guān)鍵詞語進(jìn)行相關(guān)信息的搜集,然后用戶可以根據(jù)的需要選擇保留或者推出P2P網(wǎng)絡(luò)。第二部分:語言的分析。對于用戶輸入關(guān)鍵字進(jìn)行相近詞的分析,而且在分析的時候會產(chǎn)生一定的詞語聯(lián)想技術(shù)分析詞語的意思,然后產(chǎn)生相對應(yīng)的輔助詞語供用戶選擇。第三部分:網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。P2P網(wǎng)絡(luò)檢索模式是依賴興趣節(jié)點(diǎn)對于所含信息量的有效程度,然后把相同興趣的節(jié)點(diǎn)信息分門別類,在此基礎(chǔ)上計算相鄰節(jié)點(diǎn)的信息,構(gòu)成系統(tǒng)需要的聲譽(yù)激勵法興趣樹,最后就會形成P2P網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。第四部分:信息的檢索。第一步要在P2P網(wǎng)絡(luò)檢索系統(tǒng)中發(fā)布檢索關(guān)鍵詞內(nèi)容的指令,目的是確定為P2P網(wǎng)絡(luò)檢索系統(tǒng)提供可以使用的信息節(jié)點(diǎn),然后在搜尋到滿足用戶檢索要求的時候,對信息節(jié)點(diǎn)內(nèi)的全部資源進(jìn)行搜索。第五部分:綜合信息的處理。P2P網(wǎng)絡(luò)檢索系統(tǒng)對于檢索出來的沒有鏈接效應(yīng)和空白鏈接會及時的刪掉,然后P2P網(wǎng)絡(luò)檢索系統(tǒng)依據(jù)興趣相近的程度和用戶關(guān)鍵詞的要求,對已經(jīng)搜索到的結(jié)果進(jìn)行排列組合,最終呈現(xiàn)給用戶一個較為滿意的數(shù)據(jù)信息。
P2P網(wǎng)絡(luò)檢索模式主要是通過“進(jìn)入節(jié)點(diǎn)”和“退出節(jié)點(diǎn)”興趣樹的形式對其進(jìn)行數(shù)據(jù)更新,主要是通過興趣樹更新可以確保相同節(jié)點(diǎn)信息從始至終都在一個固定有效的范圍內(nèi),在用戶檢索的時候提升了工作效率。針對用戶輸入關(guān)鍵詞語方面,P2P網(wǎng)絡(luò)檢索系統(tǒng)會進(jìn)行語義分析,分析采用的是輔助語義和語義分析相互結(jié)合的方式。按照檢索信息判斷出在線的服務(wù)節(jié)點(diǎn),然后在網(wǎng)絡(luò)緩存數(shù)據(jù)中進(jìn)行地毯式的搜索,目的在于滿足用戶個性化設(shè)置的要求。
2 P2P算法的分析
P2P網(wǎng)絡(luò)檢索算法是對節(jié)點(diǎn)信息和和個性化服務(wù)為基礎(chǔ)形成的興趣樹結(jié)構(gòu)和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),然后根據(jù)信息量的相近程度對興趣相鄰節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行匹配和選擇,其中數(shù)據(jù)資源就是網(wǎng)絡(luò)緩存下來的資源和每個節(jié)點(diǎn)存在的數(shù)據(jù)資源。
2.1 興趣樹的構(gòu)成。部分步驟如下
第一步:Start //所有變量進(jìn)行初始化操作。第二步:scanf Z //調(diào)入資源庫Z。第三步:for(F{each Ei=Si}) //判斷條件;{ If( 0 < k0 < t0) / /如果信息E 與S0節(jié)點(diǎn)信息量興趣相似度在額定值t0內(nèi);那么t0∈ S0; / /然后在信息E 節(jié)點(diǎn)信息量中添加進(jìn)S0節(jié)點(diǎn)集合,最后更新S0;第四步:(0-i,m)→S// 生成興趣的集合,然后構(gòu)建P2P網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。第五步:for ( j = 0; j < = d; j + + ){ if ( 0 < ki < tj) / / 若興趣相似度滿足興趣樹第j層閾值; Else ki∈ Ynew / /生成新的興趣樹;End if } End for。第六步:S=S;Y=Y;//輸出網(wǎng)絡(luò)拓?fù)鋱D,得到興趣樹Y,及時對其更新。
2.2 P2P網(wǎng)絡(luò)檢索機(jī)制。部分步驟如下
第一步:Start //所有變量進(jìn)行初始化操作。第二步:同義詞分析、近義詞分析和語義分析//進(jìn)行語義的分析,生成輔助語義。第三步:同義詞分析→(M∪ N)→E //確定檢索的詞語。第四步:if Sean(S∩e)=e;go to第五步//如果檢索信息的節(jié)點(diǎn)在線,那么就繼續(xù)執(zhí)行第五步。如果說Else Scan = = 1; return not answer//那么就是說掃描的結(jié)果是0,返回上一步。第五步:For ( search E ∈ S){ if ( 0 < k < t0) / / 如果信息E 和S0中信息量的興趣相似度在額定值t0內(nèi);輸出 Y0 / / 掃描Y0;If Y0j ∩ E = E , / / 掃描Y0的第c 層節(jié)點(diǎn)序列;Y0 = Y0;S0 = S0 / / 興趣樹Y0和節(jié)點(diǎn)集合S0更新;End for。第六步:判斷集合N屬于集合L// 資源列表L進(jìn)行更新。
3 試驗(yàn)仿真
實(shí)驗(yàn)環(huán)境配置:同一種網(wǎng)絡(luò)環(huán)境下的PC機(jī),配置的系統(tǒng)是Windosw 2000 Professional,處理器是Intel Pentium 1.73GHz,緩存數(shù)據(jù)是128M,P2P網(wǎng)絡(luò)協(xié)議是BestPeer,編寫程序的環(huán)境是VC++2005。實(shí)驗(yàn)使用的參考數(shù)據(jù)是在TREC中隨機(jī)抽取5000份資源。實(shí)驗(yàn)在開始的時候,要對抽取的文檔資源進(jìn)行網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的生成和興趣樹的構(gòu)成,然后才可以進(jìn)行信息檢索的評測。其中全部檢索率是V,檢索準(zhǔn)確率是B和G: ; ; 。上述公式中的I就是根據(jù)檢索條件得出興趣樹的數(shù)量,R:興趣集合的數(shù)量,W:供用戶選擇的信息量,G:綜合分析指標(biāo)。下圖是我們在試驗(yàn)的時候,分別對四種不同興趣度的數(shù)據(jù)信息進(jìn)行檢索操作,
從上述表格中的數(shù)據(jù)看得出來P2P網(wǎng)絡(luò)檢索方法具有非常好的檢索效率,然后通過Q綜合評價的計算值得出,P2P網(wǎng)絡(luò)檢索方式的非常準(zhǔn)確和有效的,從基本方面來說已經(jīng)實(shí)現(xiàn)了實(shí)時搜索的功能。
每個算法的執(zhí)行時間都會隨著規(guī)模的增大在增加,而且P2P網(wǎng)絡(luò)檢索計算方法相比較其他方法耗時是最少的。在計算初期的時候,因?yàn)榻?jīng)常使用公共數(shù)據(jù)中緩存的文件,所以在小規(guī)模的隨機(jī)抽樣中路由方式存在一定的優(yōu)勢,但是根據(jù)本文需要探討的內(nèi)容,以語義分析和興趣樹為基準(zhǔn)進(jìn)行計算的時候,耗時還是非常長的,并且搜索的效率很低。但是當(dāng)節(jié)點(diǎn)規(guī)模慢慢變大的時候,本文所提到的P2P網(wǎng)絡(luò)檢索方式的優(yōu)勢遠(yuǎn)遠(yuǎn)超過路由模式。因?yàn)楸疚奶岬降腜2P網(wǎng)路檢索方法對興趣域向鄰近的節(jié)點(diǎn)進(jìn)行值域劃分和定義的劃分,因此在計算的時候,如果說節(jié)點(diǎn)規(guī)模非常大的時候,會呈現(xiàn)一種非常高的執(zhí)行效率。
4 總結(jié)
通過上述材料的具體分析,我們具體分析了P2P網(wǎng)絡(luò)檢索算法、P2P算法的分析和試驗(yàn)仿真三個方面的相關(guān)問題,以興趣域聚類為構(gòu)建數(shù)據(jù)進(jìn)行動態(tài)數(shù)據(jù)的構(gòu)建,然后把信息資源相關(guān)的節(jié)點(diǎn)數(shù)據(jù)按照興趣類別進(jìn)行規(guī)整,然后就形成了我們需要的非結(jié)構(gòu)化的P2P網(wǎng)絡(luò),根據(jù)用戶輸入關(guān)鍵語義開始搜尋節(jié)點(diǎn)信息數(shù)據(jù),然后對最優(yōu)聲譽(yù)節(jié)點(diǎn)數(shù)據(jù)進(jìn)行更新。通過仿真實(shí)驗(yàn)證明了P2P網(wǎng)絡(luò)檢索算法的執(zhí)行效率和有效性能。
參考文獻(xiàn):
[1]項興彬,曾國蓀,夏冬梅.P2P環(huán)境下文件共享的信任建立博弈模型及穩(wěn)態(tài)分析[J].計算機(jī)應(yīng)用研究,2010(19):100-103.
[2]劉鳳鳴,丁永生.基于進(jìn)化博弈的P2P網(wǎng)絡(luò)中信任計算的動力學(xué)分析[J].計算機(jī)應(yīng)用研究,2010(18):120-123.
[3]劉鳳鳴,丁永生.基于生態(tài)網(wǎng)絡(luò)的P2P環(huán)境信任博弈進(jìn)化模型[J].計算機(jī)工程與應(yīng)用,2011(23):200-205.
作者簡介:吳謀碩(1978.08-),男,湖南湘鄉(xiāng)人,副教授,碩士研究生,研究方向:網(wǎng)絡(luò)信息檢索。
作者單位:中南民族大學(xué),武漢 430074