• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向檢索服務(wù)的詞干提取與相關(guān)排序優(yōu)化研究

    2022-11-05 10:05:38張敬偉胡曉麗單美靜
    關(guān)鍵詞:詞綴排序單詞

    朱 艷, 張敬偉, 楊 青, 胡曉麗, 單美靜

    (1.桂林電子科技大學(xué) 廣西可信軟件重點實驗室,廣西 桂林 541004;2.桂林電子科技大學(xué) 廣西自動檢測技術(shù)與儀器重點實驗室,廣西 桂林 541004;3.華東政法大學(xué) 刑事法學(xué)院,上海 201620)

    云計算、大數(shù)據(jù)等新技術(shù)的興起,以及電子商務(wù)、網(wǎng)絡(luò)自媒體、娛樂通訊等互聯(lián)網(wǎng)產(chǎn)業(yè)的蓬勃發(fā)展使得信息量呈現(xiàn)指數(shù)級增長。據(jù)統(tǒng)計[1],全球每年產(chǎn)生的數(shù)據(jù)量高達1~2 EB,其中非紙質(zhì)信息就占了99.7%。盡管大數(shù)據(jù)技術(shù)、深度學(xué)習(xí)以及神經(jīng)網(wǎng)絡(luò)計算能力的進步加速了信息處理能力的提升,但對信息過載問題的緩解仍舊微乎其微。在關(guān)注度有限的情況下,如何短時間內(nèi)從指數(shù)級增長的數(shù)據(jù)中獲取有效信息成為了亟待解決的問題,而搜索引擎則是人們提取信息的有效方式之一。

    隨著互聯(lián)網(wǎng)行業(yè)的快速發(fā)展,搜索用戶的信息需求日益復(fù)雜,同時檢索詞也逐漸變得多樣化,一個詞常有多種不同形態(tài),這些都對語料庫學(xué)習(xí)的準(zhǔn)確度產(chǎn)生一定影響。研究表明[2],若檢索詞未進行詞形規(guī)范化,可能會造成重要的檢索結(jié)果缺失或存在過多無關(guān)的文檔出現(xiàn)在檢索結(jié)果列表的情況,而若檢索詞為主題詞表中的詞語,則能有效提高檢索結(jié)果的準(zhǔn)確率與查全率。因此,在信息檢索與文本挖掘研究中,需要對單詞進行歸一化處理,以提高文本處理的效率,其中詞干提取是詞形歸一化的核心技術(shù)之一。然而現(xiàn)有的詞干提取算法普遍存在詞干提取不足、詞干提取準(zhǔn)確率不高等問題,無法有效改善龐大的文本詞匯量與關(guān)鍵詞特征缺失的矛盾問題,導(dǎo)致搜索引擎的時空復(fù)雜度偏高而查詢效率偏低。為解決文本查詢處理面臨的“高維-稀疏”問題,通過優(yōu)化詞干分析算法對文本向量空間進行降維處理,以減少詞項的數(shù)量,從而提高文本處理效率。

    此外,為了減少系統(tǒng)在相關(guān)排序過程中的時間及硬件資源消耗,查詢優(yōu)化技術(shù)逐漸受到學(xué)術(shù)界及工業(yè)界的重視。其中,top-k查詢排序是信息檢索領(lǐng)域廣泛應(yīng)用的查詢處理優(yōu)化技術(shù)之一。相關(guān)文檔top-k排序基于查詢-文檔的相似度得分,以及具體的得分聚合函數(shù)從海量文本數(shù)據(jù)中返回k個最大的得分排名結(jié)果?,F(xiàn)有的top-k排序研究大多是確定了整體的top-k結(jié)果后,才會停止排序過程。盡管這種方式通過詳盡遍歷所有文檔和詞項能夠保證檢索質(zhì)量,但同時對海量文檔的處理也產(chǎn)生了不可忽視的查詢延遲。研究表明[3-4],響應(yīng)時間過長直接影響用戶體驗,造成潛在利益的巨大損失。目前對于查詢延遲的處理,大多通過將文檔集合劃分到若干服務(wù)器來管理,但這種方式仍存在尾延遲[5-11]的問題。對于大規(guī)模分布式系統(tǒng)來說,尾延遲現(xiàn)象更加普遍,甚至?xí)?yán)重影響服務(wù)的整體性能。而隨時排序算法能夠在給定時間預(yù)算內(nèi)或給定倒排段處理數(shù)量下,隨時停止檢索過程,從而控制查詢延遲。因此,當(dāng)存在一定查詢負載時,利用隨時排序算法能夠大大降低整個系統(tǒng)的資源損耗及維護成本,解決普遍存在的高百分比尾延遲問題[12],以適應(yīng)服務(wù)水平協(xié)議對響應(yīng)時間的要求。

    基于對上述問題的思考,在文本預(yù)處理與相關(guān)排序2個方面進行了深入研究:

    首先,在文本預(yù)處理階段,設(shè)計了詞形規(guī)范化算法(advanced porter stemmer,簡稱APS),解決了現(xiàn)有算法存在的詞干提取不足、詞干提取準(zhǔn)確率高等問題。該算法基于屈折派生形態(tài)學(xué)調(diào)整了規(guī)則函數(shù)的定義,優(yōu)化了特征詞提取,并且補充了不規(guī)則動詞以及若干后綴的處理,同時添加了對停用詞過濾的支持。針對APS算法的評價,在3個真實的數(shù)據(jù)集上開展實驗,驗證了APS優(yōu)化算法對于解決詞干不足問題的有效性以及提高詞干提取準(zhǔn)確率的真實性。

    其次,在相關(guān)排序階段,設(shè)計了基于一次一得分(score-at-a-time,簡稱SAAT)查詢處理策略的隨時排序算法(SAAT-anytime ranking,簡稱SAR)。該算法能夠在處理完指定數(shù)量的倒排段后或給定時間預(yù)算內(nèi)提前終止查詢過程,大大減少了查詢評估延遲時間,在犧牲可接受范圍內(nèi)檢索質(zhì)量的情況下,能夠返回較為準(zhǔn)確的檢索結(jié)果,解決了現(xiàn)有方法普遍存在的尾延遲問題。在2個真實的大型TREC標(biāo)準(zhǔn)數(shù)據(jù)集ClueWeb09b和ClueWeb12-B13上進行了實驗,通過檢索質(zhì)量評價指標(biāo)nDCG@10對SAR 算法進行了評估,并記錄了在給定時間預(yù)算下的查詢延遲、減少的倒排段處理數(shù)量,驗證了SAR算法對于控制尾部延遲時間的有效性。

    1 相關(guān)工作

    近年來,搜索引擎的優(yōu)化問題已被廣泛研究。在互聯(lián)網(wǎng)信息量以指數(shù)級增長,信息過載問題愈發(fā)嚴(yán)峻的時代背景下,如何盡快找到滿足用戶需求的文檔內(nèi)容,提高信息檢索的效率日益成為研究者關(guān)注的焦點問題,這也為科學(xué)研究提供了動力。本節(jié)將主要圍繞詞干提取與相關(guān)查詢2個方面對以往工作進行總結(jié)概括。

    1.1 詞干提取

    根據(jù)詞干提取方法的實現(xiàn)原理,可以將其歸為4類:基于規(guī)則的詞綴刪除方法[13-17]、基于詞典查找的方法[18]、基于單詞分布規(guī)律的統(tǒng)計方法[19-21]以及混合方法[22-24]?;谠~典查找的方法在權(quán)威詞典的支持下,結(jié)果更加準(zhǔn)確,能夠處理部分不規(guī)則變換詞,但遍歷詞典查找費時且對詞典具有依賴性?;诮y(tǒng)計的方法主要是針對詞典中未收錄的詞以及不規(guī)則變化詞,通過統(tǒng)計單詞規(guī)律對單詞進行規(guī)范化,因此不受語種限制,但識別出的詞干誤差較大,且準(zhǔn)確率不穩(wěn)定。二者更適用于對小語種單詞的詞干提取。而混合型方法雖然融合了多種方法的優(yōu)勢,詞干提取的準(zhǔn)確率更高,但算法流程復(fù)雜,需要考慮的因素過多,且需要多種背景知識的支持,因此限制較大,效率較低。而基于規(guī)則的詞綴刪除方法能夠快速處理常規(guī)詞的變換,適用范圍更廣。因此,主要針對基于規(guī)則的詞綴刪除方法進行改進優(yōu)化。

    基于規(guī)則的詞綴刪除方法利用單詞屈折派生形態(tài)中具備的內(nèi)在規(guī)律,對單詞中的詞綴進行處理。1968年,Lovins[13]提出了有效的同名詞干提取Lovins算法,該算法基于最長匹配原則對照詞綴列表去除單詞后綴后,匹配規(guī)則列表中的轉(zhuǎn)換規(guī)則,重新對單詞進行編碼,將詞干轉(zhuǎn)換為有效單詞,最終提取出詞干。其優(yōu)點是規(guī)則簡單,且能夠處理某些疊詞結(jié)尾的單詞以及不規(guī)則單詞復(fù)數(shù);但缺點是非常耗時,且詞干提取的準(zhǔn)確率不高。針對Lovins算法的規(guī)則和匹配方法存在的不足,Dawson[14]提出了同名方法Dawson算法。該算法基于部分匹配的思想,在限制條件下匹配相同詞干,擴展了Lovins算法,并解決了拼寫異常問題。Dawson算法是單程非迭代算法,因此執(zhí)行速度快,但該算法的缺點是復(fù)雜,且缺乏標(biāo)準(zhǔn)的可重用實現(xiàn)。Lancaster(Paice/Husk)[15]算法是一種迭代算法,通過判斷是否需要再次提取詞干循環(huán)執(zhí)行匹配流程。該算法通過將單詞最后一個字符作為索引尋找適用規(guī)則,每條規(guī)則決定是否對后綴進行刪除或替換,若規(guī)則不匹配或滿足詞干提取結(jié)束條件,則終止流程,輸出詞干。Lancaster算法的優(yōu)點是,每次迭代都會應(yīng)用規(guī)則進行刪除和替換,降低了詞干提取不足的概率;但缺點是算法繁雜,可能會出現(xiàn)詞干過度提取的情況。Porter Stemmer(波特詞干)[16-17]算法自提出以來便廣受歡迎,現(xiàn)已廣泛應(yīng)用于信息檢索領(lǐng)域以及多種檢索系統(tǒng)中,如Lucene、Solr等。波特詞干算法對許多基本算法進行了改進和優(yōu)化,主要用于對英文單詞中通用形態(tài)以及屈折詞綴進行剔除。盡管該算法在多種算法基礎(chǔ)上做出了改進,但缺乏對不規(guī)則動詞、不規(guī)則名詞復(fù)數(shù)以及多種詞綴的考慮,因此仍存在詞干提取不足以及詞干提取準(zhǔn)確率不高等問題,需進一步優(yōu)化。

    1.2 相關(guān)排序

    將文檔數(shù)據(jù)與查詢信息進行預(yù)處理后,需要對文檔和查詢的相關(guān)度進行計算,進而根據(jù)得分高低對相關(guān)文檔進行排序,最后返回給用戶得分top-k的文檔結(jié)果,這個排序的過程稱為相關(guān)排序。目前搜索引擎的排序策略往往建立在所有文檔的相關(guān)度得分上,然而窮盡處理所有候選結(jié)果所花費的時間和資源開銷過大。在當(dāng)下互聯(lián)網(wǎng)的數(shù)據(jù)規(guī)模以指數(shù)級增長的背景下,為了提升查詢性能,相關(guān)優(yōu)化技術(shù)不斷推陳出新。目前主流的查詢效率優(yōu)化技術(shù)包括剪枝算法、選擇搜索以及隨時排序算法等。

    動態(tài)剪枝算法以處理盡可能少的相關(guān)文檔為目標(biāo),采用跳躍式訪問倒排列表的方式來減少對無關(guān)或相關(guān)度較低的文檔的處理,避免對所有文檔的遍歷和訪問,從而提高查詢效率。動態(tài)剪枝算法能夠保證top-k個文檔列表的計算是安全的,也就是說使用動態(tài)剪枝算法與窮盡查詢方法得到的查詢結(jié)果相同。常用的動態(tài)剪枝算法有MaxScore[25]、WAND[26]、BMW[27-28]以及VBMW[29]等。但有研究表明[30],剪枝算法執(zhí)行尾部查詢所花費的時間比平均查詢延遲時間要多若干數(shù)量級。

    選擇搜索在搜索構(gòu)建時,將文檔集合按照主題劃分,理想情況下每個分片都包含一組主題相關(guān)的文檔[31-32]。傳入的每個用戶查詢都由代理流程預(yù)測被劃分的集合分片,然后由劃分的分片處理查詢,最后將分片結(jié)果匯總。每個分片的處理過程都能應(yīng)用動態(tài)剪枝算法。該方法的優(yōu)點是,能夠有效減少工作負載,查詢效率高; 但缺點是,由于只有部分分片對查詢進行處理,算法得到的結(jié)果可能會與窮盡查詢算法得到的結(jié)果有所偏差。

    隨時排序算法實現(xiàn)基于影響力排序的索引(impact-ordered index)。相對于一次一文檔(term-at-atime)查詢處理策略,SAAT 查詢策略能夠根據(jù)影響力得分來處理文檔的優(yōu)先級[32-33],可在避免遍歷所有文檔的情況下,輸出較為準(zhǔn)確的排序結(jié)果,更有利于提前終止文檔相關(guān)度計算流程,這與隨時排序的目標(biāo)相同,因此隨時排序算法大都基于SAAT 策略。當(dāng)響應(yīng)時間預(yù)先由服務(wù)水平協(xié)議確定時,查詢處理過程必須支持可中斷,隨時排序算法針對此類情況給出了解決方案。隨時排序算法在給定時間預(yù)算內(nèi)返回盡可能準(zhǔn)確的結(jié)果,且檢索結(jié)果質(zhì)量隨著預(yù)算時間的延長而成正比提升[34-35]?;谝陨侠碚?在相關(guān)排序階段通過設(shè)計基于SAAT策略的隨時排序算法來控制查詢延遲時間。

    2 基于改進Porter Stemmer的APS算法

    針對Porter Stemmer存在的詞干提取不足以及詞干提取準(zhǔn)確率不高等問題,對波特詞干算法進行改進,設(shè)計了APS算法。該算法重新編碼了規(guī)則函數(shù),優(yōu)化了特征詞提取,并補充了不規(guī)則動詞以及若干后綴的處理,同時添加了對停用詞過濾的支持。

    為使算法描述更清晰,首先對以下定義進行說明:

    定義1 元音(Vowel)。a,e,i,o,u五個字母。

    定義2 輔音(Consonant)。除元音外的其他字母。

    定義3 給定單詞T,以詞綴S1結(jié)尾,若詞干滿足指定條件condition,則由新詞綴S2代替S1,即:(condition)S1→S2。 (1)

    定義4 屈折形態(tài)(Inflexion)。單詞或詞根受語法影響,加上屈折詞綴后的形態(tài),包括單詞復(fù)數(shù)形式如“apples”等、不同時態(tài)形式如“l(fā)ooked”等、以及分詞形式如“walking”等。

    定義5 派生形態(tài)(Morphological Derivation)。單詞或詞根在句法范疇基礎(chǔ)上,添加實質(zhì)性的詞綴后所派生的形態(tài),如illegal,irregular等。

    定義6 疊字(Double)。由單個字母重疊而成的詞綴,如tt、mm、nn等。

    定義7 復(fù)合詞綴(Double Suffix)。由多個詞綴整合而成的形態(tài),如由general附加ize后綴和ation后綴整合得到generalization,其中g(shù)eneralization的詞綴為復(fù)合詞綴。

    APS算法基于英文單詞形態(tài)特征及屈折派生形態(tài)學(xué),針對波特詞干算法存在的不足,做以下優(yōu)化:

    1)對不規(guī)則動詞變位與復(fù)數(shù)的特例進行補充。波特詞干算法忽略了2種不規(guī)則詞形式的處理:①不符合任何特征規(guī)則的動詞,例如單詞“buy”及其過去式“bought”。對于此類情況,通過枚舉不規(guī)則動詞形式進行改善;②符合一般規(guī)則特征的單詞,例如以-foot結(jié)尾的單詞復(fù)數(shù)形式以-feet結(jié)尾。對于此類情況,通過添加對規(guī)則的補充可以得到改善。表1為波特詞干算法與APS算法處理前后的對照示例1。

    表1 波特詞干算法與APS算法處理對照示例1

    2)對以-s結(jié)尾的動詞及其分詞形式的處理進行優(yōu)化。波特詞干算法對于以-s結(jié)尾的動詞分詞形式的處理方式是直接去除末尾的-ed或-ing,保留末尾的-s。在該規(guī)則下,對于“focus”與其復(fù)數(shù)“focuses”,存在將“focuses”轉(zhuǎn)化為詞干“focus”,而將“focus”轉(zhuǎn)化為“focu”的錯例。針對此類情況,通過優(yōu)化規(guī)則可以改善:若以-s結(jié)尾,但不以ss結(jié)尾的單詞,一律轉(zhuǎn)化為s。表2為波特詞干算法與APS算法處理前后的對照示例2。

    表2 波特詞干算法與APS算法處理對照示例2

    3)對以-y結(jié)尾單詞的詞干合并方式進行優(yōu)化。波特詞干算法對于以-y結(jié)尾的單詞的處理方式是:若包含元音,則將-y轉(zhuǎn)變?yōu)?i;另外,針對以-ies結(jié)尾的單詞處理方式是:將ies轉(zhuǎn)變?yōu)閕。這種規(guī)則能正確處理包含元音的單詞,例如carry→carries,marry→marries等。但對于不包含元音的詞干則不適用,例如cry-cries-cried,則會被轉(zhuǎn)化為cry-cri-cri-cry。

    同理,以-ye結(jié)尾的單詞也不適用,因為末尾的e最終會去除。針對此類情況,通過優(yōu)化規(guī)則:首先將分詞后綴-es/-ed/-ing去除,然后刪除規(guī)則“若包含元音,則將末尾的y轉(zhuǎn)變?yōu)閕”,即保持末尾的-y不變。表3為波特詞干算法與APS算法處理前后的對照示例3。

    表3 波特詞干算法與APS算法處理對照示例3

    4)對以雙輔音結(jié)尾的單詞及其衍生詞的處理進行優(yōu)化。波特詞干算法對于以非‘l’、‘s’或‘z’雙輔音結(jié)尾單詞的分詞形式處理方式是:去除一個輔音,保留一個輔音。在這種規(guī)則下,會出現(xiàn)錯將單詞“ebbed”轉(zhuǎn)換為“eb”,而“ebb”轉(zhuǎn)換為“eb”的錯誤案例。另外,若存在以-z結(jié)尾的單詞,但其分詞加了疊詞詞綴即-zz,例如單詞“whiz”的過去分詞“whizz”,“whiz”本身會轉(zhuǎn)化為“whiz”,而過去分詞“whizz”則轉(zhuǎn)化為“whiz”,誤判情況出現(xiàn)。針對以上情況,可優(yōu)化規(guī)則:刪除所有以除-l雙輔音結(jié)尾單詞的輔音字母,對于以雙輔音-ll結(jié)尾的單詞,若m>1,則刪除一個輔音。表4為波特詞干算法與APS算法處理前后的對照示例4。

    表4 波特詞干算法與APS算法處理對照示例4

    5)對部分現(xiàn)在分詞以及過去分詞衍生詞的處理進行優(yōu)化;波特詞干算法忽略了對現(xiàn)在分詞、過去分詞衍生詞的處理,例如“study”轉(zhuǎn)化為 “studi”,而“studiedly”卻轉(zhuǎn)化為“studiedli”。對于該類情況的處理,APS補充了對該類詞的轉(zhuǎn)化規(guī)則。表5為波特詞干算法與APS算法處理對照示例5。

    表5 波特詞干算法與APS算法處理對照示例5

    6)補充了若干后綴的處理。針對波特詞干算法忽略-tor、-sory、-ship等若干詞綴,APS算法進行了補充。另外對于單詞的復(fù)合后綴的漏判問題,通過由后綴枚舉所有可能的復(fù)合后綴進行優(yōu)化。例如,由詞綴-ate衍生出的-ative、-atic等詞綴都將被對應(yīng)到詞綴-ate。表6為部分詞綴轉(zhuǎn)換示例。

    表6 APS算法詞綴轉(zhuǎn)換示例

    APS 算法進行詞干提取的整體流程如圖1所示。由圖1可知,APS算法對詞干的提取主要包括5個步驟:第一步,處理單詞的屈折形態(tài),包括單詞的復(fù)數(shù)、現(xiàn)在分詞、過去分詞等,例如將“apples”轉(zhuǎn)換為“apple”,將“l(fā)ooked”轉(zhuǎn)換為“l(fā)ook”;第二步,根據(jù)前文描述的優(yōu)化工作對y→i的規(guī)則進行重編碼,例如將“try”轉(zhuǎn)換為“tri”;第三步,對整合多個詞綴的復(fù)合詞綴進行處理,將這類詞綴轉(zhuǎn)化為非復(fù)合后綴,例如將“generalization”轉(zhuǎn)換為“generalize”。本算法對復(fù)合詞綴到非復(fù)合后綴的映射規(guī)則進行了重編碼;第四步,刪除簡單的非復(fù)合后綴,通過定義的編碼規(guī)則對現(xiàn)存詞干進行歸一化,例如將上一步得到的“generalize”轉(zhuǎn)換為“general”。這兩步主要對單詞的派生形態(tài)進行處理。第五步,處理不滿足以上編碼規(guī)則的不規(guī)則詞,通過與補充的規(guī)則轉(zhuǎn)化表單詞進行遍歷匹配來完成對不規(guī)則詞的詞干提取;最后,在處理完不規(guī)則詞的基礎(chǔ)上,根據(jù)重編碼后的新規(guī)則去除單詞末尾的-e或-l,最終得到詞干。

    圖1 APS算法流程

    3 基于SAAT策略的隨時排序算法SAR

    搜索引擎在海量數(shù)據(jù)中檢索到滿足用戶查詢要求的文檔是一項非常耗時的任務(wù)。研究表明[36],在谷歌搜索中人為對查詢時間延長100~400 ms,用戶每天的搜索次數(shù)減少0.2%~0.6%?,F(xiàn)有的處理查詢延遲的方法往往是將文檔劃分到多個服務(wù)器,每個服務(wù)器分擔(dān)部分時間延遲,但查詢的延遲時間仍不可忽視?;趯μ嵘脩趔w驗的考慮,分析發(fā)現(xiàn),通過犧牲可接受范圍的搜索質(zhì)量能夠在任意給定時間限制的情況下,向用戶查詢返回較為準(zhǔn)確的文檔排名,并且隨著計算時間的延長,結(jié)果質(zhì)量成正比增長。在此基礎(chǔ)上,基于SAAT 查詢處理策略設(shè)計了隨時排序算法SAR。該算法能夠在處理完指定數(shù)量的倒排項后或給定時間內(nèi)提前終止查詢過程,大大減少查詢評估延遲時間。

    在SAR算法實現(xiàn)的基于影響力排序索引中,文檔標(biāo)識符按照每個詞對于文檔的實際貢獻得分分段,每段以文檔標(biāo)識符升序排列,而段按照影響力分?jǐn)?shù)降序進行排列,最終將影響力分?jǐn)?shù)的top-k結(jié)果返回。

    3.1 影響力分?jǐn)?shù)與詞項權(quán)重量化

    其中:ω(d,t)為詞項t對于文檔d的權(quán)重,在索引建立過程中被量化到b字節(jié)中,在SAR算法中設(shè)置為8;ω(q,t)為詞項t對于查詢詞q的權(quán)重。

    對于詞項的量化標(biāo)準(zhǔn),SAR 算法采用了由Anh等[37]提出的量化方法:

    3.2 索引的組織方式

    索引的組織方式如下,單詞字典中的每個查詢詞項指向倒排列表,倒排列表中的倒排項由類似{score,start,end,num}的四元組組成,稱之為段(segment)。其中段的第一項score代表影響力分?jǐn)?shù),第二項start代表指向段數(shù)據(jù)首部的指針,第三項end代表指向段數(shù)據(jù)尾部的指針,包含在段數(shù)據(jù)中的文檔數(shù)量則由變量num 存儲。每個詞項的段都按照以段中存儲的score值降序、文檔標(biāo)識符升序排列。

    3.3 SAAT評估策略

    基于以上影響力分?jǐn)?shù)計算以及索引組織方式,應(yīng)用查詢評估策略SAAT。在SAAT查詢處理機制的剪枝方法中,定義了4種查詢處理模式:

    定義9 OR模式。在該模式下,所有文檔都將分配分?jǐn)?shù)累加器,且都會進行得分統(tǒng)計。

    定義10 AND模式。若轉(zhuǎn)換為該模式,則出現(xiàn)的新文檔不再被分配分?jǐn)?shù)累加器,只針對已被分配累加器的文檔進行分?jǐn)?shù)累計操作。

    定義11 REFINE 模式。該模式應(yīng)用的前提是,top-k的文檔已經(jīng)確定,但最終順序還未確定。此時,得分累加只針對top-k的文檔。

    定義12 IGNORE模式。在該模式下,停止對所有文檔的得分進行遞加,查詢處理過程終止。

    首先獲取與查詢詞項相關(guān)的倒排列表段,然后根據(jù)段中存儲的score值進行降序排列,并按照此順序?qū)Χ芜M行處理。對于段中的每個文檔標(biāo)識符,其影響力分?jǐn)?shù)值由文檔對應(yīng)的累加器存儲,而在處理過程中累加器中的值通過維護一個堆來實時獲取top-k的結(jié)果。每當(dāng)將當(dāng)前影響力分?jǐn)?shù)值添加到累加器時,通過與堆頂值進行判斷可決定是否將指向累加器的指針添加到堆中。

    由于實時地維護了影響力值最大的top-k個文檔結(jié)果,因此能夠在任意給定時間或給定處理倒排列表項的數(shù)量終止算法,返回給用戶檢索結(jié)果。另外,段會按照優(yōu)先度依次遞減的順序處理,優(yōu)先度由詞項的分?jǐn)?shù)貢獻值決定,因此排名情況會隨著查詢進展逐步細化。若查詢時間預(yù)算增加,則輸出結(jié)果的質(zhì)量也成正比提升。

    3.4 提前終止閾值參數(shù)η

    在處理段的過程中,SAR 算法維護已處理文檔影響力得分的累加值。在下一個段處理之前,首先與η進行比較,若大于η值,則跳出循環(huán),然后從堆中獲取top-k的結(jié)果;若小于η值,則流程繼續(xù)。

    基于以上原理介紹,SAR 算法的核心代碼如算法1所示。

    SAR算法核心代碼如算法1所示。步驟1使用OR模式對各個查詢詞項對應(yīng)倒排表中分?jǐn)?shù)高的段進行處理;步驟2~11,計算每個詞項t對應(yīng)倒排表中未處理塊的最大分?jǐn)?shù),即npbt。當(dāng)文檔得分大于npbt時,將OR 模式改用AND 模式;步驟12~13,若文檔得分大于所有文檔的最大得分,即滿足條件Score≥max{MAXd|d∈AC,D?R}時,將模式改用REFINE模型進行處理。其中,AC為現(xiàn)有累加器集合,保存文檔號及文檔的部分得分,Md為文檔d的最大得分,由AC保存的分?jǐn)?shù)累加得到,即MAXd=ACd+∑{npbd|t∈q,t?Td};步驟14~15,若滿足現(xiàn)有累加器集合中的累加分?jǐn)?shù)大于文檔d的最大分?jǐn)?shù),則此時查詢可以提前終止,采用IGNORE模式。最終得到累加器中得分最高的top-k個文檔。

    4 實驗評估

    對APS算法和SAR算法分別進行評估。

    針對APS算法,使用誤差計數(shù)法對APS算法以及優(yōu)化前的波特詞干算法進行評估,利用該方法通過計算詞干提取不足指數(shù)(understemming index,簡稱UI)、詞干提取過度指數(shù)(overstemming index, 簡稱OI)以及相對截斷錯誤率(error rate relative to truncation,簡稱ERRT)3個指標(biāo)對APS算法的詞干提取準(zhǔn)確率進行評價,最后在2個數(shù)據(jù)樣本上進行實驗驗證,并與現(xiàn)有詞干算法進行對比。

    針對SAR算法,在2個真實的大型TREC標(biāo)準(zhǔn)數(shù)據(jù)集上進行實驗驗證,通過檢索質(zhì)量評價指標(biāo)nDCG@10對SAR 算法進行評估,并說明了在給定時間預(yù)算下的查詢延遲、減少的倒排段處理數(shù)量等。

    4.1 實驗環(huán)境及數(shù)據(jù)集

    實驗的硬件環(huán)境為Intel?Xeon?CPU E3-1226 v3@3.30 GHz和256 GiB 內(nèi)存;軟件環(huán)境為Red Hat Enterprise Linux 6。

    針對APS算法的評估,實驗在2個真實數(shù)據(jù)集上開展,數(shù)據(jù)集基本信息如下:

    1)Word List A:來自于Paice官方網(wǎng)站,最初用于Paice評估,包含約10 000個詞。詞匯樣本取自于圖書情報學(xué)相關(guān)的CISI測試集。

    2)Word List B:由Scrabble單詞檢查器中使用的單詞列表編譯而成,該樣本包含約20 000個單詞。

    針對SAR算法的評估,實驗在2個標(biāo)準(zhǔn)TREC測試集ClueWeb09、數(shù)據(jù)集ClueWeb12-B13 進行。通過檢索質(zhì)量評價指標(biāo)nDCG@10對SAR 算法進行評估。數(shù)據(jù)集的文檔數(shù)量和實驗所用到的TREC主題如表7所示。

    表7 TREC數(shù)據(jù)集及主題

    另外,本實驗對數(shù)據(jù)集中的每個文檔進行了如下處理:將所有無效UTF-8字符轉(zhuǎn)換成了空格,同時對字母字符與數(shù)字字符進行分離,并剔除了標(biāo)記標(biāo)簽。

    4.2 APS算法評價

    在2個數(shù)據(jù)集樣本上對APS算法進行實驗。首先,為了形成對照,將改進后的APS算法與改進前的Porter Stemmer算法進行評估對比;之后,在數(shù)據(jù)集上對現(xiàn)有的詞干分析算法Paice/Husk及Lovins也進行了對比測試,作為數(shù)據(jù)參考。通過實驗驗證得知,與現(xiàn)有詞干分析算法相比,APS算法提高了對查詢詞詞干提取的準(zhǔn)確率,實驗結(jié)果如圖2所示。

    以Word List A數(shù)據(jù)樣本為觀察對象,圖2(b)、(c)中,APS算法與改進前的波特詞干算法相比,詞干不足指數(shù)UI降低了約48.4%,相對截斷錯誤率ERRT降低了約28%。UI值的改善說明APS算法能對更多相關(guān)詞合并成同一詞干,例如對于單詞“ability”和“able”的處理,改進前的波特詞干算法并不會將其歸為同一詞干群。圖2(a)中OI值之所以相對改進前有所提升,是因為APS算法調(diào)整規(guī)則函數(shù)后刪除了許多重要詞綴,這對OI值造成了影響。實際上UI值的改善會在一定程度上影響OI值,導(dǎo)致詞干提取過度,但影響的單詞數(shù)較少。因此,根據(jù)ERRT值對總體相對準(zhǔn)確性的評估來看,APS算法對于詞干提取的效果要優(yōu)于波特詞干算法。

    以Word List B數(shù)據(jù)樣本作為觀察對象。由圖2(e)、(f)可知,APS算法較改進前,詞干不足指數(shù)UI降低了約54.6%,相對階段錯誤率ERRT降低了約30.2%。可以發(fā)現(xiàn),在Word List B 數(shù)據(jù)樣本中,APS算法對于詞干提取的準(zhǔn)確率具有較大的提升,能夠?qū)⒏嗟南嚓P(guān)詞統(tǒng)一成同一詞干。

    圖2 APS算法詞干提取準(zhǔn)確率評價

    除此之外,通過和Lovins、Paice/Husk算法對比可知,APS算法表現(xiàn)更佳,其中相對截斷錯誤率的數(shù)據(jù)表明,APS算法相對于其他的詞干提取算法,有效提升了詞干提取準(zhǔn)確率。

    4.3 SAR算法評價

    對于2個評價數(shù)據(jù)集,將前十個主題用于訓(xùn)練線性模型,其余主題用于測試。評價效率的指標(biāo)只包括引擎框架生成top-k結(jié)果花費的時間,即查詢延遲時間,不包括將單詞字典、倒排列表加載到主存儲器的啟動成本以及寫入輸出文件的時間。查詢延遲時間通過chrono庫進行測量,檢索質(zhì)量選用nDCG@10作為度量指標(biāo)。

    通過將倒排項數(shù)量η分別設(shè)置為104、105、106、107以及108觀察nDCG@10的變化,從而確定倒排項數(shù)量η的最佳取值。圖3為在給定處理倒排項數(shù)量η變化時,nDCG@10指標(biāo)的變化情況。由圖3可知,在不顯著影響檢索質(zhì)量的情況下,SAR算法有效減少了需要處理的倒排段數(shù)量。通過分析折線趨勢可以發(fā)現(xiàn),將η設(shè)置為數(shù)據(jù)集大小的10%最為合理,因為在η=107與η=108時,指標(biāo)nDCG@10數(shù)據(jù)表現(xiàn)效果不相上下。由上一步分析得到η最佳取值范圍后,在此基礎(chǔ)上用2個測試集合ClueWeb09b和ClueWeb12-B13的前10個主題訓(xùn)練模型,記錄在給定時間預(yù)算的情況下,查詢的延遲時間和處理的倒排段數(shù)量。由此模型來預(yù)測在給定時間預(yù)算下η的最佳取值。數(shù)據(jù)集ClueWeb09b和數(shù)據(jù)集ClueWeb12-B13符合線性回歸的特點,其線性模型包括恒定的開銷和每個倒排段的處理成本。通過最終的線性模型,確定η適當(dāng)?shù)娜≈岛?將時間預(yù)算分別設(shè)置為25、50、100、150、200 ms。在此條件下進行3次測試取平均值,最終SAR算法在2個數(shù)據(jù)集上的檢索質(zhì)量如圖4和圖5所示。

    圖3 給定倒排項數(shù)量η時的nDCG@10指數(shù)

    圖4 ClueWeb12-B13上的nDCG@10指數(shù)

    圖5 ClueWeb1209b上的nDCG@10指數(shù)

    圖4和圖5中max取值由雙側(cè)配對隨機化測驗得到,并作為標(biāo)準(zhǔn)值來體現(xiàn)相對有效性差異。由圖4和圖5可看出,在給定時間預(yù)算下,SAR算法檢索質(zhì)量有一定程度的下降,但在可接受范圍內(nèi);由圖中折線的總體趨勢可以發(fā)現(xiàn),隨著給定預(yù)算時間的延遲,檢索質(zhì)量也相應(yīng)提升。另外,由2個圖的數(shù)據(jù)對比可知,在數(shù)據(jù)集ClueWeb12-B13上處理所有倒排項所花費的時間要比數(shù)據(jù)集ClueWeb09b要長,這說明在相同的時間預(yù)算下,數(shù)據(jù)集越大,有效性折損也越大,因此,ClueWeb12-B13的nDCG@10指標(biāo)折損更多。

    圖6和圖7為在2個數(shù)據(jù)集上的平均延遲時間,圖8和圖9為在2個數(shù)據(jù)集上的提前終止倒排段的數(shù)量與倒排段總數(shù)量。由圖6~9可知,SAR算法通過在給定查詢時間內(nèi)提前終止查詢過程,大大減少了倒排項的處理數(shù)量,從而有效減少了查詢延遲時間。

    圖6 ClueWeb12-B13上的平均查詢延遲時間

    圖7 ClueWeb09b上的平均查詢延遲時間

    圖8 ClueWeb12-B13上的提前終止數(shù)量與總數(shù)量

    圖9 ClueWeb09b上的提前終止數(shù)量與總數(shù)量

    表8和表9為2個數(shù)據(jù)集上未處理的主題數(shù)與給定查詢時間下的超時時間。

    表8 ClueWeb09b數(shù)據(jù)集上未處理主題數(shù)與超時時間

    表9 ClueWeb12-B13數(shù)據(jù)集上未處理主題數(shù)與超時時間

    由上述實驗結(jié)果分析可知,SAR 算法在特殊情況下存在略微的延遲,總體來看影響并不大,但在控制查詢延遲時間方面效果顯著。另外,隨著預(yù)算時間的增加,檢索質(zhì)量也相應(yīng)成正比提升,雖然存在一定程度的檢索質(zhì)量下降,但在可接受的范圍內(nèi)。實驗結(jié)果也驗證了SAR算法對控制尾部延遲的有效性,能夠減少計算資源的消耗,且對于用戶體驗的提升也有一定幫助。

    5 未來展望

    基于APS算法對文本預(yù)處理進行了優(yōu)化,并基于SAAT策略設(shè)計了隨時排序算法SAR,在數(shù)據(jù)集上的實驗結(jié)果達到了預(yù)期的效果,但考慮到時代環(huán)境的需求變化以及對各種場景的適用情況,該檢索系統(tǒng)的擴展未來還有一定的優(yōu)化空間,需要相關(guān)的研究和工作支持。為此,從幾個方面提出了需要進一步研究與探討的工作點:

    首先,針對倒排索引,可以考慮利用數(shù)據(jù)壓縮算法對其進行壓縮,以減少索引占用的磁盤空間,進而降低磁盤讀寫數(shù)據(jù)的時間開銷。在之后的工作中可以在該檢索系統(tǒng)中添加一個簡單有效的解編碼器,例如基于單指令多數(shù)據(jù)流(single instruction multiple data,簡稱SIMD)的解編碼器[38-39],將壓縮和解壓的過程并行化,以實現(xiàn)存儲空間的減少和訪問速度的提升。

    其次,由于文檔長度存在不確定性,詞頻存在隨機性,為提高對文檔中稀有詞項的建模能力,實現(xiàn)帶有Dirichlet平滑(dirichlet smoothing,簡稱DiS)方法或JM 平滑方法(jelinek-mercer smoothing,簡稱JMS)的語言模型[40]也是可行的優(yōu)化點之一。對文檔和查詢項進行語言建模后,不僅能夠提高估計文檔語言模型的準(zhǔn)確性,而且也能適應(yīng)查詢中非常用詞的生成。

    最后,可以針對用戶接口設(shè)計更利于用戶體驗的界面。目前本文檢索系統(tǒng)的接口尚且基于文本,后期可以通過HTML界面來實現(xiàn)用戶交互接口。用戶在界面展示的文本框中輸入查詢詞后,搜索的結(jié)果能夠通過該界面進行展示以供閱讀、分析和判斷。對交互接口進行優(yōu)化能夠豐富表現(xiàn)信息的形式,便于用戶多方式高效接收信息,從而進一步提升用戶體驗。

    6 結(jié)束語

    針對文本預(yù)處理階段,設(shè)計了優(yōu)化的詞干分析算法APS,基于派生形態(tài)學(xué)調(diào)整了規(guī)則函數(shù)的定義,改善了波特詞干算法存在的詞干提取不足以及準(zhǔn)確率不理想的問題,并通過實驗驗證了APS算法在提升詞干提取準(zhǔn)確率的有效性。另外,針對相關(guān)排序階段,基于SAAT查詢策略設(shè)計了隨時排序算法SAR,能夠在給定時間預(yù)算或給定處理的倒排段數(shù)量的情況下,提前終止檢索過程,減少不必要的時間消耗,有效控制查詢延遲,返回較為準(zhǔn)確的檢索結(jié)果。在2個大規(guī)模TREC數(shù)據(jù)集上的實驗結(jié)果驗證了SAR 算法對于控制尾部延遲時間的有效性。最后,本文提出了若干可行的研究點,為未來的工作指明了方向。

    猜你喜歡
    詞綴排序單詞
    排序不等式
    從網(wǎng)絡(luò)語“X精”看“精”的類詞綴化
    恐怖排序
    單詞連一連
    節(jié)日排序
    看圖填單詞
    刻舟求劍
    兒童繪本(2018年5期)2018-04-12 16:45:32
    釋西夏語詞綴wji2
    西夏研究(2017年1期)2017-07-10 08:16:55
    看完這些單詞的翻譯,整個人都不好了
    試析否定詞綴在漢維語中的不同表現(xiàn)
    語言與翻譯(2014年3期)2014-07-12 10:31:56
    妹子高潮喷水视频| 免费日韩欧美在线观看| 咕卡用的链子| 69精品国产乱码久久久| 午夜福利免费观看在线| 亚洲中文字幕日韩| 曰老女人黄片| 国精品久久久久久国模美| av又黄又爽大尺度在线免费看| 日本vs欧美在线观看视频| 久久亚洲真实| 视频区欧美日本亚洲| 欧美av亚洲av综合av国产av| 亚洲中文字幕日韩| 热re99久久国产66热| 国产亚洲午夜精品一区二区久久| 又大又爽又粗| 国产亚洲精品久久久久5区| 人妻 亚洲 视频| 悠悠久久av| 亚洲欧美精品综合一区二区三区| 91精品国产国语对白视频| 久久国产精品人妻蜜桃| 最近最新中文字幕大全电影3 | bbb黄色大片| av有码第一页| 久久亚洲精品不卡| 日本欧美视频一区| 韩国精品一区二区三区| 丰满饥渴人妻一区二区三| 国产精品亚洲一级av第二区| 亚洲欧美一区二区三区久久| 制服人妻中文乱码| 首页视频小说图片口味搜索| 亚洲久久久国产精品| 乱人伦中国视频| 亚洲欧美日韩另类电影网站| 精品卡一卡二卡四卡免费| 欧美中文综合在线视频| 亚洲人成伊人成综合网2020| 久久精品成人免费网站| 成在线人永久免费视频| 亚洲熟妇熟女久久| 欧美在线黄色| 男女无遮挡免费网站观看| 亚洲少妇的诱惑av| 嫩草影视91久久| 纯流量卡能插随身wifi吗| 女同久久另类99精品国产91| 九色亚洲精品在线播放| 在线 av 中文字幕| 无限看片的www在线观看| 窝窝影院91人妻| 正在播放国产对白刺激| av又黄又爽大尺度在线免费看| bbb黄色大片| 久久久国产成人免费| 免费看十八禁软件| 视频区欧美日本亚洲| 午夜福利一区二区在线看| 欧美精品高潮呻吟av久久| 国产野战对白在线观看| 91字幕亚洲| 中文字幕制服av| 亚洲成人免费av在线播放| 激情视频va一区二区三区| 无限看片的www在线观看| 国精品久久久久久国模美| 亚洲情色 制服丝袜| 精品欧美一区二区三区在线| 99久久国产精品久久久| 中文欧美无线码| 人成视频在线观看免费观看| 久久中文字幕一级| 国产三级黄色录像| 欧美午夜高清在线| 99re在线观看精品视频| 国产在线一区二区三区精| 日韩一区二区三区影片| 免费日韩欧美在线观看| 免费在线观看日本一区| av一本久久久久| 亚洲欧洲日产国产| 久久热在线av| 高潮久久久久久久久久久不卡| 欧美大码av| 淫妇啪啪啪对白视频| 精品少妇内射三级| 青青草视频在线视频观看| 一夜夜www| 性高湖久久久久久久久免费观看| 午夜精品国产一区二区电影| 国产视频一区二区在线看| 亚洲欧美精品综合一区二区三区| 麻豆乱淫一区二区| 中文亚洲av片在线观看爽 | 久久午夜综合久久蜜桃| 欧美大码av| 国产精品一区二区免费欧美| 国产精品一区二区在线不卡| 国产亚洲午夜精品一区二区久久| 亚洲欧洲日产国产| 免费久久久久久久精品成人欧美视频| 18禁裸乳无遮挡动漫免费视频| 久久久久视频综合| 日本一区二区免费在线视频| 老司机午夜福利在线观看视频 | e午夜精品久久久久久久| 久久这里只有精品19| 99热网站在线观看| www.熟女人妻精品国产| 在线播放国产精品三级| 成人18禁高潮啪啪吃奶动态图| 丝袜美足系列| 国产精品国产高清国产av | 脱女人内裤的视频| 怎么达到女性高潮| 国产免费视频播放在线视频| 50天的宝宝边吃奶边哭怎么回事| 国产一区二区 视频在线| 欧美国产精品一级二级三级| 亚洲成国产人片在线观看| 日韩大片免费观看网站| 国产极品粉嫩免费观看在线| 欧美日韩一级在线毛片| 成人手机av| 国产精品偷伦视频观看了| 脱女人内裤的视频| 午夜久久久在线观看| 亚洲avbb在线观看| 一本—道久久a久久精品蜜桃钙片| 99热网站在线观看| 亚洲成a人片在线一区二区| 精品国产一区二区久久| 国产精品美女特级片免费视频播放器 | 最新在线观看一区二区三区| 2018国产大陆天天弄谢| 桃花免费在线播放| 日韩中文字幕视频在线看片| 熟女少妇亚洲综合色aaa.| 久久ye,这里只有精品| 丰满迷人的少妇在线观看| 亚洲精品久久午夜乱码| 亚洲 欧美一区二区三区| 不卡av一区二区三区| 国产精品一区二区精品视频观看| 亚洲成人免费电影在线观看| 久久久久久久国产电影| 精品国产亚洲在线| 热re99久久精品国产66热6| 欧美日韩亚洲高清精品| 丝瓜视频免费看黄片| 国产精品影院久久| 搡老岳熟女国产| 久久久欧美国产精品| 天堂动漫精品| 免费观看av网站的网址| 天堂中文最新版在线下载| 国产精品成人在线| 午夜精品久久久久久毛片777| aaaaa片日本免费| 午夜免费鲁丝| 91老司机精品| 丁香六月欧美| 夜夜骑夜夜射夜夜干| 国产精品久久久久久精品电影小说| 丰满饥渴人妻一区二区三| 国产精品影院久久| 美女高潮喷水抽搐中文字幕| 在线看a的网站| 成人手机av| 日韩有码中文字幕| 老司机福利观看| 国产在线精品亚洲第一网站| 国产成人精品久久二区二区免费| 欧美国产精品va在线观看不卡| 在线观看66精品国产| 少妇粗大呻吟视频| 动漫黄色视频在线观看| 国产不卡一卡二| 亚洲,欧美精品.| 免费观看人在逋| 国产色视频综合| 99热网站在线观看| 国产成人影院久久av| 亚洲成国产人片在线观看| 国产成人免费无遮挡视频| 免费日韩欧美在线观看| 多毛熟女@视频| 免费在线观看日本一区| 国产精品久久久久成人av| 天堂俺去俺来也www色官网| 国产成人系列免费观看| 国产精品二区激情视频| 狠狠狠狠99中文字幕| 成年人黄色毛片网站| 国产区一区二久久| 丁香六月欧美| 欧美日韩av久久| 久久久久久人人人人人| videos熟女内射| 一区二区日韩欧美中文字幕| 欧美黄色片欧美黄色片| 在线看a的网站| 热99re8久久精品国产| 91老司机精品| 国产精品一区二区精品视频观看| 欧美 日韩 精品 国产| 在线观看免费视频网站a站| 视频区欧美日本亚洲| 国产有黄有色有爽视频| 十八禁人妻一区二区| 亚洲成国产人片在线观看| 亚洲情色 制服丝袜| 中文字幕精品免费在线观看视频| 亚洲全国av大片| 国产精品二区激情视频| 黑丝袜美女国产一区| 大香蕉久久成人网| 女人精品久久久久毛片| 午夜免费鲁丝| 亚洲va日本ⅴa欧美va伊人久久| 午夜两性在线视频| 日本欧美视频一区| 国产一区二区三区综合在线观看| 亚洲七黄色美女视频| 老司机午夜十八禁免费视频| 国产男女内射视频| 中文字幕高清在线视频| 黄色视频在线播放观看不卡| 日韩欧美国产一区二区入口| 久久中文看片网| 国产99久久九九免费精品| 欧美大码av| 日日摸夜夜添夜夜添小说| 亚洲午夜精品一区,二区,三区| 一区二区三区激情视频| 少妇精品久久久久久久| 天堂动漫精品| 男女边摸边吃奶| 性少妇av在线| 热re99久久国产66热| 亚洲全国av大片| 他把我摸到了高潮在线观看 | 无人区码免费观看不卡 | 极品少妇高潮喷水抽搐| 久久中文看片网| 肉色欧美久久久久久久蜜桃| 男女边摸边吃奶| 视频区图区小说| 淫妇啪啪啪对白视频| 精品卡一卡二卡四卡免费| 亚洲欧美精品综合一区二区三区| 黄色 视频免费看| 国产真人三级小视频在线观看| 男女下面插进去视频免费观看| 美女主播在线视频| 色综合欧美亚洲国产小说| 精品国产乱子伦一区二区三区| 热99国产精品久久久久久7| 伊人久久大香线蕉亚洲五| 欧美在线黄色| 一个人免费在线观看的高清视频| 丝袜人妻中文字幕| 亚洲人成伊人成综合网2020| 国产高清videossex| 9191精品国产免费久久| 亚洲中文字幕日韩| 国产精品久久久av美女十八| 啦啦啦 在线观看视频| 亚洲国产欧美日韩在线播放| 天堂俺去俺来也www色官网| 国产高清激情床上av| 性色av乱码一区二区三区2| 午夜老司机福利片| 一级毛片精品| 妹子高潮喷水视频| 两个人免费观看高清视频| 男女下面插进去视频免费观看| 亚洲伊人久久精品综合| 91老司机精品| 亚洲精品一卡2卡三卡4卡5卡| 国产在线观看jvid| 亚洲精品中文字幕一二三四区 | 一二三四在线观看免费中文在| 精品亚洲成a人片在线观看| 国产精品.久久久| 免费人妻精品一区二区三区视频| 欧美国产精品一级二级三级| 亚洲欧美精品综合一区二区三区| 在线永久观看黄色视频| 18在线观看网站| 啦啦啦在线免费观看视频4| 国产一区二区在线观看av| 免费一级毛片在线播放高清视频 | 99riav亚洲国产免费| 国产精品秋霞免费鲁丝片| 一级毛片电影观看| 国产老妇伦熟女老妇高清| 黄色成人免费大全| 少妇精品久久久久久久| 国产不卡一卡二| 国产精品av久久久久免费| 免费在线观看黄色视频的| 国产一区二区 视频在线| 亚洲欧美日韩另类电影网站| 日韩欧美三级三区| 国产精品偷伦视频观看了| 亚洲欧洲精品一区二区精品久久久| 99国产精品一区二区三区| 亚洲精品在线观看二区| 一个人免费在线观看的高清视频| 国产成人免费观看mmmm| 丰满少妇做爰视频| 99国产极品粉嫩在线观看| 女性生殖器流出的白浆| 久久香蕉激情| 久久ye,这里只有精品| 成年版毛片免费区| 国产精品麻豆人妻色哟哟久久| 成人亚洲精品一区在线观看| 一区在线观看完整版| 黄色a级毛片大全视频| 老司机靠b影院| 午夜福利,免费看| 久久性视频一级片| 国产精品一区二区免费欧美| 午夜激情av网站| 欧美av亚洲av综合av国产av| 男女下面插进去视频免费观看| 可以免费在线观看a视频的电影网站| 又黄又粗又硬又大视频| 丝袜喷水一区| 亚洲七黄色美女视频| 熟女少妇亚洲综合色aaa.| 麻豆乱淫一区二区| 人妻 亚洲 视频| 亚洲国产欧美一区二区综合| 人妻久久中文字幕网| 夜夜骑夜夜射夜夜干| 精品亚洲成国产av| videosex国产| 黄色片一级片一级黄色片| 中文字幕av电影在线播放| 日本黄色日本黄色录像| 亚洲人成电影观看| 91大片在线观看| 侵犯人妻中文字幕一二三四区| a级片在线免费高清观看视频| 中亚洲国语对白在线视频| 久久热在线av| 老熟妇仑乱视频hdxx| 一个人免费在线观看的高清视频| 两人在一起打扑克的视频| 日本撒尿小便嘘嘘汇集6| 午夜免费鲁丝| 每晚都被弄得嗷嗷叫到高潮| 欧美日韩中文字幕国产精品一区二区三区 | 欧美中文综合在线视频| 欧美 亚洲 国产 日韩一| 精品一区二区三卡| 国产精品久久久久久人妻精品电影 | 一本—道久久a久久精品蜜桃钙片| 精品久久久精品久久久| 国产在线一区二区三区精| 日韩熟女老妇一区二区性免费视频| 国产熟女午夜一区二区三区| 啦啦啦在线免费观看视频4| 一本久久精品| 丝瓜视频免费看黄片| 国产在线视频一区二区| 久久久精品国产亚洲av高清涩受| 在线观看舔阴道视频| 精品亚洲成a人片在线观看| 国产伦人伦偷精品视频| 国产精品 欧美亚洲| 婷婷成人精品国产| 黄色视频,在线免费观看| 性少妇av在线| 久久精品亚洲精品国产色婷小说| 巨乳人妻的诱惑在线观看| 交换朋友夫妻互换小说| 成人18禁高潮啪啪吃奶动态图| 亚洲欧美精品综合一区二区三区| 日韩欧美一区二区三区在线观看 | 日本黄色视频三级网站网址 | 亚洲欧美色中文字幕在线| 性色av乱码一区二区三区2| 国产精品亚洲av一区麻豆| 又黄又粗又硬又大视频| 日韩视频在线欧美| 精品福利永久在线观看| 国产成人啪精品午夜网站| 亚洲午夜精品一区,二区,三区| av欧美777| 色精品久久人妻99蜜桃| 黑人猛操日本美女一级片| 在线观看66精品国产| 久久中文看片网| 日本av免费视频播放| 国产99久久九九免费精品| 中文字幕制服av| 日韩视频一区二区在线观看| 女人精品久久久久毛片| 亚洲va日本ⅴa欧美va伊人久久| 日韩 欧美 亚洲 中文字幕| 最近最新免费中文字幕在线| 丝袜美足系列| 热99久久久久精品小说推荐| 亚洲av国产av综合av卡| 亚洲av欧美aⅴ国产| 青青草视频在线视频观看| av天堂在线播放| 高清毛片免费观看视频网站 | 国产不卡一卡二| 黄色片一级片一级黄色片| 一区二区三区激情视频| 国产成人精品久久二区二区91| 亚洲av片天天在线观看| 高清视频免费观看一区二区| 午夜久久久在线观看| 国产男靠女视频免费网站| 香蕉国产在线看| 亚洲专区国产一区二区| 肉色欧美久久久久久久蜜桃| 啦啦啦视频在线资源免费观看| 国产91精品成人一区二区三区 | 日本欧美视频一区| 国产成人免费观看mmmm| 亚洲全国av大片| 后天国语完整版免费观看| 九色亚洲精品在线播放| 免费观看av网站的网址| 国产aⅴ精品一区二区三区波| 9191精品国产免费久久| 国产淫语在线视频| 中文字幕色久视频| 亚洲成人免费av在线播放| av网站免费在线观看视频| 中文字幕精品免费在线观看视频| 国产欧美亚洲国产| 91老司机精品| 亚洲,欧美精品.| 国产男女内射视频| 免费少妇av软件| 久久香蕉激情| 女同久久另类99精品国产91| 色精品久久人妻99蜜桃| 欧美日韩国产mv在线观看视频| 亚洲,欧美精品.| 久久久久久久久久久久大奶| 无限看片的www在线观看| 最新美女视频免费是黄的| 国产无遮挡羞羞视频在线观看| 久久亚洲真实| 免费日韩欧美在线观看| 国产av精品麻豆| 99国产精品99久久久久| 久久精品人人爽人人爽视色| 日日夜夜操网爽| 久久中文看片网| 午夜成年电影在线免费观看| 美女扒开内裤让男人捅视频| 乱人伦中国视频| 老司机午夜十八禁免费视频| www.自偷自拍.com| 最黄视频免费看| 亚洲精品中文字幕在线视频| 视频在线观看一区二区三区| 黄色成人免费大全| 电影成人av| av不卡在线播放| 人人妻人人澡人人爽人人夜夜| 亚洲欧美日韩高清在线视频 | 国产精品美女特级片免费视频播放器 | www.精华液| 久久国产精品男人的天堂亚洲| e午夜精品久久久久久久| 韩国精品一区二区三区| 99热国产这里只有精品6| 欧美 日韩 精品 国产| 成年人黄色毛片网站| 麻豆成人av在线观看| 欧美精品一区二区免费开放| 亚洲精品在线观看二区| 丰满人妻熟妇乱又伦精品不卡| 国产欧美日韩精品亚洲av| 午夜福利影视在线免费观看| 男女之事视频高清在线观看| 在线观看www视频免费| 亚洲国产av影院在线观看| 美女午夜性视频免费| 人人澡人人妻人| 国产一区二区三区在线臀色熟女 | 王馨瑶露胸无遮挡在线观看| 母亲3免费完整高清在线观看| 免费在线观看影片大全网站| 成人国产av品久久久| 大片电影免费在线观看免费| 深夜精品福利| 国产亚洲精品一区二区www | 青青草视频在线视频观看| 亚洲av电影在线进入| 午夜激情av网站| 久久香蕉激情| 亚洲国产看品久久| 亚洲 欧美一区二区三区| 性色av乱码一区二区三区2| 成人特级黄色片久久久久久久 | 美女视频免费永久观看网站| 一本色道久久久久久精品综合| 久久天堂一区二区三区四区| 亚洲国产欧美网| 老鸭窝网址在线观看| 纯流量卡能插随身wifi吗| 久久久久国产一级毛片高清牌| 亚洲第一青青草原| 丰满少妇做爰视频| 这个男人来自地球电影免费观看| 99国产极品粉嫩在线观看| 免费av中文字幕在线| 国产欧美日韩精品亚洲av| 成人精品一区二区免费| 啪啪无遮挡十八禁网站| 男人舔女人的私密视频| 欧美日韩亚洲国产一区二区在线观看 | 丝袜喷水一区| 最近最新中文字幕大全电影3 | 欧美激情 高清一区二区三区| 精品卡一卡二卡四卡免费| 精品福利永久在线观看| 国产欧美日韩一区二区三区在线| 亚洲精品国产一区二区精华液| www.999成人在线观看| 欧美人与性动交α欧美软件| 在线观看免费日韩欧美大片| 精品亚洲成国产av| 久久影院123| 亚洲人成77777在线视频| 国产精品1区2区在线观看. | 人妻久久中文字幕网| 91精品三级在线观看| 国产亚洲精品一区二区www | 脱女人内裤的视频| 性色av乱码一区二区三区2| 精品一区二区三区视频在线观看免费 | 午夜福利,免费看| 久久精品国产综合久久久| 十八禁人妻一区二区| 在线观看人妻少妇| 午夜免费鲁丝| 纵有疾风起免费观看全集完整版| 亚洲全国av大片| 性少妇av在线| 久久久国产欧美日韩av| 久9热在线精品视频| 法律面前人人平等表现在哪些方面| 国产精品久久久av美女十八| 狂野欧美激情性xxxx| avwww免费| www.精华液| 日韩欧美一区二区三区在线观看 | 亚洲黑人精品在线| 亚洲午夜精品一区,二区,三区| av超薄肉色丝袜交足视频| 国产99久久九九免费精品| 另类精品久久| 如日韩欧美国产精品一区二区三区| 国产一区二区三区视频了| 国产成人影院久久av| 悠悠久久av| 99久久精品国产亚洲精品| 色在线成人网| 欧美成人免费av一区二区三区 | 午夜福利影视在线免费观看| 国产福利在线免费观看视频| 少妇 在线观看| 在线观看免费日韩欧美大片| 亚洲精品中文字幕在线视频| 久久香蕉激情| 嫩草影视91久久| 极品人妻少妇av视频| 老熟女久久久| 成人国产av品久久久| 黄网站色视频无遮挡免费观看| 亚洲七黄色美女视频| 久久精品亚洲熟妇少妇任你| 最近最新中文字幕大全免费视频| 国产老妇伦熟女老妇高清| 午夜福利在线观看吧| 国产精品亚洲一级av第二区| 桃红色精品国产亚洲av| 国产精品99久久99久久久不卡| 十八禁高潮呻吟视频| 日本wwww免费看| 午夜福利视频在线观看免费| 高清av免费在线| 国产不卡av网站在线观看| av国产精品久久久久影院| 国产在线免费精品| 两性午夜刺激爽爽歪歪视频在线观看 | 国产xxxxx性猛交| 午夜激情久久久久久久| 国产一卡二卡三卡精品| 免费在线观看日本一区| 亚洲美女黄片视频| 大型av网站在线播放| 9热在线视频观看99| 亚洲av国产av综合av卡| 每晚都被弄得嗷嗷叫到高潮| 最新在线观看一区二区三区| 久久亚洲精品不卡| 亚洲情色 制服丝袜| 成年人免费黄色播放视频| 99久久99久久久精品蜜桃|