• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于系統(tǒng)模型的用戶評論中非功能需求的自動分類

    2022-11-09 07:12:44李雪瑩王田路
    電子學(xué)報 2022年9期
    關(guān)鍵詞:機(jī)器向量分類

    李雪瑩,王田路,梁 鵬,王 翀

    (武漢大學(xué)計算機(jī)學(xué)院,湖北武漢 430072)

    1 引言

    隨著移動設(shè)備的迅速普及,移動應(yīng)用程序和應(yīng)用商店在人們?nèi)粘I钪械膽?yīng)用越來越廣泛.移動應(yīng)用庫中包含了大量的用戶評論,這些用戶評論包含用戶需求、系統(tǒng)故障以及使用體驗等信息,被認(rèn)為是獲取需求的重要來源.抽取、識別和分類存在于用戶評論中的需求,不僅可以幫助開發(fā)人員維護(hù)現(xiàn)有系統(tǒng),還能快速、準(zhǔn)確地定位新的用戶需求,從而添加現(xiàn)有系統(tǒng)缺乏的功能.然而,移動應(yīng)用商店每天都有海量的用戶評論產(chǎn)生,人工處理大量自然語言文本需要耗費(fèi)極大的人力和時間成本,從而使得從用戶評論中快速有效識別和分類需求成為挑戰(zhàn)問題.

    目前從用戶評論中獲取需求的相關(guān)研究主要關(guān)注軟件系統(tǒng)功能方面的需求.然而,最近的需求工程領(lǐng)域工業(yè)調(diào)研(Naming the Pain in Requirements Engineerin,NaPiRE)結(jié)果表明,“不清楚/無法度量”的非功能需求是涉眾在開發(fā)過程中最棘手的問題之一[1].用戶評論中的非功能需求與軟件質(zhì)量密切相關(guān),在軟件系統(tǒng)的開發(fā)和維護(hù)過程中起到關(guān)鍵作用.將非功能需求進(jìn)行分類,可以幫助開發(fā)者更好地理解系統(tǒng)的非功能需求并發(fā)現(xiàn)系統(tǒng)中存在的主要質(zhì)量問題.

    Broy[2,3]提出根據(jù)結(jié)構(gòu)化的系統(tǒng)模型對需求進(jìn)行分類.該方法根據(jù)是否描述了系統(tǒng)的行為屬性,將需求分為行為型需求和表示型需求.Eckhardt[4]認(rèn)為基于Broy提出的系統(tǒng)模型能夠?qū)π枨筮M(jìn)行有效的分類.該系統(tǒng)模型提供了明確清晰的系統(tǒng)概念,可以根據(jù)系統(tǒng)屬性精準(zhǔn)地指定需求類別,使需求的表示更加具體和準(zhǔn)確.

    基于上述研究背景,本文的主要關(guān)注點是:基于系統(tǒng)模型將移動應(yīng)用用戶評論中的非功能需求自動分類為行為型需求和表示型需求.Lu等人[5]基于ISO/IEC 25010(International Organization for Standardization/International Electrotechnical Commission)軟件質(zhì)量需求標(biāo)準(zhǔn)[6],已對4000條iBooks和WhatsApp用戶評論進(jìn)行了分類,最終得到了1278條非功能需求用戶評論.本文以上述1278條非功能需求用戶評論為數(shù)據(jù)集,從系統(tǒng)模型的角度出發(fā),通過人工標(biāo)注的方式將非功能需求分類為行為型需求和表示型需求.之后,分別使用了機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法對人工標(biāo)記得到的數(shù)據(jù)集進(jìn)行自動分類.最后,評估和比較了機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型在自動分類非功能需求時的性能和時間消耗.本文的主要貢獻(xiàn)包括3個方面:(1)提供了基于系統(tǒng)模型將非功能需求標(biāo)記為“行為型需求”和“表示型需求”的實驗數(shù)據(jù)集[7],為這類研究提供了公共數(shù)據(jù);(2)將機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法應(yīng)用于基于系統(tǒng)模型的非功能需求自動分類,分別得到了性能最優(yōu)的機(jī)器學(xué)習(xí)模型組合(SVM與TF-IDF組合)和深度學(xué)習(xí)模型組合(TextCNN(Text Convolutional Neural Networks)與Word2Vec組合);(3)評估和比較了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在將非功能需求自動分類時的性能和時間消耗差異,為非功能需求的自動分類提供了最佳方法和使用建議.

    2 相關(guān)工作

    2.1 需求分類的方式

    軟件需求分類是需求工程領(lǐng)域的重要任務(wù)之一.最常見的分類方法是將需求分為功能需求和非功能需求.盡管很多研究采納了這種分類方式,但是因為“非功能需求”的定義較為模糊,對于什么是“非功能需求”以及如何獲取、記錄和驗證它們,需求工程界尚未達(dá)成共識[8].Glinz[8]指出,將需求分類為功能需求和非功能需求,將會導(dǎo)致定義問題、分類問題和表示問題.為了解決上述問題,作者提出應(yīng)該基于“關(guān)注點”將需求分為功能需求、性能需求、特定質(zhì)量需求和約束.此外,很多研究關(guān)注非功能需求的分類.最常用的非功能需求分類是ISO/IEC 25010[6]標(biāo)準(zhǔn)中的質(zhì)量模型定義的8大類質(zhì)量特性類別.然而該標(biāo)準(zhǔn)中對非功能需求進(jìn)行分類存在以下問題:(1)非功能需求通常沒有被量化,不易測試;(2)在產(chǎn)品規(guī)劃過程中沒有考慮非功能需求;(3)項目中主要關(guān)注功能需求,非功能需求通常不被記錄;(4)該分類過于抽象,難以為開發(fā)者的分類需求提供指導(dǎo)[4].盡管存在多種非功能需求的分類方式,但非功能需求沒有被集成到軟件開發(fā)過程中,且缺乏一種普遍接受的方式來提取、記錄和分析非功能需求[4].

    2.2 需求的自動分類方法

    還有一些研究使用自動化方法對需求進(jìn)行分類.Abad等人[9]使用決策樹(Decision Tree,DT)將需求分為功能需求和非功能需求.還使用LDA(Latent Dirichlet Allocation)、K-means、樸素貝葉斯(Na?ve Bayes,NB)等方法將非功能需求進(jìn)一步分類為可用性、可維護(hù)性、性能.結(jié)果表明,NB分類器在對非功能需求進(jìn)行分類時表現(xiàn)最好.Li等人[10]使用k-Nearest Neighbor、NB、SVM將需求分類為安全性、可靠性、性能、系統(tǒng)接口等子類別.結(jié)果表明,SVM在對需求進(jìn)行分類時表現(xiàn)最好.

    2.3 用戶評論分類

    目前有很多研究使用自動化方法對用戶評論進(jìn)行分類.Stanik等人[11]分別使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法將用戶評論分類為問題報告、詢問評論和無關(guān)評論.結(jié)果表明,機(jī)器學(xué)習(xí)模型與深度學(xué)習(xí)模型在分類用戶評論時性能相當(dāng).Lu等人[5]將用戶評論分為非功能需求(可靠性、可用性、可移植性和性能)、功能需求以及其 他.作 者 將BoW(Bag-of-Words)、TF-IDF(Term Frequency-Inverse Document Frequency)、CHI2(Chi Squared)和AUR-BoW(Augmented User Reviews-Bagof-Words)與NB、J48和Bagging結(jié)合對用戶評論進(jìn)行分類.其中,AUR-BoW針對訓(xùn)練集中的用戶評論,利用與評論相似的詞語對用戶評論進(jìn)行擴(kuò)展,將擴(kuò)展后的句子作為BoW的輸入.研究結(jié)果表明,AUR-BoW與Bagging結(jié)合起來的分類效果最佳.Jha等人[12]從用戶評論中提取非功能需求并將其分為可靠性、可用性、性能和可支持性,使用NB和SVM對非功能需求進(jìn)行分類.結(jié)果表明,SVM的性能優(yōu)于NB分類器的性能.

    在本文中,我們從系統(tǒng)模型的視角對非功能需求進(jìn)行分類,并在第3節(jié)對使用的技術(shù)進(jìn)行了詳細(xì)的介紹.

    3 相關(guān)理論和技術(shù)

    3.1 基于系統(tǒng)模型的非功能需求分類

    Broy[2,3]提出了一種基于結(jié)構(gòu)化的系統(tǒng)模型對需求進(jìn)行分類的方法.在系統(tǒng)模型中,系統(tǒng)由接口(Interface)、體系結(jié)構(gòu)(Architecture)和狀態(tài)(State)3個基本視圖構(gòu)成,并將接口行為作為主要概念.系統(tǒng)的行為屬性包括系統(tǒng)接口上的行為以及接口行為在體系結(jié)構(gòu)和狀態(tài)轉(zhuǎn)換方面的內(nèi)部行為(例如點擊系統(tǒng)交互界面的響應(yīng)時間),系統(tǒng)的非行為屬性則關(guān)注系統(tǒng)在語法構(gòu)成上和技術(shù)層面上的表示、描述、構(gòu)造、實現(xiàn)和執(zhí)行方式(例如系統(tǒng)實現(xiàn)要求使用的編程語言).基于系統(tǒng)模型的需求分類方法根據(jù)需求是否描述了系統(tǒng)的行為屬性,將其分為“行為型需求”和“表示型需求”.其中“行為型需求”不僅包含了傳統(tǒng)意義上的功能需求,還包含了描述系統(tǒng)行為的質(zhì)量需求;“表示型需求”包含從語法構(gòu)成和技術(shù)層面關(guān)注系統(tǒng)表示、描述、構(gòu)造、實現(xiàn)和執(zhí)行方式的質(zhì)量需求.圖1給出了基于系統(tǒng)模型對非功能需求用戶評論進(jìn)行分類的具體方法.

    圖1 基于系統(tǒng)模型的非功能需求分類

    基于系統(tǒng)模型將需求分類,為需求分類提供了新的視角,打破了實踐中功能需求與非功能需求的分離[4].從實踐角度來看,這種分類方法使得非功能需求可以像功能需求一樣被提取、分析和記錄.Eckhardt[4]基于Broy提出的分類模型對非功能需求進(jìn)行了分類.結(jié)果表明,大多數(shù)所謂的“非功能需求”實際上像功能需求一樣都描述了系統(tǒng)的行為,因此被定義為“非功能需求”并不合適.王田路等人發(fā)現(xiàn)[13],在用戶評論的非功能需求中超過70%的非功能需求描述了系統(tǒng)的行為,因此它們在本質(zhì)上不能被統(tǒng)一認(rèn)為是“非功能”的.

    為了解決傳統(tǒng)需求分類存在的問題,本文基于Broy提出的系統(tǒng)模型對需求進(jìn)行分類.本文首先基于傳統(tǒng)的需求分類模型從用戶評論中提取非功能需求評論.之后基于系統(tǒng)模型的需求分類方法,根據(jù)用戶評論是否描述了系統(tǒng)的行為屬性,將其分類為“行為型需求”和“表示型需求”,來幫助我們進(jìn)一步理解非功能需求的本質(zhì).需要說明的是,本文沒有關(guān)注用戶評論中的功能需求,原因是在基于系統(tǒng)模型的需求分類方式中,認(rèn)為功能需求屬于“行為型需求”.表1提供了用戶評論句子中“行為型需求”和“表示型需求”的示例(更多分類實例,可參見本文的實驗數(shù)據(jù)集[7]).在王田路等人前期人工標(biāo)注和分析工作的基礎(chǔ)上[13],本文結(jié)合機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的分類算法實現(xiàn)了基于系統(tǒng)模型對用戶評論中非功能需求的自動分類.該自動分類方法可以輔助需求工程師和系統(tǒng)涉眾了解和分析用戶評論中非功能需求的本質(zhì)以及非功能需求所描述的系統(tǒng)屬性.

    表1 用戶評論中行為型需求和表示型需求的示例

    3.2 文本特征提取技術(shù)

    BoW被廣泛應(yīng)用在文本分類任務(wù)中.該模型根據(jù)語料庫所有文檔中的單詞構(gòu)造一個無序字典,將字詞在文檔中出現(xiàn)的頻率作為文檔特征.TF-IDF用來評估某一字詞對于某個文檔集合或語料庫中的一個文檔的重要程度.如果某字詞在一個文檔中頻率出現(xiàn),在其他文檔中很少出現(xiàn),則認(rèn)為此字詞具有很好的類別區(qū)分能力,適合用來分類.

    3.3 監(jiān)督式機(jī)器學(xué)習(xí)

    監(jiān)督式機(jī)器學(xué)習(xí)算法接受已知的輸入數(shù)據(jù)集合(訓(xùn)練集)和已知的對數(shù)據(jù)的響應(yīng)(輸出),然后訓(xùn)練一個模型,為新輸入數(shù)據(jù)的響應(yīng)生成合理的預(yù)測.Jha等人使用機(jī)器學(xué)習(xí)算法對需求進(jìn)行自動分類時[12],結(jié)果表明SVM的性能優(yōu)于NB.Abad[9]等人在使用LDA、Kmeans、NB等方法對非功能需求分類時,結(jié)果表明NB的表現(xiàn)最好.為了確定表現(xiàn)最好的分類器,我們選擇和比較了文本分類領(lǐng)域具有代表性的監(jiān)督式機(jī)器學(xué)習(xí)算法NB、LR、DT、RF和SVM.通過學(xué)習(xí)已標(biāo)記的訓(xùn)練集分別訓(xùn)練5種分類器模型,再將訓(xùn)練好的模型應(yīng)用到測試集中,以實現(xiàn)對非功能需求的自動分類.

    3.4 詞嵌入技術(shù)

    Word2Vec[14]是詞嵌入(Word Embedding)的方式之一.它使用無監(jiān)督方法,通過學(xué)習(xí)和訓(xùn)練文本,可以把對文本內(nèi)容的處理簡化為向量運(yùn)算,使用詞向量的方式表征詞語的語義信息.使用Word2Vec工具訓(xùn)練得到的詞向量可以有效度量詞語與詞語之間的相似性.FastText[15]用于從大規(guī)模語料庫中學(xué)習(xí)單詞的高維向量表示.Word2Vec沒有考慮單詞的內(nèi)部結(jié)構(gòu),直接學(xué)習(xí)整個單詞的詞向量.而FastText首先計算子串的詞向量,最后將單詞所有子串的詞向量組合得到單詞的詞向量.因此FastText能夠識別未出現(xiàn)在語料庫中的單詞.

    3.5 神經(jīng)網(wǎng)絡(luò)模型

    通過多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)數(shù)據(jù)的特征,深度學(xué)習(xí)將數(shù)據(jù)轉(zhuǎn)換為有利于分類任務(wù)的更高效的數(shù)字表示形式.卷積神經(jīng)網(wǎng)絡(luò)(Conventional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域代表性的算法模型,CNN由輸入層、卷積層、激活函數(shù)、池化層和全連接層組成,通過反向傳播算法進(jìn)行參數(shù)優(yōu)化.TextCNN模型[16]是代表性的CNN網(wǎng)絡(luò)結(jié)構(gòu),與傳統(tǒng)的CNN相比,TextCNN在結(jié)構(gòu)上無明顯變化.其流程是:先將文本分詞,通過詞嵌入(Word Embedding)得到詞向量,將詞向量進(jìn)行卷積、池化操作,最后將輸出外接到Softmax層做n分類.RCNN模型[17]將單詞的上下文信息和單詞本身的向量進(jìn)行整合以得到該單詞的詞向量.其流程是:首先通過詞嵌入得到詞向量.然后使用一個具有循環(huán)結(jié)構(gòu)的隱藏層捕獲單詞的上下文信息,重新計算單詞向量.再對詞向量進(jìn)行池化操作,以捕獲文本的關(guān)鍵單詞.最后將輸出外接到Softmax層做n分類.CharCNN[18]模型將文本作為一種原始字符級信號來處理.其流程是:首先將一系列編碼字符作為輸入,使用one-hot編碼對字符進(jìn)行向量化操作.將文本用字符向量表示,再用字符向量得到文檔向量.之后對文檔向量進(jìn)行卷積、池化操作后,將輸出外接到全連接層做n分類.本文分別使用Word2Vec和FastText模型將單詞轉(zhuǎn)化為詞向量,作為TextCNN和RCNN模型的輸入.CharCNN本身基于字符計算向量,因此無需以Word2Vec和FastText詞向量作為輸入.

    4 研究設(shè)計

    4.1 研究目標(biāo)與研究問題

    本文的研究目標(biāo)是:基于系統(tǒng)模型,將移動應(yīng)用用戶評論中的非功能需求自動分類為行為型需求和表示型需求.為了實現(xiàn)該目標(biāo),我們使用了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,并提出了以下5個研究問題(Research Question,RQ).

    RQ1:機(jī)器學(xué)習(xí)模型中,在將用戶評論中的非功能需求自動分類為行為型需求和表示型需求時,哪種特征提取技術(shù)(TF-IDF、BoW)表現(xiàn)更好?

    在自動分類任務(wù)中,文本通常被表示為數(shù)字向量.不同的特征提取技術(shù)關(guān)注的重點和使用的算法通常不同,因此可能導(dǎo)致不同的分類效果.本文使用BoW和TF-IDF來提取文本特征.此RQ的目的是找到適合本文自動分類任務(wù)的特征提取技術(shù).

    RQ2:在將用戶評論中的非功能需求自動分類為行為型需求和表示型需求時,哪種機(jī)器學(xué)習(xí)方法(NB、LR、DT、RF、SVM)性能最好?

    不同的分類方法在相同的分類任務(wù)中,可能導(dǎo)致不同的分類性能.不同的機(jī)器學(xué)習(xí)算法適用于不同的分類場景.本文使用5種常用的分類器進(jìn)行實驗.此RQ的目的是找到在本文的自動分類任務(wù)中,獲得最佳性能的分類器.

    RQ3:深度學(xué)習(xí)模型中,在將用戶評論中的非功能需求自動分類為行為型需求和表示型需求時,哪種詞嵌入模型(Word2Vec、FastText)表現(xiàn)更好?

    深度學(xué)習(xí)模型的輸入為詞嵌入或字符嵌入.不同詞嵌入技術(shù)在計算詞向量時依據(jù)的算法是有差異的.Word2Vec和FastText被廣泛應(yīng)用于自然語言處理任務(wù)中.此RQ的目的是找到適合本文自動分類任務(wù)的詞向量技術(shù).

    RQ4:在將用戶評論中的非功能需求自動分類為行為型需求和表示型需求時,哪種深度學(xué)習(xí)模型(TextCNN、RCNN、CharCNN)表現(xiàn)最好?

    不同的深度學(xué)習(xí)模型結(jié)構(gòu)有所差異,可能導(dǎo)致不同的分類性能.TextCNN和RCNN模型基于單詞表示文本,CharCNN模型利用字符表示文本.本文使用3種流行的深度學(xué)習(xí)算法進(jìn)行實驗.此RQ的目的是,找到在本文的自動分類任務(wù)中,獲得最佳性能的深度學(xué)習(xí)模型.

    RQ5:在將用戶評論中的非功能需求自動分類為行為型需求和表示型需求時,從性能和時間消耗2個維度比較機(jī)器學(xué)習(xí)模型與深度學(xué)習(xí)模型,哪種模型表現(xiàn)更好?

    深度學(xué)習(xí)模型已被應(yīng)用于自然語言處理領(lǐng)域,在文本分類任務(wù)中都表現(xiàn)出了非常好的性能.本文使用TextCNN和RCNN模型以及CharCNN模型自動將非功能需求進(jìn)行分類.此RQ的目的是,從性能和時間消耗2個維度綜合評估和比較機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型在自動分類非功能需求時的表現(xiàn)差異.

    研究問題(RQs)間的關(guān)聯(lián):RQ1和RQ2關(guān)注機(jī)器學(xué)習(xí)算法中,不同階段使用不同技術(shù)導(dǎo)致的分類結(jié)果的性能差異.RQ1比較不同的特征提取技術(shù)的性能差異.RQ2則重在關(guān)注不同分類器的性能差異.RQ3和RQ4關(guān)注深度學(xué)習(xí)算法中,不同階段使用不同技術(shù)所導(dǎo)致的分類結(jié)果的性能差異.RQ3比較不同詞向量模型初始化詞嵌入層時的性能差異.RQ4則關(guān)注不同深度學(xué)習(xí)模型本身的性能差異.RQ5從性能和時間消耗2個維度綜合比較了機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型在分類非功能需求時的性能差異.

    4.2 數(shù)據(jù)收集

    本文所用的數(shù)據(jù)來源于App Store和Google Play中閱讀類和通訊類的2個移動應(yīng)用程序iBooks和WhatsApp.選擇這2個移動應(yīng)用程序的原因有以下2點:(1)這2個移動應(yīng)用擁有大量的活躍用戶,且其中的用戶評論規(guī)模非常龐大,可以為本研究提供豐富的數(shù)據(jù);(2)這2個移動應(yīng)用主要用于在線閱讀和信息交流,沒有涉及比較專業(yè)的領(lǐng)域,涵蓋的用戶類型較為廣泛,因此在對其用戶評論標(biāo)記時不需要研究人員具備某些專業(yè)領(lǐng)域的知識,從而使標(biāo)記得到的分類結(jié)果更加可靠.

    我們在之前的工作[6]中收集了iBooks和WhatsApp中的用戶評論,將其分割為單個句子.隨后從每個移動應(yīng)用中隨機(jī)選取2000條評論,基于ISO/IEC 25010軟件質(zhì)量需求標(biāo)準(zhǔn)將其人工標(biāo)注為功能需求和非功能需求.最終,識別了1278條“非功能需求”用戶評論,這1278條“非功能需求”用戶評論將作為本文的數(shù)據(jù)集.

    本文將1278條非功能需求進(jìn)行人工標(biāo)記.具體分為以下2個步驟:(1)預(yù)標(biāo)記.從1278條評論中隨機(jī)抽取50條作為預(yù)實驗數(shù)據(jù),由3位作者分別標(biāo)記這些數(shù)據(jù),將50條評論分類為行為型需求和表示型需求,最后3位作者一起討論和解決預(yù)標(biāo)記過程中產(chǎn)生的分歧.該過程的目的是使3位作者對基于系統(tǒng)模型進(jìn)行需求分類的理解達(dá)成共識;(2)正式標(biāo)記.在對本文分類任務(wù)達(dá)成一致理解后,由第1、2作者分別獨(dú)立標(biāo)記其余的1228條非功能需求用戶評論.使用Cohen’s Kappa系數(shù)[19]計算2位作者分類結(jié)果的一致性,該值約為0.86,表明2人在對用戶評論的非功能需求進(jìn)行分類標(biāo)記時的結(jié)果比較一致.最后,由第3作者瀏覽前2位作者的標(biāo)記結(jié)果,3位作者一起討論和解決標(biāo)記結(jié)果中存在的分歧,就數(shù)據(jù)集的標(biāo)記結(jié)果達(dá)成一致.

    最終,我們在1278條非功能需求中識別了899條行為型需求和379條表示型需求.我們將數(shù)據(jù)集劃分為訓(xùn)練集(1022條,占80%)、驗證集(128條,占10%)和測試集(128條,占10%).本文的數(shù)據(jù)集已在線提供[7].

    4.3 實驗步驟

    本文使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)對非功能需求進(jìn)行分類.圖2和圖3分別展示了使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法進(jìn)行非功能需求分類的過程及每個步驟所使用的技術(shù).在深度學(xué)習(xí)算法中,由于Word2Vec和FastText在訓(xùn)練詞向量時,不需要有標(biāo)簽的數(shù)據(jù)集,因此我們將收集到的所有用戶評論(來自iBooks的6696條原始用戶評論和來自WhatsApp的4400條原始用戶評論)作為語料庫訓(xùn)練Word2Vec和FastText詞向量.在訓(xùn)練字符向量時,我們基于文獻(xiàn)[18]提供的69個字符來計算one-hot編碼,以此得到字符向量.本文根據(jù)經(jīng)驗選取常用的數(shù)值以確定TextCNN、RCNN和CharCNN模型的主要參數(shù).3個模型的主要參數(shù)分別如表2、表3和表4所示.

    表4 CharCNN模型的主要超參數(shù)

    圖2 使用機(jī)器學(xué)習(xí)算法進(jìn)行非功能需求自動分類的過程

    圖3 使用深度學(xué)習(xí)算法進(jìn)行非功能需求自動分類的過程

    表2 TextCNN模型的主要超參數(shù)

    表3 RCNN模型的主要超參數(shù)

    我們將行為型需求類別作為正類,表示型需求類別作為負(fù)類.因此,精確率(Precision)指的是使用本文的分類模型得到的行為需求類別的用戶評論中真正屬于行為型需求類別的比例.召回率(Recall)指的是使用本文的分類模型得到的真正屬于行為型需求類別的非功能需求,占數(shù)據(jù)集中行為型需求類別的非功能需求的比例.F1-score是精確率和召回率的加權(quán)調(diào)和平均值,當(dāng)F1-score值較高時,一般說明分類模型的分類效果較好.式(1)~(3)分別給出了精確率、召回率和F1-score的計算公式.

    其中,TP(True Positive)表示被分類模型標(biāo)記為行為型需求的非功能需求中,實際屬于行為型需求的評論數(shù)量.FP(False Positive)為被標(biāo)記為行為型需求的非功能需求中,實際不屬于行為型需求的評論數(shù)量.FN(False Negative)表示被分類模型標(biāo)記為表示型需求的非功能需求中,實際不屬于表示型需求的評論數(shù)量.

    4.4 實驗環(huán)境

    實驗環(huán)境配置為Intel(R)Core(TM)i5-7200U CPU以及8 GB RAM的-臺式計算機(jī),運(yùn)行Windows 10(64位)操作系統(tǒng).本文使用NLTK工具(版本號3.4.5)進(jìn)行分詞,并刪除了長度小于等于3的單詞.在機(jī)器學(xué)習(xí)算法中使用scikit-learn工具(版本號0.22.1)提供的特征提取技術(shù)和分類器算法(默認(rèn)參數(shù))進(jìn)行實驗.在深度學(xué)習(xí)算法中使用gensim庫(版本號3.8.1)提供的詞嵌入模型訓(xùn)練詞向量,并使用Tensorflow框架(版本號1.14.0)構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型.本文使用的NLTK工具、scikit-learn工具、gemsim庫以及Tensorflow框架均基于Python語言.

    5 結(jié)果與分析

    為了回答3.1節(jié)中提出的研究問題,我們計算了由機(jī)器學(xué)習(xí)模型(如表5所示)和深度學(xué)習(xí)模型(如表6所示)處理測試集后得到的精確率、召回率和F1-score.

    表5 使用機(jī)器學(xué)習(xí)模型對用戶評論中的非功能需求進(jìn)行分類的結(jié)果

    表6 使用深度學(xué)習(xí)模型對用戶評論中的非功能需求進(jìn)行分類的結(jié)果

    RQ1:我們計算和比較了5種機(jī)器學(xué)習(xí)算法分別與TF-IDF和BoW結(jié)合時得到的F1-score值,結(jié)果如圖4所示.結(jié)果顯示,除了SVM分類器外,其他所有分類器在與BoW結(jié)合時得到的F1-score值,均比與TF-IDF結(jié)合得到的F1-score值高.SVM分類器與TF-IDF組合得到了最高的F1-score,但僅比與BoW組合得到的F1-score高0.05.

    圖4 不同機(jī)器學(xué)習(xí)算法與TF-IDF和BoW組合得到的F1-score值的對比結(jié)果

    RQ1結(jié)論:整體上可以認(rèn)為,在將用戶評論中的非功能需求自動分類為表示型需求和行為型需求時,簡單的BoW技術(shù)比TF-IDF技術(shù)表現(xiàn)更好.這表明,在需求分類任務(wù)的特征提取階段,研究人員應(yīng)該優(yōu)先選擇表現(xiàn)更好的BoW技術(shù).但是仍然需要關(guān)注使用TF-IDF技術(shù)是否能夠得到更好的性能.

    RQ2:我們計算和比較了5種機(jī)器學(xué)習(xí)模型自動分類后得到的精確率、召回率和F1-score,結(jié)果如表5所示.結(jié)果顯示,所有分類器都有較好的分類性能,精確率、召回率和F1-score值幾乎都在0.9以上(DT與TFIDF組合的結(jié)果除外).圖5顯示,5種分類器與TF-IDF組合時,SVM獲得了最佳精確率(0.941)、召回率(0.990)和F1-score(0.965).DT獲 得 了 最 低 召 回 率(0.867)和F1-score(0.899).這表明,在需求分類自動分類任務(wù)中,使用TF-IDF特征提取技術(shù)時,應(yīng)優(yōu)先考慮SVM分類器.圖6顯示,5種分類器與BoW組合時,SVM和LR獲得了最佳F1-score(0.960).SVM獲得了最佳召回率(0.980),且與LR(0.979)僅相差0.01.而NB獲得了最高的精確率(0.989).圖6與圖5中的結(jié)果相似的是,DT獲得了最低的F1-score(0.944).這表明,在需求自動分類任務(wù)中,在使用BoW特征提取技術(shù),應(yīng)優(yōu)先考慮SVM和LR分類器.同時也應(yīng)關(guān)注使用NB是否能夠得到更好的性能.

    圖5 不同機(jī)器學(xué)習(xí)算法與TF-IDF組合時得到的精確率、召回率和F1-score值的對比結(jié)果

    圖6 不同機(jī)器學(xué)習(xí)算法與BoW組合時得到的精確率、召回率和F1-score值的對比結(jié)果

    RQ2結(jié)論:整體上看,SVM與TF-IDF組合得到了最佳召回率(0.990)和最佳F1-score(0.965),而NB與BoW組合獲得了最高精確率(0.989).此外,不管是與TFIDF還是與BoW組合,DT分類器都得到了最低F1-score.因此,我們認(rèn)為在將用戶評論中的非功能需求分類為表示型需求和行為型需求時,SVM分類器整體性能最好.

    RQ3:我們計算了TextCNN、RCNN分別與2種詞向量組合后得到的F1-score值,結(jié)果如圖7所示.實驗結(jié)果顯示,無論是TextCNN還是RCNN,與Word2Vec組合獲得F1-score值均高于與FastText組合得到的F1-score.

    圖7 不同深度學(xué)習(xí)算法與Word2Vec和FastText組合得到的F1-score值的對比結(jié)果

    RQ3結(jié)論:整體上來看,在將非功能需求分類為表示型需求和行為型需求時,Word2Vec模型比FastText模型表現(xiàn)更好.

    RQ4:我們計算了TextCNN、RCNN模型分別與Word2Vec、FastText組合,以及CharCNN模型的精確率、召回率和F1-score,結(jié)果如表6所示.圖8顯示了TextCNN和RCNN分別與Word2Vec組合和CharCNN 3個模型的精確率、召回率和F1-score值的對比結(jié)果.結(jié)果顯示,TextCNN與Word2Vec組合的精確率(0.950)、召回率(0.969)和F1-score(0.959)均高于其他2個深度學(xué)習(xí)模型.圖9顯示了TextCNN和RCNN分別與Fast-Text組合和CharCNN 3個模型得到的精確率、召回率和F1-score值的對比結(jié)果.結(jié)果顯示,TextCNN與FastText組合的精確率(0.989)和F1-score(0.941)高于其他2個模型,RCNN與FastText組合獲得了最高召回率(1.000).

    RQ4結(jié)論:整體上看,TextCNN與FastText組合獲得了最高精確率(0.989),RCNN與FastText組合獲得了最高召回率(1.000),TextCNN與Word2Vec組合獲得了最高F1-score(0.959).盡管RCNN與FastText組合獲得了最高的召回率(1.000),卻是以所有模型中最低的精確率(0.766)為代價的.結(jié)合圖8和圖9,我們認(rèn)為在將非功能需求分類為表示型需求和行為型需求時,TextCNN模型整體性能最好.但也應(yīng)該注意到,當(dāng)關(guān)注召回率時,RCNN與FastText組合是非常不錯的選擇.

    圖8 TextCNN與Word2Vec組 合、RCNN與Word2Vec組 合、CharCNN得到的精確率、召回率和F1-score值的對比結(jié)果

    圖9 TextCNN與FastText組合、RCNN與FastText組合、CharCNN得到的精確率、召回率和F1-score值的對比結(jié)果

    RQ5:我們比較了2類模型中獲得最高F1-score組合的精確率、召回率和F1-score,結(jié)果如圖10所示.結(jié)果顯示,SVM與TF-IDF的召回率(0.990)和F1-score(0.965)值 比TextCNN與Word2Vec組 合 的 值 高.TextCNN與Word2Vec得到的精確率(0.950)比SVM與TF-IDF得到的精確率高(0.941).很多研究表明,相較于機(jī)器學(xué)習(xí)模型,CNN有更好的分類效果.根據(jù)我們的比較結(jié)果,機(jī)器學(xué)習(xí)模型得到了較高的召回率和F1-score.深度學(xué)習(xí)模型的分類效果沒有明顯的優(yōu)勢,可能的原因有:(1)本文實驗的數(shù)據(jù)集規(guī)模較小;(2)深度學(xué)習(xí)模型存在通過進(jìn)一步調(diào)節(jié)參數(shù)來達(dá)到更好分類效果的可能性.

    圖10 SVM與TF-IDF組合、TextCNN與Word2Vec組合得到的精確率、召回率和F1-score值的對比結(jié)果

    我們還計算和比較了所有機(jī)器學(xué)習(xí)組合與深度學(xué)習(xí)組合的時間消耗(建模耗時和模型預(yù)測耗時),結(jié)果如表7、表8和表9所示.其中,機(jī)器學(xué)習(xí)的建模耗時為完成圖2中步驟1~4所需的時間,深度學(xué)習(xí)建模耗時為完成圖3中步驟1~3所需的時間.模型預(yù)測耗時分別為完成圖2和圖3中最后一個步驟所需的時間.在機(jī)器學(xué)習(xí)算法中,建模耗時最長的是RF與BoW組合(994 ms),建模耗時最短的是DT與BoW組合(514 ms).所有機(jī)器學(xué)習(xí)算法的模型預(yù)測耗時不超過20 ms.我們注意到,機(jī)器學(xué)習(xí)算法在與TF-IDF組合時的建模耗時普遍比與BoW組合時的建模耗時長(RF除外),而模型預(yù)測耗時幾乎一致.可能的原因是計算BoW向量比計算TF-IDF向量簡單,同時也從時間消耗角度驗證了RQ1的回答“簡單的BoW技術(shù)比TF-IDF技術(shù)表現(xiàn)更好”.

    表7 機(jī)器學(xué)習(xí)算法的建模耗時(Bt)以及模型預(yù)測耗時(Pt) ms

    表8 深度學(xué)習(xí)算法(TextCNN、RCNN)的建模耗時(Bt)以及模型預(yù)測耗時(Pt) ms

    表9 深度學(xué)習(xí)算法(CharCNN)的建模耗時(Bt)以及模型預(yù)測耗時(Pt)ms

    在深度學(xué)習(xí)算法中,CharCNN模型的建模耗時最長(514391 ms)且模型預(yù)測耗時也最長(85078 ms).TextCNN和RCNN與FastText組合 的 建模 耗時,比 與Word2Vec組合耗時長了約40000到50000 ms.可能的原因是FastText詞向量考慮了單詞的內(nèi)部結(jié)構(gòu),而Word2Vec計算1個完整單詞的詞向量.但在模型測試時,TextCNN和RCNN與FastText組合的預(yù)測耗時,比與Word2Vec組合耗時短100到10000 ms.TextCNN分別與Word2Vec、FastText組合的建模耗時是所有深度學(xué)習(xí)模型中耗時最短的,模型預(yù)測耗時也是最短的.可能的原因是TextCNN直接使用了預(yù)訓(xùn)練的詞向量進(jìn)行建模,RCNN在預(yù)訓(xùn)練詞向量的基礎(chǔ)上重新計算了詞向量,CharCNN則基于文本字符計算文本向量,因此這2個模型比TextCNN模型消耗更多的建模時間.這從時間消耗角度驗證了RQ4的回答“深度學(xué)習(xí)模型中,TextCNN模型整體性能最好”.

    在時間消耗方面,深度學(xué)習(xí)模型耗時較長,主要有2個原因:(1)在特征提取階段,機(jī)器學(xué)習(xí)模型通過1278條用戶評論計算向量值,而深度學(xué)習(xí)模型則通過11096條用戶評論計算詞向量和字符向量;(2)深度學(xué)習(xí)模型需要學(xué)習(xí)的參數(shù)比機(jī)器學(xué)習(xí)模型要多,因此建模耗時和模型預(yù)測耗時比機(jī)器學(xué)習(xí)模型耗時要長.

    RQ5結(jié)論:整體上,機(jī)器學(xué)習(xí)模型完成1次分類的時間僅需500~1000 ms,深度學(xué)習(xí)模型耗時100000~200000 ms,約為機(jī)器學(xué)習(xí)模型耗時的200倍.無論在召回率、F1-score的比較上,還是在時間消耗的比較上,機(jī)器學(xué)習(xí)模型都優(yōu)于深度學(xué)習(xí)模型,尤其是2者在耗時上的巨大差距.因此我們認(rèn)為,在將非功能需求分類為表示型需求和行為型需求時,機(jī)器學(xué)習(xí)模型比深度學(xué)習(xí)模型表現(xiàn)更好,并且在需求文本分類的分類應(yīng)用中應(yīng)首先嘗試機(jī)器學(xué)習(xí)模型,在性能相當(dāng)?shù)那闆r下,應(yīng)優(yōu)先使用耗時更少的機(jī)器學(xué)習(xí)模型,在使用深度學(xué)習(xí)模型時,需要從性能和時間消耗維度對其進(jìn)行整體收益評估.

    6 結(jié)果的效度與局限性

    本文依據(jù)文獻(xiàn)[20]中的效度分析準(zhǔn)則,從構(gòu)造效度、內(nèi)部效度、外部效度和可靠性討論對本研究結(jié)論有效性的可能威脅,并介紹我們?yōu)榫徑膺@些威脅所采取的措施.

    6.1 構(gòu)造效度分析

    構(gòu)造效度關(guān)注理論構(gòu)造是否能被正確地解釋和度量.本文的潛在威脅是人工分類過程中決定每條非功能需求類別時的個人主觀性.為了減少這類威脅,人工分類的過程由3人共同完成(軟件工程領(lǐng)域碩士生和教師),在正式分類之前,3人首先隨機(jī)選取了50條用戶評論句子進(jìn)行預(yù)分類,對于存在分歧意見的用戶評論句子,3人通過討論最終達(dá)成一致意見.正式分類由參與預(yù)分類的2名碩士生先單獨(dú)進(jìn)行分類標(biāo)記,有不同分類意見時與第3人(教師)討論,并最終在分類結(jié)果上達(dá)成一致.另一項潛在威脅是基于本研究所使用的用戶評論是否能夠得出合理的結(jié)論,為了減少該威脅,我們通過隨機(jī)抽取的方式從移動應(yīng)用中選取用戶評論樣本數(shù)據(jù)作為本研究的數(shù)據(jù)集.

    6.2 內(nèi)部效度分析

    內(nèi)部效度關(guān)注研究結(jié)果是否可以由本研究數(shù)據(jù)得出,以及是否有其它影響結(jié)果的因素未考慮到.本文的內(nèi)部效度威脅是機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法是否存在過擬合或欠擬合.為了減輕這種威脅的影響,我們使用2種特征提取技術(shù)與5種機(jī)器學(xué)習(xí)算法進(jìn)行組合,并使用2種基于詞嵌入的深度學(xué)習(xí)算法和1種基于字符向量的深度學(xué)習(xí)算法,最后評估和對比了所有組合的性能和時間消耗.在當(dāng)前的數(shù)據(jù)規(guī)模下,結(jié)果表明,在對非功能需求分類進(jìn)行分類時,機(jī)器學(xué)習(xí)模型比深度學(xué)習(xí)模型在性能和時間消耗方面表現(xiàn)更好.但不能確定在數(shù)據(jù)集規(guī)模更大時,是否仍能得到與本文一致的結(jié)果,需要通過進(jìn)一步實驗來研究.

    6.3 外部效度分析

    外部效度指研究結(jié)果在多大程度上可適用于其它數(shù)據(jù)集和環(huán)境.本文對2個常用的移動應(yīng)用的用戶評論進(jìn)行非功能需求分類,通過應(yīng)用類別和平臺環(huán)境的多樣性來減少研究數(shù)據(jù)對外部效度產(chǎn)生的威脅.但是必須承認(rèn)本研究中采用的移動應(yīng)用類別數(shù)量有限,因此不能確定在使用其它類別應(yīng)用程序(例如教育類)的用戶評論進(jìn)行非功能需求分類時,結(jié)果是否一致.此外,本文數(shù)據(jù)來源于國外的移動應(yīng)用的英文用戶評論,因此尚無法保證在對中文的用戶評論使用相同的研究方法時能夠得到相同的研究結(jié)果.

    6.4 可靠性分析

    可靠性指如果其他研究人員重復(fù)本研究是否會得到相同或相似的結(jié)果.本文的人工分類標(biāo)記過程由3名軟件工程領(lǐng)域研究人員共同完成,并明確了分類標(biāo)記過程,以盡可能地減少個人偏見對分類結(jié)果的影響.此外,本文提供了研究使用的數(shù)據(jù)集[7],說明了實驗步驟和參數(shù)設(shè)置,給出了實驗環(huán)境,供其他研究人員使用和驗證本研究工作,提升了本研究結(jié)果的可重復(fù)性.需要說明的是,本文基于國外的移動應(yīng)用的用戶評論進(jìn)行研究,研究結(jié)果尚未與應(yīng)用的開發(fā)團(tuán)隊進(jìn)行確認(rèn),因此尚無法確定研究結(jié)果對這2個應(yīng)用未來的更新迭代所產(chǎn)生的影響.

    7 總結(jié)

    本文根據(jù)Broy[2]等人提出的系統(tǒng)模型,將iBooks和WhatsApp 2個應(yīng)用程序的1278條非功能需求用戶評論人工標(biāo)注為行為型需求和表示型需求.并使用了機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法進(jìn)行分類.在使用機(jī)器學(xué)習(xí)進(jìn)行分類時,將TF-IDF和BoW技術(shù)分別與NB、LR、DT、RF以及SVM進(jìn)行組合.在使用深度學(xué)習(xí)進(jìn)行分類時,將Word2Vec、FastText分別與TextCNN、RCNN相結(jié)合,并構(gòu)建和訓(xùn)練了基于字符向量的CharCNN深度學(xué)習(xí)模型.我們使用上述所有組合將1278條非功能需求分類為行為型需求和表示型需求,最后對所有組合的分類性能和時間消耗進(jìn)行評估,其中在性能方面我們計算和比較了所有組合的精確率、召回率和F1-score.結(jié)果表明,在將非功能需求分類為行為型需求和表示型需求時(其中第1到第5點分別對應(yīng)RQ1到RQ5的結(jié)果,第6點為綜合結(jié)果):

    (1)在機(jī)器學(xué)習(xí)模型中,簡單的BoW技術(shù)比TFIDF技術(shù)在特征提取方面表現(xiàn)更好.

    (2)在機(jī)器學(xué)習(xí)模型中,SVM分類器的整體性能最好.

    (3)在深度學(xué)習(xí)模型中,Word2Vec模型比FastText模型在計算詞向量方面表現(xiàn)更好.

    (4)在深度學(xué)習(xí)模型中,TextCNN的整體性能最好.

    (5)在性能和時間消耗2個維度上,機(jī)器學(xué)習(xí)模型比深度學(xué)習(xí)模型表現(xiàn)更好.

    (6)TF-IDF與SVM組 合 得 到 了 最 佳F1-score(0.965),BoW與NB組合、FastText與TextCNN組合獲得了最高精確率(0.989),F(xiàn)astText與RCNN組合獲得了最高召回率(1.000).

    基于本文的研究結(jié)果,我們計劃從以下5個方面來改進(jìn)我們的工作:

    (1)本文機(jī)器學(xué)習(xí)模型使用了默認(rèn)參數(shù),深度學(xué)習(xí)模型根據(jù)經(jīng)驗選取了常用的數(shù)值以確定主要參數(shù),未來我們計劃通過實驗來確定這些模型的最佳參數(shù),并將嘗試更多其它主流的分類算法進(jìn)行非功能需求的自動分類實驗,如DCNN(Dynamic Convolutional Neural Network)、HAN(Hierarchical Attention Networks)等.

    (2)本研究數(shù)據(jù)集來自應(yīng)用商店中2個類別的應(yīng)用程序,為了提高研究結(jié)果的通用性以及自動分類效果的外部效度,我們擬在數(shù)據(jù)集中增加移動應(yīng)用類別的數(shù)量.

    (3)本研究數(shù)據(jù)集規(guī)模可能會影響自動分類算法的訓(xùn)練效果,進(jìn)一步影響分類效果.我們計劃標(biāo)記更多數(shù)量的移動應(yīng)用用戶評論句子,以減少對外部效度的威脅.

    (4)將本文的研究結(jié)果與iBooks和WhatsApp應(yīng)用的開發(fā)團(tuán)隊進(jìn)行確認(rèn),進(jìn)一步提升本文研究結(jié)果的可靠性.

    (5)本文基于兩個國外的移動應(yīng)用的英文用戶評論進(jìn)行非功能需求自動分類的研究,我們也計劃利用國內(nèi)開發(fā)的移動應(yīng)用的中文用戶評論進(jìn)行研究,提升研究結(jié)果的通用性、自動分類效果的外部效度以及研究結(jié)果的可靠性.

    猜你喜歡
    機(jī)器向量分類
    機(jī)器狗
    向量的分解
    機(jī)器狗
    分類算一算
    聚焦“向量與三角”創(chuàng)新題
    分類討論求坐標(biāo)
    未來機(jī)器城
    電影(2018年8期)2018-09-21 08:00:06
    數(shù)據(jù)分析中的分類討論
    教你一招:數(shù)的分類
    向量垂直在解析幾何中的應(yīng)用
    久久伊人香网站| 91老司机精品| 一级片'在线观看视频| 国产精品一区二区免费欧美| 久久国产亚洲av麻豆专区| 男男h啪啪无遮挡| 亚洲午夜精品一区,二区,三区| 亚洲三区欧美一区| 日韩 欧美 亚洲 中文字幕| 亚洲,欧美精品.| 色综合站精品国产| 国产精品偷伦视频观看了| 这个男人来自地球电影免费观看| 自拍欧美九色日韩亚洲蝌蚪91| xxxhd国产人妻xxx| 亚洲av五月六月丁香网| 日本五十路高清| avwww免费| 琪琪午夜伦伦电影理论片6080| 亚洲七黄色美女视频| 国产色视频综合| 欧美黄色淫秽网站| 欧美最黄视频在线播放免费 | 国产一区二区激情短视频| 日韩欧美三级三区| 国产91精品成人一区二区三区| 在线观看一区二区三区| 巨乳人妻的诱惑在线观看| 韩国精品一区二区三区| 999久久久国产精品视频| 天堂影院成人在线观看| 淫妇啪啪啪对白视频| 在线观看舔阴道视频| 国产精品亚洲一级av第二区| 国产精品综合久久久久久久免费 | 777久久人妻少妇嫩草av网站| 久久久久久久久中文| 天堂俺去俺来也www色官网| 久久精品国产亚洲av香蕉五月| 性色av乱码一区二区三区2| 桃色一区二区三区在线观看| 久久久久国产精品人妻aⅴ院| 91成人精品电影| 亚洲av电影在线进入| 欧美色视频一区免费| 久久久久久久久免费视频了| 成人特级黄色片久久久久久久| 欧美午夜高清在线| 午夜精品在线福利| 国产精品电影一区二区三区| 999精品在线视频| 国产精品一区二区三区四区久久 | 亚洲av成人不卡在线观看播放网| 免费女性裸体啪啪无遮挡网站| 日本vs欧美在线观看视频| 中文字幕高清在线视频| 伊人久久大香线蕉亚洲五| 国产三级黄色录像| 女人被狂操c到高潮| 精品久久久精品久久久| 久久国产精品男人的天堂亚洲| 亚洲精品中文字幕一二三四区| 国产精品亚洲av一区麻豆| 9191精品国产免费久久| 男女午夜视频在线观看| 亚洲av熟女| 自拍欧美九色日韩亚洲蝌蚪91| 757午夜福利合集在线观看| 在线观看一区二区三区激情| 日韩人妻精品一区2区三区| 日韩欧美在线二视频| 亚洲精品一卡2卡三卡4卡5卡| 欧美+亚洲+日韩+国产| 91麻豆精品激情在线观看国产 | 精品国内亚洲2022精品成人| 黄色 视频免费看| 免费高清视频大片| 欧美人与性动交α欧美精品济南到| 黄色怎么调成土黄色| 欧美亚洲日本最大视频资源| 久久久精品欧美日韩精品| 国产区一区二久久| 一级黄色大片毛片| 国产欧美日韩精品亚洲av| 日韩有码中文字幕| 亚洲专区字幕在线| 男女做爰动态图高潮gif福利片 | 午夜免费激情av| 亚洲欧洲精品一区二区精品久久久| 变态另类成人亚洲欧美熟女 | 男人的好看免费观看在线视频 | 香蕉丝袜av| 亚洲免费av在线视频| 高清欧美精品videossex| 日韩欧美国产一区二区入口| 交换朋友夫妻互换小说| 怎么达到女性高潮| 日韩精品青青久久久久久| 国产免费现黄频在线看| 中出人妻视频一区二区| 女人爽到高潮嗷嗷叫在线视频| 亚洲成人免费av在线播放| 中文字幕人妻丝袜制服| 正在播放国产对白刺激| 久久久久久人人人人人| 午夜亚洲福利在线播放| 男女高潮啪啪啪动态图| 伊人久久大香线蕉亚洲五| 久久久精品欧美日韩精品| 少妇的丰满在线观看| 91九色精品人成在线观看| 国产三级在线视频| 亚洲精华国产精华精| 国产成人啪精品午夜网站| 精品少妇一区二区三区视频日本电影| 99在线人妻在线中文字幕| 免费在线观看黄色视频的| 黑人操中国人逼视频| 波多野结衣av一区二区av| 欧美在线一区亚洲| av天堂久久9| 精品国产亚洲在线| 午夜福利免费观看在线| 国产成人啪精品午夜网站| 中文亚洲av片在线观看爽| 黄片小视频在线播放| 久久九九热精品免费| 99精品在免费线老司机午夜| 无遮挡黄片免费观看| 亚洲一码二码三码区别大吗| 精品第一国产精品| 波多野结衣高清无吗| 亚洲狠狠婷婷综合久久图片| 国产精品 欧美亚洲| 亚洲熟女毛片儿| 欧美黑人欧美精品刺激| 欧美日韩一级在线毛片| 午夜日韩欧美国产| 一a级毛片在线观看| www.www免费av| 怎么达到女性高潮| 黑人巨大精品欧美一区二区蜜桃| cao死你这个sao货| 最新美女视频免费是黄的| 每晚都被弄得嗷嗷叫到高潮| 日本a在线网址| 午夜成年电影在线免费观看| 18禁观看日本| 久久中文字幕人妻熟女| 成人18禁在线播放| 女人被躁到高潮嗷嗷叫费观| av在线天堂中文字幕 | 欧美精品亚洲一区二区| 黄色视频不卡| 自拍欧美九色日韩亚洲蝌蚪91| 手机成人av网站| 国产欧美日韩一区二区三| 99香蕉大伊视频| 久久精品国产综合久久久| 国产精品久久久av美女十八| 嫁个100分男人电影在线观看| 人妻丰满熟妇av一区二区三区| 欧美+亚洲+日韩+国产| 18禁美女被吸乳视频| 国产人伦9x9x在线观看| 久久国产乱子伦精品免费另类| 亚洲国产欧美一区二区综合| av国产精品久久久久影院| 好男人电影高清在线观看| 国产亚洲精品久久久久5区| 免费av中文字幕在线| 欧美日韩黄片免| 成人免费观看视频高清| 久久午夜综合久久蜜桃| 亚洲专区中文字幕在线| 最近最新免费中文字幕在线| 色综合婷婷激情| 精品一区二区三卡| 日韩大码丰满熟妇| 超碰成人久久| 亚洲精品国产精品久久久不卡| 国产精品亚洲av一区麻豆| 在线观看66精品国产| 亚洲精品国产精品久久久不卡| 久久草成人影院| 黑人巨大精品欧美一区二区mp4| 一二三四社区在线视频社区8| 亚洲欧美激情综合另类| 国产精品国产高清国产av| 国产成年人精品一区二区 | 男女做爰动态图高潮gif福利片 | 午夜久久久在线观看| 丰满饥渴人妻一区二区三| 欧美日韩中文字幕国产精品一区二区三区 | 精品国产乱码久久久久久男人| 丰满人妻熟妇乱又伦精品不卡| 纯流量卡能插随身wifi吗| 久久人妻熟女aⅴ| 亚洲情色 制服丝袜| 嫩草影视91久久| 久久中文字幕人妻熟女| 亚洲 欧美一区二区三区| 一级a爱片免费观看的视频| 国产精华一区二区三区| 9热在线视频观看99| 美女高潮喷水抽搐中文字幕| 夜夜夜夜夜久久久久| 国产精品98久久久久久宅男小说| 亚洲性夜色夜夜综合| 黄色丝袜av网址大全| 成人国产一区最新在线观看| 色精品久久人妻99蜜桃| 国产精品野战在线观看 | 国产在线精品亚洲第一网站| 丁香欧美五月| 久久这里只有精品19| 激情在线观看视频在线高清| 成在线人永久免费视频| 久久久久久久久免费视频了| 国产不卡一卡二| 在线观看免费午夜福利视频| 一边摸一边做爽爽视频免费| 精品免费久久久久久久清纯| xxxhd国产人妻xxx| 国产精品久久久人人做人人爽| 99香蕉大伊视频| 又黄又爽又免费观看的视频| 淫秽高清视频在线观看| 欧美丝袜亚洲另类 | av在线播放免费不卡| 一级作爱视频免费观看| 亚洲欧美日韩另类电影网站| 久久人妻熟女aⅴ| 高潮久久久久久久久久久不卡| 亚洲自拍偷在线| 两性夫妻黄色片| 又黄又粗又硬又大视频| 国产精品免费一区二区三区在线| 精品一区二区三区四区五区乱码| 色哟哟哟哟哟哟| 国产有黄有色有爽视频| 国产1区2区3区精品| 一边摸一边做爽爽视频免费| 一进一出好大好爽视频| 日本vs欧美在线观看视频| 精品高清国产在线一区| 他把我摸到了高潮在线观看| 美女 人体艺术 gogo| 亚洲欧美日韩另类电影网站| 性色av乱码一区二区三区2| 人人妻人人添人人爽欧美一区卜| 国产精品国产av在线观看| 桃色一区二区三区在线观看| 欧美一区二区精品小视频在线| 亚洲黑人精品在线| 黑人操中国人逼视频| 久久精品国产亚洲av香蕉五月| 国产成人av教育| 变态另类成人亚洲欧美熟女 | 成年女人毛片免费观看观看9| 精品一区二区三区视频在线观看免费 | 极品人妻少妇av视频| 在线观看66精品国产| 淫秽高清视频在线观看| 国产日韩一区二区三区精品不卡| 波多野结衣av一区二区av| 亚洲一卡2卡3卡4卡5卡精品中文| 夜夜看夜夜爽夜夜摸 | 一级毛片高清免费大全| 一进一出好大好爽视频| 亚洲精品国产一区二区精华液| 嫩草影视91久久| 一边摸一边抽搐一进一小说| 欧美日韩av久久| 国产免费现黄频在线看| 欧美最黄视频在线播放免费 | 成人国语在线视频| 精品人妻1区二区| 欧美精品一区二区免费开放| 精品少妇一区二区三区视频日本电影| 99国产精品一区二区蜜桃av| 久久国产亚洲av麻豆专区| 1024香蕉在线观看| 精品久久久久久成人av| 亚洲国产毛片av蜜桃av| x7x7x7水蜜桃| 黄色 视频免费看| 视频在线观看一区二区三区| 日韩精品中文字幕看吧| 黄频高清免费视频| 搡老熟女国产l中国老女人| 99精品欧美一区二区三区四区| 午夜老司机福利片| 一区二区三区国产精品乱码| 国产亚洲精品第一综合不卡| 叶爱在线成人免费视频播放| 免费观看精品视频网站| 黄片小视频在线播放| 熟女少妇亚洲综合色aaa.| 日本五十路高清| 亚洲一卡2卡3卡4卡5卡精品中文| 麻豆成人av在线观看| 18禁美女被吸乳视频| 色综合婷婷激情| 亚洲精品美女久久久久99蜜臀| 国产片内射在线| 精品一区二区三卡| 成人亚洲精品av一区二区 | 午夜成年电影在线免费观看| avwww免费| 成人国语在线视频| 婷婷精品国产亚洲av在线| 欧美人与性动交α欧美精品济南到| 久久国产精品影院| 亚洲国产欧美一区二区综合| 日韩精品中文字幕看吧| 久久中文字幕一级| 美国免费a级毛片| 美女高潮到喷水免费观看| 国产日韩一区二区三区精品不卡| av欧美777| 女人精品久久久久毛片| 亚洲精品在线观看二区| 极品人妻少妇av视频| 老熟妇仑乱视频hdxx| 国产成人影院久久av| 女性被躁到高潮视频| 日韩欧美免费精品| 好看av亚洲va欧美ⅴa在| 国产免费现黄频在线看| 久久国产亚洲av麻豆专区| 国产精品二区激情视频| 久久影院123| 欧美黑人精品巨大| 欧美日韩亚洲国产一区二区在线观看| 成人三级黄色视频| 中文字幕色久视频| 在线视频色国产色| 久久久精品国产亚洲av高清涩受| 色哟哟哟哟哟哟| 国产成人影院久久av| av免费在线观看网站| 男女下面插进去视频免费观看| 无限看片的www在线观看| 嫩草影院精品99| av国产精品久久久久影院| 国产成年人精品一区二区 | 久久香蕉国产精品| 亚洲精品av麻豆狂野| 人人妻人人爽人人添夜夜欢视频| 最近最新中文字幕大全电影3 | 麻豆成人av在线观看| 欧美在线一区亚洲| 国产精品国产高清国产av| 黄频高清免费视频| 欧美精品啪啪一区二区三区| 日日干狠狠操夜夜爽| 精品久久久精品久久久| 久久人妻熟女aⅴ| 成人永久免费在线观看视频| 天堂中文最新版在线下载| 日韩免费高清中文字幕av| 国产av精品麻豆| 精品国产国语对白av| 国产精品爽爽va在线观看网站 | 69精品国产乱码久久久| 国产成人欧美| 亚洲一卡2卡3卡4卡5卡精品中文| 午夜精品国产一区二区电影| 国产成人av教育| 伊人久久大香线蕉亚洲五| 国产欧美日韩综合在线一区二区| 黑人巨大精品欧美一区二区蜜桃| 免费在线观看亚洲国产| 女人高潮潮喷娇喘18禁视频| 久久久国产成人精品二区 | 男女高潮啪啪啪动态图| 亚洲成人国产一区在线观看| 久久 成人 亚洲| 天天影视国产精品| 国产欧美日韩一区二区精品| 黄网站色视频无遮挡免费观看| 色精品久久人妻99蜜桃| 国产精品免费视频内射| 午夜免费激情av| 激情视频va一区二区三区| 国产精品偷伦视频观看了| 天堂俺去俺来也www色官网| 国产成人影院久久av| 黄网站色视频无遮挡免费观看| 午夜免费激情av| 精品一区二区三区视频在线观看免费 | 亚洲精品国产一区二区精华液| 在线观看一区二区三区| 中文字幕最新亚洲高清| 99热只有精品国产| 夜夜躁狠狠躁天天躁| 久久精品影院6| 精品国内亚洲2022精品成人| 美女高潮到喷水免费观看| 99国产精品99久久久久| 亚洲性夜色夜夜综合| 一本大道久久a久久精品| 亚洲七黄色美女视频| 一边摸一边抽搐一进一出视频| 啪啪无遮挡十八禁网站| 在线观看免费视频日本深夜| 十八禁人妻一区二区| 精品一区二区三区视频在线观看免费 | 久久午夜综合久久蜜桃| 国产欧美日韩精品亚洲av| 免费在线观看日本一区| 嫩草影院精品99| 无限看片的www在线观看| 欧美成人性av电影在线观看| 亚洲色图av天堂| 夜夜爽天天搞| 动漫黄色视频在线观看| 成人黄色视频免费在线看| 午夜精品国产一区二区电影| 夜夜夜夜夜久久久久| 亚洲国产精品sss在线观看 | 国产三级在线视频| 精品久久蜜臀av无| 80岁老熟妇乱子伦牲交| 午夜免费鲁丝| 成在线人永久免费视频| 色婷婷久久久亚洲欧美| 国产精品久久视频播放| 12—13女人毛片做爰片一| 无人区码免费观看不卡| 亚洲欧美激情在线| 在线观看午夜福利视频| 亚洲成人久久性| 很黄的视频免费| 天天躁狠狠躁夜夜躁狠狠躁| 国产亚洲欧美精品永久| 亚洲激情在线av| 我的亚洲天堂| 亚洲av电影在线进入| 亚洲自偷自拍图片 自拍| 免费搜索国产男女视频| 丰满饥渴人妻一区二区三| 欧美日韩福利视频一区二区| 国产av在哪里看| 欧美中文日本在线观看视频| 国产免费av片在线观看野外av| 最新美女视频免费是黄的| 久久久水蜜桃国产精品网| 午夜日韩欧美国产| 99国产精品一区二区蜜桃av| 丰满饥渴人妻一区二区三| 欧美日韩福利视频一区二区| 国产三级在线视频| 日本三级黄在线观看| 他把我摸到了高潮在线观看| 亚洲精品av麻豆狂野| 天天添夜夜摸| 精品福利观看| 欧美色视频一区免费| 亚洲精品在线观看二区| 校园春色视频在线观看| 亚洲成av片中文字幕在线观看| 男男h啪啪无遮挡| 天堂中文最新版在线下载| 成人国产一区最新在线观看| 欧美丝袜亚洲另类 | 精品免费久久久久久久清纯| 国产精品免费视频内射| 欧美日韩福利视频一区二区| 波多野结衣av一区二区av| 多毛熟女@视频| 91精品三级在线观看| 色播在线永久视频| cao死你这个sao货| 欧美亚洲日本最大视频资源| 国产区一区二久久| 男女做爰动态图高潮gif福利片 | 久久精品国产综合久久久| 大型av网站在线播放| 中文亚洲av片在线观看爽| 99热国产这里只有精品6| 日韩成人在线观看一区二区三区| 国产高清国产精品国产三级| 国产一区二区三区综合在线观看| 一本大道久久a久久精品| 1024视频免费在线观看| 亚洲 国产 在线| 久久久久国产一级毛片高清牌| 一进一出好大好爽视频| 黄色毛片三级朝国网站| 国产成人精品久久二区二区91| 亚洲欧美激情在线| 老司机午夜十八禁免费视频| 国产高清激情床上av| 脱女人内裤的视频| 少妇裸体淫交视频免费看高清 | 成在线人永久免费视频| 欧美日韩瑟瑟在线播放| 亚洲色图 男人天堂 中文字幕| 乱人伦中国视频| 色综合欧美亚洲国产小说| 免费在线观看完整版高清| 窝窝影院91人妻| 男女之事视频高清在线观看| 一级黄色大片毛片| 精品无人区乱码1区二区| 一a级毛片在线观看| 人人妻人人添人人爽欧美一区卜| 极品教师在线免费播放| 一级a爱视频在线免费观看| 午夜精品久久久久久毛片777| 波多野结衣av一区二区av| 美女扒开内裤让男人捅视频| 黄色女人牲交| 99国产精品99久久久久| av网站免费在线观看视频| 12—13女人毛片做爰片一| 国产单亲对白刺激| 亚洲av美国av| 欧美 亚洲 国产 日韩一| 一区二区三区精品91| 女人高潮潮喷娇喘18禁视频| 法律面前人人平等表现在哪些方面| 日本黄色日本黄色录像| 欧美性长视频在线观看| 后天国语完整版免费观看| 涩涩av久久男人的天堂| 精品第一国产精品| 91成年电影在线观看| 777久久人妻少妇嫩草av网站| 亚洲人成电影免费在线| 日韩精品免费视频一区二区三区| 亚洲色图综合在线观看| 亚洲国产精品一区二区三区在线| 12—13女人毛片做爰片一| 精品久久蜜臀av无| 一二三四社区在线视频社区8| 不卡av一区二区三区| 青草久久国产| 国产三级在线视频| 欧美久久黑人一区二区| 性色av乱码一区二区三区2| 激情视频va一区二区三区| 亚洲成a人片在线一区二区| 婷婷六月久久综合丁香| 亚洲av片天天在线观看| 这个男人来自地球电影免费观看| 日本五十路高清| 亚洲欧洲精品一区二区精品久久久| 国产精品爽爽va在线观看网站 | 免费av中文字幕在线| 久久久久久久午夜电影 | 十八禁人妻一区二区| 神马国产精品三级电影在线观看 | 女生性感内裤真人,穿戴方法视频| 国产精品国产高清国产av| 午夜精品久久久久久毛片777| 精品一区二区三卡| 可以在线观看毛片的网站| 久久亚洲真实| 97碰自拍视频| 欧美大码av| 国产亚洲精品久久久久5区| 国产99白浆流出| 欧美一级毛片孕妇| 在线天堂中文资源库| 国产乱人伦免费视频| 在线观看日韩欧美| 亚洲国产看品久久| 99精品在免费线老司机午夜| 欧美激情高清一区二区三区| 妹子高潮喷水视频| 欧美另类亚洲清纯唯美| 久久精品影院6| 午夜激情av网站| 国产精品秋霞免费鲁丝片| 久久天堂一区二区三区四区| 亚洲av片天天在线观看| 男人的好看免费观看在线视频 | 国产日韩一区二区三区精品不卡| 日韩欧美免费精品| 悠悠久久av| √禁漫天堂资源中文www| 国产av精品麻豆| 超碰97精品在线观看| 国产激情久久老熟女| 亚洲狠狠婷婷综合久久图片| 动漫黄色视频在线观看| 成人三级做爰电影| 视频区欧美日本亚洲| 黄网站色视频无遮挡免费观看| 成年女人毛片免费观看观看9| 在线天堂中文资源库| 777久久人妻少妇嫩草av网站| 日本vs欧美在线观看视频| 88av欧美| 亚洲色图av天堂| 日韩一卡2卡3卡4卡2021年| 88av欧美| 欧美日韩av久久| 97超级碰碰碰精品色视频在线观看| 欧美老熟妇乱子伦牲交| 女性被躁到高潮视频| x7x7x7水蜜桃| 欧美黑人欧美精品刺激| 9热在线视频观看99| 免费不卡黄色视频| 国产精品二区激情视频| 欧美精品亚洲一区二区| 首页视频小说图片口味搜索| 国产黄a三级三级三级人| 一边摸一边做爽爽视频免费| 欧美一级毛片孕妇| 久久久久久大精品|