• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于協(xié)同訓(xùn)練的意圖分類優(yōu)化方法

    2019-05-07 07:50邱云飛劉聰
    現(xiàn)代情報 2019年5期

    邱云飛 劉聰

    摘 要:[目的/意義]針對單純使用統(tǒng)計自然語言處理技術(shù)對社交網(wǎng)絡(luò)上產(chǎn)生的短文本數(shù)據(jù)進行意向分類時存在的特征稀疏、語義模糊和標記數(shù)據(jù)不足等問題,提出了一種融合心理語言學(xué)信息的Co-training意圖分類方法。[方法/過程]首先,為豐富語義信息,在提取文本特征的同時融合帶有情感傾向的心理語言學(xué)線索對特征維度進行擴展。其次,針對標記數(shù)據(jù)有限的問題,在模型訓(xùn)練階段使用半監(jiān)督集成法對兩種機器學(xué)習分類方法(基于事件內(nèi)容表達分類器與情感事件表達分類器)進行協(xié)同訓(xùn)練(Co-training)。最后,采用置信度乘積的投票制進行分類。[結(jié)論/結(jié)果]實驗結(jié)果表明融入心理語言學(xué)信息的語料再經(jīng)過協(xié)同訓(xùn)練的分類效果更優(yōu)。

    關(guān)鍵詞:社交網(wǎng)絡(luò);意圖分類;心理語言學(xué);協(xié)同訓(xùn)練(Co-training)

    DOI:10.3969/j.issn.1008-0821.2019.05.008

    〔中圖分類號〕TP391 〔文獻標識碼〕A 〔文章編號〕1008-0821(2019)05-0057-07

    Abstract:[Purpose/Significance]Aiming at the problems of feature sparseness,semantic ambiguity and mark data insufficiency caused by using single statistical natural language processing technology for intention classification of short text data generated on social networks,a psycholinguistic information based Co-training intention classification method was proposed.[Method/Process]Firstly,in order to enrich the semantic information,the feature dimension was extended by extracting the features of the text while synthesizing the psycholinguistic clues with emotional tendencies.Secondly,aiming at the insufficiency of mark data,two machine learning classification methods(based on the event content expression classifier and the emotional event expression classifier)were used cooperatively for training the model. Finally,the classification was performed by using a voting system of confidence products.[Conclusion/Results]The experimental results show that,by adding psycholinguistic information into the corpus,the cooperative training could provide better classification results.

    Key words:social network;intention classification;psycholinguistic;Co-training

    隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們的生活、交流方式早已和社交網(wǎng)絡(luò)平臺緊緊聯(lián)系在一起。在日常生活中,用戶通過微博平臺發(fā)布簡短信息(例如,Twitter)來表達他們的需求和愿望[1],這會促使網(wǎng)絡(luò)平臺產(chǎn)生大量的用戶數(shù)據(jù)。從這些數(shù)據(jù)中挖掘用戶信息和潛在行為,將使公司企業(yè)或政府部門對用戶進行更準確的定位[2]。因此,正確識別用戶意圖并進行精準分類作為挖掘用戶潛在行為信息的子項目,具有重要意義。

    由于微博平臺對所發(fā)布信息的字數(shù)限制,以及用戶在表述時常使用不標準的習慣用語,使得微博信息常具有碎片化特征[3]。而這些碎片化的短文本數(shù)據(jù)往往不能獲得完整的上下文信息,導(dǎo)致提取出的特征稀疏,從而影響分類效果。同時,由于微博信息即時更新的特性[4],很難在一定時間內(nèi)獲取大量標記數(shù)據(jù),這使得完全依賴于人工標記數(shù)據(jù)的監(jiān)督學(xué)習沒有足夠的覆蓋范圍,無法取得良好的分類效果。鑒于以上兩點問題,如何利用有限的標記數(shù)據(jù)對這些碎片化信息進行高效地意圖分類是這項工作的主要挑戰(zhàn)。

    Hollerit B等人曾指出推文被認為是挖掘用戶意圖的重要來源[5]。因此,本文的研究將針對推文數(shù)據(jù),結(jié)合社會心理學(xué)信息進行特征維度擴展,并采用半監(jiān)督集成方法對少量標記數(shù)據(jù)和大量未標記數(shù)據(jù)進行協(xié)同訓(xùn)練,最終使用置信度乘積的投票制進行分類,以達到更優(yōu)的分類效果。

    目前,尚無研究試圖建立意圖推文的類別。為了建立意圖推文的分類,調(diào)研了大量的推文,并研究了京東、亞馬遜等網(wǎng)絡(luò)購物商城的分類模塊。這里提到購物商城分類的原因是:1)微博用戶在推文中表達的意圖通常與日常生活有關(guān),其中包含大量的生活用品信息;2)購物商城涵蓋廣泛的日常生活用品的優(yōu)惠活動。最后,通過整合兩大網(wǎng)絡(luò)商城的分類模塊,將意圖推文分為以下5類:

    購物(Goods):這個類別主要指商品、時尚和購物分享。它們結(jié)合在一起是因為它們都與商業(yè)意圖和服務(wù)相關(guān)。

    餐飲(Food):這個類別主要與食物、餐廳相關(guān)。通常用戶會在這一類中表示自己的饑餓程度或飲食需求。

    社交通信(Social):這一類別包括聊天、打電話以及發(fā)表個人情緒。這項意圖類別的研究可以了解用戶的心理情緒波動。

    智能互娛(Entertainment):包括娛樂、音樂、游戲等類別。由于它們同屬生活中的娛樂項目被統(tǒng)稱為智能互娛。

    戶外運動(Outside):主要指旅行、運動、看電影等外出行為。

    本文結(jié)構(gòu)安排如下:第一節(jié)指出意圖分類的研究現(xiàn)狀及相關(guān)工作;第二節(jié)介紹使用的關(guān)鍵技術(shù);第三節(jié)給出實驗過程及分析;第四節(jié)給出總結(jié),并對下一步工作進行展望。

    1 相關(guān)工作

    1.1 國內(nèi)外研究現(xiàn)狀

    用戶意圖分類屬自然語言處理范疇,是情感分析與短文本分類下的交叉模塊?,F(xiàn)階段國內(nèi)外對意圖分類的改進研究大致分為以下3種方式:

    一是改進分詞技術(shù)。國內(nèi)的葛達明使用表情符號、新詞與網(wǎng)絡(luò)流行詞語擴充了情感詞典,以達到更優(yōu)的分詞效果[6]。儲濤濤通過降低公有特征詞集的權(quán)重消除多義詞的影響,從而進行更精準的分詞[7]。

    二是改進模型訓(xùn)練中特征向量。對于特征項的改進又可進行如下細分。1)挖掘文本中潛在的表達情緒并結(jié)合語義、語境進行特征維度擴展。國內(nèi)的何炎祥等人將深度學(xué)習模型MCNN與基于表情符號的情感空間映射相結(jié)合,提高了分類能力[8]。Haibo Ding等人結(jié)合多種外部字典對詞語進行分類標注,基于人類需求類別對人類情感進行分類[9]。2)針對文本自身語法規(guī)則和特殊字符的維度擴展。國內(nèi)的趙文清等人提出了一種基于語義規(guī)則的方法,考慮程度副詞、否定詞和表情符號的褒貶分類對文本情感傾向的影響[10]。國外的Sudha Subramani等人使用具有卡方度量的TF-IDF方法作為特征選擇參數(shù),以提高分類精度[11]。3)結(jié)合外部社會行為信息進行的特征維度擴展。國內(nèi)的Wayne Xin Zhao等人從微博中抽取用戶的人口統(tǒng)計信息特征,并結(jié)合lexical-POS的文本特征進行意圖分類[12]。付博等人實現(xiàn)了跨社交平臺的信息關(guān)系連接,提高了意圖識別的效果[13]。國外的Hemant Purohit等人研究危機領(lǐng)域的意圖分類。他使用不同知識來源派生的模式集(類似于規(guī)則前項),來獲得在本地上下文之外的語義,以改善意圖分類的信息語境[14]。

    三是改進分類算法。國內(nèi)的江偉等人將提取的N-gram短語加入到循環(huán)神經(jīng)網(wǎng)絡(luò)詞嵌入層,再用帶注意機制的雙向循環(huán)神經(jīng)網(wǎng)絡(luò)進行學(xué)習分類[15]。Jinpeng Wang等人提出基于圖傳播的半監(jiān)督意圖分類,通過關(guān)鍵字與意圖推文間的正則化關(guān)系建立意向圖進行自學(xué)習(Self-training)[16]。

    以上研究從不同角度對意圖分類進行改進,為本文提供了重要的理論基礎(chǔ)。

    1.2 相關(guān)概念

    意圖推文:最早來自于Chen等人在論壇上關(guān)于意圖帖子定義的討論[17],以及Hollerit等人關(guān)于商業(yè)意圖推文的定義[5]。如果一個句子滿足以下3個條件,就稱這條推文為意圖推文:

    1)至少包含一個動詞;

    2)明確描述用戶執(zhí)行活動的意圖;

    3)以一種可以識別的方式。(Hollerit在研究商業(yè)意圖推文中表明,“可識別”在人工智能和模式識別領(lǐng)域意義為:能夠在一定時間內(nèi)做出決定[5])。

    短文本分類:短文本通常被定義為長度不超過160個字符的文本形式,如微博信息、手機短信、觀點評論等比較短的文本。自動化的短文本分類是一項具有挑戰(zhàn)性的任務(wù)[18-19],目的是自動對用戶輸入的短文本按照給定的分類體系進行分類輸出。短文本通常存在特征稀疏、不遵循語法規(guī)則以及規(guī)模巨大等問題[20],一般在文本預(yù)處理、模型的訓(xùn)練等環(huán)節(jié)中進行優(yōu)化和改進,以提高分類效果。意圖分類的核心問題就是如何對短文本進行高精度的自動分類。

    如圖1所示,短文本分類包括文本預(yù)處理、特征抽取、模型訓(xùn)練、分類預(yù)測等幾個主要環(huán)節(jié)。

    半監(jiān)督學(xué)習:半監(jiān)督學(xué)習是指不依賴外界交互的學(xué)習器,能夠自動地利用未標記數(shù)據(jù)和已標記數(shù)據(jù)來提升學(xué)習性能的學(xué)習方式[21]。在機器學(xué)習領(lǐng)域中,半監(jiān)督學(xué)習作為監(jiān)督學(xué)習和無監(jiān)督學(xué)習的結(jié)合產(chǎn)物,在只有少量標記數(shù)據(jù)集的問題上,對于減少數(shù)據(jù)標注代價、提高學(xué)習性能有重大意義。近年來,半監(jiān)督學(xué)習在分類方法上的研究越來越多。

    Co-training:它是目前分類任務(wù)中最常見的半監(jiān)督集成學(xué)習方法,又稱協(xié)同訓(xùn)練方法。在半監(jiān)督學(xué)習研究的早期,Blum等人提出兩個相互獨立且充分冗余的視圖通過協(xié)同訓(xùn)練方法可以提高分類性能[22]。它用已標記數(shù)據(jù)分別在兩個視圖上進行訓(xùn)練學(xué)習,再利用訓(xùn)練好的學(xué)習器對未標記數(shù)據(jù)進行分類預(yù)測,選取置信度較高的類別進行標記,然后將這些偽標記數(shù)據(jù)加入已有的標記數(shù)據(jù)集,重新對分類器進行訓(xùn)練,反復(fù)迭代至兩個學(xué)習器都不再更新為止。該方法為半監(jiān)督學(xué)習開辟了新的分支[23]。

    2 關(guān)鍵技術(shù)

    2.1 數(shù)據(jù)預(yù)處理

    對于有效分析,數(shù)據(jù)預(yù)處理是最重要的步驟,因為它消除了降低分類性能的噪聲。通過結(jié)合數(shù)據(jù)清洗、分詞、去停用詞以及詞語標準化(詞干、詞形還原等技術(shù))對數(shù)據(jù)進行預(yù)處理來獲得高質(zhì)量的信息。

    1)數(shù)據(jù)清洗:用戶在發(fā)布的推文中常會加入一些特殊字符,如“Emoji、@、*、&”等,推文中還會加入一些URL鏈接以及數(shù)字。在對數(shù)據(jù)進行分詞前,要將這些無用的噪聲數(shù)據(jù)剔除。

    2)分詞、去停用詞、標準化:首先,根據(jù)語法習慣,將文本內(nèi)容分成若干單詞。其次,刪除介詞、連詞、代詞等停用詞。例如:一個、他的、然而和因此。接下來,是詞語標準化(即詞形還原)。將單詞形式轉(zhuǎn)換為更有限的規(guī)范形式可以減少詞形對特征提取的影響,從而減少數(shù)據(jù)特征稀疏。

    2.2 特征提取

    特征提取階段是數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的最重要的步驟之一。為提高分類準確度,需提取出更有價值的特征。為解決推文數(shù)據(jù)文本內(nèi)容有限所導(dǎo)致的特征稀疏問題,需對文本數(shù)據(jù)進行特征維度擴展。在以下部分,分別討論了這項工作中使用的兩種不同提取技術(shù)。

    2.2.1 基于事件內(nèi)容的特征提取

    2.3 模型訓(xùn)練

    為解決標記數(shù)據(jù)集不足所導(dǎo)致的分類精度低的問題,提出使用兩種不同的分類器(事件內(nèi)容表達分類器和情感事件表達分類器)分別對已標記數(shù)據(jù)集進行學(xué)習訓(xùn)練的方法,再將兩種分類器進行協(xié)同訓(xùn)練,以獲得最終的分類模型。

    本文研究的意圖分類問題屬多元分類問題。在機器學(xué)習算法中,通常使用MNB(Multinomial Naive Bayes)、LinearSVC(Linear Support Vector Classifier)、KNN(K-Nearest Neighbour)等算法進行多元分類。因此,在分類模型選取上對比使用了以上多種多元分類算法。最終,在實驗驗證的基礎(chǔ)上,得出在事件內(nèi)容表達分類器的分類問題上使用LinearSVC分類器效果可以達到最優(yōu),在情感事件表達分類器上使用MNB算法效果最優(yōu)。

    2.3.1 事件內(nèi)容表達分類器

    在事件內(nèi)容表達分類器中,單獨考慮文本內(nèi)容自身所具有的特征,即使用基于文本內(nèi)容所提取的特征項進行訓(xùn)練。將經(jīng)過數(shù)據(jù)預(yù)處理后的已標記數(shù)據(jù)集傳入事件內(nèi)容表達分類器進行模型訓(xùn)練,訓(xùn)練過程中使用LinearSVC分類算法。

    2.3.2 情感事件表達分類器

    在情感事件表達分類器中,融合了社會心理語言學(xué)知識,即使用基于心理語言學(xué)所提取的特征項進行模型訓(xùn)練。訓(xùn)練過程中使用MNB分類算法。

    2.3.3 Co-training

    由于無監(jiān)督學(xué)習常用的方法是借助領(lǐng)域詞典進行分類,而領(lǐng)域詞典的構(gòu)建需要巨大的開銷,且適用領(lǐng)域范圍小,因此無監(jiān)督學(xué)習在文本分類問題上還沒有得到很顯著的成功。又因社交網(wǎng)絡(luò)數(shù)據(jù)的實時流動性,想要借助監(jiān)督學(xué)習獲取全部的標記數(shù)據(jù)進行分類,難度系數(shù)很大,且分類效果不佳。因此,本文選取了適合處理社交短文本數(shù)據(jù)的半監(jiān)督學(xué)習。近年來,半監(jiān)督的分類方法受到了越來越多的重視[23]。

    上文提出的兩類分類器,單獨使用時都只能表現(xiàn)出較弱的“學(xué)習能力”。因此,為使分類模型具有較高的泛化能力,并進一步提高分類的精度,本文提出使用半監(jiān)督學(xué)習與集成學(xué)習相融合的Co-training算法對上文提出的兩種分類方案進行結(jié)合。Co-training算法是最早出現(xiàn)的半監(jiān)督集成學(xué)習方法[22]。一般而言,通過集成學(xué)習,分類器的性能往往比只使用一個分類器要好[21]。下文對比實驗驗證,將兩類分類器進行協(xié)同訓(xùn)練可以得到更優(yōu)分類結(jié)果。本文采用的Co-training方法具體流程如圖2所示。

    2.3.4 置信度相乘的投票制

    在最終的分類決策上采用基于置信度相乘的投票方法。在使用兩種分類器預(yù)測得到相應(yīng)類別的置信度后,篩選滿足置信度閾值(≥0.5)的項,再將兩類分類器預(yù)測出的相同類別的置信結(jié)果做乘積運算,最終選取置信度乘積分數(shù)最高的類別作為分類的標簽。

    3 實驗設(shè)置

    3.1 實驗數(shù)據(jù)

    對于當前的研究,使用從推特社交平臺提取的推文數(shù)據(jù)。在意圖推文的識別和檢索問題上,采用了Riloff E等人提出的Bootstrapping方法[26]。實驗中共使用了兩類數(shù)據(jù)集確保實驗結(jié)果的真實有效性。第一類是2009下半年的推文數(shù)據(jù),從Jinpeng Wang論文中獲取的已標注的實驗數(shù)據(jù)集[15],該類數(shù)據(jù)集被有經(jīng)驗的標注者進行分類標注,共1 599條,將該類意圖推文數(shù)據(jù)作為已標注數(shù)據(jù)(EL,Labled Data)。第二類是通過網(wǎng)絡(luò)爬蟲技術(shù)爬取的用戶于2018年4月10號23時到24時發(fā)布的推文數(shù)據(jù),共23 601條,該類數(shù)據(jù)作為未標記數(shù)據(jù)(EU,Unlabeled Data)。

    3.2 實驗環(huán)境

    本實驗使用Python3.5版本,在Pycharm2018平臺進行算法實現(xiàn)。基于事件內(nèi)容表達分類器使用Spacy自然語言處理工具包對數(shù)據(jù)進行分詞、標準化等處理,通過調(diào)用Sklearn包中的機器學(xué)習算法SVC進行分類。SVC算法采用線性核函數(shù),通過對比最終的F1-score選取出參數(shù)C(C=1,2,5,10,20,100)的最優(yōu)取值。為確保兩種分類器的充分獨立性基于情感事件表達分類器使用NLTK自然語言處理工具包進行分詞、去停用詞以及標準化等工作,并將LIWC字典提取的特征項融入到文本特征項中,最后通過調(diào)用MNB算法進行分類。

    3.3 實驗步驟

    具體流程:

    1)將已標注數(shù)據(jù)EL采用3倍交叉驗證劃分成訓(xùn)練集和測試集,并將訓(xùn)練集作為兩種分類器的輸入,分別訓(xùn)練兩類分類器;

    2)將未標記數(shù)據(jù)EU分別放入兩類初步訓(xùn)練的分類器中,通過分類預(yù)測得出屬于不同類別的置信分數(shù),過濾掉不滿足置信度閾值的結(jié)果;

    3)在滿足置信度閾值的結(jié)果中,挑選兩種分類器預(yù)測的表示同一類別的置信分數(shù)進行乘積運算,最終采用得分最高的類別標記EU;

    4)將新標記的偽標記數(shù)據(jù)加入EL;

    5)使用最新的EL重新訓(xùn)練兩類分類器;

    6)如此迭代,直至達到最大迭代次數(shù)(I=30),生成最終分類器;

    7)讀取測試集,分別放入兩類分類器,對測試集進行分類預(yù)測,與真實值進行對比,進而求出分類器性能參數(shù)。

    通過實驗結(jié)果可以看出,已有的經(jīng)典算法在長數(shù)據(jù)集上分類表現(xiàn)較好,但在具有嚴重稀疏性的推文數(shù)據(jù)上表現(xiàn)不佳。表4結(jié)果進一步論證了本文算法在處理推文數(shù)據(jù)分類問題上的有效性。

    另外,圖4展示了本文算法在不同迭代次數(shù)下的表現(xiàn)能力。如圖4所示,經(jīng)過30次迭代后,F(xiàn)1-score達到0.84,此時Co-training算法表現(xiàn)最佳。此外,可以看到,迭代次數(shù)小于30時,分類情況并沒有單獨使用事件內(nèi)容表達分類器或情感事件表達分類器的效果好。這是因為實驗標記數(shù)據(jù)集很小、未標記數(shù)據(jù)集巨大,所以我們沒有足夠的數(shù)據(jù)來微調(diào)參數(shù)。但在實驗中我們可以找到一個最佳的停止標準,通過設(shè)定合理的迭代次數(shù)來進一步提高性能。

    4 結(jié)束語

    本文針對社交網(wǎng)絡(luò)所產(chǎn)生的短文本數(shù)據(jù)進行意圖分類的問題,提出了一種基于協(xié)同訓(xùn)練的意圖分類優(yōu)化方法。該方法將基于事件內(nèi)容表達分類器和基于情感事件表達分類器進行協(xié)同訓(xùn)練,并在情感事件表達分類器中融入社會心理學(xué)知識,結(jié)合LIWC字典進行特征維度的擴展,以解決數(shù)據(jù)稀疏性所造成的分類精度低的問題。通過實驗驗證,融入了心理語言學(xué)信息的特征項對模型訓(xùn)練有積極作用。在實驗中,我們分別評估了兩種分類器的獨自的分類性能,又分析了兩種分類器協(xié)同工作的效果,發(fā)現(xiàn)在只有少量標記數(shù)據(jù)集的情況下經(jīng)過Co-training學(xué)習后的分類器提高了單一分類器的分類能力。

    在今后的研究中,將從以下3個方面入手。一是嘗試在基于事件內(nèi)容表達分類器上融合從文本內(nèi)容中提取出的更多有用的特征項(如詞性、表情符號等),以使模型的訓(xùn)練效果更優(yōu)。二是嘗試找到一個更優(yōu)的調(diào)節(jié)迭代次數(shù)的方法,讓分類器可以自動適應(yīng)并設(shè)置迭代次數(shù)。三是針對細粒度分類問題的研究,即結(jié)合應(yīng)用領(lǐng)域知識研究特定領(lǐng)域的分類問題,使該研究課題更具有商業(yè)價值。

    參考文獻

    [1]薛春香,張玉芳.面向新聞領(lǐng)域的中文文本分類研究綜述[J].圖書情報工作,2013,57(14):134-139.

    [2]曹玖新,吳江林,石偉,等.新浪微博網(wǎng)信息傳播分析與預(yù)測[J].計算機學(xué)報,2014,37(4):779-790.

    [3]李伶俐.微博熱的冷思考——兼論微博碎片化的特征及影響[J].新聞愛好者,2011,(9):82-83.

    [4]楊亮,林原,林鴻飛.基于情感分布的微博熱點事件發(fā)現(xiàn)[J].中文信息學(xué)報,2012,26(1):84-90,109.

    [5]Hollerit B,Krll M,Strohmaier M.Towards Linking Buyers and Sellers:Detecting Commercial Intent on Twitter.In WWW,2013:629-632.

    [6]葛達明.基于微博平臺的中文情感分析技術(shù)的研究[D].沈陽:沈陽工業(yè)大學(xué),2017.

    [7]儲濤濤.微博用戶的興趣發(fā)現(xiàn)與意圖識別的研究與實現(xiàn)[D].北京:北京郵電大學(xué),2017.

    [8]何炎祥,孫松濤,牛菲菲,等.用于微博情感分析的一種情感語義增強的深度學(xué)習模型[J].計算機學(xué)報,2017,40(4):773-790.

    [9]Haibo Ding,Ellen Riloff.Human Needs Categorization of Affective Events Using Labeled and Unlabeled Data[C]//Proceedings of Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies(NAACL HLT),2018.

    [10]趙文清,侯小可,沙海虹.語義規(guī)則在微博熱點話題情感分析中的應(yīng)用[J].智能系統(tǒng)學(xué)報,2014,9(1):121-125.

    [11]Subramani Sudha,Vu Huy Quan,Wang Hua.Intent Classification Using Feature Sets for Domestic Violence Discourse on Social Media.In Preprint arXiv,2018:1804.03497.

    [12]Zhao X.W,Guo Y,He Y.We Know What You Want to Buy:A Demographic-based System for Product Recommendation on Microblogs.In KDD,2014:1935-1944.

    [13]付博,劉挺.社會媒體中用戶的隱式消費意圖識別[J].軟件學(xué)報,2016,27(11):2843-2854.

    [14]Hemant Purohit,Guozhu Dong,Valerie Shalin,et al.Intent Classification of Short-Text on Social Media.In IEEE,2015.

    [15]江偉,金忠.基于短語注意機制的文本分類[J].中文信息學(xué)報,2018,32(2):102-109,119.

    [16]Jinpeng Wang,Gao Cong,Wayne Xin Zhao,et al.Mining User Intents in Twitter:A Semi-Supervised Approach to Inferring Intent Categories for Tweets.In AAAI,2015.

    [17]Chen Z,Liu B,Hsu M.Identifying Intention Posts in Discussion Forums[C]//Proceedings of Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies(NAACL HLT),2013:1041-1050.

    [18]王仲遠,程健鵬,王海勛,等.短文本理解研究[J].計算機研究與發(fā)展,2016,53(2):262-269.

    [19]張群,王紅軍,王倫文.詞向量與LDA相融合的短文本分類方法[J].現(xiàn)代圖書情報技術(shù),2016,(12):27-35.

    [20]張倩,劉懷亮.一種基于半監(jiān)督學(xué)習的短文本分類方法[J].現(xiàn)代圖書情報技術(shù),2013,(2):30-35.

    [21]周志華.機器學(xué)習[M].北京:清華大學(xué)出版社,2016.

    [22]Blum A,Mitchell T.Combining Labeled and Unlabeled Data with Co-training[C]//Proceedings of the 7th Conference on Computational Learning Theory(COLT),2000:92-100.

    [23]蔡毅,朱秀芳,孫章麗,等.半監(jiān)督集成學(xué)習綜述[J].計算機科學(xué),2017,44(S1):7-13.

    [24]J W Pennebaker,R L Boyd,K Jordan.The Development and Psychometric Properties of Liwc2015,Tech.Rep.,2015.

    [25]James W Pennebaker,Roger J Booth,and Martha E Francis.Linguistic Inquiry and Word Count:LIWC2007.Austin,TX:Liwc.net,2007.

    [26]Riloff E,Wiebe J,Wilson T.Learning Subjective Nouns Using Extraction Pattern Bootstrapping[C]//Proceedings of Conference on Computational Natural Language Learning(CoNLL),2003:25-32.

    [27]徐禹洪,黃沛杰.基于優(yōu)化樣本分布抽樣集成學(xué)習的半監(jiān)督文本分類方法研究[J].中文信息學(xué)報,2017,31(6):180-189.

    (責任編輯:陳 媛)

    成人国产综合亚洲| 日韩精品青青久久久久久| 黄色女人牲交| 男女视频在线观看网站免费| 精品日产1卡2卡| 免费在线观看日本一区| 成年女人看的毛片在线观看| 88av欧美| 欧美xxxx黑人xx丫x性爽| 人妻久久中文字幕网| 国产熟女xx| 男人舔奶头视频| 亚洲精品国产精品久久久不卡| 高清毛片免费观看视频网站| 一本精品99久久精品77| 婷婷精品国产亚洲av| av国产免费在线观看| 国内毛片毛片毛片毛片毛片| 夜夜夜夜夜久久久久| 看黄色毛片网站| 12—13女人毛片做爰片一| 久久中文看片网| 久久久久久久精品吃奶| 久久伊人香网站| 国产精品一区二区三区四区免费观看 | 日本在线视频免费播放| 成年版毛片免费区| 午夜福利欧美成人| 最近最新中文字幕大全免费视频| 欧美成人免费av一区二区三区| 久久久久免费精品人妻一区二区| 亚洲成人中文字幕在线播放| 男女视频在线观看网站免费| 中文字幕最新亚洲高清| 午夜福利在线观看免费完整高清在 | 曰老女人黄片| 亚洲激情在线av| 在线观看午夜福利视频| 狂野欧美激情性xxxx| 国产综合懂色| 韩国av一区二区三区四区| 欧美日韩精品网址| 成人特级黄色片久久久久久久| 国内精品美女久久久久久| ponron亚洲| 午夜免费成人在线视频| 成人三级黄色视频| www日本黄色视频网| 久久久成人免费电影| 国产精品九九99| 狠狠狠狠99中文字幕| 一本一本综合久久| 99热这里只有是精品50| 午夜福利高清视频| 香蕉丝袜av| 亚洲成a人片在线一区二区| 亚洲午夜理论影院| 美女午夜性视频免费| 欧美成人性av电影在线观看| 亚洲第一电影网av| 三级国产精品欧美在线观看 | 中文字幕av在线有码专区| 国内少妇人妻偷人精品xxx网站 | 99视频精品全部免费 在线 | 日韩精品中文字幕看吧| 在线观看一区二区三区| 国产激情欧美一区二区| 久久精品人妻少妇| 嫩草影院精品99| 久久久久性生活片| 激情在线观看视频在线高清| 日本 av在线| 欧美黑人巨大hd| 高清在线国产一区| 夜夜看夜夜爽夜夜摸| 日本精品一区二区三区蜜桃| 久久久色成人| 香蕉久久夜色| 日韩欧美一区二区三区在线观看| 亚洲国产色片| 欧美日本视频| 久久精品aⅴ一区二区三区四区| 久久天躁狠狠躁夜夜2o2o| 高清在线国产一区| 男人舔女人的私密视频| 久久中文字幕人妻熟女| 午夜成年电影在线免费观看| av在线蜜桃| 床上黄色一级片| 国产美女午夜福利| 日韩精品中文字幕看吧| 天堂动漫精品| 99久久精品国产亚洲精品| 国产免费男女视频| 日韩欧美一区二区三区在线观看| 国产淫片久久久久久久久 | 日韩有码中文字幕| 国产亚洲精品av在线| 亚洲美女黄片视频| 欧美xxxx黑人xx丫x性爽| 日本一本二区三区精品| 欧美又色又爽又黄视频| 亚洲av第一区精品v没综合| 欧美日韩亚洲国产一区二区在线观看| 变态另类成人亚洲欧美熟女| 国产亚洲欧美在线一区二区| www国产在线视频色| 又黄又爽又免费观看的视频| 国产欧美日韩一区二区三| 桃红色精品国产亚洲av| 小蜜桃在线观看免费完整版高清| 婷婷精品国产亚洲av在线| 免费大片18禁| 成人18禁在线播放| 国产三级中文精品| 69av精品久久久久久| 欧洲精品卡2卡3卡4卡5卡区| 悠悠久久av| 久久久久久大精品| www.精华液| 日本黄色视频三级网站网址| 变态另类丝袜制服| 97超级碰碰碰精品色视频在线观看| 超碰成人久久| 99热只有精品国产| 日本黄色片子视频| 欧美不卡视频在线免费观看| 亚洲av美国av| 色视频www国产| 国产毛片a区久久久久| 色综合亚洲欧美另类图片| 久久午夜亚洲精品久久| 国产午夜精品论理片| 亚洲片人在线观看| 日韩高清综合在线| 91九色精品人成在线观看| 国产一区在线观看成人免费| 欧美色视频一区免费| 中文字幕高清在线视频| 色综合亚洲欧美另类图片| 1024手机看黄色片| 中文字幕av在线有码专区| 国产成人系列免费观看| 给我免费播放毛片高清在线观看| 国产熟女xx| 亚洲美女视频黄频| 亚洲色图 男人天堂 中文字幕| 波多野结衣巨乳人妻| 亚洲成人中文字幕在线播放| 又大又爽又粗| 欧美日本视频| 岛国视频午夜一区免费看| 熟女人妻精品中文字幕| 亚洲专区国产一区二区| 国产av不卡久久| 国产精品亚洲av一区麻豆| av天堂中文字幕网| 天堂√8在线中文| 日本撒尿小便嘘嘘汇集6| 国内精品一区二区在线观看| 国产成人福利小说| 欧美国产日韩亚洲一区| 欧美+亚洲+日韩+国产| 51午夜福利影视在线观看| 国产人伦9x9x在线观看| 亚洲精品一区av在线观看| 日韩av在线大香蕉| 国产精品永久免费网站| 老熟妇乱子伦视频在线观看| 最好的美女福利视频网| 19禁男女啪啪无遮挡网站| 亚洲精华国产精华精| 成年女人毛片免费观看观看9| 日日摸夜夜添夜夜添小说| 1000部很黄的大片| 香蕉av资源在线| 国产成人精品久久二区二区91| 老司机午夜十八禁免费视频| 免费在线观看日本一区| 亚洲人成网站在线播放欧美日韩| 色噜噜av男人的天堂激情| 男女之事视频高清在线观看| 国产精品美女特级片免费视频播放器 | 亚洲国产精品合色在线| 欧美在线黄色| 亚洲成人久久爱视频| 国内精品一区二区在线观看| 九九热线精品视视频播放| 精品日产1卡2卡| 国产一区二区三区视频了| 久久中文字幕人妻熟女| 免费在线观看日本一区| 久久婷婷人人爽人人干人人爱| 精品一区二区三区视频在线 | 五月伊人婷婷丁香| 亚洲人与动物交配视频| 在线观看免费视频日本深夜| 一个人免费在线观看电影 | 国产精品av久久久久免费| svipshipincom国产片| 日韩免费av在线播放| 国产精品久久久久久人妻精品电影| 亚洲在线观看片| 天天躁狠狠躁夜夜躁狠狠躁| 国产麻豆成人av免费视频| 成人国产综合亚洲| 琪琪午夜伦伦电影理论片6080| 亚洲男人的天堂狠狠| 国产精品综合久久久久久久免费| 成人国产综合亚洲| 久久久国产精品麻豆| 法律面前人人平等表现在哪些方面| 午夜福利高清视频| 国产精品 国内视频| 免费一级毛片在线播放高清视频| 日韩 欧美 亚洲 中文字幕| 好男人在线观看高清免费视频| 在线十欧美十亚洲十日本专区| 国产高清视频在线观看网站| 法律面前人人平等表现在哪些方面| 999久久久国产精品视频| 免费人成视频x8x8入口观看| 免费在线观看日本一区| 久久天堂一区二区三区四区| 亚洲人成伊人成综合网2020| 免费在线观看影片大全网站| 欧美xxxx黑人xx丫x性爽| 国产亚洲精品av在线| 国产私拍福利视频在线观看| 狂野欧美激情性xxxx| 人妻夜夜爽99麻豆av| 精品免费久久久久久久清纯| 看黄色毛片网站| 1024香蕉在线观看| 国产单亲对白刺激| 婷婷精品国产亚洲av在线| 男人的好看免费观看在线视频| 亚洲无线观看免费| 国产av不卡久久| 午夜成年电影在线免费观看| av国产免费在线观看| 操出白浆在线播放| 黑人巨大精品欧美一区二区mp4| 精品久久久久久久毛片微露脸| 国产高清三级在线| 久久99热这里只有精品18| x7x7x7水蜜桃| 每晚都被弄得嗷嗷叫到高潮| 男人的好看免费观看在线视频| 天天一区二区日本电影三级| 亚洲狠狠婷婷综合久久图片| 成人欧美大片| 美女高潮喷水抽搐中文字幕| svipshipincom国产片| 人人妻人人澡欧美一区二区| 国产精品美女特级片免费视频播放器 | 99国产综合亚洲精品| 国产又黄又爽又无遮挡在线| 国产高清激情床上av| 非洲黑人性xxxx精品又粗又长| 国产精品亚洲一级av第二区| 亚洲国产精品成人综合色| 国产伦精品一区二区三区四那| 久久婷婷人人爽人人干人人爱| 国产69精品久久久久777片 | 久久伊人香网站| 午夜福利18| 男人和女人高潮做爰伦理| 老熟妇乱子伦视频在线观看| 国产高清有码在线观看视频| 国产亚洲精品综合一区在线观看| 日韩欧美三级三区| 天堂影院成人在线观看| 久久精品夜夜夜夜夜久久蜜豆| 97超级碰碰碰精品色视频在线观看| 身体一侧抽搐| 欧美乱妇无乱码| 国产精品国产高清国产av| 亚洲av电影在线进入| 欧美一级a爱片免费观看看| 男人舔女人下体高潮全视频| 又爽又黄无遮挡网站| 国内少妇人妻偷人精品xxx网站 | 人人妻,人人澡人人爽秒播| 亚洲成av人片免费观看| 欧美日韩精品网址| 亚洲黑人精品在线| 少妇熟女aⅴ在线视频| 综合色av麻豆| 国产激情偷乱视频一区二区| 一二三四社区在线视频社区8| 丰满人妻熟妇乱又伦精品不卡| 亚洲欧美日韩无卡精品| e午夜精品久久久久久久| 日韩欧美 国产精品| 亚洲五月天丁香| 国产精品99久久久久久久久| 听说在线观看完整版免费高清| 91老司机精品| 国产精品免费一区二区三区在线| 伦理电影免费视频| 久久这里只有精品中国| 97超级碰碰碰精品色视频在线观看| 一区二区三区高清视频在线| 别揉我奶头~嗯~啊~动态视频| 亚洲中文字幕日韩| 男人的好看免费观看在线视频| 白带黄色成豆腐渣| 69av精品久久久久久| 国产午夜精品论理片| 久久久久久国产a免费观看| 国产成人av激情在线播放| 久久99热这里只有精品18| 桃色一区二区三区在线观看| 一二三四在线观看免费中文在| 久久久水蜜桃国产精品网| 别揉我奶头~嗯~啊~动态视频| 亚洲无线观看免费| 床上黄色一级片| 国产在线精品亚洲第一网站| 午夜免费观看网址| 最近最新中文字幕大全电影3| 草草在线视频免费看| 性欧美人与动物交配| 日韩精品青青久久久久久| 精品一区二区三区视频在线 | 亚洲国产欧洲综合997久久,| 欧美大码av| 国产蜜桃级精品一区二区三区| 成人亚洲精品av一区二区| 日韩成人在线观看一区二区三区| 老司机午夜福利在线观看视频| 国产野战对白在线观看| 桃色一区二区三区在线观看| 无遮挡黄片免费观看| 99热6这里只有精品| 亚洲成人久久性| 午夜精品在线福利| 欧美日韩黄片免| 久久久久九九精品影院| 欧美三级亚洲精品| 亚洲欧美日韩高清专用| 免费在线观看影片大全网站| 可以在线观看的亚洲视频| 身体一侧抽搐| 在线观看免费午夜福利视频| 大型黄色视频在线免费观看| 老司机午夜十八禁免费视频| 亚洲美女黄片视频| 精品久久蜜臀av无| 美女午夜性视频免费| 精品久久蜜臀av无| 国产精品香港三级国产av潘金莲| 色尼玛亚洲综合影院| 午夜a级毛片| 婷婷丁香在线五月| 国产高清激情床上av| 美女扒开内裤让男人捅视频| 国产主播在线观看一区二区| 日韩欧美国产在线观看| 五月玫瑰六月丁香| 一级毛片女人18水好多| 色综合站精品国产| 韩国av一区二区三区四区| 最近视频中文字幕2019在线8| 一级毛片高清免费大全| 一个人免费在线观看的高清视频| 91在线观看av| 亚洲欧美一区二区三区黑人| 精品福利观看| 日韩高清综合在线| 999精品在线视频| 欧美色视频一区免费| 1000部很黄的大片| 精品无人区乱码1区二区| 日韩欧美国产一区二区入口| 亚洲一区高清亚洲精品| 色噜噜av男人的天堂激情| 亚洲avbb在线观看| 国产精品久久久久久精品电影| 欧美国产日韩亚洲一区| 亚洲av免费在线观看| xxx96com| 国产三级黄色录像| 搡老熟女国产l中国老女人| av在线天堂中文字幕| 久久久久久久久中文| 一二三四社区在线视频社区8| 三级毛片av免费| 99久久久亚洲精品蜜臀av| 亚洲黑人精品在线| 亚洲av中文字字幕乱码综合| 精品国产三级普通话版| 毛片女人毛片| 中文资源天堂在线| 岛国视频午夜一区免费看| 成年女人毛片免费观看观看9| 精品一区二区三区视频在线观看免费| 亚洲欧美一区二区三区黑人| 国产欧美日韩精品一区二区| 国产精品久久久久久精品电影| 国产精品亚洲av一区麻豆| 精品不卡国产一区二区三区| 亚洲精品色激情综合| 老司机福利观看| 久久久久久人人人人人| 俺也久久电影网| 国内精品一区二区在线观看| 国内揄拍国产精品人妻在线| 欧美色欧美亚洲另类二区| 亚洲熟女毛片儿| 99国产精品一区二区蜜桃av| 免费在线观看视频国产中文字幕亚洲| 免费电影在线观看免费观看| 国产激情久久老熟女| 丁香欧美五月| 免费在线观看成人毛片| 人妻夜夜爽99麻豆av| 国产伦人伦偷精品视频| 国产亚洲精品综合一区在线观看| 精品国产三级普通话版| 中出人妻视频一区二区| 精品电影一区二区在线| 亚洲五月婷婷丁香| 在线a可以看的网站| 亚洲精品粉嫩美女一区| 国产成人啪精品午夜网站| 黄色 视频免费看| 久久天躁狠狠躁夜夜2o2o| 老司机在亚洲福利影院| 欧美日韩乱码在线| 好看av亚洲va欧美ⅴa在| 亚洲精品美女久久av网站| 午夜久久久久精精品| 国产免费av片在线观看野外av| 两人在一起打扑克的视频| 此物有八面人人有两片| 久99久视频精品免费| 午夜视频精品福利| 国模一区二区三区四区视频 | 99热只有精品国产| 最近最新中文字幕大全电影3| 一区福利在线观看| 久久久久国产一级毛片高清牌| 国产精品久久久久久久电影 | 色在线成人网| 精品欧美国产一区二区三| 国内精品美女久久久久久| 国产精品久久视频播放| 久久精品亚洲精品国产色婷小说| 亚洲av日韩精品久久久久久密| 成人欧美大片| 亚洲熟妇中文字幕五十中出| 色av中文字幕| 精品久久久久久,| 国产成人影院久久av| 亚洲欧美精品综合一区二区三区| 亚洲精品中文字幕一二三四区| 小蜜桃在线观看免费完整版高清| 97超视频在线观看视频| 老司机福利观看| 天天躁狠狠躁夜夜躁狠狠躁| 少妇的丰满在线观看| 久久久久亚洲av毛片大全| 99精品久久久久人妻精品| 国产高清视频在线播放一区| 亚洲人成电影免费在线| 国产99白浆流出| 欧美乱妇无乱码| 一区二区三区激情视频| 在线观看午夜福利视频| 午夜两性在线视频| 性色avwww在线观看| 日本黄色视频三级网站网址| 久久久久国内视频| 欧美日韩瑟瑟在线播放| cao死你这个sao货| 日韩精品中文字幕看吧| 国产精品精品国产色婷婷| 免费一级毛片在线播放高清视频| 男女床上黄色一级片免费看| 欧美xxxx黑人xx丫x性爽| 久久精品国产综合久久久| 亚洲av电影在线进入| 国产综合懂色| 久久中文看片网| 欧美大码av| 国产精品久久久人人做人人爽| 亚洲国产中文字幕在线视频| 18禁黄网站禁片免费观看直播| 特大巨黑吊av在线直播| 欧美在线黄色| 色av中文字幕| 在线观看一区二区三区| 亚洲欧美精品综合久久99| 村上凉子中文字幕在线| 婷婷丁香在线五月| 亚洲欧美日韩无卡精品| 91麻豆av在线| www日本黄色视频网| 欧美丝袜亚洲另类 | 成人高潮视频无遮挡免费网站| 免费观看人在逋| 国产伦在线观看视频一区| 欧美性猛交╳xxx乱大交人| 中文字幕高清在线视频| 久久精品综合一区二区三区| 美女被艹到高潮喷水动态| 亚洲精品国产精品久久久不卡| 亚洲av成人精品一区久久| 欧美午夜高清在线| 日本在线视频免费播放| 黄色女人牲交| 伦理电影免费视频| 一区福利在线观看| 亚洲男人的天堂狠狠| 国产又色又爽无遮挡免费看| 一卡2卡三卡四卡精品乱码亚洲| 美女午夜性视频免费| 特大巨黑吊av在线直播| 久久久久久人人人人人| 美女免费视频网站| 国产欧美日韩一区二区精品| 不卡一级毛片| 日本一二三区视频观看| 午夜福利在线观看免费完整高清在 | 观看美女的网站| 免费看光身美女| 搡老妇女老女人老熟妇| 成人高潮视频无遮挡免费网站| 国产成人精品久久二区二区91| 老熟妇乱子伦视频在线观看| 日本 欧美在线| 国产精品亚洲一级av第二区| 青草久久国产| 国产 一区 欧美 日韩| 久久久成人免费电影| 天堂影院成人在线观看| 国产黄a三级三级三级人| 国产欧美日韩精品一区二区| 午夜福利免费观看在线| 国产黄片美女视频| 非洲黑人性xxxx精品又粗又长| 久久精品国产亚洲av香蕉五月| 一区二区三区国产精品乱码| 夜夜爽天天搞| 又粗又爽又猛毛片免费看| 国产久久久一区二区三区| 九九热线精品视视频播放| 一级黄色大片毛片| 午夜激情福利司机影院| 欧美午夜高清在线| 波多野结衣巨乳人妻| 少妇裸体淫交视频免费看高清| 国内精品一区二区在线观看| 身体一侧抽搐| 99riav亚洲国产免费| 欧美日韩综合久久久久久 | 午夜福利18| 成人亚洲精品av一区二区| 午夜a级毛片| 日韩欧美国产在线观看| 十八禁网站免费在线| 一级毛片高清免费大全| 国内毛片毛片毛片毛片毛片| 欧美激情久久久久久爽电影| 亚洲五月天丁香| 精品一区二区三区视频在线观看免费| 国产淫片久久久久久久久 | 午夜精品久久久久久毛片777| 又粗又爽又猛毛片免费看| 国产成人欧美在线观看| 国产高清激情床上av| 真实男女啪啪啪动态图| 久久精品综合一区二区三区| 久久精品亚洲精品国产色婷小说| 免费搜索国产男女视频| 成年女人看的毛片在线观看| 国产麻豆成人av免费视频| 精品久久久久久,| 日本在线视频免费播放| 亚洲18禁久久av| 99国产精品99久久久久| 久久中文字幕一级| 国产精品99久久99久久久不卡| 欧美xxxx黑人xx丫x性爽| 亚洲 国产 在线| 亚洲欧洲精品一区二区精品久久久| 听说在线观看完整版免费高清| 欧美日韩黄片免| 国产激情久久老熟女| 亚洲性夜色夜夜综合| 国内精品美女久久久久久| www.精华液| 叶爱在线成人免费视频播放| 亚洲成人久久性| 国产av一区在线观看免费| 欧美日韩乱码在线| 国产爱豆传媒在线观看| svipshipincom国产片| 免费看美女性在线毛片视频| 亚洲一区二区三区色噜噜| 久久伊人香网站| 少妇裸体淫交视频免费看高清| ponron亚洲| 国产aⅴ精品一区二区三区波| 日本a在线网址| 欧美+亚洲+日韩+国产| 日本一本二区三区精品| 99久久无色码亚洲精品果冻| 国产三级在线视频| 怎么达到女性高潮| 久久天躁狠狠躁夜夜2o2o| 国产成人系列免费观看| 小蜜桃在线观看免费完整版高清|