• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    游客情感計(jì)算的文本大數(shù)據(jù)挖掘方法比較研究

    2020-08-17 07:55:18李君軼任濤陸路正
    關(guān)鍵詞:詞典機(jī)器向量

    李君軼 ,任濤 ,陸路正

    (1.陜西師范大學(xué)地理科學(xué)與旅游學(xué)院,陜西西安710119; 2.陜西省旅游信息科學(xué)重點(diǎn)實(shí)驗(yàn)室,陜西西安710119)

    0 引 言

    旅游是一種人際交往和情感交流活動(dòng),情感貫穿于旅游活動(dòng)的全過(guò)程?!扒楦惺侨藢?duì)客觀事物是否滿足自己需要而產(chǎn)生的態(tài)度體驗(yàn)”。游客情感是游客在旅游活動(dòng)中受個(gè)人因素或外部環(huán)境影響,對(duì)旅游活動(dòng)是否滿足個(gè)體的基本需求和社會(huì)需求而產(chǎn)生的愉快、興奮、悲傷、憤怒、后悔等情感體驗(yàn),并隨著旅游進(jìn)程呈現(xiàn)多樣性和易變性[1]。這些情感不僅構(gòu)成了游客重要的旅游經(jīng)歷,同時(shí)也對(duì)旅游動(dòng)機(jī)、滿意度、行為意圖和人際互動(dòng)等產(chǎn)生重要影響[2]。在旅游中,游客通過(guò)在線平臺(tái)和社交媒體獲取信息,分享自己的旅游體驗(yàn)。其發(fā)布的文本、圖像、音視頻成為旅游大數(shù)據(jù)的主要數(shù)據(jù)源[3],其中,文本內(nèi)容以其方便、簡(jiǎn)單、直觀、快捷和低門檻的特點(diǎn)為游客進(jìn)行情感表達(dá)和信息交流提供了便利,在旅游大數(shù)據(jù)中占有越來(lái)越重要的位置。通過(guò)對(duì)文本數(shù)據(jù)的挖掘,可為旅游規(guī)劃、市場(chǎng)營(yíng)銷等提供決策支持,使得旅游大數(shù)據(jù)中的情感分析成為旅游研究的熱點(diǎn)問(wèn)題[4]。

    情感分析就是對(duì)信息進(jìn)行有效的分析和挖掘,識(shí)別情感傾向[5]。MEDHAT 等[6]認(rèn)為,情感分析是文本挖掘領(lǐng)域的研究重點(diǎn),是對(duì)文本的計(jì)算處理。早期的情感分析主要是基于文本數(shù)據(jù)進(jìn)行詞語(yǔ)語(yǔ)義的情感傾向計(jì)算[7]和文本情感計(jì)算[8-9]。隨著研究的深入,情感分析更加精細(xì),出現(xiàn)了情感計(jì)算器[10]、情感摘要[11]、產(chǎn)品屬性挖掘[12]等研究。近年來(lái),隨著大數(shù)據(jù)的發(fā)展,國(guó)內(nèi)外已有許多情感分析模型和軟件,為情感研究提供了有力支持[13]。

    CHOI 等[14]利用文本數(shù)據(jù)研究了澳門旅游形象,并驗(yàn)證了“文本分析方法不僅可以進(jìn)行定性研究,而且可以進(jìn)行定量研究”;GOVERS 等[15]采用人工神經(jīng)網(wǎng)絡(luò)對(duì)7 個(gè)旅游目的地形象進(jìn)行了文本內(nèi)容分析。RADOJEVIC 等[16]利用歐洲 6 000 多家酒店的200 多萬(wàn)條在線評(píng)論數(shù)據(jù),使用情感分析方法,發(fā)現(xiàn)評(píng)論是影響酒店滿意度最顯著的因素;國(guó)內(nèi)學(xué)者主要通過(guò)ROST 系列軟件對(duì)文本進(jìn)行處理,對(duì)游客情感與行為互動(dòng)[17],游客情感與氣候舒適度相關(guān)性[18],居民、游客情感與空氣質(zhì)量相關(guān)性[19-20],目的地形象感知[21],出境旅游者情感特征[22],目的地品牌評(píng)價(jià)[23]和城市旅游社區(qū)形象感知[24]等領(lǐng)域進(jìn)行了研究。

    情感計(jì)算是對(duì)帶有情感的文本進(jìn)行分析,將其分為積極、消極等情感類型的過(guò)程[25]。如果將情感分為積極、中性、消極情感,則情感計(jì)算就是分類問(wèn)題;如果情感為具體的數(shù)值或者給定區(qū)間上的有序值(如1~5 分),那么通過(guò)回歸方法可計(jì)算情感值?;谖谋镜牧6炔町悾楦杏?jì)算實(shí)質(zhì)上可以視為詞語(yǔ)、短語(yǔ)、句子、篇章及多篇章的多等級(jí)層次[26]?,F(xiàn)有的游客情感研究中,主要采用高頻特征詞統(tǒng)計(jì)法、內(nèi)容分析軟件分析法、情感詞典分析法和機(jī)器學(xué)習(xí)等研究目的地形象[27-31]和不同目的地的形象差異[32]?;趦?nèi)容分析軟件的方法,是在高頻特征詞統(tǒng)計(jì)法和情感詞典的基礎(chǔ)上,通過(guò)編寫邏輯代碼,將分詞、詞頻統(tǒng)計(jì)、聚類、共現(xiàn)分析、同被引分析、語(yǔ)義網(wǎng)絡(luò)、共現(xiàn)矩陣等分析方法集成在一個(gè)軟件上,實(shí)現(xiàn)對(duì)文本的處理,常用的軟件有CATPAC Ⅱ、ICTCLAS、ROST 等。情感詞典分析法主要基于包含標(biāo)記的情感詞、情感短語(yǔ)和程度的一個(gè)或多個(gè)詞典,并結(jié)合程度副詞、否定詞和連詞以及句法結(jié)構(gòu)來(lái)構(gòu)建情感計(jì)算模型,進(jìn)行情感分析[33-34]。利用機(jī)器學(xué)習(xí)進(jìn)行游客情感計(jì)算,通過(guò)人工標(biāo)注一部分表達(dá)積極情感或消極情感的文本,用這些文本訓(xùn)練機(jī)器學(xué)習(xí)算法,獲得情感計(jì)算器,再通過(guò)此情感計(jì)算器對(duì)文本數(shù)據(jù)進(jìn)行積極情感和消極情感計(jì)算,最終給出具體分值0 或1,也可以給出文本的積極概率和消極概率。在機(jī)器學(xué)習(xí)中,常用邏輯回歸(logistic)、決策樹(shù)(decision tree)、支持向量機(jī)(SVM)等方法分析情感[35-37]。

    國(guó)內(nèi)外學(xué)者通過(guò)不同分析方法對(duì)游客的情感開(kāi)展研究,主要聚焦于目的地形象感知、滿意度等。國(guó)內(nèi)早期研究主要借助內(nèi)容分析軟件判斷文本的情感特征。之后有學(xué)者在情感詞典的基礎(chǔ)上,通過(guò)設(shè)計(jì)情感計(jì)算規(guī)則計(jì)算游客情感。隨著互聯(lián)網(wǎng)和人工智能技術(shù)的快速發(fā)展,已有學(xué)者基于文本大數(shù)據(jù),用機(jī)器學(xué)習(xí)方法進(jìn)行游客情感計(jì)算研究[35-37]。目前采用深度學(xué)習(xí)方法進(jìn)行游客情感計(jì)算的研究文獻(xiàn)還較少見(jiàn)[38],對(duì)不同方法進(jìn)行比較研究的文獻(xiàn)更是少之又少,幾乎空白。本文通過(guò)對(duì)現(xiàn)有情感計(jì)算方法的分析歸納,總結(jié)基于情感詞典和基于機(jī)器學(xué)習(xí)方法的通用技術(shù)范式,通過(guò)對(duì)比分析各種方法的優(yōu)劣,探索深度學(xué)習(xí)在游客情感計(jì)算中的應(yīng)用,為后續(xù)研究提供技術(shù)指引。

    1 游客情感計(jì)算的不同范式

    1.1 基于情感詞典的游客情感計(jì)算

    基于情感詞典對(duì)游客情感進(jìn)行計(jì)算是對(duì)人類大腦處理情感問(wèn)題的簡(jiǎn)單模擬,類似于人類大腦對(duì)情感處理的路徑(見(jiàn)圖1)。

    1.1.1 情感詞典的構(gòu)建

    情感詞典的構(gòu)建非常重要,直接影響計(jì)算效果[39]。情感詞典主要包括基礎(chǔ)情感詞典、表情詞詞典、語(yǔ)氣詞詞典、特殊標(biāo)識(shí)符詞典等8 個(gè)詞典。為了得到更加完整的情感詞典,需要不斷收集情感詞和相關(guān)語(yǔ)料進(jìn)行擴(kuò)建,如加入旅游專用詞匯,有針對(duì)性地去雜、分類、更新,以提高情感計(jì)算的準(zhǔn)確率。除了人工擴(kuò)建情感詞典外[39],還可通過(guò)自動(dòng)或半自動(dòng)方法進(jìn)行擴(kuò)建[10]。情感詞典一般有2 種應(yīng)用,一種是以情感詞典為基礎(chǔ)設(shè)計(jì)軟件,通過(guò)軟件對(duì)文本進(jìn)行情感詞抽取,根據(jù)軟件中定義的語(yǔ)法規(guī)則和算法計(jì)算文本情感值,典型的有ROST[40]和MBEWC[41]。另一種是以情感詞典為基礎(chǔ)設(shè)計(jì)情感計(jì)算規(guī)則,通過(guò)邏輯/算法編程開(kāi)展情感計(jì)算。目前以第一種應(yīng)用為主。

    圖1 基于情感詞典的游客情感計(jì)算過(guò)程Fig.1 Tourist emotion classification process based on emotional dictionary

    1.1.1.1 基礎(chǔ)情感詞典

    基于情感詞典的情感計(jì)算技術(shù)發(fā)展至今,已積累了不少的情感詞典資源。英文詞典主要有g(shù)eneral inquirer,LIWC,WordNet 等。中文詞典主要有《知網(wǎng)詞典》(HowNet)、《同義詞詞林》《臺(tái)灣大學(xué)中文情感詞典》(NTUSD)[42]、張偉等[44]編著的《學(xué)生褒貶義詞典》、史繼林等[45]編著的《褒義詞詞典》等。

    在基礎(chǔ)情感詞典中,程度副詞、否定詞和連詞對(duì)情感傾向有不同的影響,應(yīng)根據(jù)實(shí)際情況區(qū)別對(duì)待。程度副詞對(duì)情感傾向有加強(qiáng)或減弱作用,是影響情感計(jì)算的重要因素。比如,“我來(lái)西安玩,非常高興”,其中“非?!弊鳛槌潭雀痹~,對(duì)于“高興”的情感程度起到了加強(qiáng)作用。否定詞能使句子的情感傾向發(fā)生反轉(zhuǎn),是十分重要的情感計(jì)算判斷依據(jù)。例如,“我不喜歡西安”中的否定詞“不”就是對(duì)“喜歡”的否定,整個(gè)句子由正向情感變?yōu)榱素?fù)向情感。連詞用來(lái)連接段落、句子、短語(yǔ)、詞語(yǔ)等,在句子中表達(dá)不同的邏輯關(guān)系,可分為并列連詞、遞進(jìn)連詞和轉(zhuǎn)折連詞等,其中并列連詞在句子情感傾向上是相同的,如“和”“同”等,而轉(zhuǎn)折連詞是相反的,如“雖然”“但是”等。

    在基于情感詞典的情感計(jì)算過(guò)程中,情感詞典的質(zhì)量決定了其計(jì)算效果,為了提高詞典質(zhì)量,學(xué)者們還構(gòu)建了表情詞詞典、語(yǔ)氣詞詞典、特殊標(biāo)識(shí)符詞典、停用詞詞典等粒度更細(xì)的輔助詞典,以進(jìn)一步提高情感計(jì)算準(zhǔn)確率。

    1.1.1.2 旅游情感詞典

    基礎(chǔ)情感詞典具有普適性,但不包含旅游的專業(yè)詞匯,無(wú)法準(zhǔn)確獲取游客“非慣常環(huán)境下”的情感,因此,構(gòu)建旅游專屬情感詞典是游客情感研究的一項(xiàng)重要基礎(chǔ)工作。于靜[46]較早就開(kāi)展了旅游專屬詞典構(gòu)建的研究,她從所收集的微博大數(shù)據(jù)中,經(jīng)分詞和詞頻統(tǒng)計(jì)共得到92 230 個(gè)詞,通過(guò)人工判斷方法篩選出帶有情感色彩的詞匯,共得到情感詞、程度副詞和否定詞2 661 個(gè),并將其分別劃歸到情感詞詞典、語(yǔ)氣詞詞典、程度副詞詞典、否定詞詞典和特殊符號(hào)詞典5個(gè)詞典中。劉逸等[22,34]以HowNet 為基礎(chǔ)詞庫(kù),采用人工閱讀篩選方式,從獲得的大量游記、評(píng)論數(shù)據(jù)中,通過(guò)人工方式提取游客情感高頻詞,共包含317 個(gè)正面詞匯和185 個(gè)負(fù)面詞匯,之后對(duì)HowNet 進(jìn)行修正,構(gòu)建了旅游專屬詞典。毛超群[39]從“馬蜂窩”“窮游網(wǎng)”等目前國(guó)內(nèi)較知名的在線旅游社交網(wǎng)站中人工挑選當(dāng)前使用較頻繁的網(wǎng)絡(luò)情感詞,構(gòu)成網(wǎng)絡(luò)情感詞典,并與HowNet 和《情感詞匯本體》合并,構(gòu)成旅游專屬詞典。

    1.1.2 情感計(jì)算規(guī)則

    基于情感詞典的情感計(jì)算,核心是情感權(quán)重及情感計(jì)算規(guī)則,情感權(quán)重可由賦值得到,如積極情感詞語(yǔ)賦予權(quán)重1,消極情感詞語(yǔ)賦予權(quán)重-1,程度副詞賦予權(quán)重2 或者-2 等;情感計(jì)算規(guī)則根據(jù)程度副詞、否定詞、連詞、表情詞、語(yǔ)氣詞等所在位置進(jìn)行設(shè)計(jì),如圖2 所示。

    圖2 情感計(jì)算規(guī)則舉例Fig.2 Examples of emotional computing rule

    圖2 中,假設(shè)積極情感詞語(yǔ)與消極情感詞語(yǔ)的權(quán)重相等,實(shí)際操作中不同詞語(yǔ)的情感權(quán)重賦值由人工逐個(gè)確定;另外,否定詞由情感計(jì)算結(jié)果與人工情感判定結(jié)果的差異決定,當(dāng)取值為-0.8 時(shí),基于情感詞典的旅游文本情感計(jì)算結(jié)果與人工判定結(jié)果之間的相對(duì)差異最小。在分詞后,如果是情感詞典中的積極情感詞語(yǔ)或消極情感詞語(yǔ),則權(quán)重相加;如果是否定詞則賦予負(fù)值,若為程度副詞則情感值翻倍。最后由權(quán)重和計(jì)算規(guī)則計(jì)算句子的情感值,以總情感值的正負(fù)來(lái)判斷句子是積極情感還是消極情感。在設(shè)計(jì)情感計(jì)算規(guī)則時(shí),如果所有的積極情感詞語(yǔ)和消極情感詞語(yǔ)在權(quán)重上相等,會(huì)導(dǎo)致分類結(jié)果不精確,例如“恨”要比“討厭”在情感上更為負(fù)向;同樣,對(duì)于否定詞和程度副詞的權(quán)重處理,如果只是一個(gè)簡(jiǎn)單的反轉(zhuǎn)或加倍,也會(huì)影響計(jì)算的精確性,比如“非常喜歡”顯然比“挺喜歡”程度更深。修正方法是區(qū)別對(duì)待每個(gè)詞語(yǔ),賦予不同的值。為此,在構(gòu)建情感詞典初期,需要根據(jù)經(jīng)驗(yàn)對(duì)詞典中每個(gè)詞人工設(shè)置權(quán)值,然后按照計(jì)算規(guī)則,通過(guò)情感詞典中匹配的權(quán)重計(jì)算情感值。

    1.2 基于機(jī)器學(xué)習(xí)的游客情感計(jì)算范式

    基于機(jī)器學(xué)習(xí)開(kāi)展的游客情感計(jì)算多采用監(jiān)督學(xué)習(xí)的方法,意味著需要人工為文本數(shù)據(jù)標(biāo)注“積極”和“消極”的分類標(biāo)簽以構(gòu)建訓(xùn)練數(shù)據(jù)集,通過(guò)人工提取某些特征值,計(jì)算機(jī)可根據(jù)訓(xùn)練集學(xué)習(xí)模型輸出結(jié)果(見(jiàn)圖3)。

    1.2.1 文本向量化

    用計(jì)算機(jī)處理文本,須將文本數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)能理解的語(yǔ)言。文本向量化就是將文本表示成一系列計(jì)算機(jī)可以識(shí)別且可以表達(dá)文本語(yǔ)義的數(shù)值向量,有詞向量和句向量2 種。目前大部分對(duì)文本向量化的研究都是通過(guò)詞向量實(shí)現(xiàn)的。詞袋(bag of words)模型是最早以詞為最小處理單元的文本向量化方法,產(chǎn)生的向量與詞出現(xiàn)的順序無(wú)關(guān),與頻率有關(guān)。詞袋模型不包含任何語(yǔ)義信息,只是將詞語(yǔ)符號(hào)化,該方法簡(jiǎn)單易行,但存在維度災(zāi)難、語(yǔ)義鴻溝和無(wú)法保留詞序信息的問(wèn)題。如“我喜歡這個(gè)地方”和“我討厭這個(gè)地方”,兩句話的特征詞為“我、喜歡、討厭、這個(gè)、地方”,文本向量如表1 所示。

    圖3 基于機(jī)器學(xué)習(xí)的游客情感計(jì)算過(guò)程Fig.3 Tourist emotion classification process based on machine learning

    表1 文本向量化舉例Table 1 Examples of text vectorization

    1.2.2 特征提取與選擇

    文本由篇、段、句、詞、字構(gòu)成,詞語(yǔ)作為中文文本中最小的語(yǔ)義單元,可以被定義為文本向量化中的特征,這些特征組合起來(lái)就表達(dá)了句子語(yǔ)義。對(duì)于中文文本來(lái)說(shuō),《新華字典》收錄了52 萬(wàn)個(gè)詞語(yǔ),常用詞語(yǔ)達(dá)5.6 萬(wàn)個(gè),而在游客情感計(jì)算研究涉及的文本大數(shù)據(jù)中,所使用的旅游專業(yè)詞語(yǔ)數(shù)量不少,因此,構(gòu)造的特征向量往往會(huì)引起維度災(zāi)難并浪費(fèi)存儲(chǔ)空間。為避免文檔向量維度過(guò)高引起向量矩陣稀疏問(wèn)題,不能簡(jiǎn)單地將文檔中所有的詞語(yǔ)都作為特征,而應(yīng)該在文本向量化的同時(shí)提取特征,進(jìn)行有效特征選擇。

    以文本分詞為例經(jīng)詞袋模型向量化后,得到一個(gè)數(shù)量龐大的詞袋,詞袋中有多少個(gè)詞,此向量就有多大維度,然后把這些向量交與計(jì)算機(jī)計(jì)算(不需要文本),向量中的數(shù)字表示每個(gè)詞的權(quán)重,代表這個(gè)詞對(duì)文本的影響程度。其中需要解決如何計(jì)算權(quán)重、如何將詞袋縮小、如何降低向量維度問(wèn)題,特征提取與選擇就是為了解決此3 個(gè)問(wèn)題。需要說(shuō)明的是,去停用詞一定程度上也是給特征向量降維。

    目前機(jī)器學(xué)習(xí)常用的特征提取與選擇算法有:詞頻-逆文本頻率指數(shù)(term frequency-inverse document frequency,TF-IDF)、信息增益(kullbackleibler divergence,KLIC) 、互 信 息 (mutual information,MI)、卡方檢驗(yàn)(Chi-square test)。TFIDF 是一種常用的加權(quán)統(tǒng)計(jì)模型,用于評(píng)估單詞對(duì)文件集或語(yǔ)料庫(kù)中的某個(gè)文件的重要程度。在具體應(yīng)用中,以 python 的 scikit-learn 為例,TF-IDF 權(quán)重計(jì)算方法主要有2類 :CountVectorizer 和TfidfTransformer,CountVectorizer 會(huì)將文本中的詞語(yǔ)轉(zhuǎn)換為詞頻矩陣,TfidfTransformer 用于統(tǒng)計(jì)vectorizer 中每個(gè)詞語(yǔ)的 TF-IDF 值。

    1.2.3 模型選擇和模型訓(xùn)練

    模型選擇和模型訓(xùn)練是根據(jù)輸入集建立并選擇合適分類算法的系統(tǒng)過(guò)程。機(jī)器學(xué)習(xí)的算法選擇一般有2 種:(1)對(duì)所有的算法進(jìn)行研究測(cè)試,形成適用于旅游文本大數(shù)據(jù)和游客情感計(jì)算特定情境的分類模型,過(guò)程比較長(zhǎng),而且需要花費(fèi)大量時(shí)間和人力;(2)查閱編程語(yǔ)言的說(shuō)明文檔,以前人研究成果為基礎(chǔ),從中尋找合適的分類模型,并經(jīng)實(shí)際測(cè)試不斷優(yōu)化,最終形成適合旅游文本大數(shù)據(jù)和特定情境的旅客情感計(jì)算模型,其過(guò)程較長(zhǎng),人力投入也較大。以python 語(yǔ)言為例,以工具包scikit-learn 算法選擇路徑圖,將機(jī)器學(xué)習(xí)算法分為分類(classification)、聚類(clustering) 、 降 維(dimensionality reduction)、回 歸(regression)四大類。

    模型選擇是機(jī)器學(xué)習(xí)過(guò)程中一個(gè)重要步驟,但由于模型的參數(shù)未知,要想得到最佳參數(shù),使模型可以準(zhǔn)確地描述自變量和因變量的變化情況,就需要用已標(biāo)注情感類型的數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練和度量。已標(biāo)注情感類型的數(shù)據(jù)集一般分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。如果有一個(gè)大的標(biāo)注數(shù)據(jù)集,那么可通過(guò)隨機(jī)抽樣獲得這3 種數(shù)據(jù)集,在只有1 萬(wàn)條或者更少數(shù)據(jù)的情況下,三者的比例一般為8∶1∶1,當(dāng)數(shù)據(jù)量為100 萬(wàn)條及以上時(shí),三者的比例一般為98∶1∶1。確定模型后,用訓(xùn)練集訓(xùn)練模型的普通參數(shù),訓(xùn)練完成后,用驗(yàn)證集驗(yàn)證模型,最后用測(cè)試集測(cè)試模型的準(zhǔn)確率,完成模型的訓(xùn)練過(guò)程,在此過(guò)程中不斷優(yōu)化參數(shù),得到最優(yōu)參數(shù)分類模型。在具體應(yīng)用中,因?qū)?shù)據(jù)集進(jìn)行人工情感標(biāo)記工作量較大,在特定領(lǐng)域,當(dāng)已標(biāo)注的數(shù)據(jù)集數(shù)據(jù)不充分時(shí),一般可將數(shù)據(jù)集拆分為訓(xùn)練集和測(cè)試集兩種,在訓(xùn)練集上訓(xùn)練和擬合模型,在測(cè)試集上評(píng)估模型效果。

    基于機(jī)器學(xué)習(xí)的游客情感計(jì)算,其核心工作是文本數(shù)據(jù)的向量化、特征選擇、降維及分類模型選擇。每一步都有多種選擇,不同方法的組合會(huì)產(chǎn)生不同的情感計(jì)算模型,通過(guò)對(duì)文本向量化特征及模型選擇的優(yōu)化,不斷提高情感計(jì)算的準(zhǔn)確率,經(jīng)多次優(yōu)化形成更優(yōu)模型。該方法與基于情感詞典的游客計(jì)算方法相類似。

    1.3 基于深度學(xué)習(xí)的游客情感計(jì)算

    深度學(xué)習(xí)在大數(shù)據(jù)TB 級(jí)別上性能卓越,并被廣泛應(yīng)用于認(rèn)知模型?;谏疃葘W(xué)習(xí)進(jìn)行游客情感計(jì)算,即使用不同的人工神經(jīng)網(wǎng)絡(luò)模型,將文本大數(shù)據(jù)映射到向量空間得到詞語(yǔ)的數(shù)值表示,再將用數(shù)值表示的這些詞語(yǔ)輸入深度學(xué)習(xí)模型,通過(guò)對(duì)模型的訓(xùn)練和參數(shù)優(yōu)化獲得最優(yōu)模型。其過(guò)程與基于機(jī)器學(xué)習(xí)的情感計(jì)算大致相同,只是在文本向量化時(shí)對(duì)文本的特征提取和分類模型的選擇與機(jī)器學(xué)習(xí)不同。

    1.3.1 文本表示及特征選擇(詞向量表示)

    人工神經(jīng)網(wǎng)絡(luò)只能接受數(shù)值輸入,不能將一個(gè)單詞作為字符串輸入,為了使深度學(xué)習(xí)模型能夠處理文本數(shù)據(jù),首先需將自然語(yǔ)言表示為模型能識(shí)別的數(shù)值向量。自然語(yǔ)言文本已從基于規(guī)則方法表示發(fā)展到基于統(tǒng)計(jì)方法的演變,基于統(tǒng)計(jì)方法表示得到的模型稱為統(tǒng)計(jì)語(yǔ)言模型。統(tǒng)計(jì)語(yǔ)言模型因其基于統(tǒng)計(jì)的思想,不考慮自然語(yǔ)言的時(shí)序特點(diǎn),易出現(xiàn)維度災(zāi)難及詞語(yǔ)相似性、模型泛化能力低、模型性能不高等問(wèn)題。如何使“詞表示”包含語(yǔ)義信息,且能更好地解決上述問(wèn)題,就需要找到一種向量化單詞的方式,這種“詞向量”的每個(gè)維度均可對(duì)該單詞的不同屬性進(jìn)行編碼。word2vec 基于簡(jiǎn)單化的淺層人工神經(jīng)網(wǎng)絡(luò),根據(jù)給定的大量語(yǔ)料庫(kù),通過(guò)訓(xùn)練和優(yōu)化模型得到訓(xùn)練結(jié)果——詞向量,此詞向量可以快速有效地將一個(gè)詞語(yǔ)表達(dá)成數(shù)值向量,并且能很好地度量詞與詞之間的相似性,從而表示該單詞的不同屬性。

    Word2vec 實(shí)際上包含詞袋(CBOW)和Skipgram 模型。CBOW 根據(jù)上下文預(yù)測(cè)當(dāng)前詞語(yǔ),Skip-gram 根據(jù)當(dāng)前詞語(yǔ)預(yù)測(cè)上下文。這兩種模型均以人工神經(jīng)網(wǎng)絡(luò)為算法,最初每個(gè)單詞都是一個(gè)隨機(jī)N維向量,經(jīng)過(guò)訓(xùn)練獲得每個(gè)單詞的最優(yōu)數(shù)值向量,即從訓(xùn)練語(yǔ)料的一大堆句子中選出不重復(fù)的單詞進(jìn)行建模,輸出唯一的向量。word2vec 模型將數(shù)據(jù)集中的句子作為輸入,并以一個(gè)固定窗口在句子中滑動(dòng),根據(jù)句子上下文預(yù)測(cè)固定窗口中詞的輸出概率,通過(guò)損失函數(shù)和優(yōu)化方法對(duì)模型進(jìn)行訓(xùn)練。word2vec 模型的輸出被稱為嵌入矩陣,此嵌入矩陣中包含訓(xùn)練集每個(gè)詞的向量,且數(shù)據(jù)量很大。CBOW 較適合小規(guī)模語(yǔ)料,而Skip-Gram 在大型語(yǔ)料中表現(xiàn)更好。在具體應(yīng)用中,用word2vec 模型對(duì)文本進(jìn)行詞向量化,一般通過(guò)TensorFlow、Keras、PyTorch、 Caffe、 Microsoft Cognitive Toolkit、Theano、Apache MXnet、DeepLearning4J 等 深 度學(xué)習(xí)框架實(shí)現(xiàn)。

    1.3.2 深度學(xué)習(xí)模型構(gòu)建

    經(jīng)word2vec 模型,得到人工神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)——數(shù)值向量。文本數(shù)據(jù)屬于時(shí)間序列數(shù)據(jù),每個(gè)詞語(yǔ)的出現(xiàn)都依賴于其前一詞語(yǔ)和后一詞語(yǔ),正是這種依賴的存在,大多情況下采用循環(huán)神經(jīng)網(wǎng)絡(luò)。

    1.3.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)

    循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)結(jié)構(gòu)與一般神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不同,一般神經(jīng)網(wǎng)絡(luò)通常由輸入層、隱藏層和輸出層三部分組成,隱藏層可能有多個(gè),而循環(huán)神經(jīng)網(wǎng)絡(luò)在三層結(jié)構(gòu)的基礎(chǔ)上增加了一個(gè)循環(huán)結(jié)構(gòu)(見(jiàn)圖4),圖4 等號(hào)左側(cè)為折疊式,等號(hào)右側(cè)為展開(kāi)式,xt為輸入層,ht為輸出層,A為隱藏層,其中每個(gè)A可以看作是一個(gè)神經(jīng)元,每個(gè)神經(jīng)元先存儲(chǔ)之前輸入的狀態(tài),再與當(dāng)前輸入相結(jié)合,運(yùn)算后保留當(dāng)前輸入與之前輸入的某些關(guān)系,從而具備“記憶”功能,可以捕獲之前計(jì)算過(guò)的信息,保留前面輸入的數(shù)據(jù)對(duì)后面數(shù)據(jù)的影響,具有很好的時(shí)序性。

    1.3.2.2 長(zhǎng)短期記憶網(wǎng)絡(luò)

    長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)由RNN 演化而來(lái),通過(guò)刻意設(shè)計(jì)計(jì)算隱藏層狀態(tài),避免了長(zhǎng)期依賴的問(wèn)題。RNN 和LSTM 均具有重復(fù)人工神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)浇Y(jié)構(gòu),但在每個(gè)重復(fù)模塊內(nèi)部均存在4 個(gè)以特殊方式相互作用的神經(jīng)網(wǎng)絡(luò)層(見(jiàn)圖5)。

    圖4 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Recurrent neural network structure

    圖5 LSTM 中的重復(fù)模塊結(jié)構(gòu)Fig.5 Repetitive module structure in LSTM

    在LSTM 中,“記憶”被稱為細(xì)胞狀態(tài),細(xì)胞狀態(tài)在鏈?zhǔn)浇Y(jié)構(gòu)上像傳送帶一樣運(yùn)行,僅存在少量線性操作,如此使得信息在流經(jīng)鏈?zhǔn)浇Y(jié)構(gòu)時(shí)可以保真。另外,為了捕獲長(zhǎng)期依賴關(guān)系,LSTM 通過(guò)被稱為門(gate)的結(jié)構(gòu)增添信息,門由單一sigmoid 神經(jīng)網(wǎng)絡(luò)層與單一點(diǎn)乘法運(yùn)算構(gòu)成,取值范圍為0~1,根據(jù)數(shù)值來(lái)控制組件信息的通過(guò)與否。LSTM有3 個(gè)門,用于保護(hù)和控制細(xì)胞狀態(tài)。第1 個(gè)門為“忘記門”,由sigmoid 層實(shí)現(xiàn),將細(xì)胞狀態(tài)中的信息選擇性地遺忘;第2 個(gè)門為“輸入門”,輸入門的sigmoid 層確定更新哪些值,后續(xù)通過(guò)tanh 層創(chuàng)建的候選向量-Ct將新的信息有選擇地記錄到細(xì)胞狀態(tài)中;第3 個(gè)門為“輸出門”,其作用對(duì)象為隱藏層ht,通過(guò)sigmoid 層確定隱藏層的輸出部分,后續(xù)將其通過(guò) tanh 層,在(-1,1)內(nèi)得到一個(gè)值,并將它與sigmoid 層的輸出值相乘,確定需要輸出的信息。在LSTM 網(wǎng)絡(luò)中,通過(guò)3 個(gè)門選擇記憶中的信息是保留還是刪除,并將之前的狀態(tài)、當(dāng)前的記憶和輸入進(jìn)行組合,這種結(jié)構(gòu)在捕獲長(zhǎng)期依賴上被證明是非常有效的。

    1.3.2.3 門控循環(huán)單元

    門控循環(huán)單元(GRU)是LSTM 的變種,可以很好地解決RNN 中的長(zhǎng)依賴問(wèn)題。LSTM 引入了3個(gè)門函數(shù):輸入門、忘記門和輸出門來(lái)分別控制輸入值、記憶值和輸出值。GRU 中只有2 個(gè)門:重置門和更新門,重置門由新輸入的信息和記憶構(gòu)成;更新門實(shí)質(zhì)上由LSTM 中的忘記門和輸入門構(gòu)成,較LSTM 結(jié)構(gòu)更簡(jiǎn)單(見(jiàn)圖6),圖6 中,rt表示重置門,zt表示更新門。重置門rt控制前一狀態(tài)有多少信息被寫入當(dāng)前的候選集h~t,重置門的值越小,前一狀態(tài)的信息被忽略的就越多,寫入的越少;更新門zt主要通過(guò)其自身的值來(lái)控制前置信息的通過(guò)量。

    圖6 GRU 內(nèi)部結(jié)構(gòu)Fig.6 Internal structure of GRU

    LSTM 和GRU 均通過(guò)各種門函數(shù)將重要特征保留下來(lái),從而保證在更長(zhǎng)的傳播中其特征不會(huì)丟失,有利于文本數(shù)據(jù)處理。此外,GRU 較LSTM 少了一個(gè)門,從而減少了幾個(gè)矩陣乘法,參數(shù)數(shù)量也少于LSTM,當(dāng)數(shù)據(jù)量很大時(shí),GRU 的訓(xùn)練速度比LSTM 快,但分類效果還是取決于具體的應(yīng)用場(chǎng)景。

    1.3.2.4 基于word2vec 的RNN 深度學(xué)習(xí)情感計(jì)算模型

    基于word2vec 將文本轉(zhuǎn)化為分布式存儲(chǔ)的詞向量,然后通過(guò)RNN(LSTM 或GRU)深度學(xué)習(xí),最后輸出計(jì)算結(jié)果(見(jiàn)圖7)。

    具體步驟包括:(1)對(duì)旅游文本大數(shù)據(jù)進(jìn)行基礎(chǔ)性處理,得到原始輸入語(yǔ)句;(2)采用word2vec 模型對(duì)原始輸入語(yǔ)句進(jìn)行詞向量化處理,得到矩陣形式的詞向量;(3)將矩陣形式的詞向量xi輸入RNN(LSTM 或 GRU)神經(jīng)網(wǎng)絡(luò);(4)經(jīng) RNN(LSTM 或GRU)神經(jīng)網(wǎng)絡(luò)產(chǎn)生輸出yi;(5)將yi連接至普通的全連接神經(jīng)網(wǎng)絡(luò)。最后,將全連接層的輸出連接至softmax 層,輸出正面情感或負(fù)面情感的概率y。

    圖7 基于word2vec 的RNN 深度學(xué)習(xí)情感計(jì)算模型Fig.7 Emotional classification model of RNN deep learning based on word2vec

    2 模型檢驗(yàn)與分析

    2.1 模型評(píng)價(jià)方法和指標(biāo)

    根據(jù)情感計(jì)算實(shí)際與預(yù)測(cè)情況,可給出如表2所示的混淆矩陣,其中,1 代表正向類,0 代表負(fù)向類。TP 表示實(shí)際是正向,預(yù)測(cè)也是正向,分類正確;FP 表示實(shí)際是負(fù)向,預(yù)測(cè)是正向,分類錯(cuò)誤;FN表示實(shí)際是正向,預(yù)測(cè)是負(fù)向,分類錯(cuò)誤;TN 表示實(shí)際是負(fù)向,預(yù)測(cè)也是負(fù)向,分類正確。

    表2 混淆矩陣Table 2 Confusion matrix

    基于混淆矩陣,情感計(jì)算一般采用準(zhǔn)確率(accuracy,A),精確率(precision,P)、召回率(recall,R)和F1值4 種指標(biāo)來(lái)評(píng)價(jià)計(jì)算效果。準(zhǔn)確率A=(TP+TN)/(TP+FP+TN+FN),表示在所有樣本中預(yù)測(cè)正確的樣本數(shù)占總樣本數(shù)的比例;精確率P=TP/(TP+FP),表示在預(yù)測(cè)為正向的數(shù)據(jù)中,預(yù)測(cè)的正確率;召回率R=TP/(TP+FN),表示在所有正向的數(shù)據(jù)中,預(yù)測(cè)的正確率。即準(zhǔn)確率、精確率與召回率分別由不同的情感計(jì)算方法對(duì)文本大數(shù)據(jù)的情感計(jì)算效果來(lái)決定;為避免P和R兩個(gè)指標(biāo)相差過(guò)大,引入綜合度量指標(biāo)F,并將F作為分類的綜合評(píng)價(jià)標(biāo)準(zhǔn):

    其中,∝為調(diào)節(jié)精確率(P)和召回率(R)兩者之間關(guān)系的調(diào)節(jié)因子,通常取1。調(diào)整后的綜合評(píng)價(jià)標(biāo)準(zhǔn)F1的計(jì)算公式為

    為檢驗(yàn)基于word2vec 的RNN 深度學(xué)習(xí)游客情感計(jì)算模型的效果,選定能有效捕獲序列數(shù)據(jù)長(zhǎng)期依賴的LSTM 網(wǎng)絡(luò)作為實(shí)驗(yàn)的深度學(xué)習(xí)模型,以譚松波標(biāo)記過(guò)的酒店評(píng)論(見(jiàn)https://www.aitechclub.com/data-detail?data_id=29)作為語(yǔ)料,80% 做訓(xùn)練集,20%做測(cè)試集,在訓(xùn)練集上迭代20 次,訓(xùn)練過(guò)程中分別預(yù)測(cè)準(zhǔn)確率和損失函數(shù)值,結(jié)果如圖8 和圖9 所示。

    同時(shí),設(shè)計(jì)實(shí)驗(yàn)對(duì)照組,使用譚松波標(biāo)記過(guò)的酒店評(píng)論語(yǔ)料作為旅游文本大數(shù)據(jù),其中正向情感樣本5 322 個(gè),負(fù)向情感樣本2 444 個(gè),共7 766 個(gè)樣本構(gòu)成數(shù)據(jù)集,按照準(zhǔn)確率A、精確率P、召回率R、綜合評(píng)價(jià)標(biāo)準(zhǔn)F1對(duì)不同游客情感計(jì)算方法進(jìn)行評(píng)價(jià)。

    圖8 準(zhǔn)確率曲線Fig.8 Accuracy curve

    圖9 損失函數(shù)曲線Fig.9 Loss function curve

    2.2 檢驗(yàn)結(jié)果與分析

    基于情感詞典ER(emotion-rules)、機(jī)器學(xué)習(xí)SVM(support vector machines)、機(jī)器學(xué)習(xí)NBC(naive Bayesian classifier)和深度學(xué)習(xí)RNN(LSTM)的情感計(jì)算模型的檢驗(yàn)結(jié)果如表3 所示。

    由表3 可知,基于機(jī)器學(xué)習(xí)的游客情感計(jì)算方法比基于情感詞典的游客情感計(jì)算方法更優(yōu),原因在于機(jī)器學(xué)習(xí)使用統(tǒng)計(jì)的方法抽取文本數(shù)據(jù)中的特征項(xiàng),其非線性特征提高了情感計(jì)算的可靠性和準(zhǔn)確率。

    在機(jī)器學(xué)習(xí)方法中,NBC 在各項(xiàng)評(píng)價(jià)指標(biāo)上的表現(xiàn)都較SVM 好,且在訓(xùn)練集與測(cè)試集上效果都比較穩(wěn)定,原因在于NBC 作為機(jī)器學(xué)習(xí)中經(jīng)典的分類模型,有著堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)和穩(wěn)定的分類效率。

    深度學(xué)習(xí)方法LSTM 模型的準(zhǔn)確率、召回率和F1值都較 ER、SVM 和 NBC 有較大提升,主要源于LSTM 模型對(duì)文本數(shù)據(jù)特征提取與學(xué)習(xí)方式上的智能化,深度學(xué)習(xí)依靠大數(shù)據(jù)與大量參數(shù)自動(dòng)擬合非線性預(yù)測(cè)函數(shù),強(qiáng)調(diào)模型結(jié)構(gòu)的深度,突出特征學(xué)習(xí)的重要性,并通過(guò)逐層特征變換將原始空間中樣本的特征表示轉(zhuǎn)換為新的特征空間。與機(jī)器學(xué)習(xí)人工構(gòu)造特征的方法相比,LSTM 模型充分體現(xiàn)了其大數(shù)據(jù)優(yōu)勢(shì)。

    在基于word2vec 的RNN 深度學(xué)習(xí)游客情感計(jì)算模型中,word2vec 用高維向量將詞語(yǔ)轉(zhuǎn)換為實(shí)數(shù)向量并精確保留其語(yǔ)義信息,LSTM 模型不但發(fā)揮了深度學(xué)習(xí)對(duì)高維數(shù)據(jù)的強(qiáng)處理能力,還保留了旅游文本數(shù)據(jù)良好的時(shí)序性,同時(shí)結(jié)合其循環(huán)神經(jīng)網(wǎng)絡(luò)注重鄰近位置的特點(diǎn),有效地將高維向量重構(gòu)并轉(zhuǎn)化為低維的抽象語(yǔ)義信息,因此,word2vec 與LSTM 深度學(xué)習(xí)模型的結(jié)合取得了比基于情感詞典和基于機(jī)器學(xué)習(xí)更好的計(jì)算效果。

    深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一種新模式,其優(yōu)勢(shì)在于強(qiáng)大的特征自學(xué)習(xí)能力和情感判別能力,非常適合旅游文本大數(shù)據(jù)多粒度、無(wú)標(biāo)簽和規(guī)模性、多樣性的特點(diǎn),有效解決了旅游大數(shù)據(jù)時(shí)代游客情感研究中情感計(jì)算數(shù)據(jù)量大、文本間的關(guān)系難度量、高度依賴人工構(gòu)建情感詞典、人工構(gòu)建特征復(fù)雜及問(wèn)題泛化能力受限等問(wèn)題。

    3 結(jié)論與討論

    3.1 結(jié) 論

    綜上,基于不同方法的游客情感計(jì)算的優(yōu)勢(shì)、不足和適用性如表4 所示。

    表3 不同方法情感計(jì)算模型的檢驗(yàn)結(jié)果Table 3 Test result of tourist emotion calculation model based on different methods

    表4 基于不同方法的游客情感計(jì)算的優(yōu)勢(shì)、不足和適用性Table 4 The advantages,insufficients and applicability of different methods of tourist emotion calculation

    3.1.1 基于情感詞典的游客情感計(jì)算

    該方法利用詞語(yǔ)的情感極性、出現(xiàn)位置、句子語(yǔ)法等規(guī)則,通過(guò)情感詞典對(duì)情感詞加權(quán)計(jì)算得到情感計(jì)算結(jié)果,核心是情感詞典和情感計(jì)算規(guī)則。其優(yōu)點(diǎn)是簡(jiǎn)單、易實(shí)現(xiàn),適用的語(yǔ)料范圍廣。但缺點(diǎn)也很突出,(1)自然語(yǔ)言千變?nèi)f化的特點(diǎn),在詞典匹配中易產(chǎn)生較大誤差;(2)性能高度依賴詞典的質(zhì)量,需要投入大量人力擴(kuò)充高質(zhì)量的情感詞典,而當(dāng)今呈指數(shù)型上漲的旅游文本更為詞典的構(gòu)建增加了難度;(3)情感詞典和情感計(jì)算規(guī)則都需要設(shè)計(jì),因此,精確與否在很大程度上取決于經(jīng)驗(yàn),推廣能力較差。

    3.1.2 基于機(jī)器學(xué)習(xí)的游客情感計(jì)算

    該方法利用已標(biāo)注情感類別的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)算法得到分類模型,而后通過(guò)模型計(jì)算文本的情感極性?;跈C(jī)器學(xué)習(xí)的情感計(jì)算過(guò)程較易實(shí)現(xiàn)且計(jì)算量小,但易受訓(xùn)練數(shù)據(jù)規(guī)模和專業(yè)性及文本特征選擇的影響,一定程度上限制了其在復(fù)雜問(wèn)題上的泛化能力。運(yùn)用統(tǒng)計(jì)學(xué)方式抽取文本中的特征項(xiàng),通過(guò)機(jī)器學(xué)習(xí)方法建立計(jì)算模型,進(jìn)而實(shí)現(xiàn)情感計(jì)算,有效解決了對(duì)情感詞典的依賴,相對(duì)于基于情感詞典的線性特征,其非線性特征極大地提高了情感計(jì)算的準(zhǔn)確率。這種有監(jiān)督的機(jī)器學(xué)習(xí)方法要求利用已知情感極性的數(shù)據(jù)作為訓(xùn)練集,但在現(xiàn)實(shí)中要獲得大量已標(biāo)注情感極性的數(shù)據(jù)難度很大,有時(shí)甚至無(wú)法獲??;同時(shí)其對(duì)語(yǔ)料的依賴具有專業(yè)性;另外,這種方法將情感文本視為一個(gè)“詞袋”,在忽略了數(shù)據(jù)集規(guī)模情況的同時(shí),也忽略了上下文的信息,TF-IDF 具有高維度高稀疏性,缺乏語(yǔ)義,特征表達(dá)能力較弱,需要經(jīng)過(guò)復(fù)雜的人工設(shè)計(jì)特征和提取特征過(guò)程,特征的選擇和降維操作所需工作量巨大。

    3.1.3 基于深度學(xué)習(xí)的游客情感計(jì)算

    該方法解決了基于情感詞典和基于機(jī)器學(xué)習(xí)無(wú)法考慮詞序信息和語(yǔ)義特征的問(wèn)題,提高了情感計(jì)算的準(zhǔn)確率,為游客情感計(jì)算提供了新的思路。通過(guò)word2vec 用高維向量將詞語(yǔ)轉(zhuǎn)換為實(shí)數(shù)向量并精確保留其語(yǔ)義,使特征具有語(yǔ)義信息,且通過(guò)神經(jīng)網(wǎng)絡(luò)保留了其大部分詞序信息。與傳統(tǒng)機(jī)器學(xué)習(xí)的計(jì)算模型相比,深度學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)可以自動(dòng)發(fā)現(xiàn)特征,不用人工設(shè)計(jì)和提取特征,大大減少了特征設(shè)計(jì)和提取的工作量。word2vec 在產(chǎn)生向量矩陣的同時(shí)降低了特征維度,加上深度學(xué)習(xí)模型可以通過(guò)GPU 加速訓(xùn)練,大大縮短了訓(xùn)練時(shí)間和實(shí)際使用時(shí)間;此外,由于深度學(xué)習(xí)不依賴專業(yè)領(lǐng)域詞典和專業(yè)領(lǐng)域的特征提取,使得其進(jìn)行情感計(jì)算的實(shí)用性更強(qiáng),泛化能力更好。但深度學(xué)習(xí)采用深層神經(jīng)網(wǎng)絡(luò),其模型較傳統(tǒng)機(jī)器學(xué)習(xí)模型復(fù)雜,對(duì)數(shù)據(jù)集的要求高,大規(guī)模訓(xùn)練數(shù)據(jù)缺乏已經(jīng)成為深度學(xué)習(xí)在情感計(jì)算中的瓶頸,同時(shí),多層神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、內(nèi)部運(yùn)行規(guī)則難以理解,對(duì)計(jì)算結(jié)果的解釋性較差。

    3.2 不足與展望

    技術(shù)只是實(shí)現(xiàn)目標(biāo)的一種手段,技術(shù)手段和方法要配合實(shí)際研究需求。在實(shí)際應(yīng)用中,技術(shù)手段的使用不但要考慮準(zhǔn)確性、誤差率等情況,而且還應(yīng)考慮其運(yùn)行速度(時(shí)間復(fù)雜度)、資源消耗程度(空間復(fù)雜度)以及實(shí)施性和穩(wěn)定性。

    在開(kāi)展相關(guān)工作時(shí),突破技術(shù)范式的束縛,尋找合適的方法,探索最優(yōu)的組合,從而形成最適模型。本研究在前人研究基礎(chǔ)上,對(duì)游客情感研究中的情感計(jì)算進(jìn)行了歸納,總結(jié)了常用的技術(shù)范式,并探索性地將新技術(shù)應(yīng)用于游客情感計(jì)算研究,由于涉及的技術(shù)較多,研究尚欠深入,如基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)多種算法在游客情感計(jì)算上的深入比較等,今后可在以下幾方面展開(kāi)進(jìn)一步研究:

    · 多種方法的組合使用。游客的情感是在“非慣常狀態(tài)”下的活動(dòng)產(chǎn)生的情感,游客情感分析是在旅游這一特殊情境下進(jìn)行的。下一步可以考慮構(gòu)建旅游專屬的情感詞典,并將旅游專屬的情感詞典與機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法相結(jié)合來(lái)研究游客情感計(jì)算。

    · 大數(shù)據(jù)的測(cè)試研究。數(shù)據(jù)量的大小決定情感模型的可信度,下一步可考慮在獲取大規(guī)模旅游文本大數(shù)據(jù)的情況下,研究不同情感計(jì)算技術(shù)在時(shí)間復(fù)雜度、空間復(fù)雜度、實(shí)施性、穩(wěn)定性上的優(yōu)劣,為大數(shù)據(jù)時(shí)代游客情感計(jì)算研究奠定基礎(chǔ)。

    猜你喜歡
    詞典機(jī)器向量
    機(jī)器狗
    向量的分解
    機(jī)器狗
    聚焦“向量與三角”創(chuàng)新題
    米沃什詞典
    文苑(2019年24期)2020-01-06 12:06:50
    未來(lái)機(jī)器城
    電影(2018年8期)2018-09-21 08:00:06
    評(píng)《現(xiàn)代漢語(yǔ)詞典》(第6版)
    詞典例證翻譯標(biāo)準(zhǔn)探索
    向量垂直在解析幾何中的應(yīng)用
    向量五種“變身” 玩轉(zhuǎn)圓錐曲線
    日韩国内少妇激情av| 国产精品精品国产色婷婷| 亚洲激情在线av| 一边摸一边做爽爽视频免费| 久久人人爽av亚洲精品天堂| 亚洲成av人片免费观看| a级毛片在线看网站| 午夜两性在线视频| 国产av又大| 97碰自拍视频| 99久久精品国产亚洲精品| 99国产极品粉嫩在线观看| 国产成人av教育| 亚洲专区中文字幕在线| 国产成人一区二区三区免费视频网站| 亚洲av成人不卡在线观看播放网| 欧美一区二区精品小视频在线| 中文字幕高清在线视频| 亚洲第一欧美日韩一区二区三区| 亚洲av熟女| 日本精品一区二区三区蜜桃| 天天躁狠狠躁夜夜躁狠狠躁| 人妻丰满熟妇av一区二区三区| 天堂√8在线中文| 91在线观看av| 69av精品久久久久久| 亚洲五月色婷婷综合| 久久午夜亚洲精品久久| 18禁观看日本| 久久久久久亚洲精品国产蜜桃av| 欧美在线黄色| 欧美大码av| 国产一区二区三区综合在线观看| 丁香六月欧美| 日本a在线网址| 一级黄色大片毛片| 亚洲色图 男人天堂 中文字幕| 精品电影一区二区在线| 操美女的视频在线观看| 国产真人三级小视频在线观看| 丰满人妻熟妇乱又伦精品不卡| 国产精品免费一区二区三区在线| 午夜免费鲁丝| 日韩视频一区二区在线观看| 少妇熟女aⅴ在线视频| 久久久久九九精品影院| 亚洲电影在线观看av| 国产极品粉嫩免费观看在线| 国产男靠女视频免费网站| 亚洲avbb在线观看| 亚洲av美国av| 色播在线永久视频| 亚洲国产精品成人综合色| 精品少妇一区二区三区视频日本电影| 十八禁人妻一区二区| 国产一区二区三区视频了| 三级毛片av免费| 一a级毛片在线观看| 最新美女视频免费是黄的| 琪琪午夜伦伦电影理论片6080| 中文字幕精品免费在线观看视频| 最近最新免费中文字幕在线| 成人av一区二区三区在线看| 欧美丝袜亚洲另类 | 亚洲国产精品sss在线观看| 日本在线视频免费播放| 久久久水蜜桃国产精品网| 熟妇人妻久久中文字幕3abv| 久久精品91无色码中文字幕| 黄色 视频免费看| 可以免费在线观看a视频的电影网站| 精品人妻在线不人妻| 丁香六月欧美| 国产精品久久久久久人妻精品电影| 欧美日韩黄片免| 最新在线观看一区二区三区| 欧美午夜高清在线| 亚洲av片天天在线观看| 亚洲国产欧美一区二区综合| 午夜视频精品福利| 成熟少妇高潮喷水视频| 长腿黑丝高跟| 亚洲国产精品合色在线| 国产欧美日韩一区二区精品| 丁香欧美五月| 午夜免费鲁丝| 69av精品久久久久久| 亚洲专区中文字幕在线| 日本三级黄在线观看| 淫秽高清视频在线观看| 国产精品一区二区精品视频观看| 别揉我奶头~嗯~啊~动态视频| 国产又色又爽无遮挡免费看| 亚洲欧美日韩高清在线视频| а√天堂www在线а√下载| 亚洲国产高清在线一区二区三 | 久久久久九九精品影院| 99久久精品国产亚洲精品| 好男人在线观看高清免费视频 | 国产亚洲精品久久久久5区| 一二三四社区在线视频社区8| 亚洲人成网站在线播放欧美日韩| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲欧洲精品一区二区精品久久久| 男女之事视频高清在线观看| 国产精品免费一区二区三区在线| 午夜福利18| 国产成人欧美| 中文亚洲av片在线观看爽| 久久久久亚洲av毛片大全| 日日摸夜夜添夜夜添小说| 午夜福利视频1000在线观看 | 久久久国产成人免费| 丰满的人妻完整版| 少妇熟女aⅴ在线视频| 中亚洲国语对白在线视频| 一区二区三区高清视频在线| 中文字幕最新亚洲高清| 两个人视频免费观看高清| 亚洲精品在线观看二区| 啦啦啦观看免费观看视频高清 | 成人精品一区二区免费| 两性夫妻黄色片| 国产欧美日韩一区二区三| 两性午夜刺激爽爽歪歪视频在线观看 | 一区福利在线观看| 欧美乱色亚洲激情| 很黄的视频免费| 欧美激情极品国产一区二区三区| 午夜激情av网站| 欧美激情高清一区二区三区| 熟妇人妻久久中文字幕3abv| 久久性视频一级片| 精品人妻在线不人妻| 国产精品国产高清国产av| 99久久精品国产亚洲精品| 国产精品九九99| 亚洲中文字幕一区二区三区有码在线看 | 午夜精品国产一区二区电影| 男人舔女人下体高潮全视频| 深夜精品福利| 亚洲精品粉嫩美女一区| 国产99白浆流出| 欧美大码av| 国产成人影院久久av| 精品一品国产午夜福利视频| 国产熟女xx| 性少妇av在线| 国产精品av久久久久免费| 97碰自拍视频| 色综合婷婷激情| 国产成人av教育| 视频区欧美日本亚洲| 成人av一区二区三区在线看| 人妻丰满熟妇av一区二区三区| 在线观看免费日韩欧美大片| 久久精品国产清高在天天线| 亚洲欧美日韩另类电影网站| 色尼玛亚洲综合影院| 免费人成视频x8x8入口观看| 国产不卡一卡二| 欧美日韩瑟瑟在线播放| 亚洲成国产人片在线观看| 亚洲九九香蕉| 亚洲国产精品sss在线观看| 欧美乱色亚洲激情| 狂野欧美激情性xxxx| 18禁美女被吸乳视频| 亚洲欧美日韩无卡精品| 国产伦一二天堂av在线观看| 女人精品久久久久毛片| 久久人妻福利社区极品人妻图片| av中文乱码字幕在线| 一本大道久久a久久精品| 成年女人毛片免费观看观看9| 51午夜福利影视在线观看| 精品国产一区二区三区四区第35| 天天一区二区日本电影三级 | 麻豆久久精品国产亚洲av| 窝窝影院91人妻| 亚洲欧美激情综合另类| 久久人妻熟女aⅴ| 久久狼人影院| 777久久人妻少妇嫩草av网站| 亚洲精品国产色婷婷电影| 午夜免费激情av| 啦啦啦 在线观看视频| 久久欧美精品欧美久久欧美| 亚洲自偷自拍图片 自拍| 亚洲avbb在线观看| 亚洲成a人片在线一区二区| 国产一区二区三区综合在线观看| 亚洲全国av大片| www日本在线高清视频| 此物有八面人人有两片| 亚洲片人在线观看| 一进一出好大好爽视频| 国产私拍福利视频在线观看| 欧美黑人欧美精品刺激| 19禁男女啪啪无遮挡网站| 中文字幕人成人乱码亚洲影| 亚洲一区二区三区色噜噜| 在线国产一区二区在线| 欧美日韩亚洲国产一区二区在线观看| 亚洲五月婷婷丁香| 亚洲av电影在线进入| 亚洲精品久久成人aⅴ小说| 动漫黄色视频在线观看| 看黄色毛片网站| 美女扒开内裤让男人捅视频| 禁无遮挡网站| av在线天堂中文字幕| 久久九九热精品免费| 国内精品久久久久久久电影| 亚洲第一欧美日韩一区二区三区| 高清在线国产一区| 久久青草综合色| 搡老熟女国产l中国老女人| 欧美日韩精品网址| 一区福利在线观看| 婷婷精品国产亚洲av在线| 黑人巨大精品欧美一区二区mp4| 一区二区三区国产精品乱码| 亚洲精品国产一区二区精华液| 久久久国产成人免费| 亚洲七黄色美女视频| 国产精品一区二区三区四区久久 | 校园春色视频在线观看| 国产熟女午夜一区二区三区| 少妇裸体淫交视频免费看高清 | 免费在线观看完整版高清| 嫩草影视91久久| 欧美激情久久久久久爽电影 | 免费少妇av软件| 久久婷婷成人综合色麻豆| 色婷婷久久久亚洲欧美| 精品国内亚洲2022精品成人| 色综合欧美亚洲国产小说| 如日韩欧美国产精品一区二区三区| 精品国产乱码久久久久久男人| 亚洲成人国产一区在线观看| 午夜影院日韩av| 欧美日韩黄片免| 欧美激情久久久久久爽电影 | av欧美777| 亚洲av成人不卡在线观看播放网| 国产精品免费视频内射| 黑人操中国人逼视频| 精品第一国产精品| 中出人妻视频一区二区| 在线观看日韩欧美| 亚洲五月天丁香| 淫秽高清视频在线观看| 在线免费观看的www视频| 欧美在线黄色| 乱人伦中国视频| 在线观看免费视频日本深夜| 国产精品亚洲美女久久久| 午夜免费鲁丝| 国产成人啪精品午夜网站| 日本撒尿小便嘘嘘汇集6| 青草久久国产| 69av精品久久久久久| 亚洲人成77777在线视频| 午夜福利,免费看| 久久国产精品男人的天堂亚洲| 日韩免费av在线播放| 国产亚洲精品久久久久久毛片| 亚洲最大成人中文| 亚洲国产欧美网| 久久久久久久久免费视频了| 成人三级做爰电影| 日本撒尿小便嘘嘘汇集6| 好男人在线观看高清免费视频 | 久久久水蜜桃国产精品网| 亚洲视频免费观看视频| 日韩 欧美 亚洲 中文字幕| 日本五十路高清| 欧美日韩黄片免| 国产精品综合久久久久久久免费 | 老汉色∧v一级毛片| 午夜激情av网站| 国产免费男女视频| 亚洲av片天天在线观看| 亚洲 欧美一区二区三区| 伦理电影免费视频| 久久草成人影院| 99久久精品国产亚洲精品| 欧美日韩一级在线毛片| 十八禁人妻一区二区| 色播亚洲综合网| 18禁美女被吸乳视频| 久久中文字幕人妻熟女| 90打野战视频偷拍视频| 在线天堂中文资源库| 中文字幕人妻丝袜一区二区| 国产欧美日韩一区二区三| 在线观看免费视频网站a站| 成人三级黄色视频| 亚洲精品一区av在线观看| 国产精品久久久久久亚洲av鲁大| 国产欧美日韩一区二区三区在线| 亚洲一区二区三区色噜噜| 久久香蕉精品热| 亚洲专区国产一区二区| 成年版毛片免费区| 欧美日韩瑟瑟在线播放| 国产精品乱码一区二三区的特点 | 午夜福利,免费看| 亚洲成人国产一区在线观看| 国产欧美日韩一区二区三| 午夜福利一区二区在线看| 久久亚洲精品不卡| 午夜a级毛片| 精品乱码久久久久久99久播| 日韩有码中文字幕| 亚洲天堂国产精品一区在线| 不卡av一区二区三区| 波多野结衣高清无吗| 中文字幕人妻丝袜一区二区| 日本 欧美在线| 精品日产1卡2卡| 自拍欧美九色日韩亚洲蝌蚪91| 一卡2卡三卡四卡精品乱码亚洲| 精品久久久久久成人av| 色综合欧美亚洲国产小说| 亚洲avbb在线观看| 丰满人妻熟妇乱又伦精品不卡| 亚洲第一电影网av| 黑人欧美特级aaaaaa片| 国内精品久久久久精免费| 亚洲精品av麻豆狂野| 99国产精品99久久久久| 精品国产国语对白av| 国产精品亚洲美女久久久| www日本在线高清视频| 啦啦啦免费观看视频1| 两个人视频免费观看高清| 久9热在线精品视频| 中文字幕色久视频| 欧美乱码精品一区二区三区| 午夜精品国产一区二区电影| 亚洲成av片中文字幕在线观看| 1024视频免费在线观看| 黄色a级毛片大全视频| 窝窝影院91人妻| 国产精品亚洲美女久久久| 老司机在亚洲福利影院| 精品国产亚洲在线| www.自偷自拍.com| 国产又爽黄色视频| 1024香蕉在线观看| 长腿黑丝高跟| 香蕉丝袜av| 1024视频免费在线观看| 一区在线观看完整版| 日本vs欧美在线观看视频| 婷婷丁香在线五月| 久久国产精品人妻蜜桃| 91精品国产国语对白视频| 国产免费男女视频| 侵犯人妻中文字幕一二三四区| 亚洲一区二区三区色噜噜| 精品人妻1区二区| 国产精品香港三级国产av潘金莲| 免费在线观看完整版高清| 成人免费观看视频高清| 一夜夜www| 禁无遮挡网站| 日本vs欧美在线观看视频| 熟女少妇亚洲综合色aaa.| 久久久久久久久免费视频了| 亚洲av成人一区二区三| 一边摸一边抽搐一进一出视频| 成人特级黄色片久久久久久久| 好男人电影高清在线观看| 国产真人三级小视频在线观看| 午夜福利,免费看| 久久中文字幕一级| 中国美女看黄片| 久久这里只有精品19| 欧美中文综合在线视频| 亚洲欧美日韩高清在线视频| 久久久久久久午夜电影| 免费女性裸体啪啪无遮挡网站| 1024视频免费在线观看| 国产麻豆成人av免费视频| 欧美日韩亚洲国产一区二区在线观看| 50天的宝宝边吃奶边哭怎么回事| 亚洲一区二区三区不卡视频| 久热爱精品视频在线9| www.自偷自拍.com| 国产主播在线观看一区二区| 变态另类丝袜制服| 国产精品久久久久久人妻精品电影| 欧美人与性动交α欧美精品济南到| 久久草成人影院| 看免费av毛片| 精品福利观看| 亚洲伊人色综图| 久久中文看片网| 叶爱在线成人免费视频播放| 午夜免费激情av| 中文字幕色久视频| 免费观看精品视频网站| 美女国产高潮福利片在线看| 日韩免费av在线播放| 午夜福利一区二区在线看| 一个人免费在线观看的高清视频| 中国美女看黄片| 欧美丝袜亚洲另类 | 一本大道久久a久久精品| 不卡一级毛片| 日韩精品免费视频一区二区三区| 久久久国产精品麻豆| 高清毛片免费观看视频网站| 狂野欧美激情性xxxx| 国产精品电影一区二区三区| 国产精品98久久久久久宅男小说| 日本五十路高清| 精品乱码久久久久久99久播| 满18在线观看网站| 亚洲欧美激情综合另类| 精品一区二区三区av网在线观看| 少妇熟女aⅴ在线视频| 成人国产一区最新在线观看| 国产精品免费一区二区三区在线| 亚洲精品中文字幕一二三四区| 日本一区二区免费在线视频| 成人18禁高潮啪啪吃奶动态图| 欧美国产精品va在线观看不卡| 成人国产一区最新在线观看| 深夜精品福利| 日本 欧美在线| 精品欧美一区二区三区在线| 一级毛片高清免费大全| 精品国产超薄肉色丝袜足j| 国产成人av激情在线播放| 国产精品国产高清国产av| av中文乱码字幕在线| 欧美日本中文国产一区发布| 又大又爽又粗| 精品久久久久久成人av| 中文字幕精品免费在线观看视频| 日本免费一区二区三区高清不卡 | 久久久久久亚洲精品国产蜜桃av| 国产1区2区3区精品| 精品乱码久久久久久99久播| 99久久综合精品五月天人人| 国产伦一二天堂av在线观看| 丰满的人妻完整版| 日本一区二区免费在线视频| 老司机深夜福利视频在线观看| 亚洲视频免费观看视频| 午夜老司机福利片| 咕卡用的链子| 日韩免费av在线播放| 美女高潮到喷水免费观看| 99香蕉大伊视频| 精品国内亚洲2022精品成人| 老汉色∧v一级毛片| 深夜精品福利| 亚洲成av人片免费观看| 两个人看的免费小视频| 亚洲成人免费电影在线观看| 精品国产美女av久久久久小说| 一级,二级,三级黄色视频| 美女扒开内裤让男人捅视频| 欧美激情久久久久久爽电影 | 精品欧美国产一区二区三| 国产精品一区二区免费欧美| 午夜两性在线视频| 免费看美女性在线毛片视频| 精品国产国语对白av| 国产一区二区在线av高清观看| 黑人欧美特级aaaaaa片| 成人三级黄色视频| 成年人黄色毛片网站| 中文字幕精品免费在线观看视频| 亚洲男人天堂网一区| 首页视频小说图片口味搜索| 亚洲 欧美 日韩 在线 免费| av在线天堂中文字幕| 两个人看的免费小视频| 在线观看一区二区三区| 操美女的视频在线观看| 搞女人的毛片| av欧美777| 亚洲国产高清在线一区二区三 | 多毛熟女@视频| 一边摸一边做爽爽视频免费| 日韩欧美三级三区| 亚洲色图 男人天堂 中文字幕| 久久青草综合色| 伊人久久大香线蕉亚洲五| 久久久国产精品麻豆| 桃色一区二区三区在线观看| 欧美 亚洲 国产 日韩一| 国产真人三级小视频在线观看| 一个人观看的视频www高清免费观看 | 一级毛片高清免费大全| 人人妻人人澡欧美一区二区 | 看免费av毛片| 亚洲av成人不卡在线观看播放网| av在线天堂中文字幕| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲精品一卡2卡三卡4卡5卡| 亚洲,欧美精品.| bbb黄色大片| 欧美 亚洲 国产 日韩一| 久热这里只有精品99| 香蕉国产在线看| 午夜日韩欧美国产| 国产xxxxx性猛交| 亚洲精品久久国产高清桃花| 日韩大尺度精品在线看网址 | 久久精品成人免费网站| 久久久久久久久免费视频了| 自线自在国产av| 国产高清有码在线观看视频 | 亚洲美女黄片视频| av超薄肉色丝袜交足视频| 我的亚洲天堂| 涩涩av久久男人的天堂| 国产精品久久久久久人妻精品电影| 九色国产91popny在线| www.自偷自拍.com| av视频在线观看入口| 9色porny在线观看| 此物有八面人人有两片| 男女下面插进去视频免费观看| 两个人看的免费小视频| 亚洲精品在线观看二区| 老鸭窝网址在线观看| 啦啦啦韩国在线观看视频| 久久国产乱子伦精品免费另类| 亚洲五月天丁香| 久久 成人 亚洲| 一a级毛片在线观看| 久9热在线精品视频| 两性午夜刺激爽爽歪歪视频在线观看 | 在线观看免费视频网站a站| 男人操女人黄网站| 老司机深夜福利视频在线观看| 国产精品免费一区二区三区在线| 美女 人体艺术 gogo| 老司机在亚洲福利影院| 国产一区二区激情短视频| 亚洲av电影不卡..在线观看| 国产一级毛片七仙女欲春2 | 精品国产美女av久久久久小说| 国产欧美日韩综合在线一区二区| 亚洲一区中文字幕在线| 19禁男女啪啪无遮挡网站| 老司机福利观看| 国产欧美日韩一区二区三区在线| 国产成人精品无人区| 脱女人内裤的视频| 一a级毛片在线观看| 国产成人av教育| 麻豆成人av在线观看| 天天添夜夜摸| 久久国产精品人妻蜜桃| 天天躁狠狠躁夜夜躁狠狠躁| 久久午夜亚洲精品久久| 岛国在线观看网站| 国产精品日韩av在线免费观看 | 999久久久国产精品视频| 日本 欧美在线| 女人爽到高潮嗷嗷叫在线视频| 日韩欧美三级三区| 精品午夜福利视频在线观看一区| 成人av一区二区三区在线看| 一级片免费观看大全| 91在线观看av| 免费高清视频大片| svipshipincom国产片| 国产野战对白在线观看| 久久久国产成人免费| 久热爱精品视频在线9| 免费观看人在逋| 国产日韩一区二区三区精品不卡| 国产在线观看jvid| 18禁黄网站禁片午夜丰满| 国产亚洲精品久久久久久毛片| 久久人妻熟女aⅴ| 精品久久久久久久人妻蜜臀av | 国产精品爽爽va在线观看网站 | 久久久久久久午夜电影| 九色国产91popny在线| 在线观看一区二区三区| 国产亚洲欧美98| 999久久久国产精品视频| 禁无遮挡网站| 国产精品1区2区在线观看.| 日韩欧美免费精品| 国产1区2区3区精品| 午夜福利,免费看| 欧美国产日韩亚洲一区| 日本欧美视频一区| 日本撒尿小便嘘嘘汇集6| 国产精品综合久久久久久久免费 | 99久久精品国产亚洲精品| 一区二区三区高清视频在线| 黄片大片在线免费观看| 国产精品99久久99久久久不卡| 免费女性裸体啪啪无遮挡网站| 男男h啪啪无遮挡| 99在线人妻在线中文字幕| 欧美久久黑人一区二区| 免费av毛片视频| 一a级毛片在线观看| 两人在一起打扑克的视频| 好男人电影高清在线观看| 69精品国产乱码久久久|