• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    ChatGPT可否充當(dāng)情感專家?——調(diào)查其在情感與隱喻分析的潛力

    2024-01-30 03:03:12張亞洲王夢遙戎璐俞洋趙東明秦璟
    關(guān)鍵詞:人類文本情感

    張亞洲 王夢遙 戎璐 俞洋 趙東明 秦璟

    北京大學(xué)學(xué)報(自然科學(xué)版) 第60卷 第1期 2024年1月

    Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 60, No. 1 (Jan. 2024)

    10.13209/j.0479-8023.2023.075

    國家自然科學(xué)基金青年基金(62006212)、中國博士后科學(xué)基金(2023M733907)、信息物理社會可信服務(wù)計算教育部重點實驗室開放基金(CPSDSC202103)和Project of Strategic Importance Grant of the Hong Kong Polytechnic University (1-ZE2Q)資助

    2023–05–17;

    2023–07–31

    ChatGPT可否充當(dāng)情感專家?——調(diào)查其在情感與隱喻分析的潛力

    張亞洲1,2王夢遙1戎璐3俞洋1趙東明4秦璟2,?

    1.鄭州輕工業(yè)大學(xué)軟件學(xué)院, 鄭州 450002; 2.香港理工大學(xué)護理學(xué)院, 香港 999077; 3.鄭州輕工業(yè)大學(xué)人事處, 鄭州 450002; 4.中國移動通信集團天津有限公司人工智能實驗室, 天津 3000201; ?通信作者, E-mail: harry.qin@polyu.edu.hk

    為了探索 ChatGPT 情感分析能力以及對主觀性和隱喻性理解的潛力, 將 ChatGPT 在 5 個情感、幽默與隱喻基準(zhǔn)數(shù)據(jù)集上展開評估, 通過與領(lǐng)域內(nèi)最前沿的模型對比, 討論其在不同任務(wù)上的優(yōu)勢與局限。此外, 還通過對比 ChatGPT 與人類在情感分析中的性能差別, 發(fā)現(xiàn) ChatGPT 在情感、幽默與隱喻任務(wù)上與人類結(jié)果分別相差 9.52%, 16.64%和 6.69%。實驗結(jié)果表明, 盡管 ChatGPT 在對話生成方面獲得最佳表現(xiàn), 但是其在情感理解方面仍具有改進的潛力。最后, 通過改善提示模板, 調(diào)查 ChatGPT 在情感理解場景下對提示模板的敏感性。

    ChatGPT; 情感分析; 幽默檢測; 隱喻識別

    情感是人類生命體驗的載體, 用于感知、辨析與理解人類潛在意圖, 驅(qū)動人類的決策與行為。情感理解能力是人與機器的主要區(qū)別之一。鑒于人類語言的主觀性, 人們可以通過語言表達各種情感狀態(tài), 如喜悅、憤怒和幽默等, 也可以通過語言感知他人的情感狀態(tài)[1]。情感分析旨在利用語言規(guī)則、語料庫和自然語言處理技術(shù)等, 幫助機器自動識別和分析人類的情感狀態(tài), 并準(zhǔn)確地做出回應(yīng)。目前主流的范式是借助 Transformer 預(yù)訓(xùn)練語言模型(pre- trained language models, PLMs)優(yōu)良的上下文特征提取能力, 通過微調(diào)或提示捕捉情感線索, 快速完成情感預(yù)測[2]。

    隨著預(yù)訓(xùn)練語言模型日趨龐大, 參數(shù)量激增, 語言模型在下游任務(wù)中的性能顯著提升, 自然語言處理領(lǐng)域開始邁入大語言模型時代。例如 GPT-3[3]以及 InstructGPT[4]等大型語言模型(large language models, LLMs)在語言生成、語言理解、文本分類以及語言翻譯等任務(wù)中取得顯著的進步。2022 年11 月, 由 OpenAI 公司發(fā)行的代表性大語言模型ChatGPT 引起學(xué)術(shù)界與工業(yè)界的關(guān)注。ChatGPT 基于 GPT-3.5 大型語言模型, 通過對齊人類的真實意圖, 即采用基于人類反饋的強化學(xué)習(xí)(reinforcement learning from human feedback, RLHF), 在大規(guī)模無標(biāo)注語料庫上完成訓(xùn)練。與傳統(tǒng)的強化學(xué)習(xí)相比, RLHF 利用人類提供的反饋[5]來指導(dǎo)模型進行學(xué)習(xí)(人類通過指導(dǎo)模型的行為來提供即時反饋, 模型可以在學(xué)習(xí)過程中利用這些反饋來調(diào)整自己的行為)。這種方法使得模型學(xué)習(xí)過程更加高效, 同時也提高了學(xué)習(xí)質(zhì)量。ChatGPT 在諸多下游任務(wù)中展露最前沿的能力, 包括對人工輸入的復(fù)雜問題提供高質(zhì)量的答案, 編寫代碼[6], 識別人類情感, 在面臨敏感話題(例如暴力和政治敏感等)時, 拒絕不恰當(dāng)請求, 甚至可以根據(jù)后續(xù)對話自我糾正先前的錯誤, 等等。因此, 與傳統(tǒng)的語言模型相比, ChatGPT擁有顯著的人類語言理解優(yōu)勢, 是實現(xiàn)通用人工智能的主要途徑之一, 已經(jīng)作為智能助手廣泛應(yīng)用于各個行業(yè)。

    ChatGPT 在取得巨大成功的同時, 亦引發(fā)研究者更多的思考與疑問。鑒于人類語言固有的主觀性與隱喻性, 對 ChatGPT 情感理解能力的定量分析卻鮮有涉及。首先, 情感表達與理解是一項非常抽象與主觀的任務(wù), 涉及個體差異(同一個情感表達被不同個體解讀為不同情感)、情感多樣性(悲傷夾雜著憤怒)、上下文性(同樣的表達在不同語境下傳達不同的情感)等多種因素, ChatGPT 的情感理解能力因而需要嚴(yán)謹(jǐn)?shù)脑u估。面對更加高級的情感語言表達方式(例如幽默和隱喻等), 人類經(jīng)常通過隱含映射和雙關(guān)語等間接地表達情感, 那么 ChatGPT 如何處理語言的多義性、映射和隱含信息, 是否有潛力作為情感專家也亟需業(yè)界的正確評估。最后, 鑒于 ChatGPT 是根據(jù)人類設(shè)計的提示語生成答案, 調(diào)查ChatGPT 在情感理解場景下對提示模板的敏感性顯得尤為必要。

    本文主要關(guān)注 3 個問題: 1) ChatGPT 是否能夠準(zhǔn)確地理解人類情感?與人類判斷情感的差距有多大?2) ChatGPT 是否能夠準(zhǔn)確地理解高級情感表達方式?3)不同的提示策略是否對 ChatGPT 的判定結(jié)果產(chǎn)生影響?

    本文在 5 個情感、幽默與隱喻基準(zhǔn)數(shù)據(jù)集上, 對 ChatGPT(2023 年 3 月 23 版)展開評估, 通過與領(lǐng)域內(nèi) 20 個最前沿模型的對比, 討論其在不同任務(wù)中的優(yōu)勢與局限, 對比 ChatGPT 與人類在情感、幽默和隱喻分析方面的性能。此外, 還通過系統(tǒng)性地改變提示策略, 進一步分析提示策略對 ChatGPT 理解人類情感能力的影響。

    1 相關(guān)研究

    從谷歌的 T5 到 OpenAI GPT 系列, 大語言模型不斷涌現(xiàn), 例如, GPT-3, PALM[7], Galactica[8]和LLaMA[9]。這些 LLM 以包含千億參數(shù)的模型架構(gòu)為基底, 并在大量數(shù)據(jù)集上進行訓(xùn)練。這種縮放訓(xùn)練策略提高了語言模型對自然語言的理解和生成能力, 即便不更新其參數(shù), 也在很多自然語言處理任務(wù)中帶來顯著的提升。例如, 在問答任務(wù)中, 這些LLM 通過理解問題和文本語境, 給出更加自然、流暢、準(zhǔn)確的回答[10](如 ChatGPT 模型); 在文本分類任務(wù)中, 通過對 LLM 進行微調(diào), 可以獲得比傳統(tǒng)方法更好的準(zhǔn)確率和泛化能力[11](如 BERT 模型); 在機器翻譯任務(wù)中, LLM 可用于語言表示和對齊, 幫助提高翻譯的質(zhì)量和效率(如 Transformer 模型)。

    作為基于 GPT-3.5 的對話生成模型, ChatGPT在情感分析任務(wù)中得到廣泛應(yīng)用。例如, 在對話系統(tǒng)中, ChatGPT 可以生成更加自然的情感豐富的回復(fù), 并且可以在情感分析任務(wù)中識別用戶的情感表達。越來越多的研究人員根據(jù)各種基準(zhǔn)進行評估, 探索 ChatGPT 的能力邊界。Zhuo 等[12]對 ChatGPT的可靠性和穩(wěn)定性進行定量分析, Jiao 等[13]對其多語言翻譯能力做了初步探究, Bang 等[14]從多任務(wù)、多語言和多模態(tài)方面評估 ChatGPT 的生成能力。與已有研究不同, 本文的重心是調(diào)查 ChatGPT 在主觀性任務(wù)中的表現(xiàn), 特別是對幽默和隱喻等復(fù)雜情感語言的理解能力。通過一個全面的評估, 判定ChatGPT 是否有潛力作為一個情感專家或助手, 從而促進情感智能方向的研究。

    2 評估方法

    自然語言處理領(lǐng)域一直在追求更加智能化的算法模型, 用來模擬人類對語言的處理方式。本文圍繞測試任務(wù)、實驗數(shù)據(jù)、對比模型、評價標(biāo)準(zhǔn)和實驗結(jié)果等, 對 ChatGPT 在情感分析領(lǐng)域的性能展開全面評估, 探索其在情感分析領(lǐng)域的應(yīng)用潛力。

    2.1 測試任務(wù)

    本文將開展以下 4 項代表性情感分析任務(wù)。

    1)主觀性情感分析: 從主觀性文本中自動識別和提取文本表達的情感狀態(tài), 分為積極、消極和中性 3 種。

    2)方面級情感分析: 從文本中提取特定方面(如商品價格、服務(wù)質(zhì)量和用餐環(huán)境等)的情感極性, 分為正面、負面和中性 3 種。

    3)幽默檢測: 判斷文本中是否包含幽默元素, 將文本分為幽默和非幽默兩類。

    4)隱喻識別: 對文本中的隱喻進行識別和解釋, 并判斷句子表達的是褒義還是貶義情感。

    2.2 實驗數(shù)據(jù)

    本研究選取 5 個廣泛評測的中文情感數(shù)據(jù)集: SMP2020 微博情感分類數(shù)據(jù)集(Usual 和 Virus)、SMP2020 文本幽默檢測數(shù)據(jù)集(Humor)、ASAP 中文評論分析數(shù)據(jù)集和隱喻式數(shù)據(jù)集(Metaphor)。Usual 和 Virus 數(shù)據(jù)集分別包含 6 類情緒, 將愉悅情緒(happy)歸類為積極樣本, 悲傷(sad)和憤怒(angry)情緒合并為消極樣本, 無情緒(neutral)定義為中性樣本。作為文本幽默數(shù)據(jù)集, Humor 包含幽默和非幽默標(biāo)簽, 用于幽默識別任務(wù)中。ASAP 是一個大型的中餐館評論數(shù)據(jù)集, 用于方面類別的情感分析(aspect based sentiment analysis, ABSA)。Metaphor是一個中文隱喻數(shù)據(jù)集, 包含褒義和貶義標(biāo)簽, 用于隱喻識別任務(wù)。實驗樣本分布如表 1 所示。

    本實驗將以上 5 個數(shù)據(jù)集分別用于對比評估ChatGPT 和其他 SOTA 模型。本文調(diào)用 ChatGPTAPI進行評測。同時, 本文挑選一系列最前沿的情感分析模型用于情感、幽默和隱喻任務(wù)評測。它們分別是 CMCNN[15], Bi-LSTM+Attention[16], CapsNet-BERT[17], DMM-CNN[18], CBMA[19], ACSA-gene-ration[20], AC-MIMLLN[21], QA-BERT[22], SGCN[23], DSPN[24], XLNet[25], GCN-BERT[26], DeepMet-S[27], MGF[28], BGCN[29], KEG[30], SaGE[31], BSI[32], Transformer[33]和 IASPS[34]。其中, Bi-LSTM+ Attention, CMCNN, CapsNet-BERT, GCN-BERT, DSPN, XLNet 和 DeepMet-S 模型使用 Github 開源代碼實現(xiàn), DMM-CNN, ACSA-generation, CBMA, AC-MIMLLN, BSI 和 Transformer 根據(jù)相關(guān)文獻模型和參數(shù)復(fù)現(xiàn); MGF, BGCN, QA-BERT, IASPS, KEG, SaGE 和 BSI模型直接采用文獻結(jié)果。

    2.3 評估標(biāo)準(zhǔn)

    本文采用精確率(precision,)、召回率(recall,)、微觀 F1 值(Micro-F1)和準(zhǔn)確率(accuracy, Acc)作為模型的性能評估指標(biāo)。選擇微觀 F1 指標(biāo)的原因是它在計算中考慮了每個類別的數(shù)量。評估指標(biāo)的計算公式如下:

    表1 數(shù)據(jù)集統(tǒng)計

    其中, TP 代表真陽性, FP 代表假陽性, TN 代表真陰性, FN 代表假陰性。

    3 實驗結(jié)果

    3.1 情感分析的實驗結(jié)果

    情感分析任務(wù)的分析結(jié)果如表 2 所示??梢园l(fā)現(xiàn), 在測試集上, ChatGPT 在情感分析任務(wù)中的表現(xiàn)可以媲美甚至超越其他模型。在 Usual 和 Virus數(shù)據(jù)集上, 主觀性情感分析的 Macro-F1 分別為82.16%和 80.20%, 比一些傳統(tǒng)的算法(如 Bi-LSTM +Attenion 以及 DMM-CNN 等)表現(xiàn)更好, 與使用BERT 模型提供詞向量的 CMCNN 語言模型相比, ChatGPT 的 Macro-F1 在 Usual 和 Virus 數(shù)據(jù)集上分別提升 1.37%和 2.16%。但是與 LLM 相比, Chat-GPT 的優(yōu)勢并不明顯, 相較于 MGF 模型, Macro-F1在 Usual 和 Virus 數(shù)據(jù)集上分別落后 1.70%和0.17%。從實驗結(jié)果來看, ChatGPT 在不同數(shù)據(jù)集的情感分析任務(wù)中表現(xiàn)穩(wěn)定。因此, ChatGPT 值得在實際應(yīng)用中進一步探索。

    作為更細粒度的情感分析任務(wù), 在進行方面類別情感分析時, 模型需要同時注意文本中的內(nèi)容特征、詞性特征和位置特征, 并同時充分學(xué)習(xí)內(nèi)容詞、方面詞和情感詞之間的聯(lián)系。從表 2 中 ASAP實驗結(jié)果看, ChatGPT 比其他模型(如 QA-BERT 和CapsNet-BERT 等)表現(xiàn)良好, 比端到端方式的遠監(jiān)督金字塔網(wǎng)絡(luò) DSPN 提升 3.57%, 但相比語言模型ACSA-generation 降低了 0.71%, 相比語言模型 AC-MIMLLN 降低 0.44%, 表明 ChatGPT 雖然能夠從長文本中準(zhǔn)確識別方面詞, 有效地捕捉文本中的上下文信息和情感表達, 但不能作為方面情感分析的最優(yōu)模型。

    3.2 隱喻和幽默任務(wù)的實驗結(jié)果

    從文本的語言表達層面來說, 人類情感可劃分為顯式情感和隱式情感, 隱式情感包含隱喻型和反諷型。目前, 隱喻沒有被廣泛承認(rèn)的正式定義, 本文將隱式情感理解為: 在字面意義之外的、不包含明顯的情感詞, 但通過隱晦、間接的語言片段表達出主觀情感。例如, “她的樣貌也就只能做個備胎”, 雖然句中并未出現(xiàn)情感詞匯, 但“備胎”卻被隱喻為“替補選項”, 表達說話者的負面情感。在實際情況中, 語言模型對隱喻情感的分析可能更加復(fù)雜, 這是因為隱喻的含義通常依賴語境和個人經(jīng)驗, 存在不同的解釋。因此, 對隱喻句子的情感分析需要考慮上下文、文化背景和作者意圖等因素, 是一項更具挑戰(zhàn)性的任務(wù)。本文采用的隱喻式數(shù)據(jù)集 Meta-phor 的情感示例如表 3 所示。

    表2 情感分析任務(wù)實驗結(jié)果(%)

    ChatGPT 在隱喻情感分析任務(wù)和幽默任務(wù)中的實驗結(jié)果如表 4 所示??梢园l(fā)現(xiàn), 在更加復(fù)雜的隱喻情感分析任務(wù)中, 與幾個基線模型相比, ChatGPT表現(xiàn)出色, 以 85.71%的 Macro-F1 超越 CCL 中文隱喻情感識別任務(wù)第一名約 1.01%, 比基于 RoBERTa的閱讀理解(reading comprehension)式隱喻識別模型DeepMet-S 提升 1.94%。這是由于 ChatGPT 在大規(guī)模語料集的訓(xùn)練下, 從大量數(shù)據(jù)中學(xué)習(xí)到隱喻的模式和特征。

    表3 隱喻式樣本

    從表 4 可以看出, ChatGPT 在幽默任務(wù)中的表現(xiàn)相對落后于其他模型, 與基于 BERT 的強化語境與語義信息的幽默識別模型 BSI 相比, ChatGPT 的Macro-F1 落后 7.34%, 與基于不一致、模糊、句法特性的幽默識別模型 IASPS 相比, Macro-F1 落后7.04%。幽默識別任務(wù)涉及對語言上下文和語義的深入理解, 而 ChatGPT 對這些因素的理解不一定是最優(yōu)的。例如, 一些幽默句子中包含的網(wǎng)絡(luò)用語“YYDS”和“No 作 No Die”, ChatGPT 不能識別它們的真正含義。此外, BSI 等語言模型更專注于特定類型的情感分析任務(wù), 并且使用更好的架構(gòu)和技術(shù), 因此在幽默識別任務(wù)中表現(xiàn)更好。ChatGPT 還有很大的發(fā)展空間, 未來可以進一步優(yōu)化模型, 以便適應(yīng)更復(fù)雜的自然語言處理任務(wù)。

    通過實驗還發(fā)現(xiàn), 在不改變問題線程的情況下, 隨著測試樣例的增加, ChatGPT 的性能也會相對提高(圖 1)。可以看出, 準(zhǔn)確率和 Macro-F1 隨測試樣例數(shù)同步增長, 表明ChatGPT 在不改變線程的情況下可以有效地學(xué)習(xí)到測試樣例中的有效信息, 通過數(shù)據(jù)的反饋, 不斷改進自身的情感分析能力, 從而不斷優(yōu)化自身模型。

    表4 隱喻分析的實驗結(jié)果(%)

    圖1 ChatGPT性能指標(biāo)隨測試樣例增加的變化

    4 ChatGPT 與人類判斷情感的差距

    我們使用 SMP2020 微博情緒分類技術(shù)測評公開的兩個數(shù)據(jù)集 Usual 和 Humor 以及 CCL2018 隱喻數(shù)據(jù)集 Metaphor 進行測試, 同時招募 5 名 18~35 歲不同社會身份(包括學(xué)生、工人、職員和商人等)志愿者, 經(jīng)過語言理解測試后, 對這 3 個數(shù)據(jù)集進行情感、幽默和隱喻標(biāo)注, 經(jīng)過最大投票后獲得最終標(biāo)注結(jié)果。為了調(diào)查 ChatGPT 與人類情感標(biāo)注的時間效率, 統(tǒng)計兩者的分類用時(均為 5 次結(jié)果的平均值)。

    如表 5 所示, ChatGPT 與人類評價在情感、幽默和隱喻數(shù)據(jù)集上均取得良好的分類結(jié)果(F1 值均超過 70%)。人類評價結(jié)果的準(zhǔn)確率與 Macro-F1 均超過 90%, 與 ChatGPT 相比, 人類情感專家在Usual, Virus 和 Metaphor 數(shù)據(jù)集上的 F1 值分別提升9.52%, 16.64%和 6.69%。這一結(jié)果表明: 1)情感、幽默與隱喻分析是挑戰(zhàn)性任務(wù); 2)盡管 ChatGPT 在文本生成和代碼生成等任務(wù)中取得令人矚目的進步, 但其情感理解能力與人類仍然存在較大的差距。

    表 6 給出幾個 ChatGPT 識別錯誤的案例。識別錯誤的原因包括以下幾個方面。

    1)上下文理解能力。ChatGPT 雖然擁有強大的自然語言處理能力, 但它的上下文理解能力比不上人類。情感分析任務(wù)需要結(jié)合上下文來理解句子或文本的情感含義, 人類可以通過背景知識、語境和生活經(jīng)驗, 更好地理解和識別情感, 而 ChatGPT 需要依賴已有的語料庫和模型訓(xùn)練數(shù)據(jù)。

    表5 ChatGPT和人類在情感分析任務(wù)上的實驗結(jié)果

    表6 錯誤舉例

    2)主觀性識別。情感分析是一項主觀性較強的任務(wù), 人類在情感表達和理解方面具有很強的主觀能力。然而, 對 ChatGPT 來說, 情感分析任務(wù)往往需要基于規(guī)則和標(biāo)注的方法進行分類, 這種方法很難完全覆蓋所有情感表達的多樣性和主觀性。

    3)跨文化和跨語言差異。情感分析還面臨跨文化和跨語言差異的問題。情感的表達和理解因不同文化和語言環(huán)境而異, 因此需要對不同的文化和語言進行針對性的處理和訓(xùn)練。在處理跨文化和跨語言情感時, ChatGPT 可能存在一定的困難。

    4)數(shù)據(jù)不平衡和偏差。情感分析任務(wù)需要大量的標(biāo)注數(shù)據(jù)來訓(xùn)練模型, 但是標(biāo)注數(shù)據(jù)的質(zhì)量和平衡性對模型的性能和準(zhǔn)確度具有決定性的影響。如果數(shù)據(jù)集中的情感類別存在偏差或不平衡, 將導(dǎo)致模型對某些情感的分類能力不足, 從而影響整體性能。

    綜上所述, 情感分析任務(wù)具有很強的主觀性和復(fù)雜性, ChatGPT 作為一種自然語言處理技術(shù), 還需要進一步的改進和優(yōu)化, 才能更好地處理這種任務(wù)。

    此外, 本研究從大眾點評商家用戶評價中隨機選取 800 條評論, 均分為互不重疊的兩組(A 和 B)。將 A 組輸入 ChatGPT 模型中, 輸出預(yù)測情感結(jié)果, 然后讓 3 位志愿者參考此結(jié)果進行最終標(biāo)注, 判斷該用戶對商品的情感極性。3 位志愿者能夠在 0.3小時完成 A 組 400 條評論的情感標(biāo)注, 其中 6 條評論的情感標(biāo)注錯誤, 準(zhǔn)確率達到 98.50%。B 組不采用任何人工智能輔助工具, 由 3 位志愿者直接標(biāo)注, 經(jīng)過 1.6 小時才完成標(biāo)注, 其中 11 條評論的情感標(biāo)注錯誤, 準(zhǔn)確率為 97.25%。上述結(jié)果表明 ChatGPT已經(jīng)可以直接輔助商家判斷用戶對商品的評價, 幫助商家更好地改進商品質(zhì)量。如果將其應(yīng)用到大規(guī)模客戶滿意度調(diào)研中, ChatGPT 的時效性優(yōu)勢與分析準(zhǔn)確率將會更加凸顯, 可以推動客戶滿意度調(diào)研的智能化建設(shè)。

    5 提示策略調(diào)查

    ChatGPT 是一個基于“無監(jiān)督學(xué)習(xí)”的大語言模型, 對于自然語言處理任務(wù), 特定的任務(wù)提示會觸發(fā) ChatGPT 對文本的不同理解力。受文獻[35–36]啟示, 本文試圖通過 ChatGPT 來生成對情感分析任務(wù)的 3 個提示(圖 2)。實驗中發(fā)現(xiàn), 不同的提示模板在任務(wù)中的表現(xiàn)存在差異, 因此需找出一種提示策略(本文只針對問答類提示和填空類提示), 使得ChatGPT 的判定結(jié)果較優(yōu)。

    問答類或填空類提示策略的選擇都有可能對情感分析任務(wù)的判定結(jié)果產(chǎn)生影響。如表 7 所示, 我們設(shè)計兩個提示策略, 對于問答類提示, 本文給出精確的情感極性; 對于填空類提示, 則讓 ChatGPT填上它認(rèn)為的情感, 通過對比 ChatGPT 在兩種提示下情感分析任務(wù)的性能指標(biāo), 判定哪種提示策略對ChatGPT 實現(xiàn)情感分析任務(wù)更友好。

    從表 7 可以看出, 問答類提示策略可以更清楚地填補問題的答案(例如情感分析中的積極、消極和中性), 只要提供足夠的上下文信息, ChatGPT 就可能做出更準(zhǔn)確的回答。問答類提示策略通常需要ChatGPT 對問題進行理解, 然后提取相關(guān)信息, 因此 ChatGPT 只需要從問題中獲取足夠的信息, 便可在回答問題時提供最相關(guān)的情感分析結(jié)果, 這種提示方式會使 ChatGPT 更注重文本中的關(guān)鍵信息。對于填空類提示策略, 則要求 ChatGPT 根據(jù)給定的文本和填空部分進行分析, 這種提示方式使 ChatGPT更注重上下文的理解以及對文本的整體情感的分析。在一些情況下, 填空類提示策略可能帶來更加準(zhǔn)確的情感分析結(jié)果, 因為在填空類提示策略下, ChatGPT 會更加關(guān)注文本的整體情感和上下文語境, 而不僅僅是某個特定的單詞或短語。

    圖2 ChatGPT生成情感分析提示

    表7 提示模板

    圖 3 的實驗結(jié)果表明, ChatGPT 使用填空類提示的性能指標(biāo)均優(yōu)于問答類提示??梢钥闯? 填空類提示的 F1 分值比問答類提示提高 5.41%, 表明填空類提示能提高 ChatGPT 對文本的理解力, 而不僅僅是分析文本中某個帶有情感極性的詞語, 更適合將 ChatGPT 用于情感分析任務(wù)中。

    6 結(jié)語

    本文在 5 個情感、幽默與隱喻基準(zhǔn)數(shù)據(jù)集上, 對 ChatGPT 的情感理解能力展開評估, 通過與領(lǐng)域內(nèi)最前沿模型對比, 驗證 ChatGPT 的優(yōu)勢與局限性。實驗結(jié)果表明, ChatGPT 能夠取得良好的情感識別結(jié)果, 獲得 86.07%的情感識別準(zhǔn)確率。此外, 本文也對比 ChatGPT 與人類在情感分析中的性能, 在情感、幽默和隱喻任務(wù)中的準(zhǔn)確率比人類結(jié)果低 9.52%, 16.64%和 6.69%。因此, 盡管 ChatGPT 在對話生成方面獲得最佳表現(xiàn), 但是其在情感理解方面仍具有改進的潛力。最后, 本文嘗試通過改善提示模板, 表明 ChatGPT 在情感理解場景下對填空提示策略的適應(yīng)性更好。總而言之, 與情感分析模型和人類情感相比, ChatGPT 在性能上尚需要進一步改善, 但是在 80.61%的案例中獲得可接受的結(jié)果, 時間效率明顯提升, 在實時性情感分析場景下, 可以作為情感分析助手, 輔助人類展開情感判斷。

    圖3 提示策略的實驗結(jié)果

    本文結(jié)果表明, ChatGPT 在理解語言方面表現(xiàn)出色, 但它僅能理解人類語言的表層含義, 對語言背后的深層含義和真正意圖的理解能力仍然有限。因此, ChatGPT 在處理復(fù)雜的語言任務(wù)(例如推理和隱喻理解等)時, 表現(xiàn)不如人類。此外, Chat-GPT 在訓(xùn)練時僅通過海量的文本數(shù)據(jù)來學(xué)習(xí)語言規(guī)律和模式, 而缺乏外部知識和常識的補充。因此, 當(dāng)需要進行跨領(lǐng)域或跨知識庫的任務(wù)時, ChatGPT可能缺乏相關(guān)領(lǐng)域的專業(yè)知識和常識, 導(dǎo)致模型輸出的錯誤或不準(zhǔn)確。

    由于算力與成本限制, 本文僅針對大語言模型中最具代表性的 ChatGPT 展開調(diào)查, 忽略了其他已提出的大語言模型, 如 GPT-4, LLaMA 和 BLOOM等。此外, 本文提出 4 種情感測試場景, 忽略了其他類型的情感分析任務(wù)(如諷刺識別和欲望檢測等)。對其他大語言模型展開全面的對比與評估, 對實現(xiàn)通用情感智能尤為必要, 也將是我們未來的研究方向。

    [1] Payal M. Unexpected surprise: emotion analysis and aspect based sentiment analysis (ABSA) of user ge-nerated comments to study behavioral intentions of tourists. Tourism Management Perspectives, 2023, 45: 101063

    [2] Wang T, Roberts A, Hesslow D, et al. What language model architecture and pretraining objective works best for zero-shot generalization? // International Conference on Machine Learning. Baltimore, 2022: 22964–22984

    [3] Tom B, Benjamin M, Nick R, et al. Language models are few-shot learners. Advances in Neural Information Processing Systems, 2020, 33: 1877–1901

    [4] Long Ouyang, Jeff W, Xu Jiang, et al. Training lan-guage models to follow instructions with human feed-back. Advances in Neural Information Processing Systems, 2022, 35: 27730–27744

    [5] Cao Z, Wong K C, Lin C T. Weak human preference supervision for deep reinforcement learning. IEEE Transactions on Neural Networks and Learning Sys-tems, 2021, 32(12): 5369–5378

    [6] Xu F F, Alon U, Neubig G, et al. A systematic eva-luation of large language models of code // Pro-ceedings of the 6th ACM SIGPLAN International Symposium on Machine Programming. New York, 2022: 1–10

    [7] Chen T, Allauzen C, Huang Y, et al. Large-scale language model rescoring on long-form data // 2023 IEEE International Conference on Acoustics. Rhodes Island, 2023: 1–5

    [8] Taylor R, Kardas M, Cucurull G, et al. Galactica: a large language model for science [EB/OL]. (2022–11–16)[2023–05–30]. https://doi.org/10.48550/arXiv.2211. 09085

    [9] Touvron H, Lavril T, Izacard G, et al. LLaMA: open and efficient foundation language models [EB/OL]. (2023–02–27) [2023–05–30]. https://doi.org/10.48550 /arXiv.2302.13971

    [10] Wang Zengzhi, Xie Qiming, Ding Zixiang, et al. Is ChatGPT a good sentiment analyzer? A preliminary study [EB/OL]. (2023–04–10) [2023–05–30]. https:// doi.org/10.48550/arXiv.2304.04339

    [11] Li Wenchang, Chen Yixing, John P L. Stars are all you need: a distantly supervised pyramid network for document-level end-to-end sentiment analysis [EB/ OL]. (2023–05–02)[2023–05–30]. https://doi.org/10.4 8550/arXiv.2305.01710

    [12] Zhuo T Y, Huang Yuyin, Chen Chunyang, et al. Exp-loring AI ethics of ChatGPT: a diagnostic analysis [EB/OL]. (2023–05–29) [2023–05–30]. https://doi.org/ 10.48550/arXiv.2301.12867

    [13] Jiao Wenxiang, Wang Wenxuan, Huang J, et al. Is ChatGPT a good translator? A preliminary study [EB/OL]. (2023–03–19) [2023–05–30]. https://doi.org/ 10.48550/arXiv.2301.08745

    [14] Bang Yejin, Cahyawijaya S, Lee N, et al. A multitask, multilingual, multimodal evaluation of ChatGPT on reasoning, hallucination, and interactivity [EB/OL]. (2023–02–28)[2023–05–30]. https://doi.org/10.48550/ arXiv.2302.04023

    [15] Liu Chang, Wang Jie, Liu Xuemeng, et al. Deep CM-CNN for spectrum sensing in cognitive radio. IEEE Journal on Selected Areas in Communications, 2019, 37(10): 2306–2321

    [16] 李衛(wèi)疆, 漆芳. 基于多通道雙向長短期記憶網(wǎng)絡(luò)的情感分析. 中文信息學(xué)報, 2019, 33(12): 119–128

    [17] Jiang Q, Chen L, Xu R, et al. A challenge dataset and effective models for aspect-based sentiment analysis // Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP). Hong Kong, 2019: 6280–6285

    [18] Mao Longbiao, Yan Yan, Xue Jinghao, et al. Deep multi-task multi-label CNN for effective facial attri-bute classification. IEEE Transactions on Affective Computing, 2020, 13(2): 818–828

    [19] Wang Bingkun, Shan Donghong, Fan Aiwan, et al. A sentiment classification method of web social media based on multidimensional and multilevel modeling. IEEE Transactions on Industrial Informatics, 2022, 18(2): 1240–1249

    [20] Liu Jian, Teng Zhiyang, Cui Leyang, et al. Solving aspect category sentiment analysis as a text generation task // Proceedings of the 2021 Conference on Empi-rical Methods in Natural Language Processing. Punta Cana, 2021: 4406–4416

    [21] Li Yuncong, Yang Zhe, Yin Cunxiang, et al. A joint model for aspect-category sentiment analysis with shared sentiment prediction layer // China National Conference on Chinese Computational Linguistics. Hainan, 2020: 388–400

    [22] Jia S, Cao J. The method for plausibility evaluation of knowledge triple based on QA // China Conference on Knowledge Graph and Semantic Computing. Singa-pore, 2022: 228–235

    [23] 方澄, 李貝, 韓萍, 等. 基于語法依存圖的中文微博細粒度情感分類. 計算機應(yīng)用, 2023, 43(4): 1056–1061

    [24] Amoroso F. Adaptive A/D converter to suppress CW interference in DSPN spread-spectrum communica-tions. IEEE Transactions on communications, 1983, 31(10): 1117–1123

    [25] Yang Z, Dai Z, Yang Y, et al. XLNet: generalized autoregressive pretraining for language understanding. Advances in Neural Information Processing Systems, 2019, 32: 5754–5764

    [26] Liu B. GCN-BERT and memory network based multi-label classification for event text of the Chinese government hotline. IEEE Access, 2022, 10: 109267–109276

    [27] LeCun Y, Bengio Y, Hinton G. Deep learning. Nature, 2015, 521: 436–444

    [28] 楊春霞, 姚思誠, 宋金劍. 一種融合字詞信息的中文情感分析模型. 計算機工程與科學(xué), 45(3): 512–519

    [29] 方澄, 李貝, 韓萍. 基于全局特征圖的半監(jiān)督微博文本情感分類. 信號處理, 2021, 37(6): 1066–1074

    [30] Khan S, Naseer M, Hayat M, et al. Transformers in vision: a survey. ACM Computing Surveys (CSUR), 2022, 54(10): 1–41

    [31] 張聲龍, 劉穎, 馬艷軍. SaGE: 基于句法感知圖 卷積神經(jīng)網(wǎng)絡(luò)和ELECTRA的中文隱喻識別模型// 第二十屆中國計算語言學(xué)大會. 呼和浩特, 2021: 667–677

    [32] Deepa M D. Bidirectional encoder representations from transformers (BERT) language model for senti-ment analysis task. Turkish Journal of Computer and Mathematics Education, 2021, 12(7): 1708–1721

    [33] Cao H, Wang Y, Chen J, et al. Swin-Unet: Unet-like pure transformer for medical image segmentation // European conference on computer vision. Cham, 2022: 205–218

    [34] 趙一鳴, 潘沛, 毛進. 基于任務(wù)知識融合與文本數(shù)據(jù)增強的醫(yī)學(xué)信息查詢意圖強度識別研究. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2023, 7(2): 38–47

    [35] Brown T, Mann B, Ryder N, et al. Language models are few-shot learners. Advances in Neural Information Processing Systems, 2020, 33: 1877–1901

    [36] Wei J, Wang Xuezhi, Schuurmans D, et al. Chain-of-thought prompting elicits reasoning in large language models. Advances in Neural Information Processing Systems, 2022, 35: 24824–24837

    Can ChatGPT Be Served as the Sentiment Expert? An Evaluation of ChatGPT on Sentiment and Metaphor Analysis

    ZHANG Yazhou1,2, WANG Mengyao1, RONG Lu3, YU Yang1, ZHAO Dongming4, QIN Jing2,?

    1. School of Software Engineering, Zhengzhou University of Light Industry, Zhengzhou 450002; 2. School of Nursing, The Hong Kong Polytechnic University, Hong Kong 999077; 3. Human Resources Office, Zhengzhou University of Light Industry, Zhengzhou 450002; 4. Artificial Intelligence Laboratory, China Mobile Communication Group Tianjin Co, Tianjin 300020; ? Corresponding author, E-mail: harry.qin@polyu.edu.hk

    To explore the potential for subjective understanding, the subjectivity and metaphorical nature of ChatGPT, this paper evaluates ChatGPT on five sentiment, humor, and metaphor benchmark datasets and discusses its strengths and limitations on different tasks by comparing it with the most cutting-edge models in the field. In addition, this paper also compares the performance of ChatGPT and humans in sentiment analysis, with gaps of 9.52%, 16.64% and 6.69% in human results on sentiment, humor and metaphor tasks. The results suggest that although ChatGPT achieves the best performance in dialogue generation, it still has potential for improvement in sentiment understanding. Finally, this paper investigates ChatGPT’s sensitivity to cueing templates in an emotion understanding scenario by improving the cueing templates.

    ChatGPT; sentiment analysis; humor detection; metaphor recognition

    猜你喜歡
    人類文本情感
    人類能否一覺到未來?
    如何在情感中自我成長,保持獨立
    人類第一殺手
    好孩子畫報(2020年5期)2020-06-27 14:08:05
    失落的情感
    北極光(2019年12期)2020-01-18 06:22:10
    情感
    在808DA上文本顯示的改善
    1100億個人類的清明
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    如何在情感中自我成長,保持獨立
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    aaaaa片日本免费| 日本黄色视频三级网站网址| 精品一品国产午夜福利视频| 国产亚洲精品久久久久5区| 午夜精品久久久久久毛片777| √禁漫天堂资源中文www| 两性午夜刺激爽爽歪歪视频在线观看 | 岛国视频午夜一区免费看| 日韩欧美免费精品| 国产精品秋霞免费鲁丝片| xxxhd国产人妻xxx| 国产精品98久久久久久宅男小说| 亚洲精品久久成人aⅴ小说| 免费观看人在逋| 午夜老司机福利片| 久久国产亚洲av麻豆专区| 精品国产超薄肉色丝袜足j| 婷婷六月久久综合丁香| 这个男人来自地球电影免费观看| 黄色丝袜av网址大全| 日韩精品中文字幕看吧| 精品国产一区二区三区四区第35| 69av精品久久久久久| 十分钟在线观看高清视频www| 国产成人精品久久二区二区免费| 大型黄色视频在线免费观看| 欧美日韩中文字幕国产精品一区二区三区 | 国产av精品麻豆| 男人操女人黄网站| 日日爽夜夜爽网站| 天天躁夜夜躁狠狠躁躁| videosex国产| 女人精品久久久久毛片| 免费在线观看视频国产中文字幕亚洲| 99re在线观看精品视频| 老鸭窝网址在线观看| 国产亚洲欧美精品永久| 精品福利观看| 精品乱码久久久久久99久播| 一区在线观看完整版| 精品第一国产精品| 亚洲 欧美 日韩 在线 免费| 亚洲精品美女久久久久99蜜臀| 日韩高清综合在线| 熟女少妇亚洲综合色aaa.| av电影中文网址| 免费看a级黄色片| 久久久久久大精品| 欧美一级毛片孕妇| av免费在线观看网站| 午夜a级毛片| 日韩av在线大香蕉| 黄色丝袜av网址大全| 女同久久另类99精品国产91| 岛国视频午夜一区免费看| 在线观看免费日韩欧美大片| 50天的宝宝边吃奶边哭怎么回事| 亚洲精品中文字幕在线视频| 成人亚洲精品一区在线观看| 国产成人欧美在线观看| 亚洲国产精品合色在线| 在线永久观看黄色视频| 成年人黄色毛片网站| 9色porny在线观看| 久久人人97超碰香蕉20202| 成年人免费黄色播放视频| 久久久国产成人免费| 国产成人av激情在线播放| 在线观看www视频免费| 99热只有精品国产| 一进一出抽搐动态| 欧美性长视频在线观看| 国产免费av片在线观看野外av| 极品教师在线免费播放| 欧美中文综合在线视频| 欧美激情久久久久久爽电影 | 日本a在线网址| 久久久久国产一级毛片高清牌| 国产精品久久久久成人av| 成人三级黄色视频| 久久精品91无色码中文字幕| 国产成人av激情在线播放| 老司机靠b影院| 琪琪午夜伦伦电影理论片6080| 国产极品粉嫩免费观看在线| 老司机深夜福利视频在线观看| 无遮挡黄片免费观看| 狠狠狠狠99中文字幕| 久久久国产一区二区| 一边摸一边抽搐一进一出视频| 国产精品香港三级国产av潘金莲| 成人手机av| 99精品在免费线老司机午夜| 午夜视频精品福利| 中文字幕人妻丝袜制服| 精品日产1卡2卡| 欧美精品亚洲一区二区| 日韩三级视频一区二区三区| 国产精品国产高清国产av| 亚洲国产看品久久| 在线观看免费日韩欧美大片| 9191精品国产免费久久| 日韩 欧美 亚洲 中文字幕| 精品福利永久在线观看| 亚洲精品久久午夜乱码| 男女午夜视频在线观看| 男女下面插进去视频免费观看| 亚洲国产中文字幕在线视频| 热re99久久精品国产66热6| 亚洲精品美女久久久久99蜜臀| 操出白浆在线播放| 亚洲va日本ⅴa欧美va伊人久久| 日韩 欧美 亚洲 中文字幕| 色精品久久人妻99蜜桃| 亚洲色图综合在线观看| 丁香欧美五月| 久久精品亚洲av国产电影网| 欧美乱码精品一区二区三区| 两个人免费观看高清视频| 嫁个100分男人电影在线观看| 国产在线精品亚洲第一网站| 国产男靠女视频免费网站| 欧美日韩乱码在线| 精品久久久久久久久久免费视频 | 18美女黄网站色大片免费观看| 丰满迷人的少妇在线观看| 老汉色∧v一级毛片| 久久久国产精品麻豆| 国产97色在线日韩免费| 九色亚洲精品在线播放| 国产三级黄色录像| 精品久久久久久成人av| 免费在线观看影片大全网站| а√天堂www在线а√下载| 日韩欧美在线二视频| 久久香蕉精品热| 亚洲熟妇熟女久久| 精品久久久久久成人av| 999久久久国产精品视频| 欧美日韩亚洲综合一区二区三区_| 人妻久久中文字幕网| 变态另类成人亚洲欧美熟女 | 久久久国产成人免费| 精品卡一卡二卡四卡免费| 在线视频色国产色| a在线观看视频网站| 欧美最黄视频在线播放免费 | 精品熟女少妇八av免费久了| 757午夜福利合集在线观看| 国产一卡二卡三卡精品| 免费不卡黄色视频| 欧美成人午夜精品| 久久久国产精品麻豆| 精品欧美一区二区三区在线| 老司机靠b影院| 叶爱在线成人免费视频播放| 国内久久婷婷六月综合欲色啪| 色哟哟哟哟哟哟| 国产一区二区三区在线臀色熟女 | 男女床上黄色一级片免费看| 欧美黄色淫秽网站| 久热爱精品视频在线9| 久久精品影院6| 国产精品亚洲av一区麻豆| 亚洲精品一卡2卡三卡4卡5卡| 1024香蕉在线观看| 性少妇av在线| 在线观看www视频免费| 国产成人精品在线电影| 成人18禁高潮啪啪吃奶动态图| 嫩草影视91久久| 欧美在线一区亚洲| 精品高清国产在线一区| 亚洲视频免费观看视频| 夜夜夜夜夜久久久久| 久久国产精品影院| 国内毛片毛片毛片毛片毛片| 黄色a级毛片大全视频| 韩国精品一区二区三区| 久久久久九九精品影院| 两性午夜刺激爽爽歪歪视频在线观看 | 久久久精品国产亚洲av高清涩受| 国产精品免费视频内射| 大陆偷拍与自拍| 伦理电影免费视频| 波多野结衣av一区二区av| 久久天躁狠狠躁夜夜2o2o| 脱女人内裤的视频| 久久狼人影院| 精品一区二区三区四区五区乱码| 亚洲欧美激情在线| 国产成人精品久久二区二区91| 久久国产精品人妻蜜桃| 乱人伦中国视频| 人成视频在线观看免费观看| 国产成人精品久久二区二区免费| 免费在线观看完整版高清| 性少妇av在线| 亚洲成人免费电影在线观看| 黑丝袜美女国产一区| 午夜成年电影在线免费观看| 无遮挡黄片免费观看| 一区二区三区精品91| 一区二区三区国产精品乱码| 欧美黄色片欧美黄色片| 亚洲精品国产一区二区精华液| 不卡一级毛片| 一级,二级,三级黄色视频| 一区二区三区国产精品乱码| 岛国视频午夜一区免费看| 成人国语在线视频| 女人被躁到高潮嗷嗷叫费观| 亚洲精华国产精华精| 可以在线观看毛片的网站| 亚洲国产精品999在线| 久久九九热精品免费| 亚洲一区二区三区不卡视频| 午夜免费观看网址| av片东京热男人的天堂| 黄色 视频免费看| 亚洲欧美一区二区三区黑人| 在线国产一区二区在线| 日本 av在线| 国产精品美女特级片免费视频播放器 | 在线观看舔阴道视频| 丰满的人妻完整版| 久久久国产成人精品二区 | 视频区图区小说| 757午夜福利合集在线观看| 国产一区二区三区综合在线观看| 国产精品久久电影中文字幕| 国产深夜福利视频在线观看| 国产熟女午夜一区二区三区| 午夜两性在线视频| 久久久久久久久久久久大奶| 中文字幕精品免费在线观看视频| 90打野战视频偷拍视频| xxxhd国产人妻xxx| a级片在线免费高清观看视频| 国产区一区二久久| 久久久久久免费高清国产稀缺| 亚洲av第一区精品v没综合| 精品久久久久久久久久免费视频 | 后天国语完整版免费观看| 色老头精品视频在线观看| 久久精品国产综合久久久| 丰满的人妻完整版| 久久久国产一区二区| 自线自在国产av| 国产精品久久视频播放| 久久精品亚洲熟妇少妇任你| 午夜福利在线免费观看网站| 免费观看精品视频网站| 国产精品免费一区二区三区在线| 精品久久久久久成人av| 亚洲第一av免费看| 欧美黄色淫秽网站| 乱人伦中国视频| 中文欧美无线码| 日韩国内少妇激情av| 在线天堂中文资源库| 国产成人啪精品午夜网站| av中文乱码字幕在线| 久久九九热精品免费| 欧美不卡视频在线免费观看 | 777久久人妻少妇嫩草av网站| 精品久久久久久久毛片微露脸| 91大片在线观看| 美女午夜性视频免费| 久99久视频精品免费| 久久国产精品影院| 一个人观看的视频www高清免费观看 | 成人18禁高潮啪啪吃奶动态图| 在线观看一区二区三区激情| 国产亚洲欧美98| 少妇粗大呻吟视频| 午夜精品在线福利| 动漫黄色视频在线观看| 在线观看午夜福利视频| 国产精品98久久久久久宅男小说| 69av精品久久久久久| 咕卡用的链子| 亚洲av日韩精品久久久久久密| 久久国产精品人妻蜜桃| 1024香蕉在线观看| 伦理电影免费视频| 80岁老熟妇乱子伦牲交| 在线av久久热| av天堂在线播放| 别揉我奶头~嗯~啊~动态视频| 一级a爱视频在线免费观看| 91av网站免费观看| 一本综合久久免费| 免费高清在线观看日韩| 脱女人内裤的视频| 天堂√8在线中文| 成人18禁在线播放| 久热这里只有精品99| 国产亚洲欧美98| 精品电影一区二区在线| 成人手机av| 变态另类成人亚洲欧美熟女 | www.精华液| 日本五十路高清| 亚洲人成电影免费在线| 麻豆久久精品国产亚洲av | 纯流量卡能插随身wifi吗| 亚洲一区二区三区欧美精品| av免费在线观看网站| 亚洲欧美一区二区三区黑人| 不卡av一区二区三区| 亚洲av日韩精品久久久久久密| 亚洲欧美日韩高清在线视频| 88av欧美| 久久久久久久久免费视频了| 国产精品免费一区二区三区在线| 成人18禁高潮啪啪吃奶动态图| 国产主播在线观看一区二区| 亚洲国产中文字幕在线视频| 欧美黑人精品巨大| 亚洲国产中文字幕在线视频| 欧美黑人精品巨大| 成人18禁在线播放| 精品国产美女av久久久久小说| 婷婷丁香在线五月| 欧美在线黄色| 成人三级做爰电影| 国产不卡一卡二| 欧美中文日本在线观看视频| 亚洲国产毛片av蜜桃av| 少妇的丰满在线观看| 最好的美女福利视频网| 97超级碰碰碰精品色视频在线观看| 国产高清视频在线播放一区| 久久精品亚洲av国产电影网| 麻豆成人av在线观看| 一个人观看的视频www高清免费观看 | 国产亚洲精品第一综合不卡| 国产97色在线日韩免费| 亚洲欧美日韩无卡精品| 亚洲第一欧美日韩一区二区三区| 国产一区在线观看成人免费| 中出人妻视频一区二区| 久久狼人影院| 欧美日韩亚洲国产一区二区在线观看| 日韩精品免费视频一区二区三区| 久久伊人香网站| 亚洲片人在线观看| 国产片内射在线| 亚洲片人在线观看| 国产片内射在线| 80岁老熟妇乱子伦牲交| 国产高清国产精品国产三级| 美女高潮喷水抽搐中文字幕| 我的亚洲天堂| 成年人免费黄色播放视频| 夜夜躁狠狠躁天天躁| 99热只有精品国产| 脱女人内裤的视频| 欧美日韩中文字幕国产精品一区二区三区 | www.精华液| 国产精品香港三级国产av潘金莲| 国产精品永久免费网站| 欧美老熟妇乱子伦牲交| 精品国产乱子伦一区二区三区| 欧美黑人欧美精品刺激| xxxhd国产人妻xxx| 视频区欧美日本亚洲| 国产成人免费无遮挡视频| 国产精品二区激情视频| 亚洲精品av麻豆狂野| 欧美激情极品国产一区二区三区| 色播在线永久视频| 国产精品av久久久久免费| 午夜91福利影院| 99国产综合亚洲精品| 女人爽到高潮嗷嗷叫在线视频| 免费高清在线观看日韩| 美国免费a级毛片| 精品国产乱码久久久久久男人| netflix在线观看网站| 午夜福利在线免费观看网站| 老司机深夜福利视频在线观看| 黄频高清免费视频| 亚洲色图av天堂| 免费搜索国产男女视频| 变态另类成人亚洲欧美熟女 | 最近最新中文字幕大全电影3 | 国产99白浆流出| 中文欧美无线码| 999精品在线视频| 欧美色视频一区免费| 欧美亚洲日本最大视频资源| 国产精品美女特级片免费视频播放器 | 91成人精品电影| aaaaa片日本免费| 亚洲美女黄片视频| 免费久久久久久久精品成人欧美视频| 国产野战对白在线观看| 久久久国产成人免费| 亚洲欧美日韩另类电影网站| 亚洲av第一区精品v没综合| 国产激情欧美一区二区| 一区二区日韩欧美中文字幕| 最近最新中文字幕大全电影3 | 变态另类成人亚洲欧美熟女 | 成人18禁高潮啪啪吃奶动态图| 亚洲av美国av| 国产精品野战在线观看 | 国产精品98久久久久久宅男小说| 国产精华一区二区三区| 精品国内亚洲2022精品成人| 国产一区二区三区在线臀色熟女 | 18禁裸乳无遮挡免费网站照片 | 91老司机精品| 国产黄a三级三级三级人| 一级毛片精品| 久久人妻福利社区极品人妻图片| 9热在线视频观看99| 亚洲国产欧美一区二区综合| 精品国产亚洲在线| 母亲3免费完整高清在线观看| 99国产精品一区二区三区| 99精品欧美一区二区三区四区| 国内久久婷婷六月综合欲色啪| 婷婷六月久久综合丁香| 精品久久久久久久久久免费视频 | 国产片内射在线| 亚洲男人天堂网一区| 99精品在免费线老司机午夜| 亚洲九九香蕉| 亚洲精品一卡2卡三卡4卡5卡| 黄片大片在线免费观看| 成人av一区二区三区在线看| 亚洲免费av在线视频| 久久国产精品男人的天堂亚洲| 法律面前人人平等表现在哪些方面| 18禁国产床啪视频网站| 黄色毛片三级朝国网站| 中文字幕另类日韩欧美亚洲嫩草| 国产精品1区2区在线观看.| 国产成人影院久久av| 亚洲精品国产区一区二| 性少妇av在线| 亚洲片人在线观看| 黄色怎么调成土黄色| 久久久久久大精品| 日韩精品中文字幕看吧| 久久精品亚洲av国产电影网| 99久久人妻综合| 中出人妻视频一区二区| 亚洲精品一二三| 一级毛片女人18水好多| 香蕉丝袜av| 国产精品国产高清国产av| 99riav亚洲国产免费| 成人av一区二区三区在线看| 女人被狂操c到高潮| 日本 av在线| 精品一区二区三区av网在线观看| 黑丝袜美女国产一区| 又黄又爽又免费观看的视频| 青草久久国产| av中文乱码字幕在线| 欧美日韩亚洲国产一区二区在线观看| 亚洲男人天堂网一区| 一区二区三区国产精品乱码| 国产成人精品无人区| 日韩中文字幕欧美一区二区| x7x7x7水蜜桃| 日韩欧美一区视频在线观看| 我的亚洲天堂| 精品国产乱码久久久久久男人| 水蜜桃什么品种好| 久久久国产成人免费| 午夜影院日韩av| 黑人猛操日本美女一级片| 老汉色av国产亚洲站长工具| 91九色精品人成在线观看| 满18在线观看网站| 国产一区二区三区视频了| 免费在线观看亚洲国产| 日韩欧美一区视频在线观看| 可以在线观看毛片的网站| 中文字幕另类日韩欧美亚洲嫩草| 在线观看免费视频日本深夜| 免费在线观看黄色视频的| 一级a爱片免费观看的视频| 色尼玛亚洲综合影院| 国产精品一区二区三区四区久久 | 国产亚洲欧美98| 午夜福利一区二区在线看| 亚洲色图综合在线观看| 51午夜福利影视在线观看| 亚洲欧美激情在线| 日本vs欧美在线观看视频| 在线观看免费视频网站a站| 怎么达到女性高潮| 精品免费久久久久久久清纯| 激情视频va一区二区三区| 精品一区二区三区四区五区乱码| 欧美黑人精品巨大| 久久国产亚洲av麻豆专区| 亚洲一码二码三码区别大吗| 国产无遮挡羞羞视频在线观看| 97超级碰碰碰精品色视频在线观看| 80岁老熟妇乱子伦牲交| 真人做人爱边吃奶动态| 69av精品久久久久久| 999精品在线视频| 女人被狂操c到高潮| 欧美老熟妇乱子伦牲交| 国产熟女xx| 18美女黄网站色大片免费观看| 大型黄色视频在线免费观看| 欧洲精品卡2卡3卡4卡5卡区| 啦啦啦 在线观看视频| 国产精品乱码一区二三区的特点 | 怎么达到女性高潮| 久久精品国产亚洲av高清一级| 妹子高潮喷水视频| 精品久久蜜臀av无| 国产欧美日韩精品亚洲av| 国产精品久久久久成人av| 成人手机av| 久久国产乱子伦精品免费另类| 91大片在线观看| 大陆偷拍与自拍| 国产视频一区二区在线看| 国产成人av教育| 两个人免费观看高清视频| 美女福利国产在线| 久久精品91无色码中文字幕| 亚洲伊人色综图| 国产人伦9x9x在线观看| 午夜福利免费观看在线| 亚洲欧美日韩另类电影网站| 色婷婷av一区二区三区视频| 国产在线观看jvid| 国产成人啪精品午夜网站| 亚洲精品一二三| 搡老熟女国产l中国老女人| 一级片免费观看大全| 在线观看免费视频日本深夜| 真人一进一出gif抽搐免费| 午夜影院日韩av| 久久久久久久久免费视频了| а√天堂www在线а√下载| 免费在线观看影片大全网站| 校园春色视频在线观看| 国产亚洲欧美在线一区二区| 国产精品99久久99久久久不卡| 久久久精品国产亚洲av高清涩受| 免费av毛片视频| 亚洲av成人一区二区三| 黄片大片在线免费观看| 在线视频色国产色| 免费在线观看日本一区| 免费人成视频x8x8入口观看| 黑人巨大精品欧美一区二区蜜桃| 伦理电影免费视频| 中文字幕另类日韩欧美亚洲嫩草| 身体一侧抽搐| 熟女少妇亚洲综合色aaa.| 亚洲av日韩精品久久久久久密| 一级a爱视频在线免费观看| 日本vs欧美在线观看视频| 黄片小视频在线播放| 一本综合久久免费| 国产av又大| 国产又色又爽无遮挡免费看| 男男h啪啪无遮挡| 视频在线观看一区二区三区| 色在线成人网| 日韩大尺度精品在线看网址 | 丰满人妻熟妇乱又伦精品不卡| 嫩草影院精品99| 少妇 在线观看| 在线av久久热| 99在线人妻在线中文字幕| 九色亚洲精品在线播放| 两人在一起打扑克的视频| 亚洲成av片中文字幕在线观看| www日本在线高清视频| 18禁黄网站禁片午夜丰满| 1024香蕉在线观看| 久久精品亚洲熟妇少妇任你| 国产极品粉嫩免费观看在线| 18禁国产床啪视频网站| 欧美国产精品va在线观看不卡| 亚洲人成电影免费在线| 他把我摸到了高潮在线观看| 无限看片的www在线观看| 中文字幕人妻熟女乱码| 一进一出好大好爽视频| 欧美人与性动交α欧美软件| 欧美日韩视频精品一区| 亚洲片人在线观看| 搡老熟女国产l中国老女人| 欧美色视频一区免费| 两个人免费观看高清视频| 午夜福利影视在线免费观看| 别揉我奶头~嗯~啊~动态视频| 另类亚洲欧美激情| 欧美 亚洲 国产 日韩一| 国产国语露脸激情在线看| 他把我摸到了高潮在线观看| 欧美 亚洲 国产 日韩一| 黄色片一级片一级黄色片| 99热只有精品国产| 亚洲一区中文字幕在线| 日韩一卡2卡3卡4卡2021年| 免费高清视频大片| 又紧又爽又黄一区二区| 亚洲成国产人片在线观看|