馮洪海 李利敏 宋舒晗
摘要:為了緩解人們?cè)谏顗毫ο鲁霈F(xiàn)的心理亞健康,設(shè)計(jì)一個(gè)通過(guò)詞匯替換自動(dòng)生成幽默的方法。該方法將可以互相替換的詞匯放在一個(gè)詞匯集合中,稱為語(yǔ)用群。語(yǔ)用群中的詞匯需滿足以下兩個(gè)條件:同一個(gè)語(yǔ)用群中每個(gè)詞匯的上位概念(superordinate concept)相同;同一個(gè)語(yǔ)用群中每個(gè)詞匯在語(yǔ)言學(xué)中的用途相同。通過(guò)替換方法可以生成4種幽默類型:說(shuō)反話型、答非所問(wèn)型、明知故犯型、張冠李戴型。結(jié)果表明,句子中的某一個(gè)位置有細(xì)小變動(dòng)就可能產(chǎn)生幽默效果。
關(guān)鍵詞:計(jì)算機(jī)幽默;語(yǔ)用群;上位概念;詞匯替換
DOIDOI:10.11907/rjdk.181180
中圖分類號(hào):TP301
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2018)010-0041-03
英文摘要Abstract:In order to alleviate the mental sub-health phenomenon that people appear under the pressure of life, this paper designs a method of automatically generating humor through the replacement of vocabulary.In this algorithm,the words that can be replaced by each other are put in a vocabulary collection,which is called pragmatic group.The creation of pragmatic groups needs to satisfy two conditions:the same superordinate concept for each word in the same pragmatic group and each word in the same pragmatic group is used for the same purpose.There are four types of humor that can be generated by the alternative method:talking about the opposite, answering non-question, violate knowingly, confusing each other.To sum up,when there is a small change in the position of a sentence,it is possible to produce a humorous effect.
英文關(guān)鍵詞Key Words:computer humor;pragmatic group;superordinate concept;lexicon replacement
0 引言
隨著幽默的跨學(xué)科研究,計(jì)算機(jī)幽默也隨之出現(xiàn)。Morkes等[1]研究了幽默在涉及HCI和計(jì)算機(jī)介導(dǎo)溝通(CMC)任務(wù)情況中的效果。Hübler等[2]發(fā)現(xiàn)了精神幽默模式,并將其應(yīng)用到大學(xué)寫作中心郵件列表的修飾中。Taylor[3]提出一個(gè)確定短文本是否為笑話的計(jì)算機(jī)幽默探測(cè)器。Friedman等[4]探討了面向計(jì)算機(jī)的幽默(COHUM),然后提供了一個(gè)框架和一個(gè)全面的分類,并將COHUM放置在更廣泛的幽默研究中。Nijholt等[5]對(duì)人機(jī)交互中的幽默進(jìn)行簡(jiǎn)短調(diào)查,發(fā)現(xiàn)計(jì)算機(jī)幽默在人機(jī)交互中還是一個(gè)被忽略的研究領(lǐng)域。Ritchie[6]強(qiáng)調(diào)基于“不一致”模型實(shí)現(xiàn)涉及有限形式的雙關(guān)語(yǔ)。Binsted等[7]利用計(jì)算機(jī)設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于簡(jiǎn)單雙關(guān)語(yǔ)謎語(yǔ)的正式語(yǔ)義和語(yǔ)法規(guī)則模型。Ritchie等[8]為具有復(fù)雜交流需求(CCN)的兒童開發(fā)了一個(gè)謎語(yǔ)生成器。Valitutti等[9]利用詞匯替換實(shí)現(xiàn)了成人幽默的自動(dòng)生成,但用于替換的詞匯主要涉及兩性、禁忌、侮辱性等語(yǔ)境詞匯。國(guó)內(nèi)雖然在情感表達(dá)和識(shí)別方面有研究,但在計(jì)算機(jī)幽默創(chuàng)作方面還很少有涉足。嚴(yán)扣鳳[10]提出可以通過(guò)語(yǔ)言的模糊性創(chuàng)造幽默效果,例如語(yǔ)音、詞匯、語(yǔ)義的模糊。
語(yǔ)用群是幽默的典型成分[11]。受語(yǔ)料庫(kù)啟發(fā),本文根據(jù)詞匯的用法建立了語(yǔ)用群,提出一種新的基于語(yǔ)用群中詞匯替換的幽默生成算法,同一個(gè)語(yǔ)用群中的詞匯不限定于特定語(yǔ)境,只需要滿足詞匯上位概念相同或在語(yǔ)言學(xué)中詞語(yǔ)用途相同即可。通過(guò)該方法替換后的文本放到原語(yǔ)境中通??梢援a(chǎn)生幽默效果。
1 語(yǔ)用群創(chuàng)建
1.1 術(shù)語(yǔ)定義
原句:忠實(shí)于上下文語(yǔ)義的句子,沒(méi)有幽默效果,但通過(guò)詞匯替換后可能產(chǎn)生幽默效果。
替換語(yǔ)句:原句經(jīng)過(guò)詞匯替換后具有幽默效果的句子。
原詞匯:原句中可以被替換的詞匯。
替換詞匯:替換原句中詞匯的詞匯。替換詞匯要求與原詞匯上位概念相同、在人類語(yǔ)言學(xué)中的用途相同。
語(yǔ)用群:根據(jù)上位概念相同、用途相同的原則,為其建立替換每個(gè)詞匯的集合。
1.2 詞匯上位概念相同限制
“上位概念”表達(dá)抽象事物的特點(diǎn),反映一組具體形象的共性[12]。詞匯上位概念限制要求原詞匯與它在語(yǔ)用群中替換詞匯的上位概念相同。
為了保證語(yǔ)用群中詞匯的上位概念相同,先確定原詞匯的上位概念,再根據(jù)上位概念找下位概念。所謂“下位概念”,表達(dá)具體事物的特點(diǎn),反映個(gè)別對(duì)象的個(gè)性。例如,“汽車”為“大眾”、“奔馳”、“奧迪”的共性,反過(guò)來(lái)“大眾”、“奔馳”、“奧迪”則是“汽車”的個(gè)性,所以“大眾”、“奔馳”、“奧迪”是“汽車”的下位概念。本文采用兩個(gè)方式收集上位概念的下位概念:①利用網(wǎng)絡(luò)資源,在網(wǎng)上收集每個(gè)上位概念的下位概念;②利用知網(wǎng)實(shí)現(xiàn)詞匯的初步篩選,在數(shù)據(jù)庫(kù)中根據(jù)每個(gè)詞條的DEF字段對(duì)詞條進(jìn)行篩選。其中知網(wǎng)是一個(gè)以漢語(yǔ)和英語(yǔ)詞語(yǔ)代表概念為描述對(duì)象,以揭示概念與概念之間以及概念屬性之間的關(guān)系為基本內(nèi)容的常識(shí)知識(shí)庫(kù)[13]。通過(guò)以上兩種方式獲取結(jié)果并匯總組成語(yǔ)用群。
1.3 詞匯用途相同限制
詞匯用途相同限制要求語(yǔ)用群中所有詞匯在日常用語(yǔ)中的用途相同。通過(guò)以下步驟收集:①對(duì)原句進(jìn)行分析確定可以進(jìn)行替換操作的原詞;②確定原詞在人類語(yǔ)言學(xué)中的用途,并從網(wǎng)絡(luò)中收集其它具有同樣用途的詞匯作為替換詞匯組成語(yǔ)用群;③對(duì)收集到的替換詞匯進(jìn)行人工篩選,篩選出比較常用且便于理解的詞匯作為語(yǔ)用群。
本文通過(guò)以上兩種限制條件共創(chuàng)建了25個(gè)語(yǔ)用群,在通過(guò)計(jì)算機(jī)實(shí)現(xiàn)詞匯替換時(shí),該25個(gè)語(yǔ)用群將會(huì)成為產(chǎn)生幽默效果的關(guān)鍵因素。
2 上下文限制
在替換詞匯與替換語(yǔ)句中,該詞前后詞匯相連構(gòu)成短語(yǔ),只有符合人們的使用習(xí)慣才會(huì)被認(rèn)可,所以需在替換過(guò)程中編寫一個(gè)軟件用來(lái)限制上下文。搜狗知識(shí)是一個(gè)知識(shí)問(wèn)答網(wǎng)站,其中詞語(yǔ)搭配符合人們的語(yǔ)言習(xí)慣,所以本文選擇該網(wǎng)站作為替換結(jié)果的矯正標(biāo)準(zhǔn)。當(dāng)文本中某一詞匯被替換以后,將替換詞匯與替換語(yǔ)句中該詞前后詞匯組成一個(gè)詞組,然后將該詞組作為關(guān)鍵字放到搜狗知識(shí)中進(jìn)行搜索。如果搜索結(jié)果至少有一條數(shù)據(jù)存在于該詞組,則該詞組符合人們的語(yǔ)言習(xí)慣,可將該替換詞匯加入到語(yǔ)用群中。
3 算法流程
為了確定原詞,本文使用中科院開發(fā)的分詞精度和速度較好的分詞軟件ICTCLAS對(duì)原句進(jìn)行分詞[14]。利用計(jì)算機(jī)實(shí)現(xiàn)詞匯替換產(chǎn)生幽默效果,要經(jīng)過(guò)以下步驟:
(1)人工創(chuàng)建語(yǔ)用群。
(2)在計(jì)算機(jī)中用文件存儲(chǔ)語(yǔ)用群。
(3)在圖形界面輸入一段需要通過(guò)替換產(chǎn)生幽默的短文本(原句)。
(4)程序?qū)⒃渥x取到內(nèi)存中。
(5)程序?qū)υ溥M(jìn)行分詞。
(6)程序確定原句中的原詞匯。
(7)在原詞匯對(duì)應(yīng)的語(yǔ)用群中隨機(jī)提取一個(gè)替換詞匯,若不存在該原詞匯對(duì)應(yīng)的語(yǔ)用群則返回第(6)步重新選擇原詞匯。
(8)程序用提取的替換詞匯替換原句中的原詞匯,生成替換語(yǔ)句。
(9)判斷替換詞匯與替換詞匯前后詞匯組成是否符合人們的語(yǔ)言習(xí)慣,若符合則輸出替換語(yǔ)句,否則返回第(7)步重新提取替換詞匯。替換的算法流程見圖1。
4 幽默效果分析
本文詞匯替換方法可以生成4種類型幽默。
(1)說(shuō)反話型。例如在以下場(chǎng)景中:課堂上老師要求學(xué)生把完成的作品都拿起來(lái)展示,當(dāng)大家拿出作品后,正常情況下老師會(huì)說(shuō):“來(lái),大家相互鼓勵(lì)一下?!倍?jīng)過(guò)詞匯替換方法處理后句子變?yōu)椋骸皝?lái),大家相互嘲笑一下?!睂ⅰ肮膭?lì)”替換成“嘲笑”后,整個(gè)句子表達(dá)的意思就完全相反,與人們的正常思維方式產(chǎn)生不同,進(jìn)而引起注意,大家潛意識(shí)里會(huì)明白這是一個(gè)錯(cuò)誤語(yǔ)句,而這個(gè)錯(cuò)誤會(huì)產(chǎn)生幽默的效果。
(2)答非所問(wèn)型。例如在以下場(chǎng)景中:一個(gè)人把母親從鄉(xiāng)村接到城市,后來(lái)發(fā)現(xiàn)近段時(shí)間水費(fèi)猛漲,另一個(gè)人問(wèn)他水費(fèi)猛漲的原因時(shí),他回答說(shuō):“我母親每天按馬桶玩。”經(jīng)過(guò)詞匯替換算法處理后可能變成:“我母親每天按門鈴?fù)??!睂ⅰ榜R桶”替換成“門鈴”,按多少次門鈴與電費(fèi)有關(guān),并不會(huì)使水費(fèi)增加,而此處應(yīng)該回答水費(fèi)增多的原因。處理后的回答與原語(yǔ)境不匹配,出現(xiàn)答非所問(wèn)現(xiàn)象,也會(huì)產(chǎn)生幽默的效果。
(3)明知故犯型。例如在以下場(chǎng)景中:一個(gè)人參加節(jié)目介紹說(shuō)自己是東北人,主持人通過(guò)提問(wèn)確定他真的來(lái)自東北,最后總結(jié)時(shí)應(yīng)該說(shuō):“鑒定完畢,他來(lái)自東北”,而經(jīng)過(guò)詞匯替換方法處理后的回答為:“鑒定完畢,他來(lái)自山東。”前面已經(jīng)明確結(jié)果為東北,而本文算法將“東北”替換成“山東”,東北和山東完全是兩個(gè)地區(qū),屬于明知故犯型錯(cuò)誤,也會(huì)產(chǎn)生幽默的效果。
(4)張冠李戴型。例如在以下場(chǎng)景中:一個(gè)人參加節(jié)目介紹自己的工作是在山崖上采摘燕窩,主持人對(duì)觀眾解釋說(shuō):“燕窩懂嗎?燕子睡覺(jué)的地方?!苯?jīng)過(guò)詞匯替換算法處理后結(jié)果為:“燕窩懂嗎?犀牛睡覺(jué)的地方?!北娝苤?,燕窩明明是燕子睡覺(jué)的地方,跟犀牛沒(méi)有任何關(guān)系,但燕子和犀牛又同屬動(dòng)物,如果將燕子睡覺(jué)的地方套在犀牛身上就會(huì)發(fā)生張冠李戴的錯(cuò)誤,也可以產(chǎn)生幽默的效果。
綜上可知,普通文本經(jīng)過(guò)詞匯替換方法處理后,將處理后的文本放在原語(yǔ)境中就會(huì)產(chǎn)生幽默的效果。
5 結(jié)語(yǔ)
本文提出語(yǔ)用群的概念,并且提出通過(guò)將文本中的詞匯替換成語(yǔ)用群中的其它詞匯而使文本在原語(yǔ)境中產(chǎn)生幽默效果的方法。經(jīng)過(guò)詞匯替換方法替換后的文本在原語(yǔ)境中會(huì)產(chǎn)生4種幽默類型:說(shuō)反話型;答非所問(wèn)型;明知故犯型;張冠李戴型。這些幽默可以在日常生活中活躍氣氛,舒緩人們?cè)诳旃?jié)奏生活中一直緊繃的神經(jīng)[15]。當(dāng)然,本文研究還有一定局限性:語(yǔ)用群的完整性與精確性有待提高;通過(guò)替換方法產(chǎn)生幽默的獨(dú)立性有待提高。隨著應(yīng)用語(yǔ)言學(xué)及大數(shù)據(jù)興起,語(yǔ)用群可以通過(guò)大數(shù)據(jù)技術(shù)進(jìn)行完善,但如何提高幽默的獨(dú)立性還是一個(gè)巨大挑戰(zhàn)。
參考文獻(xiàn):
[1] MORKES J, KERNAL H K, NASS C. Effects of humor in task-oriented human-computer interaction and computer-mediated communication: a direct test of SRCT theory[J]. Humana Computer Interaction,1999,14(4):395-435.
[2] HüBLER M T, BELL D C. Computer-mediated humor and ethos: exploring threads of constitutive laughter in online communities [J]. Computers & Composition,2003,20(3):277-294.
[3] TAYLOR B. Towards informal computer human communication: detecting humor in a restricted domain[D]. Cincinnati:University of Cincinnati,2008.
[4] FRIEDMAN L W, FRIEDMAN H H. A Framework for the study of computer-orientedu humour (cohum)[J]. Ssrn Electronic Journal, 2006,6(12):65-86.
[5] NIJHOLT A, NICULESCU A, VALITUTTI A, et al. Designing humor in human computer interaction (HUMIC 2017)[C]. Bombay, India: Ifip Tc.13 International Conference on Human-Computer Interaction-INTERACT, 2018.
[6] RITCHIE G. Current directions in computational humour[J]. Artificial Intelligence Review, 2001,16(2):119-135.
[7] BINSTED K,RITCHIE G. Computational rules for generating punning riddles[J]. Humor - International Journal of Humor Research, 2009,10(1):25-76.
[8] RITCHIE G, MANURUNG R, PAIN H, et al. A practical application of computational humour[C]. London: Proceedings of the 4th International Joint Workshop on Computational Creativity, 2007.
[9] VALITUTTI A,TOIVONEN H,DOUCET A,et al. Let everything turn well in your wife: generation of adult humor using lexical constraints[C].Sofia: The Meeting of the Association for Computational Linguistics, 2013.
[10] 嚴(yán)扣鳳.幽默語(yǔ)言的模糊手段及其運(yùn)用分析[J].文教資料,2014(17):35-36.
[11] 錢永紅,陳新仁.語(yǔ)料庫(kù)方法在語(yǔ)用學(xué)研究中的運(yùn)用[J].外語(yǔ)教學(xué)理論與實(shí)踐,2014(2):15-22.
[12] 余敏,王震宇,江耀純.淺析創(chuàng)造性判斷中下位概念對(duì)上位概念的影響[J].專利代理,2016(4):49-52.
[13] 董振東,董強(qiáng).知網(wǎng)[EB/OL]. http://www.keenage.com/zhiwang/c_zhiwang.html .2003.
[14] 代建英.漢語(yǔ)自動(dòng)分詞系統(tǒng)的研究與實(shí)現(xiàn)[D].重慶:重慶大學(xué),2005.
[15] 閆芳.幽默以及幽默語(yǔ)言學(xué)研究綜述[J].南北橋,2010(7):40-41.
(責(zé)任編輯:何 麗)