劉洪超,F(xiàn)rancesca Striklievers,黃居仁
(香港理工大學(xué)中文及雙語學(xué)系,香港)
通感(Synaesthesia),又稱連覺,是一種生理現(xiàn)象,主要是指“一種非自覺的跨感覺領(lǐng)域的聯(lián)系體驗”[1]。同時,在語言學(xué)上,它又是一種特殊的隱喻,是指用一種感覺詞去描述另外一種感覺,如“噪音污濁的空氣”(本文所使用的語料庫為臺灣中央研究院現(xiàn)代漢語語料庫,以下簡稱sinica,因此所抽取的句子為繁體中文,為了保持句子的真實可靠,未進(jìn)行繁簡轉(zhuǎn)換),“噪音”是屬于聽覺的感覺詞,但是“污濁”一般只用來形容視覺現(xiàn)象,該句用視覺詞“污濁”來描述聽覺“噪音”就是一種通感,從隱喻上來說,這里的視覺是源域(Source Domain),聽覺是目標(biāo)域(Target Domain)。之所以稱之為特殊的隱喻,是因為其源域和目標(biāo)域都屬于同一個范疇,因此也有人稱之為準(zhǔn)隱喻[2]。本文主要關(guān)注的是語言中的通感句子,而不是認(rèn)知上的通感疾病或通感體驗。
國外對通感的研究一直是一個比較熱門的話題,通感所體現(xiàn)出來的映射方向性被當(dāng)做一個通用的假設(shè)而在各個語言中進(jìn)行檢驗,研究領(lǐng)域跨越了神經(jīng)科學(xué)、認(rèn)知科學(xué)和語言學(xué)等學(xué)科;研究方法也包括了神經(jīng)科學(xué)實驗、認(rèn)知實驗和語言學(xué)觀察及統(tǒng)計等,如文獻(xiàn)[1,3,4]。但是,國內(nèi)對于通感的研究大部分仍然僅限于文學(xué)賞析上。
另一方面,對于漢語通感的研究不論是國內(nèi)還是國際都比較缺乏,只有文獻(xiàn)[5,6]等有限的幾篇。漢語通感映射方向性研究的一個前提就是要有大量的實際數(shù)據(jù)作為統(tǒng)計上的支撐,但是文獻(xiàn)[5,6]等文章中分析的漢語例子都非常有限。由于通感句子在語料庫中的分布比較稀疏,因此采用人工尋找的方法不可取。最好是采用自動抽取的方法。關(guān)于通感自動抽取,本文只找到了文獻(xiàn)[7],而關(guān)于漢語通感自動抽取的研究,目前還未發(fā)現(xiàn)。因而,本文力圖基于文獻(xiàn)[7]的方法實現(xiàn)語料庫中漢語通感句子的自動抽取。同時分別構(gòu)建觸覺(Touch)、味覺(Taste)、嗅覺(Smell)、聽覺(Hearing)和視覺(Vision)的詞庫,幫助進(jìn)行通感句子的抽取和語言學(xué)研究。
本文第1節(jié)是引言,介紹本文的研究背景和意義;第2節(jié)是相關(guān)研究的簡介,對相關(guān)文獻(xiàn)進(jìn)行簡單的綜述;第3~4節(jié)介紹本文的研究方法和結(jié)果,其中第3節(jié)介紹感覺詞的選擇標(biāo)準(zhǔn)和感覺詞表的呈現(xiàn),第4節(jié)介紹抽取方法和抽取結(jié)果,對抽取句子進(jìn)行統(tǒng)計,尋找映射規(guī)律;最后對全文進(jìn)行總結(jié),指出本文的思路、不足和未來的研究工作重點。
由于通感是將一個感覺域的詞映射到另外一個感覺域,因而就涉及到對感覺域的定義。根據(jù)是否將“情感(Emotion)”考慮為一個感覺域,基本上可以分為兩派。
大部分的研究,包括文獻(xiàn)[2],未將“情感”考慮為一個感覺域,只考慮同時分別構(gòu)建觸覺(Touch)、味覺(Taste)、嗅覺(Smell)、聽覺(Hearing)和視覺(Vision)這五種感覺,認(rèn)為“這是通用的英美文化標(biāo)準(zhǔn)”[8]。有的研究,進(jìn)一步將這五類進(jìn)行了細(xì)化,如文獻(xiàn)[4]把視覺細(xì)化為“顏色(Color)”和“維度(Dimension)”。
另外一派,包括文獻(xiàn)[6],將“情感”考慮進(jìn)了研究對象。
本文在構(gòu)建感覺詞表時并未設(shè)立“情感”類,主要是由于對于“情感”的定義比較抽象,難以劃定一個非常明確的標(biāo)準(zhǔn)。但是,在抽取的例子中,本文發(fā)現(xiàn)了大量的其他五類感覺詞和情感域之間的映射例子,如:
還是這個心情[target]感受是讓我很低沉[source]的……
“低沉”中“低”屬于視覺,“沉”屬于觸覺,而“心情”則是典型的情感,因此這里是用視覺和觸覺來描述心情。這樣的例子很多,情感這個抽象類在借助相比之下較為具體的其他五類感覺詞來表達(dá)具有很強(qiáng)的傾向性,因此本文也將之列入考察范圍。
文獻(xiàn)[2]通過對英語、法語和匈牙利語通感句子的考察發(fā)現(xiàn),這些句子的通感映射通常遵循下面的幾條規(guī)律:
(1)感覺詞從源域到目標(biāo)域的映射一般都按照下面的方向進(jìn)行:
觸覺→味覺→嗅覺→聽覺→視覺
(2)處于映射等級最低端的觸覺詞被用來表示其他感覺的頻次最高;
(3)處于映射等級第二高位的聽覺是借助其他感覺詞來表達(dá)的最高頻次的感覺域。
后來的研究,如文獻(xiàn)[3,7]等又相繼考察了希伯來語、漢語等語言中的情況,用不同的方法力圖證明在這些語言中也存在同樣的規(guī)律。
對該規(guī)律做了更好證明的是文獻(xiàn)[4],通過考察英語中65 個感覺形容詞的185 例詞義演變情況,發(fā)現(xiàn)83%以上的詞都按照上面的規(guī)律進(jìn)行映射,而其他例外也都做了合理的解釋。其繪制的感覺域之間的映射次序如圖1所示。
Figure 1 Mapping drectionality of sense-related words in reference[4]圖1 文獻(xiàn)[4]感覺詞映射路線
由于沒有大量的數(shù)據(jù)進(jìn)行支撐,因此得出的結(jié)論都不是很可靠。如文獻(xiàn)[7],其對漢語的考察只通過15個句子就得出漢語通感也是按照圖1的路線進(jìn)行映射轉(zhuǎn)換就不是很有說服力。
本文構(gòu)建了總量為1 759個的感覺詞的詞表,抽取了1 452個句子,去除重復(fù)后為940個例句,力圖找出漢語映射的規(guī)律。
本文關(guān)于通感的抽取主要就是基于感覺詞,因此本文的中心就是要為觸覺、味覺等五個感覺域創(chuàng)建盡量完整的詞表或詞典。在確定收詞標(biāo)準(zhǔn)時,本文兼顧了語言學(xué)定義和語言工程應(yīng)用兩方面。而本文在收詞時主要借助了《現(xiàn)代漢語語義信息詞典》和從sinica語料庫抽取的詞表,兩者合計共約20余萬詞條,通過半自動的方式,按照我們制定的收詞標(biāo)準(zhǔn)從中收集了1 700余個感覺詞,分別歸入了五個感覺詞表。
首先是需要對感覺域進(jìn)行定義,本文參照了文獻(xiàn)[8]對幾個感覺域的定義標(biāo)準(zhǔn),即:
(1)觸覺|聽覺:通過物理性途徑刺激形成的感覺,一般說來,觸覺的生成都是對皮膚感受器的物理刺激引起的,如“冰涼”是對皮膚溫度感受的刺激;而聽覺一般是聲波對耳膜的震動形成的,這也是一種物理刺激。
(2)味覺|嗅覺:通過化學(xué)途徑刺激形成的感覺,一般說來,味覺和嗅覺都是鼻腔粘膜或口腔粘膜的感覺細(xì)胞對相應(yīng)的化學(xué)分子的刺激反應(yīng)所產(chǎn)生的感覺。
(3)視覺:通過光線刺激形成的感覺。一般說來,視覺的形成都是光線從物體反射進(jìn)入眼睛后刺激視神經(jīng)所產(chǎn)生的感覺。
按照以上的標(biāo)準(zhǔn),本文利用《現(xiàn)代漢語語義信息詞典》中的語義類信息對詞典中的詞進(jìn)行了篩選,初步將相關(guān)的感覺詞篩選出來,本文按照表1中的映射關(guān)系進(jìn)行篩選。
Table 1 Mapping between sense domain and the SKCC’s semantic domain表1 感覺域與抽取的《現(xiàn)代漢語語義信息詞典》語義類的對應(yīng)關(guān)系
然后根據(jù)表1所抽出的候選感覺詞制作關(guān)鍵詞(及語素)表,通過關(guān)鍵詞和關(guān)鍵語素在sinica語料庫中抽取出的詞表中進(jìn)行查找,最終兩者取合集,去除重復(fù)詞項之后進(jìn)行人工校對。
由于《現(xiàn)代漢語語義信息詞典》與感覺域不是一一對應(yīng)的關(guān)系,因此,也需要對各個領(lǐng)域的候選感覺詞通過手工方法一一歸類。
在針對具體的詞進(jìn)行人工校對時,我們也采取了以下的語言學(xué)標(biāo)準(zhǔn):
(1)按照詞義進(jìn)行類別劃分,如“滾燙”,其中“滾”是屬于視覺的語素,“燙”是屬于觸覺的語素,但是整個詞義是表示“非常熱”,跟視覺并沒有關(guān)系。由于該詞本身是通感詞,即在構(gòu)詞層面上看,其詞義形成過程中有通感參與,這種通感詞進(jìn)行了特別標(biāo)注,抽取時含有該詞的句子應(yīng)該直接抽出,因為含有通感詞的句子都是通感句。
(2)單純詞的詞義主要參照本義,本義無法確定時參照常用義,如“聞”,本義屬于聽覺,在現(xiàn)代漢語中發(fā)展出嗅覺的意義,但是本文將之歸入聽覺。
(3)復(fù)合詞詞義也主要是參照本義,如果詞義跨多個感覺域,如“平滑”,表示“既平又滑”,前者屬于視覺,后者屬于觸覺,則主要參照其搭配對象,一般“平滑”是用于修飾視覺現(xiàn)象,因此,將之歸入視覺。
其中數(shù)量最多、最難處理的就是第(3)種情況,但是由于本文采取的方法主要是根據(jù)句子中是否同時含有多個不同感覺域的感覺詞,所以事實上無論將“平滑”這樣的詞放入哪一類,最終都不會影響抽取的句子總數(shù),只是抽取的具體例句屬于哪一類映射上會存在差錯。
總體原則就是除了本身就是通感詞,如“粗話”“冷笑”“滾燙”等,需要打上標(biāo)記(事實上就是兼類標(biāo)記)之外,其它所有的詞都要保持排他性,不處理為兼類,否則就會大大影響句子抽取的準(zhǔn)確率。表2是對建立的感覺詞庫的示例(由于采用的語料庫為繁體中文,因此本文構(gòu)建的詞庫也都是繁體中文版)。
Table 2 A sample of sense-related word database表2 感覺詞庫示例
表3是本文對感覺詞庫中各感覺域感覺詞分布的統(tǒng)計結(jié)果。
Table 3 Distribution of sense-related words表3 感覺詞分布情況
從表3可以看出,視覺詞占了絕大多數(shù),聽覺詞次之,最少的是嗅覺詞。本文在收集的過程中發(fā)現(xiàn)與嗅覺相關(guān)的大部分都是形容詞,名詞和動詞都比較少,而且收集難度比較高。嗅覺和味覺有很多詞都是詞義共通的,即可以同時用于兩個領(lǐng)域,只是本文按照本義劃定了歸屬,比如“味道”既可以用于嗅覺,又可以用于味覺,但是其本義是味覺。而且,《現(xiàn)代漢語語法信息詞典》中的形容詞語義類對嗅覺和味覺根本就沒有做區(qū)分,兩者合在“味道”這個語義類下,可見兩者關(guān)系比較緊密。
在構(gòu)建了感覺詞庫的基礎(chǔ)上進(jìn)行通感句子的抽取,本文采用了兩種方法,兩種方法的基本思路都是基于一個通感句子至少應(yīng)當(dāng)含有兩個以上感覺域的感覺詞這個基本原則進(jìn)行的。
第一種方法的基本步驟如下:
(1)首先對語料庫中所有句子進(jìn)行一遍掃描,將至少含有一種感覺域的感覺詞的句子抽??;
(2)然后對這個句子列表進(jìn)行第二次掃描,如果含有另外一種或多種感覺域的感覺詞就將整個句子作為候選句子輸出。
表4是第一種方法的抽取結(jié)果。
Table 4 Result of method 1表4 第一種方法實驗結(jié)果
這種方法的準(zhǔn)確率比較低,本文對抽出的句子進(jìn)行分析,發(fā)現(xiàn)以下一些原因?qū)е聹?zhǔn)確率比較低:
(1)未檢查詞性問題。有的詞有不同的詞性,不同詞性的詞有不同的分布規(guī)律,但是單純的關(guān)鍵詞匹配不會考慮這一點,如:
例1 北風(fēng)正凜冽。
“正”在詞表中屬于視覺,但是詞表中的“正”是分布在謂語位置上的形容詞,表示“純、不雜”,如“模樣很正”等。而例1中的“正”是處于狀語位置上的副詞“正”,表示正在進(jìn)行。對于這一類問題的解決辦法就是考察每一個詞的詞性分布情況,在抽取時進(jìn)行檢查,如果符合其分布規(guī)律就將句子抽出,如果不符合就淘汰。
(2)聯(lián)合結(jié)構(gòu)問題。有的句子中確實含有兩種以上的感覺域的感覺詞,但是分別處在聯(lián)合結(jié)構(gòu)的前項和后項上,兩者之間不形成通感,只是單純的并列,如:
例2 這種又甜又冷的冰淇淋作風(fēng)全行不通
“甜”和“冷”分別屬于味覺和觸覺,但是兩者并列,并沒有形成通感映射關(guān)系。對于這一類問題的解決方法是加入聯(lián)合結(jié)構(gòu)標(biāo)志詞,如“又…又…”“和”“并且”等詞的檢查,但是這樣一來又可能去掉一些通感的句子,如:
例3 周治平依然以清亮[source]而感性的[source]溫柔[source]歌聲[target]……。
“清亮”和“感性”是并列關(guān)系,但是兩者都與“歌聲”構(gòu)成了通感關(guān)系。
同時,很多沒有明顯的標(biāo)志詞的并列結(jié)構(gòu)無法用這種方式排除,如:
例4 炒出來的青菜會軟爛而不好吃。
這里的“軟爛”是并列結(jié)構(gòu),兩者之間并不形成通感,應(yīng)該被排除,但是僅僅加顯性并列結(jié)構(gòu)標(biāo)志詞判斷并不能解決這個問題,本文未來將要引入其他句法分析或語義特征的方法將之排除。
在對抽出例子分析的基礎(chǔ)上,本文著重解決了第一個問題,逐個考察了每個感覺詞的詞類分布情況,將明顯不可能出現(xiàn)在通感句子中的詞性從感覺詞庫中剔除。表5是觸覺類感覺詞的詞性分布情況。
Table 5 Touch-related words’distribution in different POS categories表5 觸覺類感覺詞詞性分布情況
限于篇幅問題,本文不再列出其他感覺域的詞性分布情況,可以看出,大部分的觸覺詞是VH(狀態(tài)不及物動詞)(每個符號具體的意義可以訪問sinica語料庫,網(wǎng)址:http://app.sinica.edu.tw/cgi-bin/kiwi/mkiwi/kiwi.sh),加入了詞性檢查之后,本文將兩次結(jié)果一并展示如表6所示。
Table 6 Results comparison of method 1and method 2表6 兩種方法實驗結(jié)果對比
由于本文無法得知sinica語料庫中通感句子總數(shù)的多少,因而無法直接計算召回率等值,但是從表6中的具體抽取結(jié)果對比可以看出,方法二的效果獲得了明顯的提升:抽取的句子數(shù)在Type值上幾乎是原來的兩倍,準(zhǔn)確率是方法一的兩倍多。即便是TTR(Type/Token)值也獲得了提升(0.53 vs 0.65),說明提取出的句子的類型豐富度,方法二也大大地高于方法一。
在抽取的大規(guī)模通感例句的基礎(chǔ)上,本文可以對第二部分提出的映射等級進(jìn)行檢驗,檢查漢語通感句子是否也遵循了文獻(xiàn)[2]提出的映射規(guī)律,表7是本文對940個通感句子的映射情況的統(tǒng)計。
Table 7 Mappings distribution between different sense domains表7 各感覺域映射分布
需要注意的是,很多句子含有多種通感,因而在計算的時候這些句子都是要分別計算的,如:
例 5 似 有 似 無 的 (幽[vision/source]香[smell/target])[smell/target](飄曳如絲)[vision/source]。
例6 兩 種 (口 味)[taste/source](間 雜 交錯)[vision/source]、(甜[taste/target]香[smell/source])[taste/target]有味。
在例5中,“幽香”在詞匯層面形成通感,通感的方向是用屬于視覺的“幽”修飾“香”這種嗅覺,源域是視覺,目標(biāo)域是嗅覺;同時整個“幽香”屬于嗅覺,再用屬于視覺的“飄曳如絲”描述“幽香”,這又構(gòu)成了另外一種通感,源域是視覺,目標(biāo)域是嗅覺。例6情況也類似。
因此,最終的通感總數(shù)與抽取的句子總數(shù)并不是一一對應(yīng)的。
從表7可以觀察到以下幾個映射的傾向性:
(1)映射幾乎可以在任意兩個感覺域之間進(jìn)行,即通感幾乎可以在任意兩個感覺域之間產(chǎn)生。
(2)聽覺域感覺詞只能向嗅覺和情感感覺詞進(jìn)行映射。
(3)聽覺域接受的通感映射最多,視覺域提供的通感映射最多。換句話說,用其他感覺詞來表示聽覺的頻次最高;視覺詞表示其他感覺的頻次最高。
這個結(jié)論除了第二點與文獻(xiàn)[2]得出的結(jié)論3有相似之處外,其他都不相同。
從語言學(xué)上說,本文要研究的問題是漢語通感句子是否存在一定的映射方向性?映射規(guī)律是什么?對于這個問題,目前的漢語研究很少,即便有,結(jié)論也是建立在少量的例句之上,因此要回答這個問題就要獲得大量的通感句子,手工辦法不可取,本文采取自動抽取的方法。
為了解決句子的抽取問題,本文采用了兩種方法,兩種方法都是基于感覺詞匹配,因此本文首先構(gòu)建了感覺詞庫,這個工作產(chǎn)生兩個結(jié)果:一方面明確了六種感覺(包括“情感”)的定義,另一方面構(gòu)建了一個較為全面的感覺詞庫,方便語言學(xué)研究。
從抽取實驗結(jié)果來看,引入了詞性檢查的抽取效果明顯好于沒有詞性檢查的效果,但是準(zhǔn)確率仍然不高,還可以通過引入句法語義分析的方式進(jìn)一步提高,這是本文下一步要進(jìn)行的工作。
通過對抽取的大量句子的統(tǒng)計結(jié)果來看,漢語通感的映射方向性并不是很明顯,但是映射也存在一定的規(guī)律,在這里不再重復(fù),下一步本研究要進(jìn)行的工作是解釋這些規(guī)律和找到這些規(guī)律形成的原因。
[1] Cytowic R E.Synesthesia:A union of the senses[M].New York:Springer Verlag,2002.
[2] Ullmann S.The principles of semantics[M].Oxford:Basil Blcakwell,1957.
[3] Shen Y,Eisenamn R.“Heard melodies are sweet,but those unheard are sweeter”:Synaesthesia and cognition[J].Language and Literature,2008,17(2):101-121.
[4] William J.Synaesthetic adjectives:A possible law of semantic change[J].Language,1976,52(2):461-478.
[5] Sean D.Synaesthesia and synaesthetic metaphors[J].PSYCHE,1996,32(2):1-16.
[6] Yen-Han Lin,Shelley Ching-Yu Hsieh.Synaesthetic metaphors of television food commercial ads in mandarin Chinese[J].TMUE Journal of Language and Literature,2011(1.6):1-16.
[7] Strik Lievers F.Synaesthesia:A corpus-based study of crossmodal directionality[J].Functions of Language,2015,22(27):69-95.
[8] Yu Ning.Synaesthetic metaphor:A cognitive perspective[J].Journal of Literary Semantics,2003,32(1):19-34.