柳超健 王軍 曹靈美
(蘇州大學(xué),蘇州215006/浙江傳媒學(xué)院,杭州310018;蘇州大學(xué),蘇州215006)
提 要:近年來,隨著認(rèn)知隱喻研究的“實(shí)證轉(zhuǎn)向”與“社會轉(zhuǎn)向”,學(xué)界開始不斷關(guān)注語料庫隱喻研究中的兩個(gè)基本問題:在方法論層面,創(chuàng)新語料庫中隱喻的檢索與識別方法;在語義學(xué)層面,挖掘隱喻使用的觸發(fā)機(jī)制與隱喻選擇的影響因素。然而,當(dāng)前研究尚缺乏或極少探究語料庫中的隱喻標(biāo)注問題。基于目前國內(nèi)外自然語言處理中隱喻識別的相關(guān)研究和諸多具有代表性的隱喻語料庫標(biāo)注實(shí)踐,本研究系統(tǒng)提出隱喻標(biāo)注的原則與內(nèi)容,并深入探討其標(biāo)注的模式與方法,以供國內(nèi)外學(xué)者在認(rèn)知隱喻研究與隱喻語料庫建設(shè)中參考。
隱喻標(biāo)注作為隱喻語料庫建設(shè)與研究的重要組成部分,大體上繼承通用語料庫中標(biāo)注的特點(diǎn)與功能。然而,隱喻是人類對抽象概念進(jìn)行推理的基本機(jī)制與認(rèn)知手段,與其他語言形式相比,蘊(yùn)含更多隱性或相對不突顯的信息。由于隱喻語言本身及其概念結(jié)構(gòu)的特殊性與復(fù)雜性,隱喻標(biāo)注也必將呈現(xiàn)出諸多不同特性。若將Lakoff等收集的重要隱喻目錄(Master Metaphor List)視為隱喻標(biāo)注研究的起點(diǎn),經(jīng)過30多年的發(fā)展,它主要有以下特點(diǎn):研究方法基本能夠相互傳承與借鑒;語料收集覆蓋度高;重視隱喻概念的界定問題。但也存在以下問題:尚未形成科學(xué)、統(tǒng)一且易操作的隱喻識別程序及方法;標(biāo)注內(nèi)容隨意、廣度模糊、深度不足;標(biāo)注模式差異顯著,各自為陣。因此,有效解決上述問題對隱喻標(biāo)注研究意義重大,同時(shí)也將對基于語料庫的相關(guān)研究產(chǎn)生直接影響。鑒于此,本研究主要從標(biāo)注原則、標(biāo)注內(nèi)容、標(biāo)注模式與標(biāo)注方法4個(gè)層面探討語料庫中的隱喻標(biāo)注問題,以期為隱喻標(biāo)注研究提供相關(guān)借鑒。
隱喻標(biāo)注的原則是確保隱喻標(biāo)注過程科學(xué)與規(guī)范的前提,并對隱喻研究的各個(gè)層面有重要的制約作用。本研究基于Leech(1993:275)在通用語料庫中提出的標(biāo)注原則,并結(jié)合目前國內(nèi)外自然語言處理中隱喻識別的相關(guān)研究及諸多具有代表性的隱喻標(biāo)注實(shí)踐,系統(tǒng)提出隱喻標(biāo)注的5個(gè)基本原則:強(qiáng)制性、選擇性、準(zhǔn)確性、一致性和折衷性。早期相關(guān)研究已對語料標(biāo)注的外部信息和結(jié)構(gòu)特征作過較為詳實(shí)的論述(Leech 1993,1997;何婷婷2003;Sinclair 2007)。此外,從現(xiàn)代計(jì)算機(jī)科學(xué)的發(fā)展視角看,Leech在標(biāo)注原則中提到的語料處理技術(shù)已不再是難點(diǎn)問題。因此,本研究提出的原則主要針對隱喻標(biāo)注的內(nèi)容,暫不探討標(biāo)注中如何利用計(jì)算機(jī)對隱喻語料進(jìn)行數(shù)據(jù)保存等技術(shù)性問題。
(1)強(qiáng)制性原則。該原則主要針對隱喻標(biāo)注的廣度而言,即,隱喻標(biāo)注必須涵蓋4個(gè)基本要素(隱喻性詞匯、源域、目標(biāo)域和概念映射)。從理論上講,隱喻標(biāo)注至少可以從詞匯、語法、語義、語用及語篇等層面進(jìn)行。然而,語料的標(biāo)注和語料的利用始終是一對矛盾體。從用戶的角度來看,語料標(biāo)注越詳盡越好,而標(biāo)注者則還須考慮標(biāo)注的可行性。因此,任何標(biāo)注模式都是在二者之間求得的一種妥協(xié)的產(chǎn)物(丁信善1998:8)。從目前國內(nèi)外語料庫隱喻標(biāo)注的實(shí)踐來看,多數(shù)研究在方法上雖能相互傳承與借鑒,但在標(biāo)注內(nèi)容方面各自為陣,存在較大的隨意性。此外,隱喻具有不同層次的抽象性(Ritchie 2003)。如果語料標(biāo)注無法明確隱喻性詞匯、源域、目標(biāo)域以及相應(yīng)的概念映射,隱喻的識解必將因時(shí)、因地、因人而產(chǎn)生較大的差異。若單論此,對隱喻的基本要素進(jìn)行標(biāo)注就顯得尤為重要。
(2)選擇性原則。隱喻語料庫既可隸屬能夠代表某種語言全貌而建成的通用語料庫,也可以是出于某種特定的研究目的而開發(fā)的專用語料庫。顯然,研究目的不同將導(dǎo)致兩種類型的語料庫在標(biāo)注方面產(chǎn)生差異?;诖?,在遵循強(qiáng)制性原則的基礎(chǔ)上,可適當(dāng)根據(jù)語料庫的研究目的對隱喻語言進(jìn)行不同層面的選擇性標(biāo)注,如表1所示。
(3)準(zhǔn)確性原則。與隱喻的其他話題相比,學(xué)界對隱喻識別的關(guān)注步伐略晚,但它確屬隱喻研究中一個(gè)常被忽略的問題。通過文獻(xiàn)梳理,我們發(fā)現(xiàn)目前研究中對該話題并未達(dá)成概念上的統(tǒng)一。其中最根本的問題在于隱喻識別到底應(yīng)該識別什么,是隱喻性詞匯還是源域與目標(biāo)域,又或是概念映射?是否應(yīng)該嚴(yán)格區(qū)分隱喻在詞匯層面和概念層面的識別?此外,概念隱喻理論強(qiáng)調(diào)隱喻的概念性本質(zhì)特征,但Lakoff在其諸多論著中始終未談及如何從紛繁的語言隱喻中構(gòu)建或提取概念隱喻的方法或原則。這將直接導(dǎo)致各家在隱喻映射問題上觀點(diǎn)迥異,眾說紛紜。因此,隱喻標(biāo)注不僅需要明確隱喻識別的概念,更要制定或選取一套清晰、科學(xué)且易操作的識別方法。
表1 隱喻的選擇性標(biāo)注內(nèi)容
(4)一致性原則。在隱喻標(biāo)注中,針對同一隱喻概念,不論是語義層面的隱喻規(guī)約性,還是語用層面的隱喻功能,標(biāo)注者之間都應(yīng)達(dá)到某種程度上的一致性。因此,在隱喻標(biāo)注之前,不僅要嚴(yán)格制定標(biāo)注者的選擇標(biāo)準(zhǔn),還要切實(shí)提出或選取一套科學(xué)、嚴(yán)密的隱喻標(biāo)注模式和流程,盡可能縮減標(biāo)注者之間的差異,從而確保隱喻標(biāo)注的信度與效度。對于標(biāo)注結(jié)果仍有疑慮的標(biāo)注案例,必須通過小組討論的方式加以解決。若存在無法解決的案例,也應(yīng)明確告知用戶標(biāo)注的置信區(qū)間等相關(guān)信息。
(5)折衷性原則。 Leech(1993:275)認(rèn)為語料庫標(biāo)注方案不具有真值性,不存在所謂的“標(biāo)準(zhǔn)”模式。因此,任何標(biāo)注方案都不能作為第一或唯一標(biāo)準(zhǔn)。即使存在,也只能通過大量實(shí)踐和比較才能得到。鑒于目前學(xué)界尚未制定標(biāo)準(zhǔn)、統(tǒng)一的通用語料標(biāo)注賦碼與規(guī)范,標(biāo)注過程應(yīng)注重實(shí)用性并最大限度地為語料庫使用者提供便利。在增強(qiáng)語料使用靈活性的同時(shí),還要盡量選用學(xué)界普遍接受的中立方案,這將有利于語料庫的資源共享。當(dāng)前,國內(nèi)外隱喻語料庫建設(shè)單位在選擇語料標(biāo)注賦碼時(shí)也存在上述問題。因此,隱喻標(biāo)注也應(yīng)綜合考察與研究各種標(biāo)注方案,取長補(bǔ)短,并結(jié)合自身的研究目的,制定一種較為折衷的標(biāo)注方案。
可擴(kuò)展性標(biāo)注語言(Extensible Markup Lan?guage,XML)是目前最常見的通用語言標(biāo)注格式。與SGML等早期模式相比,XML不使用預(yù)設(shè)標(biāo)簽,也不注重文本格式的呈現(xiàn),但更關(guān)注對數(shù)據(jù)結(jié)構(gòu)的定義與描寫。因此,用戶可基于不同需求來定義不同領(lǐng)域內(nèi)的標(biāo)記語言。整體而言,XML可彌補(bǔ)HTML的缺陷與不足,具有更強(qiáng)大的文件傳送與處理能力??梢哉f,XML的自身特點(diǎn)與隱喻標(biāo)注的本質(zhì)存在某種程度上的契合。本研究選取XML作為標(biāo)注語言主要基于以下3項(xiàng)既定事實(shí)。
(1)XML遵循特定的語法規(guī)則,能夠確保每個(gè)文檔形式的完整性。比如,XML的基本結(jié)構(gòu)是層級性的成對標(biāo)簽,即,每個(gè)元素必須包含起始標(biāo)簽(start tag)與結(jié)束標(biāo)簽(end tag),并注明屬性及其數(shù)值。這種強(qiáng)制性的語法規(guī)則在很大程度上能夠簡化XML相關(guān)應(yīng)用程序的開發(fā),而不必參照DTD對文件結(jié)構(gòu)進(jìn)行確認(rèn)。因此,XML可使隱喻語料更嚴(yán)謹(jǐn),語料觀察更直觀,語料檢索更方便,從而能夠最大限度地確保隱喻標(biāo)注的系統(tǒng)性和完整性。
(2)XML雖有嚴(yán)格的定義方法和規(guī)則集,但其文檔建立在基本內(nèi)嵌(nested)結(jié)構(gòu)中某個(gè)核心集的基礎(chǔ)之上。當(dāng)語料庫因?yàn)樘砑硬煌瑢蛹壍男畔⒍乖瓉淼慕Y(jié)構(gòu)變得復(fù)雜時(shí),這些基本結(jié)構(gòu)就可代表復(fù)雜的信息集合,而不需要改變自身結(jié)構(gòu)。從而,標(biāo)注者需要為內(nèi)部結(jié)構(gòu)的復(fù)雜化程度付出的努力就更少。隱喻的核心內(nèi)容是源域到目標(biāo)域的跨域映射過程。在隱喻標(biāo)注過程中,標(biāo)注者完全可以標(biāo)注隱喻的基本要素為基礎(chǔ),并依據(jù)不同程度的研究目的,選擇性地進(jìn)行層級標(biāo)注。
(3)XML具有可擴(kuò)展性。首先,除了XML模式中定義的數(shù)據(jù)類型之外,開發(fā)者可自行創(chuàng)建DTD,并應(yīng)用于多種“可擴(kuò)展”的標(biāo)志集。其次,通過使用某些附加標(biāo)準(zhǔn),可對XML的核心功能進(jìn)行擴(kuò)展。比如,增加樣式、鏈接和參照能力。XML的擴(kuò)展內(nèi)容為其他可能產(chǎn)生的標(biāo)準(zhǔn)提供堅(jiān)實(shí)的基礎(chǔ)(李薇等1999:24)。不可否認(rèn),隱喻的識別、理解與生成是一個(gè)動態(tài)變化發(fā)展的過程,因此,在語料標(biāo)注中能夠表征其形式的語言格式也必然不是一成不變的。XML恰好為隱喻標(biāo)注提供一個(gè)表征結(jié)構(gòu)化信息的方式,并允許用戶自定義任意標(biāo)記形式,以滿足或改變不同標(biāo)注內(nèi)容的需求。這就突破以往HTML只可描述文本格式的束縛,而且至少在數(shù)量方面極大提高隱喻標(biāo)注的效率。
目前現(xiàn)有的語料標(biāo)注方法主要包括人工標(biāo)注、人工標(biāo)注+機(jī)器輔助、機(jī)器標(biāo)注+人工輔助以及機(jī)器全自動標(biāo)注。從宏觀上講,隱喻標(biāo)注可分為隱喻識別與隱喻標(biāo)記兩個(gè)過程。隱喻識別是隱喻標(biāo)記的基礎(chǔ),其效度將直接影響隱喻標(biāo)記的質(zhì)量。因此,隱喻標(biāo)注的本質(zhì)是在隱喻識別的基礎(chǔ)上,通過使用某種特定的符號代碼對隱喻各個(gè)層面的信息進(jìn)行加工、處理和記錄的過程。本研究采用Pragglejaz Group(2007)提出的 MIP隱喻識別方法。從理論上講,隱喻標(biāo)注的兩個(gè)過程可選取上述任意一種標(biāo)注方法。然而,本研究倡導(dǎo)在隱喻識別階段應(yīng)采用“人工識別+機(jī)器輔助”,在隱喻標(biāo)記階段應(yīng)以“機(jī)器標(biāo)注+人工輔助”或機(jī)器全自動標(biāo)注為宜。之所以采用這兩種方法,主要有以下幾個(gè)方面的考量:
(1)隱喻概念的特殊性及復(fù)雜性。盡管La?koff等學(xué)者的跨域映射論為隱喻的分析與闡釋提供基本理論框架,但其心理真實(shí)性問題向來受到學(xué)界的質(zhì)疑與挑戰(zhàn)。因此,在自然語篇中,對隱喻的理解須采用多元化、跨學(xué)科的研究視角。比如,可選取語料庫語言學(xué)的基本原理與方法來觀察隱喻的共時(shí)與歷時(shí)變化;可采用語篇分析法來挖掘隱喻語言的形式、結(jié)構(gòu)與功能;可基于行為學(xué)方法來研究或驗(yàn)證人類心智對隱喻的認(rèn)知表征。
(2)隱喻識別的方法論與技術(shù)性問題。語言隱喻與概念隱喻的關(guān)系通常極其復(fù)雜且兩者易融合(conflated),但語言形式畢竟只是表層結(jié)構(gòu),終究無法完整地表征其概念系統(tǒng)(Steen 2007:175)。雖然語言隱喻的識別是概念隱喻構(gòu)建的基礎(chǔ),然而研究過程中對兩者的識別需要對應(yīng)的方法論。從研究現(xiàn)狀來看,現(xiàn)存的隱喻識別程序或集中于識別隱喻性詞匯,或缺乏科學(xué)、系統(tǒng)且易操作的方法來指導(dǎo)隱喻在概念層面的識別,又或是對兩者識別的關(guān)系問題含糊不清。這些問題在很大程度上將影響隱喻形式化與模型化的準(zhǔn)確性與科學(xué)性,不利于隱喻自動識別的發(fā)展。此外,從目前隱喻自動識別研究的個(gè)案來看,在語料標(biāo)注規(guī)模及標(biāo)注對象方面依然受到限制,整體標(biāo)注不具有代表性。
(3)隱喻標(biāo)注的指向性問題。隱喻標(biāo)注階段并不涉及文本中的每個(gè)詞匯單元或句子,這是由隱喻語料庫的特殊性決定的。這就導(dǎo)致隱喻識別之后,必須借助人工手段對隱喻性詞匯及相關(guān)涉及隱喻概念映射的句子(群)進(jìn)行篩選、校對與補(bǔ)充。當(dāng)然,這一階段的任務(wù)可以通過開發(fā)相關(guān)計(jì)算機(jī)程序,并通過手工錄入信息的方式來實(shí)現(xiàn)計(jì)算機(jī)的自動篩選。比如,張冬瑜等(2015)在歸納情感隱喻語料庫理論框架的基礎(chǔ)上,通過對詞條信息進(jìn)行多重人工檢查及嚴(yán)格控制信息更新的方式,設(shè)計(jì)出情感隱喻的錄入界面,極大提高隱喻標(biāo)注的效率。由此可見,標(biāo)注階段采用機(jī)器錄入的這種方案不僅是為了提高標(biāo)注效率,減輕標(biāo)注者的記憶負(fù)擔(dān),更重要的也是為了保證語料標(biāo)注賦碼上的一致性。
隱喻語料庫的元信息標(biāo)注主要是記錄語料庫中文本的非語言信息,包括外部信息(如語料來源、文本模式、類型、領(lǐng)域、作者、出版時(shí)間、標(biāo)注階段、首標(biāo)時(shí)間、定標(biāo)時(shí)間等)和文本的內(nèi)部結(jié)構(gòu)特征(如標(biāo)題、段落、文獻(xiàn)、伴隨口語的副語言特征等)。這些信息通常置于文件頭部,并通過某種特定的符號編碼與文本建立關(guān)聯(lián)。根據(jù)XML格式,將標(biāo)注內(nèi)容置于尖括號內(nèi),并注明屬性及參數(shù)值。此外,每項(xiàng)標(biāo)注內(nèi)容必須包含獨(dú)立的起始標(biāo)簽與結(jié)束標(biāo)簽。具體標(biāo)注格式如下:
<annotator team =“...” name= “...”orgname=“...” > < /annotator> 分別表示“標(biāo)注者起始標(biāo)簽、標(biāo)注團(tuán)隊(duì)、標(biāo)注者、標(biāo)注者單位、標(biāo)注者結(jié)束標(biāo)簽”。
<annodate initial_notated = “...” lastmod =“...” > < /annodate>分別表示“標(biāo)注時(shí)間起始標(biāo)簽、首標(biāo)時(shí)間、定標(biāo)時(shí)間、標(biāo)注時(shí)間結(jié)束標(biāo)簽”。
< corpus source = “...” discourse =“...” > < /corpus> 分別表示“語料起始標(biāo)簽、語料來源、類型、語料結(jié)束標(biāo)簽”。
以上標(biāo)注內(nèi)容是用戶獲取隱喻語料庫基本信息的重要窗口。具體來講,它可以幫助用戶按照元信息標(biāo)注參數(shù)檢索出所需要類別的批量文本或?qū)τ谡麄€(gè)研究最有某種顯著意義的一些特定文本,也可以用來確定某些元文本參數(shù)之間準(zhǔn)確的統(tǒng)計(jì)學(xué)數(shù)據(jù),進(jìn)而研究它們之間的相關(guān)性(陳虹2012:40)。當(dāng)然,隱喻語料庫開發(fā)者需要根據(jù)不同的研究目的或公開程度來合理選取相應(yīng)的元信息進(jìn)行標(biāo)注。
語法標(biāo)注有時(shí)也被稱為詞類賦碼或詞性標(biāo)注,是指對語料庫文本中的每個(gè)詞匯單元添加某種標(biāo)簽或記號來表明詞性(Leech 1997:2)。這是一種最基本的語料標(biāo)注方法,也是自然語言處理中相對比較成熟的一種自動標(biāo)注技術(shù)。目前最常見的英語自動詞性賦碼軟件有Claws,TreeTag?ger,Wmatrix等。隱喻語料庫中的語法標(biāo)注主要是針對隱喻性詞匯而言的。因此,在標(biāo)注之前,需要通過某種隱喻識別程序來獲取語料庫中的隱喻性詞匯,然后通過計(jì)算機(jī)軟件的自動標(biāo)注技術(shù)對這些詞匯進(jìn)行詞性標(biāo)注,被標(biāo)注的詞匯單元將對應(yīng)于不同的隱喻類型。具體標(biāo)注格式如下:
<p>
<s n=“45”>Container<w NN>group Tiphook yesterday<w VBD>said it was still<w JJ>confident of<w VBG>winning its<w JJ>joint£ 643 million<w NN>bid for Sea Containers even though the<w NN>battle has<w VBN>swung<w IN>towards James Sherwood’s ferries?to?trailers combine.
<s n= “46” > ...
< /p >
以上文本的開頭<p>表示段落的開始,</p>表示段落結(jié)束。 <s n=“45”>和<s n=“46”>分別表示文本中的句序。而尖括號內(nèi)的字母組合代表該詞的詞性,即隱喻類型。比如,<w NN>表示group是一個(gè)普通名詞,<w VBN>表示swung是動詞的過去分詞。因此,這兩個(gè)詞的隱喻類型分別歸類為名詞性隱喻與動詞性隱喻。
認(rèn)知語言學(xué)通常將隱喻研究劃入認(rèn)知語義學(xué)研究的范疇。因此,語義標(biāo)注無疑是隱喻語料庫標(biāo)注過程中的重要環(huán)節(jié)。通常情況下,隱喻的語義標(biāo)注主要包含以下5個(gè)方面。
(1)基本元素
本研究利用英國蘭卡斯特大學(xué)Paul Rayson開發(fā)的在線語義標(biāo)注工具Wmatrix進(jìn)行文本中的隱喻識別:程序步驟包括獲取主題語義域、確定候選源域及源域詞匯、識別隱喻形符、確定目標(biāo)域與構(gòu)建概念映射(柳超健 王軍2017)。此外,在概念映射構(gòu)建環(huán)節(jié),本研究還引入目前主流的隱喻語料庫 Master Metaphor List,ATT?Meta data bank,Metalude作為概念映射構(gòu)建的主要參考依據(jù)。當(dāng)然,如果在標(biāo)注過程中無法在上述隱喻語料庫中檢索到相應(yīng)的基本概念映射,標(biāo)注者也可自定義額外的詞匯范疇。具體標(biāo)注格式如下:
<view>
<mapping>LIFE IS A JOURNEY</mapping>
<metuw>road</metuw>
<source domain>journey</source domain>
<target domain>life</target domain>
<source>MML</source>
<o(jì)riginal literature>more than cool reason</original literature>
</view>
以上文本的開頭<view>表示隱喻界定的開始,</view>表示隱喻界定的終止;<metuw><source domain><target domain><mapping>分別對應(yīng)于隱喻的基本要素journey,journey,life和LIFE ISA JOURNEY;<o(jì)riginal literature>表示該隱喻源于專著More than cool reason;<source>表示該概念映射的主要參考依據(jù)來源于隱喻語料庫Metaphor Master List.
(2)歸約性
正常情況下,在詞匯單元產(chǎn)生隱喻意義時(shí),人們無法有意識地感知其隱喻性,因?yàn)榻^大多數(shù)隱喻表達(dá)式都是高度規(guī)約化的。然而,隱喻的歸約性并非靜止不變,它是一個(gè)程度上的問題。隱喻規(guī)約性差異將產(chǎn)生不同的隱喻類別,其中最常見的有常規(guī)隱喻、新奇隱喻和歷史隱喻(etymological metaphor)。隱喻的規(guī)約性程度越高,識別難度也就越大。隱喻的歸約性是語料庫用戶透視隱喻概念的一個(gè)重要視窗。具體標(biāo)注格式如下:
<view>
<conventionality>conventional metaphor</conventionality>
<conventionality> novel metaphor< /conven?tionality>
<conventionality>etymological metaphor</conventionality>
</view>
(3)層級性
隱喻具有層級性(gradability),即,不同概念的隱喻性程度之間存在差異。通常情況下,源域和目標(biāo)域所共享的語義特點(diǎn)越多,隱喻程度就越弱。比如,海洋綠洲的隱喻性要低于心智“綠洲”的隱喻性。語義回響值是衡量隱喻性程度的基本指數(shù),可通過觀察語料庫中隱喻使用的實(shí)際情況來獲取。當(dāng)不相關(guān)的概念被引入、激活或響應(yīng)語境中的隱性概念時(shí),相應(yīng)的語義回響值就會增大(Hanks 2006:31)。隱喻的層級性從本質(zhì)上講是隱喻性程度的體現(xiàn)。隱喻性程度越高,其顯性程度越低。鑒于目前尚未有可定性的計(jì)算方法來界定隱喻性,本研究暫選用從-5到+5的數(shù)值區(qū)間進(jìn)行量化。數(shù)值越大,隱喻性程度越高。隱喻性程度對于揭示隱喻使用者及隱喻接受者的認(rèn)知行為具有重要意義。具體標(biāo)注格式如下:
<view>
<metaphoricity>5</metaphoricity>
</view>
(4)間接性
隱喻概念的間接性(indirectness)及歸約性與隱喻的功能存在某種程度的相關(guān)性,并且會影響隱喻接受者的心智模型(Krennmayr 2011:273)。因此,可基于概念的間接性對隱喻進(jìn)行標(biāo)注。隱喻概念的間接性在語言層面可分為間接隱喻、直接隱喻和明晰隱喻(explicit metaphor)。間接隱喻是概念隱喻中最具有原型意義的類別,即源域的概念結(jié)構(gòu)(比如high wage)通過間接方式來表征目標(biāo)域;直接隱喻無需借助間接概念進(jìn)行概念轉(zhuǎn)換與表征,最常見的形式為明喻(simile);明晰隱喻主要涉及隱喻的間接回指,即在概念結(jié)構(gòu)中可重新獲取所指概念的隱喻性(Steen et al 2010:33-40)。具體標(biāo)注格式如下:
<view>
< indirectness > indirect metaphor < /indirect?ness>
< indirectness > direct metaphor < /indirect?ness>
< indirectness > explicit metaphor < /indirect?ness>
</view>
(5)標(biāo)記語
某些隱喻的使用通常伴有明確的話語標(biāo)記(marker)或調(diào)節(jié)語(tuning device)(Goatly 1997;Cameron,Deignan 2003),因此可將這類標(biāo)記語作為隱喻識別的文本線索。該標(biāo)注也是隱喻自動識別方法的重要組成部分。鑒于Goatly對隱喻話語標(biāo)記語做過迄今為止最詳盡的分類:包括顯性標(biāo)記語、強(qiáng)調(diào)詞、弱化修飾詞、元語言、擬態(tài)詞等(Goatly 1997:172 -199),本研究主要基于上述分類標(biāo)準(zhǔn),分別為每個(gè)類別的隱喻標(biāo)記語進(jìn)行從字母A到L的標(biāo)注,并記錄其序號和內(nèi)容。具體標(biāo)注格式如下:
<metsignal>
<metsignal N =“11” >
<signal>literally, something of< /signal>
<sigclass>A-L</sigclass>
< /metsignal>
隱喻是人類認(rèn)知世界的基本推理機(jī)制,其基本功能是能夠讓我們通過具體、簡單、顯性的經(jīng)驗(yàn)結(jié)構(gòu)來表征抽象、復(fù)雜、隱性的經(jīng)驗(yàn)結(jié)構(gòu)。然而,如果從語篇視角研究隱喻的功能,我們需要探討交際中更具體的問題。比如,為什么某種特定的隱喻形式只出現(xiàn)于某類特定的文本或語篇中。這類問題通常與隱喻對現(xiàn)實(shí)的表征相關(guān)。具體來說,隱喻具有說服、理解、評價(jià)、解釋、突顯、掩蓋、表達(dá)情感或信仰、理論化等功能。當(dāng)然,在同種語篇中,也可能出現(xiàn)幾種功能共現(xiàn)的情況。如果從語言交際的視角看,隱喻的功能則主要體現(xiàn)在隱喻使用的刻意性(deliberateness)方面,即,隱喻使用者是否刻意引導(dǎo)話語接受者通過某個(gè)事物來理解另一事物,或是隱喻話語接受者在經(jīng)歷刻意性的隱喻話語之后是否改變對當(dāng)前話題的某些觀點(diǎn)(Krennmayr 2011:152)。 具體標(biāo)注格式如下:
<view>
<metfunction>persuasion</metfunction>
< communication > deliberate < /communica?tion>
</view>
隱喻標(biāo)注在隱喻語料庫建設(shè)與應(yīng)用過程中具有重要意義,是當(dāng)前語料庫隱喻研究的重要課題之一。本研究在以往國內(nèi)外大型隱喻語料庫標(biāo)注實(shí)踐的基礎(chǔ)上,深入探討隱喻標(biāo)注的相關(guān)重要問題。在理論指導(dǎo)方面,系統(tǒng)提出隱喻標(biāo)注的基本原則;在標(biāo)注語言方面,論證XML在隱喻標(biāo)注中的優(yōu)勢及可行性;在標(biāo)注方法方面,對隱喻標(biāo)注的概念作出重新定義,并倡導(dǎo)“人工識別+機(jī)器輔助”與“機(jī)器標(biāo)注+人工輔助”并用的理念;在標(biāo)注覆蓋度方面,對隱喻標(biāo)注內(nèi)容作出具體說明,并建議采用“基本標(biāo)注+選擇性標(biāo)注”的方案。此外,語料庫隱喻標(biāo)注研究依舊任重道遠(yuǎn),對概念隱喻理論中涉及基本隱喻等重要信息的自動提取、識別與標(biāo)注,是重點(diǎn),更是難點(diǎn)。