徐立紅
(漳州師范學(xué)院外語系,福建漳州 363000)
言語引述中回指解析研究
徐立紅
(漳州師范學(xué)院外語系,福建漳州 363000)
許多指稱解析研究忽略了言語直接引述的回指現(xiàn)象。以已知信息等級(jí)為理論框架,根據(jù)W atters和 Gundel的已知等級(jí)議定標(biāo)準(zhǔn),集中探討代詞“它”在漢語報(bào)紙新聞直接引述語中的回指解析,代詞“它”回指語的非所指和先行語的不可確認(rèn)方面比英語更復(fù)雜。W atters和 Gundel的已知等級(jí)議定標(biāo)準(zhǔn)并不完全適合漢語直接引述語中這一特殊指稱關(guān)系的解析。
言語引述;回指解析;已知等級(jí);議定標(biāo)準(zhǔn)
回指解析 (anaphora resolution)(劉禮進(jìn),2005)不同于普通語言學(xué)上的回指確認(rèn)或照應(yīng)解讀,它是指計(jì)算機(jī)對(duì)自然語言中回指語 (主要是代詞)的自動(dòng)化解析,即電腦通過運(yùn)行研究者設(shè)計(jì)的計(jì)算程序/方案成功檢索出代詞的先行語。20世紀(jì)七八十年代這方面的早期研究工作趨于理論性,主要局限于依靠簡(jiǎn)單的啟示規(guī)則的計(jì)算法 (Bobrow,1964)。20世紀(jì) 90年代后期,這方面的研究趨于切合實(shí)際,把回指解析設(shè)計(jì)限定在單一的特定語境、語言知識(shí)或語域之內(nèi),獲得了實(shí)用、有效的方法和經(jīng)驗(yàn)。不同時(shí)期涌現(xiàn)出一批標(biāo)志性成果,如 Hobbs(1978)的簡(jiǎn)樸計(jì)算法、R ich和 LuperFoy(1988)的分布方案、M itkov(1996)的回指解析系統(tǒng)等。
自動(dòng)化回指解析是計(jì)算機(jī)對(duì)自然語言理解的一項(xiàng)艱難任務(wù),這方面的研究近年來在國(guó)內(nèi)也受到格外的關(guān)注。王德亮 (2004)提出一個(gè)基于中心理論框架的回指解析計(jì)算法擴(kuò)展模式,對(duì)漢語零回指進(jìn)行了實(shí)證研究。還有學(xué)者運(yùn)用計(jì)算語言學(xué)的回指解析探索篇章回指的語用功能 (許余龍,2004)和會(huì)話的回指修正 (馬文,2007)等。
關(guān)于言語引述的研究在西方已有很長(zhǎng)的歷史。言語引述有直接引述 (直引 DS)和間接引述 (間引 IDS)兩種方式。從語篇分析的角度看,它局限于孤立句子間句法關(guān)系的描寫和文學(xué)作品方面的研究。Coulm as(1985),Bakhtin(1996)和辛斌 (2007)等語言學(xué)家對(duì)不同體裁的引述語形式與功能作出了廣泛的語篇—語用解釋,但卻忽略了引述語中的回指現(xiàn)象。因?yàn)橐Z中的回指語與其他的回指形式不同,缺乏足夠的語境 (W atters&Gunde,2007),對(duì)引述語篇的指代關(guān)系研究較少。本研究嘗試根據(jù)Gundel,Hedberg和 Zacharsk i(1993)的已知信息等級(jí)理論及W atters和 Gundel(2007)的已知等級(jí)議定標(biāo)準(zhǔn),通過大量報(bào)紙新聞直接引述語料,運(yùn)用計(jì)算機(jī)自動(dòng)化計(jì)算法,集中探討代詞“它”在漢語報(bào)紙新聞直接引述語中的回指解析,并與 W atters和 Gundel(2007)的研究成果進(jìn)行對(duì)比分析。
報(bào)紙新聞言語引述是報(bào)道者表達(dá)意圖的有效手段之一,目的是保留原話的風(fēng)格,增添報(bào)道的真實(shí)感,加強(qiáng)報(bào)道的可信性。根據(jù) Thomp son(1996)的觀點(diǎn),它具有三種主要功能:強(qiáng)調(diào)性、說服力及報(bào)道者與引語之間保持聯(lián)系。Fairc lough(1995a:50)認(rèn)為,它通常用于重要的、來自權(quán)威者的、報(bào)道者希望把自己與引語相聯(lián)系的或有充分報(bào)道空間的內(nèi)容。正確理解報(bào)紙新聞直接引語篇具有重要意義。如何解析報(bào)紙新聞直接引述語篇的指代關(guān)系呢?漢語直接引述語中的代詞“它”回指解析是否與英語一樣?這種特殊語境的回指解析是否因與其他回指形式的不同而被忽略?能否為回指解析系統(tǒng)提供足夠的語境以使這一回指現(xiàn)象得以正確解讀?
Gundel界定了不同參照標(biāo)記所指對(duì)象的認(rèn)知度,由高到低的 6種已知信息級(jí)別 (givenness hierarchy)為注意焦點(diǎn) >激活 >熟知 >唯一可識(shí)別 >可確指 >類型識(shí)別。
Gundel的已知等級(jí)充分體現(xiàn)出指稱語的認(rèn)知級(jí)別。由具體限定詞與代詞組成的認(rèn)知級(jí)別體現(xiàn)了指稱對(duì)象在記憶和注意狀態(tài)方面具有不同的信息含義:(1)表示讀者可確認(rèn)某類實(shí)體;(2)表示作者意指某個(gè)實(shí)體并預(yù)設(shè)讀者可確認(rèn);(3)表示作者意圖中特定實(shí)體可被讀者確認(rèn);(4)表示所指實(shí)體已為讀者所熟知;(5)表示實(shí)體處于作者 /讀者認(rèn)知激活狀態(tài);(6)表示實(shí)體不但被激活且處于注意焦點(diǎn),即處于作者/讀者當(dāng)前短時(shí)記憶里或出現(xiàn)在直接語境中。實(shí)際上,已知等級(jí)是一個(gè)關(guān)于所指含義或?qū)嶓w認(rèn)知等級(jí)的連續(xù)體。新聞報(bào)紙報(bào)道者確立代詞“它”表示所指對(duì)象在讀者記憶和注意狀態(tài)方面不但被激活且處于焦點(diǎn)狀態(tài),所以,這一所指標(biāo)記作為認(rèn)知信息處理信號(hào)在信息狀態(tài)上具有可識(shí)別能力,其認(rèn)知狀態(tài)蘊(yùn)含了所有右向的低等級(jí)狀態(tài)。
本項(xiàng)研究選取 2008年 1至 12月的《南方周末》上文化、財(cái)經(jīng)、政經(jīng)、科學(xué)、調(diào)查、觀察、時(shí)局天下、縱深、音樂、文學(xué)和閱讀等欄目報(bào)道中雙引號(hào)里帶有代詞“它”的語篇作為數(shù)據(jù)分析語料。為了保證語料的信度和效度,人物專訪的報(bào)道忽略不計(jì),因?yàn)檫@方面的語篇帶有報(bào)道者轉(zhuǎn)述主觀性并缺乏引號(hào)標(biāo)示。收集到語料3 760字,共有 245個(gè)帶有代詞“它”的直接引述語篇,代詞“它”共計(jì) 288個(gè)。對(duì)于同一引語的回指語不止一個(gè)的 (如例 (2),(10)),系統(tǒng)只取一個(gè),得到代詞“它”245個(gè)。
劉禮進(jìn) (2005)認(rèn)為,自動(dòng)化回指解析一般分為三個(gè)步驟:識(shí)別回指語與非回指語、檢索先行語候選項(xiàng)、從先行語候選項(xiàng)集合中選擇先行語。根據(jù)以上步驟,采用數(shù)據(jù)庫(kù)系統(tǒng)軟件dBASEIV,把 245個(gè)帶有代詞“它”的直接引述語篇收集到自建的語料庫(kù)中,按語篇中出現(xiàn)的先后順序編號(hào),并標(biāo)注回指語 (referential)或非回指語 (non-referential)。唯有回指性的才需進(jìn)一步解析,計(jì)算系統(tǒng)逐一核查。代詞“它”絕大部分為回指語,除了個(gè)別的例子為下指語,即指稱對(duì)象在代詞“它”標(biāo)示語后面,這種個(gè)例不在本研究的范圍內(nèi),不納入語料庫(kù)?;刂傅拇~“它”既然是指稱代詞,就必須在先前具有所指的對(duì)象。大多數(shù)情況下,先行語是先前名詞詞組、動(dòng)詞詞組標(biāo)示的事物或表述的事件、活動(dòng)等。檢索每個(gè)代詞先行語候選項(xiàng),一旦搜索到回指語,就可辨別先行語的待釋候選項(xiàng)。代詞“它”先行語檢索范圍以當(dāng)前句外加 2至 3個(gè)先前語句為限。代詞“它”先行語的待釋候選項(xiàng)劃定之后,就從先行語待釋候選項(xiàng)集合中選擇先行語。系統(tǒng)將從已檢索到的候選項(xiàng)集合中確認(rèn)哪個(gè)先行語符合已知等級(jí)議定標(biāo)準(zhǔn)的哪一個(gè)。如果不符合議定標(biāo)準(zhǔn),根據(jù)已知信息等級(jí),這一先行語就被標(biāo)示為不可確認(rèn)的。
代詞 it的所指對(duì)象符合以下 W atters和Gundel(2007:97-101)自動(dòng)化回指解析中的已知信息等級(jí)編碼議定標(biāo)準(zhǔn),就會(huì)在記憶和注意狀態(tài)下處于已知等級(jí)的認(rèn)知焦點(diǎn)級(jí)別上。本研究嘗試運(yùn)用這些議定標(biāo)準(zhǔn)探討漢語直接引述語中的代詞“它”。
a.代詞 it(它)的所指對(duì)象在前一句的主語位置上
(1)“Dodder is a very difficu ltpest to contro l.”De Moraes says.“It attaches to the host p lant,and it m akes it very hard to kill the weed p lan twithout k illing the host.”
(2)他 (李小龍)說:“所以我從小覺得自己就是一個(gè)美國(guó)人,中國(guó)人的身份對(duì)我來說就像是一個(gè)長(zhǎng)著紅頭發(fā)。不是說它不存在,而是它太次要了,完全不能表明我是誰?”
b.代詞 it(它)的所指對(duì)象在同一句的先前位置提及
(3)“W e believe our offer ismore than fair and don’t feel any need to am end it at this point,”Parker said.
(4)“開始動(dòng)物會(huì)害怕,但過一陣,它就好奇,要出去了,去爬去看另一個(gè)空間,看到別的動(dòng)物,它可能探一下頭馬上就跑回來,有時(shí)候它又會(huì)直接跑到廣場(chǎng)中間,你完全不可控制?!秉S永栤說。
c.代詞 it(它)的所指對(duì)象在先前句的句法焦點(diǎn)位置上 (分裂句或存在句的系動(dòng)詞后面)
(5)“If itwas a test environm ent,they said,‘Let’s p lay dead’,”saysO fria.“There’s th is th ing com ing to kill them,and so they avoid it and go on with their lives.”
(6)“有很多作品不痛不癢,可以掛在墻上美化生活,因此,它也可有可無,而我要避免的作品變成一個(gè)美化生活的東西。”黃永栤說。
d.代詞 it(它)的所指對(duì)象是較高層級(jí)的主題 (無論所指是顯性的還是隱性的)
(7)Fo r Pilgrim s stream ing in from all continents,the ha jj is a crowningmom ent of faith,a duty fo r all ab le-bod ied M uslim s to carry out at leastonce.On Thursdaymorning,as they have for the past few days,hund reds of thousands c irc led the Kaaba,the black cubic stone in M ecca,Islam’s ho liest site,w hich M uslim s facew hen they perform their daily p rayers.“For us it is a vacation aw ay from work and daily life to renew yourself sp iritually,”said Ahm ed Karkoutly,an Am erican docto r from B row nsville,Texas.“You feelyou are partof a universe fu lfilling God’swill.It’s a cosm icmo tion,orbiting the Kaaba.”
本段落描述的是穆斯林信徒們到麥加朝拜的情況。it所指的是 the hajj(麥加朝圣),因?yàn)閠he hajj是較高層級(jí)的隱性主題。隨后報(bào)道者直截了當(dāng)?shù)孛枋鼋掏絺兙奂?the Kaaba(天房)朝拜的具體情況。由于信徒們面向天房祈禱是麥加朝圣的必要程序,代詞 it的所指對(duì)象應(yīng)該是處于較遠(yuǎn)距離的隱性主題 the hajj,先行語與指稱代詞 it間隔兩個(gè)小句。
(8)有關(guān)統(tǒng)計(jì)表明,活動(dòng)的參與者大多數(shù)是在近 20年里移居廈門的。兩百多萬人口中,“新廈門人”已經(jīng)占多數(shù)。老孟從 1992年到廈門工作,“半生積蓄 +半生債務(wù)”,才換來屬于自己的一套房子。汪民認(rèn)為,這些落戶廈門的外地人學(xué)歷較高,有較強(qiáng)的公共意識(shí)。他們和老廈門人一起,通過合法理性的方式去維護(hù)自己的利益。
“我們就是沖著它的溫馨而來,并打算在這兒過下半輩子呢。這兒必須要好,否則只有離開?!?/p>
此例的突顯主題為廈門和廈門人,代詞“它”顯然指代廈門。
d.代詞 it(它)的所指對(duì)象在前兩個(gè)句中都提及
(9)The B ritish demo lished the building in an effort to disband the un it.“W e identified the ser ious cr im es un it as frank ly,too far gone,”Burbridge said.“W e justhad to get rid of it. ”
(10)我剛把嬰兒放在身邊就墜入了深淵。然后,她給牢友釋夢(mèng):“那個(gè)嬰兒就是我們的信念。任何東西都無法阻擋它成長(zhǎng)。我們是它的開路人,但我們必將在它成人之前為它而死。”
f.代詞 it(它)的所指對(duì)象是前一句的事件或活動(dòng)
(11)In July,M ayer John F.Streetgave a televised address in which he p leaded with young peop le.“Lay down your weapon s.Do it now.Choose education over vio lence.”
(12)“我們得知難而進(jìn),勇于解決困難,渡過關(guān)鍵期?!彼f,“……它才是辦法,我們大家唯一的出路。”
根據(jù)W atters和 Gundel(2007)對(duì)英語直接引述語中代詞 it的回指語歸類結(jié)果,在含有 it的 310個(gè)直接引述語中,有 263個(gè) it具有回指功能,即有所指的,另有 47個(gè)不具備回指功能,即非所指的,兩者分別占回指語總數(shù)的84.84%和 15.16%。而漢語代詞“它”回指語歸類結(jié)果顯示,含有“它”的 245個(gè)直接引述語中,有 239個(gè)“它”具有回指功能,只有 6個(gè)不具備回指功能,屬于下指語,指稱對(duì)象在代詞后面,兩者分別占回指語總數(shù)的 97.55%和 2.45%。
表1 代詞 it(它)的回指語分類
W atters和 Gundel(2007)對(duì)于代詞 it的先行語歸類結(jié)果顯示,在 263個(gè)具有回指功能的代詞 it中有 256個(gè)先行語,其中被標(biāo)示為可確認(rèn)的為 208個(gè),不可確認(rèn)的為 48個(gè),分別占先行語總數(shù)的 81.25%和 18.75%。而漢代詞“它”先行語歸類結(jié)果顯示,233個(gè)代詞先行語中有 214個(gè)被標(biāo)示為可確認(rèn)的,19個(gè)為不可確認(rèn)的,兩者分別占先行語總數(shù)的 91.85%和8.15%。在這 19個(gè)不可確認(rèn)的先行語中有 7個(gè)出現(xiàn)多個(gè)相互競(jìng)爭(zhēng)的指稱對(duì)象,它們含糊不清,難以確認(rèn),還有 12個(gè)所指對(duì)象在系統(tǒng)中找不到匹配的先行語。例如:
(13)一篇獲獎(jiǎng)作文可以進(jìn)大學(xué)?在媒體的炒作下,“新概念作文大賽”的 7名獲獎(jiǎng)?wù)哧惣延?、宋靜茹、王越、楊倩、伍迪、李佳、劉嘉駿分別被北京大學(xué)、南開大學(xué)、南京大學(xué)、華東師范大學(xué)免試錄取,一時(shí)成為社會(huì)話題,廣為人知。
“它讓我們進(jìn)大學(xué)多了一個(gè)通道,不必參加高考了?!标惣延禄貞洝?/p>
代詞“它”所指對(duì)象是一篇獲獎(jiǎng)作文或是新概念作文大賽,兩個(gè)相互競(jìng)爭(zhēng)的先行語令人無法確認(rèn)。實(shí)際上,“它”既不指一篇獲獎(jiǎng)作文,也不指新概念作文大賽,指稱對(duì)象應(yīng)該是參加新概念作文大賽這一活動(dòng)。這種例子既屬于相互競(jìng)爭(zhēng)的先行語,也屬于找不到匹配的先行語,系統(tǒng)將其歸入不可確認(rèn)的、多個(gè)相互競(jìng)爭(zhēng)的先行語。
表2 代詞 it(它)的先行語分類
數(shù)據(jù)分析發(fā)現(xiàn),漢語直接引述語中代詞“它”的回指關(guān)系比英語更復(fù)雜,體現(xiàn)在非所指的回指語和不可確認(rèn)的先行語方面,漢語數(shù)據(jù)明顯比英語低,非所指的回指語分別占 2.45%和15.16%,不可確認(rèn)的先行語分別占 8.15%和18.75%?;谡Z料分析發(fā)現(xiàn),漢語部分代詞回指語并非找不到匹配的先行詞,而是系統(tǒng)設(shè)計(jì)的議定標(biāo)準(zhǔn)缺少先行語在先前小句的句法定語位置這一標(biāo)準(zhǔn)項(xiàng)。12個(gè)代詞的所指對(duì)象找不到匹配的先行語中有 9個(gè)屬于下例的情況。
(14)“那時(shí)我心里像倒了五味瓶,我不像臺(tái)灣的親人,也不像臺(tái)灣的客人,它有時(shí)親切,有時(shí)生疏,我不知該怎么定義它!”夏天怡說。
(15)信中同時(shí)說,……“到目前為止,關(guān)于南北帶上的強(qiáng)震危險(xiǎn)雖然已經(jīng)開過多次會(huì)商討,可是仍然得不到肯定的結(jié)論,這說明僅靠日常監(jiān)視工作這套做法,是難于解決問題的,只有依靠更深入地和更有針對(duì)性地展開科學(xué)研究,組織高水平的科技隊(duì)伍,進(jìn)行集體攻關(guān),在強(qiáng)震危險(xiǎn)區(qū)的判斷接近實(shí)際的情況下,再環(huán)繞它部署密集的配套的短臨前兆觀測(cè)網(wǎng),方能有希望做出較好的臨震預(yù)報(bào)?!?/p>
這兩例的代詞回指語之所以被劃入不可確認(rèn)的、找不到匹配的先行語,是因?yàn)殡m然回指語在先前句子中提及,但指稱對(duì)象并不在前句的句法突顯位置 (充當(dāng)定語),這種情況不符合任何一個(gè)已知等級(jí)議定標(biāo)準(zhǔn),實(shí)際上,這種代詞回指現(xiàn)象并非找不到匹配的先行語,而是這種指代關(guān)系不符合系統(tǒng)設(shè)計(jì)的議定標(biāo)準(zhǔn)。由此可見,W atters和 Gundel的已知等級(jí)議定標(biāo)準(zhǔn)并不完全適合漢語直接引述語中代詞“它”的指稱關(guān)系解析。
以已知信息等級(jí)為理論框架,根據(jù)W atters和 Gundel的已知等級(jí)議定標(biāo)準(zhǔn),為漢語直接引述語的代詞回指關(guān)系確認(rèn)提供必要的語境。借助語料和計(jì)算機(jī)運(yùn)算來確認(rèn)引語這種特殊語境下指稱代詞的所指是不容忽視的有效方法。對(duì)比W atters和 Gundel的研究成果,發(fā)現(xiàn)漢語代詞“它”在非所指的回指語和不可確認(rèn)的先行語方面比英語更復(fù)雜。漢語部分代詞回指語并非找不到匹配的先行詞,而是系統(tǒng)設(shè)計(jì)的議定標(biāo)準(zhǔn)缺少先行語在先前小句的句法定語位置這一標(biāo)準(zhǔn)項(xiàng)。W atters和 Gundel的已知等級(jí)議定標(biāo)準(zhǔn)并不完全適合漢語直接引述語中指代關(guān)系的解析。由于已知信息等級(jí)針對(duì)不同的限定詞與代詞標(biāo)示不同的認(rèn)知等級(jí),對(duì)于其他指稱標(biāo)示語,如指示代詞、有定指稱語等,這些標(biāo)準(zhǔn)和算法是否產(chǎn)生同樣的情況還有待于今后更多的實(shí)證研究和數(shù)據(jù)支持。
[1]Bakhtin,M.Problem s ofD ostoevsky’s Poetics[M].M inneapolis:University ofM innesota Press,1996.
[2]Bobrow,D.G.A Question Answering System forH igh SchoolA lgebraW ord Problem[A].AFIPS JointCom pu terConference Proceed ings[C].New York:ACM,1964.591-614.
[3]Coulm as,F.D irectand Indirect Speech:General Problem s and Problem sof Japanese[J].Journa l of Pragm a tics,1985,(9):41-63.
[4]Fairclough,N.Critica lD iscourse[M].London:Edward A rnold Pub lishers,1995.
[5]Gundel,J.K.,N.Hedberg&R.Zacharski.Cognitive Status and the Form of Referring Exp ression in D iscourse[J].Language,1993,(69):274-307.
[6]Hobbs,J.Resolving Pronoun Reference[J].L ingua,1978,(44):339-352.
[7]M itkov,R.Pronoun Resolution:The PracticalA lternative[A].In S.Botley&A.M cEnery(eds.)Corpus-based and Com pu ta tiona lApproaches to D iscourse Anaphora[C].Am sterdam:John Benjam ins Publishing Company,1996.
[8]Rich,E.&S.LuperFoy.An A rchitecture forAnaphoric Resolution[A].Proceed ings of the 2nd Conference on Applied Na tura lLanguage Processing[C].Morristown:A ssociation forComputationalLinguistics,1988.18-24.
[9]Thompson,G.Voices in the Text:D iscourse Perspectiveson Language Reports[J].Applied L inguistics,1996,17(4):501-530.
[10]W atters,S.&J.Gundel.An Emp irical Investivation of theRelation between Coreference andQuotation:Can a Pronoun Located inQuotations Find ItsReferent?[A].Proceed ings of the 6 th D iscourse Anaphora and AnaphorResolu tion Conference on Anaphora:Ana lysis,A lgorithm s and Applica tions[C].Berlin:Sp ringer-Verlag,2007.
[11]劉禮進(jìn).自然語言理解中的回指解析研究概述[J].外語教學(xué)與研究,2005,(6).
[12]王德亮.漢語零形回指解析——基于向心理論的研究[J].現(xiàn)代外語,2004,(4).
[13]辛斌.辛斌語言學(xué)選論[M].上海:復(fù)旦大學(xué)出版社,2007.
[14]許余龍.篇章回指的功能語用探索[M].上海:上海外語教育出版社,2004.
Som e reference reso lution studiesom itanaphoric form s in quotations.In the givennesshierachy fram ework,thispaper focuseson the anaphora reso lution algorithm of non-personalp ronounitin Chinese new spaper quotations based onW atters and Gundel’s givenness hierachy coding p rotoco l criteria.The study finds that the anaphora reso lution of p ronounitin Chinese new spaper quotations ismore comp licated than that in English in term sof non-referential anapho ra and indeterm inab le an tecedent.The coding p rotocol criteria,in som ew ay,is notapp licab le to the anaphora resolution in Chinese quotations.
discourse quotation;anaphora reso lution;givenness hierarchy;coding p rotoco l criteria
H314 < class="emphasis_bold">文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):
1008-665x(2010)06-0001-05
2010-03-29
福建省教育廳社科資助項(xiàng)目(JA 09168S);漳州師范學(xué)院科研項(xiàng)目(SS07012)
徐立紅 (1966-),女,副教授,研究方向:語篇分析