張霄軍,周靜獅
(1. 西交利物浦大學(xué) 人文社科學(xué)院,江蘇 蘇州 215123;2. 廣東省安全智能新技術(shù)重點實驗室,廣東 深圳 518055;3. 西交利物浦大學(xué) 智能工程學(xué)院,江蘇 蘇州 215123)
論辯挖掘(Argument Mining)的主要任務(wù)是從非結(jié)構(gòu)化文本文檔中自動檢測、分類和提取論點,以便為機(jī)器學(xué)習(xí)及深度學(xué)習(xí)模型提供結(jié)構(gòu)化數(shù)據(jù)[1]。它是計算論辯中一個重要的任務(wù),而計算論辯作為情感計算的子任務(wù), 在自然語言處理諸多下游任務(wù)中越來越受到重視。這是因為論辯挖掘以創(chuàng)新的方式處理來自網(wǎng)絡(luò)的信息,特別是來自社交媒體的信息,具有潛力非凡的應(yīng)用價值。論辯挖掘系統(tǒng)可以對專業(yè)報紙文章、政府報告、法庭判決記錄、在線社交網(wǎng)絡(luò)內(nèi)容中的論點、決策、評論等進(jìn)行大量的定性分析,為社會和政治科學(xué)領(lǐng)域的決策者和研究人員提供前所未有的自動化工具,為企業(yè)市場營銷創(chuàng)造新的前景。在林林總總的論辯挖掘應(yīng)用場景中,政治論辯挖掘關(guān)注的是政治話語和評論,但政治話語不同于法庭記錄和用戶評價的“直接”陳述事實、表述訴求或者發(fā)表褒貶,而是充斥著外交辭令、政治表達(dá)和演講修辭。這對論辯挖掘任務(wù)而言是一個挑戰(zhàn)——系統(tǒng)得兼顧語用(Pragmatics)而非單純語義(Semantics)去理解政治話語。
受制于訓(xùn)練語料資源稀缺,論辯挖掘在中文政治領(lǐng)域的實驗研究仍屬于空白地帶。外交作為政治的窗口,外交文本中的外交辭令、外事問答以及外宣公告都蘊含著豐富而微妙的政治論辯技巧,在外交領(lǐng)域開展政治論辯挖掘研究具有現(xiàn)實意義和應(yīng)用價值?!岸嗾Z外交對話語料庫”是一個在建的基于中國外交部例行記者招待會和外交部新聞發(fā)言人表態(tài)和電話答問的中外多語轉(zhuǎn)錄文本的多語問答語料庫,其例行記者招待會和新聞發(fā)言人電話答問實錄文本是構(gòu)建對話式中文政治論辯挖掘任務(wù)數(shù)據(jù)集的理想數(shù)據(jù)來源,其新聞發(fā)言人表態(tài)文本則是構(gòu)建單篇式中文政治論辯挖掘任務(wù)數(shù)據(jù)集的理想數(shù)據(jù)來源。鑒于不同語言在表達(dá)政治觀點時的語用方式不同,如中文表達(dá)相對委婉謹(jǐn)慎,而英文表達(dá)相對直接大膽,雙語平行政治論辯語料將會有助于系統(tǒng)更好地理解原文,因此該語料庫又可以從跨語言論辯挖掘的角度提供新的中文政治論辯挖掘任務(wù)及數(shù)據(jù)集。
根據(jù)石岳峰等[2]的綜述,目前用于政治論辯的論辯挖掘任務(wù)數(shù)據(jù)集主要有三個: USElecDeb60To16[3]、the UK 2015 Political Election Corpus[4]和The American Presidency Project[5]。也有研究者[6-8]自建小規(guī)模論辯語料庫從不同視角設(shè)計不同論辯挖掘任務(wù)進(jìn)行研究。
USElecDeb60To16數(shù)據(jù)來源為美國總統(tǒng)競選辯論委員會網(wǎng)站(Commission on Presidential Debates(1)https://www.debates.org/,目前該網(wǎng)站數(shù)據(jù)已經(jīng)更新至2020年特朗普與拜登總統(tǒng)競選辯論會。),包含自1960年肯尼迪與尼克松總統(tǒng)競選辯論會至2016年克林頓與特朗普總統(tǒng)競選辯論會全文轉(zhuǎn)寫,以及副總統(tǒng)競選全文轉(zhuǎn)寫, 共計39篇轉(zhuǎn)寫文本。Haddadan等人[3]將其切分為6 601個話輪(Speech Turns)共計34 013個句子和676 227個詞例。人工標(biāo)注兩種論辯成分——“主張(Claims)”和“舉證(Premises)”,其中,標(biāo)注主張16 087項,標(biāo)注舉證13 434項,共計29 521項。他們將這些標(biāo)注好論辯成分的句子分成三個數(shù)據(jù)集: 訓(xùn)練集(含13 894個論辯標(biāo)記)、驗證集(含6 577個論辯標(biāo)記)和測試集(含9 050個論辯標(biāo)記),設(shè)計了兩個分類的論辯挖掘任務(wù): 論辯句檢測和論辯成分識別。
Lippi和Torroni[4]選擇英國星空新聞頻道(Sky News)2015年4月2日7位英國首相候選人的論辯節(jié)目,截取其中三位候選人(卡梅倫、克萊格和米利班德)的386個視頻片段(卡梅倫122段視頻、克萊格104段視頻、米利班德160段視頻)并將其轉(zhuǎn)寫為實錄文本,轉(zhuǎn)寫文本共9 666個詞例(卡梅倫3 469詞、克萊格2 849詞、米利班德3 348詞)。人工只標(biāo)注視頻片段是否包含主張,設(shè)計的論辯任務(wù)也只涉及待檢測論辯句是否包含主張。
Menini等人[5]的數(shù)據(jù)也是美國總統(tǒng)競選辯論,但只選取1960年肯尼迪和尼克松的競選辯論文本。數(shù)據(jù)集來源并非美國總統(tǒng)競選辯論委員會網(wǎng)站,而是美國總統(tǒng)競選項目(The American Presidency Project(2)https://www.presidency.ucsb.edu/)。該項目不僅收集歷屆美國總統(tǒng)的競選辯論文本,還收集任何與總統(tǒng)競選相關(guān)的可公開獲取的政治文本,如白宮新聞中心發(fā)布的聲明、記者招待會實錄等文本。因此該數(shù)據(jù)集包含881篇文本逾160萬詞例(肯尼迪約81.5萬詞例、尼克松約83萬詞例)。根據(jù)美國史專家的建議,他們將這些文本分為五個主題,“古巴(Cuba)”“裁軍(Disarmament)”“醫(yī)療健康(Health-Care)”“最低工資(Minimum Wage)”和“失業(yè)(Unemployment)”,抽取各個主題文本中的論辯對共計19 888對(“古巴”4 229對、“裁軍”2 508對、“醫(yī)療健康”3 945對、“最低工資”6 341對、“失業(yè)”2 865對)。從中隨機(jī)抽取1 907組論辯對,人工標(biāo)注每組論辯對的關(guān)系(“支持(Support)”“反對(Attack)”和“無關(guān)(No relation)”),論辯挖掘任務(wù)設(shè)定為論辯關(guān)系預(yù)測。
Duthie和Budzynska[6]的數(shù)據(jù)集來源于英國議會會議事錄(UK Hansard(3)http://hansard.millbanksystems.com/),他們抽取了撒切爾夫人主政時期(1979—1990)的90篇實錄文本,每篇文本均由一位英國議會議員發(fā)問開頭,然后是某位大臣的回答,接下來進(jìn)入辯論環(huán)節(jié)。論辯挖掘任務(wù)主要針對“聽眾喜好判斷(Ethos Mining)”,即聽眾對說話者有一個先驗的認(rèn)知,如果聽眾認(rèn)為說話人是個“好人”,那對說話人的觀點會積極回應(yīng)并支持,反之,如果聽眾認(rèn)為說話人是個“壞人”, 那他對說話人的觀點會進(jìn)行攻擊[7]?!奥牨娤埠门袛唷本褪歉鶕?jù)聽眾對說話人的回應(yīng)表達(dá)(Ethotic Sentiment Expression, ESE)來預(yù)測該聽眾對說話人的觀點是支持還是反對。語料標(biāo)注內(nèi)容包括“說話者(Speaker)”“目標(biāo)(Target)(4)即ESE所指的內(nèi)容或者觀點。”“喜好支持(Ethotic Support, +ESE)”“喜好反對(Ethotic Attack,-ESE)”。他們選取60篇文本做訓(xùn)練集,剩余30篇文本做測試集。數(shù)據(jù)集共標(biāo)注638句ESE(反對的有469句,支持的有169句),涉及149位說話者和188項ESE所指觀點,共計90 991詞例。
Cano-Basave和He[8]將說服性論辯(Persuasive Argumentation)識別應(yīng)用于政治論辯。該研究用到了兩種語料: 說服性文本語料(Persuasive Essays, PE)和政治辯論語料(Political Debates, PD),前者用到了說服性文本語料庫[9],后者用到了美國總統(tǒng)競選項目語料庫。說服性文本論辯識別任務(wù)數(shù)據(jù)集標(biāo)注項包括“主張(Claim)”“舉證(Premise)”“正向論辯(ForStance)”“負(fù)向論辯(AgainstStance)”“支持(SupportRel.)”和“反對(AttackRel.)”。他們應(yīng)用“語義框架網(wǎng)絡(luò)(FrameNet(5)https://framenet.icsi.berkeley.edu/fndrupal/)”來解析從兩個語料庫中選擇的90篇說服性文本和20篇政治論辯文本的所有句子,得到每個句子各個成分的語義框架并將其投射到數(shù)據(jù)集各個標(biāo)注項。
Visser等人[10]選擇了美國總統(tǒng)競選項目中有關(guān)2016年希拉里·克林頓和特朗普之間的電視論辯視頻內(nèi)容,包括期間共和黨、民主黨以及總統(tǒng)候選人之間的各種論辯視頻及其轉(zhuǎn)寫文本。他們也將短視頻平臺Reddit(6)https://www.reddit.com上那段時間發(fā)布的競選短視頻評論文本納入其語料庫the US2016 Corpus中。這樣,整個語料庫就是由US2016tv和US2016reddit兩部分語料構(gòu)成,每一部分包括共和黨語料US2016R1(分為US2016R1tv和US2016R1reddit)、民主黨語料US2016D1(分為US2016D1tv和US2016D1reddit)和候選人語料US2016G1(分為US2016G1tv和US2016G1reddit),其中字母R、D和G分別指代“共和黨(the Republican primaries)”“民主黨(the Democratic primaries)”和“候選人(the General election)”,數(shù)字“1”指的是只收集了以上三種辯論的第一輪辯論內(nèi)容。該語料庫及其子語料庫均發(fā)布在AIFdb語料庫網(wǎng)站(7)www.corpora.aifdb.org[11]上,可以公開獲取。整個語料庫共計97 999詞例(其中電視競選辯論58 900詞例、短視頻評論文本39 099詞例)。在論辯內(nèi)容標(biāo)注上,他們選擇10.5%的電視競選辯論文本和10%的短視頻評論文本作為標(biāo)注樣本,標(biāo)注項包括: “論辯單元(Locution)”“話輪轉(zhuǎn)換(Transition)”“言語行為(Illocution)”“觀點主張(Proposition)” “接受(Inferences)”“沖突(Conflicts)”和“重述(Rephrase)”。每項標(biāo)注均由5位標(biāo)注者在論辯標(biāo)注平臺OVA(8)www.ova.arg.tech上獨立完成,最后達(dá)成一致,最終在標(biāo)注樣本中產(chǎn)生了8 099個“觀點主張”標(biāo)記、2 754個“接受”標(biāo)記、823個“沖突”標(biāo)記和620個“重述”標(biāo)記。他們并未設(shè)定特定的論辯挖掘任務(wù),但是說明了該數(shù)據(jù)集的潛在應(yīng)用場景,如為深度學(xué)習(xí)在論辯挖掘中的應(yīng)用提供資源、為實證的文本分析研究提供量化數(shù)據(jù)等。
Guo等人[12]的工作雖然并不是直接的論辯挖掘,但他們所使用的語料庫是解密的外交文本,是將政治論辯具體化為外交論點挖掘的有用資源。他們的工作是利用美國國家檔案局(The U.S. National Archives)解密的1973—1977年間外交文檔來完成外交事件抽取和預(yù)測。這些文檔每篇都有一個主題編碼(TAGS),如MNUC指的是“軍事與國防事務(wù)-核武器使用(Military and Defense Affairs-Military Nuclear Applications)”,VS指的是“南越(Vietnam (South))”等。這些主題編碼方便文檔按照主題分類,Menini等人[5]的政治論辯挖掘任務(wù)就是基于主題分類進(jìn)行的。
以上是對目前政治論辯挖掘領(lǐng)域所使用的數(shù)據(jù)集的一個綜述,可以看出來,這些數(shù)據(jù)集和語料都是英語單語的,尚沒有發(fā)現(xiàn)其他語言的政治論辯挖掘任務(wù)中可以利用的數(shù)據(jù)資源,跨語言政治論辯挖掘研究也屬于學(xué)術(shù)空白。
“外交對話多語語料庫”建設(shè)的初衷其實并不是為了政治論辯挖掘任務(wù),而是為了面向國際關(guān)系研究、外交語言研究、外事翻譯研究以及對話機(jī)器翻譯研究的多語平行語料庫。在建設(shè)過程中,筆者越來越感覺到外交內(nèi)容挖掘的重要性,并論證了將該語料庫應(yīng)用于中文外交(政治)論辯挖掘任務(wù)的可行性,提出在該語料庫基礎(chǔ)上標(biāo)注中文政治論辯挖掘任務(wù)數(shù)據(jù)集的想法。
我國外交部自2011年起就將例行記者招待會實錄文本及其外文翻譯分別公開發(fā)布在外交部中外文網(wǎng)站上。截至2022年10月1日,已有2 739篇中文、英語、法語、西班牙語、阿拉伯語和俄語的例行記者招待會平行實錄文本公開發(fā)布。數(shù)據(jù)規(guī)模相當(dāng)大,目前中文文本達(dá)到957萬漢字,英語文本已經(jīng)達(dá)到627萬英語詞例,法語文本達(dá)到793萬詞例,西班牙語文本達(dá)到810萬詞例,阿拉伯語文本和俄語文本規(guī)模也都在500萬詞例以上。此外,外交部就某個特定外交事件的發(fā)言人表態(tài)和就某個重大外交事件的中外媒體吹風(fēng)會等實錄文本及其外文翻譯文本也在外交部網(wǎng)站公開發(fā)布,語料庫數(shù)據(jù)規(guī)模仍在不斷增加。外文翻譯均由外交部翻譯司專業(yè)譯員完成,翻譯質(zhì)量可以保證,因此,這個語料庫首先是一個質(zhì)量上乘的大規(guī)模多語平行語料庫,可以直接應(yīng)用于外事翻譯研究和面向特定領(lǐng)域的多語種機(jī)器翻譯使用。其次,外交部例行記者招待會充滿唇槍舌戰(zhàn),沒有充分的準(zhǔn)備和高超的話語技巧是很難勝任外交部發(fā)言人這個職位的,因此,該語料庫又是一個研究外交語言和外交話語策略的有力資源。還有,問答內(nèi)容都是有關(guān)我國外交事務(wù)的,從彼此的一問一答之中,可以窺見我國在地緣政治、國際沖突、國內(nèi)矛盾以及國際合作等事件中的態(tài)度和立場,是研究國際關(guān)系的第一手素材。
記者招待會都是以問答的形式進(jìn)行,即“記者提問+新聞發(fā)言人回答”的模式,有時會有記者的追問,新聞發(fā)言人一般會有補充回答,總之,都是一問一答。一般來說,一個問答可以視為一個話輪,因為下一個問答的內(nèi)容就是另外一個對話主題了,所以話輪分界比較明顯。目前,對于話輪主題的標(biāo)記集已經(jīng)制定完成,由“國際沖突(IC, International Conflict)”“國際合作(GC, Global Cooperation)”“地緣政治(GP, Geopolitics)”“國內(nèi)矛盾(DC, Domestic Contradiction)”“體育文化(PC, PE and Culture)”“民生經(jīng)濟(jì)(CE, Civilian Economy)”五個標(biāo)記集構(gòu)成,每個標(biāo)記集下面有若干子集,每個主題類型都賦予一個獨一無二的標(biāo)記。話輪的其余元語言標(biāo)記(問答日期、提問者、回答者等)均已標(biāo)注完成,話輪切分也已全部完成,其中中文文本共切分為22 344個話輪。
由于我國和英美國家的政治體制不同,在中文政治論辯挖掘領(lǐng)域沒有可以應(yīng)用的辯論文本,所以中文政治論辯挖掘研究尚沒有公開發(fā)表的研究成果。盡管外交部例行記者招待會上的問答實錄不能完全體現(xiàn)中文政治論辯的全部特征,但外交智慧就體現(xiàn)在一問一答之間,外交立場就建立在唇槍舌戰(zhàn)之中,政治態(tài)度就蘊含在每個話輪之中?;谶@樣的語料庫,我們可以設(shè)計獨具特色的中文政治論辯挖掘任務(wù),并開發(fā)相應(yīng)的任務(wù)數(shù)據(jù)集。
中文外交辭令中很少直接說“不”或者“是”,這就很難給論點貼上“支持”或者“反對”的標(biāo)簽,這對于論辯挖掘任務(wù)而言就是一大挑戰(zhàn)了。例如,圖1的話輪中抽取到的問話人“澳亞衛(wèi)視記者”的觀點是括號中的“在當(dāng)前世界經(jīng)濟(jì)放緩的背景下,中國不愿推出更多經(jīng)濟(jì)刺激措施,給美支持國際經(jīng)濟(jì)增長帶來更大壓力”,但中國外交部發(fā)言人,即說話者“趙立堅”的話語中并不能直接抽取出對上述觀點持“支持”或者“反對”的舉證,甚至感覺有些“答非所問”。實際上,“答非所問”就是一種外交辭令,因為無論外交部發(fā)言人直接回復(fù)“是的,中方不愿意”或者“不,中方已經(jīng)推出了相關(guān)舉措”,都會給別有用心的外媒留下口實或者引發(fā)下一個追問。實際上,澳亞衛(wèi)視記者的提問“中方對此有何回應(yīng)?”預(yù)設(shè)了“中國不愿推出更多經(jīng)濟(jì)刺激措施”和“美國支持國際經(jīng)濟(jì)增長”兩種觀點。此時,發(fā)言人既需反駁前一種觀點,又要駁斥后一種預(yù)設(shè)。所以,發(fā)言人在闡述了中國的負(fù)責(zé)任經(jīng)濟(jì)舉措之后,立即轉(zhuǎn)向“反觀美國”,對第二種預(yù)設(shè)予以充分且強有力的駁斥。
圖1 表示“主張”的論辯句標(biāo)注示例(中文)
鑒于不同語言在表達(dá)政治觀點時的語用方式不同,如中文表達(dá)相對委婉謹(jǐn)慎而英文表達(dá)相對直接大膽,雙語平行政治論辯語料將會有助于系統(tǒng)更好地理解原文,因此可以從跨語言論辯挖掘的角度提供新的中文政治論辯挖掘任務(wù)及數(shù)據(jù)集。Toledo-Ronen等人[13]已經(jīng)驗證了多語言論辯挖掘的可操作性,但缺乏真實的對應(yīng)的多語文本,他們只能使用機(jī)器翻譯生成其他五種語言的“準(zhǔn)平行文本”來進(jìn)行訓(xùn)練和測試。Eger等人[14]也是采用機(jī)器翻譯的方法來完成跨語言論辯挖掘任務(wù)的。Liu等人[15]利用漢英雙語平行語料庫實現(xiàn)了雙語對話推薦系統(tǒng),此方法可以借鑒到雙語論辯挖掘任務(wù)中來。Shimizu等人[16]則是實現(xiàn)了利用英語標(biāo)注來提高日語圖片問答系統(tǒng)性能的生成任務(wù),但該方法可否遷移到論辯挖掘任務(wù)中來還需要實驗驗證。無疑,“外交對話多語語料庫”中高質(zhì)量多語平行語料可以為跨語言對話式政治論辯挖掘任務(wù)提供數(shù)據(jù)支持。
論辯挖掘任務(wù)一般可以分為三種: 論辯對識別、論辯關(guān)系預(yù)測和論辯數(shù)據(jù)評估。為了方便順利開展這些論辯挖掘任務(wù),一般需要對論辯數(shù)據(jù)集進(jìn)行加工標(biāo)注,最基本的標(biāo)注內(nèi)容就包括主張和舉證。我們從“多語外交對話語料庫”中隨機(jī)選擇200篇中文及其對應(yīng)的200篇英語例行記者會實錄文本進(jìn)行論辯標(biāo)注,這400篇實錄文本包含1 536個話輪。
我們定義“主張”為主觀性、詢問式、結(jié)論性話語,定義“舉證”為客觀性、陳述式、解釋性話語。“舉證”話語是“主張”話語的證據(jù)和例示。圖1和圖2是我們的一些標(biāo)注示例: 圖1是“主張”的標(biāo)注示例,圖2是“舉證”的標(biāo)注實例,這兩個例子均出自同一個“話輪”——2022年9月22日外交部例行記者會話輪1(BiDAM-20220922-ZH/EN-T1-CE)。根據(jù)Visser等人[17]的論辯標(biāo)注體系(Annotating Argument Scheme),只要滿足有主語、有謂語就可以進(jìn)入論辯句標(biāo)注序列,間接引語和直接引語如果是句子,那就要納入到論辯句識別的范疇。當(dāng)援引某種說法時,這種說法本身一般是結(jié)論性的,應(yīng)該標(biāo)注為“主張”,但援引本身又是例證,所以整個援引句又是“舉證”。值得注意的是: 句號不能作為漢語句子的句界標(biāo)記,因為句號句并不是一個漢語句子。實際漢語文本中句號的使用常常帶有隨意性,因此句號句不具備當(dāng)作基本語法單位的資格[18]。宋柔[19]認(rèn)為漢語句子的句界不會出現(xiàn)在標(biāo)點句的句內(nèi),只能出現(xiàn)在兩個標(biāo)點句之間。這會給漢語句子完全句法分析帶來困擾,同樣也會給漢語論辯句句界檢測帶來挑戰(zhàn)。
圖2 表示“舉證”的論辯句標(biāo)注示例(中文)
這1 536個話輪由3位標(biāo)注者共同標(biāo)注完成,但每個話輪都由至少兩位標(biāo)注者進(jìn)行獨立手工標(biāo)注,標(biāo)注質(zhì)量評估指標(biāo)為內(nèi)部標(biāo)注一致性(Inner-Annotation Agreement, IAA),一般用卡帕檢驗(Kappa test)公式[20]進(jìn)行驗證。我們在句子層觀察到論辯句標(biāo)注一致性達(dá)到了85%,κ=0.63;在論辯構(gòu)件層觀察到的標(biāo)注一致性達(dá)到了67%,κ=0.51。這說明在政治文本中標(biāo)注論辯句時,有時候標(biāo)注者很難達(dá)到一致。在這個話輪中,一個爭論的焦點是英語文本中“The US, however, is another story.”該不該標(biāo)注為“主張”,兩位標(biāo)注者認(rèn)為不應(yīng)該標(biāo)注,一位標(biāo)注者認(rèn)為應(yīng)該標(biāo)注。經(jīng)過協(xié)商溝通最終達(dá)成一致——不標(biāo)注。因此,在這個話輪中總共標(biāo)注了7句表示“主張”的論辯句和9句表示“舉證”的論辯句,如表1所示。
表1 論辯句標(biāo)注示例話輪中的“主張”和“舉證”
我們標(biāo)注了每個話輪中各個論辯句之間的關(guān)系,發(fā)現(xiàn)在同一話輪之中,除了“主張”與“舉證”之間的“支持”“反對”與“無關(guān)聯(lián)”這三種關(guān)系外,提問部分和回答部分的“主張”和“舉證”之間還存在“蘊含”關(guān)系,如表1中的主張1和舉證1之間就是蘊含關(guān)系;回答部分的“主張”有時與提問部分的“主張”也存在“支持”或者“反對”的關(guān)系,如表1中回答部分的主張4及主張6就和提問部分的主張1之間構(gòu)成“反對”關(guān)系。同時,作為對提問問題的回應(yīng),回答部分的論辯句中的某些“主張”和/或“舉證”與提問部分作為問題的“主張”之間構(gòu)成“回應(yīng)”關(guān)系,如表1中的主張3~7都是對提問部分主張2的“回應(yīng)”。這樣,我們就得到了示例中各個“主張”句及其“支持”“反對”“蘊含”和“回應(yīng)”四種關(guān)系(“無關(guān)聯(lián)”關(guān)系不包括在內(nèi))的論辯關(guān)系表(表2)。
表2 示例話輪中 “主張”和“舉證”的關(guān)系
從表2可以看出,外交部發(fā)言人提出的第6條和第7條“主張”竟然獲得了與之劍拔弩張、針鋒相對的外媒提問者的第一條舉證的“支持”。也就是說,發(fā)言人既通過舉證(舉證2~3)駁斥了提問者對己方主張(主張3~4)的責(zé)難,又通過舉證(舉證 4~9)反駁了對方主張(主張1)中的謬誤,還通過己方的主張(主張6~7)獲得了對方舉證(舉證1)的支持,體現(xiàn)了高超的外交才能,展示了精妙的外交論辯口才。
在我們選擇的400篇外交部例行記者會實錄文本標(biāo)注中,共標(biāo)注了12 288個論辯句(5 376個“主張”論辯句和6 912個“舉證”論辯句)。Haddadan等人[3]指出在政治論辯文本中“主張”是多于“舉證”的,因為辯論者在論辯時有時不舉證。但我們的數(shù)據(jù)集并非嚴(yán)格意義上的論辯題材,更像是政治問答題材,所以“舉證”數(shù)目多于“主張”數(shù)目是可以理解的。我們將這些標(biāo)注好的語料提取出來作為中文政治論辯挖掘?qū)嶒灥臄?shù)據(jù)集,命名為“中英雙語外交論辯挖掘數(shù)據(jù)集(Chinese-English Bilingual Diplomatic Argumentation Mining dataset, BiDAM)”。表3是該數(shù)據(jù)集的一些統(tǒng)計數(shù)據(jù),如話輪平均長度和“主張”以及“舉證”的平均長度等。
表3 “中英雙語外交論辯挖掘數(shù)據(jù)集”統(tǒng)計信息
鑒于外交部例行記者會問答內(nèi)容大都涉及對國際國內(nèi)重大事件的態(tài)度和觀點,論辯信息挖掘和情感態(tài)度分析這兩類計算問題在這個領(lǐng)域就有了相輔相成的密切關(guān)聯(lián),因此我們對抽取出來的中英文論辯句均進(jìn)行了情感分析計算。中文情感分析器使用的是SnowNLP(9)https://github.com/isnowfy/snownlp,情感極性區(qū)間為[0,1],抽取語句情感極性均值為0.83,情感傾向整體以褒揚為主;英語情感分析器使用的是TextBlob(10)https://github.com/sloria/TextBlob,情感極性區(qū)間為[-1, 1],抽取語句情感極性均值為0.67,情感傾向整體以中性偏褒揚為主。歸一化處理之后,全部抽取出來的論辯句情感極性均值為0.75,整體情感傾向偏褒揚。這與我們的外交語篇分析結(jié)果一致,我國外交發(fā)言人傾向于展示積極、正向的態(tài)度,很少直接提出反對觀點或者對提問者的主張進(jìn)行直接抨擊,這也是我國外交話語區(qū)別于他國外國話語的一大特征。
接下來我們將利用BiDAM數(shù)據(jù)集進(jìn)行中文政治論辯挖掘任務(wù)[21-24]的實驗,以期驗證該數(shù)據(jù)集的可用性,同時探索跨語言論辯挖掘的有效性。此外,在論辯挖掘領(lǐng)域用以訓(xùn)練有監(jiān)督學(xué)習(xí)算法的標(biāo)注語料庫嚴(yán)重匱乏,我們尚有大量未經(jīng)標(biāo)注的語料,可以利用BiDAM來訓(xùn)練有監(jiān)督學(xué)習(xí)算法,為自動標(biāo)注論辯語料提供研究資源。我們在面向論辯挖掘任務(wù)的同時考慮到情感計算方向與其緊密聯(lián)系,因此在面向論辯挖掘的同時,數(shù)據(jù)集也可用作情感分類任務(wù)。