黃成龍,饒 敏,高 揚(yáng)
(1.中國社會(huì)科學(xué)院民族學(xué)與人類學(xué)研究所 北京 100081;2.重慶工商大學(xué)國際商學(xué)院 重慶 400067)
本文通過對(duì)2016年境外發(fā)表的藏緬語研究論著的分析,介紹海外藏緬語研究的學(xué)術(shù)前沿、研究取向和最新研究動(dòng)態(tài),以期進(jìn)一步推動(dòng)國內(nèi)藏緬語的研究。2016年境外藏緬語研究①在語言研究方法、語音、歷史比較、形態(tài)句法、詞匯語義、應(yīng)用語言學(xué)、自然語言處理等本體和應(yīng)用研究方面發(fā)表了一些帶有前沿性的研究論文。本文擬從以下幾個(gè)方面簡要介紹2016年藏緬語研究的前沿和最新動(dòng)態(tài)。
羅仁地(Randy J.LaPolla)在《論范疇化:遵循語言事實(shí)》一文中,強(qiáng)調(diào)在做語言描寫和語言比較時(shí),我們應(yīng)該重歸納,尊重自然語料呈現(xiàn)出的語言事實(shí),而不訴諸于抽象化,否則會(huì)導(dǎo)致在做語言和結(jié)構(gòu)歸類時(shí)忽略語言現(xiàn)有本質(zhì)[1]。
羅仁地在《再論語言學(xué)的方法和論證:將漢藏語系改成泛喜馬拉雅語系的論據(jù)問題》一文中談到,大家對(duì)漢藏語系譜系結(jié)構(gòu)這一公認(rèn)觀點(diǎn)進(jìn)行質(zhì)疑是很好的,因?yàn)槲覀冃枰粩嗟刭|(zhì)疑我們的最基礎(chǔ)假設(shè)。他在此文中研究將漢藏語系改成泛喜馬拉雅語系這一提法的論據(jù),指出這些論據(jù)因事實(shí)和論證的問題而說服力不足[2]。
蔡斯勒(Zeisler)在《語境!陌生語言調(diào)查中對(duì)發(fā)音人想法的揣摩》一文中,基于自己對(duì)拉達(dá)克(Ladakhi)語長期的田野調(diào)查,探討了一項(xiàng)田野調(diào)查的特殊方法“乒乓球游戲”技術(shù)。文章強(qiáng)調(diào)在田野調(diào)查中通過應(yīng)用“乒乓球游戲”,即通過首先收集每個(gè)發(fā)音人的真實(shí)自然語料,再由至少另外一個(gè)發(fā)音人對(duì)語料進(jìn)行核對(duì),最后由另外第三個(gè)、第四個(gè)發(fā)音人對(duì)所收集的第一個(gè)原發(fā)音人的語料進(jìn)行評(píng)估反饋的方式來激發(fā)發(fā)音人無意識(shí)的創(chuàng)造力。作者在文中重點(diǎn)以“體現(xiàn)輔音遷移現(xiàn)象的復(fù)合詞”、“動(dòng)詞語義”和“動(dòng)詞配價(jià)”等三個(gè)點(diǎn)的數(shù)據(jù)收集為例討論了“乒乓球游戲”技術(shù)的應(yīng)用[3]。
切利亞(Chelliah)在《方法論回應(yīng):論印度的語料收集和語言記錄》一文中,指出語言學(xué)家們對(duì)語料描寫和記錄的最佳方法長期爭論不休。目前的討論集中在“通過誘導(dǎo)式提問收集到的語料是否準(zhǔn)確有效”以及“是否需要采用誘導(dǎo)式提問的方法與自然語料分析相結(jié)合起來的方式來收集更加可靠的語料”。鑒于語料對(duì)語言學(xué)的發(fā)展至關(guān)重要,并且語言學(xué)研究對(duì)人類認(rèn)知及行為的研究也至關(guān)重要,為了獲取更加可靠的語料,我們需要使用更加正確的方法。作者基于自己對(duì)印度東北部的藏緬語族語言梅泰語(Meitei)進(jìn)行的田野調(diào)查和分析,指出在文本分析過程中調(diào)查者其實(shí)可以根據(jù)“微誘導(dǎo)式調(diào)查計(jì)劃(mini-elicitation schedules)”來進(jìn)行調(diào)查,這個(gè)調(diào)查表能夠提供語言結(jié)構(gòu)研究的明確線索,優(yōu)于基于語言普遍性而預(yù)先設(shè)定好的通用調(diào)查問卷[4]。
2016年藏緬語語音方面的描寫主要包括介紹聲調(diào)和調(diào)域的聲學(xué)分析、重音韻律、音調(diào)分配、變調(diào)、借詞音變等研究。
盧偉(Lew)和格魯伯(Gruber)在《Louma Oeshi話的聲調(diào)及調(diào)域的聲學(xué)分析》一文中,對(duì)老撾境內(nèi)研究極少的Akoid(阿卡支系)的Louma Oeshi話的聲調(diào)及調(diào)域進(jìn)行了聲學(xué)分析,指出Louma Oeshi話有高、中、低三個(gè)聲調(diào),加之調(diào)域有松緊之分,進(jìn)而造成六種超音段音位的對(duì)立[5]。
達(dá)斯(Das)和馬漢塔(Mahanta)在《博多語的焦點(diǎn)標(biāo)記和音域變化》一文中,描寫了博多語的重音韻律方面的特征。他們通過三個(gè)實(shí)驗(yàn)來調(diào)查當(dāng)博多語詞匯與強(qiáng)調(diào)助詞一起出現(xiàn)在不同的語境諸如寬焦點(diǎn)(wide focus)、對(duì)比焦點(diǎn)(contrastive focus)、糾正焦點(diǎn)(corrective focus)、窄焦點(diǎn)(narrow focus)時(shí)所表現(xiàn)出的音位特征。這些結(jié)果證明了博多語的音域變化具有離散性[6]。
多布斯(Dobbs)和 喇明清(Lǎ Mingqing)在《Lataddi Narua話的雙調(diào)值聲調(diào)系統(tǒng)》一文中,通過調(diào)查云南寧蒗縣、四川鹽源及附近鄉(xiāng)鎮(zhèn)的Narua話(納西語東部方言或者叫摩梭話),首次發(fā)現(xiàn)Narua話只有兩個(gè)聲調(diào),而其他的納西語通常都有三個(gè)聲調(diào)。文章還指出Narua話的聲調(diào)系統(tǒng)以平調(diào)為主,聲調(diào)與詞匯有關(guān),與音節(jié)關(guān)系不大[7]。
拉伊巴拉(Rajbala)在《曼尼普爾語借詞的音素替代》一文中,介紹了分布在印度曼尼普爾邦的曼尼普爾語(又名梅特語)的借詞音變。該文就一個(gè)音素對(duì)另外一個(gè)音素的代替、音節(jié)數(shù)量的增加、送氣的消失、音素的丟失和添加等現(xiàn)象進(jìn)行研究。作者在曼尼普爾語借詞的元音和輔音中均發(fā)現(xiàn)了音素替換的現(xiàn)象,并指出源自母語的影響是造成曼尼普爾語借詞中音素替換現(xiàn)象的原因之一[8]。
卡普婁(Caplow)在《巴爾蒂藏語的重音形式及其聲學(xué)相關(guān)性》一文中,對(duì)分布在巴基斯坦北部巴爾蒂斯坦地區(qū)的巴爾蒂藏語雙音節(jié)的重音進(jìn)行了分析。文章指出,在該語言中非動(dòng)詞雙音節(jié)(包括名詞、形容詞和數(shù)詞)重音均落在第二音節(jié)上,并且這種第二音節(jié)重音的模式與基頻值有緊密聯(lián)系。另外,元音長度會(huì)對(duì)其有微弱的影響,但與強(qiáng)度無關(guān)。但是動(dòng)詞卻恰恰相反,其重音落在第一個(gè)音節(jié)上,基頻值、聲音強(qiáng)度和元音音長均對(duì)音節(jié)重音有影響。這些發(fā)現(xiàn)與之前關(guān)于巴爾蒂語按詞類不同而進(jìn)行的重音描寫是不同的[9]。
馬呂斯(Marius)在《原始藏語動(dòng)詞系統(tǒng)的功能構(gòu)擬》一文中,根據(jù)普里克話(Purik)中驗(yàn)證到的最復(fù)雜的書面藏語及物動(dòng)詞詞形變化的四個(gè)詞干來構(gòu)擬原始藏語的動(dòng)詞系統(tǒng)。在他構(gòu)擬的原始藏語動(dòng)詞系統(tǒng)中,帶唇音的清輔音聲母(labial-prefixed voiceless onsets)強(qiáng)調(diào)一個(gè)事件的開始,帶鼻冠音的濁輔音聲母(nasal-prefixed voiced onsets)強(qiáng)調(diào)一個(gè)事件的結(jié)果,沒有前置輔音的聲母和送氣清輔音聲母則強(qiáng)調(diào)事件的中間過程。這個(gè)構(gòu)擬系統(tǒng)有助于我們辨識(shí)藏語諸多動(dòng)詞形態(tài)特征的原始功能[10]。
龔勛在《安多藏語韻母的音韻史》一文中提出了從古藏語韻母到現(xiàn)代的安多藏語方言韻母的語音演變構(gòu)擬,并按照相應(yīng)的時(shí)間順序提出了很中肯的音變建議,還追溯了個(gè)別特殊音變的年代。最有趣的是,他發(fā)現(xiàn)盡管安多藏語同他的祖先古藏語一樣沒有音素長度區(qū)別,但是其本文的研究表明安多藏語如同其他藏語方言一樣是從一個(gè)有音素長度區(qū)別的階段演變至今的[11]。
科尼特(Konnerth)在《原始藏緬語的名物化前綴*gV-》一文中,對(duì)馬提索夫(Matisoff)的相關(guān)構(gòu)擬進(jìn)行了改進(jìn)。馬提索夫(Matisoff 2003)在沃爾芬登(Wolfenden 1929)的構(gòu)想上構(gòu)擬了原始藏緬語的形容詞前綴*gV-??颇崽鼗?0種藏緬語的語法調(diào)查描寫,找到了證據(jù)來改進(jìn)Matisoff的構(gòu)擬。根據(jù)他的新證據(jù),*gV-被構(gòu)擬成了原始藏緬語的名物化前綴,其功能包括(并不只限于)形容詞前綴[12]。
卡普婁(Caplow)在《原始藏語的重音構(gòu)擬》一文中,描寫了不太為人所知的巴爾蒂話(Balti)和同仁話(Rebkong)的重音模式。這兩種話是位于藏語區(qū)邊緣地帶,從而保留了較多古藏語特征。作者在文中展示了雙音節(jié)詞的重音分配是由詞匯類型決定的,然后利用這個(gè)新發(fā)現(xiàn)重新構(gòu)擬了古藏語的重音模式[13]。
2016年藏緬語形態(tài)句法方面的研究論文研究深入,多數(shù)具有前沿性,主要以討論形態(tài)、句法為多。
Krishna Boro在《Za結(jié)構(gòu):博若語的類中動(dòng)結(jié)構(gòu)》一文中,基于柯默爾(Kemmer1993)的中動(dòng)結(jié)構(gòu)語義分析框架,調(diào)查了漢藏語系薩爾語群的博若語(Boro)的類中動(dòng)結(jié)構(gòu)(middle-like constructions),并對(duì)這些結(jié)構(gòu)進(jìn)行了詳細(xì)的分析。他提出博若語的這些類中動(dòng)結(jié)構(gòu)中的一個(gè)共有的語素za“變、發(fā)生”應(yīng)當(dāng)被分析成中動(dòng)標(biāo)志(middle marker),這個(gè)za在自發(fā)的事件結(jié)構(gòu)中是作為一個(gè)謂詞,在其他結(jié)構(gòu)中作為一個(gè)連動(dòng)動(dòng)詞[14]。
凱瑟琳·多諾霍(Cathryn Donohue)和馬克·多諾霍(Mark Donohue)在《布姆唐宗語的作格》一文中,通過調(diào)查不丹中部的布姆唐宗語(Bumthang)來分析其作格標(biāo)記,并描寫了布姆唐宗語作格標(biāo)記出現(xiàn)的條件。他們的研究指出,句法、語義、語用等多種因素決定著布姆唐宗語的作格標(biāo)記的使用。他們的分析對(duì)理解其他喜馬拉雅地區(qū)語言作格標(biāo)記的多用途也極具參考價(jià)值[15]。
賴云帆在《俄熱話及其他綽斯甲方言的使動(dòng)結(jié)構(gòu)》一文中,不僅描寫了俄熱話的使動(dòng)前綴、反使動(dòng)、分析型使動(dòng)結(jié)構(gòu)、易變動(dòng)詞,將俄熱話與其他嘉絨語以及漢藏語系其他語言間的比較分析[16]。
向柏霖(Jacques)等在《卡林語的自反模式》一文中,分析研究吉蘭提(Kiranti)語支卡林語(Khal?ing)中的自反/中動(dòng)后綴標(biāo)記(Reflexive/Middle suf?fix)-si,指出其主要功能是減少動(dòng)詞的配價(jià)論元。他們不僅描寫了卡林語自反詞形的復(fù)雜形態(tài)變化,還詳細(xì)描寫了-si后綴在卡林語中派生出的多種含義[17]。
拉奧蘇瓦(Lahaussois)在《圖龍語的自反派生》一文中,描寫了尼泊爾東部的圖龍語拉伊話(Thu?lung Rai)的兩個(gè)反身派生后綴-si和-s[18]。
葉莉涅米(Yliniemi)在《印度錫金族菩提亞登宗話中的提請(qǐng)注意式話語標(biāo)記=?o》一文中,討論印度錫金族菩提亞(Sikkimese Bhutias)登宗話(Denjongke)中的提請(qǐng)注意式話語標(biāo)記,其形式是=?o。這個(gè)標(biāo)記包括了焦點(diǎn)標(biāo)記的功能但并不僅限于此,它還表示驚異范疇(mirativity[19]。
2016年藏緬語研究中關(guān)于詞匯和語義的文章較往年多,共有11篇,集中在數(shù)詞、量詞、形容詞、副詞、指示詞、代詞等方面。
沙尼(Chanu)在《自美語的數(shù)詞》一文中,對(duì)印度東北部的一種瀕危語言自美語(Zeme)的數(shù)詞系統(tǒng)的詞法及句法進(jìn)行了描寫。Zeme語的數(shù)詞系統(tǒng)不僅展示了藏緬語數(shù)詞常見的十進(jìn)位類型(deci?mal type),同時(shí)也發(fā)現(xiàn)有二十進(jìn)位的類型(vigesi?mal type)。像其他的SOV語言一樣,Zeme語的數(shù)詞在語序上緊隨中心名詞之后,可分七大類:基數(shù)詞、序數(shù)詞、分?jǐn)?shù)、倍數(shù)、分配數(shù)詞、限定數(shù)詞、約數(shù)詞[20]。
梵天(Brahma)在《博多語、拉巴語、科克博洛克語的數(shù)量詞比較分析》一文中,對(duì)比分析了博多語(Bodo)、拉巴語(Rabha)、科克博洛克語(Kok Borok)的數(shù)量詞系統(tǒng)。這三種語言同屬一個(gè)語言分支并一起遷移到了印度的東北部,既有共性也富有差異。就數(shù)量詞而言,這三種語言各自呈現(xiàn)了自己獨(dú)有的結(jié)構(gòu)和功能[21]。
郝克普(Haokip)和瑪麗(Mary)在《塔多語的數(shù)詞系統(tǒng)》一文中,探討了漢藏語系藏緬語族庫基-欽語支中的塔多語(Thadou)的數(shù)詞系統(tǒng)特點(diǎn)。塔多語,像其他庫基-欽語支語言一樣,計(jì)數(shù)也遵循十進(jìn)制系統(tǒng)。1到10的數(shù)字都是一個(gè)詞匯項(xiàng)并且均為單語素詞,1到19的數(shù)字均是純粹的10進(jìn)制方式構(gòu)成的,20及以上的數(shù)字則是采用不同方式構(gòu)成的,如加法式、乘法式等等。該語言像其他SOV語言一樣,數(shù)詞可作形容詞,置于中心詞之前[22]。
德威(Devi)在《那木巴士語的形容詞》一文中,調(diào)查和描寫了印度唐庫爾語支的那木巴士語(Nambashi)形容詞的形成和種類。作者通過對(duì)那木巴士語形容詞的研究揭示出了其構(gòu)詞的多樣手段及其語言結(jié)構(gòu),同時(shí)也揭示了那木巴士語和其他藏緬語語言的關(guān)系[23]。
梵天(Brahma)在《博多語的副詞構(gòu)成過程》一文中,將博多語的副詞分為構(gòu)成副詞(forming ad?verb)和基本副詞兩類并詳細(xì)描寫了波多語是怎樣通過加前后綴、組合或重疊等手段來派生構(gòu)成副詞的[24]。
瓦靈(Walling)在《印度奧語的代詞、反身代詞和約束》一文中,對(duì)分布于印度那加蘭邦的藏緬語族語言-奧語(Ao)的反身代詞進(jìn)行了詳細(xì)的介紹,然后還對(duì)奧語的交互動(dòng)詞和強(qiáng)調(diào)反身代詞進(jìn)行了探討,并且根據(jù)喬姆斯基的約束理論簡要地就其約束可能性進(jìn)行了測(cè)試[25]。
辛格(Singh)在《梅特語的復(fù)雜謂詞結(jié)構(gòu)》一文中,就梅特語(Meiteilon)中復(fù)雜謂詞的結(jié)構(gòu)進(jìn)行了探討,并基于詞位或動(dòng)詞詞位的語義和句法功能的性質(zhì)將其分類。梅特語中的詞位或動(dòng)詞詞位可以被看作具有多功能性質(zhì)的詞匯項(xiàng),這樣的兩個(gè)詞匯項(xiàng)可以一起作為單個(gè)功能詞出現(xiàn)在短語中,具體來說,在兩個(gè)詞匯項(xiàng)共同出現(xiàn)時(shí),第一個(gè)詞匯項(xiàng)與第二個(gè)詞匯項(xiàng)具有不同的語義和句法功能[26]。
馬加爾(Magar)和 紐帕尼(Neupane)在《尼泊爾西部拉吉部落植物藥用的本土知識(shí)記錄》一文中,揭示拉吉(Raji)部落保持著很強(qiáng)的植物藥用的傳統(tǒng)并一直沿用于疾病治療。在哈吉人聚居且本土文化保持完整的地方,本土的植物藥用知識(shí)的力度和使用度都比其他地方高。這種力度和強(qiáng)度隨著住戶、人口的減少以及社會(huì)文化的侵蝕而相應(yīng)削弱[27]。
列普查(Lepcha)和 托尼(Torri)在《Dzongu地區(qū)的田野調(diào)查:沿著并超越Siiger的足跡》一文中,講述在印度錫金邦Dzongu地區(qū)進(jìn)行的田野調(diào)查。該文作為一個(gè)章節(jié)被收入《Halfdan Siiger的足跡》一書。Halfdan Siiger是一名宗教歷史學(xué)家,曾經(jīng)參加了丹麥的第三次中亞考查隊(duì),對(duì)巴基斯坦的卡拉沙語(Kalasha)、印度錫金邦的列普查語(Lepcha)和印度的博多語(Bodo)做過田野調(diào)查。這本書是一本論文集,講述了Siiger的調(diào)查生活和工作以及丹麥對(duì)中亞的研究[28]。
昂山(Aung Si)在《動(dòng)植物詞匯表對(duì)生物多樣性研究貢獻(xiàn)的潛在性:以緬甸的鳥類詞匯紀(jì)錄》一文中,以緬甸的鳥類詞匯紀(jì)錄為例來探究動(dòng)植物詞匯表對(duì)生物多樣性研究貢獻(xiàn)的潛在性。其調(diào)查結(jié)果表明一個(gè)基于語言記錄為目標(biāo)的對(duì)鳥類的調(diào)查能即快且又有成效地提供有價(jià)值的生物多樣性的信息[29]。
潘達(dá)(Panda)等人在《匯總和記錄中印邊界阿帕塔尼山谷運(yùn)用'Gonde Unio'草本提取黑鹽的傳統(tǒng)準(zhǔn)備方法》一文中,講述了作者在阿帕塔尼山谷(Apatani valley)進(jìn)行土著傳統(tǒng)知識(shí)記錄過程中,發(fā)現(xiàn)的不為外人所知的一種從草本提取黑鹽的傳統(tǒng)方法[30]。
希斯洛普(Hyslop)在《不丹中部的知識(shí)世界:以黑山門巴語的語言記錄為例》一文中,認(rèn)為過去對(duì)不丹國黑山門巴語奧勒喀(’Olekha)的調(diào)查研究很少,外界對(duì)該群體的語言、歷史及其社會(huì)文化基本上一無所知,而他們的語言文化現(xiàn)處在極度瀕危狀態(tài)。為了記錄該群體的知識(shí)體系,作者運(yùn)用語言學(xué)、民族志、動(dòng)植物學(xué)等跨學(xué)科方法記錄了奧勒喀人的語言、親屬稱謂、動(dòng)植物,進(jìn)而與鄰近親屬語言比較,區(qū)分哪些稱謂是當(dāng)?shù)毓逃械?,哪些稱謂是借用周遍族群的。文章最后指出伴隨著語言記錄的再次出現(xiàn),語言學(xué)與其他學(xué)科合作可發(fā)揮巨大貢獻(xiàn)[31]。
余德芬(Defen Yu)在《城市化和漢族移民對(duì)瀕危語言及其文化的沖擊》一文中,通過對(duì)云南昆明市官渡區(qū)矣六鄉(xiāng)子君村撒摩都彝族的個(gè)案研究,討論城市化及大量漢族移民涌入對(duì)當(dāng)?shù)厣贁?shù)民族語言及文化的沖擊[32]。
散德曼(Sandman)和 西蒙(Simon)在其論文《藏語作為安多語言聚合區(qū)的模式語言:來自撒拉語和五屯話的證據(jù)》中,指出他們發(fā)現(xiàn)某些藏語的形態(tài)句法特征轉(zhuǎn)移到了突厥語族的撒拉語(Salar)和漢語的五屯話(Wutun)這兩種毫無親屬關(guān)系且類型不同的語言里。這兩種語言同處于中國西部黃河流域上游的安多語言聚合區(qū)(Amdo Sprach?bund)。由于撒拉語和五屯話與該地區(qū)占文化優(yōu)勢(shì)地位的安多藏語有著長時(shí)期的語言接觸,此兩種語言有很多與安多藏語并行趨同的現(xiàn)象,因此,他們發(fā)展出了與安多藏語共享的一些特征[33]。
高恩(Gawne)和Ring在《語言記錄和描寫中的語言地圖制作》一文中,向讀者介紹了語言記錄過程中語言地圖的制作工作。文章以中印尼泊爾交界地區(qū)藏緬語分布為例,討論了在語言地理學(xué)和地理信息系統(tǒng)編制過程中,制作好的語言地圖的益處及其道德挑戰(zhàn)性。文章還介紹了當(dāng)下處理語言地圖數(shù)據(jù)有用的工具和經(jīng)驗(yàn),尤其是使用現(xiàn)場(chǎng)定位來識(shí)別語言區(qū)域/邊界。文中除了演示相對(duì)較為復(fù)雜的涉及Google Maps和TileMill的使用流程之外,還介紹了一種基于云的開源地圖平臺(tái)-CartoDB的基本流程[[34]。
黃成龍?jiān)凇吨袊亩嗾Z政策:以云南省為例》一文中,首先從“中華人民共和國憲法”和“中華人民共和國民族區(qū)域自治法”兩個(gè)法律層面介紹了像我國這樣一個(gè)多民族多語言的國家,對(duì)少數(shù)民族語言文字方面的主要國家方針政策。然后以少數(shù)民族聚集的云南省為例,介紹了我國是如何具體針對(duì)少數(shù)民族語言文字展開宣傳和推廣工作的,并且對(duì)云南省少數(shù)民族語言文字相關(guān)法令法規(guī)進(jìn)行了介紹[35]。
2016年在藏緬語的研究領(lǐng)域中,出現(xiàn)了一個(gè)新的研究熱點(diǎn),那就是自然語言處理(NLP)在藏緬語研究中的應(yīng)用。共有10篇文章涉及這一領(lǐng)域。
施密特(Schmidt)在《語料庫的實(shí)踐應(yīng)用:基于研究的語言學(xué)在藏語的掃盲教育上扮演的角色》一文中,闡述了語料庫語言學(xué)貫穿藏語母語和二語掃盲教育的方式,并基于他們自己語言學(xué)研究數(shù)據(jù),探討數(shù)據(jù)可讀性的問題,并以此構(gòu)建基于頻率數(shù)據(jù)的藏語掃盲教育的新教學(xué)法[36]。
龍從軍和李琳在《基于多策略的藏語語義角色標(biāo)注研究》一文中,指出語義角色標(biāo)注是自然語言處理領(lǐng)域有重大意義的研究之一,目前英語和漢語的語義角色標(biāo)注已經(jīng)取得了很多成就,但是在藏語的研究中由于缺乏帶有語義角色標(biāo)注的語料以及研究方法的滯后,語義角色標(biāo)注研究還一直停留在一個(gè)早期階段。藏語是一種句法標(biāo)記很豐富的語言,這些標(biāo)記自然地把一個(gè)句子分成了不同的語義塊,并指明了這些語義塊之間的關(guān)系。這篇文章探討了藏語的語義角色分類,并介紹了藏語語義角色標(biāo)記的多策略方法。作者所提出的藏語語義角色標(biāo)記的多策略實(shí)現(xiàn)了83.91%的準(zhǔn)確率,82.78%的召回率,且綜合評(píng)價(jià)指標(biāo)F值達(dá)到了85.71%。他們的研究方法不僅包含基于轉(zhuǎn)換的錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)和條件隨機(jī)場(chǎng),還引入了大量的語言學(xué)規(guī)則[37]。
江荻和李茂莉在《藏語動(dòng)詞的句法結(jié)構(gòu)和語義分類》一文中,根據(jù)動(dòng)詞的論元數(shù)目和必要的句法特性,提出了藏語動(dòng)詞的12類分法。這些藏語動(dòng)詞的句法及語義的分類可以直接應(yīng)用來創(chuàng)建一個(gè)藏語的語法信息詞典,從而構(gòu)建藏語自然語言處理的基礎(chǔ)資源[38]。
孟文和江荻在《藏語中帶后綴的復(fù)合形容詞的來源和特性》一文中,指出藏語中“名詞詞根+形容詞詞根+后綴”的形式有兩種分析方式:一種為“名詞詞根+(形容詞詞根+后綴)”的短語結(jié)構(gòu);另一種為“(名詞詞根+形容詞詞根)+后綴”的結(jié)構(gòu)形式。無論是語義還是其句法功能,二者都有很大的差別。本文采用生成詞匯理論對(duì)這兩個(gè)結(jié)構(gòu)進(jìn)行分析。作為短語結(jié)構(gòu),“形容詞詞根+后綴”是“名詞詞根“的修飾成分,但在語義上,“名詞詞根”似乎是“形容詞詞根+后綴”的屬性值,在某些方面突出了“形容詞詞根+后綴”的屬性,因此,這種語義條件產(chǎn)生了一種隱含的離心結(jié)構(gòu)[39]。
李琳、龍從軍、趙維納等人在《基于統(tǒng)計(jì)方法的藏語功能塊識(shí)別》一文中,指出功能塊不僅能展現(xiàn)句子的結(jié)構(gòu)、表明各功能塊之間的關(guān)系,還在理解句意上扮演了重要的角色。識(shí)別功能塊是自然語言處理的一個(gè)分支研究,能有效地提高句法分析的準(zhǔn)確度。該文提出藏語功能塊的分類,為功能塊識(shí)別打下了基礎(chǔ)。統(tǒng)計(jì)結(jié)果證實(shí)這個(gè)分類令人滿意,它不僅能夠全面地實(shí)現(xiàn)對(duì)句子結(jié)構(gòu)的描寫,而且其基于條件隨機(jī)場(chǎng)構(gòu)建的功能塊模型在測(cè)試中的綜合評(píng)價(jià)指標(biāo)F值能達(dá)到82.30%[[40]。
趙維納等在《藏語三音節(jié)動(dòng)詞結(jié)構(gòu)的識(shí)別》一文中,基于多策略構(gòu)建了藏語三音節(jié)動(dòng)詞結(jié)構(gòu)的識(shí)別模式。實(shí)驗(yàn)結(jié)果表明,多策略識(shí)別模式優(yōu)于其他策略,也證明了語言特征對(duì)計(jì)算機(jī)實(shí)現(xiàn)藏語三音節(jié)動(dòng)詞結(jié)構(gòu)的自動(dòng)識(shí)別有較大作用[41]。
劉匯丹等在《利用多樣化翻譯策略的漢語到藏語的機(jī)器翻譯系統(tǒng)》一文,提出了一個(gè)具有多樣化翻譯策略的漢語到藏語的機(jī)器翻譯系統(tǒng),并對(duì)核心語料庫和技術(shù)進(jìn)行了詳細(xì)解釋。作者通過實(shí)驗(yàn)表明,在翻譯過程中若子系統(tǒng)按照漢語語序而非藏語語序輸出每個(gè)短語的翻譯,將導(dǎo)致翻譯質(zhì)量不盡人意。因此,在漢語到藏語的機(jī)器翻譯系統(tǒng)中,調(diào)整語序模式是至關(guān)重要[42]。
馬龍龍、吳健在《應(yīng)用統(tǒng)計(jì)識(shí)別方法實(shí)現(xiàn)在線手寫藏文識(shí)別》一文中介紹了在線對(duì)手寫藏文進(jìn)行識(shí)別的系統(tǒng)。文章還介紹了如何運(yùn)用數(shù)學(xué)形態(tài)學(xué)中的膨脹、腐蝕和細(xì)線化來消除手寫軌跡噪聲的去噪方法[43]。
加羊吉等在《結(jié)合最大熵和條件隨機(jī)場(chǎng)來識(shí)別藏族人名的混合方法》一文中,指出藏族人名識(shí)別是藏文信息處理領(lǐng)域最艱巨的任務(wù)之一,并且識(shí)別效果會(huì)直接影響到藏文分詞的精度和相關(guān)應(yīng)用系統(tǒng)性能,包括藏漢機(jī)器翻譯、藏文信息檢索和文本分類等。根據(jù)藏族人名規(guī)則和特征的分析,該文提出了一種結(jié)合最大熵和條件隨機(jī)場(chǎng)來識(shí)別藏族人名的方法[44]。
赫爾特(Hildt)在《描寫藏語的句法:通過半自動(dòng)的工作流程實(shí)現(xiàn)從分詞到重寫規(guī)則》一文中,指出分詞(word segmentation)是藏語自然語言處理中的首要任務(wù),同時(shí)給我們介紹了一款基于詞匯資源的輕量級(jí)分詞工具。這個(gè)工具是用InDesign軟件來實(shí)現(xiàn)的,可以通過用戶的手動(dòng)修改來實(shí)現(xiàn)實(shí)時(shí)更新。該工具不僅可以讓專業(yè)人士獲取資源從而進(jìn)行藏語句法的研究,還可以額外生成可供發(fā)音人自己使用的教學(xué)材料[45]。
Rowinski和Keutzer在《Namsel:藏文文本的光學(xué)字體辨識(shí)》一文中探討了一個(gè)名為Namsel的新系統(tǒng)。它利用光學(xué)字體識(shí)別(OCR)來支持藏文文本的大規(guī)模輸出、檢查和可查找概率(distribution of searchable)。 Namsel解決了諸如Tibean uchen字體等復(fù)雜腳本的一系列問題,并且能夠在廣泛的機(jī)器印刷作品上實(shí)現(xiàn)較高的精度。文章討論了藏文光學(xué)字體辨識(shí)的很多細(xì)節(jié)問題、Namsel的工作原理以及能夠解決的問題,還討論了Namsel與伙伴圖書館之間的合作工作,旨在建立一個(gè)由一千多萬頁歷史和現(xiàn)代藏文作品構(gòu)成的綜合性數(shù)據(jù)庫[46]。
第9屆印度東北語言學(xué)會(huì)研討會(huì)(NEILS 9)于2016年2月5-7日在印度阿薩姆邦阿薩姆大學(xué)舉行,吸引了印度國內(nèi)及國外眾多的學(xué)者,大會(huì)報(bào)告內(nèi)容覆蓋了關(guān)于藏緬語族、印度-雅利安語支、泰語和東北部的南亞語系語言等諸多題目。
第26屆東南亞語言學(xué)會(huì)年會(huì)(SEALS 26)于2016年5月26-28日在菲律賓迪里曼大學(xué)舉行。會(huì)議所討論的語言涵蓋漢藏語系(漢語、藏緬語族、侗臺(tái)語族、苗瑤語族)、南亞語系(孟高棉語族、越芒語族)、南島語系(臺(tái)灣南島語、菲律賓一些南島語)。會(huì)議論文中涉及藏緬語的較少,僅有2篇討論藏緬語人稱范疇和一篇討論彝語聲調(diào)問題。
第22屆喜馬拉雅語言研討會(huì)(HLS 22)于2016年6月8-10日在印度瓜哈提(Guwahati)理工學(xué)院召開,會(huì)議主要議題包括喜馬拉雅地區(qū)語言的語音與音系、認(rèn)知語言學(xué)、句法、語義、形態(tài)、語言科技開發(fā)、自然語言處理、書寫系統(tǒng)與排印、語言與政策、喜馬拉雅地區(qū)的移民類型、語言研究史、言語技術(shù)、第二語言習(xí)得等。
第4屆中國西南地區(qū)漢藏語工作坊(Fourth Workshop on Sino-Tibetan Languages of Southwest China)于2016年9月8-10日在美國西雅圖的華盛頓大學(xué)召開,多位國內(nèi)外知名語言學(xué)家參加了這次研討會(huì)。會(huì)議共持續(xù)三天時(shí)間,總共有29篇報(bào)告發(fā)言,其中中國學(xué)者共計(jì)16人。大會(huì)報(bào)告涉及均為中國西南地區(qū)的漢藏語言,其中包括多個(gè)藏緬語族語言,如,拉祜語、彝語、羌語、爾龔語、木雅語、綽斯甲嘉戎語、貴瓊語及多個(gè)嘉絨語組的語言。
第49屆漢藏語言暨語言學(xué)國際會(huì)議(ICSTLL 49)于2016年11月11-13日在廣州暨南大學(xué)召開。來自中國、美國、日本、法國、澳大利亞等世界20余個(gè)國家和地區(qū)共160余位學(xué)者參加了會(huì)議,話題涉及漢藏語言的歷時(shí)比較、共時(shí)描寫、古文字、古文獻(xiàn)、實(shí)驗(yàn)語音學(xué)、語言生態(tài)、語言翻譯及應(yīng)用等領(lǐng)域。
從前面介紹的2016年境外發(fā)表的藏緬語研究的最新動(dòng)態(tài)和前沿問題研究來看,藏緬語研究在保持傳統(tǒng)研究特色的基礎(chǔ)上,開創(chuàng)了一些新的、前沿的研究領(lǐng)域,主要特點(diǎn)表現(xiàn)在:
其一,調(diào)查研究的視角和方法論問題越來越被重視。有的學(xué)者倡導(dǎo)語言研究注重語言事實(shí)的歸納方法,不太提倡抽象研究方法,認(rèn)為這樣會(huì)忽視語言現(xiàn)象的本質(zhì)。漢藏語的比較(尤其是藏緬語的比較)頗受爭議,在進(jìn)行語言譜系結(jié)構(gòu)分類時(shí),有說服力的方法論和證據(jù)至關(guān)重要。在調(diào)查研究陌生語言時(shí)采用何種方法和手段,使研究者能及時(shí)了解發(fā)音人所要表達(dá)的信息;如何更好地把誘導(dǎo)式調(diào)查資料和自然語料有機(jī)結(jié)合,促進(jìn)語言學(xué)和人類行為的研究等在本年度的研究中都有所提及。
其二,語音實(shí)驗(yàn)分析越來越活躍。過去對(duì)語音的分析研究主要以描寫為主,語音的實(shí)驗(yàn)分析較少。從去年發(fā)表的語音的論文來看,語音實(shí)驗(yàn)研究及其顯著,尤其聲調(diào)、重音、焦點(diǎn)韻律是實(shí)驗(yàn)研究的熱點(diǎn)。
其三,自然語言處理逐步得到加強(qiáng)。藏緬語的自然語言處理研究始終較為薄弱,近些年這方面的研究有一定的發(fā)展,尤其是藏語的自然語言處理有較大突破。在《喜馬拉雅語言學(xué)》雜志上刊載10篇藏語自然語言處理方面的研究成果,一方面向西方介紹了中國在這方面的研究成果,另一方面促進(jìn)了東西方的合作與交流。
其四,通過語言研究本土知識(shí)系統(tǒng)。過去藏緬語研究只注重語言結(jié)構(gòu)的描寫和分析,對(duì)語言所承載的知識(shí)體系關(guān)注較少。這幾年西方學(xué)者在調(diào)查研究語言的同時(shí),也開始通過語言去了解當(dāng)?shù)氐膬x式、生態(tài)、親屬制度等,于是在2016年的研究文獻(xiàn)中我們看到了關(guān)注動(dòng)植物命名系統(tǒng)和當(dāng)?shù)厝酥R(shí)系統(tǒng)的研究,這些研究起到了更好地保存和發(fā)揚(yáng)當(dāng)?shù)貍鹘y(tǒng)文化的作用。
其五,學(xué)術(shù)活動(dòng)越來越受重視,青年學(xué)者嶄露頭角。國際漢藏語言暨語言學(xué)會(huì)議(ICSTLL)、東南亞語言學(xué)會(huì)(SEALS)、喜馬拉雅語言研討會(huì)(SHL)、印度東北部語言學(xué)會(huì)(NEILS)、中國西南藏緬語工作坊(WSTLSC)是先后成立的研究藏緬語和區(qū)域語言重要的協(xié)會(huì)和會(huì)議。除了中國西南藏緬語工作坊每三年召開一屆外,其他四個(gè)每年都舉辦年會(huì)。這五個(gè)會(huì)是藏緬語學(xué)界或者藏緬語學(xué)者與其他學(xué)者進(jìn)行學(xué)術(shù)交流、共享最新學(xué)術(shù)研究成果的重要平臺(tái),每年都有一些年輕學(xué)者和博士生嶄露頭角,為藏緬語研究薪火相傳奠定基礎(chǔ)。
[注 釋]
①本文中“境外藏緬語研究”是指中國境內(nèi)外學(xué)者在國外發(fā)表的藏緬語研究成果,特此說明。此文在三位作者相互協(xié)作的基礎(chǔ)上完成的,龍從軍博士惠賜寶貴意見,在此深表感謝。文中錯(cuò)漏之處,概由作者自負(fù)。