劉群
(襄樊學院 文學院,湖北 襄陽 441053)
基于有限狀態(tài)轉移網絡的詞語重疊形式生成和識別
劉群
(襄樊學院 文學院,湖北 襄陽 441053)
有限狀態(tài)轉移網絡是語言形式化表達手段之一。通過對詞語重疊音節(jié)數目的限制、語義內涵的限制、典型形式的限制,確定有限狀態(tài)轉移網絡可接受的詞語重疊的范圍,運用有限狀態(tài)轉移網絡再現了漢語詞語重疊的生成過程和生成模式,以此說明靜態(tài)的語法規(guī)則或語法結果是可計算的。
漢語;語言形式化;有限狀態(tài)轉移網絡;詞語重疊
詞語重疊是漢語普遍的語言現象。漢語是缺少形態(tài)變化的語言,這也就使得詞語重疊究竟是不是形態(tài)變化的爭議成為可能。有人將詞語重疊界定為漢語重要的語法手段,并且是可以直接感知的顯性語法手段。也有人將之歸為構形法的一類。構詞法和構形法是詞的結構分析中兩種既互相對立又互為補充的方法。由兩個或兩個以上語素組合成新詞的規(guī)則即是構詞法。這樣的結論幾乎是蓋棺定論的。但是,漢語究竟有沒有構形法?《馬氏文通》、《新著國語文法》、《中國文法要略》等漢語語法著作,都不承認漢語有構形法。《漢語語法論》則認為漢語有構形法。作者后來還根據詞和形態(tài)標記的依存關系將形態(tài)區(qū)分為內部形態(tài)和外部形態(tài)。重疊則是構形法的內部形態(tài)。當然,形態(tài)是否有內部和外部之分?這是語言學理論尚待解決的問題,我們且不必深入探討。但是,漢語的確有一些詞語具備明顯的形態(tài)變化的特點。形態(tài)變化的結果不是產生新詞,而是呈現一個詞的不同的語法形式,并由此附加上一定的語法意義?!罢Z法手段之說”、“構形法之說”,實際上都殊途同歸地承認重疊是詞語的形式方面的變化。
有限狀態(tài)轉移網絡是語言形式化表達手段之一。我們可以借助這樣的方式對漢語詞語重疊現象加以類似于自然科學的描述和解釋。
從詞類角度看,名詞、量詞、動詞、形容詞的可重疊性已是公認的事實。鑒于有限狀態(tài)轉移網絡的“有限性”,有必要細化有限狀態(tài)轉移網絡可接受的漢語詞語重疊的范圍。
(一)重疊的音節(jié)數目限制
形態(tài)手段的使用常常受詞語音節(jié)數目多少的影響。[1]如英語形容詞的級。單音節(jié)形容詞級的變化以形態(tài)手段體現,即單音節(jié)形容詞后直接加后綴er和est表示比較級和最高級,如short—shorter—shortest。多音節(jié)形容詞級的變化以詞匯手段體現,即多音節(jié)形容詞前直接加單詞more和most表示比較級和最高級,如interesting—more interesting—most interesting。同樣,漢語的重疊也受音節(jié)數目的影響和限制。
1.名詞和量詞重疊只限于單音節(jié),雙音節(jié)的或多音節(jié)的則不可重疊。
月——月月 年——年年 個——個個 條——條條
窗戶——窗戶窗戶 窗戶——窗窗戶戶
2.形容詞和動詞重疊可以是單音節(jié)的,也可以是雙音節(jié)的。
動詞重疊:摸——摸摸 想——想想 打掃——打掃打掃 晃悠——晃晃悠悠
形容詞重疊:高——高高 小——小小 簡單——簡簡單單 筆直——筆直筆直
漢語詞語重疊最多的音節(jié)數目是4個,那么重疊的基本音節(jié)數只能是1個或2個,形式上可以用A代表一個音節(jié),A、B代表2個不同的音節(jié)。
(二)重疊的語義內涵限制
語義內涵一般有語法層面的、詞匯層面的、篇章層面的。詞語重疊的語義是指向語法層面的。不同語言詞語重疊的語法意義是不一樣的。馬來語名詞重疊表復數,俄語動詞重疊表未完成體,印地語形容詞重疊表程度高。就漢語而言,通過重復整個詞(A或者AB)或詞的一部分(A或者B)的方式獲取的是某種抽象的、概括的、附加的語法意義,即以結構形式變異獲義。那么,這里就有兩個限制性的條件:重疊即詞語外在形式的變化是獲取新義的前提,通過形式變化獲取的新義是一般性的一類意義。如此一來,至少可以排除兩類重疊并非本文討論的重疊。
一是疊音式的單純詞,如猩猩、姥姥、亭亭、翩翩;二是重疊式的合成詞,如星星、寶寶、哥哥、剛剛、僅僅、常常。兩者都是兩個相同的字組合成詞的方式。所不同的是,疊音式單純詞的兩個音節(jié)表示一個語素,單個音節(jié)沒有語義值,即AA式沒有原形A,不存在A(原形)→AA。所以,AA式就不能以結構形式的變異獲取抽象的語法意義,其意義只能是詞匯層面的詞匯意義。
重疊式合成詞的單個音節(jié)有語義值,兩個音節(jié)是兩個語素,即AA式有原形A,存在A(原形)→AA。這一類詞的語義形式比較復雜。以“哥—哥哥”為代表的親屬稱呼,以“寶—寶寶”為代表的親昵愛稱和以“星—星星”為代表的一般指物名詞,其A式和AA式的語義差異并不明顯。也有人認為A式是口語語體,AA式是書面語語體。筆者認為這樣的分別很牽強。
例1:——這是誰呀?——這是我哥。
例2:——這是誰呀?——這是我哥哥。
例1、例2的語義完全相同。生硬地分出口語語體和書面語語體反而不合適。
以“剛剛”為代表的副詞,其A式和AA式是兩個不同的詞。有時,A義=AA義;有時,A義≠AA義。如“常、常?!倍急硎拘袨?、動作的次數頻繁。
例3:他常遲到=他常常遲到。
但是,否定式多用“不?!?,少用“不常常”。[2]
例4:他不常來了。
例5:他不常常來了。
和疊音式單純詞重疊式合成詞不同的是,名詞、量詞、動詞、形容詞是以結構變異獲義,獲取的是一類抽象的語法意義。
1.名詞、量詞重疊的語法意義。
名詞、量詞重疊后表“每一”。如天天=每一天、朵朵=每一朵。石毓智稱之為周遍性表達。[1]79徐通鏘指出,周遍性的事物被認為是有定的。所以,周遍性一般由兩個義項組成:既定的范圍和每一個成員。
2.動詞重疊的語法意義。
(1)動詞重疊后呈現的是動作行為發(fā)生或進行的方式,相當于印歐語系的語法范疇“體”。具體而言,主要是試行體、短時體、完成體。[3]
看(原形)——看看(短時體)——看一看(短時體)——看了看(完成體)——看了一看(完成體)
研究(原形)——研究研究(試行體)
(2)動詞重疊后表示動作的隨意性、反復性或延續(xù)性。
說笑——說說笑笑(隨意性) 來往——來來往往(反復性) 踉蹌——踉踉蹌蹌(延續(xù)性)
3.形容詞重疊的語法意義。
(1)形容詞重疊后表事物程度的加深或減弱。
干凈——干干凈凈(程度的加深) 大——大大(程度的加深或減弱)
筆直——筆直筆直(程度的加深)
(2)形容詞重疊后表貶義,主要用于口語。
糊涂——糊里糊涂 古怪——古里古怪
(三)重疊的典型型和非典型型
從典型范疇(prototype—based category)的角度出發(fā),以重疊的外在形式作為參照標準,重疊有典型和非典型之分。典型的重疊模式是A、B或AB自身重疊,如AA、ABB、ABAB。非典型的重疊模式是A、B或AB的重疊需借助其他形式,這里的其他形式一般是指某一個具體的漢字。所以非典型重疊也可稱作嵌字式重疊,如A了A、A里AB。需要說明的是,被嵌的漢字沒有實在的語義值,或者表示空靈的語法義,如“了”“著”;或者語義值為零,如“里”。以此為準,名詞、量詞、動詞、形容詞的典型重疊形式和非典型重疊形式可以總結為:
表1 典型重疊和非典型重疊
狀態(tài)轉移網絡的其字符串或符號串是字母表上的字符組成的長度有限的序列。[4]嚴格地講,字母表的符號應該是作用性質相同的記號單位。如0—9是數字符號,A—Z是大寫字母符號。顯然{A、B、AB、了、一、著、里}不是一類符號,更不能構成字母表∑。所以,經過取舍,狀態(tài)轉移網絡只能描述典型的重疊形式。
那么,同時符合以上3個條件的重疊形式就是有限狀態(tài)轉移網絡可接受的形式,即有限狀態(tài)轉移網絡描述對象={單音節(jié)A或雙音節(jié)AB}∩{結構形式變異獲義}∩{典型重疊}=AA、ABAB、AABB、ABB、AAB。
有限狀態(tài)轉移網絡(FSTN,Finite State Transition Network)是一個有向圖。所以,有限狀態(tài)轉移網絡也叫圖計算。完整的有限狀態(tài)轉移網絡由結點、單圈、雙圈、有方向的弧線、轉移條件(有條件或無條件)的標記構成。其中,結點代表轉移狀態(tài),單圈代表非終止狀態(tài),雙圈代表終止狀態(tài),有方向的弧線是不同狀態(tài)的連接線,弧線上的字符即轉移條件的標記。若是無條件轉移,則統(tǒng)一標注為ε(空字符)。
q0是起始狀態(tài),q1是中間狀態(tài),q2是終止狀態(tài)。狀態(tài)轉移過程是:狀態(tài)q0到狀態(tài)q1的條件是當前字符為A,狀態(tài)q1到狀態(tài)q1的條件是當前字符為A,狀態(tài)q1到狀態(tài)q2的條件是當前字符為B,狀態(tài)q2到狀態(tài)q2的條件是當前字符為B,狀態(tài)q2到狀態(tài)q1的條件是當前字符為空。需要注意的是:狀態(tài)q0到狀態(tài)q1是空集,即不存在形式A;狀態(tài)q2到狀態(tài)q1是空計算,即從狀態(tài)q2到狀態(tài)q1是無條件的。
按照以上有限狀態(tài)轉移網絡的運行規(guī)律和運行過程,漢語詞語重疊形式的生成過程可以表示如下:
表2 有限狀態(tài)轉移網絡識別重疊形式的過程
表3 重疊式的狀態(tài)轉移表
表2所示有限狀態(tài)轉移網絡也可用狀態(tài)轉移表(state transition table)的形式表示。
有限狀態(tài)轉移網絡好比有限狀態(tài)自動機,動態(tài)地計算出語言成分的生成過程和生成模式,和靜態(tài)描寫、闡釋語法成分的分析方法相互補充,既印證了語法實體存活的可能性,也說明語法規(guī)則或語法結果是可計算的(computable)。但是,對語言的形式化處理也就意味著簡單化,畢竟自然語言的意義和形式不是絕對的一一對應關系,因此,形式的手段和它所要替代的自然語言之間有時很難達成一致。比如嵌字式重疊,所嵌字的字形、意義、位置缺少應有的穩(wěn)固性,導致有限狀態(tài)轉移網絡無法識別其生成過程。當然,這也為我們的研究提出了新的課題。
[1] 石毓智.語法化的動因和機制[M].北京:北京大學出版社,2005:109.
[2] 呂叔湘.現代漢語八百詞[M].北京:商務印書館,1984:92.
[3] 張 靜.語言語用語法[M].河南:文心出版社,1994:1078.
[4] 俞士汶.計算語言學概論[M].北京:商務印書館,2007:27.
Generation and Recognition of Word Repetition Based on FSTN
LIU Qun
(College of Chinese Language and Literature,Xiangfan University,Xiangyang 441053,China)
Finite State Transition Network(FSTN)is one of the methods on language expression in forms.It indicates that the static rules or results of the grammar are countable according to the limitation of the repetition syllable’s numbers,the connotation of the meanings,the typical forms,and to make sure the acceptable scope of the repetition of the words in the Finite State Transition Network,and representation the process and the model of the generation of the repetition of Chinese words through the Finite State Transition Network.
Chinese;Language formalization;Finite State Transition Network(FSTN);Word repetition
H109.4
A
1009-2854(2011)10-0071-04
2011-09-18
劉 群(1972—),女,湖北襄陽人,襄樊學院文學院副教授,主要研究方向:現代漢語,對外漢語教學。
(責任編輯:倪向陽)