于東等
摘 要:復(fù)雜術(shù)語通常作為整體使用,具有詞的特征,其中包含的其他術(shù)語或通用詞的詞匯地位下降為語素,即語素化。在該視角下,具體學(xué)科的復(fù)雜術(shù)語構(gòu)詞可描述為三層模型:首先學(xué)科基本概念由學(xué)科基元語素表征,然后由學(xué)科基元語素擴(kuò)展構(gòu)成固有語素組,最終由固有語素組擴(kuò)展構(gòu)成復(fù)雜術(shù)語。統(tǒng)計顯示,在通信學(xué)科中超過80%的術(shù)語均包含學(xué)科基元語素,幾乎所有術(shù)語均包含固有語素組。
關(guān)鍵詞:復(fù)雜科技術(shù)語,語素化,學(xué)科基元語素,固有語素組
中圖分類號:H083;N04 文獻(xiàn)標(biāo)識碼:A 文章編號:1673-8578(2015)02-0015-06
Morphemization in Complex Terms Constitution
YU Dong RAO Gaoqi TANG Gongbo XUN Endong
Abstract: In Chinese, complex terms are usually used as one word, so other terms or general words that constitute the term can be seen as morphemes, so called morphemization. Under this view, complex term formation can be described as a three layer model: firstly, basic concepts of a subject can be described by a number of domain element morphemes; then, inherent morpheme groups are extended based on domain element morphemes; finally, complex terms are formed by using inherent morpheme groups. Statistics show that more than 80% terms in communication science contain domain element morphemes and almost all terms contain inherent morpheme groups.
Keywords: complex term, morphemization, domain element morpheme, inherent morpheme group
收稿日期:2014-12-11
基金項目:國家自然科學(xué)基金項目(61300081,61170162);國家科技支撐項目(2012BAH16F00);北京語言大學(xué)中央高?;究蒲袠I(yè)務(wù)專項資金(15YJ030006)
作者簡介:于東(1982—) ,男,山東日照人,博士,講師,研究方向為計算語言學(xué)。通信方式:yudong_blcu@126.com。
引 言
隨著科技不斷發(fā)展,新概念不斷涌現(xiàn),作為概念載體的科技術(shù)語的數(shù)量飛速增長。在中文中,由于無法為每個概念創(chuàng)造全新的詞語,由多個“單詞”復(fù)合構(gòu)成的復(fù)雜術(shù)語成為概念表示的主要形式。研究復(fù)雜術(shù)語的構(gòu)詞結(jié)構(gòu),不僅可以發(fā)展對中文術(shù)語的認(rèn)識,在實踐上還能夠為概念相似度計算、新術(shù)語發(fā)現(xiàn)、語義分析、機(jī)器翻譯和信息檢索等提供理論支撐。
在《現(xiàn)代術(shù)語學(xué)引論》[1]中,將“采用原有單詞構(gòu)成詞組表示新的概念(的術(shù)語)”定義為“詞組型術(shù)語”,比如“碼分多址”“赫夫曼編碼”“高斯最小頻移鍵控”等。與詞組型術(shù)語相對應(yīng)的則是“單詞型術(shù)語”,例如“比特”。而實際上,術(shù)語無論內(nèi)部結(jié)構(gòu)復(fù)雜或者簡單,其所指必然只有一個概念,從語法功能和語義的角度上看都是一個整體。
在構(gòu)詞理論中,造詞材料一旦組合成詞,根據(jù)同類性原則彼此均要以“語素”的身份出現(xiàn)[2-3]。從這個角度而言,“詞組型術(shù)語”并非真正詞組或短語,詞組型術(shù)語定義中“采用原有單詞”所指的單詞,在復(fù)雜術(shù)語中應(yīng)不再具有詞匯屬性,而成為構(gòu)詞的語素。而且,“單詞型術(shù)語”本身經(jīng)常用作“詞組型術(shù)語”的組成部分。其自身又分為兩類:可以單獨做術(shù)語和不能單獨做術(shù)語。這與合成詞中語素的表現(xiàn)十分相似。另一方面,構(gòu)成術(shù)語的諸多“單元”(不僅僅是單詞)與其獨立使用時有所不同,出現(xiàn)了“語素化”的現(xiàn)象。原有單詞在術(shù)語中常出現(xiàn)語義壓縮、形態(tài)縮略、詞性變換等。將復(fù)雜術(shù)語看成為若干詞的組合,不如看成是若干語素或語素組的組合。因此,從語素角度分析術(shù)語構(gòu)詞特征,更符合實際情況和語言理論。本文將具有內(nèi)部結(jié)構(gòu)的術(shù)語視為整體,姑且稱為復(fù)雜術(shù)語。在該視角下,我們從語素構(gòu)詞角度研究復(fù)雜術(shù)語中語素形態(tài)和構(gòu)詞特征。
此外,對于一個學(xué)科而言,學(xué)科中的術(shù)語和它本身表征的概念系統(tǒng)具有等價關(guān)系。概念系統(tǒng)的復(fù)雜性將體現(xiàn)在術(shù)語構(gòu)詞中,具體表現(xiàn)為構(gòu)成復(fù)雜術(shù)語的語素之間存在內(nèi)在聯(lián)系和規(guī)律。以通信科學(xué)為例,選擇全國科學(xué)技術(shù)名詞審定委員會發(fā)布的《通信科學(xué)技術(shù)名詞》(2008版)[4]作為研究對象,并對其中的2107條術(shù)語進(jìn)行了包括語素切分、語素類型在內(nèi)的標(biāo)注。通過分析這些復(fù)雜術(shù)語的語素類型和來源,并對其進(jìn)入術(shù)語形成語素過程中的語素化現(xiàn)象進(jìn)行分析和討論,我們發(fā)現(xiàn)特定學(xué)科術(shù)語紛繁復(fù)雜、數(shù)量巨大的背后是少數(shù)基元概念組合構(gòu)成概念組,由概念組再組成術(shù)語概念的過程。具體到物質(zhì)層面就是學(xué)科基元語素組成語素組,由語素組組合構(gòu)成大量復(fù)雜術(shù)語。
一 科技術(shù)語構(gòu)詞的語素化機(jī)制
邱艷萍在《概念整合在語素化構(gòu)詞中的作用》中指出[5],語素化主要分為兩類:音節(jié)語素化和詞的語素化。前者指本來不表義的音節(jié)變成了表義的語素;后者則指漢語中已經(jīng)存在的詞,它們的詞匯地位發(fā)生變化,由詞下調(diào)為一個構(gòu)詞語素,以便派生新詞。本文的研究主要集中在后一種,即詞的語素化方面。endprint
對于復(fù)雜術(shù)語中,語素化現(xiàn)象又可以進(jìn)一步分為兩種:第一種,是直接將詞語作為新詞的一部分使用。這樣的例子如“比特滑動”“插入損耗”“接入?yún)f(xié)議”等,這種現(xiàn)象在我們標(biāo)注的術(shù)語中占較大比例。第二種,是將詞語進(jìn)行若干形式變換和處理后,形成構(gòu)成新術(shù)語的語素。這主要表現(xiàn)在語義和形態(tài)兩方面。在本文研究對象中,語義方面的語素化主要表現(xiàn)為語義范圍的縮小與轉(zhuǎn)化,如:
(1)瀏覽器——萬維網(wǎng)(Web)服務(wù)的客戶端瀏覽程序。可向萬維網(wǎng)服務(wù)器發(fā)送各種請求,并對從服務(wù)器發(fā)來的超文本信息和各種多媒體數(shù)據(jù)格式進(jìn)行解釋、顯示和播放。(語義縮?。?/p>
(2)游牧性——用戶或終端慢速移動,或無需跨區(qū)切換的特性。(語義轉(zhuǎn)化)
其中,(1)內(nèi)語素“瀏覽”的語義縮小為了“瀏覽網(wǎng)頁”,(2)“游牧”則完全脫離了其本義。
在形態(tài)上的表現(xiàn)有位移(相對于定義中的表達(dá)順序)和縮略,如:
(3)比特劫取——泛指借用分配給某些信息傳輸用的比特來傳送另外功能的操作。(位移)
(4)跳頻——無線傳輸中,射頻頻率按照某種特定算法發(fā)生的重復(fù)變化……(縮略與位移)
其中,(3)的原始定義中的實際動作是“截取”,“比特”是動作的受事,通常應(yīng)出現(xiàn)在動作的后面。但語素化過程中“比特”出現(xiàn)了位移。(4)中“跳”所指稱的動作是“跳轉(zhuǎn)”,“頻”指稱“頻率”, 是“跳轉(zhuǎn)”的主語。它在語素化中發(fā)生了縮略,且同時發(fā)生了位移。
另一方面,術(shù)語和它本身表征的概念都具有系統(tǒng)性,這樣的系統(tǒng)性同樣反映在術(shù)語構(gòu)詞的語素集合中??梢哉J(rèn)為語素在術(shù)語內(nèi)和術(shù)語間也具有語義上的聯(lián)系。具體來說,科技術(shù)語是具體概念的表征,對于一個特定概念而言,根據(jù)概念層級不同,一般存在上位概念、下位概念,實際上是學(xué)科概念體系中的一個分支節(jié)點。整個學(xué)科中,所有的概念可以形成樹狀結(jié)構(gòu),如圖1所示,“通信”和它的4種下位概念,構(gòu)成該學(xué)科內(nèi)概念體系的一棵子樹。
圖1 術(shù)語“通信”構(gòu)成的概念樹
對于某個學(xué)科的術(shù)語而言,新術(shù)語的構(gòu)詞與術(shù)語概念在概念體系中所處的層級高度相關(guān)。較上位的概念出現(xiàn)較早,往往是學(xué)科中的基本概念,因此其對應(yīng)術(shù)語的構(gòu)詞形式大多比較簡單,可認(rèn)為是學(xué)科基本術(shù)語。而較下位概念,往往是上位概念在某種情形下的擴(kuò)展或限定,其對應(yīng)術(shù)語的構(gòu)詞較多采用“上位概念+限定語/補(bǔ)充成分”的形式加以描述。這樣的情況在我們標(biāo)注的數(shù)據(jù)中占83.4%。在這樣的結(jié)構(gòu)中,上位概念往往由學(xué)科基本術(shù)語演化而得到,而限定語的來源則頗為廣泛。
從語素角度來看,術(shù)語“圖像通信”中,“圖像”和“通信”是詞匯語素化的典型,其中“圖像”是基本概念“通信”的限定成分。兩者均可進(jìn)一步劃分為單字語素“通”“信”和“圖”“像”。而在該術(shù)語中,它們實際上能夠作為語素組整體出現(xiàn)。學(xué)界通常認(rèn)為語素組具有和語素同樣的構(gòu)詞、造詞功能[6]。為區(qū)別二者,本文將“信”“圖”這樣的單字語素稱為學(xué)科基元語素。復(fù)雜術(shù)語中學(xué)科基元語素和語素組在構(gòu)詞中的作用將在第二部分進(jìn)行詳細(xì)介紹。
二 從語素到復(fù)雜術(shù)語
對于大部分學(xué)科,隨著學(xué)科研究不斷深入,該學(xué)科的術(shù)語會逐漸增多,這是詞匯系統(tǒng)開放性的一個縮影。但通過觀察可以發(fā)現(xiàn),特定學(xué)科中,大部術(shù)語都是復(fù)雜術(shù)語或者“詞組型術(shù)語”,其內(nèi)部仍存在細(xì)分結(jié)構(gòu)。正是這樣的細(xì)分結(jié)構(gòu),使得學(xué)科術(shù)語數(shù)量巨大,同時所使用的語素和語素組卻十分有限,即術(shù)語構(gòu)詞中體現(xiàn)出語言宏觀的“有限單元形成無限組合”的特性。
為了描述這樣的有限單元,我們對通信學(xué)科數(shù)據(jù)集合進(jìn)行了最小語素單元的劃分,以“最小音義結(jié)合單位”為依據(jù),將術(shù)語集中的每條術(shù)語進(jìn)行劃分,得到的語素可認(rèn)為是該學(xué)科中不可再分概念(原子概念)的體現(xiàn),我們稱之為原子語素。如(5)至(8)所示。
(5)通信——通(交流、溝通)+ 信(信息)
(6)雙工——雙(雙向)+工(工作模式)
(7)香農(nóng)熵——香農(nóng)(Shannon)+熵(熱力學(xué)標(biāo)量)
(8)長波——長(長的)+波(電磁波)
通過觀察發(fā)現(xiàn),類似(5)(6)(8)的術(shù)語雖是多語素復(fù)合詞,但也經(jīng)常作為整體被語素化,成為復(fù)雜科技術(shù)語內(nèi)部的一個語素組。相反,復(fù)雜科技術(shù)語并不直接操作原子語素,而是在語義上對原子語素進(jìn)行了整合,通過使用語義更加明確的語素組實現(xiàn)構(gòu)詞。
同時,語素組還可以有效減少語素多義同形的現(xiàn)象。語素組所表示的復(fù)合概念直接參與構(gòu)成復(fù)雜科技術(shù)語所指稱的概念。且語素組在學(xué)科內(nèi)重復(fù)使用,對整個術(shù)語的學(xué)科性起到基礎(chǔ)的構(gòu)建作用。每種語素組和構(gòu)成它們的原子語素間的對應(yīng)關(guān)系又相對固定。如(9)(10)所示。
(9)高斯噪聲——高斯+噪聲(噪+聲)
(10)通信衛(wèi)星——通信(通+信)+衛(wèi)星(衛(wèi)+星)
上述過程中,原子語素往往先組合成為語素組,然后再由這些語素組經(jīng)過組合和變換,形成形式更為復(fù)雜的術(shù)語。其構(gòu)詞層次結(jié)構(gòu)如圖2所示。
必須強(qiáng)調(diào)的是,雖然語素組在語義和構(gòu)詞上有重要作用,但是其并非一種新的語法單位:它只是語素之間的一種緊密結(jié)合。因此語素組也可以和語素直接構(gòu)成詞,而不違背相似性原則。
圖2 復(fù)雜科技術(shù)語的構(gòu)詞層次結(jié)構(gòu)
對通信學(xué)科術(shù)語進(jìn)行統(tǒng)計發(fā)現(xiàn),原子語素的數(shù)量遠(yuǎn)遠(yuǎn)少于由其構(gòu)成的語素組的數(shù)量,能產(chǎn)性也遠(yuǎn)遠(yuǎn)小于語素組。語素組的高能產(chǎn)性背后是少數(shù)學(xué)科基本概念組合構(gòu)成大量概念組,然后再由概念組組成更復(fù)雜的概念的過程。因此可以認(rèn)為,語素組這一中間層次的存在是復(fù)雜術(shù)語巨大能產(chǎn)性的基礎(chǔ)和關(guān)鍵。
此外,在術(shù)語構(gòu)成成分中,根據(jù)語素來源不同,還可以進(jìn)一步分析語素組成與學(xué)科概念體系之間的聯(lián)系,這樣的分析有助于學(xué)科術(shù)語制定和規(guī)范化,本文在第三、四部分對此進(jìn)行討論。
三 學(xué)科基元語素endprint
構(gòu)成學(xué)科術(shù)語集合的眾多原子語素也存在來源的差異。如例(8)中,“波”指代的概念是“電磁波”,符合通信學(xué)科的語境。類似還有“信”“頻”“香農(nóng)”等。這些原子語素都具有通信學(xué)科的特征,即不(常)出現(xiàn)在非通信學(xué)科詞語中。本文將具有這樣性質(zhì)的原子語素定義為學(xué)科基元語素,后文簡稱基元語素。而例(8)中語素“長”的語義和其在普通詞匯中無異,均表示“兩端之間距離大”。類似還有“雙”“短”“系統(tǒng)”“模型”等。這些語素常作為學(xué)科術(shù)語的限定成分出現(xiàn),在構(gòu)造復(fù)雜術(shù)語的過程中不可或缺,只是它們自己的語義不具有學(xué)科性,可認(rèn)為是學(xué)科無關(guān)的通用語素。
表1中給出了通信學(xué)科術(shù)語集中統(tǒng)計得到的高頻基元語素示例及其頻率數(shù)據(jù)。通過標(biāo)注和統(tǒng)計2107條術(shù)語,本文最終確定該學(xué)科的基元語素共130個。這些基元語素可以進(jìn)一步分為音譯基元語素(如“香農(nóng)”)和基本基元語素。在通信術(shù)語中音譯基元語素43條,基本基元語素87條。它們在術(shù)語中的分布情況如圖3所示。
統(tǒng)計發(fā)現(xiàn),在術(shù)語集中包含基元語素的術(shù)語共有1694條,占全部術(shù)語的80.4%,其中由基本基元語素單獨生成的有1670條,音譯基元語素單獨生成的有120條。從統(tǒng)計來看,基元語素構(gòu)造了學(xué)科中大部分的術(shù)語,說明學(xué)科相關(guān)的語義表示在術(shù)語這一詞匯系統(tǒng)中占據(jù)主導(dǎo)地位。
同時也注意到,仍存在一部分術(shù)語不包含任何基元語素,如“每戶平均收入”(電信運營商用于測定來自每個用戶收入的指標(biāo))。從字面上看,此類術(shù)語的學(xué)科特征不明顯,較難判斷其必然屬于通信學(xué)科。這是因為此類術(shù)語經(jīng)常與學(xué)科內(nèi)其他術(shù)語共同出現(xiàn)和使用,其代表學(xué)科屬性的部分在使用中為避免贅述而省略。
基元語素生成術(shù)語的能力差異巨大,如“網(wǎng)”共出現(xiàn)在214條術(shù)語中?!熬W(wǎng)”多次和“絡(luò)”組合并穩(wěn)定出現(xiàn)在許多術(shù)語中。第四部分將對其進(jìn)行詳細(xì)介紹。
四 學(xué)科固有語素組
和基元語素類似,本文將術(shù)語集中穩(wěn)固組合、表達(dá)學(xué)科特定概念的語素組稱為學(xué)科固有語素組。在基元語素的基礎(chǔ)上,筆者進(jìn)一步篩選出學(xué)科固有語素組。表2為通信學(xué)科術(shù)語集中統(tǒng)計得到的高頻固有語素組。
固有語素組并非完全由基元語素構(gòu)成。如“無線”,“無”就是一個非學(xué)科基元語素,但是和基元語素“線”一同構(gòu)成了在大量術(shù)語中穩(wěn)定重復(fù)使用的語素組“無線”,并且表達(dá)了通信學(xué)科的學(xué)科語義。因此固有語素組的強(qiáng)大構(gòu)詞能力不僅來源于基元語素的組合,也來源于基元語素和非基元語素的組合。
由圖4可以發(fā)現(xiàn),出現(xiàn)頻率不小于10次的語素組有36條,在所有的語素組中占11.43%,說明少量固有語素組具有強(qiáng)大構(gòu)詞能力。如(11)所示。
(11)數(shù)字(參與構(gòu)建68條術(shù)語)
數(shù)字——數(shù)字 通信
數(shù)字——數(shù)字 信號
數(shù)字——數(shù)字 化
數(shù)字——數(shù)字 差錯
數(shù)字——數(shù)字 線 對 增益
……
較之基元語素,語素組的構(gòu)詞能力分布表現(xiàn)出了更加明顯的長尾現(xiàn)象。這也從一個側(cè)面反映了學(xué)科術(shù)語的概念集中程度。此外,基元語素生成學(xué)科固有語素組的能力,也表現(xiàn)了類似的現(xiàn)象,如表3和圖5所示。
在術(shù)語集中,復(fù)雜科技術(shù)語的語素組平均長度為5.4(包括非固有語素組)。但是所蘊含的固有語素組大多為一個。這進(jìn)一步表明了固有語素組對學(xué)科概念具有較好的表征特性,即復(fù)雜術(shù)語多由一個上位概念和其他非學(xué)科限定語復(fù)合構(gòu)成。如圖6為“微波通信系統(tǒng)”這一術(shù)語從語素到語素組再到術(shù)語本身的構(gòu)成過程。
五 語素化視角下的術(shù)語構(gòu)詞
從語素化的視角出發(fā),復(fù)雜科技術(shù)語的構(gòu)詞更能體現(xiàn)術(shù)語所對應(yīng)概念體系的特點。本文所提出的學(xué)科基元語素、學(xué)科固有語素組的概念,實質(zhì)上就是學(xué)科概念體系在復(fù)雜術(shù)語中的映射過程。可以看出,學(xué)科術(shù)語的構(gòu)詞就是概念組合的過程,表現(xiàn)在物質(zhì)層面就是從學(xué)科基元語素到復(fù)雜科技術(shù)語的構(gòu)建過程。
基元語素對于一個特定學(xué)科而言,起到基礎(chǔ)性作用,是構(gòu)建該學(xué)科概念和術(shù)語的核心。并且我們有理由稍微大膽地認(rèn)為它們也是構(gòu)建整個學(xué)科知識的核心。如圖7中,圍繞基元語素“頻”,能夠構(gòu)建出通信學(xué)科若干復(fù)雜術(shù)語。
對于術(shù)語規(guī)范化而言,制定術(shù)語集進(jìn)行科技名字規(guī)范可以使用同樣的方法,即從基元語素出發(fā),進(jìn)行規(guī)范。一個理想的科技術(shù)語應(yīng)當(dāng)包含有學(xué)科基元語素或?qū)W科固有語素組,使得術(shù)語的學(xué)科性語義表征更為具體,亦不會引起混淆。
另一方面,隨著學(xué)科交叉的空前深入,不同學(xué)科的語素和語素組以前所未有的速度和規(guī)模互相滲透。而科技進(jìn)步又使得大量學(xué)科概念成為日常生活中的一般概念。學(xué)科與學(xué)科之間和學(xué)科與通用之間的界限日益模糊。因而從基元語素和固有語素組的層面上對術(shù)語進(jìn)行規(guī)范和界定將對術(shù)語工作提供有益的幫助。
參考文獻(xiàn)
[1] 馮志偉. 現(xiàn)代術(shù)語學(xué)引論[M]. 北京:商務(wù)印書館, 2011.
[2] 曹德和. 語速研究的性質(zhì)、方法及語料來源[J]. 復(fù)旦學(xué)報:社會科學(xué)版,2003 (6):134-140.
[3] 劉力堅. 復(fù)合詞造詞材料的語素化問題[J]. 浙江師范大學(xué)學(xué)報:社會科學(xué)版,2005 (4):20-24.
[4] 科學(xué)技術(shù)名詞[M]. 北京:科學(xué)出版社,2008.
[5] 邱艷萍. 概念整合在語素化構(gòu)詞中的作用[J].西南民族大學(xué)學(xué)報:社會科學(xué)版,2012 (S1):178-181.
[6] 丁建川.“語素組合體”述要[J]. 廣西社會科學(xué),2005(7):162-165.endprint