王秋萍
(沈陽師范大學(xué) 國際教育學(xué)院,遼寧 沈陽 110034)
《現(xiàn)代漢語詞典》收錄的字母詞使用情況調(diào)查與分析
王秋萍
(沈陽師范大學(xué) 國際教育學(xué)院,遼寧 沈陽 110034)
字母詞指漢語中單獨(dú)由字母構(gòu)成,或者由字母、數(shù)字、符號(hào)、漢字混合構(gòu)成的詞,在《現(xiàn)代漢語詞典》(第6版)中總計(jì)收錄字母詞242條。此次調(diào)查將關(guān)注這些字母詞在漢語中的使用情況,尤其關(guān)注高頻、低頻字母詞,第6版新增字母詞在漢語中的使用情況,并對調(diào)查結(jié)果做出比較分析。擬展示不同頻段字母詞在漢語中各異的使用面貌,量化其發(fā)展變化規(guī)律,總結(jié)其使用特點(diǎn)和成因;剝離低頻字母詞,補(bǔ)充使用程度較高的字母詞,為詞典修訂提供參考。
《現(xiàn)代漢語詞典》;字母詞;使用;調(diào)查;分析
自20世紀(jì)90年代以來,字母詞在漢語中廣泛和大量使用已是不爭的事實(shí),它也已成為漢語詞匯系統(tǒng)引進(jìn)外來詞和產(chǎn)生新詞的重要形式之一[1-4]。然而,字母詞使用卻也一直惹爭議[5][6],這些由字母構(gòu)成的詞,是否可以與漢字詞同等視為漢語詞,即便作為借詞的一種形式接納了它們,可這些很難見其形而度其義的字母詞接受起來是否跟學(xué)習(xí)和使用外語一樣。其實(shí),一項(xiàng)通過對1990-2014年(以下25年均指此時(shí)間段)漢語書面語中字母詞使用情況的大規(guī)模調(diào)查發(fā)現(xiàn)①在王秋萍博士學(xué)位論文《近二十年來漢語書面語中字母詞使用狀況調(diào)查》的基礎(chǔ)上,加入近五年的語料后調(diào)查得出的數(shù)據(jù)和結(jié)論。,其字母詞使用量總計(jì)8 000多個(gè),其中,使用頻次為1的字母詞占至50%左右,這說明字母詞的一過使用率非常高,穩(wěn)定性差。累計(jì)使用總頻次大于100的字母詞僅有不到200個(gè),卻可以覆蓋字母詞總使用頻次的70%以上。這表明,高頻使用的字母詞數(shù)量相當(dāng)有限,了解起來根本不能與學(xué)習(xí)外語等而視之,更不必產(chǎn)生過于強(qiáng)烈的因字母詞的使用而導(dǎo)致人們閱讀理解障礙的擔(dān)憂。
為了方便查閱字母詞,《現(xiàn)代漢語詞典》自1996年第3版起,除收錄“阿Q”“卡拉OK”“三K黨”3條字母詞外,首次在“西文字母開頭的詞語”題錄下收錄39個(gè)字母詞。又分別在2002年第4版,2005年第5版和2012年第6版中,總計(jì)收錄字母詞145個(gè)、185個(gè)和242個(gè)。
本文將以《現(xiàn)代漢語詞典》(第6版)(下文簡稱“《現(xiàn)漢6》”)中收錄的242個(gè)字母詞為調(diào)查對象[7],擬通過對其使用情況的調(diào)查展示字母詞在漢語中的使用面貌,量化其發(fā)展變化規(guī)律,總結(jié)其使用特點(diǎn)和成因,為字母詞使用規(guī)范和入典提供參考。
《現(xiàn)漢6》收錄字母詞總計(jì)242個(gè),其中,同形詞2個(gè),形成244個(gè)統(tǒng)計(jì)詞條。將244個(gè)字母詞分別在1990-2014年歷時(shí)25年的《人民日報(bào)》語料中檢索,并統(tǒng)計(jì)出各詞條25年總使用頻次和各年度使用頻次,以及在語料中出現(xiàn)的年份等信息,形成字母詞使用情況的25張年表和一張總表。
頻次是衡量詞匯常用程度的一個(gè)最直觀的統(tǒng)計(jì)量,25年總使用頻次可以反映出字母詞自20世紀(jì)90年代以來在現(xiàn)代漢語中累計(jì)使用量的多寡,其統(tǒng)計(jì)結(jié)果見表1。
表1 244條字母詞不同頻次段詞種、詞次分布
從表1可以看出:第一,《現(xiàn)漢6》中所收錄的244個(gè)字母詞,25年使用總詞次為110748次。1990-2014年這25年《人民日報(bào)》中使用的字母詞總共有8 000多個(gè),近200 000詞次,相當(dāng)于每近2 328個(gè)漢字詞,就會(huì)出現(xiàn)一個(gè)字母詞①在王秋萍博士學(xué)位論文《近二十年來漢語書面語中字母詞使用狀況調(diào)查》的基礎(chǔ)上,加入近五年的語料后調(diào)查得出的數(shù)據(jù)和結(jié)論。。而所收錄的244個(gè)字母詞詞種數(shù)僅占25年《人民日報(bào)》使用總字母詞詞種數(shù)的3%左右,卻覆蓋了總使用詞次的近50%,總體上看,這244個(gè)字母詞中涵蓋了大多數(shù)漢語中常用的字母詞,而且在現(xiàn)代漢語中常用字母詞的數(shù)量并不多。
第二,244個(gè)字母詞中,25年總使用頻次在300以上的詞條有66條,占收錄總詞種數(shù)的27.05%,500以上的詞條有44條,占18.03%,1000以上的詞條有25條,占10.25%。25年總使用頻次在300以下的詞條有178條,占收錄總詞種數(shù)的72.95%,100以下的詞條有132條,占54.1%,50以下的詞條有99條,占40.57%。
第三,25年總使用頻次在300以上的66條字母詞僅占收錄總詞種數(shù)的27.05%,其25年總使用頻次覆蓋率卻可達(dá)89.39%,這說明這一小部分字母詞的使用頻次很高。而25年總使用頻次在300以下的178條字母詞占收錄總詞種數(shù)的72.95%,其25年總使用頻次覆蓋率僅達(dá)到10.61%,可見這些字母詞中很大一部分的使用頻次較低?!冬F(xiàn)漢6》收錄的244條字母詞中,高頻詞與中、低頻詞的比例約為1:2。
在《現(xiàn)漢6》所收錄的244個(gè)字母詞中,25年總使用頻次在300以上的字母詞有66條,各詞條25年總使用頻次見表2。
表2數(shù)據(jù)顯示:25年總使用頻次最高的字母詞是“GDP”,位居第二、三位的是“WTO”和“APEC”,這三個(gè)字母詞覆蓋了244條字母詞總使用頻次的30.45%,66條高頻字母詞總使用頻次的34.06%。
表2 高頻字母詞詞表
GDP的漢譯詞是“國內(nèi)生產(chǎn)總值”,我國從1985年起建立GDP核算制度,1993年正式取消GNP核算,從此,“國內(nèi)生產(chǎn)總值”成為國民經(jīng)濟(jì)核算的核心指標(biāo)。20世紀(jì)90年代以來,世界上絕大多數(shù)國家也紛紛放棄GNP而重點(diǎn)采用GDP作為國家經(jīng)濟(jì)核算指標(biāo)。這一經(jīng)濟(jì)領(lǐng)域的變化馬上反映在詞匯的使用上。圖1所見,GNP在25年各年度的使用量均不高。而且,1994年以后,其使用頻次呈現(xiàn)下降趨勢,除個(gè)別年份外,基本降至年總使用頻次10次以內(nèi),而GDP的使用頻次卻逐年迅增。圖2則反映出漢語系統(tǒng)對這一經(jīng)濟(jì)概念采用字母詞還是漢字詞形式的選擇趨勢。1998年以前,“國內(nèi)生產(chǎn)總值”這一詞形占據(jù)頻次優(yōu)勢,以后則字母詞GDP使用頻次優(yōu)勢凸顯。25年總體而言,漢字詞形式年度使用頻次相對不高,且呈下降趨勢,字母詞形式反之呈上升趨勢,2004年以來,年度使用頻次均高于800次。這一變化趨勢不僅體現(xiàn)出國家對經(jīng)濟(jì)發(fā)展的重視,也體現(xiàn)出詞匯系統(tǒng)在接納這一經(jīng)濟(jì)領(lǐng)域術(shù)語的博弈中,字母詞形式所表現(xiàn)出的表達(dá)優(yōu)勢。
GDP一詞25年總使用頻次非常高,年度使用頻次總體呈上升趨勢,這反映了高頻字母詞使用的一種變化類型。類似的字母詞還有PMI,指“制造業(yè)采購經(jīng)理指數(shù)”,在2005年語料中首次出現(xiàn),2009年開始進(jìn)入使用頻次的上升期,累計(jì)至今成為高頻詞。近些年來,PMI已發(fā)展成為衡量世界經(jīng)濟(jì)運(yùn)行活動(dòng)的重要評價(jià)指標(biāo)和世界經(jīng)濟(jì)變化的晴雨表,使得其使用頻次持續(xù)高升。這類字母詞還有:NBA、CBA、A股、CPI、IPO。
圖1 “GDP”和“GNP”25年使用頻次變化
圖2 “GDP”和“國內(nèi)生產(chǎn)總值”25年使用頻次變化
WTO即“世界貿(mào)易組織”,其25年總使用頻次也非常高,但是它的高頻使用則反映了字母詞使用頻次歷時(shí)變化的又一種類型。圖3所示,WTO一詞在2001和2002年使用頻次特別高,年使用頻次1700以上,在其前后一兩年是頻次的驟升期和驟降期,呈現(xiàn)此變化趨勢與2001年底中國正式加入WTO這一事件息息相關(guān)。又如字母詞APEC、PM2.5和SARS,2001年APEC會(huì)議在上海召開,2003年SARS疫情爆發(fā),2012-2014年,長時(shí)間懸浮于空氣中,直徑小于等于2.5微米的細(xì)顆粒物與空氣質(zhì)量的話題成社會(huì)熱點(diǎn),使其使用頻次呈現(xiàn)出陡峰突起之勢。伴隨非典疫情的有效控制,SARS一詞也漸漸淡出人們的視線。而2014年APEC會(huì)議再度在中國召開,APEC一詞又迎來了第二個(gè)陡峰突起。可以想見,若PM2.5得到有效治理,空氣質(zhì)量好轉(zhuǎn),PM2.5一詞也將淡出人們的視線。這類字母詞還有:F1、CEPA、B股、NMD、ECFA、H股。
有些字母詞雖然25年總使用頻次很高,但是正經(jīng)歷年度使用頻次變化的下降期,進(jìn)而可能進(jìn)入低頻期,如圖4,卡拉OK一詞從1996年開始進(jìn)入使用頻次下降期,并逐漸轉(zhuǎn)入低頻期,這反映字母詞歷時(shí)變化的第三種類型。這類字母詞還有:ISO、VCD、 CDMA、IC卡、CD、PC、GSM、BBC、MBA、BP機(jī)、SUV、CAD、CIMS、IP電話。
圖3 “WTO”和“APEC”25年使用頻次變化
圖4 “卡拉OK”25年使用頻次變化
還有兩類字母詞,一類是經(jīng)過逐漸升溫的關(guān)注期后趨于穩(wěn)定使用,圖5所見,IT一詞從1999年至2001年是其使用頻次的增長期,2002年以來穩(wěn)定在一個(gè)較高的頻次范圍內(nèi)。這類字母詞還有:DNA、GPS、LED、DVD、M2、M1、GMP、ATM機(jī)、CNN、IP地址、POS機(jī)、VIP。
圖5 “IT”25年使用頻次變化
圖6 “CT”和“X光”25年使用頻次變化
另一類字母詞是25年間使用頻次歷時(shí)變化趨勢不明顯,或者年度使用頻次不高,頻次歷時(shí)變化不大,趨于穩(wěn)定。圖6所見,前者如CT,后者如X光。這類字母詞還有:CCTV、IMF、QQ、B超、CEO、ST、X射線、CPU、QFII、CBD、WAP、PPI、MTV、T恤衫、BBS、SCI、ABC、HIV、阿Q。
(2)C-E mistranslation of publicity materials of red tourism in Hunan Province will hinder Hunan Province from boosting its Red Tourism
高頻字母詞在漢語中的歷時(shí)發(fā)展?fàn)顟B(tài)顯示,它們有些成為字母詞中的常青樹,有些伴隨社會(huì)關(guān)注度的冷熱程度變化而時(shí)隱時(shí)現(xiàn),有些則將漸漸退出交際的舞臺(tái)。
字母詞的“首次出現(xiàn)年份”記錄了其出現(xiàn)年代的早晚,而“累積出現(xiàn)年份”則可以反映其生命力,它們也是字母詞在漢語中使用情況的體現(xiàn)。
如表3所見,66條高頻字母詞中,56個(gè)字母詞于20世紀(jì)90年代已經(jīng)在漢語中使用,占高頻字母詞詞種總數(shù)的85%。根據(jù)語料統(tǒng)計(jì)得到的字母詞累計(jì)出現(xiàn)年份數(shù)據(jù),66條字母詞中,累計(jì)使用20年以上的字母詞有36個(gè),約占高頻字母詞詞種總數(shù)的55%,累計(jì)使用15年以上的字母詞有50個(gè),占高頻字母詞詞種總數(shù)的76%,累計(jì)使用10年以上的字母詞有62個(gè),占高頻字母詞詞種總數(shù)的94%,累計(jì)使用年份不足5年的高頻字母詞為0??梢?,這66個(gè)高頻字母詞在漢語中的使用已經(jīng)經(jīng)歷了很長一段時(shí)間,絕大多數(shù)已經(jīng)發(fā)展成為漢語詞匯中成熟而常用的組成部分,已經(jīng)具備了相當(dāng)?shù)纳Α?/p>
表3 高頻字母詞首次出現(xiàn)年份和累計(jì)出現(xiàn)年份分布
如果將字母詞分為組織機(jī)構(gòu)名、專業(yè)術(shù)語和一般名詞3種類型,那么這66個(gè)高頻字母詞的類型分布見表4。
表4 高頻字母詞類型分布
從表4的統(tǒng)計(jì)結(jié)果看,在高頻字母詞中,術(shù)語所占比例最大,其次是一般名詞,專名所占比例最低。如果將高頻字母詞按照其使用的領(lǐng)域劃分,其分布情況見表5。
表5 高頻字母詞領(lǐng)域分布
在高頻字母詞中,反映國家政治經(jīng)濟(jì)和人民生活的最多,其次是科技文化及醫(yī)療衛(wèi)生,反映農(nóng)業(yè)生產(chǎn)的沒有。這一方面與國計(jì)民生、社會(huì)關(guān)注息息相關(guān);另一方面,從語言學(xué)角度看,也和字母詞所對應(yīng)的漢譯詞的有無關(guān)系也非常大。有些字母詞至今沒有可替代的漢譯詞,如:卡拉OK、CT、X光、CD、B超、X射線、T恤衫、B股、A股、BP機(jī)、IC卡、H股、M1、M2、VCD、DVD、F1、IP電話、QQ。它們有些用到了字母的構(gòu)形特點(diǎn),有些用到了字母的分類排序作用,有些因?yàn)闈h語釋義繁瑣晦澀,難以推廣而積極使用字母詞形式,有些是專名,總之,這些因素都構(gòu)成字母詞高頻使用的原因??梢姡帜冈~是漢語產(chǎn)生新詞語的一個(gè)重要途徑,有些新詞語最早產(chǎn)生就是一個(gè)字母詞。
25年總使用頻次小于50的字母詞被劃入“低頻字母詞”,列入表6,總計(jì)98個(gè),占收錄字母詞總詞條的40%。其在不同頻段分布見圖7,其中,25年總使用頻次為0的字母詞有9條,25年總使用頻次小于20的有66個(gè),占低頻字母詞的67.3%。
低頻字母詞的首次出現(xiàn)年份分布見圖8。首次出現(xiàn)年份分布于 1990-1999年間的有 58條,1990-2009年間的有85條,2010-2014年間的有4條??梢?,絕大多數(shù)低頻字母詞并非新詞,其25年累計(jì)使用頻次小于50次的確表明它們是低頻字母詞。
這些低頻字母詞,除了其指稱的事物或概念本就不常用以外,從語言學(xué)視角分析,導(dǎo)致低頻的原因還有:第一,其漢譯詞使用占優(yōu)勢,如:AI(人工智能)、DC(數(shù)碼相機(jī))、APC(復(fù)方阿司匹林)、Wi-Fi(無線網(wǎng)絡(luò))等。第二,在口語交際中使用占優(yōu)勢,如:NG、K歌等。第三,在非大眾傳播媒介,如專業(yè)領(lǐng)域交際中使用占優(yōu)勢,如:SSD、HDMI、OLED等。第四,其另一種書寫形式占優(yōu)勢,如:hi-fi(HIFI)、CCC(3C)等。
①“PE”是同形字母詞,釋義為“市盈率”的頻次為1,釋義為“聚乙烯”的頻次為57。
與《現(xiàn)漢5》相較,《現(xiàn)漢6》新增字母詞60個(gè),形成61個(gè)統(tǒng)計(jì)詞條,其25年總使用頻次見表7。其中,中、高頻字母詞有31個(gè),成為詞典收錄字母詞的重要補(bǔ)充。其余30個(gè)為低頻字母詞,占新增字母詞的近50%,約占低頻字母詞的1/3。
表6 低頻字母詞詞表
僅就統(tǒng)計(jì)得到的25年使用數(shù)據(jù)而言,低頻新增字母詞收錄的理由并不十分充分。通過對1990-2014《人民日報(bào)》中字母詞使用情況的調(diào)查發(fā)現(xiàn)①在王秋萍博士學(xué)位論文《近二十年來漢語書面語中字母詞使用狀況調(diào)查》的基礎(chǔ)上,加入近五年的語料后調(diào)查得出的數(shù)據(jù)和結(jié)論。,其中有些使用程度較高的字母詞《現(xiàn)漢6》并未收錄。這里“使用程度較高”的篩選規(guī)則為:25年累計(jì)使用總頻次不低于50,并且累計(jì)分布總文本數(shù)不低于50或者累計(jì)使用總年份不低于10年②25年累計(jì)使用總頻次、分布總文本數(shù)和使用總年份三個(gè)統(tǒng)計(jì)量的閾值是通過對1990-2014《人民日報(bào)》中字母詞使用數(shù)據(jù)的統(tǒng)計(jì)分析以后得到的經(jīng)驗(yàn)值。。并且,將得到的字母詞進(jìn)行人工甄別,去掉產(chǎn)品品牌名、公司名等部分專名,去掉頻次雖高,但缺乏時(shí)代感,已然面臨淘汰的詞,列入表8中。
圖7 低頻字母詞頻段分布
圖8 低頻字母詞首次出現(xiàn)年份分布
表8使用程度較高而《現(xiàn)漢6》未收錄的字母詞詞表《現(xiàn)漢6》除了在漢字詞條目中非常謹(jǐn)慎地收錄了3條漢字開頭的字母詞以外,其它字母詞均收錄在“西文字母開頭的詞語”題錄下。因此,表8中以漢字或數(shù)字開頭的字母詞僅基于詞形上的客觀條件考慮即沒有被選錄其中。然而,通過大規(guī)模語料的調(diào)查統(tǒng)計(jì),表8所列字母詞僅從統(tǒng)計(jì)數(shù)據(jù)角度比較,的確比《現(xiàn)漢6》所收錄的部分中低頻字母詞常用,入典的理由也更充分些。
表7 《現(xiàn)漢6》新增字母詞詞表
表8 使用程度較高而《現(xiàn)漢6》未收錄的字母詞詞表
統(tǒng)計(jì)采用《人民日報(bào)》語料,因受到新聞?wù)Z料所限,新聞事件中涉及到的字母詞,其使用頻次可能會(huì)高些。但是,調(diào)查采用歷時(shí)25年語料,語料量和歷時(shí)跨度均較大,會(huì)削弱新聞?wù)Z料這種語料屬性的局限性;且詞典所收錄字母詞均遵循在漢語中已經(jīng)使用很成熟的原則,這也會(huì)削弱語料性質(zhì)的影響。因此,調(diào)查結(jié)果在一定程度上可以反映《現(xiàn)漢6》中所收字母詞在漢語中的使用面貌。
雖然絕對頻次在反映字母詞使用量方面受語料量影響較大,但是它依然可以客觀反映出該版詞典所收錄的244個(gè)字母詞之間相對使用量的關(guān)系,即哪些是高頻的,哪些是低頻的。
研究結(jié)果顯示,《現(xiàn)漢6》所收錄的字母詞中,高頻使用的字母詞僅占約27%,而40%左右是低頻字母詞,另33%是中頻的。然而,高頻字母詞雖少,其覆蓋率卻很高,66個(gè)高頻字母詞覆蓋字母詞使用總量的近90%。即使是高頻字母詞,其致高頻的原因也存在不同情況,還有些使用頻次已呈遞減趨勢。由此可見,在漢語系統(tǒng)中,真正高頻穩(wěn)定使用的字母詞詞種數(shù)并不多,詞次覆蓋率卻可以很大,并通過反復(fù)使用而漸漸為人們所熟知。
[1]沈孟瓔.淺議字母詞的入典問題[J].辭書研究,2001(1):30-38.
[2]劉涌泉.關(guān)于漢語字母詞的問題[J].語言文字應(yīng)用,2002(1):85-90.
[3]鄭澤芝.字母詞語跟蹤研究[J].語言文字應(yīng)用,2009(1):69-78.
[4]侯敏,滕永林,劉俊,劉欣斐.廣播電視語言外文縮略詞使用狀況調(diào)查[J].北華大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2011(4):18-25.
[5]國家語言資源監(jiān)測與研究中心.2006中國語言生活狀況報(bào)告:下編[M].北京:商務(wù)印書館,2007:40-43.
[6]劉佳,鄒煜,侯敏.如何引導(dǎo)媒體語言規(guī)范——以外文縮略詞在廣播電視語言中的使用為例[J].語言文字應(yīng)用,2011(4):78-83.
[7]中國社會(huì)科學(xué)院語言研究所詞典編輯室.現(xiàn)代漢語詞典:第6版[M].北京:商務(wù)印書館,2012:1,716,1117,1750-1755.
Research on Letter Words in Modern Chinese Dictionary
Wang Qiuping
(College ofInternational Education,ShenyangNormal University,ShenyangLiaoning110034)
Letter words consist of either a single letter or numbers,punctuation and Chinese characters.There are 242 letter words in Modern Chinese Dictionary(6thedition).This research focuses on the usage ofthese letter words and the frequency as well as the newly added words in the 6thedition.It also makes a comparison and analysis of the results so as to showthe frequency of the words used.The regularity of development,features and possible reasons are discussed as well.Hopefully,it will provide references for revisingthe dictionary.
Modern Chinese Dictionary;letter words;usage;survey;analysis
H 08
A
1674-5450(2016)02-0081-06
2016-01-08
遼寧省教育廳科學(xué)研究一般項(xiàng)目(W2013148);遼寧省社會(huì)科學(xué)基金規(guī)劃項(xiàng)目(L11DYY051);沈陽師范大學(xué)博士科研項(xiàng)目啟動(dòng)基金經(jīng)費(fèi)資助
王秋萍,女,遼寧沈陽人,沈陽師范大學(xué)講師,語言學(xué)博士,主要從事語料庫語言學(xué)及語言監(jiān)測研究。
【責(zé)任編輯:楊抱樸責(zé)任校對:王鳳娥】