高其海
摘 要:本文說明了,漢語拼音信息量不足,是導(dǎo)致讀速慢,低頻合成詞學(xué)習(xí)難,打字慢的主要原因。
關(guān)鍵詞:漢語拼音 信息量 讀速慢 打字慢
中圖分類號(hào):H13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-9082(2018)09-0-01
制定漢語拼音的初衷是,為替代難以學(xué)習(xí)的漢字做準(zhǔn)備。然而時(shí)間已經(jīng)過去60年了,可漢語拼音用于文字的試驗(yàn),卻始終處于通俗讀物的水平,從未出版過教科書,小說,專著等。
初衷是美好的,試驗(yàn)卻不順利,原因何在?一種解釋是,中國人不習(xí)慣拼音文字。實(shí)際上,文字是傳遞信息的工具,若對(duì)漢語拼音的主要性能,即讀、學(xué)、寫性能,逐項(xiàng)予以測試,就不難找到真實(shí)的原因。
分析表明,漢語拼音用于文字時(shí),字匯量不足,信息量不足,音節(jié)的含義不清。由此引發(fā)的不良性能是,低頻合成詞理解難,學(xué)習(xí)難,尤其是閱讀性能不合格,讀速慢,不勝任,是制約漢語拼音用于文字的主要原因。
一、漢語拼音的信息量不足
為了便于與漢字的信息量相對(duì)照,本文所說的漢語拼音的信息量不足,主要指的是音節(jié)的信息量不足。
1.漢語拼音音節(jié)的信息量
文字單位的信息量是由文字單位的字匯量確定的,漢語拼音標(biāo)調(diào)音節(jié)的數(shù)量約1300(含輕聲)。平均每個(gè)音節(jié)的信息量為7.56比特[1](陳明遠(yuǎn).1980年,頁77),與漢字的信息量相比,平均每個(gè)音節(jié)少了2.1比特。
——經(jīng)過上個(gè)世紀(jì)七十年代大規(guī)模統(tǒng)計(jì),統(tǒng)計(jì)到的漢字六千多,平均每個(gè)漢字的信息量為9.66比特[2](林聯(lián)合.1980,頁145)。
為了改善漢語拼音的閱讀性能,人們?cè)鴮?duì)分詞連寫寄予厚望。分詞連寫能夠補(bǔ)充信息量,但補(bǔ)充的信息量非常有限。
2.分詞連寫補(bǔ)充信息量的原理
分詞連寫補(bǔ)充信息量的原理是,分詞連寫可在音節(jié)之間標(biāo)出大小兩種間隔,兩種間隔能夠提供相鄰音節(jié)之間的關(guān)系密切與否的信息。
具體地講,單詞內(nèi)部的音節(jié)之間是小間隔,小間隔表明,其兩側(cè)音節(jié)之間的關(guān)系密切些。單詞之間是大間隔,大間隔表明,其兩側(cè)音節(jié)之間的關(guān)系疏遠(yuǎn)些。經(jīng)驗(yàn)表明,這種音節(jié)之間關(guān)系密切與否的信息,對(duì)于提高理解,閱讀速度同樣是有益的。
例如,我們學(xué)古文的時(shí)候,如果老師首先幫助我們點(diǎn)開句子,不一定以單詞為標(biāo)準(zhǔn)進(jìn)行切分,只要以一兩個(gè),或兩三個(gè)較為密切的漢字為一組,在每組之間點(diǎn)個(gè)點(diǎn)(相當(dāng)于“大間隔”),我們的閱讀就會(huì)頓感順暢了許多。
【一點(diǎn)說明】
當(dāng)大小間隔頻率均等,各為0.5的時(shí)候,例如,所有單詞都是雙音節(jié)詞的時(shí)候,分詞連寫補(bǔ)充的信息量最多,平均每個(gè)間隔一比特。(計(jì)算過程略)
假如漢語拼音平均每個(gè)音節(jié)的信息量就是7.56比特,分詞連寫補(bǔ)充的信息量按一比特計(jì),二者合計(jì)為8.56 比特,與漢字相比,信息量仍然是不足的。
——有趣的是,漢語單詞的雙音節(jié)化傾向,漢語音步二二相承的傾向。兩種傾向均可使音節(jié)后的大小間隔交替出現(xiàn),頻率趨于均等,這分明是“追求”口頭語言聽覺信息量最大化的表現(xiàn)。
二、信息量不足對(duì)性能的影響
漢語拼音信息量不足會(huì)導(dǎo)致三項(xiàng)不良性能。第一,讀速慢。第二,低頻合成詞理解難,學(xué)習(xí)難。第三,打字慢。
1.漢語拼音讀速慢
漢字的字義清晰,能夠區(qū)分同音詞,讀者理解快,讀速快。
漢語拼音把形音義具備的漢字“降級(jí)”,變?yōu)楹x不清的音節(jié),因而無法像漢字那樣,利用字義區(qū)分同音詞。要想讀懂文章的本義,有時(shí)還需讀者的揣摩和猜測。漢語中的同音詞比比皆是,揣摩猜測會(huì)頻頻發(fā)生,讀速慢也是容易測試的。
如果遇到那些由低頻字組成,卻又不知名的人名、地名、商標(biāo)、臨時(shí)稱謂等,不只是讀速慢,文中大忌——誤讀也會(huì)隨時(shí)發(fā)生。
文字是傳遞信息的工具,漢語拼音之所以從未出版過教科書,小說,專著等,閱讀性能不合格,不勝任,無疑是最主要的原因。
2.字義與合成詞的學(xué)習(xí)
漢字形音義具備,字義清晰,讀者理解快,學(xué)習(xí)快。一些詞典外的合成詞如同詞組一般容易學(xué)習(xí),即便是作者根據(jù)所要表達(dá)的意義,即造即用的合成詞,讀者即便初次見到,大多也能知音知義。
漢語拼音把形音義具備的漢字“降級(jí)”,變?yōu)楹x不清的音節(jié),致使大量低頻合成詞,變得理解難,學(xué)習(xí)難。這一點(diǎn)是可以對(duì)比測試的,還可在現(xiàn)實(shí)中找到例證。
例如,與知識(shí)分子相比,不識(shí)字的人們?cè)~匯量是有限的。原因是,盡管他們也會(huì)從廣播、電視等媒體中聽到過大量低頻合成詞,只因口語音節(jié)的含義不清,不理解,不知所云,結(jié)果是隨聽隨忘。
——無論是漢語拼音,或是口頭語言,遇到不理解的合成詞,都會(huì)像(沒有擬聲痕跡的)多音節(jié)單純?cè)~一樣難于記憶。
值得強(qiáng)調(diào)的是,切莫不加區(qū)別地?cái)嘌?,由于漢語拼音是拼音文字,所以漢語拼音就一定是容易學(xué)習(xí)的文字。
實(shí)際上,對(duì)于漢語拼音,只有知音知義,能聽會(huì)說,信息量少的高頻詞才是容易學(xué)習(xí)的。與漢字相比,大量的,聽不懂,不會(huì)說的低頻合成詞,反倒是不容易學(xué)習(xí)的。這是評(píng)價(jià)漢語拼音學(xué)習(xí)性能時(shí),一個(gè)易被遺漏的重要側(cè)面。
3.漢語拼音打字慢
電報(bào)碼的信息量充足,能夠一一對(duì)應(yīng)出所需的字或詞。
由于漢語拼音的信息量不足,因而每輸入一組音節(jié),會(huì)出現(xiàn)一批同音詞,必須人工選詞。選詞的按鍵次數(shù)不一定很多,但遇到難選詞語,則需要逐一審視,翻頁等,與輸入音節(jié)的過程相比,有時(shí)能多出十幾倍的時(shí)間。
——這里的難選詞語,就是前文提到的,由低頻字組成,卻又不知名的人名、地名、商標(biāo)、臨時(shí)稱謂等。如果低頻字又有大量同音字,則翻頁更多。
選詞過程不可記憶,不可盲打,筆者之前的文章有過討論,此處不多贅述。
【表象與本質(zhì)】
漢語拼音的三項(xiàng)不良性能,即讀速慢,低頻合成詞學(xué)習(xí)難,打字慢,為什么重點(diǎn)都是低頻字,低頻詞?回答是,三項(xiàng)不良性能都是信息量不足造成的,差額懸殊與否,就是合理的解釋。
以低頻字為例,根據(jù)信息量的定義[3] (日 藤田広一,1982年 ,頁6—11),低頻字的信息量多,(相應(yīng))音節(jié)的信息量少,差額懸殊,所以低頻字就成了漢語拼音不勝任的重點(diǎn)。
反之,高頻字的信息量少,與音節(jié)的信息量相差不懸殊,漢語拼音的表現(xiàn)就會(huì)好一些,這也是漢語拼音“偏愛”通俗讀物的主要原因。
4.關(guān)于漢語拼音長音節(jié)的討論
注音字母的音節(jié)最多只有三個(gè)字母,而漢語拼音的音節(jié)最多卻有六個(gè)字母。音節(jié)的字母數(shù)量增加了,音節(jié)的信息量能否隨著增加?答案是否定的。
通過字典的兩種注音方式可以看出,漢語拼音的音節(jié),注音字母的音節(jié),二者是一一對(duì)應(yīng)的,數(shù)量是相等的,使用頻率也是相等的,二者的平均信息量必然也是相等的。漢語拼音音節(jié)的字母數(shù)量多,而信息量卻未增加,上述三項(xiàng)不良性能自然不會(huì)得到任何改善。
其負(fù)面效果卻是,與注音字母相比,在同等熟練的條件下,漢語拼音在書寫速度,字典檢字速度,全拼碼打字速度,節(jié)省紙張等方面,均會(huì)更遜一籌。
——這里只涉及速度、經(jīng)濟(jì)性能的比較,不涉及字母形式的比較。
三、歷史的啟示
漢語拼音把形音義具備的漢字“降級(jí)”,變?yōu)楹x不清的音節(jié)。類似的“降級(jí)”,也就是古代的同音假借,早已大量試過。有文獻(xiàn)指出,甲骨文中假借字的占比達(dá)74%左右。[4](王楓.2008年,頁41—42)
假借字以一當(dāng)十,可大幅減少字?jǐn)?shù),字?jǐn)?shù)少了容易學(xué)習(xí)。然而漢字最終放棄了這種嘗試,原因是,假借字過多,字匯量不足,信息量不足,假借字的含義不清,同樣會(huì)理解難,讀速慢,這與漢語拼音遇到的問題是相同的。
形聲字是在春秋戰(zhàn)國及其前后,伴隨著中華民族智慧井噴式地爆發(fā),伴隨著中華民族迅速成熟的過程盛行起來的。優(yōu)點(diǎn)是字匯量增加了,信息量增加了,字義清晰了,理解,讀速加快了??梢哉f,漢字中的形旁,決不是畫蛇添足,而是先哲們大智慧選出的,可完善漢字諸多性能的優(yōu)質(zhì)部件。
結(jié)語
漢語拼音(或注音字母)只對(duì)漢字的音節(jié)成分實(shí)施了拼音化改造,拼音化是先進(jìn)的,但與眾多的形聲字相比,舍棄了形旁,字匯量銳減,信息量銳減,音節(jié)的含義不清,是大失誤。
參考文獻(xiàn)
[1]陳明遠(yuǎn).數(shù)理語言學(xué).百科知識(shí)[J].1980,(1).
[2]林聯(lián)合. 關(guān)于漢字統(tǒng)計(jì)特征的幾個(gè)問題.語文現(xiàn)代化[J].1980,(1).
[3](日)藤田広一 .基礎(chǔ)信息論[M].魏鴻駿等譯.北京:國防工業(yè)出版社,1982.
[4]王楓 .從漢字的理據(jù)性看漢語編碼的發(fā)展階段.漢字文化[J]2008,(6).