摘 要:
文章分析了四角號碼著者號產(chǎn)生重號的原因,通過借鑒漢語拼音輸入法中雙拼輸入模式的設(shè)計(jì)原理設(shè)計(jì)雙拼著者號,并輔以實(shí)例證明雙拼著者號的設(shè)計(jì)可行性,一定程度上解決了傳統(tǒng)拼號法著者號無法較好兼顧重號的問題,以期對圖書館書目管理及讀者閱讀體驗(yàn)有所助益。
關(guān)鍵詞:
書次號;著者號;漢語拼音;雙拼著者號;四角號碼
中圖分類號:G254.13??? 文獻(xiàn)標(biāo)識碼:A?? 文章編號:
1003-7136(2023)01-0035-04
The Compilation Method of the Binary-syllabification Author Number
LU Wei
Abstract:
This paper analyzes the reasons for the repetition of author number of the four-corner number,designs the binary-syllabification author number by referring to the design principle of the binary-syllabification input pattern in the Chinese Pinyin input method,and proves the design feasibility of the binary-syllabification author number with an example,which solves the problem that the traditional spelling author number cannot give consideration to the duplicate number to some extent,so as to improve the library bibliography management and the reader′s reading experience.
Keywords:
book number;author number;Chinese Pinyin;the binary-syllabification author number;the four-corner number
0 引言
著者號是書次號的一種,一直受到不少圖書館的青睞,主要原因是著者號能集中同一著者的同一類書、同種書的不同版本、分次到館的多卷書、連續(xù)出版物等[1],對提升開架借閱方式下讀者的圖書查找體驗(yàn)尤為有利。此外,相較于另一種書次號類型種次號,著者號取號時不依賴已有館藏,因此更有利于書次號的標(biāo)準(zhǔn)化。盡管著者號具有上述諸多優(yōu)點(diǎn),但至今仍沒有一種著者號能在全國得到廣泛認(rèn)可和應(yīng)用。但是,這并不妨礙各館從已有的眾多著者號編制方法中選用最符合本館需求的方法,以筆者所在的廣西壯族自治區(qū)為例,從省級到縣級公共圖書館多采用四角號碼著者號。四角號碼著者號是一種常見的拼號法著者號,脫胎于四角號碼檢字法,依據(jù)漢字筆形取號,對中文古籍文獻(xiàn)索引來說十分便利,也不存在查號法著者號增字配號的問題,但四角號碼著者號存在其他問題,其中以重號問題最為突出。下面筆者將從四角號碼著者號的重號問題入手,分析其產(chǎn)生重號的原因并嘗試設(shè)計(jì)一種全新的著者號。
1 四角號碼著者號的重號問題
在分析四角號碼著者號產(chǎn)生重號的具體原因前,一些與四角號碼著者號相關(guān)的實(shí)踐經(jīng)驗(yàn)是值得先行討論的。首先,四角號碼著者號的編制重心通常放在著者首字,其他字為輔;其次,四角號碼著者號一般只取著者首字的兩角號碼,而兩位數(shù)字的編碼容量僅為100,所以重號是無法避免的;再次,著者首字的出現(xiàn)頻率有高低之分,優(yōu)先將高頻著者首字的號碼區(qū)分開,有利于從整體上控制著者首字的重號規(guī)模。綜上所述,若要評估四角號碼著者號的重號規(guī)模,可以將高頻著者首字集合作為待評估的漢字集合,漢字?jǐn)?shù)量則與兩位數(shù)字的編碼容量一致。
至于高頻著者首字集合該收錄哪些漢字,中文普通圖書的著者類型有多種,除本名外還有筆名、少數(shù)民族名、外文名等,但本名仍是主流,所以本名中的傳統(tǒng)姓氏將是高頻著者首字集合的重要來源。公安部戶政管理研究中心2021年2月發(fā)布的《二〇二〇年全國姓名報告》顯示:按戶籍人口數(shù)量排名,2020年的“百家姓”與2019年相比變化不大;“王”“李”“張”“劉”“陳”依舊名列前五,五大姓氏人口總數(shù)占全國戶籍總?cè)丝诘?0.8%[2]。據(jù)此可以明確以下信息:“百家姓”總體上是穩(wěn)定的;“百家姓”的人口在全國總?cè)丝谥姓急容^高。因此筆者把“百家姓”整體確定為高頻著者首字集合,并對“百家姓”的姓氏取前兩角四角號碼后統(tǒng)計(jì)重號情況,結(jié)果顯示重號最多的是號碼10和44,數(shù)量分別達(dá)到10和11,號碼10對應(yīng)的姓氏有“王”“于”“丁”“石”“賈”“夏”“雷”“萬”“覃”“嚴(yán)”,號碼44對應(yīng)的姓氏有“黃”“趙”“林”“董”“蔡”“蔣”“杜”“蘇”“范”“薛”“莫”,由此可見四角號碼著者號的重號規(guī)模并不小。經(jīng)統(tǒng)計(jì),“百家姓”范圍內(nèi)四角號碼著者號重號率高達(dá)78%,究其原因是一些漢字的偏旁部首常常占用兩個甚至更多角而使得這些漢字的四角號碼喪失了區(qū)分性,所以兩角四角號碼是不足以區(qū)分“百家姓”的,只有通過增加取角的數(shù)量或其他漢字特征才能使“百家姓”進(jìn)一步區(qū)分開來,不過這會導(dǎo)致號碼變得更長,所以四角號碼著者號的重號問題分析到這里似乎陷入了一個兩難的境地。
2 雙拼著者號的設(shè)計(jì)原理
四角號碼著者號的重號問題或者說如何兼顧重號與碼長的問題,不僅困擾著四角號碼著者號,也困擾著其他拼號法著者號,但解決途徑是有的。在計(jì)算機(jī)漢語拼音輸入法中就存在一種雙拼輸入模式,習(xí)慣上稱之為雙拼輸入法,與傳統(tǒng)的全拼輸入模式需要輸入全部拼音(聲母和韻母,通常不包括聲調(diào))的方式不一樣,雙拼輸入法是將所有拼音的聲母和韻母分別映射到鍵盤上的某個字母鍵上,由于輸入時只需按兩下按鍵就能達(dá)到和全拼一樣的效果,所以在輸入效率上雙拼要高于全拼。在區(qū)分卷舌音和平舌音的情況下,漢語拼音中共23個聲母,在雙拼輸入法中,除卷舌音的聲母映射到一些無法用作聲母的字母鍵外,其他聲母都是映射到與之一致的字母鍵上,如圖1智能 ABC雙拼方案所示,聲母zh、ch、sh分別映射到了A、E、V三個鍵上。韻母方面,漢語拼音中共35個韻母,這顯然無法與鍵盤上的26個字母鍵一一映射,在各類雙拼方案中這個問題都是通過對若干韻母編組的方法來解決的,這些雙拼方案并沒有因?yàn)榫幗M了韻母而產(chǎn)生重號,原因是雙拼輸入法的設(shè)計(jì)者在編組若干韻母前已通過統(tǒng)計(jì)手段保證了與這些韻母可相拼的聲母是沒有相同的。以韻母iang和uang為例,與韻母iang可相拼的聲母有n、l、j、q、x,與韻母uang可相拼的聲母有g(shù)、k、h、zh、ch、sh,兩組聲母并無交集,如圖1所示韻母iang和uang都映射到字母鍵T上。
因此,筆者也希望通過參考雙拼輸入法的編組原理來設(shè)計(jì)一種全新的拼號法雙拼著者號,為對標(biāo)四角號碼著者號,雙拼著者號使用兩位數(shù)字對漢語拼音編碼,即一位數(shù)字表示聲母,一位數(shù)字表示韻母,由于數(shù)字相較字母的編碼容量要小得多,不僅韻母與數(shù)字無法一一映射,聲母與數(shù)字也無法一一映射,因此要求聲母和韻母都必須編組。此外,雙拼著者號還兼顧著“百家姓”范圍內(nèi)少重號甚至無重號這一重要目標(biāo),要實(shí)現(xiàn)這個目標(biāo),把“百家姓”引入雙拼著者號設(shè)計(jì)環(huán)節(jié)作為設(shè)計(jì)條件直接干預(yù)聲母和韻母編組是唯一的辦法。循此思路,筆者專門為雙拼著者號設(shè)置了以下兩類條件:一是聲母編組條件,“百家姓”范圍內(nèi)若與兩聲母相拼的韻母不存在相同的,且這些韻母個數(shù)之和小于等于10,則兩聲母可編為一組,漢語拼音中的23個聲母須全部參與編組,共10組;二是韻母編組條件,以完成的聲母編組為參考,“百家姓”范圍內(nèi)若與兩韻母相拼的聲母所在的編組不存在相同的,則兩韻母可編為一組,漢語拼音中的35個韻母須全部參與編組,共10組。
3 雙拼著者號的設(shè)計(jì)過程
首先是對聲母進(jìn)行編組,以聲母c和x為例,“百家姓”范圍內(nèi)與聲母c相拼的韻母有:ao、ai、ui,與聲母x相拼的韻母有:ü、ie、iao、ia、iong、üe、iang,由于這些韻母不存在相同的且這些韻母的個數(shù)之和為10,所以聲母c和x可編為一組。如法炮制,在經(jīng)過大量嘗試后筆者得到了完整的聲母編組,
即{l}、{f,q,b}、{m,w,n}、{d,t}、{zh,j}、{z,g,r}、{ch,h}、{c,x}、{sh,p,k}、{s,y}。至于“百家姓”范圍內(nèi)未出現(xiàn)的聲母n,則可置入任一聲母編組中。值得一提的是,作為符合條件的聲母編組表并不是唯一的,任何符合條件的聲母編組表都可作為候選表進(jìn)入韻母編組階段。
其次是對韻母進(jìn)行編組,以韻母u和üe為例,“百家姓”范圍內(nèi)與韻母u相拼的聲母所在的編組有:{l}、{f,q,b}、{m,w,n}、{d,t}、{zh,j}、{z,g,r}、{ch,h}、{s,y},與韻母üe相拼的聲母所在的編組有{c,x},由于不存在相同的聲母編組,所以韻母u和üe可編為一組。與之前討論過的雙拼輸入法中韻母iang和uang編組的規(guī)律一樣,類似的規(guī)律還存在于iong和ong、ia和ua、un和ün、uan和üan、uai和üe等韻母之間,可以優(yōu)先將這類韻母編為一組,但是過程中應(yīng)注意度的問題,過度運(yùn)用這些規(guī)律會導(dǎo)致韻母編組進(jìn)程受阻以致無法完成最終的編組任務(wù)。同樣在經(jīng)過大量嘗試后筆者最終得到了完整的韻母編組,即{u,üe,uai}、{ong,iong,a}、{iang,uang,uan,üan}、{in,en,ing,ie}、{ü,ian,ou,o}、{iu,ao,er}、{iao,eng,un,ün}、{ai,e,ei}、{uo,ia,an,ua}、{i,ang,ui}
,其間還對“百家姓”范圍內(nèi)未出現(xiàn)的韻母er、ua、uai、ün也做了編配。與聲母編組表類似,作為符合條件的韻母編組表也不是唯一的。
但是,有一種極端情況是依據(jù)所確定的高頻著者首字集合無法找到任何符合條件的聲母編組表,或存在符合條件的聲母編組表但不存在符合條件的韻母編組表,無論哪一種情況都只能在調(diào)整高頻著者首字集合后再次嘗試編組,直至同時找到符合條件的聲母編組表和韻母編組表。在結(jié)合聲母編組和韻母編組并為其統(tǒng)一分配數(shù)字編碼后,雙拼著者號編碼表如表1所示。
此時可對雙拼著者號的基本取號規(guī)則作如下規(guī)定:參照表1分別對著者首字聲母、首字韻母、次字聲母、第三字聲母取號;漢字無聲母的取0;著者不足三字的,缺字部分也取0。應(yīng)用以上取號規(guī)則即可得到一個由四位數(shù)字構(gòu)成的著者號,如張愛玲的著者號為4900,錢鐘書的著者號為1448,冰心的著者號為1370。當(dāng)然,上述取號規(guī)則只針對著者的常見形式,實(shí)際出版物的著者五花八門,但對這類特殊著者如何取號不屬于本文討論的范疇,這里不再展開。
4 對雙拼著者號的評價
與評估四角號碼著者號重號規(guī)模的方式近似,筆者根據(jù)雙拼著者號碼表對“百家姓”中姓氏的聲母、韻母分別進(jìn)行了取號,結(jié)果詳見表2。經(jīng)統(tǒng)計(jì),“百家姓”范圍內(nèi)雙拼著者號的重號率只有25%,遠(yuǎn)低于四角號碼著者號的重號率,由于雙拼著者號是以結(jié)果為導(dǎo)向進(jìn)行編制的,所以其最終的設(shè)計(jì)結(jié)果自然也符合預(yù)期目標(biāo)。優(yōu)勢方面:雙拼著者號依據(jù)漢語全拼來編制著者號碼表,保留了漢字相對完整的拼音特征,從著者的排序效果來看比較直觀,且取號簡單,易于規(guī)范,新生代館員從義務(wù)教育階段就接受漢語拼音教育,無需再開展專門的著者號使用培訓(xùn)。不足方面:“百家姓”范圍內(nèi)仍存在少量重號,如“江”“姜”“蔣”等同音姓氏,但在實(shí)際使用過程中這類重號通常不會對讀者造成大的困擾;其次,由于同音姓氏的存在,結(jié)果中有13個號碼未被使用,這意味著雙拼著者號還有改進(jìn)的空間,可在對包括“百家姓”在內(nèi)的高頻著者首字進(jìn)一步調(diào)查統(tǒng)計(jì)的基礎(chǔ)上,通過適當(dāng)擴(kuò)大高頻著者首字的范圍來使用這些剩余號碼;再次,結(jié)果中還出現(xiàn)了同一聲母編組內(nèi)不同聲母的姓氏混合排列的現(xiàn)象,如表2中從90到99的號碼中,聲母為s和y的姓氏是交替出現(xiàn)的,這是由編組操作伴生而來的,是無法消除的;最后,雙拼著者號的編制目前完全依靠人工完成,自動化編制工具的設(shè)計(jì)將有利于提高雙拼著者號的編制效率,輔助館員在多種可行性方案之間做出更優(yōu)的選擇。
5 結(jié)語
筆者通過借鑒雙拼輸入法的編組原理提出了雙拼著者號的設(shè)想,并用實(shí)例證明了雙拼著者號的設(shè)計(jì)可行性,一定程度上解決了傳統(tǒng)拼號法著者號無法較好兼顧重號的問題。此外,雙拼著者號的價值并不局限于編制出某個具體的雙拼著者號碼表,還在于它提供了一種普適的方法,使得各館可根據(jù)各自館藏文獻(xiàn)的著者情況來確定高頻著者首字集合的收錄內(nèi)容,并結(jié)合自定義的設(shè)計(jì)條件編制出更適合本館的雙拼著者號碼表,甚至可以拓展設(shè)計(jì)范圍,將雙拼著者號的編制方法應(yīng)用于用字同樣相對集中的報刊名號碼表的設(shè)計(jì)中。
參考文獻(xiàn):
[1]張秀芬.淺議著者號與種次號[J].科技情報開發(fā)與經(jīng)濟(jì),2010,20(31):63-65.
[2]公安部戶政管理研究中心.《二○二○年全國姓名報告》發(fā)布[EB/OL].(2021-02-08)[2021-08-22].https://www.mps.gov.cn/n2253534/n2253535/c7725981/content.html.
作者簡介:
陸偉(1980— ),男,大學(xué)本科,助理館員,任職于廣西壯族自治區(qū)柳州市鹿寨縣圖書館。研究方向:圖書流通服務(wù)、館藏發(fā)展、圖書館服務(wù)模式。