白喜文,金 良
(1.內(nèi)蒙古師范大學(xué)科學(xué)技術(shù)史研究院,內(nèi)蒙古呼和浩特010022;2.內(nèi)蒙古師范大學(xué)網(wǎng)絡(luò)技術(shù)學(xué)院,內(nèi)蒙古呼和浩特010022;3.內(nèi)蒙古師范大學(xué)科技處,內(nèi)蒙古呼和浩特010022;)
中國蒙古文信息處理技術(shù)發(fā)展歷程
白喜文1,2,金 良3
(1.內(nèi)蒙古師范大學(xué)科學(xué)技術(shù)史研究院,內(nèi)蒙古呼和浩特010022;2.內(nèi)蒙古師范大學(xué)網(wǎng)絡(luò)技術(shù)學(xué)院,內(nèi)蒙古呼和浩特010022;3.內(nèi)蒙古師范大學(xué)科技處,內(nèi)蒙古呼和浩特010022;)
從國內(nèi)外蒙古文信息處理現(xiàn)狀、蒙古文國際標(biāo)準(zhǔn)與字庫、蒙古文信息處理關(guān)鍵技術(shù)等幾個(gè)方面簡述了蒙古文信息處理技術(shù)發(fā)展歷程,并對(duì)蒙古文信息處理應(yīng)用價(jià)值及存在的問題進(jìn)行了分析,希望以此可以為推進(jìn)蒙古文信息處理工作提供良好的參考作用。
蒙古文;信息處理技術(shù);發(fā)展歷程
在信息處理領(lǐng)域中,最重要的應(yīng)用之一就是進(jìn)行文字處理。自20世紀(jì)40年代計(jì)算機(jī)誕生伊始,特別是60年代商用機(jī)研制成功后,語言文字的信息化便成為了計(jì)算機(jī)的重要作用之一。目前,以各種形式研究開發(fā)的文字處理軟件日新月異。英語等字母文字很容易輸入進(jìn)計(jì)算機(jī),但是諸如漢字等字型文字,由于字?jǐn)?shù)多、筆畫繁難,很難按照字母文字的方式輸入進(jìn)計(jì)算機(jī)。
中國的文字處理技術(shù)雖然起步較晚,但舉全國之力,歷時(shí)40年的努力,中文信息處理工作的研制水平在一定程度上已經(jīng)趕上或超過發(fā)達(dá)國家。不過,另一方面,由于我國是一個(gè)由多民族組成的國家,每個(gè)民族都有著燦爛的歷史文化遺產(chǎn),很多民族都形成了獨(dú)具特色的民族語言文字。這些民族語言文字是本民族文化的載體,傳承和弘揚(yáng)著民族文化。所以,對(duì)民族語言文字進(jìn)行信息化處理,是擺在國家、社會(huì)、研究單位面前亟待解決的問題。
蒙古語文字具有悠久的歷史。在上千年發(fā)展演變過程中前后出現(xiàn)六種不同形式的文字蒙古文、回鶻文、托忒蒙古文、巴思巴蒙古文、新蒙古文、布里亞特文?,F(xiàn)行蒙古語言文字尚有三種,分別是常用蒙古文、托忒蒙古文和新蒙古文。常用蒙古文也稱舊蒙古文或老蒙古文,是從古回鶻文經(jīng)回鶻式蒙古文逐漸演變而來的一種拼音文字,主要通行于內(nèi)蒙古自治區(qū);托忒蒙古文是在舊蒙古文基礎(chǔ)上改制而成的拼音文字,主要通行于新疆維吾爾自治區(qū)的蒙古族地區(qū);新蒙古文也稱斯拉夫蒙古文或基里爾字蒙古文,是在俄文基礎(chǔ)上改制而成的,主要通行于蒙古人民共和國。
蒙古文有34個(gè)基本字母,其中7個(gè)為元音字母,其它為輔音字母。其書寫規(guī)則和語法結(jié)構(gòu)又極為特殊,不同與一般的文字。例如:它分為名義字符和顯現(xiàn)字符,名義字符在書寫時(shí)根據(jù)其所在的位置和前后連接字符的不同而不同,這就是它對(duì)應(yīng)顯現(xiàn)字符。每個(gè)字母在詞首、詞中、詞尾出現(xiàn)時(shí),其書寫形式均有變化,而且“音”和“形”不是一一對(duì)應(yīng)的。蒙古文字在書寫時(shí),是自上而下、自左至右。蒙古文字還大量存在著“一字多形,多字同形”的現(xiàn)象。蒙古語屬黏著性語言,其構(gòu)詞、構(gòu)形都是通過在詞干后綴接不同的詞尾而實(shí)現(xiàn)的,其中蒙古語的構(gòu)形法更為復(fù)雜。動(dòng)詞詞干直接綴接動(dòng)詞的陳述式、祈使式、形動(dòng)詞、副動(dòng)詞等33個(gè)結(jié)尾形式后綴。動(dòng)詞還有態(tài)的變化,因詞尾的陰、陽性變化,這樣使一個(gè)動(dòng)詞語法形態(tài)變化至少可以有1710個(gè)選擇[1]。因蒙古語文字、語法結(jié)構(gòu)的復(fù)雜性,這使得蒙古文信息處理工作,尤其是詞、句、篇章處理工作比一般文字的信息處理工作需付更多的艱辛和努力。所以,對(duì)蒙古文信息進(jìn)行計(jì)算機(jī)處理,是一項(xiàng)具有很強(qiáng)創(chuàng)新性的科研工作。
國外從事蒙古文信息處理系統(tǒng)研究開發(fā)工作的有美國、匈牙利、德國、俄羅斯及日本等國,主要的研究領(lǐng)域是蒙文字形、操作系統(tǒng)、多國語言字處理軟件和印刷出版系統(tǒng)等。另外,世界各地阿爾太語系學(xué)者也提供蒙文字形。Gamma Production公司作為Unicode的實(shí)現(xiàn)者,以開發(fā)多文種字處理或文本編輯軟件著名,其開發(fā)的用于Windows的Universe是一個(gè)完備的、遵循Unicode的多文種字處理系統(tǒng)及字形系統(tǒng),適用于世界上的175種語言,甚至對(duì)含有聯(lián)體字(Ligatures)及重迭(Overstrikes)的最復(fù)雜的語言文字都很容易書寫編排,它能與任何語言文字的組合混用及匹配,并通過一次掃描就可實(shí)現(xiàn)多文種的拼寫校對(duì)。該公司的DOS版MutiLingual Scholar軟件和 Windows 3.1下使用的 Universe、Unitype軟件可處理蒙文,也可處理其它少數(shù)民族的文字,是使用比較方便的軟件之一[2]。
從上世紀(jì)70年代末至80年代末,中國蒙古語信息處理專家不斷向國內(nèi)外信息處理專家學(xué)習(xí),嘗試如何將蒙古語言文字輸入到計(jì)算機(jī)中,初步實(shí)現(xiàn)了信息處理的打印、出版等主要功能。從80年代開始,國內(nèi)外有不少專家為研制蒙古文應(yīng)用系統(tǒng),做了一些探索性的工作。1983年,內(nèi)蒙古大學(xué)蒙古語文研究所與內(nèi)蒙古計(jì)算中心合作將《蒙古秘史》錄入到計(jì)算機(jī)中,并匹配了一套檢索系統(tǒng),實(shí)現(xiàn)檢索和統(tǒng)計(jì)功能,這一事件被公認(rèn)為蒙古文信息處理的開端。當(dāng)時(shí)沒有蒙古文編碼方案,以內(nèi)蒙古大學(xué)確精扎布教授為代表的學(xué)者們研制了通過拉?。ㄓ⒄Z拼音)轉(zhuǎn)寫方式,即把蒙古文相應(yīng)字母與拉丁字母對(duì)應(yīng)起來,并賦予部分ASCII碼特殊意義,解決蒙古文一音多形,一形多音問題,實(shí)現(xiàn)了拉丁轉(zhuǎn)寫文件與源文件的可還原。
上世紀(jì)80年代末,內(nèi)蒙古計(jì)算機(jī)中心在IBMPC機(jī)及其兼容機(jī)上,以CC-DOS2.1為基礎(chǔ)研制開發(fā)了英漢蒙混合DOS系統(tǒng)。該系統(tǒng)主要以蒙古文字為處理對(duì)象,在保留CC-DOS各種輸入/輸出方式(界面圖)的基礎(chǔ)上,為用戶提供了老蒙古文和斯拉夫蒙古文的輸入、輸出,包括鍵盤輸入、顯示、打印機(jī)打印三個(gè)模塊。老蒙古文編碼有一字節(jié)和二字碼,占用中文異形國標(biāo)碼的F8區(qū)的94個(gè)碼。斯拉夫蒙文與俄文共享F7區(qū)的70個(gè)碼。系統(tǒng)中根據(jù)字模厚度劃分為8×16,16×16,24×16三種規(guī)格(后來該方案被國家標(biāo)準(zhǔn)化管理委員會(huì)批準(zhǔn)為國家標(biāo)準(zhǔn),即GB8045-87,GB8046-87),解決了因字符高低不同,與傳統(tǒng)印刷文字有別的難題。但該系統(tǒng)編碼方案中碼長不致,有一、二、三字節(jié)三種長度。并沒有解決蒙古文的豎向顯示問題。
1986年內(nèi)蒙古電子計(jì)算中心與中國航空測(cè)試技術(shù)公司合作,研制開發(fā)蒙古文字處理軟件和精密照排系統(tǒng)。1987年,內(nèi)蒙古電子計(jì)算中心的嘎日迪等人完成了《信息處理交換用蒙古文七位和八位編碼圖形字符集》(GB8045-87)、《信息處理交換用蒙古文字符集的字母區(qū)布局》GB8046-87、《信息處理交換用蒙古文16×12,16×18,16×4點(diǎn)陣字模集和數(shù)據(jù)集》BG7422.1-2-87、《信息處理交換用蒙古文24點(diǎn)陣字模集和數(shù)據(jù)集》等國家標(biāo)準(zhǔn)研制工具,這些國家標(biāo)準(zhǔn)是我國少數(shù)民族語言文字信息化過程中的第一個(gè)國家標(biāo)準(zhǔn),為加快了蒙古文字標(biāo)準(zhǔn)化、信息化步伐奠定基礎(chǔ)。
蒙古文信息處理技術(shù)一開始的研究工作就與服務(wù)社會(huì)相聯(lián)系。上世紀(jì)80年代,蒙古文信息處理技術(shù)剛剛起步,內(nèi)蒙古經(jīng)濟(jì)信息中心就制定了“王安VS-80計(jì)算機(jī)蒙古文信息處理系統(tǒng)”的研究計(jì)劃,目的是在王安VS-80電子計(jì)算機(jī)上研制實(shí)現(xiàn)蒙文字符編碼、蒙文字模庫生成(可在計(jì)算機(jī)上顯示、打印6種大小不同的蒙文字體)及配套的蒙文處理計(jì)算機(jī)系統(tǒng)工作軟件(包括蒙文編碼錄入、存儲(chǔ)、顯示、打印等支持軟件)的成功開發(fā),使之成為可在計(jì)算機(jī)上存儲(chǔ)、顯示、打印、處理蒙文字型的計(jì)算機(jī)系統(tǒng)之一。研究取得成功之后,即為內(nèi)蒙古教育出版社成功完成了蒙文小學(xué)、中學(xué)、高中課本的蒙文字詞錄入、詞頻統(tǒng)計(jì)工作,得到了很高的評(píng)價(jià)?!度嗣袢?qǐng)?bào)》、《內(nèi)蒙古日?qǐng)?bào)》、中央國際廣播電臺(tái)等媒體曾作相關(guān)報(bào)道。
當(dāng)時(shí),內(nèi)蒙古圖書館為了在蒙古文圖書目錄管理和檢索工作中應(yīng)用電子計(jì)算機(jī),實(shí)現(xiàn)圖書館蒙古文圖書管理和服務(wù)工作的自動(dòng)化,與內(nèi)蒙古計(jì)算中心蒙文室聯(lián)合進(jìn)行“微機(jī)蒙古文圖書目錄管理系統(tǒng)”的研制,最終設(shè)計(jì)出該系統(tǒng)具有6種功能,含有15項(xiàng)著錄內(nèi)容,功能齊全,能較全面地反映圖書館蒙古文圖書目錄的特征。由于該系統(tǒng)采用了《蒙古文文獻(xiàn)著錄規(guī)則》的格式,符合標(biāo)準(zhǔn)化方向,通用性很強(qiáng)。同時(shí),研究人員將人機(jī)對(duì)話方式嵌入系統(tǒng)中,為借閱者提供了較詳細(xì)的檢索規(guī)則和提示信息,使得整個(gè)系統(tǒng)操作簡便,易于掌握和推廣。該系統(tǒng)經(jīng)過試用,證明效果良好,較大地提高工作效率和服務(wù)效果,受到圖書情報(bào)界同行的好評(píng)[3]。
內(nèi)蒙古自治區(qū)電子計(jì)算中心還研制了蒙醫(yī)專家系統(tǒng)。該系統(tǒng)可實(shí)現(xiàn):問診、記錄、建立患者病歷卡、病案記錄、診斷、開處方、藥價(jià)計(jì)算、給患者的忠告等功能;研制了蒙文圖書的管理系統(tǒng)。設(shè)計(jì)實(shí)現(xiàn)建立目錄、修改目錄、刪除目錄、顯示目錄、查找最大種次號(hào)以及目錄檢索等功能。內(nèi)蒙古師范大學(xué)計(jì)算機(jī)系完成了國家教委下達(dá)的科研課題“蒙漢雙語多媒體計(jì)算機(jī)教學(xué)軟件研究”。設(shè)計(jì)出的教學(xué)軟件包括蒙漢、漢蒙的詞匯與句型詞典方式的雙向精確及模糊翻譯功能;蒙漢、漢蒙的詞正、句型雙向翻譯的鞏固學(xué)習(xí)的功能;蒙漢雙語的詞匯庫及句型庫的維護(hù)功能;可給學(xué)生講新課的功能以及對(duì)新詞條、句型、雙語資料卡片打印功能。該軟件的研制成功完全改變了過去傳統(tǒng)的蒙漢文教學(xué)方法,與計(jì)算機(jī)和投影儀等現(xiàn)代化的教學(xué)設(shè)備相連,實(shí)現(xiàn)了電子演示教學(xué)方法,減輕了教師的勞動(dòng)強(qiáng)度,增加了學(xué)生的學(xué)習(xí)興趣,改善了教學(xué)環(huán)境和教學(xué)效果。同時(shí)也為將來的遠(yuǎn)程教學(xué)提供了可能。該項(xiàng)目的光盤軟件可以作為家庭輔助教學(xué)軟件。可以不受時(shí)間、地點(diǎn)的約束,隨時(shí)幫助學(xué)生掌握課本內(nèi)容[4]。
總之,經(jīng)過蒙古學(xué)和信息處理專家近30年的努力,蒙古文信息處理技術(shù)已取得了一系列的成績,廣泛地應(yīng)用于辦公自動(dòng)化、電子政務(wù)、新聞出版、文字識(shí)別、圖像處理、語音識(shí)別、機(jī)器翻譯、三語教學(xué)等眾多領(lǐng)域,真正使蒙古文出版、印刷業(yè)告別了鉛與火的時(shí)代。為蒙古族的各項(xiàng)文化事業(yè)的發(fā)展提供了技術(shù)保障。
通過對(duì)蒙古文信息處理技術(shù)發(fā)展歷程的介紹,可以看出:自從上世紀(jì)80年代蒙古文信息處理技術(shù)興起以來,中國迅速地建立起了自己的技術(shù)方法與發(fā)展路徑,成果十分明顯。從蒙古文信息處理技術(shù)整體發(fā)展脈絡(luò)來看,必然存在一些曲折,現(xiàn)有的技術(shù)成果也是成效各異,但都對(duì)國家、自治區(qū)的蒙古文信息處理技術(shù)發(fā)展先后起到了關(guān)鍵性的作用,促進(jìn)了蒙古族文化的發(fā)展。
蒙古文信息處理技術(shù)取得如此巨大的成績,影響因素主要在以下幾個(gè)方面:
1)各級(jí)政府大力扶植,并創(chuàng)造了良好的研究環(huán)境,提供了充足的資金支持。包括國家高新技術(shù)863計(jì)劃、國家自然科學(xué)基金項(xiàng)目、國家社會(huì)科學(xué)基金、內(nèi)蒙古自然科學(xué)基金等各級(jí)各類科研專項(xiàng)基金都給予涉及蒙古文信息處理技術(shù)的科研項(xiàng)目與基金支持。國家教委、國家質(zhì)量技術(shù)監(jiān)督局、科技部等國務(wù)院相關(guān)部委也設(shè)立科研項(xiàng)目給予蒙古文信息處理技術(shù)資金支持。
2)政府對(duì)蒙古文信息處理技術(shù)所取得的成果給予榮譽(yù)、獎(jiǎng)勵(lì),促使科研人員積極主動(dòng)進(jìn)行相關(guān)研究。如“蒙古文三項(xiàng)國家標(biāo)準(zhǔn)的制訂造”獲國家科技進(jìn)步三等獎(jiǎng),“MHJ-1型蒙古語言分析軟件包”獲內(nèi)蒙古自治區(qū)科技進(jìn)步二等獎(jiǎng),“微機(jī)蒙古文圖書目錄管理系統(tǒng)”獲中華人民共和國文化部科技成果四等獎(jiǎng)等。
3)開放的學(xué)術(shù)、科研研究環(huán)境,造就了一大批從事蒙古文信息處理技術(shù)的研究團(tuán)隊(duì)。內(nèi)蒙古高校、科研院所、企業(yè)等各類機(jī)構(gòu)廣泛參與蒙古文信息處理技術(shù)的研制與推廣行動(dòng)中,促使蒙古文信息處理技術(shù)得到全面、快速的發(fā)展。
相信這些因素也是未來蒙古文信息處理技術(shù)得以持續(xù)發(fā)展完善的重要?jiǎng)恿Α?/p>
[1]確精扎布.蒙古文國際標(biāo)準(zhǔn)編碼通過以后研制的幾種蒙古文錄入系統(tǒng)比較[A].中國中文信息學(xué)會(huì).第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會(huì)論文集[C].2005:132-139.
[2]巴力登.蒙文信息處理國內(nèi)外研究動(dòng)態(tài)[J].計(jì)算機(jī)世界報(bào),1997(11):43-49.
[3]嘎日迪,吉日木圖,賽音,等.我國蒙文信息處理技術(shù)的研究開發(fā)[J].計(jì)算機(jī)世界報(bào),1995(45):35.
[4]趙小兵,林民,嘎日迪,等.蒙漢雙語電化教學(xué)軟件研究[J].計(jì)算機(jī)應(yīng)用研究,2002(3):21-22.
〔責(zé)任編輯 李 ?!?/p>
Analysis on the Development History of M ongolian language Information Processing Technology in China
BAIXi-wen1,2,JIN Liang3
(1.Instituteof Historyof Science and Technology,InnerMongolianNormalUniversity,Hohhot InnerMongolian,010022;2.College of Network Technology,Inner Mongolian Normal University,Hohhot Inner Mongolian,010022;3.Science and Technology Department,InnerMongolian Normal University,Hohhot Inner Mongolian,010022)
This paper is based on the present Mongolian information processing situation at home and abroad,Mongolian international standard and font libraries,key technology and the development of research team and so on,to introduce development of Mongolian information technology and analysis its processing technology application value the existing problems.Hopefully,this paper can offer some good suggestions for referencesMongolian information processingwork in the future.
mongolian;information processing technique;development
R235.3+4
A
1674-0874(2012)04-0093-04