張利峰,胡其圖.內蒙古師范大學青年政治學院,內蒙古呼和浩特 0005 .內蒙古社會科學院,內蒙古呼和浩特 0005
蒙古文在線輸入法研究與實現(xiàn)
張利峰1,胡其圖2
1.內蒙古師范大學青年政治學院,內蒙古呼和浩特 010051 2.內蒙古社會科學院,內蒙古呼和浩特 010051
本文闡述了通過蒙古文字體嵌入與Jscript等技術,實現(xiàn)一種蒙古文的在線輸入法的研究與實現(xiàn)方法,目的是想通過這種技術解決在沒有安裝蒙古文字體和輸入法的計算機上實現(xiàn)蒙古文的顯示與錄入等信息處理問題,為廣大蒙古語應用群體提供方便快捷的信息處理手段。
蒙古文;在線;輸入法
隨著互聯(lián)網的迅猛發(fā)展以及上網本等廉價產品的出現(xiàn),家家都能上網的夢想不再遙遠,尤其在城市與經濟發(fā)達的農牧區(qū)基本上家家都有了電腦。內蒙古及其他省份使用蒙古語的地區(qū)也同樣使用電腦,通過互聯(lián)網了解世界。經過近幾年的發(fā)展,蒙古文網站也逐漸多起來,比較典型的“中國蒙古語新聞網”“蒙驛門戶網”及“蒙古包網盟”等。
我們知道在計算機上顯示某種文字,必須有相關語言的字體才可以顯示,所以以上幾個網站都是通過字體嵌入的方式實現(xiàn)了不用下載蒙古文字體便可在任何一臺電腦上顯示蒙文的功能,所以任何人在任何地方都可以不用安裝蒙古文字體便可以查看以上網站。人們在查看網站的同時也出現(xiàn)的發(fā)表自己的觀點、文章或聊天等需求,這就需要有蒙古文輸入法才能實現(xiàn)。目前蒙古文輸入法有很多種,比如可以免費使用的“蒙科立蒙古文輸入法”“賽音蒙古文輸入法”及其他多種輸入法,都實現(xiàn)了蒙古文的輸入功能,但是他們的共同點就是必須安裝到本地計算機上才可以實現(xiàn)蒙古文的輸入法。這就對互聯(lián)網用戶帶來許多麻煩,因為這些用戶有可能在家里上網,有可能上單位上網,或者去網吧上網,這些電腦上未必安裝有蒙古文輸入法,此時必須手工安裝蒙古文輸入法。但是有些單位或網吧管理員為了維護方便或怕電腦被感染病毒等原因,拒絕其他用戶自行安裝軟件,還有一些用戶對計算機操作不熟練,對下載和安裝蒙古文輸入法等操作一竅不通,這就給應用帶來了許多問題。所以人們更喜歡使用不需要下載,也不需要安裝的蒙古文輸入法。本文中闡述的方法就可以解決以上問題。
有人可能也會說Windows VISTA已經包含了蒙古文字體和輸入法,所以沒有必要研究嵌入式字體和在線輸入法。其實這種想法是錯誤的,因為第一,VISTA系統(tǒng)目前還沒有普及,雖然有了替代產品Windows7,但是還沒有上市,即便是上市了,離普及還有一段時間,普通用戶是否喜歡還是個未知數(shù);第二,VISTA上使用的蒙古文編碼與目前公開的蒙古文網站編碼不同,互相之間不兼容;第三,目前不管是個人還是團體開發(fā)的蒙古文網站都是基于蒙科立或賽音的TrueType字體實現(xiàn)的,要將如此之多的網站轉到VISTA兼容格式需要很大的投入,很多人沒有精力和財力去完成,而且VISTA上提供的輸入法比較單一,輸入非常不方便,很多人都不喜歡使用他。所以,以目前的情況來看,要將當前的所有蒙古文網站轉到Vista上的蒙古文編碼格式還需要很長一段時間。這就要求我們繼續(xù)維護當前的編碼方式下的蒙古文網站,并且要對他進行更多的功能擴充和豐富應用。
1.1字體嵌入技術
這里指的字體嵌入技術指的是在網頁瀏覽器里嵌入蒙古文字體的技術。此技術一般應用在本地計算機沒有蒙文字體時需要顯示蒙文的環(huán)境。目前互聯(lián)網上公開的網站一般都是用這種技術實現(xiàn)蒙文的顯示功能,所以客戶瀏覽這些網站時無需下載蒙文字體便可瀏覽網站的所有內容。這種技術的出現(xiàn)也緩解了目前通用的計算機操作系統(tǒng)沒有預裝蒙文字體的問題,對蒙古文網站的建設和推廣也做出一定的積極貢獻。
在網頁瀏覽器里嵌入字體技術是由微軟公司實現(xiàn),我們只要使用微軟公司提供的Microsoft Web Embedding Font Tool工具,將現(xiàn)有的TrueType字體轉換一下就可以了。具體轉換方法在網上有很多資料,感興趣的朋友可以上網查看。
目前,在流行的網頁瀏覽器中,支持網頁嵌入式字體的只有Windows Internet Explore,其他瀏覽器尚不支持,所以對應用上帶了一點不便之處,但是并不影響從多數(shù)用戶,因為目前許多人還是在使用微軟的操作系統(tǒng)及瀏覽器。
1.2豎排顯示
由于蒙古文的書寫是需要豎排的,所以網頁瀏覽器需要支持豎排顯示才可以。微軟Internet Explore通過支持CSS的writing-mode實現(xiàn)豎排顯示功能,達到了基本的蒙古文顯示功能。但是微軟當初實現(xiàn)豎排功能可能是針對漢文或日文,所以只支持從右到左的排列功能,而蒙古文正好跟這個相反,需要從左到右顯示。
目前的解決方法有兩種,一種是對每行字后面加回車換行符,然后再倒序后輸出。目前各蒙古文類網站都是使用這種方法實現(xiàn)的。這種解決方法的缺點也是顯而易見的:1)必須為每行字加一個回車換行符;2)將每行字反序后才可以正常顯示;3)換行的兩個字不連貫,對查詢帶來一定的問題。第二種方法是使用CSS的濾鏡功能,將豎排從右到左的文本倒過來,就可以從左到右顯示蒙文了,但是文字也跟著反了,所以需要開發(fā)反向的字體,以滿足蒙古文的正常顯示需求。這種方法使用的較少,可能是因為比較麻煩,而且使用濾鏡可能會影響速度。
圖1是使用第一種方法實現(xiàn)的蒙古文新聞網站。
圖1
1.3輸入規(guī)則與算法
輸入法的規(guī)則和算法是基于蒙科立公司的音碼輸入法,目前此輸入法的安裝版已經公開,任何人都可以免費下載使用,下載地址為http∶//reg.ulaaq.com。此輸入法的特點為比較成熟,輸入方法比較智能,能夠自動識別出陰陽字,的、特等字型變化可以自動算出,使用非常方便。
要實現(xiàn)在線輸入法就要依靠Jscript,因為他可以寫簡單的JAVA代碼,并且可以實現(xiàn)客戶端自動下載功能,而客戶并不知道下載和后臺所做的所有事情,客戶只要正常錄入就可以了。雖然只提供簡單的JAVA語言功能,但是對于編寫在線輸入法是綽綽有余了,只要輸入法的算法的規(guī)則定下,任何類型的或復雜的輸入法都可以實現(xiàn)。
測試地址為:http∶//www.noruu.com/menk_test. html。以下是使用在線輸入法的應用截圖。
從圖2中可以看出輸入法已經嵌入到網頁中,并且靠窗口右側懸停,很像windows系統(tǒng)提供的輸入法。
圖2
由于網頁上豎排顯示文本和字體嵌入技術只有IE5.5上及版本的瀏覽器才支持,而Linux等操作系統(tǒng)上流行的mozilla firfox等瀏覽器并不支持,所以以上技術只能在Windows下的IE瀏覽器里才適用。好在目前微軟的操作系統(tǒng)及瀏覽器占據著非常大的市場份額,所以對用戶的體驗與使用上不會有什么大的影響。如果想完美地解決蒙古文顯示問題還需要修改以上瀏覽器的底層功能,比如在Firfox瀏覽器里直接嵌入字體等,但是這需要更多的努力。
[1]李海柱.蒙古文網頁中字體嵌入和文字豎排研究[J].內蒙古師范大學學報:自然科學漢文版,2005(34):1.
[2]費拉納提.JavaScript權威指南[M].5版.北京:機械工業(yè)出版社,2007.
[3]確精扎布.蒙古文編碼國際標準[M].呼和浩特:內蒙古大學出版社,2001.
TP3
A
1674-6708(2016)170-0084-02
本論文獲得2014年度內蒙古自治區(qū)高等學??茖W研究項目《面向蒙語授課班學生英語學習的英蒙機器翻譯平臺基礎研究》的支持,項目編號:NJZY14238;本論文獲得2016年度內蒙古自治區(qū)蒙古語言文字科研資助項目《蒙漢文牌匾翻譯標準與規(guī)范化網絡平臺研究》的支持,項目編號:MW-YB-2016025。
張利峰,內蒙古師范大學青年政治學院。胡其圖,內蒙古社會科學院。