袁莉 蔡文霞 李愛華
【摘 要】漢字信息提取技術(shù)是寫字機器人中的關(guān)鍵技術(shù)之一,機器人能夠?qū)懗鰷蚀_美觀的文字的基礎(chǔ)是必須要有正確的文字信息輸入。本文闡述了三種文字識別技術(shù):字庫提取技術(shù)、機器視覺文字提取技術(shù)和模仿學習提取漢字信息技術(shù),介紹了它們的關(guān)鍵技術(shù)點及實現(xiàn)方法,最后展望了書寫機器人及漢字識別提取技術(shù)的發(fā)展方向。
【關(guān)鍵詞】書寫機器人;模仿學習;機器識別
漢字文化博大精深,經(jīng)過6000多年的變化,漢字數(shù)量達8萬之多,標準的書法字體有甲骨文、金文、小篆、隸書、楷書、行書等等,因此,漢字的書寫不同于英文的書寫,其書寫更為復雜,更為講究,筆劃、筆順、用筆力度、停頓等都是書寫時要注意的問題,寫字機器人要寫出結(jié)構(gòu)美觀的漢字,首先要獲取準確的漢字信息。機器人漢字信息提取主要有三種途徑:已有字庫、機器視覺和智能模仿學習。在信息提取的過程中,涉及多種技術(shù)和方法,本文對機器人漢字信息提取技術(shù)做了全面分析研究,并展望智能機器人中漢字提取技術(shù)的發(fā)展趨勢。
1 字庫漢字信息提取技術(shù)
書寫機器人從現(xiàn)有字庫中獲取漢字信息,對其進行再現(xiàn)書寫。字庫一般選取文字矢量文件或矢量信息,如AutoCAD公司的.shx文件和早期的UCDOS漢字矢量庫,現(xiàn)在使用較廣泛的是Windows平臺下的TrueTypeFont矢量字庫,TTF字庫是Microsoft公司和Apple公司共同推出的一種輪廓字體。TTF是一種矢量字體,它用一系列點構(gòu)造字型輪廓,在此基礎(chǔ)上用一系列指令調(diào)節(jié),使輪廓線變的平滑,可以得到良好的顯示效果。一個字符由一系列閉合輪廓線組成,每條閉合輪廓對應(yīng)一個TTPOLYGONHEADER數(shù)據(jù)結(jié)構(gòu),而一條輪廓包含至少一條曲線(包括折線和二次樣條),曲線由TTPOLYCURVE數(shù)據(jù)結(jié)構(gòu)定義。利用Win32的API函數(shù)GetGlyphOutline()提取所需漢字的輪廓線數(shù)據(jù)或位圖數(shù)據(jù),通過編程把TTPOLYGONHEADER結(jié)構(gòu)中POINTFX形式的點坐標轉(zhuǎn)換為Cpoint坐標,分離出組成輪廓線的各條折線和Bezier曲線。將漢字輪廓線數(shù)據(jù)中點坐標保存在一個數(shù)組中,用于控制寫字機器人的筆尖移動軌跡控制。
如果寫字機器人要求書寫的漢字尺寸很小,書寫雙線字效果不好,這時就需要繪制單線字。單線字繪制一般選取點陣字庫,文字提取主要采用輪廓提取和輪廓跟蹤技術(shù)。用“0”和“1”分別表示無筆劃和有筆劃,將漢字點陣信息形成字符矩陣,從筆劃的始點出發(fā),在其8個相鄰點中選定跟蹤方向,在此方向上連續(xù)跟蹤,直到?jīng)]有后繼點為止。
2 機器視覺提取文字信息技術(shù)
機器視覺提取文字信息技術(shù)可以使機器人靈活的寫出任意字體的漢字。將任意字體的漢字放在攝像頭下,攝像頭將拍攝的圖像傳送到計算機,計算機處理圖像得到文字的坐標文件。計算機接收到圖像后,首先要對圖像進行去除噪聲、傾斜校正、閾值化運算、行列切分、閉運算、細化運算和去毛刺處理,將圖像處理成黑白的二值圖像,而且要輪廓光滑,突出漢字骨架。然后進行提取文字筆劃工作,提取筆劃的最大難點是鏡頭下的漢字的不可預測性及隨意性,尤其手寫連筆漢字。一條連續(xù)曲線對應(yīng)一個筆劃,把漢字進行連通域的劃分處理,然后按照先左后右、先上后下的順序在每個連通域內(nèi)提取筆劃保存筆劃坐標,按照1中提到的輪廓跟蹤方法確定筆順。
3智能模仿漢字書寫技術(shù)
我們讓機器人書寫一個漢字,我們稍微示范一下,機器人就能學會!一旦機器人具備這樣的模仿學習能力,機器人就擁有了類似人類的模仿學習能力,智能機器人通過自主學習獲得具有切實的類人的智能行為能力,這是機器人的終極理想狀態(tài)。寫字機器人模仿學習主要是通過人手牽引,與機械手臂相互協(xié)作使之獲取相應(yīng)漢字信息,最終實現(xiàn)書寫。Toru Tsumugiw提出了一種基于延時定位的人機交互的可變阻抗的控制方法[4],由壓力傳感器實時獲取操作者手臂前端的力度,使機器人末端傳感器實時獲取壓力和位置數(shù)據(jù),實時獲取壓力與位置數(shù)據(jù),使人機協(xié)作系統(tǒng)更加穩(wěn)定。Andre Lemme[5] 以人形機器人iCub為平臺,構(gòu)建了一個運動基元庫,通過人類的引導能夠自監(jiān)督地從復雜軌跡中感知并學習運動基元,學會相應(yīng)的軌跡動作,并能使用復雜的手寫軌跡進行評價。
另一種模仿學習的方式就是通過觀察和模仿人類,獲取對應(yīng)的漢字信息并進行漢字的書寫。例如V. Mohan等人[6] 以嬰兒人型機器人iCub 為平臺,通過綜合系統(tǒng)學習繪制從簡單到復雜的形狀圖案,即通過觀察示范者的動作,特別是示范者末端執(zhí)行器的軌跡,來學習模仿示范者的動作。在此基礎(chǔ)上,也有研究者通過觀察人的手勢來實現(xiàn)機器人手臂的書寫。通過運動傳感器輸入設(shè)備實時捕捉示范者的手勢軌跡,采用簡化的分類集成器識別人體不同的動作手勢,來控制機械臂書寫不同的筆畫,最終實現(xiàn)整個漢字的書寫。
4 結(jié)束語
目前寫字機器人漢字信息提取技術(shù)主要是字庫提取和機器視覺提取,模仿學習技術(shù)還不是很成熟,寫字機器人的應(yīng)用面也比較窄。隨著計算機技術(shù)、圖像處理技術(shù)、傳感器技術(shù)和人工智能技術(shù)的不斷發(fā)展,寫字機器人必將從只能重復單一工作發(fā)展為像人類一樣能模仿學習,并能隨著經(jīng)驗的積累自動提高性能,甚至可以自我創(chuàng)作書法。強調(diào)機器人的自主學習方式,研制能夠使人類的生產(chǎn)生活發(fā)生深刻變革的具備“通用智能”的機器人,無疑是機器人未來的發(fā)展方向。
參考文獻:
[1]何薇,錢增磊 等.基于機器視覺的機器人寫字技術(shù)的設(shè)計[J].江南大學學報(自然科學版).2011,10(5):513-516
[2]曾華琳,黃雨軒,晁飛,周昌樂.書寫機器人研究綜述[J].智能系統(tǒng)學報,2016,11(1):16-26..
[3]王光建,梁錫昌.寫字機器人的文字矢量化及應(yīng)用[J].現(xiàn)代制造工程,2004(7):40-42.
[4]TSUMUGIWA T,YOKOGAWA R,KHARA R.Variable impedance control based on estimation of human arm stiff-ness for human-robot cooperative calligraphic task[C]//Proceedings of IEEE International Conference on Robotics and Automation.Washington,DC,USA,2002:644-650
[5]LEMME A,REINHART R F,STEIL.J.J.Self-super Vised bootstrapping of a movement primitive library from complex trajectories[C]//Proceedings of the 14th IEEE-RAS International Conference on Humanoid Robots(Humanoids).Madrid,2014:726-732.
[6]MOHAN V,MORASSO P,ZENZERI J,etal.Teaching a humanoid robot to draw’Shapes’[J].Autonomousrobots,2011,31(1):21-53.
(作者單位:1石家莊學院機電學院;2陸軍工程大學無人機工程系)