• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于標(biāo)注點分析字體結(jié)構(gòu)與系統(tǒng)設(shè)計*

      2022-12-10 06:55:10律睿慜
      傳感器與微系統(tǒng) 2022年12期
      關(guān)鍵詞:關(guān)鍵點字體筆畫

      律睿慜,席 旭

      (江南大學(xué) 人工智能與計算機學(xué)院,江蘇 無錫 214122)

      0 引 言

      中國書法是一門古老的研究學(xué)科,是對字體書寫和形式美學(xué)的研究。近年來,隨著書法學(xué)習(xí)人群的增加,書法這類的藝術(shù)受到了更多的重視,也成為了計算機藝術(shù)[1]的研究內(nèi)容。而利用人工智能(artificial intelligence,AI)技術(shù)創(chuàng)作書畫藝術(shù)等研究的興起,推動了書法與科技的結(jié)合,如機器創(chuàng)作書法、手寫漢字識別[2,3]等應(yīng)用的出現(xiàn)。為了更好地促進書法與技術(shù)的結(jié)合,推動其發(fā)展,有必要探索新方法研究書法藝術(shù)。其中,結(jié)構(gòu)作為書法三要素之一,分析結(jié)構(gòu)一直是書體研究的重點。但以往研究主要是根據(jù)對書法家及作品的經(jīng)典個案分析總結(jié)書法特征;如石璐對魏晉女書法家[4]的研究,蔡顯良分析王羲之對中唐書法的影響[5],高聿加對趙孟頫書法的解析[6]等。盡管能有效分析出書法特點,但對書法的量化研究不足。

      針對上述問題,本文根據(jù)人文計算的理念,提出一種基于結(jié)構(gòu)關(guān)鍵點研究楷書結(jié)構(gòu)的方法,并參考機器學(xué)習(xí)領(lǐng)域的數(shù)據(jù)標(biāo)注工具設(shè)計了一種用于字體圖像標(biāo)記的軟件系統(tǒng)。利用開發(fā)的圖像標(biāo)注系統(tǒng),通過被試者標(biāo)注實驗采集到不同書體的關(guān)鍵點位置坐標(biāo)。篩選實驗數(shù)據(jù),再通過有效的標(biāo)注數(shù)據(jù)計算字體結(jié)構(gòu)的關(guān)鍵要素,以分析書體的結(jié)構(gòu)特征。

      1 方法與工作

      1.1 結(jié)構(gòu)量化方法

      隨著信息技術(shù)的發(fā)展,數(shù)字人文[7]這一計算機和人文學(xué)科相互交叉研究的新領(lǐng)域出現(xiàn)。借鑒其方法,本文利用專家定義標(biāo)注的關(guān)鍵點計算分析楷書四大家書體的結(jié)構(gòu)差別。關(guān)鍵點是定義在字體上能代表結(jié)構(gòu)特征的特殊點。

      本文研究的實驗方法如下:

      Step1 選取筆畫、結(jié)構(gòu)、間架等不同的研究漢字。

      1)采集研究文字的對應(yīng)書法圖片;

      2)定義并標(biāo)記所有研究漢字的關(guān)鍵點。

      Step2 開發(fā)用于字體標(biāo)注的系統(tǒng),在系統(tǒng)平臺中設(shè)置好帶有標(biāo)注點的參考字與要標(biāo)注的書法字;找到被試者標(biāo)注字體獲取坐標(biāo)數(shù)據(jù)。

      Step3 計算字體各關(guān)鍵點的均值坐標(biāo)。通過坐標(biāo)計算字體關(guān)鍵點之間的距離與角度等數(shù)值要素,以度量4種不同書體的結(jié)構(gòu)特點。

      1.2 實驗文字的選取

      研究書法[2~6]一般是通過具體的書法字分析書體,但漢字數(shù)量龐大,不能對所有字體都進行研究。因此,由Zipf定律,從黃自元92法的每一法中選取一個研究字,代表了常用的字體結(jié)構(gòu),且在文本中的出現(xiàn)頻率較高。頻率根據(jù)式(1)計算

      C(m)=(m/n)×100%

      (1)

      式中C(m)即字頻,其中語料規(guī)模n為20 000萬字,m為文字出現(xiàn)次數(shù),是在相關(guān)網(wǎng)站上爬取的文本信息。

      1.3 書法圖片的采集

      利用標(biāo)注關(guān)鍵點研究書法的另一個準(zhǔn)備工作是書法圖片的采集。本文用到的圖片為顏柳歐趙4種楷書的碑文石刻等作品,來源于書法字典網(wǎng),屬于原書法家的字體,且圖像質(zhì)量較高,適合標(biāo)注。但字典網(wǎng)中不能找到全部研究漢字的書法素材,缺失的字體圖片利用楷書字體生成軟件獲取。

      1.4 結(jié)構(gòu)關(guān)鍵點的定義與標(biāo)記

      文字與圖片確定后,再對不同漢字定義要標(biāo)注的關(guān)鍵點。關(guān)鍵點標(biāo)注在能代表字體結(jié)構(gòu)要點的位置,而標(biāo)注點的順序依照漢字書寫的筆畫順序。如圖1為關(guān)鍵點的選取定義。關(guān)鍵點利用同心圓放置標(biāo)記,同心圓中間的圓心為字體關(guān)鍵點位置,外部的圓環(huán)為輔助確定結(jié)構(gòu)的關(guān)鍵點位置。再根據(jù)四色定理[8]給字體筆畫用不同顏色染色,使相鄰與相近筆畫的同心圓顏色不同;讓測試者能清晰的分辨出不同筆畫并標(biāo)記關(guān)鍵點;最后根據(jù)漢字筆順給標(biāo)記點標(biāo)上序號。所有漢字關(guān)鍵點都按照這種方式嚴(yán)格設(shè)計制作。

      圖1 結(jié)構(gòu)關(guān)鍵點的文字標(biāo)記

      這樣就將對字體結(jié)構(gòu)的分析轉(zhuǎn)換為對結(jié)構(gòu)關(guān)鍵點的計算以度量不同書法結(jié)構(gòu)的差異。而結(jié)構(gòu)關(guān)鍵點的選取和定義有嚴(yán)格的標(biāo)準(zhǔn)[9],要能代表字體結(jié)構(gòu)特點;其選取規(guī)則與在筆畫上的標(biāo)號順序為:起點(1),彎曲點(曲率最大處)(2),彎折點(2),相接點(2),相交點(2),特殊點(2),終點(3)。

      為了判斷選定的關(guān)鍵點能否代表結(jié)構(gòu)要點,在Unity平臺上對字體關(guān)鍵點進行線條連接。如圖2為對Mac系統(tǒng)中Apple字體標(biāo)注關(guān)鍵點的連接擬合,看到基本覆蓋了整個字體骨架,表明定義的關(guān)鍵點代表了不同字體的關(guān)鍵結(jié)構(gòu)特征。

      圖2 字體標(biāo)注點的擬合仿真

      1.5 關(guān)鍵點分析方法

      本文提出的關(guān)鍵點分析字體結(jié)構(gòu)有2種計算方式,一是通過關(guān)鍵點計算出筆畫距離和角度分析結(jié)構(gòu),二是通過仿真字體骨架分析結(jié)構(gòu)。如設(shè)關(guān)鍵點坐標(biāo)為A(xm,ym),B(xn,yn),根據(jù)兩點間的距離公式有

      (2)

      通過式(2)能得到存儲字體兩兩關(guān)鍵點之間距離的對稱矩陣X,如下所示

      (3)

      矩陣X關(guān)于對角線對稱,可以將X合并成上三角矩陣分析字體筆畫的長短,新矩陣U如下

      (4)

      同樣,知道兩點坐標(biāo)后還可以計算字體筆畫的方向角度矩陣,這樣通過關(guān)鍵點就能計算出字體的距離、角度等數(shù)值。而利用數(shù)值就可以統(tǒng)計出筆畫間距、字型大小、偏旁距離等幾乎全部的結(jié)構(gòu)特征。而對于學(xué)習(xí)者還可以參考定義的關(guān)鍵點學(xué)寫結(jié)構(gòu)。圖2的擬合說明關(guān)鍵點代表了中文字體常見的結(jié)構(gòu)要點。

      2 標(biāo)注系統(tǒng)的設(shè)計開發(fā)

      數(shù)據(jù)標(biāo)注是人工智能的基礎(chǔ)工作之一,開始于斯坦福大學(xué)啟動的 ImageNet 項目[10]。目前有多種用于圖像標(biāo)注的軟件系統(tǒng),但還沒有專門應(yīng)用標(biāo)注字體圖像的工具。為了方便收集標(biāo)注數(shù)據(jù),根據(jù)本文的實驗方法,參考LabelImg,VOTT等標(biāo)注工具的功能后,設(shè)計了一種用于書法圖標(biāo)注的系統(tǒng)。

      如圖3所示,系統(tǒng)由登錄、跳轉(zhuǎn)(結(jié)束)和書法字標(biāo)記界面3部分組成。每個標(biāo)記頁面能設(shè)置要研究的書法字。而點擊最后一頁的按鈕會進入下一輪書法字的標(biāo)記測試或結(jié)束標(biāo)注。標(biāo)記界面有3個標(biāo)注交互按鈕,分別是“撤銷”,“下一個”和“上一個”,有標(biāo)記點的撤銷、標(biāo)注下個字和返回上個已標(biāo)注漢字的功能。3個交互按鈕能讓測試者對每個書法字關(guān)鍵點都進行最精準(zhǔn)的位置標(biāo)記。并將以往LabelImg標(biāo)注軟件的矩形標(biāo)記改為圓標(biāo)記,記錄的也是圓心坐標(biāo)而不再是左上角的坐標(biāo),且數(shù)據(jù)記錄格式由.xml改為.csv文件。

      圖3 字體圖像標(biāo)注軟件

      標(biāo)記界面左邊是利用軟件平臺自身的繪圖功能制作好關(guān)鍵點的參考字,相當(dāng)于專家標(biāo)注字體。右面是要標(biāo)注的書法字。參考字選用筆畫粗細均勻的Apple印刷字,測試時參考字會顯示一個圓標(biāo)注點和對應(yīng)顏色的筆順線條指導(dǎo)用戶在書法圖上如何標(biāo)注。對應(yīng)書法圖的下方會顯示已標(biāo)記的關(guān)鍵點和總標(biāo)記點;最下方是漢字目錄,也會改變顏色提示測試進度。當(dāng)標(biāo)注完成一個字體后,目錄中的漢字由白色變成黃色表明該字體的位置點標(biāo)記完成。標(biāo)注的交互方式是鼠標(biāo)點擊,每點擊一次就會產(chǎn)生一個標(biāo)記點位置坐標(biāo)并記錄,然后系統(tǒng)根據(jù)坐標(biāo)計算關(guān)于字體結(jié)構(gòu)的矩陣并存儲。

      3 標(biāo)注實驗

      3.1 實驗設(shè)計與被試者

      字體標(biāo)注系統(tǒng)完成后,采用眾包標(biāo)注[11]模式。在本地找到130名數(shù)字媒體專業(yè)的大學(xué)生為標(biāo)注人員,男女比例為1︰1。通過他們對系統(tǒng)中字體的標(biāo)記收集到書體的關(guān)鍵標(biāo)注點數(shù)據(jù),用于度量結(jié)構(gòu),并調(diào)查分析大眾對書法結(jié)構(gòu)的普遍差異感受。

      3.2 實驗過程

      實驗的漢字共有90個,而每個字又有4種不同的書法字;因此實驗時隨機將學(xué)生分為10個小組標(biāo)注字體。系統(tǒng)為每組平均分配約15個不同的研究字,確保每個字都最少經(jīng)過16人標(biāo)記。系統(tǒng)會自動取得標(biāo)注點的位置并記錄,大約0.5 h學(xué)生就能完成實驗。

      3.3 數(shù)據(jù)記錄

      系統(tǒng)收集到關(guān)鍵點的標(biāo)記結(jié)果后,會將標(biāo)注點坐標(biāo)記錄在以學(xué)生姓名與學(xué)號命名的文件夾中。先記錄字體各標(biāo)注點的坐標(biāo)值;再根據(jù)關(guān)鍵點坐標(biāo)值計算出關(guān)于字體結(jié)構(gòu)的2個矩陣,最后存儲到文本中。

      4 結(jié)果與分析

      4.1 數(shù)據(jù)預(yù)處理

      因為每位學(xué)生單獨標(biāo)注,為得到小誤差的結(jié)構(gòu)關(guān)鍵點坐標(biāo)數(shù)據(jù),先對標(biāo)注點進行分類。將不同學(xué)生同一字體的標(biāo)注數(shù)據(jù)匯集到一個文件中,再利用系統(tǒng)中的線條對數(shù)據(jù)有效性進行可視化復(fù)原驗證;使文件中每一個位置點都是去掉無效數(shù)據(jù)后13人以上的標(biāo)注數(shù)據(jù)。最后利用Python的Pandas和Matplotlib函數(shù)庫對標(biāo)注的關(guān)鍵點坐標(biāo)進行運算,取得其平均值。均值代表實驗所期望獲取的各字體關(guān)鍵點位置數(shù)據(jù)。

      4.2 字體結(jié)構(gòu)矩陣

      學(xué)生標(biāo)注時系統(tǒng)會根據(jù)在字體上的標(biāo)注信息實時創(chuàng)建2個數(shù)值矩陣,分別存儲著字體兩兩關(guān)鍵點之間的長度和角度信息。其中,距離矩陣根據(jù)式(2)計算,其中,m,n取值為{0,1,2…,i-1,i}。i為一個字體定義的關(guān)鍵點數(shù)量,i越大,矩陣的維度越高。而角度矩陣的計算也與距離矩陣類似。

      如圖4為系統(tǒng)后臺計算得出的字體結(jié)構(gòu)矩陣文件。矩陣最直接的作用是把字體結(jié)構(gòu)數(shù)據(jù)化,將其筆畫的長度和書寫角度轉(zhuǎn)換為數(shù)值存儲到矩陣。距離矩陣是兩兩關(guān)鍵點的長度信息,可以合并成主對角線以下為0的上三角矩陣;而角度矩陣代表筆畫書寫的角度。2個矩陣可以用來度量字體的結(jié)構(gòu)特征。如從漢字“下”的趙體和顏體距離矩陣相比,橫筆畫的長度類似,而豎筆畫趙體更短。從角度矩陣看出柳體“土”比歐體“土”的第一筆橫向筆畫的傾斜角度更大。

      圖4 結(jié)構(gòu)信息矩陣

      矩陣的意義是首次采用數(shù)值表示與分析結(jié)構(gòu)。如2個書法字的距離矩陣差值,對應(yīng)到結(jié)構(gòu)上就是不同書法筆畫寫法偏短或偏長,準(zhǔn)確存儲并顯示了每個字體筆畫的長度和角度信息。標(biāo)注系統(tǒng)為字體創(chuàng)建的距離與角度矩陣為結(jié)構(gòu)特征的初步分析結(jié)果。

      4.3 結(jié)構(gòu)特征統(tǒng)計(任務(wù)1)

      4.3.1Z值統(tǒng)計分析字型

      僅靠字體矩陣難以直觀統(tǒng)計字體更多的結(jié)構(gòu)特點,而且矩陣存儲的字體數(shù)據(jù)為相對量而非絕對量。為了對結(jié)構(gòu)做更準(zhǔn)確分析,需利用特殊關(guān)鍵點度量結(jié)構(gòu)。從關(guān)鍵點中找到能度量字型“胖”或“瘦”的特征點,特征點代表了字體結(jié)構(gòu)的高度和寬度。根據(jù)本文關(guān)鍵點定義方法,可以找出代表字體寬高的特征點。設(shè)X,Y,Z三個量,Y為字體高度,X為寬度,則

      (5)

      式中Z為字體形態(tài)值,可知值域為Z∈(0,+∞),這樣設(shè)定可以用來衡量字型的“胖”和“瘦”。如Z為b時代表字體結(jié)構(gòu)方正,為c時偏“瘦”,為a時偏“胖”。表1就是利用Z值度量字體的結(jié)果。

      表1 顏體和柳體部分字的Z值

      限于篇幅表1只列出了部分文字,結(jié)果顯示柳體字相比顏體Y/X的值更大,說明柳體字型更偏瘦,而顏體字型更豐肥,這也體現(xiàn)了“顏筋柳骨”的特征。

      4.3.2 筆畫角度分析字體傾斜度

      結(jié)構(gòu)中正度、筆畫傾斜度等結(jié)構(gòu)特征,利用距離難以度量,需要引入數(shù)學(xué)角度統(tǒng)計分析。將單個筆畫看成直線或曲線,利用標(biāo)注點計算斜率的公式為

      (6)

      式中 (x1,y1),(x2,y2)為字體上2個關(guān)鍵點的坐標(biāo),k為筆畫的斜率,由k計算出豎、橫、撇等筆畫的角度a,然后通過角度度量字結(jié)構(gòu)的端莊與傾斜。如表2是兩種書體部分漢字筆畫的斜率和角度對比。主要統(tǒng)計對應(yīng)的橫向筆畫,因為斜率為正,利于分析。

      表2 顏體和歐體字部分筆畫的斜率與角度

      由表2結(jié)果看出,歐體筆畫比顏體傾斜程度普遍更高。下文將利用Z值與角度統(tǒng)計其他字體的結(jié)構(gòu)。

      4.4 結(jié)構(gòu)特征統(tǒng)計(任務(wù)2)

      將數(shù)據(jù)結(jié)合參數(shù)樣條曲線[12]仿真分析書體結(jié)構(gòu)的保存或損失程度。在標(biāo)注系統(tǒng)中利用Bezier曲線能將位置點數(shù)據(jù)可視化以研究書法結(jié)構(gòu)。曲線由Pierre Bezier提出,對于給定的點P0,P1,…,Pn,有

      (7)

      利用式(7)結(jié)合關(guān)鍵數(shù)據(jù)就能仿真出字體形態(tài),且去除了字體的筆法等要素,只保留結(jié)構(gòu)進行分析。

      如圖5從左到右依次是顏、柳、歐、趙字體,與對應(yīng)的字體曲線仿真圖對比后,可以看到,趙體的關(guān)鍵點難以覆蓋住連筆筆畫;其結(jié)構(gòu)偏離了正楷字,而帶有行書風(fēng)格的特征。仿真字體后的筆畫缺失顯示趙體的書寫更隨意,學(xué)生也不會將連筆當(dāng)作筆畫的終點或起點。在系統(tǒng)中對所有字體仿真并與原圖對比后,統(tǒng)計出各書體帶有粘連筆畫的文字數(shù)量為:顏體:1,柳體:1,歐體:3,趙體:24。表明:趙體的連筆字遠超其他字體,也就是有連貫的結(jié)構(gòu)特征。了解這個特征很重要,如知道了關(guān)于楷書的筆畫爬取算法就不適用于趙體字。因為粘連筆畫較多,要采用新的提取算法才能準(zhǔn)確分離趙楷的筆畫。

      圖5 書法字和曲線字體的對比

      4.5 結(jié)構(gòu)特征統(tǒng)計(任務(wù)3)

      表3利用前文方法統(tǒng)計分析結(jié)構(gòu)的結(jié)果。表中Z值是全部研究漢字的總和,橫向總斜率是隨機從每個研究字體抽樣相同的共150個橫向筆畫計算得出。

      表3 字體結(jié)構(gòu)特征的統(tǒng)計結(jié)果

      從Z值中看出字形“胖瘦”程度為:趙體>顏體>歐體>柳體。從筆畫斜率和角度統(tǒng)計看出結(jié)構(gòu)中正程度為:顏體>柳體>趙體>歐體。而字體粘連筆畫的數(shù)量多少為:趙體>歐體>柳體>顏體。

      上述為總體上的結(jié)果。表3除粘連筆畫外,其他統(tǒng)計量差別不是很大。如從Z值看,柳體字形只是總體上比趙體細長,計算時發(fā)現(xiàn)個別趙體字比柳體字的Z值更大,斜率也類似。這表明:書法結(jié)構(gòu)的普遍特征在單個字上或許不存在,顯示了每個字體的特殊性。

      5 結(jié)束語

      本文提出了一種利用標(biāo)注字體關(guān)鍵點研究結(jié)構(gòu)的方法,并通過眾包標(biāo)注獲取的數(shù)據(jù)對顏柳趙等書體結(jié)構(gòu)進行計算度量。統(tǒng)計結(jié)果表明,關(guān)鍵點分析能發(fā)現(xiàn)更準(zhǔn)確的結(jié)構(gòu)差異,以后可以優(yōu)化該方法應(yīng)用到隸行書的研究中。設(shè)計的標(biāo)注工具在書法圖像集標(biāo)注、結(jié)構(gòu)研究等方面也有應(yīng)用前景。未來將嘗試將卷積神經(jīng)網(wǎng)絡(luò)等技術(shù)融入到系統(tǒng)中,以提高結(jié)構(gòu)分析的效率。

      猜你喜歡
      關(guān)鍵點字體筆畫
      聚焦金屬關(guān)鍵點
      肉兔育肥抓好七個關(guān)鍵點
      筆畫相同 長短各異
      ——識記“己”“已”“巳”
      有趣的一筆畫
      字體的產(chǎn)生
      找不同
      一筆畫
      醫(yī)聯(lián)體要把握三個關(guān)鍵點
      組合字體
      鎖定兩個關(guān)鍵點——我這樣教《送考》
      語文知識(2014年7期)2014-02-28 22:00:26
      华阴市| 永善县| 南昌县| 柳河县| 红桥区| 尼勒克县| 昌邑市| 曲松县| 旬邑县| 胶州市| 涟源市| 宜阳县| 安吉县| 云林县| 苍梧县| 明光市| 新野县| 台北县| 奉化市| 泗洪县| 黑山县| 淮阳县| 库尔勒市| 漳平市| 巴南区| 杂多县| 伊宁县| 乌拉特后旗| 古丈县| 遵义县| 佳木斯市| 平远县| 内黄县| 巫溪县| 鹤庆县| 绩溪县| 连云港市| 大同县| 涿州市| 清徐县| 陕西省|