李崗崗,趙婷婷
(運(yùn)城學(xué)院 大學(xué)英語教學(xué)部, 山西 運(yùn)城 044000)
?
紡織科技英語強(qiáng)化訓(xùn)練的詞匯分類方法
李崗崗,趙婷婷
(運(yùn)城學(xué)院 大學(xué)英語教學(xué)部, 山西 運(yùn)城 044000)
為了提高紡織科技英語強(qiáng)化訓(xùn)練的水平,實(shí)現(xiàn)詞匯信息的準(zhǔn)確分類,提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強(qiáng)化訓(xùn)練詞匯分類模型.通過分析紡織科技英語強(qiáng)化訓(xùn)練詞匯分布數(shù)據(jù)結(jié)構(gòu),構(gòu)建詞匯語義特征序列模型,除去詞匯語義指向性信息素濃度聚焦特征,采用改進(jìn)的模糊C均值聚類算法實(shí)現(xiàn)詞匯優(yōu)化分類.仿真結(jié)果表明,采用該方法進(jìn)行紡織科技英語強(qiáng)化訓(xùn)練詞匯的分類,具有較好的語義特征聚焦性能,分類準(zhǔn)確度較高,收斂性較好,提高了對詞匯的查準(zhǔn)性能.
紡織科技;英語強(qiáng)化訓(xùn)練;詞匯分類;語義
紡織科技英語詞匯分布復(fù)雜,對其熟練掌握的難度較高,需要進(jìn)行紡織科技英語詞匯強(qiáng)化訓(xùn)練,通過對用于紡織科技英語強(qiáng)化訓(xùn)練詞匯進(jìn)行優(yōu)化分類,采用語義信息處理方法實(shí)現(xiàn)英語詞匯的信息融合和特征提取,提高對紡織科技英語詞匯強(qiáng)化訓(xùn)練的對象性和針對性.通過對紡織科技英語詞匯進(jìn)行語義信息融合和檢索,實(shí)現(xiàn)詞匯信息的準(zhǔn)確分類,提高紡織科技英語強(qiáng)化訓(xùn)練水平,研究用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯分類方法具有重要意義.
由于紡織科技英語強(qiáng)化訓(xùn)練的詞匯為一組非線性語義特征序列,采用語義本體模型構(gòu)建和語義特征提取方法進(jìn)行英語詞匯的分類研究具有可行性.傳統(tǒng)方法中,對用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯分類方法主要有K-Means法、模糊C均值聚類算法、K均值聚類算法、遺傳算法、粒子群進(jìn)化算法以及BP神經(jīng)網(wǎng)絡(luò)模糊控制算法等[1-3],用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯是通過云計(jì)算和云存儲方式進(jìn)行加工和處理,通過提取詞匯的語義信息特征,對特征進(jìn)行分類處理,結(jié)合信息融合法和分裂法實(shí)現(xiàn)詞匯分類,根據(jù)上述原理,相關(guān)學(xué)者進(jìn)行了詞匯分類算法研究,其中,文獻(xiàn)[4]提出基于混沌特征擾動模糊C均值聚類的英語詞匯語義特征分解和聚類算法,采用特征分割方法進(jìn)行詞匯屬性特征提取和統(tǒng)計(jì),使得用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯屬性特征提取過程滿足收斂性要求,提高詞匯數(shù)據(jù)分類的準(zhǔn)確性,但是該算法計(jì)算開銷較大,特征分類實(shí)時性不好;文獻(xiàn)[5]提出基于序貫重采樣蟻群濾波的紡織科技英語強(qiáng)化訓(xùn)練詞匯優(yōu)化聚類方法,該方法舍棄了低權(quán)值聚類中心的多樣性信息,降低了計(jì)算開銷,提高了數(shù)據(jù)聚類的收斂性,但是在較大詞匯相關(guān)信息的擾動時,詞匯分類的信息融合中心出現(xiàn)失真和位置偏移,導(dǎo)致詞匯分類準(zhǔn)確度下降,性能不佳[6-10].因此,提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強(qiáng)化訓(xùn)練詞匯分類模型.構(gòu)建紡織科技英語強(qiáng)化訓(xùn)練詞匯分布數(shù)據(jù)結(jié)構(gòu)分析和詞匯語義特征序列模型,提取英語詞匯語義指向性信息素濃度特征,對提取的詞匯語義信息特征進(jìn)行模糊C均值聚類算法研究和改進(jìn),實(shí)現(xiàn)詞匯的有效分類,最后通過仿真實(shí)驗(yàn)進(jìn)行了性能測試,得出有效性結(jié)論.
圖 1 紡織科技英語強(qiáng)化訓(xùn)練詞匯 分類總體構(gòu)架Fig.1 Vocabulary classification framework of textile science and technology English intensive training
為了實(shí)現(xiàn)對用于紡織科技英語強(qiáng)化訓(xùn)練詞匯的優(yōu)化分類,首先需要分析用于紡織科技英語強(qiáng)化訓(xùn)練詞匯在詞匯信息云存儲系統(tǒng)中的分布式結(jié)構(gòu)模型,用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯采用的是I/O虛擬計(jì)算機(jī)和USB接口層進(jìn)行詞匯信息和存儲和傳輸調(diào)度,設(shè)當(dāng)前英語詞匯的信息流在時序滑動窗口中的第i個語義特征幾何結(jié)構(gòu)本體模型記為CF=
根據(jù)圖1所示的總體模型,采用字符串的匹配技術(shù),將標(biāo)記為Mountain的節(jié)點(diǎn)以及模型利用字符串匹配方法進(jìn)行相似度特征分解,得到S1和S2間相似度的公式為
(1)
2.1 詞匯語義指向性信息素濃度聚焦特征提取模型
通過對紡織科技英語詞匯進(jìn)行語義信息融合和檢索,實(shí)現(xiàn)詞匯信息的準(zhǔn)確分類,可提高紡織科技英語強(qiáng)化訓(xùn)練水平.傳統(tǒng)方法采用基于序貫重采樣蟻群濾波算法的紡織科技英語強(qiáng)化訓(xùn)練詞匯分類,由于特征提取過程中抗干擾性不強(qiáng),詞匯分類信息融合中心出現(xiàn)失真和位置偏移,導(dǎo)致詞匯分類準(zhǔn)確度下降[16-20],為了克服傳統(tǒng)方法的弊端,本文提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強(qiáng)化訓(xùn)練詞匯分類模型,首先給出基礎(chǔ)概念.
定義2 (詞匯語義指向性信息素濃度的聚集交叉項(xiàng))若詞匯語義指向性信息素濃度特征提取的時頻平面任意點(diǎn)(t,f)通過聚類相似性特征提取,記SB,則令聚類目標(biāo)函數(shù)在采樣時序i時的鄰近點(diǎn)(t-t′,f-f′)上的近鄰樣本數(shù)為SBi={bi-w+1,bi-w+2,...,bi},來自多分量時頻坐標(biāo)(t,f)的函數(shù)為聯(lián)合搜索X、Y所得到的詞匯信息相似度交叉項(xiàng).若詞匯分類窗口數(shù)為n,則詞匯語義指向性信息素濃度sbi(span)=n*p.
根據(jù)上述定義,得到詞匯語義指向性信息素濃度聚焦特征對象結(jié)構(gòu)的干擾向量模型表達(dá)式為
(2)
式中:a(t)為概念間層次關(guān)系本體模型的信息幅度.節(jié)點(diǎn)概念深度特征空間的尺度信息z(t)的瞬時幅度可通過離散傅里葉變換計(jì)算,構(gòu)建詞匯語義指向性信息素濃度的相關(guān)函數(shù).假設(shè)英語詞匯數(shù)據(jù)庫中語義信息數(shù)據(jù)挖掘過程的特征分布的有限數(shù)據(jù)集為
(3)
式中:P(X)、P(Y)是語義內(nèi)容X、Y在集合頁面數(shù)的動態(tài)差異性特征.通過詞匯語義指向性信息素濃度聚焦特征提取和分類,得到n個樣本特征分解結(jié)果,以此為特征輸入進(jìn)行詞匯分類.
2.2 詞匯分類算法改進(jìn)實(shí)現(xiàn)
在上述進(jìn)行詞匯語義指向性信息素濃度聚焦分析的基礎(chǔ)上,在英語詞匯主題特征空間中,采用領(lǐng)域知識和模式匹配方法,結(jié)合模糊C均值聚類進(jìn)行詞匯分類算法改進(jìn),在詞匯語義指向性梯度下降方向,計(jì)算詞匯分類融合中心權(quán)值為
(4)
(5)
對于含有n個樣本的有限數(shù)據(jù)集,構(gòu)造短文檔向量空間,其中主題特征樣本為xi,i=1,2,…,n,英語詞匯語義指向性擾動矢量為
(6)
對短文檔的向量空間進(jìn)行相位合成,把語義特征數(shù)據(jù)集合X分為K類,采用模糊C均值算法對用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯進(jìn)行正則化計(jì)算及加權(quán)平均,結(jié)合兩個詞語相似性的度量實(shí)現(xiàn)分類控制和模糊判決,判決函數(shù)為
(7)
式中:Vi為向量空間詞匯分類中心的第i個矢量.根據(jù)個體最優(yōu)和搜索詞條的向量空間得到第i個聚類中心矢量,修正每個向量vi,則模糊劃分矩陣表示為
(8)
圖 2 用于紡織科技英語強(qiáng)化訓(xùn)練的 詞匯文本特征匹配Fig.2 Lexical text feature matching for intensive training in textile science and technology English
式中:c為搜索步數(shù);μik為最大特征值的詞語泛函集,由此實(shí)現(xiàn)基于詞匯語義指向性信息素濃度聚焦的詞匯分類.利用主題詞表實(shí)現(xiàn)對用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯的特征匹配,實(shí)現(xiàn)框圖如圖2所示.
根據(jù)上述分析,用于紡織科技英語強(qiáng)化訓(xùn)練詞匯分類的實(shí)現(xiàn)步驟描述為
(1) 輸入主題詞中的語義特征數(shù)據(jù)集合X到語義信息搜索引擎中;
(3) 對每個文檔di計(jì)算描述文本的語義信息向量vi,vi=((w1,t1),(w2,t2),…(wj,tj)),其中,wj表示文檔中詞匯語義指向性;tj表示wj的敘詞表特征值;
(5) 對各分向量進(jìn)行標(biāo)引、存儲和檢索,通過樹狀層次結(jié)構(gòu)進(jìn)行信息拓?fù)?,得到英語詞匯分類結(jié)果集R(X)的中心向量C(X),選擇搜索結(jié)果滿足:
(9)
(6) 同樣,計(jì)算出英語詞匯Y的語義指向性信息素濃度,綜合詞語相似度結(jié)果確定詞匯分類的中心向量C(Y),則X、Y的相似度為
(10)
根據(jù)語義相似性比較詞語特征值,通過英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類,實(shí)現(xiàn)紡織科技英語強(qiáng)化訓(xùn)練詞匯分類.
為了測試改進(jìn)詞匯分類算法在實(shí)現(xiàn)紡織科技英語強(qiáng)化訓(xùn)練詞匯分類中的性能,進(jìn)行仿真實(shí)驗(yàn).實(shí)驗(yàn)采用Matlab仿真軟件,仿真實(shí)驗(yàn)中,測試數(shù)據(jù)來自于Textile Science Technology紡織科技實(shí)驗(yàn)室提供的CWT200G紡織科技英語強(qiáng)化訓(xùn)練詞匯分?jǐn)?shù)據(jù)庫,英語詞匯特征信息采樣的歸一化初始頻率f1=0.8Hz;終止頻率f2=0.15Hz;紡織科技英語強(qiáng)化訓(xùn)練詞匯的圖一聚類空間半徑設(shè)為R=16,詞語相似度的特征片段閾值設(shè)為μ=12;主題詞表特征空間的維度設(shè)置為20;其他參量設(shè)定為Gmax=30;D=12;c=3;NP=30;詞匯分類的干擾強(qiáng)度擾動范圍為-10~10dB;干擾比特率為0.67 Bps/s;詞匯分類的加速因子為2.根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進(jìn)行用于紡織科技英語強(qiáng)化訓(xùn)練的詞匯分類仿真,紡織科技英語強(qiáng)化訓(xùn)練的詞匯為一組語義特征序列,進(jìn)行語義特征序列時域模型構(gòu)建和采樣,得到兩個采樣通道的原始數(shù)據(jù)信息的采樣時域波形,如圖3所示.以上述采樣的英語強(qiáng)化訓(xùn)練詞匯語義特征為訓(xùn)練集(imf1)和測試集(imf2),進(jìn)行英語詞匯語義指向性信息素濃度聚焦分析,計(jì)算英語詞匯分類的相似度信息,構(gòu)建主題詞表,得到英語詞匯語義指向性信息素濃度聚焦結(jié)果如圖4所示.
圖 3 紡織科技英語強(qiáng)化訓(xùn)練詞匯語義特征序列時域模型構(gòu)建濃度聚焦 圖 4 英語詞匯語義指向性信息素Fig.3 Vocabulary semantic feature sequence time domain model construction of textile science Fig.4 English lexical semantic orientation pheromone concentration focusing and technology English intensive training
抽取主題詞表中紡織科技英語強(qiáng)化訓(xùn)練詞語對共2 902對,進(jìn)行詞匯分類,得到詞匯分類結(jié)果如圖5所示,從圖可見,采用本文方法進(jìn)行詞匯分類,具有較好的語義特征聚焦性能,分類的準(zhǔn)確度較高,收斂性較好.為了定量對比算法性能,采用本文方法和傳統(tǒng)方法,以英語強(qiáng)化訓(xùn)練詞匯分類查準(zhǔn)率為測試指標(biāo)進(jìn)行對此分析,得到仿真結(jié)果如圖6所示,從圖6可見,采用本文方法進(jìn)行英語詞匯分類,提高了對詞匯的查準(zhǔn)性能.
圖 5 主題詞表詞語分類輸出仿真結(jié)果 圖 6 查準(zhǔn)率對比 Fig.5 Simulation results of thesaurus Fig.6 Precision comparison words classification output
本文提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強(qiáng)化訓(xùn)練詞匯分類模型.通過分析紡織科技英語強(qiáng)化訓(xùn)練詞匯分布數(shù)據(jù)結(jié)構(gòu)構(gòu)建詞匯語義特征序列模型,提取英語詞匯語義指向性信息素濃度特征,在此基礎(chǔ)上,進(jìn)行模糊C均值聚類算法研究和改進(jìn),實(shí)現(xiàn)詞匯的有效分類.研究結(jié)果表明,采用本文方法進(jìn)行紡織科技英語強(qiáng)化訓(xùn)練詞語的語義特征分析和詞匯分類,準(zhǔn)確度較高,抗干擾性能較好,詞匯查準(zhǔn)率高,展示了較好的應(yīng)用性能.
[1] 孫延.基于蟻群算法的紡織企業(yè)生產(chǎn)調(diào)度技術(shù)研究[J].電子設(shè)計(jì)工程,2015,23(18):116-118.
SUNYan.Researchonschedulingworkshopproductionofmoderntextileenterprises[J].ElectronicDesignEngineering, 2015, 23(18):116-118.
[2] 文天柱,許愛強(qiáng),程恭. 基于改進(jìn)ENN2 聚類算法的多故障診斷方法[J]. 控制與決策, 2015, 30(6): 1021-1026.
隨著r提高,流經(jīng)各受熱面的煙氣流速增加,加強(qiáng)了對各受熱面的擾動程度,各受熱面煙氣對流放熱系數(shù)均呈顯著增長趨勢。對于各受熱面?zhèn)鳠嵯禂?shù),隨著r提高,爐膛上部分隔屏過熱器及后屏過熱器受熱面?zhèn)鳠嵯禂?shù)基本不變;高溫過熱器傳熱系數(shù)略有增長;尾部煙道的省煤器傳熱系數(shù)增長顯著。
WENTianzhu,XUAiqiang,CHNEGGong.Multi-faultdiagnosismethodbasedonimprovedENN2clusteringalgorithm[J].ControlandDecision, 2015, 30(6): 1021-1026.
[3] 邢長征, 劉劍. 基于近鄰傳播與密度相融合的進(jìn)化數(shù)據(jù)流聚類算法[J]. 計(jì)算機(jī)應(yīng)用, 2015, 35(7): 1927-1932.
XINGChangzheng,LIUJian.Evolutionarydatastreamclusteringalgorithmbasedonintegrationofaffinitypropagationanddensity[J].JournalofComputerApplications, 2015, 35(7): 1927-1932.
[4] 陶新民, 宋少宇, 曹盼東,等. 一種基于流形距離核的譜聚類算法[J]. 信息與控制, 2012,19(3): 307-313.
TAOXinmin,SONGShaoyu,CAOPandong,etal.Aspectralclusteringalgorithmbasedonmanifolddistancekernel[J].InformationandControl, 2012,19(3): 307-313.
[5]GLENTISGO,JAKOBSSONA,ANGELOPOULOSK.Block-recursiveIAA-basedspectralestimateswithmissingsamplesusingdatainterpolation[C]∥InternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),F(xiàn)lorence, 2014: 350-354.
[6]SUNW,SOHC,CHENY,etal.Approximatesubspace-basediterativeadaptiveapproachforfasttwo-dimensionalspectralestimation[J].IEEETransactionsonSignalProcessing, 2014, 62(12): 3220-3231.
[7] 田剛, 何克清, 王健, 等. 面向領(lǐng)域標(biāo)簽輔助的服務(wù)聚類方法[J]. 電子學(xué)報(bào), 2015, 43(7): 1266-1274.
TIANGang,HEKeqing,WANGJian,etal.Domain-orientedandtag-aidedwebserviceclusteringmethod[J].ChineseJournalofElectronics, 2015, 43(7): 1266-1274.
[8] 吳濤,陳黎飛,郭躬德. 優(yōu)化子空間的高維聚類算法[J]. 計(jì)算機(jī)應(yīng)用, 2014, 34(8): 2279-2284.
WUTao,CHENLifei,GUOGongde.High-dimensionaldataclusteringalgorithmwithsubspaceoptimization[J].JournalofComputerApplications, 2014, 34(8): 2279-2284.
[9] 辛宇,楊靜,湯楚蘅,等. 基于局部語義聚類的語義重疊社區(qū)發(fā)現(xiàn)算法[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(7): 1510-1521.
XINYu,YANGJing,TANGChuheng,etal.Anoverlappingsemanticcommunitydetectionalgorithmbasedonlocalsemanticcluster[J].JournalofComputerResearchandDevelopment, 2015, 52(7): 1510-1521.
[10]LIAOLüchao,JIANGXinhua,ZOUFumin,etal.Aspectralclusteringmethodforbigtrajectorydataminingwithlatentsemanticcorrelation[J].ChineseJournalofElectronics, 2015, 43(5): 956-964.
[11] 余曉東,雷英杰,岳韶華,等.基于粒子群優(yōu)化的直覺模糊核聚類算法研究[J].通信學(xué)報(bào),2015,13(5):99
YUXiaodong,LEIYingjie,YUEShaohua,etal.ResearchonPSO-basedintuitionisticfuzzykernelclusteringalgorithm[J].JournalofCommunication, 2015,13(5):99.
[12]XINYu,YANGJing,TANGChuheng,etal.Anoverlappingsemanticcommunitydetectionalgorithmbasedonlocalsemanticcluster[J].JournalofComputerResearchandDevelopment, 2015, 52(7): 1510-1521.
[13] 馬俊濤,高梅國,董健. 基于稀疏迭代協(xié)方差估計(jì)的缺失數(shù)據(jù)譜分析及時域重建方法[J]. 電子與信息學(xué)報(bào), 2016, 38(6): 1431-1437.
MAJuntao,GAOMeiguo,DONGJian.Sparseiterativecovarianceestimation-basedapproachforspectralanalysisandreconstructionofmissingdata[J].JournalofElectronics&InformationTechnology,2016, 38(6): 1431-1437.
[14]KARLSSONJ,ROWEW,XUL,etal.Fastmissing-dataIAAwithapplicationtonotchedspectrumSAR[J].IEEETransactionsonAerospaceElectronicSystems, 2014, 50(2): 959-971.
[15]PARKHR,LIJie.Sparsecovariance-basedhighresolutiontimedelayestimationforspreadspectrumsignals[J].ElectronicsLetters, 2015, 51(2): 155-157.
[16] 劉俊,劉瑜,何友,等. 雜波環(huán)境下基于全鄰模糊聚類的聯(lián)合概率數(shù)據(jù)互聯(lián)算法[J]. 電子與信息學(xué)報(bào), 2016, 38(6): 1438-1445.
LIUJun,LIUYu,HEYou,etal.Jointprobabilisticdataassociationalgorithmbasedonall-neighborfuzzyclusteringinclutter[J].JournalofElectronicsandInformationTechnology, 2016, 38(6): 1438-1445.
[17]BAESH,YOONKJ.Robustonlinemultiobjecttrackingwithdataassociationandtrackmanagement[J].IEEETransactionsonImageProcessing, 2014, 23(7): 2820-2833.
[18]JIANGX,HARISHANK,THAMARASAR,etal.Integratedtrackinitializationandmaintenanceinheavyclutterusingprobabilisticdataassociation[J].SignalProcessing, 2014,14(14):241-250.
[19]LIL,XIEW.Intuitionisticfuzzyjointprobabilisticdataassociationfilteranditsapplicationtomultitargettracking[J].SignalProcessing, 2014,14(26):241-250.
[20]ZHAOH.Nationallaureatesfortextilescienceandtechnology[J].ChinaTextile, 2015,13(1):60-62.
編輯、校對:趙 放
Vocabulary classification method for intensive training of textile science and technology English
LI Ganggang,ZHAO Tingting
(Department of College English, Yuncheng University,Yuncheng 044000,Shanxi,China)
In order to improve the training of textile science and technology English,and complete the accurate classification of lexical information. A new vocabulary classification model is proposed for textile science and technology English intensive training based on the semantic orientation of English lexical semantic orientation and fuzzy C-means clustering. By vocabulary distribution data structure analyzing,a semantic feature sequence model is construded, removing lexical semantic directivity pheromone concentration focus characteristics,and using the improved fuzzy C-means clustering algorithm to achieve optimal classification of vocabulary. The simulation results show that the vocabulary classification, has better focusing semantic features, classification accuracy,and convergence, and it can improve the vocabulary recall and precision performance.
textile science and technology; English intensive training; vocabulary classification; semantic
1674-649X(2016)04-0440-06
10.13338/j.issn.1674-649x.2016.04.006
2016-02-12
運(yùn)城學(xué)院教學(xué)改革項(xiàng)目(JG201428)
李崗崗(1985—), 男,甘肅省天水市人,運(yùn)城學(xué)院講師,研究方向?yàn)槎Z習(xí)得與測試及語言學(xué).
E-mail:lgg-snow@163.com
李崗崗,趙婷婷.紡織科技英語強(qiáng)化訓(xùn)練的詞匯分類方法[J].西安工程大學(xué)學(xué)報(bào),2016,30(4):440-445.
LI Ganggang,ZHAO Tingting.Vocabulary classification method for intensive training of textile science and technology English[J].Journal of Xi′an Polytechnic University,2016,30(4):440-445.
TP391
A