劉曉偉,劉科學(xué),謝楓,王莉,鞏冬梅
(國網(wǎng)冀北電力有限公司營銷服務(wù)中心(計(jì)量中心),北京 100045)
隨著電網(wǎng)企業(yè)的不斷壯大,在日常運(yùn)營活動中,運(yùn)營商每天將獲取海量的文本數(shù)據(jù),這些文本數(shù)據(jù)涉及機(jī)械、電子、信息等多個領(lǐng)域,種類多樣,數(shù)量龐雜,缺乏規(guī)范的整合處理操作。為此,不少研究學(xué)者針對工單標(biāo)簽數(shù)據(jù)的特點(diǎn)對其進(jìn)行自動分類標(biāo)注操作,提升這些數(shù)據(jù)的分辨率,便于高效地識別[1-2]。
由于工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng)在數(shù)據(jù)操作的過程中需獲取完整的工單標(biāo)簽數(shù)據(jù)信息,并不斷審核系統(tǒng)內(nèi)部的操作空間結(jié)構(gòu),因此,在操作的同時需調(diào)整系統(tǒng)硬件元件與軟件程序間的結(jié)構(gòu)關(guān)系,管理硬件與軟件的數(shù)據(jù)存儲方式[3-4]。目前的研究選用數(shù)據(jù)分類的方式整合工單標(biāo)簽數(shù)據(jù)信息,簡化操作步驟,縮減操作所需的數(shù)據(jù)數(shù)量,避免了復(fù)雜的系統(tǒng)操作。
傳統(tǒng)基于文本挖掘技術(shù)的工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng),利用文本挖掘方式對工單標(biāo)簽數(shù)據(jù)進(jìn)行深度挖掘,在掌控系統(tǒng)數(shù)據(jù)的基礎(chǔ)上執(zhí)行數(shù)據(jù)挖掘命令,有效緩解操作系統(tǒng)的內(nèi)部壓力,并調(diào)整自動分類標(biāo)注系統(tǒng)的內(nèi)部結(jié)構(gòu),具有良好的操作性[5]。傳統(tǒng)基于預(yù)訓(xùn)練BERT模型的工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng)根據(jù)標(biāo)準(zhǔn)模型管理操作中產(chǎn)生的操作問題,訓(xùn)練基礎(chǔ)數(shù)據(jù),并調(diào)節(jié)基礎(chǔ)數(shù)據(jù)的傳輸方式,獲取準(zhǔn)確率較高的基礎(chǔ)數(shù)據(jù)信息,確保數(shù)據(jù)的良好傳輸,提升自動分類標(biāo)注的操作效率。但傳統(tǒng)系統(tǒng)在實(shí)際操作中將產(chǎn)生一系列的數(shù)據(jù)操控問題,對于部分隱藏數(shù)據(jù)的查找能力有限,無法獲取隱藏數(shù)據(jù)的信息資源,導(dǎo)致最終獲取的結(jié)果精準(zhǔn)率較低[6]。為此,針對上述問題,文中提出一種新的基于語義分割的工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng)。
文中利用語義分割的數(shù)據(jù)識別性能調(diào)整內(nèi)部系統(tǒng)硬件元件的關(guān)系,并結(jié)合相關(guān)的硬件結(jié)構(gòu)將工單標(biāo)簽數(shù)據(jù)錄入基礎(chǔ)空間中,執(zhí)行硬件系統(tǒng)操作指令,并構(gòu)建指令傳導(dǎo)圖,如圖1所示。
圖1 指令傳導(dǎo)圖
選用內(nèi)部存儲性能較高的數(shù)據(jù)存儲器作為工單標(biāo)簽數(shù)據(jù)的基礎(chǔ)存儲元件,以實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)存儲。該存儲器具有較強(qiáng)的工作效率,內(nèi)部連接口連接分類單元芯片,將數(shù)據(jù)分類功能與存儲功能隔離,避免相應(yīng)功能的碰撞,減少外部數(shù)據(jù)因素的影響。該存儲器的內(nèi)部容量為2 GB,能夠確保數(shù)據(jù)的完整性存儲,并在存儲的同時可進(jìn)行存儲通道拓展操作,轉(zhuǎn)變數(shù)據(jù)的存儲模式,構(gòu)建良好的數(shù)據(jù)存儲環(huán)境[7-8]。
在實(shí)現(xiàn)對數(shù)據(jù)的存儲后,利用數(shù)據(jù)傳導(dǎo)器將工單標(biāo)簽數(shù)據(jù)進(jìn)行精準(zhǔn)傳導(dǎo)操作,文中數(shù)據(jù)傳導(dǎo)器可在較為復(fù)雜的數(shù)據(jù)操作環(huán)境下使用,能夠在傳導(dǎo)命令下達(dá)的同時進(jìn)行數(shù)據(jù)分析,減少數(shù)據(jù)操作失誤,并隨時進(jìn)行數(shù)據(jù)分類操作,轉(zhuǎn)化數(shù)據(jù)類型,內(nèi)部設(shè)有記憶芯片,可對傳導(dǎo)的數(shù)據(jù)進(jìn)行數(shù)據(jù)記憶,提升數(shù)據(jù)操作的可靠性[9]。
語義分割作為計(jì)算機(jī)算法的基本任務(wù),需要將數(shù)據(jù)分為不同的語義可解釋類別進(jìn)行輸入,并利用這些類別特征執(zhí)行數(shù)據(jù)操作指令,文中在系統(tǒng)接收層輸入數(shù)據(jù)組,調(diào)整數(shù)據(jù)組內(nèi)部的數(shù)據(jù)信息,確保數(shù)據(jù)信息的完整性[10]。利用梯度下降算法進(jìn)行數(shù)據(jù)學(xué)習(xí),并訓(xùn)練基礎(chǔ)數(shù)據(jù)的操作性能,擴(kuò)展數(shù)據(jù)操作范圍,便利數(shù)據(jù)的基礎(chǔ)操作[11-12]。
標(biāo)定特征數(shù)據(jù),并設(shè)置數(shù)據(jù)標(biāo)定公式[13-14]:
式中,F(xiàn)m(x)為標(biāo)定結(jié)果參數(shù),F(xiàn)(m-1)(x)表示內(nèi)部維度特征數(shù)據(jù)參數(shù),βm表示內(nèi)部整合條件參數(shù),h為相關(guān)度匹配數(shù)據(jù),x表示基礎(chǔ)標(biāo)定函數(shù),α表示內(nèi)部相關(guān)性分析指數(shù),m為標(biāo)定條件參數(shù)。經(jīng)過以上數(shù)據(jù)操作后,管理標(biāo)定的數(shù)據(jù)信息。將標(biāo)定的數(shù)據(jù)信息完整存儲于相應(yīng)的操作空間中,等待空間軟件平臺處理[15]。
在實(shí)現(xiàn)平臺處理后,執(zhí)行系統(tǒng)軟件操作命令。輸入基礎(chǔ)工單文本數(shù)據(jù),在內(nèi)部平臺中進(jìn)行文本預(yù)測處理操作,并構(gòu)建預(yù)處理公式:
式中,T表示預(yù)處理結(jié)果參數(shù),S表示軟件系統(tǒng)操作指令,k表示內(nèi)部平臺操作規(guī)則,l表示空間軟件處理信息任務(wù)。
由此獲取預(yù)處理數(shù)據(jù),并根據(jù)預(yù)處理數(shù)據(jù)構(gòu)建數(shù)據(jù)調(diào)節(jié)模型,取得較為精準(zhǔn)的操作數(shù)據(jù)[16],并執(zhí)行數(shù)據(jù)訓(xùn)練指令,下達(dá)訓(xùn)練任務(wù),對文本數(shù)據(jù)進(jìn)行效果評估。調(diào)節(jié)中心軟件的平臺信息,在評估結(jié)果中查找自動分類標(biāo)注性能,并將此性能結(jié)果作為操作的最終結(jié)果,由此實(shí)現(xiàn)對工單標(biāo)簽數(shù)據(jù)的自動分類標(biāo)注系統(tǒng)設(shè)計(jì),并構(gòu)建分類標(biāo)注流程,如圖2所示。
圖2 分類標(biāo)注流程圖
文中將研究的系統(tǒng)數(shù)據(jù)進(jìn)行整理,控制整理界面信息數(shù)據(jù),管理不同空間結(jié)構(gòu)的數(shù)據(jù)信息,時刻分配系統(tǒng)的分類標(biāo)注項(xiàng)目,按照分類標(biāo)注結(jié)果整合操作數(shù)據(jù),獲取相應(yīng)的實(shí)驗(yàn)研究參數(shù),并構(gòu)建實(shí)驗(yàn)參數(shù)表,如表1所示。
表1 實(shí)驗(yàn)參數(shù)1
在表1中,選用代表性較強(qiáng)的實(shí)驗(yàn)操作數(shù)據(jù),按照系統(tǒng)功能管理的標(biāo)準(zhǔn)查詢分類標(biāo)注界面,匹配界面信息,構(gòu)建較為寬廣的界面結(jié)構(gòu),執(zhí)行內(nèi)部操控指令,將實(shí)驗(yàn)參數(shù)空間數(shù)據(jù)與內(nèi)部系統(tǒng)界面數(shù)據(jù)相結(jié)合,并監(jiān)控數(shù)據(jù)界面信息,掌握不同的信息功能。根據(jù)信息功能系統(tǒng)分析自動分類標(biāo)注結(jié)果數(shù)據(jù)追蹤結(jié)果數(shù)據(jù)位置,將位置數(shù)據(jù)與條件數(shù)據(jù)相結(jié)合,審核此刻的結(jié)合數(shù)據(jù)信息,查找結(jié)合數(shù)據(jù)信息與內(nèi)部自動分類標(biāo)注信息的相似性。分類數(shù)據(jù)信息,將數(shù)據(jù)按可能性進(jìn)行排序,并構(gòu)建數(shù)據(jù)信息分布式表示,如圖3所示。
圖3 數(shù)據(jù)信息分布式表示圖
按照相似性順序排列自動分類標(biāo)注數(shù)據(jù)結(jié)果,執(zhí)行結(jié)果數(shù)據(jù)。標(biāo)準(zhǔn)化控制整合的實(shí)驗(yàn)信息,采用所設(shè)計(jì)系統(tǒng)與基于文本挖掘技術(shù)的標(biāo)注系統(tǒng)、基于預(yù)訓(xùn)練BERT模型的標(biāo)注系統(tǒng)對自動分類標(biāo)注參數(shù)進(jìn)行查詢,整合查詢信息,獲取完整的實(shí)驗(yàn)結(jié)果數(shù)據(jù),3種方法的自動分類標(biāo)注準(zhǔn)確率對比結(jié)果如圖4所示。
圖4 自動分類標(biāo)注精準(zhǔn)率對比圖
根據(jù)圖4可以分析出,文中基于語義分割的工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng)的自動分類標(biāo)注精準(zhǔn)率均高于兩種傳統(tǒng)自動分類標(biāo)注系統(tǒng)?;谖谋就诰蚣夹g(shù)標(biāo)注系統(tǒng)的自動分類標(biāo)注精準(zhǔn)率較高,基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)的自動分類標(biāo)注精準(zhǔn)率較低。由于文中系統(tǒng)在設(shè)計(jì)過程中調(diào)整了系統(tǒng)的設(shè)計(jì)范圍,并查詢整體自動分類標(biāo)注的數(shù)據(jù)信息,調(diào)配自動分類標(biāo)注系統(tǒng)信息,并緩和硬件與軟件系統(tǒng)間的操作矛盾,強(qiáng)化外部系統(tǒng)管理性能,因此具有較強(qiáng)的數(shù)據(jù)操控性,收集的初始數(shù)據(jù)精準(zhǔn)程度較高,其最終的自動分類標(biāo)注精準(zhǔn)率較高。傳統(tǒng)基于文本挖掘技術(shù)的標(biāo)注系統(tǒng)利用文本挖掘的優(yōu)勢進(jìn)行數(shù)據(jù)挖掘,同時匹配功能信息查詢不同區(qū)域的數(shù)據(jù)狀況,對工單標(biāo)簽數(shù)據(jù)的了解程度較深,能夠達(dá)到良好的數(shù)據(jù)操作效果,并及時控制數(shù)據(jù)的流向,具有較高的自動分類標(biāo)注精準(zhǔn)率。傳統(tǒng)基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)雖完善了系統(tǒng)的內(nèi)部結(jié)構(gòu),但對于外部數(shù)據(jù)分析的力度較小,無法掌控工單標(biāo)簽數(shù)據(jù)的基礎(chǔ)性能,且操作投入較大,消耗高,導(dǎo)致其最終研究過程中的數(shù)據(jù)產(chǎn)生一定的偏差,自動分類標(biāo)注精準(zhǔn)率較低。
在實(shí)現(xiàn)以上實(shí)驗(yàn)操作后,對實(shí)驗(yàn)過程中將產(chǎn)生的數(shù)據(jù)轉(zhuǎn)化因素進(jìn)行監(jiān)控,時刻保持實(shí)驗(yàn)操作的正常狀態(tài)。標(biāo)定基礎(chǔ)信息數(shù)據(jù),將工單標(biāo)簽數(shù)據(jù)整合至一個密閉的操作空間中,避免無關(guān)數(shù)據(jù)的侵入與影響,并構(gòu)建網(wǎng)絡(luò)模型結(jié)構(gòu)圖,如圖5所示。
圖5 網(wǎng)絡(luò)模型結(jié)構(gòu)圖
整理操作的數(shù)據(jù)信息,并按照獲取的信息內(nèi)容提升操作的技術(shù)性。構(gòu)建網(wǎng)絡(luò)監(jiān)管模式,將硬件平臺信息全部錄入平臺系統(tǒng)中,便于后續(xù)實(shí)驗(yàn)操作辨識,并設(shè)置實(shí)驗(yàn)參數(shù),如表2所示。
表2 實(shí)驗(yàn)參數(shù)2
收集不同區(qū)域的工單標(biāo)簽數(shù)據(jù)信息,將數(shù)據(jù)信息的分類標(biāo)準(zhǔn)添加至操作應(yīng)用程序中,緩解應(yīng)用程序的內(nèi)部壓力。縮減操作所需步驟,將操作時間控制在系統(tǒng)操作允許范圍內(nèi),并標(biāo)定范圍信息。利用標(biāo)定的范圍信息管理工單標(biāo)簽數(shù)據(jù)的自動分類標(biāo)注模式,對比3種系統(tǒng)的數(shù)據(jù)分類標(biāo)注時間,如圖6所示。
由圖6可知,傳統(tǒng)基于文本挖掘技術(shù)標(biāo)注系統(tǒng)的數(shù)據(jù)分類標(biāo)注時間較長,傳統(tǒng)基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)的數(shù)據(jù)分類標(biāo)注時間較短,文中基于語義分割的工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng)的分類標(biāo)注時間均短于其他兩種傳統(tǒng)系統(tǒng)。
圖6 數(shù)據(jù)分類標(biāo)注時間對比圖
造成此種差異的原因在于文中系統(tǒng)設(shè)計(jì)在數(shù)據(jù)收集的初級階段構(gòu)建了信息管理空間站,標(biāo)定了收集的工單數(shù)據(jù)信息。同時,管理不同位置的數(shù)據(jù)信息狀態(tài),加強(qiáng)對信息數(shù)據(jù)的集中處理力度,獲取了良好的操作效果,完善了內(nèi)部系統(tǒng)機(jī)制,減少了不必要的操作浪費(fèi),縮減操作所需時間與分類標(biāo)注時間。傳統(tǒng)基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)能夠利用預(yù)訓(xùn)練BERT模型對不同平臺的工單標(biāo)簽數(shù)據(jù)進(jìn)行程序訓(xùn)練,在數(shù)據(jù)管理的同時及時控制外側(cè)信息的錄入,具有良好的數(shù)據(jù)系統(tǒng)操作性,能夠更好地符合數(shù)據(jù)分類標(biāo)注的標(biāo)準(zhǔn),降低了操作的困難程度,由此縮短了其分類標(biāo)注時間。傳統(tǒng)基于文本挖掘技術(shù)標(biāo)注系統(tǒng)雖配置了一系列文本挖掘協(xié)議,但對于工單標(biāo)簽數(shù)據(jù)的調(diào)整力度較小,造成工單標(biāo)簽數(shù)據(jù)無法得到系統(tǒng)的有效傳輸,在傳輸途中將產(chǎn)生不可避免的操作危機(jī),導(dǎo)致其最終的分類標(biāo)注時間較長。
文中在傳統(tǒng)工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng)的基礎(chǔ)上設(shè)計(jì)了一種新的基于語義分割的工單標(biāo)簽數(shù)據(jù)自動分類標(biāo)注系統(tǒng),該系統(tǒng)不斷調(diào)節(jié)系統(tǒng)軟件與硬件間的操作關(guān)系,轉(zhuǎn)變操作條件,并提升操作過程中的工單標(biāo)簽數(shù)據(jù)的數(shù)據(jù)收集精準(zhǔn)度,獲取可靠的操作數(shù)據(jù),縮減操作所需時長。實(shí)驗(yàn)結(jié)果表明,文中系統(tǒng)的自動分類標(biāo)注效果明顯優(yōu)于傳統(tǒng)系統(tǒng)。