(呂梁學(xué)院,經(jīng)濟(jì)管理系,山西呂梁市,033000) 郭越樂(lè)
作為信息化建設(shè)項(xiàng)目的核心,軟件造價(jià)分析工作發(fā)揮著重要作用,在分析和利用信息化工程造價(jià)數(shù)據(jù)時(shí),如果沒(méi)有大數(shù)據(jù)技術(shù)作支撐,軟件造價(jià)分析新方法的功能難以充分發(fā)揮,從而造成大量異常數(shù)據(jù)產(chǎn)生,從而影響造價(jià)分析的準(zhǔn)確率[1-2]。目前,造價(jià)數(shù)據(jù)在不同階段的復(fù)雜度都較高,同時(shí)編寫(xiě)報(bào)告的工作量龐大,采用人工計(jì)算方式獲取造價(jià)數(shù)據(jù)相對(duì)較低,造價(jià)費(fèi)用在不同階段具體應(yīng)用情況不易高效且精準(zhǔn)獲取[3]。本研究基于國(guó)家標(biāo)準(zhǔn)功能點(diǎn)評(píng)估,同時(shí)將智能軟件度量系統(tǒng)創(chuàng)造性的借鑒,工作量評(píng)估以“需求導(dǎo)向”為重點(diǎn),同時(shí)結(jié)合機(jī)器學(xué)習(xí)及大數(shù)據(jù)知識(shí)體系,針對(duì)工作量評(píng)估方法體系從流程、制度等層面開(kāi)展創(chuàng)新性研究,確保工作效率能得到顯著提高。
按照說(shuō)明書(shū)模板,對(duì)word文檔內(nèi)的格式信息進(jìn)行讀取,在此基礎(chǔ)上對(duì)“業(yè)務(wù)功能”相關(guān)內(nèi)容進(jìn)行識(shí)別[4]。參考說(shuō)明書(shū)模板讀取相應(yīng)章節(jié)內(nèi)容,具體文本描述包括:業(yè)務(wù)流程描述、模塊名稱(chēng)、業(yè)務(wù)功能說(shuō)明等。在對(duì)存在各模塊中全部的動(dòng)名詞短語(yǔ)、名詞短語(yǔ)及名詞進(jìn)行識(shí)別時(shí)需合理利用數(shù)據(jù)挖掘技術(shù)及自然語(yǔ)言處理方法。在此基礎(chǔ)上再完成不同候選集的構(gòu)建,包括ILF,EI,EQ這三種。
當(dāng)模型采用數(shù)據(jù)挖掘技術(shù)完成構(gòu)建后,此時(shí)要進(jìn)行測(cè)試和驗(yàn)證,以實(shí)際數(shù)據(jù)作為參考依據(jù)。在對(duì)各個(gè)預(yù)測(cè)模型的有效性進(jìn)行驗(yàn)證時(shí),推薦系統(tǒng)常用的評(píng)價(jià)指標(biāo)主要包括召回率Recall、準(zhǔn)確率Precision等[5]。
在構(gòu)建模型的初期,數(shù)據(jù)支撐的審核主要通過(guò)功能點(diǎn)實(shí)現(xiàn)。驗(yàn)證數(shù)據(jù)、深度學(xué)習(xí)模型、機(jī)器學(xué)習(xí)模型及其他模型均從語(yǔ)料集中獲取。因此在后期評(píng)估和訓(xùn)練模型的過(guò)程中,收集語(yǔ)料集發(fā)揮著關(guān)鍵性作用。
應(yīng)用word2vec 完成詞向量轉(zhuǎn)換,可實(shí)現(xiàn)向量化文本中全部的詞,從而對(duì)它們的關(guān)系展開(kāi)定量分析和研究,基于此將存在于詞與詞間的隱含關(guān)系進(jìn)行充分挖掘。作為自然語(yǔ)言處理中的核心概念,NGram 也被稱(chēng)為N 元模型,通過(guò)N-Gram 可實(shí)現(xiàn)對(duì)某句或詞義合理性的判斷和評(píng)估,一般而言,人們?cè)贜LP 中僅需通過(guò)語(yǔ)料庫(kù)就能實(shí)現(xiàn)這一目的。功能項(xiàng)短語(yǔ)通過(guò)該算法就能完成分詞功能。前面存在若干詞語(yǔ)后某個(gè)詞接著出現(xiàn),通過(guò)這種思想來(lái)實(shí)現(xiàn)算法功能,事實(shí)上該思想也算法假設(shè)n變量的基礎(chǔ)。
在構(gòu)建模型時(shí)需考慮不同類(lèi)型的語(yǔ)料,在此基礎(chǔ)上再完成任務(wù)。模型訓(xùn)練重復(fù)次數(shù)隨著語(yǔ)料集不斷增加而增多,這樣一來(lái)模型精度可根據(jù)數(shù)據(jù)新增狀況有不同程度的提升。當(dāng)結(jié)束模型訓(xùn)練后,再評(píng)估模型準(zhǔn)確性指標(biāo)及模型性能指標(biāo),將模型預(yù)測(cè)的效率及準(zhǔn)確性作為重點(diǎn)考量指標(biāo)。
功能點(diǎn)分類(lèi)模型可通過(guò)模型流程進(jìn)行構(gòu)建,下列為詳細(xì)步驟:①驗(yàn)證集與訓(xùn)練集語(yǔ)料均包含在已有語(yǔ)料集種,將特定識(shí)別名稱(chēng)賦予給模型。語(yǔ)料管理頁(yè)面中如果缺少語(yǔ)料需先將相關(guān)語(yǔ)料進(jìn)行上傳;②分詞處理方式以及詞典均采取自定義選取方式,結(jié)合行業(yè)類(lèi)型和特征完成自定義詞典選擇,可選擇新建詞典或者不做選擇;③對(duì)神經(jīng)網(wǎng)絡(luò)分類(lèi)模型、包含SVC 及邏輯回歸在內(nèi)的基本機(jī)器學(xué)習(xí)方法的分類(lèi)器模型進(jìn)行選擇;構(gòu)建模型參數(shù)數(shù)值可參考所選模型;④訓(xùn)練模型前需要完成模型屬性的設(shè)置。通常情況下,訓(xùn)練模型需要較長(zhǎng)的時(shí)間,完成訓(xùn)練需耐心等待。在結(jié)束訓(xùn)練后評(píng)估分析模型性能。
模型管理人員負(fù)責(zé)完成構(gòu)建機(jī)器學(xué)習(xí)模型過(guò)程中的配置與管理工作。具體工作內(nèi)容包括評(píng)估、調(diào)整、訓(xùn)練及構(gòu)建模型。模型使用人員使用權(quán)限由管理人員負(fù)責(zé)分發(fā)。
模型管理人員在語(yǔ)料集變動(dòng)條件下需隨時(shí)重新調(diào)整已有模型的參數(shù)。該過(guò)程要求使用者對(duì)這些變化調(diào)整沒(méi)有任何感知,從而有效開(kāi)展模型評(píng)估。
在未正式生產(chǎn)使用前,模型結(jié)束訓(xùn)練后需要再次通過(guò)評(píng)估和測(cè)試。確保模型具有應(yīng)用價(jià)值。為實(shí)現(xiàn)這一目的,需不算完善和更新模型評(píng)估體系。
在未正式生產(chǎn)使用前,模型結(jié)束訓(xùn)練后需要再次通過(guò)評(píng)估和測(cè)試。確保模型具有應(yīng)用價(jià)值。為實(shí)現(xiàn)這一目的,需不算完善和更新模型評(píng)估體系。
針對(duì)構(gòu)建的模型定制相應(yīng)的評(píng)估指標(biāo),選取指標(biāo)需結(jié)合各功能點(diǎn)及應(yīng)用場(chǎng)合來(lái)完成,在無(wú)法確定選取評(píng)估指標(biāo)的情況下,全部指標(biāo)作為選擇;驗(yàn)證集數(shù)據(jù)全都來(lái)源于評(píng)估模型,在此基礎(chǔ)上評(píng)估各種類(lèi)型的驗(yàn)證集;評(píng)估指標(biāo)在多次評(píng)估環(huán)節(jié)都不一致,這種情況下,對(duì)于使用模型人員而言,可根據(jù)自己需求預(yù)測(cè)選取合適的模型。
通過(guò)模型評(píng)估體系測(cè)試已經(jīng)過(guò)訓(xùn)練的模型,進(jìn)一步評(píng)估該模型的準(zhǔn)確性指標(biāo)及性能指標(biāo)。確認(rèn)投放使用模型的前提是需要通過(guò)測(cè)試,模型管理人員面對(duì)未經(jīng)測(cè)試的模型僅有對(duì)比使用的權(quán)限。
一般模型包含多種性能指標(biāo),因此在多個(gè)層面各指標(biāo)都能對(duì)模型性能進(jìn)行較好詮釋。模型性能指標(biāo)在不同場(chǎng)合要求下所需滿足的條件不一致。表1 為模型評(píng)估指標(biāo)的結(jié)果。事實(shí)上,模型性能指標(biāo)可通過(guò)準(zhǔn)確率進(jìn)行精準(zhǔn)反饋,模型識(shí)別能力隨著準(zhǔn)確率的提高而增強(qiáng);因此通常需要采取必要措施提高模型識(shí)別率。
表1 模型評(píng)估指標(biāo)
綜上所述,本文考慮到低效、人工計(jì)數(shù)難度高等問(wèn)題,在功能點(diǎn)技術(shù)過(guò)程中對(duì)已識(shí)別功能點(diǎn)計(jì)數(shù)文檔的特征抽取出來(lái)進(jìn)行探索,基于此完成分析框架的構(gòu)建以及功能點(diǎn)輔助審核規(guī)則的形成。系統(tǒng)類(lèi)別以及主要功能的識(shí)別需通過(guò)參考功能點(diǎn)計(jì)數(shù)項(xiàng)完成,人工審核工作量可采取文本分析能力構(gòu)建所降低,從而促進(jìn)預(yù)算管理效率的提高。