王芳靜,王和勇
(1.華南理工大學 電子商務系,廣東 廣州 510006;2. 廣州賽寶認證中心服務有限公司,廣東 廣州 511370)
產(chǎn)品型軟件企業(yè)大多運用敏捷開發(fā)模式,快速迭代交付出滿足特定行業(yè)需求的軟件產(chǎn)品。近年來,我國軟件和信息技術服務業(yè)發(fā)展水平呈現(xiàn)穩(wěn)步提升趨勢,但是整體仍需進一步提高[1]。各軟件行業(yè)都會有使用問題的發(fā)生,軟件質(zhì)量的可靠性受到不同程度的質(zhì)疑?,F(xiàn)代軟件項目要求軟件開發(fā)的每一次迭代都能快速、增量地交付[2]。在資源有限的情況下如何持續(xù)維持高質(zhì)量軟件交付是產(chǎn)品型敏捷軟件企業(yè)面臨的一大難題。當試圖在軟件企業(yè)中提高敏捷性以提升高質(zhì)量軟件交付能力時,需要綜合考慮其他因素,對其過程進行有效改進[3]。哪些關鍵因素影響了質(zhì)量目標的達成?對識別出的關鍵質(zhì)量因素需要改進到什么程度既能確保質(zhì)量目標的達成,又能兼顧有限資源的合理分配?這兩個問題是企業(yè)決策者關心的問題。數(shù)據(jù)是引入新技術環(huán)境中的知識創(chuàng)造促成因素[4],數(shù)據(jù)和過程分析之間進行接合,過程改進將變得更加經(jīng)濟可行,使得不具備專業(yè)知識或缺少預算的團隊也能進行過程改進[5]。為此,通過建立回歸預測模型,通過量化方式有效地策劃、預測、監(jiān)督和控制產(chǎn)品型敏捷軟件企業(yè)質(zhì)量過程改進情況,充分合理分配有限的資源。
本文以某產(chǎn)品型敏捷軟件企業(yè)為例,結合量化過程改進的理論和實踐經(jīng)驗,探析如何在產(chǎn)品型敏捷軟件企業(yè)中運用回歸預測模型有效實施過程改進,從而為企業(yè)最終達成業(yè)務目標奠定基礎。某產(chǎn)品型敏捷軟件企業(yè)核心業(yè)務為智能交通軟件研發(fā),專注于高速公路收費領域,涉及智慧路網(wǎng)、高速公路清分結算、高速公路移動支付等多個軟件產(chǎn)品。質(zhì)量是交通行業(yè)的生命線,該企業(yè)自成立以來就十分重視軟件質(zhì)量,每年都會投入大量的資源以維持高質(zhì)量產(chǎn)出。隨著數(shù)字化的推進,過程改進小組在2021年上半年收集質(zhì)量相關數(shù)據(jù),建立回歸預測模型,協(xié)調(diào)資源進行量化質(zhì)量過程改進和預測,截至2021年9月,企業(yè)在合理使用資源的前提下,高質(zhì)量的完成了項目任務,得到了客戶和公司領導的高度認可。
回歸預測模型法是一種數(shù)學預測方法,它是運用數(shù)學模型,以一個或幾個自變量X作為依據(jù),來預測因變量Y發(fā)展變動趨勢和水平的一種方法。軟件組織可以運用回歸預測模型在有限的資源下進行漸進式量化過程改進,預測和控制改進目標的達成情況?;貧w預測模型在軟件過程改進中的主要研究問題包括:識別改進目標變量Y的影響因子X并確定相關性;確定Y與X間的定量關系表達式,建立改進目標預測模型并進行檢驗;利用所建立的預測模型對改進目標進行改進和預測。
識別過程改進目標變量Y的影響因子X時多采用經(jīng)驗和數(shù)據(jù)分析相接合的方式,使用的方法也比較多樣,比如魚骨圖法、帕累托法、問卷調(diào)查、案例研究等等。建立回歸預測模型的前提是X與Y是顯著相關的,有多個X時,X之間是不相關的,所以識別出X后,需收集Y及X數(shù)據(jù)進行相關性分析。
相關性分析涉及到顯著性和相關系數(shù)兩類檢驗,顯著性檢驗是檢驗變量之間是否有顯著影響,而相關系數(shù)檢驗是檢驗變量之間影響的方向和程度,因此應先進行顯著性檢驗,再進行相關系數(shù)檢驗。
顯著性檢驗即p檢驗,p值小于0.05,則認為變量間有顯著影響。相關系數(shù)檢驗即r檢驗,r是用以反映變量之間相關關系密切程度的統(tǒng)計指標,r的值在-1和1之間,r>0,正相關;r<0,負相關。r的絕對越大,則相關性越顯著。0<|r|≤0.3 ,弱相關;0.3<|r|≤0.5,低相關;0.5<|r|≤0.8,顯著相關;0.8<|r|≤1,高度相關。
確定了變量之間的相關關系,只是反映了因變量和自變量之間存在著非嚴格的、不確定的依存關系。要達到預測的目的,則需要找到他們之間嚴格的依存關系,即回歸方程關系來建立模型。找到一個影響因子的建立一元回歸方程,找到多個影響因子的則建立多元回歸方程。
建立的回歸預測模型是否正確、有效和可信需通過模型檢驗來證實。一般通過驗證模型是否滿足給定的形式化規(guī)約進行,即將該模型和形式化規(guī)約作為模型檢驗的輸入,將模型通過樣本預測出的值和實際值進行遍歷計算來判斷該模型的行為是否滿足規(guī)約的要求。模型檢驗一般包括兩個方面:一是驗證所建模型能夠反映真實系統(tǒng)的行為特征,二是驗證所建模型即是建模者構想中的模型。軟件過程改進中回歸預測模型檢驗常用到的有擬合優(yōu)度檢驗和線性顯著性檢驗。
擬合優(yōu)度檢驗屬于驗證所建模型能夠反映真實系統(tǒng)的行為特征,是檢驗回歸方程的預測值與實際數(shù)據(jù)擬合的優(yōu)劣程度,是用來檢驗方程解釋Y的有效性,該檢驗的形式化規(guī)約為R2,因此也稱為 R2檢驗。R2是線性回歸中的回歸平方和占總平方的比例,反映了在因變量Y的變差中被估計的回歸方程所解釋的比例。0≤R2≤1,R2越大,直線擬合越好,如R2= 0.7,表示Y的變化能被X解釋70%,即R2越接近于1,回歸模型的“擬合憂度”越好,原則上如果R2低于55%,表示回歸方程式的解釋力不足,須采取進一步分析,矯正造成這個分析結果的原因。
線性顯著性檢驗屬于驗證所建模型即是建模者構想中的模型,是對模型中解釋變量Y與被解釋變量X之間的線性關系在總體上是否顯著成立做出推斷,即回歸方程中X解釋Y的有效性。該檢驗的形式化規(guī)約為F,因此也稱為 F檢驗。線性顯著性檢驗中應先檢驗p值,p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05,提示樣本中變量關聯(lián)有 5%的可能是由于偶然性造成的。 0.05的p值通常被認為是可接受錯誤的邊界水平,如果p值高于0.05,表示回歸方程式不成立,須反復執(zhí)行分析,直到p值小于0.05時檢驗F值才有意義。F檢驗應用的方法是數(shù)理統(tǒng)計學中假設檢驗,提出假設:
原假設H0:b1=b2=b3=……=0(即方程不顯著)
備擇假設H1:b1、b2、b3……至少有一個不為0(即方程顯著)。
計算F值并與F的臨界值Fa進行比較,根據(jù)給定的顯著性水平在F表中查找臨界值Fa,如果F>Fa,則拒絕原假設,回歸方程是線性顯著的;反之則接受原假設,回歸方程是線性不顯著,須分析原因,調(diào)整方程。
回歸預測模型在過程改進小組分配資源進行影響因子過程改進時可以起到預測的作用,運用該模型來預測X應該改進到什么程度,Y可以達到預期目標。預測分為點預測和區(qū)間預測,點預測是用估計出的影響因子預測目標變量的數(shù)值;區(qū)間預測是用估計出的影響因子預測目標變量以多大的概率落在某個區(qū)間內(nèi),落在區(qū)間內(nèi)的概率越大,則預測的區(qū)間越大,但相對預測的精度會下降。
點預測相對比較簡單,將影響因子的估計值代入建立的回歸模型中,可得到目標變量的具體估計值,這個具體的目標變量估計數(shù)值就是預測值。區(qū)間預測需要預測一個區(qū)間,預測區(qū)間的上限為預測值加上概率度與殘差的標準差之積,下限為預測值減去概率度與殘差的標準差之積,概率度可以通過查正態(tài)分布概率表獲得。
某產(chǎn)品型敏捷軟件企業(yè)運用回歸預測模型來協(xié)調(diào)資源進行量化質(zhì)量過程改進時,企業(yè)高層根據(jù)業(yè)務目標明確了2021年度的質(zhì)量目標為控制系統(tǒng)測試缺陷密度保持不變,該質(zhì)量目標的計算公式為:系統(tǒng)測試缺陷數(shù)/功能點數(shù),過程改進小組組織公司領導,項目經(jīng)理,資深工程人員包括需求人員、設計人員、開發(fā)人員及測試人員等,采用魚骨圖的方法對測試子過程中影響系統(tǒng)測試缺陷密度的因素進行了分析,最終確定關鍵因素為測試人員平均經(jīng)驗和環(huán)境差異度。
在改進過程中該企業(yè)主要運用了質(zhì)量管理統(tǒng)計軟件Minitab進行數(shù)據(jù)分析、模型建立以及質(zhì)量預測。收集2021年4-6月項目的系統(tǒng)測試發(fā)現(xiàn)缺陷數(shù)及功能點數(shù),并在此基礎上運用SPC方法建立了基線來量化企業(yè)的當前質(zhì)量情況,制定當前年度的質(zhì)量目標均值0.185,標準差0.152,上限0.641,下限0.000。同時收集2021年4-6月份項目的測試人員平均經(jīng)驗和環(huán)境差異度數(shù)據(jù),運用Minitab“統(tǒng)計”菜單中的“相關”執(zhí)行相關性分析,判斷系統(tǒng)測試缺陷密度(Y)與測試人員平均經(jīng)驗(X1)和環(huán)境差異度(X2)三者之間的相關性,得到p值和r值。
p值分析:自變量X1和X2之間p值=0.235>0.05,線性相關不顯著;自變量X1于應變量Y之間p值=0.001<0.05線性相關顯著;自變量X2于應變量Y之間p=0.001<0.05線性相關顯著。
r值分析:自變量X1和X2之間r的絕對值=0.326<0.5,線性相關不顯著;自變量X1于應變量Y之間r的絕對值=0.766>0.5,線性相關顯著;自變量X2于應變量Y之間r的絕對值=0.759>0.5,線性相關顯著。
相關性檢驗結論:測試人員平均經(jīng)驗(X1)和環(huán)境差異度(X2)之間,線性相關不顯著,可以做為兩個獨立的自變量;自變量測試人員平均經(jīng)驗(X1)與與應變量系統(tǒng)測試缺陷密度(Y)是線性相關的,自變量環(huán)境差異度(X2)與應變量系統(tǒng)測試缺陷密度(Y)也是線性相關的,并且兩個自變量與應變量相關的程度都很高,所以選擇之前分析出來的影響因素作為變量建立質(zhì)量回歸預測模型。
為了達到改進和預測的目的,需建立二元回歸方程以明確系統(tǒng)測試缺陷密度、測試人員平均經(jīng)驗和環(huán)境差異度三者之間嚴格的量化依存關系。運用Minitab“統(tǒng)計”菜單中的“擬合回歸模型”,將系統(tǒng)測試缺陷密度,測試人員平均經(jīng)驗和環(huán)境差異度放入Minitab中來建立回歸預測模型。建立的模型為:系統(tǒng)測試缺陷密度=-0.659+0.057 3測試人員平均經(jīng)驗+ 0.988 環(huán)境差異度。同時運用Minitab進行擬合優(yōu)度檢驗、F檢驗、T檢驗三個方面的檢驗,通過Minitab中執(zhí)行的回歸結果圖,可以觀察到 R-Sq值為87.57%>75%,模型回歸效果很好;F檢驗中的p均為0,小于0.05,認為回歸模型存在線性關系顯著。綜合上面的檢驗,證明該回歸預測模型正確有效,可以依據(jù)該模型進行質(zhì)量過程改進和資源調(diào)配。通過該量化模型可以總結出以下結論:
測試人員平均經(jīng)驗和環(huán)境差異度都與系統(tǒng)測試缺陷密度為正相關,即測試人員平均經(jīng)驗與環(huán)境差異度的數(shù)值變大,系統(tǒng)測試缺陷密度的數(shù)值也會相應的變大。
環(huán)境差異度的系數(shù)比測試人員平均經(jīng)驗的系數(shù)大,即兩個變量因素中,環(huán)境差異度比測試人員平均經(jīng)驗對應變量系統(tǒng)測試缺陷密度的影響更大。
根據(jù)該回歸預測模型,過程改進小組提出改進建議,針對測試人員平均經(jīng)驗,建議多培養(yǎng)資深測試人員,建立測試人員上升通道。針對環(huán)境差異度,建議開發(fā)時盡可能使用與測試現(xiàn)場相同的應用服務器環(huán)境;若產(chǎn)品涉及到硬件外設,應盡量借用與測試現(xiàn)場相同型號的設備或者采用模擬器對測試環(huán)境進行模擬。
企業(yè)開始著手進行這兩方面的改進,但這些改進都與企業(yè)資源密切相關,可以通過回歸預測模型的點預測和區(qū)間預測來合理調(diào)配資源進行改進以達成保持高質(zhì)量輸出的目標。預測測試人員平均經(jīng)驗和環(huán)境差異度應該改進到什么程度,目標系統(tǒng)測試缺陷密度可以達到預期目標。某項目難以進行環(huán)境配置,環(huán)境差異度較大為0.65,改善環(huán)境差異度企業(yè)需要付出非常大的成本代價,企業(yè)難以投入,但質(zhì)量是必須達成的硬性指標,系統(tǒng)測試缺陷密度期望在平均值和往上浮動兩個標準差的范圍,即(0.185 0,0.489 0),所以依據(jù)建立的回歸預測模型項目組嘗試從測試人員平均經(jīng)驗上進行改進。運用Minitab“統(tǒng)計”菜單中的“預測”功能進行區(qū)間預測,環(huán)境差異度0.65,測試人員平均經(jīng)驗4.5時,95%的系統(tǒng)測試缺陷密度會落在 (0.187 041, 0.294 369)之間,在目標上下限范圍以內(nèi)。通過該預測可知安排平均經(jīng)驗為4.5的測試人員在該項目中可行。
在該產(chǎn)品型敏捷軟件企業(yè)的量化質(zhì)量過程改進中,企業(yè)成功實踐并總結了以下幾條重要的質(zhì)量改進經(jīng)驗:
在產(chǎn)品型敏捷軟件企業(yè),測試人員的專業(yè)及行業(yè)經(jīng)驗對質(zhì)量有非常重要的作用,建立測試人員培養(yǎng)及上升機制是對高質(zhì)量產(chǎn)出的基本保證。
產(chǎn)品型敏捷軟件的應用環(huán)境,包括應用服務器和硬件外設對產(chǎn)出高質(zhì)量的軟件產(chǎn)品有非常大的影響,應盡可能在公司內(nèi)部配置相關環(huán)境,使得開發(fā)時就可以使用。
因為客戶為特定行業(yè),產(chǎn)品型敏捷軟件的應用環(huán)境往往價格昂貴且更新較快或受行業(yè)限制,在軟件企業(yè)內(nèi)部配置應用環(huán)境要付出很大的代價,應用回歸預測模型可以量化改進環(huán)境差異度,維持軟件高質(zhì)量產(chǎn)出。
測試人員平均經(jīng)驗和環(huán)境差異度是影響產(chǎn)品型敏捷軟件企業(yè)高質(zhì)量產(chǎn)出的兩個重要因素,但兩者的改進都需要投入大量資源,在資源有限的情況下,可以通過回歸預測模型在這兩方面平衡調(diào)配,一方難以提升時,可以從另一方面進行著力改進。
某產(chǎn)品型敏捷軟件應用量化預測模型進行質(zhì)量過程改進,在面對產(chǎn)品線增加,客戶需求變化及應用設備升級的多重挑戰(zhàn)下,下半年截至9月,所有的軟件產(chǎn)品維持了高質(zhì)量產(chǎn)出且有所提升,均值0.120 7,標準差0.067 5,上限0.323 3,下限0.000,達到了預期量化目標。回歸預測模型的量化質(zhì)量過程改進起到了很大作用,為企業(yè)高層及軟件項目經(jīng)理選擇合適的測試人員及配置企業(yè)內(nèi)部環(huán)境提供了決策支持。
軟件開發(fā)存在四大難題:復雜性、隱匿性、配合性和易變性,軟件過程改進試圖要解決的問題,在過去、現(xiàn)在和將來一直存在[6]。質(zhì)量的挑戰(zhàn)將一直存在,如何既能夠維持高質(zhì)量的軟件產(chǎn)出,又能夠避免資源的浪費,對軟件行業(yè)尤其是產(chǎn)品型敏捷企業(yè)有非常重要的現(xiàn)實意義。后續(xù)仍將接合實際與理論不斷完善該模型,力圖找到更優(yōu)、更適合我國軟件行業(yè)當前階段量化質(zhì)量改進模型。