尹 雋,劉 偉,葛世倫,王念新
?
電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量
尹 雋,劉 偉,葛世倫,王念新
(江蘇科技大學(xué)經(jīng)濟(jì)管理學(xué)院,江蘇鎮(zhèn)江212003)
電子政務(wù)系統(tǒng)的復(fù)雜性測量是電子政務(wù)系統(tǒng)信息資源管理、IT服務(wù)評估、運(yùn)維服務(wù)定價(jià)以及運(yùn)維持續(xù)優(yōu)化等的基礎(chǔ)。本文從數(shù)據(jù)的靜態(tài)性和動(dòng)態(tài)性兩方面將系統(tǒng)的數(shù)據(jù)復(fù)雜性劃分為數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)量和數(shù)據(jù)操作三個(gè)維度,構(gòu)建了電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量模型,利用信息熵和復(fù)雜網(wǎng)格空間理論明確了電子政務(wù)系統(tǒng)數(shù)據(jù)復(fù)雜性計(jì)算方法,最后通過A市中小企業(yè)公共服務(wù)平臺系統(tǒng)驗(yàn)證了本文提出的測量模型和計(jì)算方法的有效性。
電子政務(wù)系統(tǒng);數(shù)據(jù)復(fù)雜性;信息熵;復(fù)雜網(wǎng)格空間
準(zhǔn)確測量電子政務(wù)系統(tǒng)的復(fù)雜性,是進(jìn)行系統(tǒng)信息資源管理、IT服務(wù)評估、內(nèi)部信息化績效評估、系統(tǒng)設(shè)計(jì)評估與優(yōu)化、運(yùn)維服務(wù)定價(jià)以及運(yùn)維持續(xù)優(yōu)化等的基礎(chǔ)。電子政務(wù)系統(tǒng)的復(fù)雜性已經(jīng)成為了學(xué)界和業(yè)界關(guān)注的熱點(diǎn)話題之一[1-3]。如,朱銳勛[4]通過對電子政務(wù)系統(tǒng)中的政府行政組織模式變革的分析,提出了電子政務(wù)系統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)交換、應(yīng)用集成和體系結(jié)構(gòu)的復(fù)雜性。Lee[5]認(rèn)為不同級別的任務(wù)復(fù)雜性會導(dǎo)致人們使用不同的決策標(biāo)準(zhǔn)和不同的驗(yàn)收決策模式,電子政務(wù)的任務(wù)復(fù)雜性影響了在線服務(wù)質(zhì)量。相麗玲[6]和朱景偉[7]基于復(fù)雜適應(yīng)系統(tǒng)理論對電子政務(wù)系統(tǒng)的復(fù)雜性進(jìn)行了研究,提出了電子政務(wù)系統(tǒng)的設(shè)計(jì)工作和建設(shè)的發(fā)展策略。上述研究對電子政務(wù)系統(tǒng)的復(fù)雜性進(jìn)行了初步探討,但仍缺乏對電子政務(wù)系統(tǒng)復(fù)雜性測量的研究,難以有效評估電子政務(wù)系統(tǒng)復(fù)雜性程度。
電子政務(wù)是信息系統(tǒng)在政府管理和服務(wù)中的具體應(yīng)用,因此電子政務(wù)系統(tǒng)的復(fù)雜性測量可以充分借鑒信息系統(tǒng)領(lǐng)域的研究成果。目前對信息系統(tǒng)復(fù)雜性測量的研究主要從信息系統(tǒng)軟件[8]、體系結(jié)構(gòu)[9]和配置過程[10]等視角展開,其中基于軟件視角的測量模型最為傳統(tǒng),并遵循軟件開發(fā)方法的演進(jìn)過程,分別面向軟件結(jié)構(gòu)[11-14]、軟件對象[15-20]以及面向軟件交互語句建立測量模型;基于體系結(jié)構(gòu)視角的研究主要是用于解決系統(tǒng)設(shè)計(jì)、優(yōu)化和重構(gòu)等方面的問題,分別利用Petri網(wǎng)、信息熵[21-27]等測量方法;基于配置過程視角的研究主要針對信息系統(tǒng)的運(yùn)維過程,對運(yùn)維流程進(jìn)行結(jié)構(gòu)抽象建模并按照配置行為進(jìn)行復(fù)雜性模型求解[28-34]。以上研究大多是基于信息系統(tǒng)設(shè)計(jì)、實(shí)現(xiàn)或運(yùn)維的某個(gè)階段,模型缺乏全面性和整體性,且大多未考慮用戶行為和時(shí)間維度,其測量模型缺乏動(dòng)態(tài)性因素。
為了全面、動(dòng)態(tài)地測量電子政務(wù)系統(tǒng)的復(fù)雜性,論文從數(shù)據(jù)復(fù)雜性角度,構(gòu)建了包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)量和數(shù)據(jù)操作三個(gè)維度的電子政務(wù)系統(tǒng)復(fù)雜性的測量模型,從信息的寬度(數(shù)據(jù)結(jié)構(gòu),即實(shí)體數(shù)、實(shí)體類型及相應(yīng)權(quán)數(shù)、實(shí)體關(guān)系)、信息的長度(數(shù)據(jù)量)、信息的動(dòng)態(tài)性(數(shù)據(jù)操作,即基于時(shí)間的用戶操作行為)等方面建立信息熵模型,并利用復(fù)雜性格空間理論對數(shù)據(jù)復(fù)雜性進(jìn)行綜合測量,最后通過A市中小企業(yè)公共服務(wù)平臺系統(tǒng)來驗(yàn)證論文提出的測量模型和計(jì)算方法的有效性。
從信息處理論的角度來看,電子政務(wù)系統(tǒng)本質(zhì)上是政務(wù)數(shù)據(jù)處理系統(tǒng),其主要功能就是對政務(wù)數(shù)據(jù)進(jìn)行采集、加工、存儲和傳播。數(shù)據(jù)既是電子政務(wù)系統(tǒng)的輸入和輸出,也是電子政務(wù)系統(tǒng)的管理對象,電子政務(wù)系統(tǒng)運(yùn)行過程中會不斷累積各類數(shù)據(jù),反映政府的狀態(tài)、特征、行為等[35]。因此,從這個(gè)角度講,數(shù)據(jù)的復(fù)雜性將決定對其進(jìn)行管理的電子政務(wù)系統(tǒng)的復(fù)雜度,合理準(zhǔn)確的界定數(shù)據(jù)復(fù)雜性的內(nèi)容和范圍,是測量電子政務(wù)系統(tǒng)復(fù)雜度的一個(gè)嶄新視角。
數(shù)據(jù)復(fù)雜性是指信息系統(tǒng)在運(yùn)行過程中,從數(shù)據(jù)的靜態(tài)性和動(dòng)態(tài)性兩個(gè)層面所反映的數(shù)據(jù)本身以及用戶對數(shù)據(jù)對象操作的復(fù)雜程度。它包含了數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)量和數(shù)據(jù)操作三個(gè)維度,數(shù)據(jù)的靜態(tài)性包含了數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)量,而數(shù)據(jù)操作則表征用戶行為的數(shù)據(jù)動(dòng)態(tài)性。數(shù)據(jù)復(fù)雜性測量空間{數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)量,數(shù)據(jù)操作}是一個(gè)三元組的測量域,而對于每一個(gè)測量域又由不同的測量指標(biāo)構(gòu)成,同時(shí)每一個(gè)測量指標(biāo)對數(shù)據(jù)復(fù)雜性的影響程度是不同的。電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量模型如圖1所示。
圖1 電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量模型
電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量模型能夠更加準(zhǔn)確、全面的測量電子政務(wù)系統(tǒng)的復(fù)雜性。一方面,電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量模型不但包括了系統(tǒng)本身的靜態(tài)數(shù)據(jù),而且考慮了用戶對各網(wǎng)頁頁面進(jìn)行操作的動(dòng)態(tài)數(shù)據(jù),其中靜態(tài)的數(shù)據(jù)復(fù)雜性主要體現(xiàn)在后臺數(shù)據(jù)庫的數(shù)據(jù)本身,包含了數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)量,測量其復(fù)雜性的基本單元是數(shù)據(jù)表,而動(dòng)態(tài)的數(shù)據(jù)復(fù)雜性則體現(xiàn)在表征用戶行為的數(shù)據(jù)操作上,測量其復(fù)雜性的基本單元?jiǎng)t是網(wǎng)頁頁面。
另一方面,從系統(tǒng)生命周期看,電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量模型不僅涵蓋了系統(tǒng)設(shè)計(jì)階段的數(shù)據(jù)結(jié)構(gòu),而且考慮了系統(tǒng)運(yùn)維階段的數(shù)據(jù)量和用戶的數(shù)據(jù)操作。原有信息系統(tǒng)復(fù)雜性的研究更多的是研究如何測量軟件本身或者系統(tǒng)體系結(jié)構(gòu)的復(fù)雜性,而這些復(fù)雜性決定于系統(tǒng)設(shè)計(jì)階段,沒有考慮系統(tǒng)運(yùn)維階段產(chǎn)生的復(fù)雜性。電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性測量模型將數(shù)據(jù)量和數(shù)據(jù)操作納入測量范疇,使得對電子政務(wù)系統(tǒng)數(shù)據(jù)復(fù)雜性的測量更加全面,這也將有助于電子政務(wù)系統(tǒng)運(yùn)維服務(wù)成本估算、運(yùn)維服務(wù)定價(jià)和運(yùn)維持續(xù)優(yōu)化。
2.1數(shù)據(jù)復(fù)雜性的信息熵計(jì)算方法
信息熵最早由信息論之父 C. E. Shannon[36]提出,信息熵是指把信息中排出了冗余后的平均信息量。
定義1:若一個(gè)X的值域?yàn)椋鹸1,x2,…,xn}每個(gè)基本的測量要素對總體的復(fù)雜性的平均信息量貢獻(xiàn)為:,則數(shù)據(jù)復(fù)雜性信息熵函數(shù)可以表示為:
2.1.1數(shù)據(jù)結(jié)構(gòu)的信息熵模型
數(shù)據(jù)結(jié)構(gòu)是指系統(tǒng)存儲、組織數(shù)據(jù)的方式,而它的基礎(chǔ)是數(shù)據(jù)模型,數(shù)據(jù)模型是一個(gè)描述數(shù)據(jù)、數(shù)據(jù)聯(lián)系、數(shù)據(jù)語義以及一致性約束的概念工具的集合,而其中實(shí)體聯(lián)系模型(E-R模型)是由Peter Pin-Shan Chen于1976年提出的,被視為目前最適用的描述數(shù)據(jù)結(jié)構(gòu)的方法[35],所以應(yīng)用E-R模型來描述數(shù)據(jù)結(jié)構(gòu)是最佳的選擇。
E-R模型中主要有實(shí)體、聯(lián)系和屬性三個(gè)維度的8個(gè)指標(biāo),其中實(shí)體中主要是實(shí)體集數(shù)對數(shù)據(jù)復(fù)雜性的影響。聯(lián)系中主要包含了聯(lián)系集數(shù)、二元聯(lián)系、M:N聯(lián)系、1:N聯(lián)系和IsA聯(lián)系等6個(gè)指標(biāo),其中聯(lián)系集數(shù)和IsA聯(lián)系這兩個(gè)因素主要是數(shù)量大小的影響,而二元聯(lián)系指的是二元聯(lián)系在聯(lián)系所占的比例,M:N聯(lián)系和1:N聯(lián)系是指兩者在二元聯(lián)系中的比例,這幾個(gè)指標(biāo)是指單個(gè)基本要素對整體要素不同的信息貢獻(xiàn)對數(shù)據(jù)復(fù)雜性的影響。而屬性有屬性數(shù)和屬性類型兩個(gè)指標(biāo),屬性數(shù)是各個(gè)實(shí)體集和聯(lián)系集中屬性數(shù)的總和,同時(shí)每一個(gè)屬性可能會對應(yīng)不同的數(shù)據(jù)類型,而數(shù)據(jù)類型的不同也使得數(shù)據(jù)可取值的域是不同的,按照存儲空間的字節(jié)大小將SQL的常用的24個(gè)劃分為八個(gè)屬性類型:k1=0.01、k2=0.02、k3=0.04、k4=0.08、k5=0.09、k6=0.1、k7=0.16、k8=0.5。屬性類型的分類如表1所示。
表1 屬性類型的分類
其余在這里沒有討論的和可變存儲空間的數(shù)據(jù)類型可按實(shí)際情況進(jìn)行重新設(shè)定其屬性類型等級,例如char和varchar等。對數(shù)據(jù)結(jié)構(gòu)的每一個(gè)測量指標(biāo)進(jìn)行復(fù)雜性測量如下:
(1)實(shí)體
實(shí)體是在現(xiàn)實(shí)世界中區(qū)別于其他對象的“事物”或“對象”,電子政務(wù)系統(tǒng)中實(shí)體的測量因素主要是實(shí)體集的數(shù)量對數(shù)據(jù)復(fù)雜性的影響,則:
定義2:設(shè)電子政務(wù)系統(tǒng)E-R模型中實(shí)體集數(shù)為nm,則實(shí)體集的復(fù)雜性信息量為:
(2)聯(lián)系
聯(lián)系是實(shí)體間的相互關(guān)聯(lián),聯(lián)系對于數(shù)據(jù)復(fù)雜性的影響因素主要有:聯(lián)系集數(shù)、M:N聯(lián)系、1:N聯(lián)系、二元聯(lián)系和IsA聯(lián)系。其中,對每一項(xiàng)的復(fù)雜性測量如下:
a.聯(lián)系集數(shù)
聯(lián)系集數(shù)指E-R模型中聯(lián)系集的總數(shù)量,也就是E-R模型中“菱形”的總個(gè)數(shù),則:
定義3:設(shè)電子政務(wù)系統(tǒng)E-R模型中聯(lián)系集數(shù)為np,則聯(lián)系集的復(fù)雜性信息量為:
b.二元聯(lián)系
E-R模型中二元聯(lián)系的數(shù)量不用會影響數(shù)據(jù)結(jié)構(gòu)的復(fù)雜性,將E-R模型中二元聯(lián)系數(shù)與聯(lián)系集數(shù)的比定義為二元聯(lián)系的復(fù)雜性平均信息貢獻(xiàn)量,則:
定義4:設(shè)電子政務(wù)系統(tǒng)E-R模型中聯(lián)系集數(shù)為np,二元聯(lián)系數(shù)為nq,則二元聯(lián)系的復(fù)雜性信息量為:
c.M:N聯(lián)系
影射基數(shù)是指一個(gè)實(shí)體通過一個(gè)聯(lián)系集能同時(shí)與多少個(gè)實(shí)體相關(guān)聯(lián),它在二元聯(lián)系中包含了三種情況:一對一、一對多(多對一)和多對多,可以將其概括為1:N和M:N兩種情況,其中1:N聯(lián)系的總數(shù),包含了一對一和一對多的情況,所以對聯(lián)系的復(fù)雜性測量,主要是對M:N聯(lián)系和1:N聯(lián)系進(jìn)行測量。則:
定義5:設(shè)電子政務(wù)系統(tǒng)E-R模型的聯(lián)系集中M:N聯(lián)系數(shù)為ns,二元聯(lián)系數(shù)為nq,則M:N聯(lián)系的復(fù)雜性信息量為:
d.1:N聯(lián)系
1:N聯(lián)系包含了聯(lián)系中一對一和一對多的情況,則:
定義6:設(shè)電子政務(wù)系統(tǒng)E-R模型的聯(lián)系集中1:N聯(lián)系數(shù)為ns,二元聯(lián)系數(shù)為nq,則1:N聯(lián)系的復(fù)雜性信息量為:
e.IsA聯(lián)系數(shù)
實(shí)體集中有時(shí)包含一些子集,子集中的實(shí)體在某些方面區(qū)別于實(shí)體集中的其他實(shí)體。這是對于實(shí)體集內(nèi)部的一種分組,用父類-子類聯(lián)系也就IsA聯(lián)系來測量其復(fù)雜性,則:
定義7: 設(shè)電子政務(wù)系統(tǒng)E-R模型中IsA聯(lián)系數(shù)為nu,第i個(gè)IsA聯(lián)系中有1個(gè)父類實(shí)體,nui個(gè)子類實(shí)體,則第i個(gè)IsA聯(lián)系的復(fù)雜性信息量為:
則電子政務(wù)系統(tǒng)E-R模型中總的IsA聯(lián)系復(fù)雜性信息量為:
(8)
(3)屬性
屬性是把實(shí)體集或聯(lián)系集映射到域的函數(shù)上,用來描述實(shí)體或聯(lián)系的屬性值是存儲在系統(tǒng)中數(shù)據(jù)的重要組成部分,實(shí)體和聯(lián)系都有屬性,每個(gè)屬性都有一個(gè)可取值的域。屬性有復(fù)合屬性、多值屬性和派生屬性等,主要包含了屬性數(shù)和屬性類型兩個(gè)指標(biāo)。
a.屬性數(shù)
屬性數(shù)是指實(shí)體集和聯(lián)系集中屬性的個(gè)數(shù)總和,則:
定義8: 設(shè)電子政務(wù)系統(tǒng)E-R模型中實(shí)體集和聯(lián)系集總和為na,則na=nm+np,第i實(shí)體集或聯(lián)系集的屬性數(shù)為ni,則i中的屬性復(fù)雜性信息量為:
則電子政務(wù)系統(tǒng)E-R模型中總的屬性復(fù)雜性信息量為:
(10)
b.屬性類型
在電子政務(wù)系統(tǒng)中數(shù)據(jù)有兩種特征:類型和長度。所謂類型就是以數(shù)據(jù)的表現(xiàn)方式和存儲方式來劃分的數(shù)據(jù)種類,屬性類型是根據(jù)數(shù)據(jù)類型的不同來進(jìn)行劃分,則:
定義9:設(shè)屬性中的八個(gè)屬性類型k1, k2, k3,k4, k5, k6, k7和k8所對應(yīng)每種分類中包含的數(shù)據(jù)類型出現(xiàn)的總個(gè)數(shù)為:n1,n2,n3,n4,n5,n6,n7和n8,則總的屬性個(gè)數(shù)為:n= n1+n2+n3+n4+n5+n6+n7+n8,則總的屬性類型的復(fù)雜性信息量為:
2.1.2數(shù)據(jù)量的信息熵模型
在電子政務(wù)系統(tǒng)中,數(shù)據(jù)量的大小對數(shù)據(jù)復(fù)雜性有最直接的影響,數(shù)據(jù)量是指二維表所包含記錄數(shù)的多少,因行數(shù)有對應(yīng)著元組數(shù),所以用元組數(shù)來測量其復(fù)雜性。數(shù)據(jù)結(jié)構(gòu)已經(jīng)確定了數(shù)據(jù)庫的“寬度”,它的“高度”主要是數(shù)據(jù)量的不同所決定的,即元組數(shù)的大小。數(shù)據(jù)量是測量靜態(tài)數(shù)據(jù)復(fù)雜性的重要指標(biāo),則:
定義10:設(shè)電子政務(wù)系統(tǒng)中的第i張表的元組數(shù)為mi,共有n張表,則表i中的數(shù)據(jù)量復(fù)雜性信息量為:
則電子政務(wù)系統(tǒng)總的數(shù)據(jù)量復(fù)雜性信息量為:
(13)
2.1.3數(shù)據(jù)操作的信息熵模型
在完成了對靜態(tài)數(shù)據(jù)的復(fù)雜性建模之后,動(dòng)態(tài)的數(shù)據(jù)復(fù)雜性就主要體現(xiàn)在了由用戶對政務(wù)平臺各網(wǎng)頁的數(shù)據(jù)操作上。而從前臺用戶對網(wǎng)頁的數(shù)據(jù)訪問行為來分析,可以從用戶行為強(qiáng)度(訪問量)、行為密度(訪問頻度、并發(fā)數(shù))、行為的規(guī)律性(高密度訪問比,即存在多少峰值訪問)三個(gè)方面衡量,因此可以從訪問量、訪問頻度、并發(fā)和高于平均訪問的時(shí)間比等指標(biāo)分析其復(fù)雜程度。這幾個(gè)指標(biāo)的測量模型如下:
a.訪問量
訪問量的大小主要取決于在復(fù)雜性測量時(shí)間間隔內(nèi)用戶對電子政務(wù)平臺網(wǎng)站中各網(wǎng)頁的訪問操作數(shù)量。則:
定義11:設(shè)電子政務(wù)系統(tǒng)平臺實(shí)施運(yùn)行以來,用戶對電子政務(wù)平臺各網(wǎng)頁的操作總數(shù)為nq,則訪問量的數(shù)據(jù)復(fù)雜性信息量為:
b.訪問頻度
訪問頻度是指單位時(shí)間內(nèi)用戶對電子政務(wù)網(wǎng)頁的訪問數(shù),也就是在實(shí)施電子政務(wù)系統(tǒng)以來用戶對系統(tǒng)網(wǎng)頁的日平均訪問量。則:
定義12: 設(shè)在實(shí)施電子政務(wù)以來的時(shí)間間隔為t內(nèi),用戶對電子政務(wù)系統(tǒng)中各網(wǎng)頁的訪問總數(shù)為nq,訪問速率為rk,則:
訪問頻度的復(fù)雜性信息量為:
(16)
c.并發(fā)
在同一個(gè)時(shí)間點(diǎn)上,多個(gè)用戶同時(shí)對同一網(wǎng)頁進(jìn)行操作,會造成并發(fā)。在這樣的網(wǎng)站平臺中,必須提供一定的并發(fā)機(jī)制以確保用戶訪問的互不干擾,所以并發(fā)的多少會直接影響動(dòng)態(tài)數(shù)據(jù)的復(fù)雜性。數(shù)據(jù)操作的復(fù)雜性實(shí)際是由并發(fā)數(shù)的大小、并發(fā)的次數(shù)以及發(fā)生并發(fā)的網(wǎng)頁數(shù)所決定的,則:
定義14:設(shè)在復(fù)雜性測量時(shí)間間隔期△t內(nèi),產(chǎn)生并發(fā)的網(wǎng)頁數(shù)為nc,第i個(gè)網(wǎng)頁中用戶訪問的并發(fā)數(shù)為nci,并發(fā)數(shù)為nci共有ncij,則第i個(gè)操作對象的并發(fā)數(shù)復(fù)雜性的信息量為:
總的并發(fā)數(shù)復(fù)雜性的信息量為:
(18)
d.高于平均訪問的時(shí)間比
電子政務(wù)類的網(wǎng)站在處理用戶訪問時(shí),其數(shù)據(jù)復(fù)雜性除了有較高的訪問量和并發(fā)數(shù)直接影響之外,用戶訪問的分布情況也起著關(guān)鍵的作用。其中,高于平均訪問量的時(shí)間在整個(gè)測量時(shí)間內(nèi)的比重越高,數(shù)據(jù)操作的復(fù)雜程度就越高,則:
定義13: 設(shè)在復(fù)雜性測量時(shí)間間隔期△t內(nèi),用戶對電子政務(wù)系統(tǒng)的單位時(shí)間內(nèi)的訪問量為,其中高于的時(shí)間總和是△t1,高于平均訪問的時(shí)間比為rk,則:
用戶更新操作比率的復(fù)雜性信息量為:
(20)
2.2數(shù)據(jù)復(fù)雜性的格空間計(jì)算方法
根據(jù)上面的研究過程可以求出各個(gè)測量指標(biāo)的信息量熵值,由圖1可以看出,對數(shù)據(jù)復(fù)雜性的測量是先對數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)量和數(shù)據(jù)操作三個(gè)子維度進(jìn)行測量,是一個(gè)多維的測量問題,而對數(shù)據(jù)復(fù)雜性的整體進(jìn)行測量則需要建立多維統(tǒng)一模型,本文將應(yīng)用復(fù)雜網(wǎng)格空間理論[37] [38]建立數(shù)據(jù)復(fù)雜性熵尺度的多維矢量空間測量模型來統(tǒng)一測量。
2.2.1多維矢量空間復(fù)雜性信息量模型
設(shè)Xn(xi, i=1,2,…,n)為H熵空間上的n維矢量空間,即Xn(xi, i=1,2,…,n)→Hn,分量xi∈Hn。對于這個(gè)在多維概念空間的管理信息力場,借助了功的原理與多維矢量空間的歐幾里得關(guān)系,則可以得到分量wi其在特定矢量空間中的能量方程式:
那么,全部廣義信息F的能量信息量為:
(22)
2.2.2基于復(fù)雜網(wǎng)格空間理論的尺度模型
由復(fù)雜性域格空間wi的元格空間wij可定義‖wij‖:wi→H表示元格空間wij的長度或單位j的所含信息內(nèi)容?!瑆ij‖, ‖wij-wi(j+1)‖是wij的尺度或是wi到wi(j+1)的距離,它的位置由其長度和前趨單位中由順序的位置關(guān)系所給出, 則和, 其中mi=max{nij︱j=1,2,…,ni}。
為獲得全部復(fù)雜性信息量值,定義一個(gè)W1×W2×W3×…×Wi×…×Wn的n維熵尺度空間, Wi的維度第一次被劃分為n維,其中分量Wi的維度為ni。若假設(shè)∪是一個(gè)影像,定義∪為:W1×W2×W3×…×Wi×…×Wn→Hn,∪是Hn上的n維張量。定義這個(gè)張量為Kn(H),也是H上的一個(gè)矢量空間。如果定義一個(gè)n×m矩陣Si(m=max{m1,m2,…,mn};i=1,2,…,m)由W1×W2×W3×…×Wi×…×Wn上的分量Wki(akij)(i=1,2,…,ni;j=1,2,… ,mi;k=1,2,…,n)的矢量對應(yīng)行所構(gòu)成,如果末行的列數(shù)小于m則用0補(bǔ)齊,那么‖∪i‖=‖∪i(W)‖=‖Si‖是張量的形式,表示信息能分量Wi的統(tǒng)一管理信息能的量值。
若設(shè)集合(Kn(H),‖∪i‖)為管理信息能n維空間,則H上的尺度或從Wi到Wi-1的距離定義為下式:
這是信息能分量Wi-1的之后分量Wi需要產(chǎn)生的全部復(fù)雜信息能信息量,則:
(24)
是全部張量的熵值,為全部需要產(chǎn)生的信息能信息量。
3.1 A市中小企業(yè)公共服務(wù)平臺系統(tǒng)介紹
A市中小企業(yè)公共服務(wù)平臺系統(tǒng)是于2012年2月26日開始上線運(yùn)行的電子政務(wù)類服務(wù)平臺網(wǎng)站,專門為該市內(nèi)中小企業(yè)搭建了一個(gè)信息交流的平臺,通過對整個(gè)城市內(nèi)中小企業(yè)的信息整合,讓企業(yè)更好的在企業(yè)集群中找到自己的供應(yīng)商和市場空間,政府通過透明化的政策和信息支持來幫助中小企業(yè)更好地發(fā)展。而為了對該服務(wù)平臺系統(tǒng)的數(shù)據(jù)復(fù)雜性進(jìn)行測量,特統(tǒng)計(jì)相關(guān)指標(biāo)數(shù)據(jù)如表2和表3所示(時(shí)間:2013年2月26日,即△t=1440min):
表2 A市中小企業(yè)公共服務(wù)平臺系統(tǒng)數(shù)據(jù)復(fù)雜性各自維度相關(guān)指標(biāo)取值
表2(續(xù)) A市中小企業(yè)公共服務(wù)平臺系統(tǒng)數(shù)據(jù)復(fù)雜性各自維度相關(guān)指標(biāo)取值
表3 A市中小企業(yè)公共服務(wù)平臺各網(wǎng)頁并發(fā)情況
3.2 A市中小企業(yè)公共服務(wù)平臺系統(tǒng)數(shù)據(jù)復(fù)雜性測量值計(jì)算
3.2.1數(shù)據(jù)復(fù)雜性分量信息量
由表2可以得到數(shù)據(jù)復(fù)雜性測量指標(biāo)的相關(guān)取值,并根據(jù)論文第2部分各測量公式可以計(jì)算出各復(fù)雜性量值,如表4所示。
求出A市中小企業(yè)公共服務(wù)平臺系統(tǒng)分量構(gòu)成指標(biāo)的復(fù)雜性量值后,需要通過多維統(tǒng)一的復(fù)雜性計(jì)算模型來求出系統(tǒng)分量的復(fù)雜性量值,用表4計(jì)算的各復(fù)雜性信息量值帶入到式(21)來求出數(shù)據(jù)結(jié)構(gòu)復(fù)雜性信息量值為:
其中,數(shù)據(jù)量復(fù)雜性測量只有唯一個(gè)子維度,即:
290.2142
表4 A市中小企業(yè)公共服務(wù)平臺系統(tǒng)各指標(biāo)復(fù)雜性信息量
數(shù)據(jù)操作的復(fù)雜性信息量值為:
w1、w2、w3即A市中小企業(yè)公共服務(wù)平臺系統(tǒng)的數(shù)據(jù)復(fù)雜性分量數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)量和數(shù)據(jù)操作三者的復(fù)雜性信息量值。
3.2.2數(shù)據(jù)復(fù)雜性統(tǒng)一信息量
由表4的數(shù)值以及公式(24)可以求出A市中小企業(yè)公共服務(wù)平臺系統(tǒng)的數(shù)據(jù)復(fù)雜性多維統(tǒng)一信息量,即:
290.2142
72.3460
由式(23)可以得出A市中小企業(yè)公共服務(wù)平臺系統(tǒng)數(shù)據(jù)復(fù)雜性多維統(tǒng)一的信息量為:
3.3結(jié)果分析與討論
對復(fù)雜度的計(jì)算結(jié)果分析可知,w1,w2,w3分別是A市中小企業(yè)服務(wù)平臺中數(shù)據(jù)結(jié)構(gòu)(結(jié)構(gòu))、數(shù)據(jù)量(信息量)和數(shù)據(jù)操作(行為)三個(gè)方面的復(fù)雜性分量,‖w‖E則為統(tǒng)一的復(fù)雜性總值,二者結(jié)合起來,可作為從系統(tǒng)的局部到系統(tǒng)的整體綜合評價(jià)系統(tǒng)復(fù)雜性的評價(jià)標(biāo)準(zhǔn),其值越大,表示系統(tǒng)越復(fù)雜。
從案例中的復(fù)雜性信息量值計(jì)算結(jié)果w2>w3>w1可以看出,對數(shù)據(jù)復(fù)雜性起決定性作用的是數(shù)據(jù)量的大小,因?yàn)樽鳛槌恋黼娮诱?wù)業(yè)務(wù)的數(shù)據(jù)反映,其復(fù)雜性影響顯然最大,另外還能說明,隨著系統(tǒng)中元組數(shù)的增多,數(shù)據(jù)復(fù)雜性也會越來越大。同時(shí),數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)操作同樣對數(shù)據(jù)復(fù)雜性產(chǎn)生了影響,本案例中的w3略大于w1,說明因較高和不規(guī)律的用戶訪問使得行為數(shù)據(jù)對數(shù)據(jù)復(fù)雜性的整體影響要大于結(jié)構(gòu)數(shù)據(jù)。特別地,行為數(shù)據(jù)為用來表征用戶行為的動(dòng)態(tài)數(shù)據(jù)復(fù)雜性的指標(biāo),在本案例中其復(fù)雜性量值大于數(shù)據(jù)結(jié)構(gòu)的復(fù)雜性量值,說明行為數(shù)據(jù)是測量電子政務(wù)系統(tǒng)數(shù)據(jù)復(fù)雜性量值中非常重要的考慮因素,結(jié)合電子政務(wù)系統(tǒng)用戶的多樣化特點(diǎn),因此其用戶的行為強(qiáng)度(訪問量)、行為密度(訪問頻度、并發(fā)數(shù))、行為的規(guī)律性(高密度訪問比,即存在多少峰值訪問)均比傳統(tǒng)企業(yè)內(nèi)信息系統(tǒng)要來的復(fù)雜,因此分析與平衡電子政務(wù)系統(tǒng)的復(fù)雜性可以先從行為強(qiáng)度、行為密度和行為規(guī)律性等幾個(gè)指標(biāo)入手。
電子政務(wù)系統(tǒng)的信息資源管理和績效評估等問題的解決必須首先對政務(wù)平臺的本身進(jìn)行合理評價(jià)和度量,而論文提出的數(shù)據(jù)復(fù)雜性是測量電子政務(wù)系統(tǒng)復(fù)雜度的一個(gè)全新視角。為了全面、動(dòng)態(tài)地測量電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性,論文將數(shù)據(jù)復(fù)雜性分為數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)量和數(shù)據(jù)操作等三個(gè)維度,構(gòu)建了電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性結(jié)構(gòu)模型,并利用信息熵和復(fù)雜網(wǎng)格空間進(jìn)行電子政務(wù)系統(tǒng)的數(shù)據(jù)復(fù)雜性的模型計(jì)算。此方法從電子政務(wù)平臺的系統(tǒng)本身和前臺用戶對平臺網(wǎng)頁的訪問這兩個(gè)層面來全面準(zhǔn)確地測量其數(shù)據(jù)復(fù)雜性,不但能夠提供電子政務(wù)系統(tǒng)全過程復(fù)雜性的測量方法,也為合理解決電子政務(wù)系統(tǒng)平臺的成本估算、信息化績效評估、運(yùn)維服務(wù)定價(jià)等問題,為減少復(fù)雜性、實(shí)行簡化設(shè)計(jì),保障平穩(wěn)運(yùn)行并持續(xù)改善提供了理論依據(jù)和量化參考,同時(shí),本文為復(fù)雜性研究拓展了新的空間。
[1] 王立華.中國農(nóng)村電子政務(wù)準(zhǔn)備度評價(jià)——基于中國27個(gè)省(自治區(qū))2004-2009年相關(guān)統(tǒng)計(jì)數(shù)據(jù)[J].情報(bào)雜志,2012,(05):139-143.
[2] Kutsikos K, Kontos G. A systems-based complexity management framework for collaborative e-government services[J]. International Journal of Applied Systemic Studies, 2011, 4(1): 1-16.
[3] Helbig N, Ramón Gil-García J, Ferro E. Understanding the complexity of electronic government: Implications from the digital divide literature[J]. Government Information Quarterly, 2009, 26(1): 89-97.
[4] 朱銳勛. 試論電子政務(wù)系統(tǒng)的網(wǎng)絡(luò)復(fù)雜性[J]. 電子政務(wù), 2006, (93): 15-17.
[5] Lee JK, Rao HR. Task complexity and different decision criteria for online service acceptance: A comparison of two e-government compliance service domains[J]. Decision Support Systems, 2009, 47: 424-435.
[6] 相麗玲, 蔡華利. 電子政務(wù)建設(shè)的復(fù)雜性特征及其發(fā)展策略——基于 CAS理論的思考[J]. 生產(chǎn)力研究, 2007, (21): 88-91.
[7] 朱景偉, 張世明. 電子政務(wù)系統(tǒng)的復(fù)雜適應(yīng)系統(tǒng)建模[J]. 微型電腦應(yīng)用, 2009,25 (11): 60-64.
[8] 李兵, 王浩, 李增揚(yáng)等. 基于復(fù)雜網(wǎng)絡(luò)的軟件復(fù)雜性度量研究[J] 電子學(xué)報(bào), 2006, 34(12): 2371-2375.
[9] Luo Ai-min, Huang Li. Entropy Based Complexity Analysis for Architecture of Information System [C]//2008 IEEE International Conference on Networking and Control. Sensing and Control, 2008, 2: 1734-1738.
[10] Brown A B, Hellerstein J L. A Model of Configuration Complexity and Its Application to a Change Management System [C]//Proc, of the 9th IFIP/IEEE International Symposium on Integrated Management. Nice, France: IEEE Press, 2005: 631-644.
[11] McCabe T J.A Complexity Measure [J]. IEEE Transactions of Software Engineering. 1976, SE-2(4):308-320.
[12] Joseph K, Kearney, Robert L, etc. Software Complexity Measurement [J]. Communications of the ACM.1986, 29(11): 1044-1050.
[13] Halstead M H. Elements of Software Science [J]. New York: Elsevier North Holland, 1977.
[14] Erman C, Martha G. Software Complexity and Its Impacts in Embedded Intelligent Real-Time Systems [J]. The Journal of Systems and Software, 2005, 78(2): 128-145.
[15] Chidamber S R, Kemerer C F. Towards a metrics suite for object oriented design [C]//In: Conference Proceedings on Object-oriented Programming systems, languages, and applications. Phoenix, Arizona, United States: ACM, 1991: 197-211.
[16] Brito E, Abreu F. The MOOD metrics set [C]//In: Proceedings of ECOOP’95 Workshop on Metrics. Aarhus, Denmark, 1995.
[17] 李兵,王浩,李增揚(yáng).基于復(fù)雜網(wǎng)絡(luò)的軟件復(fù)雜性測量研究[J].電子學(xué)報(bào),2006, 34(12): 2371-2375.
[18] Loernz M, Kidd J. Object-Oriented Software Metrics, A Practical Guide [M]. Englewood Clisff, N.J.: PTR Prentice-Hall, 1994.
[19] Wei Li. Another metric suite for object-oriented programming[J]. Journal of Systems and Software, 1998, 44(2): 155-162.
[20] Chen JY , Lu J F. A new metric for object-oriented design[J]. Information and Software Technology, 1993, 35(4): 232-240.
[21] 王忠杰,徐曉飛,戰(zhàn)德臣.基于熵的信息系統(tǒng)業(yè)務(wù)模型復(fù)雜性測量[J].計(jì)算機(jī)科學(xué),2006, 33(1): 104-107.
[22] 高暉,張莉.軟件體系結(jié)構(gòu)層次的結(jié)構(gòu)度量研究[J].計(jì)算機(jī)工程與應(yīng)用,2007, 43(24): 19-23.
[23] Snider G. Measuring the Entropy of Large Software Systems: [Technical Report HPL-2001-221]. HP Laboratories Palo Alto.2001.
[24] 張文,劉剛,朱一凡.信息系統(tǒng)體系結(jié)構(gòu)復(fù)雜性測量方法研究[J].計(jì)算機(jī)應(yīng)用研究,2011, 28(11): 4081-4085.
[25] Luo Ai-min, Huang Li. Entropy Based Complexity Analysis for Architecture of Information System [C]//Proc, 2008 IEEE International Conference on Networking and Control. Sensing and Control, 2008, 2: 1734-1738.
[26] Wang J G, Gan R C. Structural Complexity Analysis of Information Systems Based on Petri Nets [J]. Journal Beijing Institute of Technology, 1999, 8(4): 1-10.
[27] 孫世溫,夏承遺,王莉.基于復(fù)雜網(wǎng)絡(luò)的軟件結(jié)構(gòu)測量方法綜述[J].智能系統(tǒng)學(xué)報(bào),2011, 6(3): 208-212.
[28] Brown A B, Hellerstein J L. IBM Research Report: An Approach to Benchmarking Configuration Complexity [C]//Proc, of the 11th ACM Sigops European Workshop, Leuven, Belgium: ACM Press, 2004.
[29] Brown A B, Hellerstein J L. A Model of Configuration Complexity and Its Application to a Change Management System [C]//Proc, of the 9th IFIP/IEEE International Symposium on Integrated Management. Nice, France: IEEE Press, 2005: 631-644.
[30] Diao Y X, Keller A. Quantifying the Complexity of IT Service Management Processes [C]//Proc, of the 17th IFIP/IEEE International Workshop on Distributed Systems: Operations and Management. Dublin, Ireland: IEEE Press, 2006.
[31] Eilam T, Michael H. Managing the configuration complexity of distributed application in internet data centers [C]//Proc, Network and Service Management/IEEE Communications Magazine. IEEE Press, 2006: 166-177.
[32] 韓峰,肖剛,王建新,等.運(yùn)維過程復(fù)雜度建模及有效性驗(yàn)證[J].北京郵電大學(xué)學(xué)報(bào),2009, 32(增刊): 15-19.
[33] 韓峰,王建新,肖剛,等.配置復(fù)雜度模型在系統(tǒng)運(yùn)維中的應(yīng)用[J].計(jì)算機(jī)工程,2010, (3): 37-40.
[34] 雷蕾,毛煒豪.配置復(fù)雜度分析與建模[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010, 19(2): 75-82.
[35] 葛世倫. 企業(yè)管理信息系統(tǒng)—理論、方法、模型 [M]. 北京: 科學(xué)出版社, 2010.
[36] Shannon C E. A Mathematical Theory of Communication [J]. Bell System Technology Journal, 1948, (27) : 379 - 423.
[37] 宋華嶺. 復(fù)雜性測度理論、方法與實(shí)證研究—基于格空間熵尺度的企業(yè)復(fù)雜系統(tǒng)[M]. 北京: 經(jīng)濟(jì)管理出版社, 2010.
[38] 宋華嶺, 金志新, 李金克,等. 企業(yè)管理系統(tǒng)復(fù)雜性評價(jià)的三維尺度模型建模與實(shí)證研究[J]. 管理工程學(xué)報(bào), 2006, (1): 103-108.
Measuring the Data Complexity of the E-government System
YIN Jun, LIU Wei, GE Shi-lun, WANG Nian-xin
(School of Economics and Management, Jiangsu University of Science and Technology, Zhenjiang 212003, China)
Measuring complexity is a prerequisite for managing e-government system’s problems, such as information resource management, IT services evaluation, operation and maintenance services pricing, and sustainable optimization. Recently, complexity research has become a hot topic in the field of e-government system. Many exploratory researches in this area have been conducted in this area, but the issue on e-government systems’ complexity measurement has not yet been fully discussed and developed to reflect dynamic factors. Based on the data of e-government systems, this paper develops a complexity model to measure the e-government system’s complexity, with the calculation method of information entropy and complex grid space. The paper finally conducts an empirical verification with the data of a SMEPSPS (small and medium-sized enterprises public service platform system).
The first part in this paper is to develop a complexity measurement model from the perspective of e-government system’s data. According to the information processing theory, the e-government system can be seen as government affairs’ data processing system. The complexity of data includes affairs data and user behavior data. The data accumulated in the e-government system to some degree can decide the complexity of the e-government system. With the consideration of data’s static and dynamic features, the paper classifies the data complexity into three dimensions: data structure, data volume and data operation. Each dimension can be measured with a series of explicit indicators. After decomposing the three dimensions, we obtain the data complexity of measurement space.
One contribution of the proposed complexity measurement model is its ability to understand that dynamic data about user behavior. The complexity of e-government systems cannot be ignored in the model. Our proposed model is a more complete model for measuring the data not only in the system development but also in the system operation and maintenance.
The second part is about the research method. With the above measurement model, Shannon’s information entropy was used to measure the complexity degree of the three dimensions: data structure, data volume and data operation. The data structure was measured with the E-R model, including three secondary indicators: entity, relation and attribute. The data volume was measured by the number of data record. The data operation was measured with four secondary indicators from three aspects, including the intensity, density and regularity of the operation behavior. Afterwards, we used the complex grid space theory to construct a multidimensional vector space measurement model to synthesize the captured information entropy.
The third part is an analysis of empirical data. With the data collected from the SMEPSPS on February in 2013 in A city, we calculated the complexity degree of data structure, data volume and data operation respectively, which are 26.1, 290.2, and 32.9. Thus, the total data complexity of the unified dimensions of this system is 434.06. Combining these results, we analyzed the system from the two sides of parts and whole. From the calculated values, it’s obvious that the data volume is the reflection of affairs or businesses and contributes the most to the complexity of the whole system. In addition, different from the empirical result of ERP systems in enterprises, the complexity value of user behavior exceeds that of the data structure. This finding indicates that the complexity of user behaviors in the e-government system has relatively more impact on the complexity of whole system.
The last part is the conclusion. The theoretical contribution and practical values of this paper are discussed in this part. For theoretical contributions, the data complexity is a new perspective to measure the complexity of the e-government system and expands the study on the complexity of e-government system, which also provides a theoretical basis for IT service performance evaluation, operation and maintenance pricing and sustainable optimization of the system. As for practical implications, measurement results can be used as a quantitative reference for providing high-quality services, such as data migration and the optimization of e-government system structure. In addition, they can be used as an effective index to measure IT service cost and assess the performance of IT department.
This paper shows the development of a data complexity model, which consists of data structure, data volume and data operation. The model is used to measure the degree of e-government system complexity by employing the calculation method of information entropy and complex grid space theory. The data of the SMEPSPS in A city is used to validate and explain the proposed model and calculation method. The analysis results indicate that the difference between the e-government system and traditional ones is that data operation has a larger influence on the whole data complexity. This research can provide theoretical and practical foundation for solving problems in the e-government system area, including IT service evaluation, the performance evaluation of government IT department, system design evaluation and optimization, operation and maintenance pricing, and sustainable optimization.
e-government system; data complexity; information entropy; complex grid space
中文編輯:杜 ?。挥⑽木庉嫞篊harlie C. Che
TP311
A
1004-6062(2016)01-0212-09
10.13587/j.cnki.jieem.2016.01.027
2013-03-15
2013-12-12
國家自然科學(xué)基金資助項(xiàng)目(71331003,71271104,71471079,71171101,71101065)
尹雋(1978—),女,浙江寧波人。江蘇科技大學(xué)博士研究生,江蘇科技大學(xué)經(jīng)濟(jì)管理學(xué)院講師,研究方向:電子商務(wù)、信息管理與信息系統(tǒng)。