[摘 要] 本文首先介紹遺傳算法的定義和內容,分析了企業(yè)信息化指標體系和企業(yè)信息化措施;其次建立了企業(yè)信息化建設的數學模型;然后運用遺傳算法對數學模型進行分析、求解;最后舉例說明遺傳算法在企業(yè)信息化建設決策中的合理性,并指出了遺傳算法在應用中的不足之處。
[關鍵詞] 企業(yè)信息化;遺傳算法;信息化建設
[中圖分類號]F270.7[文獻標識碼]A[文章編號]1673-0194(2008)21-0070-03
隨著現代信息技術的飛速發(fā)展,信息在各行各業(yè)發(fā)揮著越來越重要的作用,尤其是在企業(yè)中,信息已經和人、物料、資金一并成為了企業(yè)的四大生產資料,任何一個企業(yè)的發(fā)展都離不開對信息的利用。信息論的奠基人Claude E. Shanon在1948年給出了信息的定義:“信息是用來消除不確定性的東西”。在企業(yè)中,信息是對組織的管理決策和實現管理目標具有參考價值的數據,企業(yè)信息化就是企業(yè)應用信息的過程。我國的企業(yè)信息化開始于20世紀80年代,經歷了從企業(yè)產品設計信息化到企業(yè)管理信息化的發(fā)展階段,企業(yè)的信息化使企業(yè)生產效率和利潤有了迅猛的提高。但是,我國企業(yè)的信息化基礎比較薄弱,面對經濟全球化的發(fā)展沖擊尤為明顯,如何應用企業(yè)信息化來提高企業(yè)的核心競爭力已經成為企業(yè)當前及今后戰(zhàn)略發(fā)展的重點。本文通過對企業(yè)信息化以及實現信息化措施的分析,運用遺傳算法這一優(yōu)化算法來解決企業(yè)在信息化建設中的一些問題。
1 遺傳算法
遺傳算法(GA)是由自由派生的隨機優(yōu)化方法,它以自然選擇和演變過程為基礎,但聯系又是不牢靠的。它們最早是由密歇根大學的John Holland在1975年提出并進行研究。它以其很強的解決問題的能力和廣泛的適應性滲透到研究和工程的各個領域,并取得了良好的效果。GA是建立在自然選擇和群體遺傳學機制基礎上的隨機、迭代、進化,具有廣泛的實用性的搜索方法。所有的自然種類都是適應環(huán)境而得以生存,這一自然適應性是GA的主規(guī)律。GA搜索結合了達爾文適者生存和隨機信息交換,前者消除了解中的不適應因素,后者利用了原有解中已有的知識,從而有力地加快了搜索過程。
2 企業(yè)信息化建設的模型
本文構建企業(yè)信息化績效指標體系如表1所示;企業(yè)信息化建設措施如表2所示。
根據表1,設企業(yè)的信息化水平為:A=αA,m為企業(yè)信息化水平指標數,A表示第i個企業(yè)信息化水平指標,取值0或1,1表示信息化水平高,0表示信息化水平低。我們可以通過層次分析法(AHP)得出每個水平指標的一個權重α,并且使得α=1。
根據表2,設企業(yè)信息化建設措施為:B=β,n為企業(yè)信息化建設措施種類,B表示采用第j個建設措施,取值為0或1,1表示采用實施了該措施,0表示沒有實施該措施。β表示實施第j個措施的費用, β=β。
所以,在企業(yè)信息化建設中所遇到的問題有兩個:
一是讓企業(yè)的信息化程度最高,即Max A=αA;二是讓企業(yè)在實施信息化建設中的花費最小,即Min B=
B。信息化水平A隨著信息化建設措施B的實施而變化,因為有的措施增強了一個信息化水平指標,而削弱了另一個信息化水平指標,我們記作A= f(B)??梢钥闯?,這是一個多目標優(yōu)化問題,通過目標的加權和的方法,構造一個優(yōu)化目標函數,即Max Z= υA- ωB,或Max Z= υ
f (B)- ωB。其中υ和ω是權重,表示管理者對目標一與目標二的偏好(υ+ ω =1且0≤υ,ω≤1)。υ > ω表示管理者比較看重企業(yè)信息化建設;反之,表示管理者比較看重信息化建設所需的費用。
3 遺傳算法求解
(1)編碼
遺傳算法的第一步驟是以編碼串的形式表示可供選擇的解,每一個串是一系列具有值的特征;每一個特征的值都可以用一個值來編碼,這個值來自一個叫等位集的離散值的集合。根據問題我們可以用二進制向量作為每一個染色體來表示單個變量的實值。例如信息化水平(110101110)表示企業(yè)的網絡建設水平(A3)、企業(yè)組織機構整合水平(A5)和企業(yè)人員的素質水平(A9)不高,這些方面有待提高。信息化建設措施(01001000)表示增加計算機等硬件設施和建立企業(yè)網站和電子商務。
(2) 產生群體
當t=0時,隨機產生幾個個體組成一個群體P(t),該群體代表優(yōu)化問題的一些可能解的集合,也就是信息化建設中可以采取的幾種可以實施的方案,一般來說,它們并不是最優(yōu)的方案,GA的任務就是從這些群體出發(fā),模擬進化過程,最后得出最優(yōu)方案。
(3)評價
在建立起群體后,下一步是計算群體中每個成員的適合度值,因為每個染色體都是最優(yōu)解的候選。對一個最大值問題來講,第k個成員的適合度F通常是目標函數在這個參數空間中點的估計值。在此問題中我們設置的適合度函數是:F= υαA- ωB。
(4)選擇
在這一階段,我們就需要從當前代中建立一個新的群體P(t+1)。選擇操作以確定哪個父染色體會參與繁殖下一代。一般來說,選擇成員來參與選擇的概率與成員的適合度值成比例。最常見的方式是設定選擇概率P=FF,其中λ是群體的大小,F是第i個染色體的適合度值。這種選擇方法的作用是讓在平均值以上的成員進行繁殖并取代適合度低于平均值的成員。一些染色體可能被選擇多次,這是因為遺傳算法通過保持一個潛在解的群體進行多維搜索,并鼓勵優(yōu)質解。
(5)交叉
遺傳算法的力量從結構化信息與高度適合的個體交叉組合的交換中得到了提升,因此,我們需要的是能開發(fā)染色體之間重要的相似性的交叉算子。交叉概率是一個定義期望染色體數目的參數。如果P=1,則表示群體中的所有的染色體將會進行交叉操作;如果P=0.5,則表示只有一半的染色體將會進行交叉,其余的一半將不進行任何改變,直接補充到新的群體中。
(6) 變異
在生物的進化過程中,基因突變是偶然的現象,所以突變概率P是很小的概率,是將染色體中的某一位基因進行反轉,即1→0或0→1。突變算子可以防止任何一位數遍歷整個群體后收斂于一個值,更重要的是,它防止群體收斂并停滯于局部最優(yōu)點。突變率通常很低,所以通過交叉獲得的好的染色體不會丟失,并且保證算法能搜索到問題解空間的每一點,從而使算法更具有全局優(yōu)化性,增強了遺傳算法的能力。
在自然演變過程中,選擇、交叉和變異都同時出現以繁衍出后代。遺傳算法的詳細實現變化非常大,主要的過程就是迭代過程,如此循環(huán)往復,使群體中最優(yōu)個體的適應度和平均適應度不斷提高,直到最優(yōu)個體的適應度達到某一限值或最優(yōu)個體的適應度和群體的平均適應度不再提高,則迭代過程收斂,算法結束。
4 應用實例
已知在某一企業(yè)的信息化水平中,企業(yè)的管理系統(tǒng)使用水平(A6)、管理者及員工的信息素質水平(A7)和企業(yè)人員吸收培訓及創(chuàng)新水平(A9)不高,因此我們可以用(111110010)來表示。當t=0時,隨機產生的信息化建設措施有增強企業(yè)網絡性能(B3)和培訓企業(yè)信息技術人員(B7)。根據專家打分法我們可以給出企業(yè)信息化指標的權重(見表3)和每項信息化建設措施的費用(見表4)。
我們假設GA的參數為: 迭代次數=20,υ =0.4,ω =0.6,P(t)=5,P=0.5,P=0.15,P=0.02。根據以上遺傳算法可以進行求解,由于這個例子的規(guī)模較小,所以解的收斂較快,最終可以得出的解是(00000011),即本企業(yè)的最佳措施是培訓企業(yè)信息技術人員(B7)和增強企業(yè)信息創(chuàng)新(B8)。
5 結束語
遺傳算法在解決企業(yè)信息化建設中采用了定性和定量相結合的分析方法,在一定程度上使企業(yè)的決策更加合理和科學。當企業(yè)的規(guī)模大、決策復雜時,我們可以采用細分企業(yè)的信息化指標和企業(yè)信息化建設措施來增強決策的準確度。遺傳算法是多個學科結合和參與的產物,它已經成功地運用到了各個領域,但也存在一些不足,如在遺傳算法中,群體規(guī)模和遺傳算子的控制參數的選取是非常困難的,同時它們又是必不可少的實驗參數,這方面已有一些具有指導性的實驗結果。遺傳算法還有一個過早收斂的問題,怎樣阻止其過早收斂也是正在研究的問題之一。
主要參考文獻
[1] 司有和. 企業(yè)信息管理學[M]. 北京:科學出版社,2006.
[2] 熊和金,陳德軍. 智能信息處理[M]. 北京:國防工業(yè)出版社,2006.
[3] 康曉東. 基于數據倉庫的數據挖掘技術[M]. 北京:機械工業(yè)出版社,2004.
[4] Mehmed Kantardzic. 數據挖掘——概念、模型、方法和算法[M]. 閃四清,陳茵,程雁,等譯. 北京:清華大學出版社,2003.
[5] 陳光,匡興華.基于遺傳算法的信息系統(tǒng)安全技術方案[J]. 國防科技大學學報,2005,27(6):130-134.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文