汪杰
(北京化工大學(xué),北京 100089)
社會的發(fā)展離不開科技的進步,科學(xué)技術(shù)是第一生產(chǎn)力,我國每年均在鼓勵社會各界進行科技創(chuàng)新,社會每年都在產(chǎn)生著大量科技成果??萍汲晒霓D(zhuǎn)化是科技成果變?yōu)樯鐣a(chǎn)力、創(chuàng)造價值的重要一步,科技成果的轉(zhuǎn)化過程主要包含3 個步驟,分別是基礎(chǔ)研究、技術(shù)研究與產(chǎn)品研究。首先在基礎(chǔ)研究上,科研院所通過相關(guān)基礎(chǔ)理論的研究在某一領(lǐng)域形成知識形態(tài);接著研發(fā)部門根據(jù)市場信息進行技術(shù)研發(fā),將理論轉(zhuǎn)化為技術(shù),形成準商品;最終在產(chǎn)品研發(fā)階段,技術(shù)產(chǎn)品轉(zhuǎn)移至生產(chǎn)企業(yè),企業(yè)經(jīng)產(chǎn)品孵化,借助規(guī)?;某善樊a(chǎn)生社會價值[1-6]。
科技成果的轉(zhuǎn)移是一項涉及面廣、流程復(fù)雜的系統(tǒng)工程,在這一過程中,會花費大量的人力、財力資源。若能夠在科技成果孵化為產(chǎn)品之前即可通過智能化的算法預(yù)測其社會收益,則對于科學(xué)合理地進行科技項目立項、規(guī)劃科技投資具有重要的指導(dǎo)意義[7-16]?;谝陨夏康?,該文對科技成果的轉(zhuǎn)移預(yù)測進行了相關(guān)研究,并對科技成果的轉(zhuǎn)移流程進行數(shù)學(xué)建模,同時介紹該文使用的感應(yīng)學(xué)習(xí)網(wǎng)絡(luò)理論,使用生產(chǎn)中的實際數(shù)據(jù)進行仿真,從而驗證該文模型與算法的有效性。
在該文的引言階段,已對科技成果轉(zhuǎn)化的各個階段內(nèi)容進行了簡要說明。該文的目的在于通過引入先進的計算機算法,利用科技成果轉(zhuǎn)化過程中的多方面數(shù)據(jù),預(yù)估成果轉(zhuǎn)移的社會效益。因此,仍需對上述過程進行數(shù)學(xué)化的抽象。通過研究發(fā)現(xiàn),從數(shù)學(xué)建模的角度出發(fā),科技成果的轉(zhuǎn)移過程可以分為成果的形成、小型試驗、中期試驗與產(chǎn)品誕生4 個階段。為了承接這4 個階段中的數(shù)據(jù)流,該文設(shè)計了科技成果轉(zhuǎn)移過程流程圖,如圖1 所示。
圖1 中包含4 個子系統(tǒng)與系統(tǒng)間的數(shù)據(jù)流向,這4 個子系統(tǒng)分別是針對科技成果進行技術(shù)研發(fā)的子系統(tǒng)H1;對科技成果進行技術(shù)改進的子系統(tǒng)H2;進行中期試驗的中試轉(zhuǎn)化系統(tǒng)H3 與進行新產(chǎn)品生產(chǎn)的系統(tǒng)H4。每個子系統(tǒng)均有其需要的初始啟動費用Wi;在各個系統(tǒng)實驗中,又會引入新的經(jīng)費投入Qi;在科技成果轉(zhuǎn)移過程中,每個階段均會產(chǎn)生一定的成果Ri;系統(tǒng)中還存在表征成果轉(zhuǎn)移效率的變量Ki。系統(tǒng)的變量說明如圖2 所示。
在圖2(d)中,根據(jù)其定義方法,計算方式如下:
圖1 科技轉(zhuǎn)化流程建模
圖2 系統(tǒng)中變量說明
1.1節(jié)中建立了科技成果轉(zhuǎn)移的數(shù)學(xué)模型,該模型可以定量描述科技成果轉(zhuǎn)移過程中的數(shù)據(jù)流向。為了通過這些數(shù)據(jù)流向準確地預(yù)測一項新的科技成果的社會效益,需要再引入計算機智能算法,該文使用的計算機智能算法是感應(yīng)神經(jīng)網(wǎng)絡(luò)。在機器學(xué)習(xí)理論中,將無監(jiān)督的神經(jīng)網(wǎng)絡(luò)稱為感應(yīng)神經(jīng)網(wǎng)絡(luò),而自組織神經(jīng)網(wǎng)絡(luò)即是一個典型的感應(yīng)神經(jīng)網(wǎng)絡(luò),其基本結(jié)構(gòu)如圖3 所示。
圖3 自組織神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
自組織神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程分為3 個子過程:競爭、合作與自適應(yīng)。
1)競 爭
對于一個自組織網(wǎng)絡(luò),其輸入為x、輸入層到競爭層的連接向量wj分別可以記為式(2)。
其中,網(wǎng)絡(luò)在競爭層中有l(wèi) 個單元,式(2)中的j=1,2,…,l。
競爭的依據(jù)為x與wj間的歐式距離或余弦距離。x與wj間距離最小的輸入向量為競爭的勝利者,其對應(yīng)的輸入神經(jīng)元被選擇為當(dāng)前網(wǎng)絡(luò)的輸入神經(jīng)元。兩種距離各自的計算方法,如式(3)所示。
2)合 作
競爭僅是確立了最佳的輸入神經(jīng)元,但一個網(wǎng)絡(luò)僅依靠一個神經(jīng)元是不具備較強的分類性能。因此,自組織神經(jīng)網(wǎng)絡(luò)還會在最佳神經(jīng)元的鄰域內(nèi)選擇合作神經(jīng)元。該鄰域以最佳神經(jīng)元為圓心,以距離hj,i為半徑,該鄰域的確定依托于兩個條件:
1)當(dāng)鄰域內(nèi)的神經(jīng)元到最佳神經(jīng)元的距離di,j=0 時,hj,i最大;
2)hj,i是關(guān)于di,j的單調(diào)遞減函數(shù)。
根據(jù)上述的兩個條件,該文選擇的di,j與hj,i關(guān)系函數(shù)為Guass 函數(shù),如式(4)所示。
通過引入式(3),使得hj,i只受合作神經(jīng)元與最佳神經(jīng)元距離影響,剔除了最佳神經(jīng)元坐標變換引起的抖動。對于二維的神經(jīng)元網(wǎng)格,其di,j的計算方法如式(5)所示。
在自組織神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程中,為了保證訓(xùn)練的效果,可以將式(4)中ξ設(shè)置為關(guān)于訓(xùn)練時間的變量,如式(6)所示。
其中,n=0,1,2…。根據(jù)式(6),hj,i的最終形式可寫為式(7)。
3)自適應(yīng)
自適應(yīng)過程是指在訓(xùn)練過程中,網(wǎng)絡(luò)連接權(quán)值隨誤差反向傳播而更新,隨著網(wǎng)絡(luò)自適應(yīng)進程的推進,自組織網(wǎng)絡(luò)逐漸達到理想的輸出。在每一次迭代中,權(quán)值的變化定義如下:
其中,η是網(wǎng)絡(luò)的學(xué)習(xí)率;g(yj)是一個線性函數(shù),如式(9)所示。
將yi寫成(yj)=hj,i(x)。此時,Δwj如式(10)所示。
最終可以得到n到n+1 時刻權(quán)值wj(n+1)的變化公式,如式(11)所示。
基于以上分析,將自組織神經(jīng)網(wǎng)絡(luò)與科技成果轉(zhuǎn)移預(yù)測的系統(tǒng)模型相結(jié)合,設(shè)計基于感應(yīng)學(xué)習(xí)網(wǎng)絡(luò)的科技成果轉(zhuǎn)移預(yù)測模型的方法流程,如圖4所示。
該文選取的數(shù)據(jù)是某科技集團的30 個科技項目。在數(shù)據(jù)的預(yù)處理上,按照圖1 的數(shù)據(jù)模型進行整理,并將數(shù)據(jù)進行歸一化。在數(shù)據(jù)集的劃分上,選取其中20 組作為模型的訓(xùn)練數(shù)據(jù)、10 組作為測試數(shù)據(jù)。模型的參考函數(shù)選擇K-G 多項式,其形式如下:
圖4 算法流程圖
式(10)中,共包含5 個初始模型,初始模型的集合為式(13)。
隨后,根據(jù)圖4 將輸入向量交叉并獲得神經(jīng)元,每個神經(jīng)元均有一個函數(shù)序列,如式(14)所示。
在此過程中,神經(jīng)元的復(fù)雜性從y=A0開始遞增,每一次遞增的過程中,通過最小二乘法確定神經(jīng)元的系數(shù),判定標準為PESS,如式(15)所示。
根據(jù)圖1 中的科技成果轉(zhuǎn)移數(shù)據(jù)流程,共包含了H1、H2、H3、H4 4 個子系統(tǒng)。每個子系統(tǒng)均可用一個自組織網(wǎng)絡(luò)進行描述,通過圖4 的流程,可以得到4 個訓(xùn)練好的自組織網(wǎng)絡(luò)。以H1 技術(shù)研發(fā)子系統(tǒng)為例,得到的網(wǎng)絡(luò)模型如圖5 所示。
圖5 H1網(wǎng)絡(luò)參數(shù)結(jié)構(gòu)
圖5 所示技術(shù)研發(fā)子系統(tǒng)的網(wǎng)絡(luò)參數(shù),如表1所示。
表1 模型參數(shù)
使用得到的自組織網(wǎng)絡(luò)與剩余的5 組測試數(shù)據(jù)進行網(wǎng)絡(luò)性能的測試,為了更直觀地評估模型性能,使用回歸分析模型進行對比。表2 中給出了這5 個科技項目的實際社會收益、在回歸分析法下及感應(yīng)學(xué)習(xí)模型下的預(yù)測收益;表3 給出了兩個模型的相對誤差。
表2 科技項目轉(zhuǎn)移效益預(yù)測結(jié)果 單位:億元
表3 算法誤差統(tǒng)計
可以看出,該文提出的算法在該組數(shù)據(jù)下的平均相對誤差為2.23%,相較于回歸分析法的4.24%提升了約2%,誤差的最大值為3.12%,而回歸分析法的最大誤差為5.71%。文中算法的誤差在平均值附近波動較小,在針對某一項目進行預(yù)測時,更接近其真實值。但值得注意的是,回歸分析法的預(yù)測結(jié)果大多小于實際的社會效益,數(shù)據(jù)具有較好的一致性。使用回歸分析法進行預(yù)測時,只要將其預(yù)測值進行一定量的增加,即可接近實際的科技項目轉(zhuǎn)移獲得的社會收益。
該文對于科技成果的轉(zhuǎn)移過程進行了抽象化的數(shù)學(xué)建模,該模型可以準確地描述轉(zhuǎn)移過程中復(fù)雜的數(shù)據(jù)流向。該文模型的提出,方便了計算機智能化算法在科技成果轉(zhuǎn)移領(lǐng)域的應(yīng)用。在未來,科學(xué)地分析科技成果的轉(zhuǎn)移效率對于科技項目立項、研發(fā)經(jīng)費投入均具有重要的指導(dǎo)意義。