劉雅橦
(青島大學(xué)經(jīng)濟(jì)學(xué)院金融系,山東 青島 266100)
整個(gè)私募股權(quán)市場(chǎng)的投資重心偏向沿海等發(fā)達(dá)地區(qū),尤以北京和上海兩個(gè)城市為重,內(nèi)陸地區(qū)只有星星點(diǎn)點(diǎn)的投資項(xiàng)目,但單項(xiàng)投資金額較大。傳統(tǒng)行業(yè)最受PE投資機(jī)構(gòu)青睞。這與國(guó)外 PE在幫助高科技和創(chuàng)新企業(yè)成長(zhǎng)方面發(fā)揮主要促進(jìn)作用,存在較大差異。究其原因,一是國(guó)內(nèi)許多高科技企業(yè),如生物制藥等行業(yè)的發(fā)展還處于起步階段,其穩(wěn)定性和成長(zhǎng)性都不能滿足PE投資的要求;二是股票市場(chǎng)發(fā)展不完善,創(chuàng)業(yè)板市場(chǎng)的缺位使有意投資于高科技行業(yè)的投資者望而卻步;三是與歐美等發(fā)達(dá)私募股權(quán)資本市場(chǎng)相比,中國(guó)政府的稅收和政策優(yōu)惠都不明顯,且股票市場(chǎng)對(duì)高科技公司和私有公司的關(guān)注也不夠。
徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN)是一種使用徑向基函數(shù)作為激活函數(shù)的仿真網(wǎng)絡(luò)。它是一個(gè)常用的三層前饋神經(jīng)網(wǎng)絡(luò),具有輸入、隱藏和輸出層。
令輸入向量x = [x1,x2,...,xn]和輸出層向量y = [y1,y2,...,y]。w = [ω1,ω2,...,ωk]代表隱藏輸出權(quán)向量,k表示隱藏節(jié)點(diǎn)總數(shù)。徑向基函數(shù)可以具有不同的形式,其中最常用的是高斯函數(shù):
其中ci和σi分別表示第i個(gè)節(jié)點(diǎn)的中心和擴(kuò)展寬度。一般來(lái)說(shuō),RBFNN訓(xùn)練有兩個(gè)步驟:第一步是確定徑向基函數(shù)的參數(shù),第二步是通過(guò)監(jiān)督學(xué)習(xí)方法確定輸出權(quán)重w。
K近鄰算法是最近鄰算法的一個(gè)推廣。該規(guī)則將是一個(gè)測(cè)試數(shù)據(jù)點(diǎn)x分類為與它最接近的 K 個(gè)近鄰中出現(xiàn)最多的那個(gè)類別。K 近鄰算法從測(cè)試樣本點(diǎn)x開(kāi)始生長(zhǎng),不斷地?cái)U(kuò)大區(qū)域,直到包含進(jìn) K 個(gè)訓(xùn)練樣本點(diǎn)為止,并且把測(cè)試樣本點(diǎn)x歸為這最近的 K 個(gè)訓(xùn)練樣本點(diǎn)中出現(xiàn)頻率最大地類別。其中測(cè)試樣本與訓(xùn)練樣本的相似度一般使用歐式距離測(cè)量。
作為金融業(yè)的重要組成部分,如何挖掘有價(jià)值的投資決策具有重要意義。本文首先用k最近鄰算法填補(bǔ)缺失值,然后將學(xué)校分為兩類,并將它們分成訓(xùn)練和測(cè)試集。由于這兩個(gè)類別的不平衡,結(jié)論可能會(huì)有一定的偏差。
在本文中平衡了訓(xùn)練集并獲得了初始樣本,在該過(guò)程中,執(zhí)行c-SVC和S形核函數(shù),懲罰因子C和核函數(shù)參數(shù)g通過(guò)交叉驗(yàn)證來(lái)優(yōu)化。得到基于給定數(shù)據(jù)的實(shí)驗(yàn)結(jié)果(超平面H0)如下。
而后計(jì)算每個(gè)實(shí)例與H0之間的歐幾里得距離以確定后驗(yàn)概率。再次使用libsvm工具箱來(lái)訓(xùn)練小規(guī)模SVC以獲得新的超平面H1。
f(x)=θ*·φ(x)+ b*
為了反映該模型在金融投資領(lǐng)域的高效可靠的分類性能,本文采用K-NN和RBFNN來(lái)解決同樣的問(wèn)題,結(jié)果如表1所示。在此表中,F(xiàn)1分?jǐn)?shù)用于衡量分類的修正,它是用來(lái)衡量統(tǒng)計(jì)二分模型準(zhǔn)確度的指標(biāo)。 F1分?jǐn)?shù)可以被看作是加權(quán)平均模型的精確度和召回率,它的最大值是1,最小值是0。
表1 模型結(jié)果比較
從表1中可以看出,與兩種經(jīng)典算法的結(jié)果相比,SVC的精度最高,但運(yùn)行時(shí)間更長(zhǎng)。 但是在分類性能反面,IE-SVC無(wú)論是精度還是運(yùn)行時(shí)間都是最好的。因此通過(guò)對(duì)大規(guī)模、高維度的基金投資數(shù)據(jù)分析,IE-SVC可以顯著降低分類的空間和時(shí)間復(fù)雜度,提高準(zhǔn)確率。
本文將IE-SVC應(yīng)用于投資基金領(lǐng)域,與K-NN分類和RBFNN的結(jié)果相比,IE-SVC分類在降低空間和時(shí)間復(fù)雜度以及提高準(zhǔn)確性方面具有更高的性能。它可以快速準(zhǔn)確地識(shí)別大量的投資候選人,這種方法可以為解決高維度基金投資決策提供有效的方法。