王洪禮,姬曉鵬(天津大學管理與經(jīng)濟學部,天津300072)
秩估計及向量廣義線性模型在風險投資中應用
王洪禮,姬曉鵬
(天津大學管理與經(jīng)濟學部,天津300072)
摘要:從風險投資案例中整理發(fā)現(xiàn)內(nèi)在變化規(guī)律,有助于把握投資方向和路徑。以2001—2011年全球投資公司每輪平均投資數(shù)據(jù)為例,由于數(shù)據(jù)不具備正態(tài)性和方差齊次性,基于秩估計方差分析,結(jié)果表明,各年之間均值存在顯著差異。假設平均投資服從伽瑪分布,其形狀參數(shù)和尺度參數(shù)是年份的二次函數(shù),基于向量廣義線性模型估計各參數(shù)。最后預測2015年伽瑪分布形狀參數(shù)為1.195 9,尺度參數(shù)為5 816.186。風險投資位于任何區(qū)間的概率都可以通過分布函數(shù)計算。
關鍵詞:風險投資;均值檢驗;秩估計;向量廣義線性模型
風險投資是追求高額回報的資本投資,主要用于支持剛剛起步或尚未開始高新技術(shù)企業(yè)或高新技術(shù)產(chǎn)品。對于歐美發(fā)達國家而言,高新技術(shù)企業(yè)對于國民經(jīng)濟增長的貢獻率從開始的5%~20%,慢慢上升到50%,目前已經(jīng)高達60%~80%。其對經(jīng)濟的推動發(fā)展已經(jīng)遠遠超過傳統(tǒng)的資本密集型企業(yè)。
高新技術(shù)產(chǎn)業(yè)是高投資、高收益和高風險的事業(yè)。發(fā)達的風險資本網(wǎng)絡通過降低進入一個行業(yè)的困難,為企業(yè)家提供了巨大的激勵機制。風險資本家用他們的經(jīng)驗和他們之間的接觸,減少了許多信息和機會中與新業(yè)務信息相關的耗費[1]。
根據(jù)2010年《中國創(chuàng)業(yè)投資及細目股權(quán)投資市場回顧》,在中國,新籌集的風險資本總數(shù)達到111.69億美元,與2009年相比增長90.7%,新成立的風險投資基金為158家,與2009年比增長了68.1%。另一方面,投資項目與投資金額的大數(shù)量,帶來了對即將初次公開發(fā)行公司之間激烈的競爭。因此,市盈率的倍數(shù)變得越來越大。從風險投資案例中整理發(fā)現(xiàn)內(nèi)在變化規(guī)律,有助于明確投資方向和高新企業(yè)。
從Thomson Reuters旗下SDC platinum數(shù)據(jù)庫導出2001—2011年部分指標數(shù)據(jù)。為了更好了解風險投資公司在每輪投資中的表現(xiàn),選取投資公司每輪平均投資(Firm's Avg Company Investment)指標。在某輪投資中,風險投資公司可以投資好幾個高新企業(yè),對于不同高新企業(yè),投資額度肯定有所不同。Firm's Avg Company Investment就是其平均值,單位為1 000美元。數(shù)據(jù)跨度為2001—2011年,剔除缺失數(shù)據(jù)后。2001年案例最多,有20 000多輪次投資,2009年案例最少,只有14 000多輪次投資。主要受美國次級債危機的影響,風險資本也大幅縮水。
圖12001 —2011年全球投資公司每輪平均投資盒子展示
圖1盒子展示2001—2011年全球投資公司每輪平均投資。盒子中間粗線表示中位數(shù),盒子底線和頂線分別表示25%和75%分位數(shù)。底線向下虛線延伸到最小值,頂線虛線延伸至1.5倍75%分位數(shù),超過該值,視為異常值,用圓圈表示。每年每輪投資額度大概在500萬美元,也有部分著名風險投資公司對于一家高新企業(yè)超過1 500萬美元,投資金額大的異常值容易出現(xiàn)。從中位數(shù)來看,2001—2012年略微有增長的趨勢。
為了更好地看出投資數(shù)據(jù)變化規(guī)律,計算出更詳細的統(tǒng)計量(見表1)?;久磕甑淖钚≈禐? 200美元,2010年的最小值為12 600美元。最小值涉及到的投資公司不具有普遍的含義。每年的25%經(jīng)驗分位數(shù)在25萬美元左右,中位數(shù)在500萬美元上下,75%經(jīng)驗分位數(shù)從700萬慢慢增長到800萬左右。最大值從1 000萬遞增到7 000萬,2010—2011年最大值激增為7 000萬,而以前的最大值在3 000萬多一點。說明2010和2011年全球風險投資特別活躍,大規(guī)模投資隨處可見。每年均值在600萬美元左右,變化幅度不大。標準差表示波動的程度,每年標準差在800~900萬美元之間,波動比較劇烈的是2010年,達到1 100萬美元。偏度衡量數(shù)據(jù)是否關于均值對稱,偏度接近零,說明數(shù)據(jù)對稱性好。偏度越大于零,說明數(shù)據(jù)更容易出現(xiàn)比均值大的值,反之依然。2001—2009年偏度在10多個點,而2010—2011年偏度達到42和36,其大額風險投資頻率更高。正態(tài)分布峰度為3,如果峰度大于3,就是所說的“尖峰厚尾”現(xiàn)象,表示大值更容易出現(xiàn)。每年峰度都遠遠超過3,“尖峰厚尾”現(xiàn)象非常嚴重。
表12001 至2011年全球投資公司每輪平均投資基本統(tǒng)計量
一般模型都要求數(shù)據(jù)服從正態(tài)分布,可以利用正態(tài)性檢驗判斷是否服從正態(tài)分布。正態(tài)性檢驗有很多,按照SAS和SPSS的規(guī)定,當樣本量小于5 000時,以Shapiro-Wilk(W檢驗)為準。而當樣本量大于5 000時,以Kolmogorov-Smirnov(D檢驗)為準。本文每年數(shù)據(jù)都遠超5 000,采用Kolmogorov-Smi rnov D檢驗。每年檢驗結(jié)果都是一樣的,D統(tǒng)計量達到極限值1。相伴概率小于0.05,拒絕原假設。2001—2011年全球投資公司每輪平均投資不服從正態(tài)分布。
一個關心的問題是全球投資公司每輪平均投資每年均值是否一致,常用的分析方法是方差分析表(analysis of variance,ANOVA),但是ANOVA要求數(shù)據(jù)服從正態(tài)分布,而且不同年份方差相等[2]風險投資數(shù)據(jù)都不符合。本文選用基于秩估計的均值檢驗方法。該方法是一種非參數(shù)方法,對數(shù)據(jù)分布類型和方差沒有要求。
基于秩次的估計方法相比于傳統(tǒng)的最小二乘或者極大似然估計更健,不易受異常值影響。它是一種非參數(shù)方法。基于秩次的回歸首先由Jurecková1971[3]Jaeckel 1972[4]提出。McKeanandHettmansperger 1978[5]提出的Newton遞歸優(yōu)化算法將秩估計的計算量降低到可以接受的水平。從此之后,關于線性模型的秩推斷按照傳統(tǒng)最小二乘估計的框架建立起來。秩估計的權(quán)威專著見Hettmansperger and McKean 2011[6]。各種有關秩估計的診斷方法都相繼被提出[7]。
由于每年風險投資案例個數(shù)不相同,本文數(shù)據(jù)就是一種完全隨機試驗。假設每個風險投資案例都是獨立的,不同年份投資案例分布最多只是位置參數(shù)不同,分布類型和其它參數(shù)不會改變。
R語言的Rfit宏包對于單參參均值相等檢驗提供一種分散降低檢驗。同時給出調(diào)整之后的多重比較檢驗相伴概率。函數(shù)oneway.rfit完成檢驗。相伴概率小于0.05,拒絕原假設,認為11年均值之間存在顯著差異。
表2是tukey方法修正之后的多重比較檢驗結(jié)果,置信下限和上限是兩年組間均值之差的95%置信區(qū)間,如果該置信區(qū)間不包含零點,說明這兩年均值存在顯著差異。反之,如果該置信區(qū)間包含零點,認為這兩年均值不存在顯著差異。從表1中可以看出,2001年和2002年均值可以認為沒有差別,2002年明顯高于2003年,2003年低于2004年,2004年低于2005年,2005年低于2006年,2006年低于2007年,2007年和2008年沒有差別,2008年和2009年沒有差別,2009年和2010年沒有差別,2010年高于2011年。
表2 2001—2011年全球投資公司每輪平均投資均值秩回歸tukey修正多重比較檢驗
2001—2011年全球投資公司每輪平均投資均值存在差異,但是每一年份數(shù)據(jù)可以假定獨立同分布。不同投資公司之間的投資應該具備一定的獨立性,雖然同一投資公司不同的的投資案例可能具有一定的相關性,但是本文絕大部分數(shù)據(jù)是不同投資公司案例,滿足獨立性條件。進一步假設服從相同的分布。不同年份之間數(shù)據(jù)假設服從相同的分布類型,但是參數(shù)存在差異。
由于分布類型成千上萬,選擇哪種分布擬合是首選面臨的問題。從正態(tài)性檢驗結(jié)果來看,全球投資公司每輪平均投資不符合正態(tài)分布,更符合伽瑪分布。
伽瑪分布有兩個參數(shù),形狀參數(shù)α>0和尺度參數(shù)μ>0。隨著參數(shù)不同,概率密度函數(shù)可以單減,也可以具有單峰,單峰兩邊的凹凸性還可以改變。
假設2001—2011年全球投資公司每輪平均投資案例相互獨立且服從伽瑪分布,每年之內(nèi)案例伽瑪分布參數(shù)相同,不同年份案例參數(shù)隨時間而變。即形狀參數(shù)α和尺度參數(shù)μ都是年份t的函數(shù)。根據(jù)均值建議的結(jié)果,均值有升有降,假設二次函數(shù)更合理。
傳統(tǒng)線性模型假設響應變量服從正態(tài)分布,其均值是解釋變量的線性函數(shù),但是方差保持不變。廣義線性模型允許響應變量概率分布為指數(shù)分布族中任何一員,其均值和解釋變量的線性組合通過連接函數(shù)關聯(lián)。但是響應變量只能有一個,而向量廣義線性模型可以推廣到多個響應變量。
向量廣義線性模型由奧克蘭大學統(tǒng)計系教授Yee2003[8]提出,經(jīng)過不斷改進,2008年形成R語言的宏包VGAM[9-11]可以看成向量廣義線性模型的一種特殊情形,除了指數(shù)分布族,向量廣義線性模型假定響應變量概率分布類型更多,如伽瑪分布、Dagum分布等。除了分布類型的擴展,廣義線性模型只是假設響應變量分布均值是解釋變量的函數(shù),向量廣義線性模型假定多個參數(shù)是解釋變量的函數(shù),而不單單只是均值。這也是向量的解釋。類似廣義線性模型,參數(shù)和解釋變量也是通過連接函數(shù)關聯(lián)。所以本文的最終模型就是
式中:yi為投資公司每輪平均投資;t為年份;g1和g2為連接函數(shù)。
本文兩個參數(shù)的連接函數(shù)都取自然對數(shù)。
采用R語言VGAM宏包的vglm函數(shù)極大似然估計參數(shù),經(jīng)過9次循環(huán)終止,最大對數(shù)似然函數(shù)-1 904 306,自由度393 550。極大似然估計參數(shù)如表2,其中a表示形狀參數(shù)α的系數(shù),b表示尺度參數(shù)μ的系數(shù)。從表2可以看出,二次系數(shù)都為負值,表明拋物線開口向下,說明形狀參數(shù)和尺度參數(shù)既有上升,也有下降。這點和樣本數(shù)據(jù)經(jīng)驗分析吻合。所有參數(shù)估計標準誤都比較小,說明估計量的波動范圍小,是有效估計。
根據(jù)估計系數(shù),令年份t=15,代入
0.294 4+0.026 8 x 15-0.002 3 x 152=0.178 9
計算2014年伽瑪分布形狀參數(shù)對數(shù)為0.178 9,尺度參數(shù)對數(shù)為8.668 4。指數(shù)得到原始形狀參數(shù)為1.195 9,尺度參數(shù)為5 816.186。由于本文伽瑪分布尺度參數(shù)就是其均值,所以2015年全球投資公司每輪平均投資600萬美元,這和前些年數(shù)據(jù)的樣本均值基本吻合。
表2 伽瑪分布向量廣義線性模型參數(shù)極大似然估計
本文基于全球風險投資案例數(shù)據(jù),重點分析全球投資公司每輪平均投資。樣本數(shù)據(jù)從2001—2011年。假設投資案例之間相互獨立且服從伽瑪分布,基于秩估計的單參數(shù)方差分析得到各年均值存在顯著差異。認為各年案例伽瑪分布參數(shù)是年份的二次函數(shù),通過向量廣義線性模型估計參數(shù)。最后預測2015年伽瑪分布形狀參數(shù)為1.195 9,尺度參數(shù)為5 816.186。估計2015年全球投資公司每輪平均投資在600萬美元左右。投資額度在任何區(qū)間的概率都可以通過分布函數(shù)計算,有利于相關人士對全球風險投資的整體把握和認識。
參考文獻:
[1]葛培初.美國在華風險投資及其對我國風險投資的啟示[D].蘇州:蘇州大學東吳商學院,2013.
[2]Welch B L.On the comparison of several mean values:An alternative approach[J].Biometrika,1951(38):330-336.
[3]Jureckova J.Nonparametric estimate of regression coefficients[J].The Annals of Mathematical Statistics,1971,42 (4):1328-1338.
[4]Jaeckel L A.Estimating regression roefficients by minimizing the dispersion of the residuals[J].The Annals of Mathematical Statistics,1972,43(5):1449-1458.
[5]Mckean J W,Hettmansperger T P.A robust analysis of the general linear model based on one step R-estimates[J].Biometrika,1978,65(3):571-579.
[6]Hettmansperger T,McKean J.Robust Nonparametric Statistical Methods[M].New York:CRC Press,2011.
[7]王彤,鮑彥平.一類基于秩次的穩(wěn)健線性回歸估計與診斷方法[J].數(shù)理統(tǒng)計與管理,2008(5):857-863.
[8]Yee T W,Hastie T J.Reduced-rank vector generalized linear models[J].Statistical Modelling,2003(3):15-41.
[9]Yee T W,Stephenson A G.Vector generalized linear and additive extreme value models[J].Extremes,2007(10):1-19.
[10]Yee T W.The VGAM package for categorical data analysis [J].Journal of Statistical Software,2010(32):1-34.
[11]Yee T W.Reduced-rank vector generalized linear models with two linear predictors[J].Computational Statistics and Data Analysis,2014(71):889-902.
Application of Rank Estimation and Vector Generalized Linear Model in Risk Investment
Wang Hongli,Ji Xiaopeng
(College of Management and Economics,Tianjin University,Tianjin 300072,China)
Abstract:It's very important to find the rule of inherence and internal relationship from the case of risk investment,then venture capital investors can see clearly of the investment trend as well as the regarding detailed information.Take,for instance,the data of average investment amount of all the funds in the world follows neither the normality assumption nor the homogeneity of variance.We used“analysis of variance estimation of rank”to prove the significant difference of average investment by each fund among each year.Assuming the average investment follow the rule of Gamma distribution,and the form parameter and scale parameter are quadratic function of year parameter,we can estimate each parameter based on model of generalized linear vector.Finally we forecasted the form parameter of Gamma distribution of 2015 is 1.1959,and scale parameter of Gamma distribution of 2015 is 5816.186.The probabiting of the investment in any interval can be calculated by distribution function.
Keywords:venture investment;mean equality test;rank estimation;vector general linear model
通訊作者:姬曉鵬,18602108681@163.com.
作者簡介:王洪禮(1945—),女,教授.
收稿日期:2014-07-09.
中圖分類號:X730
文獻標志碼:A
文章編號:1008-4339(2015)01-006-04