楊 云,龐 宇,韓 勇
(科學(xué)技術(shù)部評(píng)估中心,北京 100081)
線性回歸方法是實(shí)證研究中最簡單、最常用的一種方法。它用于確定自變量和因變量之間的關(guān)系,例如,企業(yè)銷售收入與研發(fā)經(jīng)費(fèi)投入、科研人員數(shù)量之間的關(guān)系。通過已知的數(shù)據(jù),按照統(tǒng)計(jì)學(xué)的規(guī)律,采用線性回歸方法求出一個(gè)方程,就可以預(yù)測(cè)出:自變量發(fā)生改變時(shí),因變量會(huì)有什么樣的改變。
這種方法在科研管理實(shí)踐有著廣泛的用途。例如,在政府支持企業(yè)R&D項(xiàng)目中選擇目標(biāo)企業(yè)時(shí),我們可以根據(jù)企業(yè)的歷年數(shù)據(jù),考察哪一些企業(yè)的R&D投入帶來了更多的產(chǎn)出,從而選擇這些企業(yè)作為資助對(duì)象。
根據(jù)若干組自變量和因變量數(shù)據(jù),用數(shù)學(xué)方法就可以求出線性回歸方程 (具體的方法在本文后面介紹)。例如,
Y=30.6×X+250,R=0.8,n=20
此為一元線性回歸方程。其中,Y是因變量,只有X一個(gè)自變量,30.6為回歸系數(shù),R=0.8為相關(guān)系數(shù),n=20為樣本數(shù)。R和n的數(shù)值決定了所得方程是否可靠,n越大,說明觀察的樣本數(shù)越多,越容易接近真實(shí)情況。R越接近1,說明根據(jù)樣本數(shù)據(jù)描出的坐標(biāo)點(diǎn)越接近所得方程表示的曲線,換言之,就是方程越接近真實(shí)情況。在常見的統(tǒng)計(jì)學(xué)教科書中,都會(huì)給出一個(gè)相關(guān)系數(shù)表,通過查表可以得出,不同樣本數(shù)對(duì)相關(guān)系數(shù)有不同的要求。例如,當(dāng) n=10時(shí),相關(guān)系數(shù) R=0.76460,置信度=0.01(表明有99%的概率方程是準(zhǔn)確的);相關(guān)系數(shù)R=0.63190,置信度=0.05(表明有95%的概率方程是準(zhǔn)確的)。通常只要做到置信度不小于0.05就可以了。
在置信度可以接受 (小于0.05)的情況下,回歸系數(shù)越大,說明自變量對(duì)因變量的影響越大?;貧w系數(shù)為正數(shù),表明因變量與自變量存在正相關(guān)關(guān)系。反之,則表明因變量與自變量存在負(fù)相關(guān)關(guān)系。我們通常要做的,是尋找因變量與哪些自變量存在正相關(guān)關(guān)系,哪個(gè)自變量對(duì)因變量的影響最大。
大量文獻(xiàn)表明,R&D投入與產(chǎn)出存在正相關(guān)關(guān)系。以江蘇省1562家高新技術(shù)企業(yè)的研究樣本為例,研發(fā)經(jīng)費(fèi)投入力度與技術(shù)創(chuàng)新績效產(chǎn)出存在明顯的正相關(guān)關(guān)系[1]。西安高新區(qū)2900家企業(yè)研發(fā)投入與產(chǎn)出的數(shù)據(jù)分析也表明,企業(yè)研發(fā)投入與產(chǎn)出績效之間存在明顯的正相關(guān)關(guān)系[2]。用1995—2005年中國R&D資本存量與中國高技術(shù)產(chǎn)業(yè)各個(gè)產(chǎn)出指標(biāo)進(jìn)行分析,發(fā)現(xiàn)它與該行業(yè)專利申請(qǐng)受理數(shù)量、銷售收入、利潤和新產(chǎn)品銷售收入等指標(biāo)都存在顯著的正線性相關(guān)關(guān)系[3]。用1992—2007年全國R&D投入與產(chǎn)出增長的數(shù)據(jù)分析,也顯示我國企業(yè)研發(fā)投入與產(chǎn)出增長之間存在著明顯的單向因果關(guān)系[4]。
在科研管理實(shí)踐中,真正運(yùn)用實(shí)證方法選擇目標(biāo)企業(yè)的實(shí)例不多。其原因是,實(shí)證方法涉及大量的數(shù)學(xué)計(jì)算,一些人無力為之,一些人不愿為之。
線性回歸是實(shí)證研究中最簡單的方法之一,但是對(duì)不熟悉數(shù)學(xué)和計(jì)量經(jīng)濟(jì)方法的人來說,還是有些望而生畏。筆者在實(shí)際工作中,發(fā)現(xiàn)了兩個(gè)簡單易行的工具,這里特別介紹給大家:
(1)Microsoft Excel。用Microsoft Excel 2007以上版本可以做一元一次線性回歸分析。在Excel表格中填入自變量和因變量數(shù)值,選擇數(shù)據(jù),插入“散點(diǎn)圖”。雙擊圖片,在圖表工具欄中下拉選擇圖表類型,選擇帶fx標(biāo)志的圖表類型,就可以自動(dòng)得出線性回歸曲線、線性回歸方程和相關(guān)系數(shù)。
(2)數(shù)學(xué)集成計(jì)算系統(tǒng)Forlab。數(shù)學(xué)集成計(jì)算系統(tǒng)Forlab是一個(gè)功能很強(qiáng)大的數(shù)理運(yùn)算軟件系統(tǒng),能夠解決大部分的數(shù)學(xué)計(jì)算問題。它的功能包括:全屏幕編輯制表、Forcal編程計(jì)算、函數(shù)作圖、矩陣運(yùn)算及數(shù)據(jù)分析、多元分析、數(shù)值計(jì)算以及建立各種數(shù)學(xué)模型等。系統(tǒng)界面簡潔,功能實(shí)用,易于操作。
Forlab數(shù)據(jù)區(qū)和計(jì)算結(jié)果是各自獨(dú)立的,數(shù)據(jù)區(qū)以表格形式進(jìn)行分析,計(jì)算結(jié)果則視情況分別以文本方式或者表格的方式進(jìn)行顯示。數(shù)據(jù)區(qū)和結(jié)果都可以用鼠標(biāo)進(jìn)行任意剪切、復(fù)制、粘貼等編輯,而且可以與Excel表格進(jìn)行剪切、復(fù)制、粘貼等編輯。Forlab可以免費(fèi)下載。
最近,我們協(xié)助開展了科學(xué)儀器重大專項(xiàng)的有關(guān)工作,科技管理部門有意在研發(fā)方面對(duì)一部分企業(yè)給予支持。我們的任務(wù)是協(xié)助選擇有實(shí)力、有發(fā)展?jié)摿Φ哪繕?biāo)企業(yè)。
我們嘗試用實(shí)證方法。中國高新企業(yè)數(shù)據(jù)庫積累了大量的企業(yè)基本信息和經(jīng)營數(shù)據(jù)資料。我們從中選擇儀表行業(yè)的企業(yè)數(shù)據(jù),第一步確定挑選的數(shù)據(jù)字段包括企業(yè)名稱、年份、企業(yè)注冊(cè)時(shí)間、工業(yè)總產(chǎn)值、主營業(yè)務(wù)收入、凈利潤、年末負(fù)債合計(jì)、年末資產(chǎn)總計(jì)、年末資產(chǎn)負(fù)債率、研發(fā)經(jīng)費(fèi)投入合計(jì)、全職科研人員數(shù)量、年末從業(yè)人員數(shù)、發(fā)明專利授權(quán)數(shù)。查詢儀表企業(yè)的10年經(jīng)營數(shù)據(jù),時(shí)間跨度為2001—2010年。經(jīng)過查詢,找到數(shù)據(jù)比較完整的企業(yè)總共有48家。
如前所述,大量文獻(xiàn)表明R&D投入與產(chǎn)出存在正相關(guān)關(guān)系。產(chǎn)出主要表現(xiàn)為企業(yè)收入、企業(yè)利潤、發(fā)明專利等。我們希望從儀表行業(yè)整體的角度,來看看R&D投入與哪一項(xiàng)產(chǎn)出的相關(guān)關(guān)系更明顯,以便找出最主要的數(shù)據(jù)項(xiàng),作為我們選擇企業(yè)的依據(jù)。其中,發(fā)利專利授權(quán)數(shù)只有2006到2010年期間的5年數(shù)據(jù)。為了簡化問題,我們不做多元線性回歸,而是做三次一元線性回歸。以R&D投入 (RD)為自變量,分別以企業(yè)收入(Re)、企業(yè)利潤 (Pr)和發(fā)明專利數(shù) (Pa)為因變量。四組數(shù)據(jù)均采用48家企業(yè)10年總額,以便了解行業(yè)的整體狀況。用Microsoft Excel 2007很容易對(duì)數(shù)據(jù)進(jìn)行匯總,并得出相應(yīng)的線性回歸方程。見圖1、圖2、圖3,分別得出三個(gè)方程如下:
①Re=34.38×RD+25044,R2=0.566(R=0.752),n=48
圖1 研發(fā)支出 (RD)與企業(yè)收入 (Re)的相關(guān)性曲線
②Pr=1.631×RD+18187,R2=0.28(R=0.529),n=48
圖2 研發(fā)投入 (RD)與企業(yè)利潤 (Pr)的相關(guān)性曲線
③Pa=2×10-5×RD+25.73,R2=0.005(R=0.071),n=48
圖3 研發(fā)投入 (RD)與發(fā)明專利授權(quán)數(shù) (Pa)的相關(guān)性曲線
查閱相關(guān)系數(shù)表知道,n=48時(shí),置信度ɑ=0.05對(duì)相關(guān)系數(shù)的要求是R不小于0.28452。由此表明,前兩個(gè)回歸方程都是可以置信的。企業(yè)收入、企業(yè)利潤與研發(fā)投入存在正相關(guān)關(guān)系,其中,企業(yè)收入受研發(fā)投入的影響最大。發(fā)明專利授權(quán)數(shù)與研發(fā)投入的相關(guān)性不明顯,大概是因?yàn)榘l(fā)明專利授權(quán)數(shù)只有5年數(shù)據(jù),導(dǎo)致數(shù)據(jù)沒有代表性。
通過以上分析,我們就確定了選擇目標(biāo)企業(yè)的方法:以各家企業(yè)10年的企業(yè)收入 (Rei)與研發(fā)投入 (RDi)數(shù)據(jù)為切入點(diǎn),進(jìn)行48次線性回歸分析,分別求解每一家企業(yè)的線性回歸方程。在置信度允許的前提下,選出回歸系數(shù)最高的企業(yè)作為目標(biāo)企業(yè)。
在企業(yè)計(jì)算過程中,由于企業(yè)在某些年份的研發(fā)投入為零,為了減少這些異常情況的干擾,我們將這些數(shù)據(jù)做剔除處理。因此,不是每家企業(yè)都是用10年數(shù)據(jù)做回歸的。表1中列出n值,代表企業(yè)數(shù)據(jù)所包含的年數(shù)。根據(jù)數(shù)學(xué)上的經(jīng)驗(yàn),線性回歸的樣本數(shù)一般不宜小于5。
依次對(duì)48家企業(yè)的數(shù)據(jù)進(jìn)行線性回歸分析,得出回歸系數(shù)值最大的前5家企業(yè)如下表,同時(shí)列出線性回歸的相關(guān)系數(shù)R作為參考。
我們通過案頭研究、企業(yè)訪談等方式對(duì)選出來的企業(yè)進(jìn)行考察,對(duì)實(shí)證研究得出的結(jié)論給予了佐證。
貴陽新天光電科技有限公司是國家機(jī)電行業(yè)大型高新技術(shù)企業(yè),一直被列為貴陽市、貴州省及國家重點(diǎn)發(fā)展的裝備制造企業(yè),在2006年還被國家統(tǒng)計(jì)局認(rèn)定為“自主創(chuàng)新能力行業(yè)十強(qiáng)企業(yè)”。
浙江佳環(huán)電子有限公司是國家重點(diǎn)高新技術(shù)企業(yè)、中國環(huán)境保護(hù)產(chǎn)業(yè)骨干企業(yè),產(chǎn)品覆蓋全國30個(gè)省市自治區(qū)及遠(yuǎn)銷國外。
吉林市光大電力設(shè)備有限責(zé)任公司國內(nèi)電廠化學(xué)領(lǐng)域知名企業(yè),是吉林省政府命名的小巨人企業(yè),是國家人事部首批批準(zhǔn)設(shè)立“國家博士后科研工作分站”的企業(yè)。
表1 五家企業(yè)研發(fā)投入與收入線性回歸的相關(guān)系數(shù)
北京牡丹聯(lián)友環(huán)??萍脊煞萦邢薰臼潜本┲嘘P(guān)村科技園區(qū)的高新技術(shù)企業(yè)和北京市重點(diǎn)扶持的環(huán)保企業(yè)。該公司的HP5000煙氣在線監(jiān)測(cè)設(shè)備擁有全部自主知識(shí)產(chǎn)權(quán)和專有技術(shù)。已有1100多套HP5000型煙氣在線監(jiān)測(cè)系統(tǒng)在北京、上海、天津等20多個(gè)省市投入運(yùn)行。
愛博精電公司是國際領(lǐng)先的能源管理和智能測(cè)量儀表供應(yīng)商,在擁有自主知識(shí)產(chǎn)權(quán)的產(chǎn)品,應(yīng)用于市政、機(jī)場、石化、冶金、交通、醫(yī)院、大學(xué)、數(shù)據(jù)中心、銀行、國防和電力等領(lǐng)域。
從數(shù)據(jù)出發(fā)選擇企業(yè),然后跟定性觀察相對(duì)照,這樣既能做到選出優(yōu)秀的企業(yè),又能做到公平公正。
以上實(shí)踐表明,線性回歸這樣的實(shí)證研究方法,簡單、有效,不熟悉計(jì)量經(jīng)濟(jì)專門知識(shí)的人也可以掌握,在科研管理的實(shí)際工作可以廣泛加以應(yīng)用。希望給為廣大同行提供參考。
[1]胡義東,仲偉俊.高新技術(shù)企業(yè)技術(shù)創(chuàng)新績效影響因素的實(shí)證研究[J].中國科技論壇,2011,(4):80-85.
[2]王育寶,吳淑娥,胡芳肖等.科技園區(qū)企業(yè)科技投入與產(chǎn)出績效關(guān)系的實(shí)證分析——以西安高新區(qū)為例[J].科技進(jìn)步與對(duì)策,2010,27(7):29 -33.
[3]張小蒂,王中興.中國R&D投入與高技術(shù)產(chǎn)業(yè)研發(fā)產(chǎn)出的相關(guān)性分析[J].科學(xué)學(xué)研究,2008,26(3):526-529.
[4]于成學(xué).我國企業(yè)研發(fā)投入與產(chǎn)出增長關(guān)系的實(shí)證研究[J].科技管理研究,2009,29(10):315-317.