朱海婷,吳正平
(新疆農(nóng)業(yè)大學(xué)公共管理學(xué)院(法學(xué)院),烏魯木齊 830052)
區(qū)域科技創(chuàng)新能力是推進(jìn)國家科技創(chuàng)新事業(yè)發(fā)展的主要動力,在中國區(qū)域科技創(chuàng)新事業(yè)發(fā)展進(jìn)程中,縮小東西部區(qū)域科技創(chuàng)新能力差距,引領(lǐng)帶動欠發(fā)達(dá)區(qū)域協(xié)調(diào)發(fā)展成為建設(shè)創(chuàng)新型國家的重要一步。為了加快中國西部欠發(fā)達(dá)地區(qū)區(qū)域科技創(chuàng)新事業(yè)發(fā)展,國家和地區(qū)頒布的一系列科技創(chuàng)新政策為西部地區(qū)科技創(chuàng)新事業(yè)發(fā)展提供了基本保障。新疆作為中亞區(qū)域創(chuàng)新中心,在創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略引領(lǐng)下,新疆區(qū)域創(chuàng)新系統(tǒng)的培育和發(fā)展顯得尤為重要,對新疆現(xiàn)有科技創(chuàng)新政策有效性影響因素進(jìn)行研究,可以為新一輪政策的制定及完善提供重要依據(jù)。
隨著大數(shù)據(jù)時代的發(fā)展,越來越多的學(xué)者關(guān)注到海量的網(wǎng)絡(luò)數(shù)據(jù)所反映出的行為信息。海量的網(wǎng)絡(luò)數(shù)據(jù)所具有的市場價(jià)值在于網(wǎng)絡(luò)數(shù)據(jù)能實(shí)時地將信息傳達(dá)給需求者,這些數(shù)據(jù)不僅反映出人們對某一問題的關(guān)注度,也反映出人們在現(xiàn)實(shí)中的行為規(guī)律和趨勢。目前,基于網(wǎng)絡(luò)搜索的研究已延伸到就業(yè)、汽車旅游、電影票房預(yù)測等眾多領(lǐng)域。特別在政策評估方面,網(wǎng)絡(luò)數(shù)據(jù)能增強(qiáng)政策目標(biāo)對象的有效性,為政策評估提供導(dǎo)向,依據(jù)數(shù)據(jù)分析技術(shù),增強(qiáng)信息收集的系統(tǒng)性和針對性,建立健全政策評估和反饋機(jī)制,進(jìn)而有助于公共資源的合理優(yōu)化。
有關(guān)科技創(chuàng)新政策評估研究方法具有代表性的有以下幾種。一是回歸分析。蒲則文[1]采用經(jīng)濟(jì)計(jì)量模型,從研發(fā)資本收益的角度對山西省2010—2017年的科技創(chuàng)新政策效果進(jìn)行評估。曾婧婧等[2]以中國“十一五”至“十二五”期間的省級面板數(shù)據(jù)為基礎(chǔ),采用回歸模型考察科技創(chuàng)新政策對各地區(qū)的創(chuàng)新驅(qū)動效應(yīng)。二是DEA數(shù)據(jù)包絡(luò)法。梁瑞敏等[3]基于區(qū)域科技創(chuàng)新子過程構(gòu)建區(qū)域科技創(chuàng)新效率模型及指標(biāo)體系,采用二階段網(wǎng)絡(luò)DEA方法對山西省區(qū)域科技創(chuàng)新績效進(jìn)行研究。王任遠(yuǎn)[4]運(yùn)用網(wǎng)絡(luò)DEA法和主成分分析法,從科技投入和科技產(chǎn)出兩個維度出發(fā),對江蘇省科技創(chuàng)新政策效果進(jìn)行評估。三是文獻(xiàn)計(jì)量法。張永安等[5]對區(qū)域科技創(chuàng)新政策進(jìn)行梳理分類,并結(jié)合政策工具作出分析。蘇敬勤等[6]通過對中央和地方的代表性科技創(chuàng)新政策進(jìn)行關(guān)鍵詞提取,建立共詞網(wǎng)絡(luò)和中心性及小團(tuán)體,分析得到中國技術(shù)創(chuàng)新政策的整體構(gòu)成,并采用內(nèi)容分析法進(jìn)行對比分析。四是熵值法。郭強(qiáng)[7]利用相關(guān)數(shù)據(jù),結(jié)合模糊數(shù)學(xué)理論及熵值法,分別計(jì)算出31個省級區(qū)域的科技創(chuàng)新隸屬度和權(quán)重,并對科技創(chuàng)新政策效果進(jìn)行評估。胡先杰等[8]結(jié)合新的科技創(chuàng)新政策范式,參考政府監(jiān)管的政策績效評估框架,利用個案研究法,從“內(nèi)容—執(zhí)行—效果”進(jìn)行政策的全過程評估。白晶晶[9]設(shè)計(jì)了以企業(yè)滿意度為指標(biāo)的科技創(chuàng)新政策評估問卷,利用李克特五級量表(5-point likert scale)將指標(biāo)量化,采用方差分析和相關(guān)分析法對浙江省科技創(chuàng)新政策進(jìn)行績效評估。張永安等[10]以12項(xiàng)國務(wù)院創(chuàng)新政策為樣本,構(gòu)建了PMC指數(shù)模型,并繪制了可以直觀了解政策優(yōu)劣勢的PMC曲面圖,進(jìn)行政策量化評估。
網(wǎng)絡(luò)搜索行為每時每刻在發(fā)生,它可以滿足人們對于信息的需求,并為做出決策提供依據(jù)。Ginsberg等[11]通過分析Google搜索引擎數(shù)據(jù)研究流行性感冒癥狀的發(fā)展軌跡。宋雙杰等[12]利用谷歌趨勢搜索指數(shù)對中國股票市場的IPO抑價(jià)現(xiàn)象做出研究。崔東佳[13]將百度搜索指數(shù)與各個汽車品牌的銷量建立預(yù)測模型,研究表明,該種預(yù)測模型相較于傳統(tǒng)預(yù)測模型具有更高的精準(zhǔn)度,且在時效上具有前瞻性。張應(yīng)劍等[14]以陜西互聯(lián)網(wǎng)為研究對象,基于網(wǎng)絡(luò)求職搜索指數(shù)構(gòu)建時間序列模型,對陜西互聯(lián)網(wǎng)行業(yè)的就業(yè)需求情況進(jìn)行預(yù)測。張娟[15]基于與房價(jià)相關(guān)度較高的關(guān)鍵詞,合成綜合網(wǎng)絡(luò)搜索指標(biāo),對房屋價(jià)格指數(shù)進(jìn)行預(yù)測,結(jié)果證明,基于網(wǎng)絡(luò)搜索指數(shù)的預(yù)測模型對房價(jià)波動可以得出較為及時準(zhǔn)確的結(jié)論。劉超凡[16]以網(wǎng)絡(luò)搜索關(guān)鍵詞為基礎(chǔ),構(gòu)建了商品住宅價(jià)格指數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測模型。在政策評估領(lǐng)域,利用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行研究也取得了較多的研究成果。王博永等[17]在研究房地產(chǎn)政策宏觀調(diào)控效果問題時,利用網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)探究網(wǎng)絡(luò)搜索關(guān)鍵詞與房地產(chǎn)政策效果的相關(guān)關(guān)系,建立網(wǎng)絡(luò)搜索關(guān)鍵詞與房地產(chǎn)政策效果的關(guān)系模型,以中國42個城市為樣本,對房地產(chǎn)市場不同調(diào)控政策產(chǎn)生的不同影響進(jìn)行分析研究。張永安等[18]將網(wǎng)絡(luò)搜索相關(guān)數(shù)據(jù)引入中國科技創(chuàng)新政策調(diào)控有效性分析中,利用網(wǎng)絡(luò)搜索方法彌補(bǔ)傳統(tǒng)評估方法的不足,提高中國科技創(chuàng)新政策評估的效率和準(zhǔn)確性。
目前在科技政策評估中對于政策整體效果的研究較多,對不同政策工具所產(chǎn)生的效果研究較少。傳統(tǒng)評估方法需要回收大量的問卷調(diào)查,專家打分等量化方法主觀性影響的弊端無法避免。還有學(xué)者利用年鑒等面板數(shù)據(jù)更是無法避免數(shù)據(jù)的時效性問題。對于有效獲得即時性數(shù)據(jù)進(jìn)而及時對政策評估、糾偏及優(yōu)化的相關(guān)研究顯得相對缺乏卻又尤為重要。在研究對象上多為針對中國創(chuàng)新事業(yè)發(fā)展較好的?。ㄊ校?,對西部地區(qū)尤其是新疆科技創(chuàng)新政策實(shí)施現(xiàn)狀及評估的研究幾乎為空白。本研究以新疆區(qū)域科技創(chuàng)新政策為研究對象,采用網(wǎng)絡(luò)搜索的方法,對所獲得的信息數(shù)據(jù)進(jìn)行分類提煉,得到關(guān)鍵詞庫,構(gòu)建網(wǎng)絡(luò)搜索數(shù)據(jù)與政策有效性的相關(guān)模型,通過線性回歸方法進(jìn)行實(shí)證研究,在對比不同政策工具所產(chǎn)出的創(chuàng)新成果后,對新疆區(qū)域科技創(chuàng)新政策的調(diào)控效果進(jìn)行評估,并對其進(jìn)行合理優(yōu)化。
在理性預(yù)期理論和信息搜尋理論基礎(chǔ)上,構(gòu)建基于網(wǎng)絡(luò)搜索的新疆區(qū)域科技創(chuàng)新政策有效性影響因素研究框架,主要基于兩方面內(nèi)容構(gòu)建該框架。
首先,政府在制定政策時會考慮對創(chuàng)新主體行為的影響?;诶硇灶A(yù)期理論,可以預(yù)測政策頒布后產(chǎn)生的效果,促使響應(yīng)政策的創(chuàng)新主體創(chuàng)新產(chǎn)出增加,依據(jù)創(chuàng)新產(chǎn)出的變化信息,更多創(chuàng)新主體進(jìn)行模仿并意圖獲取相應(yīng)的科技創(chuàng)新政策信息,創(chuàng)新主體在進(jìn)行科技創(chuàng)新活動時就對政策效果做出預(yù)判,故而他們的決策是有所依據(jù)的。創(chuàng)新主體的行為使許多信息變得具有研究意義,他們不僅是科技創(chuàng)新政策作用的對象,同時根據(jù)自身的理性預(yù)期行為影響著科技創(chuàng)新政策的制定。創(chuàng)新主體對科技創(chuàng)新政策的反應(yīng)顯示出這些政策的有效性。科技創(chuàng)新政策的有效性不僅是由政策制定者決定,身為科技創(chuàng)新活動的創(chuàng)新主體所做出的決定也有著舉足輕重的作用。故而創(chuàng)新主體的行為是科技創(chuàng)新政策制定者在制定政策時需要充分考慮的一方面。
其次,在大數(shù)據(jù)時代,網(wǎng)絡(luò)已經(jīng)成為人們搜索信息和獲得信息的主要手段,網(wǎng)絡(luò)搜索行為可以反映創(chuàng)新主體的關(guān)注與預(yù)判。無論是科技創(chuàng)新政策的制定者還是需求者,他們所做出的行為是一個決策的過程,而決策均需要輸入信息、搜索信息,網(wǎng)絡(luò)搜索作為重要的信息搜索渠道,網(wǎng)絡(luò)搜索數(shù)據(jù)可以綜合反映創(chuàng)新主體的共性,站在一個獨(dú)特的視角體現(xiàn)科技創(chuàng)新政策對科技創(chuàng)新事業(yè)的影響。
基于以上兩方面構(gòu)建網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性影響因素的關(guān)系框架(圖1),網(wǎng)絡(luò)搜索數(shù)據(jù)中的政策工具搜索指數(shù)為自變量,科技創(chuàng)新產(chǎn)出數(shù)據(jù)作為因變量,將科技創(chuàng)新政策有效性定義為科技創(chuàng)新產(chǎn)出,通過政策工具搜索指數(shù)與科技創(chuàng)新產(chǎn)出數(shù)據(jù)的影響程度,對目前的網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性影響因素進(jìn)行分析,進(jìn)一步結(jié)合對科技創(chuàng)新政策的分類進(jìn)行研究,明確各類科技創(chuàng)新政策產(chǎn)生的不同效果程度,為國家和地區(qū)出臺相關(guān)政策提供依據(jù)。
圖1 網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性影響因素的關(guān)系框架
3.1.1 網(wǎng)絡(luò)搜索數(shù)據(jù)來源通過網(wǎng)絡(luò)搜索指數(shù)研究新疆區(qū)域科技創(chuàng)新政策有效性影響因素,關(guān)鍵詞數(shù)據(jù)選取來源尤為重要。百度指數(shù)是百度網(wǎng)站研發(fā)的一類可提供較長時間跨度、數(shù)量種類范圍廣、科學(xué)性較強(qiáng)的數(shù)據(jù)分析工具,以網(wǎng)絡(luò)用戶在百度搜索引擎上的搜索量為基礎(chǔ),以關(guān)鍵詞為統(tǒng)計(jì)樣本,科學(xué)計(jì)算分析關(guān)鍵詞在搜索網(wǎng)頁中的頻次加權(quán)和,以此反映出各關(guān)鍵詞所對應(yīng)的事物被關(guān)注程度和熱門程度。其具有易獲取、透明公開的特點(diǎn),滿足本研究對數(shù)據(jù)的需求,故采用百度指數(shù)作為新疆區(qū)域科技創(chuàng)新政策有效性影響因素分析的搜索數(shù)據(jù)來源。在Python語言環(huán)境下利用網(wǎng)絡(luò)爬蟲技術(shù)采集百度指數(shù)上各關(guān)鍵詞在新疆區(qū)域上的日數(shù)據(jù),時間跨度為2012年1月1日至2020年3月31日,并利用數(shù)據(jù)分析軟件將其加工整理為月度數(shù)據(jù)。
3.1.2 科技創(chuàng)新產(chǎn)出數(shù)據(jù)來源本研究將科技創(chuàng)新產(chǎn)出視為新疆區(qū)域科技創(chuàng)新政策有效性的變量。基于前人的研究結(jié)果可知,目前學(xué)術(shù)界常將新產(chǎn)品銷售額或?qū)@l(fā)明量視為科技創(chuàng)新產(chǎn)出的指標(biāo)[19,20]。但中國高科技產(chǎn)業(yè)和國家統(tǒng)計(jì)局統(tǒng)計(jì)年鑒所公布的均為新產(chǎn)品銷售額的年度數(shù)據(jù),與所獲得的百度指數(shù)月度數(shù)據(jù)不一致,會影響實(shí)證分析的準(zhǔn)確性。專利發(fā)明量中專利授權(quán)量指標(biāo)由于存在從申請到獲批的3年滯后期[19],因此也不符合本研究所需數(shù)據(jù)的要求?;谝陨峡紤],將國家知識產(chǎn)權(quán)局和國家統(tǒng)計(jì)局所公布的新疆專利申請量作為科技創(chuàng)新產(chǎn)出數(shù)據(jù),時間跨度為2012年1月1日至2020年3月31日,并將其整理為月度數(shù)據(jù)進(jìn)行研究。
科技創(chuàng)新政策有效性影響因素研究屬于對宏觀事件的研究,在研究時應(yīng)對將宏觀事件進(jìn)行降維處理,即將網(wǎng)絡(luò)搜索數(shù)據(jù)和觀測到的數(shù)據(jù)按照不同政策工具類型進(jìn)行分析?;谝酝鶎W(xué)者對科技創(chuàng)新政策分類的研究成果,將新疆區(qū)域科技創(chuàng)新政策分為人力資源政策、公共服務(wù)政策、基礎(chǔ)建設(shè)政策、資金支持政策、目標(biāo)規(guī)劃政策、法規(guī)管制政策、金融稅收政策、知識產(chǎn)權(quán)政策、服務(wù)外包政策和海外機(jī)構(gòu)政策10類政策10個網(wǎng)絡(luò)搜索對象。
從現(xiàn)有研究成果看,學(xué)術(shù)界對關(guān)鍵詞選取方法主要有直接取詞法、范圍取詞法、技術(shù)取詞法和經(jīng)驗(yàn)取詞法。不同的創(chuàng)新主體在使用搜索引擎獲取信息時,受到各種客觀和主觀因素影響,導(dǎo)致搜索關(guān)鍵詞具有多樣性、復(fù)雜性的特點(diǎn)。建立網(wǎng)絡(luò)搜索關(guān)鍵詞庫,一方面,要搜集到盡可能全面的搜索關(guān)鍵詞,另一方面,也要避免數(shù)據(jù)缺失和冗余的問題,確保數(shù)據(jù)的研究價(jià)值。在選擇搜索關(guān)鍵詞時遵守3個原則。①含義充分性。一個關(guān)鍵詞應(yīng)代表要素指標(biāo)的一方面,所有關(guān)鍵詞能概括要素指標(biāo)的大概含義。②統(tǒng)計(jì)充分性。所選關(guān)鍵詞數(shù)據(jù)序列具有連續(xù)性,保證關(guān)鍵詞與基準(zhǔn)指標(biāo)的穩(wěn)定性。③與基準(zhǔn)指標(biāo)對應(yīng)性。所選關(guān)鍵詞數(shù)據(jù)序列的峰谷趨勢與基準(zhǔn)指標(biāo)數(shù)據(jù)的峰谷有一定對應(yīng)性。
基于此,本研究采用文獻(xiàn)研究法、范圍取詞法、文本挖掘法收集搜索關(guān)鍵詞,結(jié)合專家經(jīng)驗(yàn)和相關(guān)分析進(jìn)行關(guān)鍵詞篩選,從而建立關(guān)鍵詞庫。
3.2.1 初始搜索關(guān)鍵詞建立初始關(guān)鍵詞庫,先運(yùn)用文獻(xiàn)研究法,綜合前人經(jīng)驗(yàn)和新疆區(qū)域特征提出初始關(guān)鍵詞,再將初始關(guān)鍵詞輸入百度搜索引擎,利用關(guān)鍵詞推薦及相關(guān)關(guān)鍵詞推薦工具,共得到53個非重復(fù)的關(guān)鍵詞,組成初始關(guān)鍵詞庫,如表1所示。
表1 初始關(guān)鍵詞庫
3.2.2 擴(kuò)充搜索關(guān)鍵詞結(jié)合文本計(jì)量方法,針對10類科技創(chuàng)新政策工具進(jìn)行信息文本收集,信息文本來源渠道包括網(wǎng)絡(luò)新聞、政府官方網(wǎng)站、網(wǎng)絡(luò)論壇,如表2所示。將3~5個初始關(guān)鍵詞輸入搜索工具,分時段將搜索結(jié)果以文本形式保存。應(yīng)用Python語言環(huán)境下的jieba分詞工具對信息文本進(jìn)行文本挖掘,提取頻次較高且與政策工具主題相關(guān)性較高的關(guān)鍵詞作為擴(kuò)充的關(guān)鍵詞集合,去重后得到165個關(guān)鍵詞。
表2 關(guān)鍵詞來源
3.2.3 篩選搜索關(guān)鍵詞本研究搜集的165個網(wǎng)絡(luò)搜索關(guān)鍵詞,若全部引入模型進(jìn)行回歸和預(yù)測,由于關(guān)鍵詞之間存在弱相關(guān)性,將出現(xiàn)變量之間產(chǎn)生多重共線性并導(dǎo)致模型效果欠佳,因此需要篩選出具有代表性的網(wǎng)絡(luò)搜索關(guān)鍵詞,引入模型進(jìn)行擬合。通過手動篩選和相關(guān)系數(shù)法兩部分確定最終的搜索關(guān)鍵詞庫。
1)手動篩選。將獲取到的所有關(guān)鍵詞數(shù)據(jù)趨勢圖與專利申請量的數(shù)據(jù)趨勢圖作對比,將趨勢變化不同或峰谷變化不同的關(guān)鍵詞剔除。共剔除27個關(guān)鍵詞,剩余138個關(guān)鍵詞進(jìn)行下一步處理。
2)相關(guān)系數(shù)法。目前學(xué)術(shù)界探究關(guān)鍵詞與研究對象間的關(guān)系時,常用Person相關(guān)系數(shù)法,該方法具有操作簡便、判斷結(jié)果準(zhǔn)確的特點(diǎn)。Person相關(guān)系數(shù)分為3個層次:系數(shù)的絕對值大于0.8時,可以理解為2個變量存在強(qiáng)關(guān)聯(lián);系數(shù)的絕對值小于0.8大于0.5時為中度相關(guān);系數(shù)的絕對值小于0.5大于0.3為弱相關(guān),當(dāng)系數(shù)絕對值小于0.3為極弱相關(guān)或不相關(guān)。本研究使用SPSS軟件中的Person相關(guān)系數(shù)法,將一定時間序列上的搜索關(guān)鍵詞數(shù)據(jù)與專利申請量數(shù)據(jù)進(jìn)行量化分析,篩選出相關(guān)系數(shù)絕對值大于0.4的關(guān)鍵詞19個,且篩選后的關(guān)鍵詞與專利申請量之間均為正相關(guān),如表3所示。
表3 搜索關(guān)鍵詞數(shù)據(jù)與專利申請量相關(guān)性
搜索關(guān)鍵詞庫中的關(guān)鍵詞與科技創(chuàng)新產(chǎn)出數(shù)據(jù)(專利申請量)的變化都具有一定的相關(guān)性,若將其全部引入回歸模型中,搜索關(guān)鍵詞間的多重共線性會影響模型的擬合效果。為使網(wǎng)絡(luò)搜索數(shù)據(jù)能更好地進(jìn)行擬合,避免搜索關(guān)鍵詞之間的信息重疊現(xiàn)象,保證其獨(dú)立性,需將眾多搜索關(guān)鍵詞進(jìn)行降維處理,成為更具綜合性的網(wǎng)絡(luò)搜索指標(biāo)。
在指數(shù)合成的研究中,確定各個關(guān)鍵詞的權(quán)重是核心問題,目前學(xué)術(shù)界常用方法有兩種。一是評價(jià)系統(tǒng)法,該方法預(yù)先明確評價(jià)原則,再對各個關(guān)鍵詞進(jìn)行評分,并以該評分決定權(quán)重分配,最終合成綜合指數(shù)。該方法雖然在數(shù)據(jù)納入時較全面,但主觀性較強(qiáng)。二是利用相關(guān)系數(shù)分配權(quán)重,該方法具有易于操作、客觀性較強(qiáng)的優(yōu)點(diǎn)。
本研究采用相關(guān)系數(shù)作為賦權(quán)方法,將各個搜索關(guān)鍵詞按照相關(guān)系數(shù)合成對應(yīng)政策工具分類下的網(wǎng)絡(luò)搜索指數(shù),具體計(jì)算公式如下。
人力資源搜索指數(shù)=0.645×人才隊(duì)伍+0.444×人才培養(yǎng)+0.682×創(chuàng)新人才+0.487×技術(shù)人才+0.554×科技人員+0.553×科技人才+0.631×科技創(chuàng)新人才
資金支持搜索指數(shù)=0.402×專項(xiàng)資金+0.457×研發(fā)費(fèi)用
公共服務(wù)搜索指數(shù)=0.481×科技交流會+0.494×科技服務(wù)平臺
基礎(chǔ)建設(shè)搜索指數(shù)=0.632×孵化器+0.551×實(shí)驗(yàn)室+0.404×科技企業(yè)孵化器
知識產(chǎn)權(quán)搜索指數(shù)=0.412×專利權(quán)+0.442×科技成果轉(zhuǎn)化
服務(wù)外包搜索指數(shù)=0.421×產(chǎn)學(xué)研
海外機(jī)構(gòu)搜索指數(shù)=0.488×國際科技+0.496×技術(shù)引進(jìn)
選擇專利申請量Yt為因變量,自變量包含7個政策工具網(wǎng)絡(luò)搜索指數(shù):人力資源搜索指數(shù)Xrl、資金支持搜索指數(shù)Xzj、公共服務(wù)搜索指數(shù)Xgg、基礎(chǔ)建設(shè)搜索指數(shù)Xjc、知識產(chǎn)權(quán)搜索指數(shù)Xzs、服務(wù)外包服搜索指數(shù)Xfw、海外機(jī)構(gòu)搜索指數(shù)Xhw。7個政策工具搜索指數(shù)與新疆專利申請量的相關(guān)系數(shù)如表4所示。由表4可知,7個政策工具搜索指數(shù)與新疆專利申請量相關(guān)性較強(qiáng),且均為正相關(guān)。
表4 科技創(chuàng)新政策搜索指數(shù)與專利申請量間的相關(guān)系數(shù)
由于各自變量與因變量均為時間序列數(shù)據(jù),要求變量具有一定的平穩(wěn)性,因此,在建立回歸模型之前應(yīng)先對其做平穩(wěn)性檢驗(yàn)。對單位根進(jìn)行檢驗(yàn)可以體現(xiàn)其平穩(wěn)性,通過檢驗(yàn)時間序列數(shù)據(jù)中是否存在單位根來判定時間序列數(shù)據(jù)是否平穩(wěn)。若序列中至少存在1個單位根即判定為不平穩(wěn),會使后續(xù)回歸分析產(chǎn)生偽回歸現(xiàn)象。本部分采用應(yīng)用較為廣泛的ADF檢驗(yàn)進(jìn)行單位根檢驗(yàn)。
ADF檢驗(yàn)的原假設(shè)認(rèn)為時間序列中至少存在1個單位根即為不平穩(wěn);若時間序列中不存在單位根,即為平穩(wěn)序列。當(dāng)P小于1個臨界值(一般為P<0.05)拒絕原假設(shè),即該序列不存在單位根,為平穩(wěn)序列。ADF檢驗(yàn)結(jié)果如表5所示。由表5可看出,Yt、Xrl、Xzj、Xgg、Xjc、Xzs、Xfw、Xhw在水平值時均未能拒絕原假設(shè)。經(jīng)過一階差分后,能夠拒絕原假設(shè),且為同階單整,為平穩(wěn)序列。
表5 科技創(chuàng)新政策搜索指數(shù)平穩(wěn)性檢驗(yàn)
回歸分析是一類用于預(yù)測建模的計(jì)量統(tǒng)計(jì)方法,是指確定2個或2個以上變量之間相互影響的定量關(guān)系。根據(jù)變量的數(shù)量分為一元回歸分析和多元回歸分析。由于影響科技創(chuàng)新產(chǎn)出數(shù)據(jù)的因素較多,故本研究采取多元線性回歸方法進(jìn)行研究。
n組數(shù)據(jù)的多元線性回歸模型的一般形式為:
式中,yn為因變量;x1,x2,…,xi為自變量;β0為回歸常數(shù)項(xiàng);β1,β2,…,βi為回歸系數(shù);ε為隨機(jī)誤差項(xiàng)。
多元線性回歸模型需滿足5條假設(shè)條件,分別為自變量為彼此獨(dú)立的非隨機(jī)變量;自變量的所有觀測數(shù)據(jù)需有相同方差的隨機(jī)誤差項(xiàng);自變量與隨機(jī)誤差項(xiàng)存在不相關(guān)關(guān)系;隨機(jī)誤差項(xiàng)為彼此不相關(guān),且期望值或平均值為0的隨機(jī)變量;隨機(jī)誤差項(xiàng)符合正態(tài)分布。
模型采用最小二乘估計(jì)法,在SPSS軟件中選擇步進(jìn)式變量輸入方式進(jìn)行回歸分析。當(dāng)變量進(jìn)入方式為步進(jìn)時,能夠自動計(jì)算出模型的最優(yōu)擬合。
當(dāng)模型進(jìn)行第四次計(jì)算時,R2為0.603,此時自變量(基礎(chǔ)建設(shè)搜索指數(shù)、人力資源搜索指數(shù)、公共服務(wù)搜索指數(shù)、知識產(chǎn)權(quán)搜索指數(shù))與因變量(專利申請量)的相關(guān)關(guān)系較強(qiáng),剔除資金支持搜索指數(shù)、服務(wù)外包搜索指數(shù)和海外機(jī)構(gòu)搜索指數(shù)三類相關(guān)性不強(qiáng)的因變量,線性回歸模型解釋度為60.3%,擬合程度較好,具備解釋能力。
回歸系數(shù)估計(jì)結(jié)果如表6所示,基礎(chǔ)建設(shè)搜索指數(shù)的系數(shù)為0.029,人力資源搜索指數(shù)的系數(shù)為0.019,公共服務(wù)搜索指數(shù)的系數(shù)為0.067,知識產(chǎn)權(quán)搜索指數(shù)的系數(shù)為0.053,自變量系數(shù)均大于0,表明自變量與因變量存在正相關(guān)關(guān)系。經(jīng)過t檢驗(yàn),常量和因變量的顯著性P均小于0.05,故而均有顯著性意義。在共線性診斷中,各個自變量的膨脹因子(VIF)均小于10,表示模型中的自變量之間未出現(xiàn)明顯的共線性。
表6 回歸結(jié)果
殘差項(xiàng)的正態(tài)檢驗(yàn)如圖2所示,從殘差項(xiàng)的直方圖可以看出,殘差項(xiàng)的分布近似于正態(tài)分布。
圖2 標(biāo)準(zhǔn)化殘差
由以上檢驗(yàn)結(jié)果可知,采用線性函數(shù)形式的新疆區(qū)域科技創(chuàng)新政策有效性模型滿足獨(dú)立性和正態(tài)性假設(shè),具有良好的擬合度和解釋力,該回歸模型具有統(tǒng)計(jì)學(xué)意義。
最終建立線性回歸方程:
基于該模型,對因變量(專利申請量)進(jìn)行預(yù)測,如圖3所示,其中虛線表示專利申請量的預(yù)測值,實(shí)線表示由國家知識產(chǎn)權(quán)局公布的專利申請量實(shí)際數(shù)據(jù),由圖3可看出二者變化趨勢比較一致。
圖3 新疆專利申請量實(shí)際數(shù)據(jù)與預(yù)測數(shù)據(jù)趨勢對比
根據(jù)回歸模型結(jié)果,對新疆區(qū)域科技創(chuàng)新政策有效性影響因素進(jìn)行討論。人力資源、基礎(chǔ)建設(shè)、公共服務(wù)和知識產(chǎn)權(quán)4類政策工具的網(wǎng)絡(luò)搜索指數(shù)與專利申請量擬合度較好,表明網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性有較為顯著的動態(tài)關(guān)聯(lián)性,故而網(wǎng)絡(luò)搜索行為既可以作為政策發(fā)布、執(zhí)行并產(chǎn)生效果后的輸出結(jié)果,也可以作為新政策制定的需求導(dǎo)向。從政策工具網(wǎng)絡(luò)搜索指數(shù)的系數(shù)可以看出,4類政策工具均對科技創(chuàng)新產(chǎn)出呈正向影響。其中公共服務(wù)和知識產(chǎn)權(quán)為較重要的政策調(diào)控工具,對科技創(chuàng)新產(chǎn)出影響最為顯著,對科技創(chuàng)新政策有效性影響最大,基礎(chǔ)建設(shè)和人力資源對科技創(chuàng)新產(chǎn)出影響相對較弱,對科技創(chuàng)新政策有效性影響相對較小。通過線性回歸模型也可運(yùn)算出專利申請量的預(yù)測值,將運(yùn)算得出的預(yù)測值與國家知識產(chǎn)權(quán)局所公布的實(shí)際數(shù)據(jù)進(jìn)行比較,可以看出兩者變化趨勢大體一致。因此,該模型不僅可以用來評估科技創(chuàng)新政策有效性,還可以用來對科技創(chuàng)新產(chǎn)出作出預(yù)測,對下一階段的科技創(chuàng)新政策有效性進(jìn)行預(yù)判和調(diào)整。
本研究采用網(wǎng)絡(luò)搜索方法,以新疆區(qū)域科技創(chuàng)新政策為研究對象,構(gòu)建了網(wǎng)絡(luò)搜索數(shù)據(jù)與政策有效性影響因素的相關(guān)模型,通過線性回歸方法進(jìn)行實(shí)證研究,主要得出以下結(jié)論并以此提出建議。
1)為新疆科技創(chuàng)新政策有效性研究提供新的研究視角?,F(xiàn)有研究所采用的傳統(tǒng)研究方法往往以科技創(chuàng)新企業(yè)為研究對象,研究結(jié)果的準(zhǔn)確性受到企業(yè)類型、企業(yè)數(shù)據(jù)、企業(yè)報(bào)表等因素影響。采用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行科技創(chuàng)新政策有效性研究,在研究數(shù)據(jù)獲取路徑、范圍和數(shù)量上都具有優(yōu)勢。
2)基于網(wǎng)絡(luò)搜索數(shù)據(jù)與政策有效性的相關(guān)模型,4類政策工具均對科技創(chuàng)新產(chǎn)出呈正向影響。在各類影響因素中公共服務(wù)和知識產(chǎn)權(quán)對科技創(chuàng)新產(chǎn)出影響最為顯著,對科技創(chuàng)新政策有效性影響最大,基礎(chǔ)建設(shè)和人力資源對科技創(chuàng)新產(chǎn)出影響相對較弱,對科技創(chuàng)新政策有效性影響相對較小。地區(qū)政府可以此為參考,合理優(yōu)化科技創(chuàng)新政策。優(yōu)化供給類政策工具配比,強(qiáng)化公共服務(wù)類和基礎(chǔ)建設(shè)類政策工具的使用,不斷加強(qiáng)信息化基礎(chǔ)設(shè)施的廣度和深度建設(shè);平衡環(huán)境類政策工具結(jié)構(gòu),發(fā)揮其滲透作用。在注重知識產(chǎn)權(quán)類保護(hù)政策的同時,平衡稅收金融、目標(biāo)規(guī)劃、法規(guī)管制類政策的使用;加強(qiáng)需求類政策工具運(yùn)用,發(fā)揮其拉力作用。在目前供給推動力大于需求拉動力的情況下,應(yīng)大力引進(jìn)和培育具有帶頭示范作用的服務(wù)外包企業(yè),發(fā)展民間自營科研機(jī)構(gòu),承接國際服務(wù)外包業(yè)務(wù),借助一帶一路的東風(fēng),立足新疆地緣優(yōu)勢,利用外資科技創(chuàng)新活動的質(zhì)量和水平,擴(kuò)大知識密集型科技創(chuàng)新服務(wù)出口,提升科技創(chuàng)新能力。
3)通過回歸模型計(jì)算出專利申請量的預(yù)估值,該預(yù)估值與官方網(wǎng)站所公布的真實(shí)值變化趨勢較為一致。在未來的研究中,可以在大數(shù)據(jù)背景下充分利用海量、多變的網(wǎng)絡(luò)搜索數(shù)據(jù),基于回歸模型對科技創(chuàng)新產(chǎn)出進(jìn)行合理預(yù)測,對下一輪新政策產(chǎn)生的效果進(jìn)行及時調(diào)整。
4)本研究還有很多不足之處。關(guān)鍵詞的提取方法在信息分析時非常重要,但目前學(xué)術(shù)界還未對其進(jìn)行系統(tǒng)研究,未來還需進(jìn)一步研究。本研究收集數(shù)據(jù)的來源渠道較符合中國網(wǎng)民使用情況,針對國內(nèi)經(jīng)濟(jì)社會研究較為有效,但利用該方法探究全球范圍的經(jīng)濟(jì)社會研究時具有一定的局限性。