朱海婷,吳正平
(新疆農(nóng)業(yè)大學(xué)公共管理學(xué)院(法學(xué)院),烏魯木齊 830052)
區(qū)域科技創(chuàng)新能力是推進(jìn)國(guó)家科技創(chuàng)新事業(yè)發(fā)展的主要?jiǎng)恿Γ谥袊?guó)區(qū)域科技創(chuàng)新事業(yè)發(fā)展進(jìn)程中,縮小東西部區(qū)域科技創(chuàng)新能力差距,引領(lǐng)帶動(dòng)欠發(fā)達(dá)區(qū)域協(xié)調(diào)發(fā)展成為建設(shè)創(chuàng)新型國(guó)家的重要一步。為了加快中國(guó)西部欠發(fā)達(dá)地區(qū)區(qū)域科技創(chuàng)新事業(yè)發(fā)展,國(guó)家和地區(qū)頒布的一系列科技創(chuàng)新政策為西部地區(qū)科技創(chuàng)新事業(yè)發(fā)展提供了基本保障。新疆作為中亞區(qū)域創(chuàng)新中心,在創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略引領(lǐng)下,新疆區(qū)域創(chuàng)新系統(tǒng)的培育和發(fā)展顯得尤為重要,對(duì)新疆現(xiàn)有科技創(chuàng)新政策有效性影響因素進(jìn)行研究,可以為新一輪政策的制定及完善提供重要依據(jù)。
隨著大數(shù)據(jù)時(shí)代的發(fā)展,越來(lái)越多的學(xué)者關(guān)注到海量的網(wǎng)絡(luò)數(shù)據(jù)所反映出的行為信息。海量的網(wǎng)絡(luò)數(shù)據(jù)所具有的市場(chǎng)價(jià)值在于網(wǎng)絡(luò)數(shù)據(jù)能實(shí)時(shí)地將信息傳達(dá)給需求者,這些數(shù)據(jù)不僅反映出人們對(duì)某一問(wèn)題的關(guān)注度,也反映出人們?cè)诂F(xiàn)實(shí)中的行為規(guī)律和趨勢(shì)。目前,基于網(wǎng)絡(luò)搜索的研究已延伸到就業(yè)、汽車旅游、電影票房預(yù)測(cè)等眾多領(lǐng)域。特別在政策評(píng)估方面,網(wǎng)絡(luò)數(shù)據(jù)能增強(qiáng)政策目標(biāo)對(duì)象的有效性,為政策評(píng)估提供導(dǎo)向,依據(jù)數(shù)據(jù)分析技術(shù),增強(qiáng)信息收集的系統(tǒng)性和針對(duì)性,建立健全政策評(píng)估和反饋機(jī)制,進(jìn)而有助于公共資源的合理優(yōu)化。
有關(guān)科技創(chuàng)新政策評(píng)估研究方法具有代表性的有以下幾種。一是回歸分析。蒲則文[1]采用經(jīng)濟(jì)計(jì)量模型,從研發(fā)資本收益的角度對(duì)山西省2010—2017年的科技創(chuàng)新政策效果進(jìn)行評(píng)估。曾婧婧等[2]以中國(guó)“十一五”至“十二五”期間的省級(jí)面板數(shù)據(jù)為基礎(chǔ),采用回歸模型考察科技創(chuàng)新政策對(duì)各地區(qū)的創(chuàng)新驅(qū)動(dòng)效應(yīng)。二是DEA數(shù)據(jù)包絡(luò)法。梁瑞敏等[3]基于區(qū)域科技創(chuàng)新子過(guò)程構(gòu)建區(qū)域科技創(chuàng)新效率模型及指標(biāo)體系,采用二階段網(wǎng)絡(luò)DEA方法對(duì)山西省區(qū)域科技創(chuàng)新績(jī)效進(jìn)行研究。王任遠(yuǎn)[4]運(yùn)用網(wǎng)絡(luò)DEA法和主成分分析法,從科技投入和科技產(chǎn)出兩個(gè)維度出發(fā),對(duì)江蘇省科技創(chuàng)新政策效果進(jìn)行評(píng)估。三是文獻(xiàn)計(jì)量法。張永安等[5]對(duì)區(qū)域科技創(chuàng)新政策進(jìn)行梳理分類,并結(jié)合政策工具作出分析。蘇敬勤等[6]通過(guò)對(duì)中央和地方的代表性科技創(chuàng)新政策進(jìn)行關(guān)鍵詞提取,建立共詞網(wǎng)絡(luò)和中心性及小團(tuán)體,分析得到中國(guó)技術(shù)創(chuàng)新政策的整體構(gòu)成,并采用內(nèi)容分析法進(jìn)行對(duì)比分析。四是熵值法。郭強(qiáng)[7]利用相關(guān)數(shù)據(jù),結(jié)合模糊數(shù)學(xué)理論及熵值法,分別計(jì)算出31個(gè)省級(jí)區(qū)域的科技創(chuàng)新隸屬度和權(quán)重,并對(duì)科技創(chuàng)新政策效果進(jìn)行評(píng)估。胡先杰等[8]結(jié)合新的科技創(chuàng)新政策范式,參考政府監(jiān)管的政策績(jī)效評(píng)估框架,利用個(gè)案研究法,從“內(nèi)容—執(zhí)行—效果”進(jìn)行政策的全過(guò)程評(píng)估。白晶晶[9]設(shè)計(jì)了以企業(yè)滿意度為指標(biāo)的科技創(chuàng)新政策評(píng)估問(wèn)卷,利用李克特五級(jí)量表(5-point likert scale)將指標(biāo)量化,采用方差分析和相關(guān)分析法對(duì)浙江省科技創(chuàng)新政策進(jìn)行績(jī)效評(píng)估。張永安等[10]以12項(xiàng)國(guó)務(wù)院創(chuàng)新政策為樣本,構(gòu)建了PMC指數(shù)模型,并繪制了可以直觀了解政策優(yōu)劣勢(shì)的PMC曲面圖,進(jìn)行政策量化評(píng)估。
網(wǎng)絡(luò)搜索行為每時(shí)每刻在發(fā)生,它可以滿足人們對(duì)于信息的需求,并為做出決策提供依據(jù)。Ginsberg等[11]通過(guò)分析Google搜索引擎數(shù)據(jù)研究流行性感冒癥狀的發(fā)展軌跡。宋雙杰等[12]利用谷歌趨勢(shì)搜索指數(shù)對(duì)中國(guó)股票市場(chǎng)的IPO抑價(jià)現(xiàn)象做出研究。崔東佳[13]將百度搜索指數(shù)與各個(gè)汽車品牌的銷量建立預(yù)測(cè)模型,研究表明,該種預(yù)測(cè)模型相較于傳統(tǒng)預(yù)測(cè)模型具有更高的精準(zhǔn)度,且在時(shí)效上具有前瞻性。張應(yīng)劍等[14]以陜西互聯(lián)網(wǎng)為研究對(duì)象,基于網(wǎng)絡(luò)求職搜索指數(shù)構(gòu)建時(shí)間序列模型,對(duì)陜西互聯(lián)網(wǎng)行業(yè)的就業(yè)需求情況進(jìn)行預(yù)測(cè)。張娟[15]基于與房?jī)r(jià)相關(guān)度較高的關(guān)鍵詞,合成綜合網(wǎng)絡(luò)搜索指標(biāo),對(duì)房屋價(jià)格指數(shù)進(jìn)行預(yù)測(cè),結(jié)果證明,基于網(wǎng)絡(luò)搜索指數(shù)的預(yù)測(cè)模型對(duì)房?jī)r(jià)波動(dòng)可以得出較為及時(shí)準(zhǔn)確的結(jié)論。劉超凡[16]以網(wǎng)絡(luò)搜索關(guān)鍵詞為基礎(chǔ),構(gòu)建了商品住宅價(jià)格指數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。在政策評(píng)估領(lǐng)域,利用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行研究也取得了較多的研究成果。王博永等[17]在研究房地產(chǎn)政策宏觀調(diào)控效果問(wèn)題時(shí),利用網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)探究網(wǎng)絡(luò)搜索關(guān)鍵詞與房地產(chǎn)政策效果的相關(guān)關(guān)系,建立網(wǎng)絡(luò)搜索關(guān)鍵詞與房地產(chǎn)政策效果的關(guān)系模型,以中國(guó)42個(gè)城市為樣本,對(duì)房地產(chǎn)市場(chǎng)不同調(diào)控政策產(chǎn)生的不同影響進(jìn)行分析研究。張永安等[18]將網(wǎng)絡(luò)搜索相關(guān)數(shù)據(jù)引入中國(guó)科技創(chuàng)新政策調(diào)控有效性分析中,利用網(wǎng)絡(luò)搜索方法彌補(bǔ)傳統(tǒng)評(píng)估方法的不足,提高中國(guó)科技創(chuàng)新政策評(píng)估的效率和準(zhǔn)確性。
目前在科技政策評(píng)估中對(duì)于政策整體效果的研究較多,對(duì)不同政策工具所產(chǎn)生的效果研究較少。傳統(tǒng)評(píng)估方法需要回收大量的問(wèn)卷調(diào)查,專家打分等量化方法主觀性影響的弊端無(wú)法避免。還有學(xué)者利用年鑒等面板數(shù)據(jù)更是無(wú)法避免數(shù)據(jù)的時(shí)效性問(wèn)題。對(duì)于有效獲得即時(shí)性數(shù)據(jù)進(jìn)而及時(shí)對(duì)政策評(píng)估、糾偏及優(yōu)化的相關(guān)研究顯得相對(duì)缺乏卻又尤為重要。在研究對(duì)象上多為針對(duì)中國(guó)創(chuàng)新事業(yè)發(fā)展較好的省(市),對(duì)西部地區(qū)尤其是新疆科技創(chuàng)新政策實(shí)施現(xiàn)狀及評(píng)估的研究幾乎為空白。本研究以新疆區(qū)域科技創(chuàng)新政策為研究對(duì)象,采用網(wǎng)絡(luò)搜索的方法,對(duì)所獲得的信息數(shù)據(jù)進(jìn)行分類提煉,得到關(guān)鍵詞庫(kù),構(gòu)建網(wǎng)絡(luò)搜索數(shù)據(jù)與政策有效性的相關(guān)模型,通過(guò)線性回歸方法進(jìn)行實(shí)證研究,在對(duì)比不同政策工具所產(chǎn)出的創(chuàng)新成果后,對(duì)新疆區(qū)域科技創(chuàng)新政策的調(diào)控效果進(jìn)行評(píng)估,并對(duì)其進(jìn)行合理優(yōu)化。
在理性預(yù)期理論和信息搜尋理論基礎(chǔ)上,構(gòu)建基于網(wǎng)絡(luò)搜索的新疆區(qū)域科技創(chuàng)新政策有效性影響因素研究框架,主要基于兩方面內(nèi)容構(gòu)建該框架。
首先,政府在制定政策時(shí)會(huì)考慮對(duì)創(chuàng)新主體行為的影響?;诶硇灶A(yù)期理論,可以預(yù)測(cè)政策頒布后產(chǎn)生的效果,促使響應(yīng)政策的創(chuàng)新主體創(chuàng)新產(chǎn)出增加,依據(jù)創(chuàng)新產(chǎn)出的變化信息,更多創(chuàng)新主體進(jìn)行模仿并意圖獲取相應(yīng)的科技創(chuàng)新政策信息,創(chuàng)新主體在進(jìn)行科技創(chuàng)新活動(dòng)時(shí)就對(duì)政策效果做出預(yù)判,故而他們的決策是有所依據(jù)的。創(chuàng)新主體的行為使許多信息變得具有研究意義,他們不僅是科技創(chuàng)新政策作用的對(duì)象,同時(shí)根據(jù)自身的理性預(yù)期行為影響著科技創(chuàng)新政策的制定。創(chuàng)新主體對(duì)科技創(chuàng)新政策的反應(yīng)顯示出這些政策的有效性??萍紕?chuàng)新政策的有效性不僅是由政策制定者決定,身為科技創(chuàng)新活動(dòng)的創(chuàng)新主體所做出的決定也有著舉足輕重的作用。故而創(chuàng)新主體的行為是科技創(chuàng)新政策制定者在制定政策時(shí)需要充分考慮的一方面。
其次,在大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)已經(jīng)成為人們搜索信息和獲得信息的主要手段,網(wǎng)絡(luò)搜索行為可以反映創(chuàng)新主體的關(guān)注與預(yù)判。無(wú)論是科技創(chuàng)新政策的制定者還是需求者,他們所做出的行為是一個(gè)決策的過(guò)程,而決策均需要輸入信息、搜索信息,網(wǎng)絡(luò)搜索作為重要的信息搜索渠道,網(wǎng)絡(luò)搜索數(shù)據(jù)可以綜合反映創(chuàng)新主體的共性,站在一個(gè)獨(dú)特的視角體現(xiàn)科技創(chuàng)新政策對(duì)科技創(chuàng)新事業(yè)的影響。
基于以上兩方面構(gòu)建網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性影響因素的關(guān)系框架(圖1),網(wǎng)絡(luò)搜索數(shù)據(jù)中的政策工具搜索指數(shù)為自變量,科技創(chuàng)新產(chǎn)出數(shù)據(jù)作為因變量,將科技創(chuàng)新政策有效性定義為科技創(chuàng)新產(chǎn)出,通過(guò)政策工具搜索指數(shù)與科技創(chuàng)新產(chǎn)出數(shù)據(jù)的影響程度,對(duì)目前的網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性影響因素進(jìn)行分析,進(jìn)一步結(jié)合對(duì)科技創(chuàng)新政策的分類進(jìn)行研究,明確各類科技創(chuàng)新政策產(chǎn)生的不同效果程度,為國(guó)家和地區(qū)出臺(tái)相關(guān)政策提供依據(jù)。
圖1 網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性影響因素的關(guān)系框架
3.1.1 網(wǎng)絡(luò)搜索數(shù)據(jù)來(lái)源通過(guò)網(wǎng)絡(luò)搜索指數(shù)研究新疆區(qū)域科技創(chuàng)新政策有效性影響因素,關(guān)鍵詞數(shù)據(jù)選取來(lái)源尤為重要。百度指數(shù)是百度網(wǎng)站研發(fā)的一類可提供較長(zhǎng)時(shí)間跨度、數(shù)量種類范圍廣、科學(xué)性較強(qiáng)的數(shù)據(jù)分析工具,以網(wǎng)絡(luò)用戶在百度搜索引擎上的搜索量為基礎(chǔ),以關(guān)鍵詞為統(tǒng)計(jì)樣本,科學(xué)計(jì)算分析關(guān)鍵詞在搜索網(wǎng)頁(yè)中的頻次加權(quán)和,以此反映出各關(guān)鍵詞所對(duì)應(yīng)的事物被關(guān)注程度和熱門程度。其具有易獲取、透明公開(kāi)的特點(diǎn),滿足本研究對(duì)數(shù)據(jù)的需求,故采用百度指數(shù)作為新疆區(qū)域科技創(chuàng)新政策有效性影響因素分析的搜索數(shù)據(jù)來(lái)源。在Python語(yǔ)言環(huán)境下利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)采集百度指數(shù)上各關(guān)鍵詞在新疆區(qū)域上的日數(shù)據(jù),時(shí)間跨度為2012年1月1日至2020年3月31日,并利用數(shù)據(jù)分析軟件將其加工整理為月度數(shù)據(jù)。
3.1.2 科技創(chuàng)新產(chǎn)出數(shù)據(jù)來(lái)源本研究將科技創(chuàng)新產(chǎn)出視為新疆區(qū)域科技創(chuàng)新政策有效性的變量?;谇叭说难芯拷Y(jié)果可知,目前學(xué)術(shù)界常將新產(chǎn)品銷售額或?qū)@l(fā)明量視為科技創(chuàng)新產(chǎn)出的指標(biāo)[19,20]。但中國(guó)高科技產(chǎn)業(yè)和國(guó)家統(tǒng)計(jì)局統(tǒng)計(jì)年鑒所公布的均為新產(chǎn)品銷售額的年度數(shù)據(jù),與所獲得的百度指數(shù)月度數(shù)據(jù)不一致,會(huì)影響實(shí)證分析的準(zhǔn)確性。專利發(fā)明量中專利授權(quán)量指標(biāo)由于存在從申請(qǐng)到獲批的3年滯后期[19],因此也不符合本研究所需數(shù)據(jù)的要求?;谝陨峡紤],將國(guó)家知識(shí)產(chǎn)權(quán)局和國(guó)家統(tǒng)計(jì)局所公布的新疆專利申請(qǐng)量作為科技創(chuàng)新產(chǎn)出數(shù)據(jù),時(shí)間跨度為2012年1月1日至2020年3月31日,并將其整理為月度數(shù)據(jù)進(jìn)行研究。
科技創(chuàng)新政策有效性影響因素研究屬于對(duì)宏觀事件的研究,在研究時(shí)應(yīng)對(duì)將宏觀事件進(jìn)行降維處理,即將網(wǎng)絡(luò)搜索數(shù)據(jù)和觀測(cè)到的數(shù)據(jù)按照不同政策工具類型進(jìn)行分析?;谝酝鶎W(xué)者對(duì)科技創(chuàng)新政策分類的研究成果,將新疆區(qū)域科技創(chuàng)新政策分為人力資源政策、公共服務(wù)政策、基礎(chǔ)建設(shè)政策、資金支持政策、目標(biāo)規(guī)劃政策、法規(guī)管制政策、金融稅收政策、知識(shí)產(chǎn)權(quán)政策、服務(wù)外包政策和海外機(jī)構(gòu)政策10類政策10個(gè)網(wǎng)絡(luò)搜索對(duì)象。
從現(xiàn)有研究成果看,學(xué)術(shù)界對(duì)關(guān)鍵詞選取方法主要有直接取詞法、范圍取詞法、技術(shù)取詞法和經(jīng)驗(yàn)取詞法。不同的創(chuàng)新主體在使用搜索引擎獲取信息時(shí),受到各種客觀和主觀因素影響,導(dǎo)致搜索關(guān)鍵詞具有多樣性、復(fù)雜性的特點(diǎn)。建立網(wǎng)絡(luò)搜索關(guān)鍵詞庫(kù),一方面,要搜集到盡可能全面的搜索關(guān)鍵詞,另一方面,也要避免數(shù)據(jù)缺失和冗余的問(wèn)題,確保數(shù)據(jù)的研究?jī)r(jià)值。在選擇搜索關(guān)鍵詞時(shí)遵守3個(gè)原則。①含義充分性。一個(gè)關(guān)鍵詞應(yīng)代表要素指標(biāo)的一方面,所有關(guān)鍵詞能概括要素指標(biāo)的大概含義。②統(tǒng)計(jì)充分性。所選關(guān)鍵詞數(shù)據(jù)序列具有連續(xù)性,保證關(guān)鍵詞與基準(zhǔn)指標(biāo)的穩(wěn)定性。③與基準(zhǔn)指標(biāo)對(duì)應(yīng)性。所選關(guān)鍵詞數(shù)據(jù)序列的峰谷趨勢(shì)與基準(zhǔn)指標(biāo)數(shù)據(jù)的峰谷有一定對(duì)應(yīng)性。
基于此,本研究采用文獻(xiàn)研究法、范圍取詞法、文本挖掘法收集搜索關(guān)鍵詞,結(jié)合專家經(jīng)驗(yàn)和相關(guān)分析進(jìn)行關(guān)鍵詞篩選,從而建立關(guān)鍵詞庫(kù)。
3.2.1 初始搜索關(guān)鍵詞建立初始關(guān)鍵詞庫(kù),先運(yùn)用文獻(xiàn)研究法,綜合前人經(jīng)驗(yàn)和新疆區(qū)域特征提出初始關(guān)鍵詞,再將初始關(guān)鍵詞輸入百度搜索引擎,利用關(guān)鍵詞推薦及相關(guān)關(guān)鍵詞推薦工具,共得到53個(gè)非重復(fù)的關(guān)鍵詞,組成初始關(guān)鍵詞庫(kù),如表1所示。
表1 初始關(guān)鍵詞庫(kù)
3.2.2 擴(kuò)充搜索關(guān)鍵詞結(jié)合文本計(jì)量方法,針對(duì)10類科技創(chuàng)新政策工具進(jìn)行信息文本收集,信息文本來(lái)源渠道包括網(wǎng)絡(luò)新聞、政府官方網(wǎng)站、網(wǎng)絡(luò)論壇,如表2所示。將3~5個(gè)初始關(guān)鍵詞輸入搜索工具,分時(shí)段將搜索結(jié)果以文本形式保存。應(yīng)用Python語(yǔ)言環(huán)境下的jieba分詞工具對(duì)信息文本進(jìn)行文本挖掘,提取頻次較高且與政策工具主題相關(guān)性較高的關(guān)鍵詞作為擴(kuò)充的關(guān)鍵詞集合,去重后得到165個(gè)關(guān)鍵詞。
表2 關(guān)鍵詞來(lái)源
3.2.3 篩選搜索關(guān)鍵詞本研究搜集的165個(gè)網(wǎng)絡(luò)搜索關(guān)鍵詞,若全部引入模型進(jìn)行回歸和預(yù)測(cè),由于關(guān)鍵詞之間存在弱相關(guān)性,將出現(xiàn)變量之間產(chǎn)生多重共線性并導(dǎo)致模型效果欠佳,因此需要篩選出具有代表性的網(wǎng)絡(luò)搜索關(guān)鍵詞,引入模型進(jìn)行擬合。通過(guò)手動(dòng)篩選和相關(guān)系數(shù)法兩部分確定最終的搜索關(guān)鍵詞庫(kù)。
1)手動(dòng)篩選。將獲取到的所有關(guān)鍵詞數(shù)據(jù)趨勢(shì)圖與專利申請(qǐng)量的數(shù)據(jù)趨勢(shì)圖作對(duì)比,將趨勢(shì)變化不同或峰谷變化不同的關(guān)鍵詞剔除。共剔除27個(gè)關(guān)鍵詞,剩余138個(gè)關(guān)鍵詞進(jìn)行下一步處理。
2)相關(guān)系數(shù)法。目前學(xué)術(shù)界探究關(guān)鍵詞與研究對(duì)象間的關(guān)系時(shí),常用Person相關(guān)系數(shù)法,該方法具有操作簡(jiǎn)便、判斷結(jié)果準(zhǔn)確的特點(diǎn)。Person相關(guān)系數(shù)分為3個(gè)層次:系數(shù)的絕對(duì)值大于0.8時(shí),可以理解為2個(gè)變量存在強(qiáng)關(guān)聯(lián);系數(shù)的絕對(duì)值小于0.8大于0.5時(shí)為中度相關(guān);系數(shù)的絕對(duì)值小于0.5大于0.3為弱相關(guān),當(dāng)系數(shù)絕對(duì)值小于0.3為極弱相關(guān)或不相關(guān)。本研究使用SPSS軟件中的Person相關(guān)系數(shù)法,將一定時(shí)間序列上的搜索關(guān)鍵詞數(shù)據(jù)與專利申請(qǐng)量數(shù)據(jù)進(jìn)行量化分析,篩選出相關(guān)系數(shù)絕對(duì)值大于0.4的關(guān)鍵詞19個(gè),且篩選后的關(guān)鍵詞與專利申請(qǐng)量之間均為正相關(guān),如表3所示。
表3 搜索關(guān)鍵詞數(shù)據(jù)與專利申請(qǐng)量相關(guān)性
搜索關(guān)鍵詞庫(kù)中的關(guān)鍵詞與科技創(chuàng)新產(chǎn)出數(shù)據(jù)(專利申請(qǐng)量)的變化都具有一定的相關(guān)性,若將其全部引入回歸模型中,搜索關(guān)鍵詞間的多重共線性會(huì)影響模型的擬合效果。為使網(wǎng)絡(luò)搜索數(shù)據(jù)能更好地進(jìn)行擬合,避免搜索關(guān)鍵詞之間的信息重疊現(xiàn)象,保證其獨(dú)立性,需將眾多搜索關(guān)鍵詞進(jìn)行降維處理,成為更具綜合性的網(wǎng)絡(luò)搜索指標(biāo)。
在指數(shù)合成的研究中,確定各個(gè)關(guān)鍵詞的權(quán)重是核心問(wèn)題,目前學(xué)術(shù)界常用方法有兩種。一是評(píng)價(jià)系統(tǒng)法,該方法預(yù)先明確評(píng)價(jià)原則,再對(duì)各個(gè)關(guān)鍵詞進(jìn)行評(píng)分,并以該評(píng)分決定權(quán)重分配,最終合成綜合指數(shù)。該方法雖然在數(shù)據(jù)納入時(shí)較全面,但主觀性較強(qiáng)。二是利用相關(guān)系數(shù)分配權(quán)重,該方法具有易于操作、客觀性較強(qiáng)的優(yōu)點(diǎn)。
本研究采用相關(guān)系數(shù)作為賦權(quán)方法,將各個(gè)搜索關(guān)鍵詞按照相關(guān)系數(shù)合成對(duì)應(yīng)政策工具分類下的網(wǎng)絡(luò)搜索指數(shù),具體計(jì)算公式如下。
人力資源搜索指數(shù)=0.645×人才隊(duì)伍+0.444×人才培養(yǎng)+0.682×創(chuàng)新人才+0.487×技術(shù)人才+0.554×科技人員+0.553×科技人才+0.631×科技創(chuàng)新人才
資金支持搜索指數(shù)=0.402×專項(xiàng)資金+0.457×研發(fā)費(fèi)用
公共服務(wù)搜索指數(shù)=0.481×科技交流會(huì)+0.494×科技服務(wù)平臺(tái)
基礎(chǔ)建設(shè)搜索指數(shù)=0.632×孵化器+0.551×實(shí)驗(yàn)室+0.404×科技企業(yè)孵化器
知識(shí)產(chǎn)權(quán)搜索指數(shù)=0.412×專利權(quán)+0.442×科技成果轉(zhuǎn)化
服務(wù)外包搜索指數(shù)=0.421×產(chǎn)學(xué)研
海外機(jī)構(gòu)搜索指數(shù)=0.488×國(guó)際科技+0.496×技術(shù)引進(jìn)
選擇專利申請(qǐng)量Yt為因變量,自變量包含7個(gè)政策工具網(wǎng)絡(luò)搜索指數(shù):人力資源搜索指數(shù)Xrl、資金支持搜索指數(shù)Xzj、公共服務(wù)搜索指數(shù)Xgg、基礎(chǔ)建設(shè)搜索指數(shù)Xjc、知識(shí)產(chǎn)權(quán)搜索指數(shù)Xzs、服務(wù)外包服搜索指數(shù)Xfw、海外機(jī)構(gòu)搜索指數(shù)Xhw。7個(gè)政策工具搜索指數(shù)與新疆專利申請(qǐng)量的相關(guān)系數(shù)如表4所示。由表4可知,7個(gè)政策工具搜索指數(shù)與新疆專利申請(qǐng)量相關(guān)性較強(qiáng),且均為正相關(guān)。
表4 科技創(chuàng)新政策搜索指數(shù)與專利申請(qǐng)量間的相關(guān)系數(shù)
由于各自變量與因變量均為時(shí)間序列數(shù)據(jù),要求變量具有一定的平穩(wěn)性,因此,在建立回歸模型之前應(yīng)先對(duì)其做平穩(wěn)性檢驗(yàn)。對(duì)單位根進(jìn)行檢驗(yàn)可以體現(xiàn)其平穩(wěn)性,通過(guò)檢驗(yàn)時(shí)間序列數(shù)據(jù)中是否存在單位根來(lái)判定時(shí)間序列數(shù)據(jù)是否平穩(wěn)。若序列中至少存在1個(gè)單位根即判定為不平穩(wěn),會(huì)使后續(xù)回歸分析產(chǎn)生偽回歸現(xiàn)象。本部分采用應(yīng)用較為廣泛的ADF檢驗(yàn)進(jìn)行單位根檢驗(yàn)。
ADF檢驗(yàn)的原假設(shè)認(rèn)為時(shí)間序列中至少存在1個(gè)單位根即為不平穩(wěn);若時(shí)間序列中不存在單位根,即為平穩(wěn)序列。當(dāng)P小于1個(gè)臨界值(一般為P<0.05)拒絕原假設(shè),即該序列不存在單位根,為平穩(wěn)序列。ADF檢驗(yàn)結(jié)果如表5所示。由表5可看出,Yt、Xrl、Xzj、Xgg、Xjc、Xzs、Xfw、Xhw在水平值時(shí)均未能拒絕原假設(shè)。經(jīng)過(guò)一階差分后,能夠拒絕原假設(shè),且為同階單整,為平穩(wěn)序列。
表5 科技創(chuàng)新政策搜索指數(shù)平穩(wěn)性檢驗(yàn)
回歸分析是一類用于預(yù)測(cè)建模的計(jì)量統(tǒng)計(jì)方法,是指確定2個(gè)或2個(gè)以上變量之間相互影響的定量關(guān)系。根據(jù)變量的數(shù)量分為一元回歸分析和多元回歸分析。由于影響科技創(chuàng)新產(chǎn)出數(shù)據(jù)的因素較多,故本研究采取多元線性回歸方法進(jìn)行研究。
n組數(shù)據(jù)的多元線性回歸模型的一般形式為:
式中,yn為因變量;x1,x2,…,xi為自變量;β0為回歸常數(shù)項(xiàng);β1,β2,…,βi為回歸系數(shù);ε為隨機(jī)誤差項(xiàng)。
多元線性回歸模型需滿足5條假設(shè)條件,分別為自變量為彼此獨(dú)立的非隨機(jī)變量;自變量的所有觀測(cè)數(shù)據(jù)需有相同方差的隨機(jī)誤差項(xiàng);自變量與隨機(jī)誤差項(xiàng)存在不相關(guān)關(guān)系;隨機(jī)誤差項(xiàng)為彼此不相關(guān),且期望值或平均值為0的隨機(jī)變量;隨機(jī)誤差項(xiàng)符合正態(tài)分布。
模型采用最小二乘估計(jì)法,在SPSS軟件中選擇步進(jìn)式變量輸入方式進(jìn)行回歸分析。當(dāng)變量進(jìn)入方式為步進(jìn)時(shí),能夠自動(dòng)計(jì)算出模型的最優(yōu)擬合。
當(dāng)模型進(jìn)行第四次計(jì)算時(shí),R2為0.603,此時(shí)自變量(基礎(chǔ)建設(shè)搜索指數(shù)、人力資源搜索指數(shù)、公共服務(wù)搜索指數(shù)、知識(shí)產(chǎn)權(quán)搜索指數(shù))與因變量(專利申請(qǐng)量)的相關(guān)關(guān)系較強(qiáng),剔除資金支持搜索指數(shù)、服務(wù)外包搜索指數(shù)和海外機(jī)構(gòu)搜索指數(shù)三類相關(guān)性不強(qiáng)的因變量,線性回歸模型解釋度為60.3%,擬合程度較好,具備解釋能力。
回歸系數(shù)估計(jì)結(jié)果如表6所示,基礎(chǔ)建設(shè)搜索指數(shù)的系數(shù)為0.029,人力資源搜索指數(shù)的系數(shù)為0.019,公共服務(wù)搜索指數(shù)的系數(shù)為0.067,知識(shí)產(chǎn)權(quán)搜索指數(shù)的系數(shù)為0.053,自變量系數(shù)均大于0,表明自變量與因變量存在正相關(guān)關(guān)系。經(jīng)過(guò)t檢驗(yàn),常量和因變量的顯著性P均小于0.05,故而均有顯著性意義。在共線性診斷中,各個(gè)自變量的膨脹因子(VIF)均小于10,表示模型中的自變量之間未出現(xiàn)明顯的共線性。
表6 回歸結(jié)果
殘差項(xiàng)的正態(tài)檢驗(yàn)如圖2所示,從殘差項(xiàng)的直方圖可以看出,殘差項(xiàng)的分布近似于正態(tài)分布。
圖2 標(biāo)準(zhǔn)化殘差
由以上檢驗(yàn)結(jié)果可知,采用線性函數(shù)形式的新疆區(qū)域科技創(chuàng)新政策有效性模型滿足獨(dú)立性和正態(tài)性假設(shè),具有良好的擬合度和解釋力,該回歸模型具有統(tǒng)計(jì)學(xué)意義。
最終建立線性回歸方程:
基于該模型,對(duì)因變量(專利申請(qǐng)量)進(jìn)行預(yù)測(cè),如圖3所示,其中虛線表示專利申請(qǐng)量的預(yù)測(cè)值,實(shí)線表示由國(guó)家知識(shí)產(chǎn)權(quán)局公布的專利申請(qǐng)量實(shí)際數(shù)據(jù),由圖3可看出二者變化趨勢(shì)比較一致。
圖3 新疆專利申請(qǐng)量實(shí)際數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)趨勢(shì)對(duì)比
根據(jù)回歸模型結(jié)果,對(duì)新疆區(qū)域科技創(chuàng)新政策有效性影響因素進(jìn)行討論。人力資源、基礎(chǔ)建設(shè)、公共服務(wù)和知識(shí)產(chǎn)權(quán)4類政策工具的網(wǎng)絡(luò)搜索指數(shù)與專利申請(qǐng)量擬合度較好,表明網(wǎng)絡(luò)搜索數(shù)據(jù)與科技創(chuàng)新政策有效性有較為顯著的動(dòng)態(tài)關(guān)聯(lián)性,故而網(wǎng)絡(luò)搜索行為既可以作為政策發(fā)布、執(zhí)行并產(chǎn)生效果后的輸出結(jié)果,也可以作為新政策制定的需求導(dǎo)向。從政策工具網(wǎng)絡(luò)搜索指數(shù)的系數(shù)可以看出,4類政策工具均對(duì)科技創(chuàng)新產(chǎn)出呈正向影響。其中公共服務(wù)和知識(shí)產(chǎn)權(quán)為較重要的政策調(diào)控工具,對(duì)科技創(chuàng)新產(chǎn)出影響最為顯著,對(duì)科技創(chuàng)新政策有效性影響最大,基礎(chǔ)建設(shè)和人力資源對(duì)科技創(chuàng)新產(chǎn)出影響相對(duì)較弱,對(duì)科技創(chuàng)新政策有效性影響相對(duì)較小。通過(guò)線性回歸模型也可運(yùn)算出專利申請(qǐng)量的預(yù)測(cè)值,將運(yùn)算得出的預(yù)測(cè)值與國(guó)家知識(shí)產(chǎn)權(quán)局所公布的實(shí)際數(shù)據(jù)進(jìn)行比較,可以看出兩者變化趨勢(shì)大體一致。因此,該模型不僅可以用來(lái)評(píng)估科技創(chuàng)新政策有效性,還可以用來(lái)對(duì)科技創(chuàng)新產(chǎn)出作出預(yù)測(cè),對(duì)下一階段的科技創(chuàng)新政策有效性進(jìn)行預(yù)判和調(diào)整。
本研究采用網(wǎng)絡(luò)搜索方法,以新疆區(qū)域科技創(chuàng)新政策為研究對(duì)象,構(gòu)建了網(wǎng)絡(luò)搜索數(shù)據(jù)與政策有效性影響因素的相關(guān)模型,通過(guò)線性回歸方法進(jìn)行實(shí)證研究,主要得出以下結(jié)論并以此提出建議。
1)為新疆科技創(chuàng)新政策有效性研究提供新的研究視角?,F(xiàn)有研究所采用的傳統(tǒng)研究方法往往以科技創(chuàng)新企業(yè)為研究對(duì)象,研究結(jié)果的準(zhǔn)確性受到企業(yè)類型、企業(yè)數(shù)據(jù)、企業(yè)報(bào)表等因素影響。采用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行科技創(chuàng)新政策有效性研究,在研究數(shù)據(jù)獲取路徑、范圍和數(shù)量上都具有優(yōu)勢(shì)。
2)基于網(wǎng)絡(luò)搜索數(shù)據(jù)與政策有效性的相關(guān)模型,4類政策工具均對(duì)科技創(chuàng)新產(chǎn)出呈正向影響。在各類影響因素中公共服務(wù)和知識(shí)產(chǎn)權(quán)對(duì)科技創(chuàng)新產(chǎn)出影響最為顯著,對(duì)科技創(chuàng)新政策有效性影響最大,基礎(chǔ)建設(shè)和人力資源對(duì)科技創(chuàng)新產(chǎn)出影響相對(duì)較弱,對(duì)科技創(chuàng)新政策有效性影響相對(duì)較小。地區(qū)政府可以此為參考,合理優(yōu)化科技創(chuàng)新政策。優(yōu)化供給類政策工具配比,強(qiáng)化公共服務(wù)類和基礎(chǔ)建設(shè)類政策工具的使用,不斷加強(qiáng)信息化基礎(chǔ)設(shè)施的廣度和深度建設(shè);平衡環(huán)境類政策工具結(jié)構(gòu),發(fā)揮其滲透作用。在注重知識(shí)產(chǎn)權(quán)類保護(hù)政策的同時(shí),平衡稅收金融、目標(biāo)規(guī)劃、法規(guī)管制類政策的使用;加強(qiáng)需求類政策工具運(yùn)用,發(fā)揮其拉力作用。在目前供給推動(dòng)力大于需求拉動(dòng)力的情況下,應(yīng)大力引進(jìn)和培育具有帶頭示范作用的服務(wù)外包企業(yè),發(fā)展民間自營(yíng)科研機(jī)構(gòu),承接國(guó)際服務(wù)外包業(yè)務(wù),借助一帶一路的東風(fēng),立足新疆地緣優(yōu)勢(shì),利用外資科技創(chuàng)新活動(dòng)的質(zhì)量和水平,擴(kuò)大知識(shí)密集型科技創(chuàng)新服務(wù)出口,提升科技創(chuàng)新能力。
3)通過(guò)回歸模型計(jì)算出專利申請(qǐng)量的預(yù)估值,該預(yù)估值與官方網(wǎng)站所公布的真實(shí)值變化趨勢(shì)較為一致。在未來(lái)的研究中,可以在大數(shù)據(jù)背景下充分利用海量、多變的網(wǎng)絡(luò)搜索數(shù)據(jù),基于回歸模型對(duì)科技創(chuàng)新產(chǎn)出進(jìn)行合理預(yù)測(cè),對(duì)下一輪新政策產(chǎn)生的效果進(jìn)行及時(shí)調(diào)整。
4)本研究還有很多不足之處。關(guān)鍵詞的提取方法在信息分析時(shí)非常重要,但目前學(xué)術(shù)界還未對(duì)其進(jìn)行系統(tǒng)研究,未來(lái)還需進(jìn)一步研究。本研究收集數(shù)據(jù)的來(lái)源渠道較符合中國(guó)網(wǎng)民使用情況,針對(duì)國(guó)內(nèi)經(jīng)濟(jì)社會(huì)研究較為有效,但利用該方法探究全球范圍的經(jīng)濟(jì)社會(huì)研究時(shí)具有一定的局限性。