商雯雯,支鳳穩(wěn),2,孟佳琪
(1.河北大學(xué) 管理學(xué)院,河北 保定 071002;2.河北省數(shù)字治理與協(xié)同治理研究基地,河北 保定 071002)
科學(xué)數(shù)據(jù)是不同領(lǐng)域的科研團隊及科研人員通過基礎(chǔ)與應(yīng)用研究、試驗等方式獲取并用于科學(xué)研究活動的原始數(shù)據(jù)及其衍生數(shù)據(jù)[1],其作為一種重要的資源,對科學(xué)研究的發(fā)展與進步有重大的作用??蒲腥藛T通過重用數(shù)據(jù)可以節(jié)省收集、整理新數(shù)據(jù)所花費的時間、精力等,減少科研過程中重復(fù)的工作,實現(xiàn)科學(xué)數(shù)據(jù)價值的最大化。最早提出科學(xué)數(shù)據(jù)重用這一概念是Zimmerman A. S.[2]。他指出科學(xué)數(shù)據(jù)重用是為研究新問題,或者為解決特定的問題,又或者為描述某些現(xiàn)象而收集現(xiàn)有的數(shù)據(jù)。在學(xué)界,科研人員也逐漸意識到重用數(shù)據(jù)的價值與意義,雖然在理論層面展開了積極的研究并取得一定的成果,但在實踐應(yīng)用層面卻不容樂觀,已有研究表明科學(xué)數(shù)據(jù)重用面臨數(shù)據(jù)表達存在差異、科研人員發(fā)現(xiàn)和理解數(shù)據(jù)的能力不足、移動數(shù)據(jù)的風(fēng)險、數(shù)據(jù)不匹配[3]以及權(quán)益問題[4]、數(shù)據(jù)存儲庫功能及服務(wù)不完善[5]、數(shù)據(jù)濫用及引用[6]等問題,這些問題都會影響科研人員對科學(xué)數(shù)據(jù)的重用??茖W(xué)數(shù)據(jù)重用是進一步挖掘數(shù)據(jù)潛在的價值,實現(xiàn)數(shù)據(jù)價值最大化的重要方式之一。因此,探究影響科學(xué)數(shù)據(jù)重用的因素具有重要的現(xiàn)實意義。
隨著科學(xué)數(shù)據(jù)重用研究的不斷推進,有關(guān)科學(xué)數(shù)據(jù)重用的研究也取得了不少成果。但是,不同學(xué)者對科學(xué)數(shù)據(jù)重用意愿影響因素進行研究,得到的結(jié)果存在較大的差異性,具體表現(xiàn)為關(guān)系強度不同、影響方向不一致等。基于此,本研究采用元分析方法,系統(tǒng)地梳理現(xiàn)有科學(xué)數(shù)據(jù)重用意愿影響因素的實證研究情況從而得到一般性的結(jié)論,并探究導(dǎo)致研究結(jié)果間不一致的原因。
文獻梳理發(fā)現(xiàn),有關(guān)科學(xué)數(shù)據(jù)重用影響因素研究主要集中在以下幾個方面。第一是關(guān)于科學(xué)數(shù)據(jù)重用行為的影響因素。Curty R. G.等[7]發(fā)現(xiàn):感知功效與感知重要性對重用行為影響較大;其次是感知效率和主觀規(guī)范對重用行為的影響;而感知擔(dān)憂對重用行為沒有顯著影響。第二是關(guān)于科學(xué)數(shù)據(jù)重用意愿的影響因素:Joo Y. K.[8]結(jié)合計劃行為理論和技術(shù)接受模型,發(fā)現(xiàn)感知努力對工程領(lǐng)域科研人員的重用意愿沒有顯著影響;而Yoon A.等[9]發(fā)現(xiàn)感知努力與科學(xué)數(shù)據(jù)重用意愿存在顯著負相關(guān);聶磊等[10]發(fā)現(xiàn)感知風(fēng)險對重用意愿沒有顯著影響,這一結(jié)論與Kim Y.等[11]的研究結(jié)果不同。第三是關(guān)于科學(xué)數(shù)據(jù)重用滿意度的影響因素:Faniel I. M.等[12]發(fā)現(xiàn)數(shù)據(jù)的完整性、可獲得性、可操作性、可信度及文檔質(zhì)量等都對重用滿意度有影響;文靜[13]從數(shù)據(jù)因素、數(shù)據(jù)來源因素、科研人員背景因素、重用規(guī)則因素四個方面探究影響重用滿意度的因素。第四是關(guān)于科學(xué)數(shù)據(jù)重用信任的影響因素:Yoon A.[14]發(fā)現(xiàn)影響實踐社區(qū)、認知社區(qū)、數(shù)據(jù)生產(chǎn)者的信息、重用者的情況、數(shù)據(jù)本身、數(shù)據(jù)存儲庫等有助于通過歸因和轉(zhuǎn)移過程建立對數(shù)據(jù)的初始信任,并且在重新確認的過程中,數(shù)據(jù)生產(chǎn)者的信息及數(shù)據(jù)存儲庫也有助于確認數(shù)據(jù)重用者的最終信任判斷;Yoon A.等[15]發(fā)現(xiàn)數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)質(zhì)量等因素與信任存在正相關(guān),學(xué)術(shù)社區(qū)、數(shù)據(jù)庫等因素對信任沒有顯著影響。
目前,已有的實證研究主要以社會心理學(xué)理論為理論基礎(chǔ),研究方法多以問卷調(diào)查法、訪談法為主,被調(diào)查對象來自社會科學(xué)、自然科學(xué)以及多學(xué)科領(lǐng)域,其中以多學(xué)科為主。部分研究結(jié)果存在差異,這種差異可能對該領(lǐng)域后續(xù)研究產(chǎn)生一定的阻礙,不利于科學(xué)數(shù)據(jù)重用實踐活動的展開,也不利于實現(xiàn)數(shù)據(jù)價值的最大化。
元分析是由Glass G. V.[16]提出,是一種針對已有獨立研究的結(jié)果進行綜合定量分析的方法。相比在其他學(xué)科領(lǐng)域的發(fā)展,元分析在圖情領(lǐng)域的應(yīng)用較晚,但隨著學(xué)者們對元分析的探究與應(yīng)用,近幾年在圖情領(lǐng)域也取得了不少元分析研究成果:萬莉等[17]基于已有研究將從個體因素、制度因素、資源因素三方面出發(fā)構(gòu)建了科學(xué)數(shù)據(jù)共享行為意愿影響因素整合理論模型,并基于13篇文獻的結(jié)果進行元分析,對構(gòu)建的模型進行檢驗;李雪麗等[18]通過元分析方法對55篇有關(guān)社交媒體用戶隱私披露意愿影響因素的實證研究結(jié)果進行綜合分析,得出了一般性的結(jié)論。
隨著實證研究文獻數(shù)量激增,元分析方法已經(jīng)成為圖情領(lǐng)域研究的重要方法之一。采用元分析方法進行影響因素研究有其獨特的優(yōu)勢:元分析能夠在一定程度上降低傳統(tǒng)研究方法在樣本數(shù)量不足、研究對象選擇單一、地域選擇受限制、時間跨度短等方面引起的誤差;元分析擴大了統(tǒng)計量,得到的研究結(jié)果更加客觀、真實,其結(jié)論更具有說服力;元分析通過納入已有的大量研究進行整合分析,能夠降低研究成本;元分析可以探尋前人研究中不一致結(jié)果的原因,進而得到影響結(jié)果差異性的調(diào)節(jié)變量,對今后的研究提供可能的方向。
然而,目前鮮有學(xué)者采用元分析方法對影響科學(xué)數(shù)據(jù)重用意愿的因素進行整合研究。為此,本文通過元分析方法探究科學(xué)數(shù)據(jù)重用意愿的影響因素及其影響程度的大小,旨在得到較為完善的科學(xué)數(shù)據(jù)重用意愿影響因素整合模型,并進一步探究導(dǎo)致研究結(jié)果不一致的原因,為后續(xù)科學(xué)數(shù)據(jù)重用的研究提供理論借鑒。
理性行為理論、計劃行為理論、技術(shù)接受模型及其擴展模型等在科學(xué)數(shù)據(jù)重用領(lǐng)域相關(guān)實證研究中得到廣泛的應(yīng)用,且隨著模型被不斷完善,這些模型更加清晰地指出各變量之間的關(guān)聯(lián),為研究提供了理論依據(jù)。計劃行為理論是由Ajzen I.[19]于1985年提出的,該理論指出意愿是由態(tài)度、主觀規(guī)范、知覺行為控制三個因素共同影響,且主觀規(guī)范與態(tài)度、知覺行為控制之間存在相互影響的關(guān)系,但該理論未指明哪些具體因素能夠?qū)B(tài)度等產(chǎn)生影響。為了彌補這一不足,Davis F. D.[20]提出技術(shù)接受模型,該模型表明感知有用性、感知易用性都對態(tài)度有影響,且感知有用性也對意愿有直接影響。之后,Viswanath V.等[21]、Wu J. H.等[22]都對技術(shù)接受模型進行擴展,分別指出感知易用性、感知風(fēng)險對意愿有顯著的影響。
雖然研究逐漸豐富,但仍存在一些不足:應(yīng)用技術(shù)接受模型時,一些研究并未檢驗感知有用性對重用意愿的直接影響;應(yīng)用計劃行為理論時,一些研究未建立態(tài)度與主觀規(guī)范或主觀規(guī)范與重用意愿之間的關(guān)系。為此,本文在計劃行為理論、技術(shù)接受模型及其擴展模型的基礎(chǔ)上,系統(tǒng)進行文獻梳理,盡量識別并提取研究較多的因素與調(diào)節(jié)變量。本研究提取的因素包含感知有用性(PU,Perceived Usefulness)、感知數(shù)據(jù)質(zhì)量(PDQ,Perceived Data Quality)、感知風(fēng)險(PR,Perceived Risk)、感知努力(PE,Perceived Effort)、科學(xué)數(shù)據(jù)重用態(tài)度(SDRA,Scientific Data Reuse Attitude)、主觀規(guī)范(SN,Subjective Norms)、內(nèi)部資源支持(IRS,Internal Resource Support)、數(shù)據(jù)存儲庫的可用性(DRA,Data Repository Availability);調(diào)節(jié)變量包含量表等級、國別、學(xué)科、文獻類型,構(gòu)建了本文的研究模型,如圖1所示。其中,調(diào)節(jié)變量對應(yīng)的兩個向下箭頭,表示4個調(diào)節(jié)變量分別對12個路徑起的調(diào)節(jié)作用。
Fig.1 Integration model of influencing factors of scientific data reuse intention圖1 科學(xué)數(shù)據(jù)重用意愿影響因素整合模型
感知有用性(PU,Perceived Usefulness)是指科研人員對重用他人的數(shù)據(jù)能給自己帶來有形或無形的好處或收益的感知[9],包含獎金的獲得、資源的節(jié)約、知識的增長、研究成果的關(guān)注度及學(xué)術(shù)影響力的提高等[23]。感知有用性是技術(shù)接受模型中重要結(jié)構(gòu)因素之一,技術(shù)接受模型的核心結(jié)構(gòu)表明感知有用性對個體的態(tài)度和意愿都有一定的影響,且已有研究證實了感知有用性會影響科研人員數(shù)據(jù)重用的意愿[11],還可以通過科學(xué)數(shù)據(jù)重用態(tài)度對重用意愿產(chǎn)生間接影響[24]??蒲腥藛T重用其他人員公開的科學(xué)數(shù)據(jù)時,可以減少數(shù)據(jù)采集的時間與精力,從而有更多的機會開展其他的科研活動,提高科研效率。因此,提出以下假設(shè):
H1:感知有用性對科學(xué)數(shù)據(jù)重用態(tài)度存在正向影響;
H2:感知有用性對科學(xué)數(shù)據(jù)重用意愿存在正向影響。
感知數(shù)據(jù)質(zhì)量(PDQ,Perceived Data Quality)是指科研人員對重用數(shù)據(jù)質(zhì)量的感知,數(shù)據(jù)質(zhì)量不僅包括數(shù)據(jù)的準確性與完整性、數(shù)據(jù)來源的可靠性等基本屬性[24-25],還包括元數(shù)據(jù)、文檔格式等技術(shù)屬性[23]。Faniel I. M.等[12]發(fā)現(xiàn)數(shù)據(jù)的完整性、可獲得性、可操作性等都對科研人員數(shù)據(jù)重用滿意度有影響:當(dāng)科研人員想要使用他人的科學(xué)數(shù)據(jù)時,會對獲取的科學(xué)數(shù)據(jù)的質(zhì)量進行評估;科學(xué)數(shù)據(jù)的質(zhì)量越高,科研人員越有可能愿意使用他人的數(shù)據(jù)。魏銀珍等[23]發(fā)現(xiàn)感知數(shù)據(jù)質(zhì)量對科學(xué)數(shù)據(jù)重用意愿存在正向影響。因此,提出以下假設(shè):
H3:感知數(shù)據(jù)質(zhì)量對科學(xué)數(shù)據(jù)重用意愿存在正向影響。
感知風(fēng)險(PR,Perceived Risk)是指科研人員對重用他人的數(shù)據(jù)可能會帶來不確定性風(fēng)險的感知[9],包含對數(shù)據(jù)的誤用或錯用[25]、擔(dān)心研究價值被低估[9]、害怕發(fā)生侵權(quán)行為等[23],感知風(fēng)險又稱感知擔(dān)憂。韓雁雁[26]對123篇實證文獻進行元分析,結(jié)果證實感知風(fēng)險對網(wǎng)購參與態(tài)度有負向影響;Joo S.等[24]發(fā)現(xiàn)感知風(fēng)險與科學(xué)數(shù)據(jù)重用態(tài)度呈顯著的負相關(guān),并且通過態(tài)度間接影響科學(xué)數(shù)據(jù)重用意愿,即當(dāng)科研人員越擔(dān)心重用他人的數(shù)據(jù)可能會導(dǎo)致不良后果時,對科學(xué)數(shù)據(jù)重用越持反對的態(tài)度,進而重用意愿也會隨之減弱;此外,還發(fā)現(xiàn)科學(xué)數(shù)據(jù)重用態(tài)度對科研人員數(shù)據(jù)重用的意愿有直接影響[11]。因此,提出以下假設(shè):
H4:感知風(fēng)險對科學(xué)數(shù)據(jù)重用態(tài)度存在負向影響;
H5:感知風(fēng)險對科學(xué)數(shù)據(jù)重用意愿存在負向影響。
感知易用性(PE,Perceived Effort)源于技術(shù)接受模型,感知易用性是個體主觀意識上認為使用某一特定系統(tǒng)需要付出努力的程度[27],感知易用性越高,其使用該系統(tǒng)的態(tài)度越積極。在科學(xué)數(shù)據(jù)重用相關(guān)研究中,感知易用性通常用感知努力來表述。本研究將感知努力定義為科研人員為了重用他人的數(shù)據(jù)對付出努力程度的感知,包括付出的時間、精力和金錢等。感知努力不僅對科學(xué)數(shù)據(jù)重用意愿有直接影響[9],還會通過態(tài)度等因素產(chǎn)生間接影響[23]??梢灶A(yù)見,當(dāng)科研人員重用他人數(shù)據(jù)所付出的努力越少,不僅能產(chǎn)生積極的態(tài)度,還能促進重用的意愿。因此,提出以下假設(shè):
H6:感知努力對科學(xué)數(shù)據(jù)重用態(tài)度存在負向影響;
H7:感知努力對科學(xué)數(shù)據(jù)重用意愿存在負向影響。
科學(xué)數(shù)據(jù)重用態(tài)度(SDRA,Scientific Data Reuse Attitude)是指科研人員對于重用他人數(shù)據(jù)所產(chǎn)生的積極或消極的看法[24],包含認為是否有價值、有必要、令人感到愉悅等[9]。計劃行為理論表明個體的態(tài)度對意愿有顯著的影響,且在應(yīng)用中也被證實。如Joo Y. K.等[8]的研究表明工程科學(xué)家的科學(xué)數(shù)據(jù)重用態(tài)度對其重用意愿有積極的促進作用,即科研人員對數(shù)據(jù)重用的態(tài)度越積極,越可能利用他人的數(shù)據(jù)。因此,提出以下假設(shè):
H8:科學(xué)數(shù)據(jù)重用態(tài)度對科研人員科學(xué)數(shù)據(jù)重用意愿存在正向影響。
主觀規(guī)范(社會規(guī)范)(SN,Subjective Norms)是指科研人員在學(xué)術(shù)社區(qū)或團隊中受到來自重要他人對其重用數(shù)據(jù)的支持或期望的程度[28]或科研人員所在環(huán)境中科學(xué)數(shù)據(jù)重用的實踐程度[24]。在計劃行為理論中,主觀規(guī)范作為一種重要的社會因素,是影響個體態(tài)度、意愿的重要因素之一。Kim Y.[28]發(fā)現(xiàn)主觀規(guī)范與科學(xué)數(shù)據(jù)重用態(tài)度及科學(xué)數(shù)據(jù)重用意愿都存在顯著正相關(guān),即當(dāng)科研人員受到其他人的鼓勵或期待時,越能促進其對數(shù)據(jù)重用的態(tài)度與意愿。本研究沿襲這一觀點,因此,提出以下假設(shè):
H9:主觀規(guī)范對科學(xué)數(shù)據(jù)重用態(tài)度存在正向影響;
H10:主觀規(guī)范對科學(xué)數(shù)據(jù)重用意愿存在正向影響。
本文借鑒Joo S.[24]的劃分標準,將內(nèi)部資源支持(IRS,Internal Resource Support)和數(shù)據(jù)存儲庫的可用性(DRA,Data Repository Availability)作為知覺行為控制的兩個維度。內(nèi)部資源支持是指科研人員可以從其所在的科研機構(gòu)或組織獲得任何可能的幫助,特別是技術(shù)或人力方面的幫助[25]。當(dāng)科研人員感知相關(guān)組織或機構(gòu)等提供的服務(wù)、支持等越完善時,科學(xué)數(shù)據(jù)重用意愿也會顯著提高,并且很有可能在一定程度上增進對他人數(shù)據(jù)重用的意愿,從而形成一個相互促進的科學(xué)數(shù)據(jù)重用氛圍,已有研究發(fā)現(xiàn)二者之間存在顯著正相關(guān)[29]。數(shù)據(jù)存儲庫的可用性指科研人員能從數(shù)據(jù)存儲庫中獲取數(shù)據(jù),也可以在數(shù)據(jù)存儲庫中共享自己生產(chǎn)的數(shù)據(jù)。此外,這種可用性還指數(shù)據(jù)存儲庫通過提供增值服務(wù)來保證科研人員對數(shù)據(jù)的再利用[9]??蒲腥藛T能夠輕松訪問數(shù)據(jù)存儲庫、獲取數(shù)據(jù)時,其重用數(shù)據(jù)的意愿也會顯著增加[8]。因此,提出以下假設(shè):
H11:內(nèi)部資源支持對科學(xué)數(shù)據(jù)重用意愿存在正向影響;
H12:數(shù)據(jù)存儲庫的可用性對科學(xué)數(shù)據(jù)重用意愿存在正向影響。
不同于一般的調(diào)節(jié)變量,元分析中的調(diào)節(jié)變量是指納入元分析的所有文獻共有的特征,是顯變量,可以是研究對象特征、期刊類型、測量工具等因素[30]。結(jié)合上述調(diào)節(jié)變量的定義以及對納入元分析的實證文獻進行分析,總結(jié)出4個潛在的調(diào)節(jié)變量。
第一是量表等級。實證研究多通過問卷調(diào)查法來獲取數(shù)據(jù),使用量表進行測量。在一定范圍內(nèi),隨著量表級數(shù)的增加,被調(diào)查對象在填寫問卷時越能夠精確地選擇符合自身情況的選項。吳永澤等[31]發(fā)現(xiàn)不考慮個別調(diào)查對象的特殊性,采用七級左右的量表所取得的結(jié)果是比較理想的。
第二是國別。不同國家地區(qū)有不同的區(qū)域文化,文化是價值觀的重要體現(xiàn),其影響著人類的認知及行為。Tenopir C.等[32]調(diào)查發(fā)現(xiàn)科研人員數(shù)據(jù)重用的意愿在不同地理區(qū)域存在顯著的差異。已有研究證實國別可以調(diào)節(jié)部分因素與科學(xué)數(shù)據(jù)共享意愿之間的關(guān)系[33],科研人員共享數(shù)據(jù)時很可能伴隨著科學(xué)數(shù)據(jù)重用意愿的產(chǎn)生,二者是相互促進的。
第三是學(xué)科。通過調(diào)研發(fā)現(xiàn)已有研究中被調(diào)查對象的學(xué)科特征分化明顯,每個學(xué)科都有其自身的特性,并且不同學(xué)科在其形成和發(fā)展過程中會形成屬于該學(xué)科的獨特的文化,從而對個體的價值觀念產(chǎn)生一定的影響。已有研究發(fā)現(xiàn)部分因素對不同學(xué)科科研人員的影響程度是不同的[34]。
第四是文獻類型。本文將文獻類型分為期刊和學(xué)位論文兩種。文獻類型作為調(diào)節(jié)變量,本質(zhì)可以理解為對研究質(zhì)量的劃分,由于出版流程、質(zhì)量控制等方面的差異,可能會導(dǎo)致研究結(jié)論上的差異[35]。有學(xué)者證實文獻類型的確對部分研究間的異質(zhì)性起到調(diào)節(jié)作用,如石艷等[35]在探究教師知識共享影響因素時,發(fā)現(xiàn)文獻類型對部分變量起到調(diào)節(jié)作用。
綜上所述,本文將量表等級、國別、學(xué)科、文獻類型作為可能導(dǎo)致科學(xué)數(shù)據(jù)重用意愿影響因素實證研究結(jié)果不一致的調(diào)節(jié)變量,均在本研究中假設(shè)的各變量之間的關(guān)系起調(diào)節(jié)作用。提出如下假設(shè):
H13:量表等級對本研究中假設(shè)的各路徑之間的關(guān)系起調(diào)節(jié)作用;
H14:國別對本研究中假設(shè)的各路徑之間的關(guān)系起調(diào)節(jié)作用;
H15:學(xué)科對本研究中假設(shè)的各路徑之間的關(guān)系起調(diào)節(jié)作用;
H16:文獻類型對本研究中假設(shè)的各路徑之間的關(guān)系起調(diào)節(jié)作用。
本文使用CMA2.0軟件,該軟件能夠直接輸出經(jīng)過多個計算步驟后的平均效應(yīng)值,也可以利用多種方式進行發(fā)表偏倚檢驗和異質(zhì)性檢驗,同時還能得到隨機效應(yīng)模型和固定效應(yīng)模型的分析結(jié)果。
研究過程主要包括:第一步是發(fā)現(xiàn)研究問題,提出假設(shè);第二步是進行文獻檢索與篩選;第三步是文獻編碼與處理,即對文獻中的基本信息及所需數(shù)據(jù)進行編碼;第四步是數(shù)據(jù)轉(zhuǎn)化與計算,該環(huán)節(jié)是對提取的數(shù)據(jù)進行轉(zhuǎn)化并求得平均效應(yīng)值;第五步是數(shù)據(jù)分析,包括發(fā)表偏倚檢驗、異質(zhì)性檢驗、描述性統(tǒng)計分析、主效應(yīng)分析、調(diào)節(jié)效應(yīng)分析、敏感性分析等。
本文確定檢索詞包括“科學(xué)數(shù)據(jù)”和“重用”兩部分,在檢索過程中還需結(jié)合實際情況對檢索詞進一步限定和擴展:查準率較低時,在中文檢索數(shù)據(jù)庫中與“意愿、意圖、行為、態(tài)度、因素”組配得到較為精準的結(jié)果;查全率較低時,可將檢索詞擴展為“數(shù)據(jù)重用、數(shù)據(jù)二次利用”或“Data Reuse、Data Secondary Use”等??茖W(xué)數(shù)據(jù)的檢索詞如下:中文檢索詞有科學(xué)數(shù)據(jù)、科研數(shù)據(jù)、研究數(shù)據(jù)、二手數(shù)據(jù);英文關(guān)鍵詞有Scientific Data、Scientific Research Data、Science Data、Research Data、Second Hand Data。另外,與重用相關(guān)的中文檢索詞有重用、復(fù)用、再利用、重復(fù)利用、二次利用;英文關(guān)鍵詞有Reusing、Reuse、Reusability。檢索步驟如下:首先在知網(wǎng)、萬方、維普、超星發(fā)現(xiàn)、WOS、Emerald、Elsevier、ProQuest Education Journals、SAGE、Wiley、Springer、OADDS等中、英文數(shù)據(jù)庫進行檢索;其次對國內(nèi)外相關(guān)期刊及專家進行專項檢索;再次選取谷歌學(xué)術(shù)和百度學(xué)術(shù)作為輔助文獻源,對相關(guān)文獻的參考文獻進行查找。
本文按照一定的標準對檢索出的文獻進行納入與剔除,標準內(nèi)容如下:第一,文獻類型必須是實證類文獻,訪談、案例、綜述等類型的文獻需要被剔除;第二,文獻必須至少包含一個本研究構(gòu)建的科學(xué)數(shù)據(jù)重用意愿影響因素整合模型中的路徑;第三,必須提供樣本數(shù)、相關(guān)系數(shù)或者p(p為顯著性檢驗值)、t(路徑性顯著性的t值)等可以計算效應(yīng)值的統(tǒng)計量;第四,基于同一樣本量的期刊和學(xué)位論文,優(yōu)先納入學(xué)位論文;第五,剔除描述不清、基于同一樣本量或樣本量存在較大交叉等情況的文獻。最終得到納入元分析的文獻13篇:按照語種來說包含中文6篇、英文7篇,按照文獻類型來說分為期刊8篇、學(xué)位論文5篇。本文提取的因素數(shù)量均≥3,有學(xué)者指出當(dāng)所得平均效應(yīng)值至少包含3個不同研究樣本的數(shù)據(jù)時,其元分析的結(jié)果是穩(wěn)定的[17]。目標文獻的篩選流程如圖2所示。
篩選出目標文獻后,逐篇對目標文獻進行編碼,編碼規(guī)則見表1。本文的編碼由作者分兩次進行,且前后時間間隔為一個星期,對兩次編碼結(jié)果進行比對,對于不一致的數(shù)據(jù)通過查閱原文以及咨詢專家進而得到最終編碼結(jié)果。
表1 編碼規(guī)則表Table1 Coding rule table
有學(xué)者對管理學(xué)中元分析的應(yīng)用情況進行統(tǒng)計,發(fā)現(xiàn)研究常采用r來計算平均效應(yīng)值[39]。本文提取數(shù)值的類型包含r和β兩種類型,需要對β進行轉(zhuǎn)化。本文采用Peterson R. A.等[40]推薦的較為簡潔且效果較好的公式:r=β+0.05λ(-0.5,0.5)(當(dāng)β≥0時,λ=1;β<0時,λ=0)。盡管對數(shù)據(jù)類型進行了統(tǒng)一,但不同研究人員在進行研究時,由于人為原因可能會使所得觀察值與真實值存在一定的誤差。因此,在進行元分析過程中,要盡可能地減小誤差,獲取更真實的數(shù)據(jù)。本文利用編碼中收集的信度系數(shù)對相關(guān)系數(shù)進行修正,修正后效應(yīng)值大于1的原始相關(guān)系數(shù),則放棄修正,公式如(1)所示:
(1)
(2)
(3)
(4)
元分析是對已有研究結(jié)果的再分析,通過收集已有數(shù)據(jù)結(jié)果進行匯總從而增加統(tǒng)計效能,使研究結(jié)論更具穩(wěn)健性。但在收集文獻的過程中,研究結(jié)果具有統(tǒng)計學(xué)意義、樣本量較大、采用通用語種以及被引次數(shù)較高等的研究文獻更容易被檢索[41],進而可能發(fā)生漏檢、誤檢,使得樣本較少,導(dǎo)致合并的平均效應(yīng)值被高估[42]。因此,要對研究進行發(fā)表偏倚檢驗。本文采用三種檢驗方法:失效安全系數(shù)檢驗、Egger檢驗和秩相關(guān)檢驗。失效安全系數(shù)是計算至少還需要多少研究才能使元分析的結(jié)果失去統(tǒng)計學(xué)意義,一般大于5K+10(K為研究中各變量納入的文獻數(shù)),即可視為不存在發(fā)表偏倚。進行Egger檢驗時,p>0.05(p代表偏移的顯著性),則不存在發(fā)表偏倚[43]。秩相關(guān)檢驗被認為是漏斗圖的直接統(tǒng)計學(xué)模擬,Tau值(Tau值作為異質(zhì)性平方差估計量,其本身反映了Meta分析中異質(zhì)性的大小)顯著則說明研究可能存在發(fā)表偏差[44]。綜合三種研究結(jié)果(見表2),發(fā)現(xiàn)各路徑研究結(jié)果穩(wěn)定性較高,受發(fā)表偏倚影響的概率較低。
表2 發(fā)表偏倚檢驗結(jié)果Table 2 Publication bias test results
研究間的相似之處是進行元分析的基本前提,因此需要對研究間的相似性或者異質(zhì)性進行檢驗。當(dāng)異質(zhì)性檢驗結(jié)果顯著時,說明不僅存在組內(nèi)誤差,還可能存在由研究對象的不同、偏倚的控制等引起的組間誤差[45],即在計算效應(yīng)值時,既要考慮組內(nèi)誤差,還要考慮組間誤差,應(yīng)選擇隨機模型計算效應(yīng)值均值。隨機效應(yīng)模型不會因為大樣本而忽視小樣本,所得出的總效應(yīng)量是各個研究真實效應(yīng)量的均值[46]。利用Q統(tǒng)計量檢驗(Q統(tǒng)計量是異質(zhì)性檢驗的基礎(chǔ),它服從自由度為k-1的卡方分布,k為效應(yīng)值數(shù)量,如果Q值在統(tǒng)計上顯著,則這些效應(yīng)值存在異質(zhì)性,應(yīng)采用隨機效應(yīng)模型)時,P<0.05(P為Q值的顯著性檢驗值),表明研究間存在異質(zhì)性,反之,表明研究間不存在異質(zhì)性[47]。此外,一般而言,I2值(I2為異質(zhì)性檢驗的補充值,反映的是效應(yīng)值的真實差異占總差異的百分比)大于50%即說明存在比較明顯的異質(zhì)性[48]。異質(zhì)性檢驗結(jié)果見表3,發(fā)現(xiàn)所有變量Q值均達到顯著性水平,同時I2值均大于50%,表明各個研究間存在異質(zhì)性,因此均選擇隨機效應(yīng)模型。
表3 異質(zhì)性檢驗結(jié)果Table 3 Heterogeneity test results
4.1.1 路徑分析
從表4分析結(jié)果可知,從研究數(shù)量來看,研究較多的路徑關(guān)系是“感知有用性—科學(xué)數(shù)據(jù)重用意愿”。從各路徑的相關(guān)系數(shù)結(jié)果來看:“主觀規(guī)范—科學(xué)數(shù)據(jù)重用態(tài)度”(SN—SDRA)這一路徑研究結(jié)果間的差異最大,即最大值(0.553)-最小值(-0.279)=0.832;“內(nèi)部資源支持—科學(xué)數(shù)據(jù)重用意愿”(IRS—SDRI)研究結(jié)果間差異最小,即最大值(0.454)-最小值(0.251)=0.203。從Fisher’s Z值來看:“感知有用性—科學(xué)數(shù)據(jù)重用態(tài)度”(PU—SDRA)研究間的Fisher’s Z值差值最大,即最大值(2.092)-最小值(0.391)=1.701;“內(nèi)部資源支持—科學(xué)數(shù)據(jù)重用意愿”(IRS—SDRI)研究間的Fisher’s Z值差值最小,即最大值(0.490)-最小值(0.256)=0.234。從樣本量來看:“感知有用性—科學(xué)數(shù)據(jù)重用意愿”(PU—SDRI)這一路徑總樣本量最大,達到4 230;而“感知努力—科學(xué)數(shù)據(jù)重用態(tài)度”這一路徑樣本量最少也達到997。
表4 路徑分析結(jié)果Table 4 Path analysis results
4.1.2 信度分析
為使研究結(jié)果更趨嚴謹,本研究對各因素變量進行信度分析。Nunnally J. C.[49]認為信度值大于0.7時,可認為該結(jié)果具有良好的可信度。如表5所示:各變量的平均信度范圍為0.797~0.899,平均信度最小是0.797,方差范圍為0.000~0.010,方差最大值是0.010。說明各變量的數(shù)據(jù)結(jié)果信度較好且較穩(wěn)定,能為后續(xù)進行元分析提供保障。
表5 信度分析結(jié)果Table5 Reliability analysis results
表6 主效應(yīng)分析結(jié)果Table 6 Main effect analysis results
4.3.1 量表等級
依照上文編碼結(jié)果,將量表等級分為七級和五級兩個屬性進行檢驗。表7研究結(jié)果顯示:“感知風(fēng)險—科學(xué)數(shù)據(jù)重用意愿”(PR—SDRI,Q=4.115,p=0.043)、“內(nèi)部資源支持—科學(xué)數(shù)據(jù)重用意愿”(IRS—SDRI,Q=9.835,p=0.002)之間的關(guān)系均受到量表等級的調(diào)節(jié)作用,即組間統(tǒng)計量Q值均顯著(p<0.05);其他路徑間的關(guān)系沒有得到顯著調(diào)節(jié)。進一步分析發(fā)現(xiàn),除“感知風(fēng)險—科學(xué)數(shù)據(jù)重用態(tài)度”(PR—SDRA)“科學(xué)數(shù)據(jù)重用態(tài)度—科學(xué)數(shù)據(jù)重用意愿”(SDRA—SDRI)兩種路徑外,采用七級量表所得到各路徑之間的效應(yīng)值更接近效應(yīng)值的均值,可認為采用李克特七級量表的所得效果更好。
表7 量表等級為調(diào)節(jié)變量的分析結(jié)果Table 7 Analysis results with the scale level as the adjustment variable
續(xù)表7 量表等級為調(diào)節(jié)變量的分析結(jié)果Continued Table 7 Analysis results with the scale level as the adjustment variable
4.3.2 國別
本研究將國別劃分國內(nèi)和國外兩個亞組進行調(diào)節(jié)效應(yīng)分析。表8研究結(jié)果顯示:國別對感知有用性、感知努力與科學(xué)數(shù)據(jù)重用態(tài)度以及感知數(shù)據(jù)質(zhì)量、內(nèi)部資源支持、數(shù)據(jù)存儲庫的可用性與科學(xué)數(shù)據(jù)重用意愿之間的關(guān)系均起到調(diào)節(jié)作用;其余關(guān)系未得到顯著調(diào)節(jié)。
表8 國別為調(diào)節(jié)變量的分析結(jié)果Table 8 Analysis results with country as adjustment variable
對有統(tǒng)計意義的結(jié)果進一步分析,發(fā)現(xiàn)感知有用性、感知風(fēng)險對國外科研人員數(shù)據(jù)重用態(tài)度的影響較大,同時感知有用性對國外科研人員科學(xué)數(shù)據(jù)重用意愿有更積極的促進作用,該結(jié)果證實了Tenopir C.等[32]的結(jié)論。較國內(nèi)來說,國外科學(xué)數(shù)據(jù)開放與重用進程發(fā)展更快。由于國外大多崇尚個人主義文化:當(dāng)國外科研人員感覺重用他人數(shù)據(jù)能給自己帶來更多利益時,越對科學(xué)數(shù)據(jù)重用持積極態(tài)度,科學(xué)數(shù)據(jù)重用意愿也越高;反之,當(dāng)重用他人的數(shù)據(jù)會帶來一定的風(fēng)險時,也會顯著降低他們的積極性。相較于國外,感知數(shù)據(jù)質(zhì)量、主觀規(guī)范、內(nèi)部資源支持、數(shù)據(jù)存儲庫的可用性均對國內(nèi)科研人員的數(shù)據(jù)重用意愿影響較大。當(dāng)科研人員感覺其所獲取的數(shù)據(jù)質(zhì)量越高或者得到的他人和組織的支持越多或者所選擇的數(shù)據(jù)存儲庫的可用性越高時,國內(nèi)科研人員越有可能使用他人的數(shù)據(jù)。國內(nèi)科研人員更注重集體的利益,當(dāng)科研人員所在社區(qū)的科學(xué)數(shù)據(jù)重用現(xiàn)象較普遍時,科研人員可能為了科學(xué)社區(qū)的發(fā)展或者為了滿足他人的期待而重用他人生產(chǎn)的數(shù)據(jù)。
4.3.3 學(xué)科
通過編碼結(jié)果可知,被調(diào)查對象所屬學(xué)科范圍可劃分為社會科學(xué)、自然科學(xué)和多學(xué)科三種,為了使得結(jié)果更加清晰,本文僅從社會科學(xué)和自然科學(xué)兩個亞組檢驗學(xué)科是否對各路徑間的關(guān)系起到調(diào)節(jié)作用。剔除部分亞組沒有效應(yīng)值的路徑,得到研究結(jié)果見表9。學(xué)科對感知有用性、科學(xué)數(shù)據(jù)重用態(tài)度、數(shù)據(jù)存儲庫的可用性與科學(xué)數(shù)據(jù)重用意愿的關(guān)系均具有調(diào)節(jié)作用。
續(xù)表9 學(xué)科為調(diào)節(jié)變量的分析結(jié)果Continued Table 9 Analysis results of subject as adjustment variables
研究結(jié)果表明,感知有用性、感知數(shù)據(jù)質(zhì)量、科學(xué)數(shù)據(jù)重用態(tài)度都對社會科學(xué)領(lǐng)域科研人員的科學(xué)數(shù)據(jù)重用意愿影響較小,原因可能是與學(xué)科自身特征有一定的關(guān)系:社會科學(xué)側(cè)重于發(fā)現(xiàn)和解釋社會現(xiàn)象,研究緊跟時代的發(fā)展,通常需要科研人員采用訪談和問卷調(diào)查等方法獲取數(shù)據(jù);相比利用他人的數(shù)據(jù),社會科學(xué)領(lǐng)域科研人員自己收集數(shù)據(jù)帶來的收益可能更大,從而使得科研人員對數(shù)據(jù)重用沒有較高的意愿。另一方面,主觀規(guī)范、數(shù)據(jù)存儲庫的可用性與社會科學(xué)領(lǐng)域科研人員的數(shù)據(jù)重用意愿關(guān)系較強:社會科學(xué)研究以社會現(xiàn)象為主,具有一定的主觀性,使得科研人員可能會為了滿足他人的期待去利用他人的數(shù)據(jù);在數(shù)據(jù)存儲庫方面,自然科學(xué)領(lǐng)域的數(shù)據(jù)庫數(shù)據(jù)較多且較完善,而社會科學(xué)領(lǐng)域的數(shù)據(jù)庫還存在較大的不足,使得社會科學(xué)領(lǐng)域科研人員獲取數(shù)據(jù)較困難進而影響科研人員數(shù)據(jù)重用的意愿。
4.3.4 文獻類型
本研究將文獻類型劃分期刊和學(xué)位論文兩個亞組。“數(shù)據(jù)存儲庫的可用性—科學(xué)數(shù)據(jù)重用意愿”這一路徑只有期刊這一亞組,所以不進行調(diào)節(jié)效應(yīng)分析,得到其他路徑研究結(jié)果見表10所示。文獻類型對“感知數(shù)據(jù)質(zhì)量—科學(xué)數(shù)據(jù)重用意愿”(PDQ—SDRI,Q=6.290,p=0.012)、“主觀規(guī)范—科學(xué)數(shù)據(jù)重用態(tài)度”(SN—SDRA,Q=175.721,p=0.000)、“內(nèi)部資源支持—科學(xué)數(shù)據(jù)重用意愿”(IRS—SDRI,Q=4.456,p=0.035)之間的關(guān)系均起到調(diào)節(jié)作用。進一步對效應(yīng)值進行分析,發(fā)現(xiàn)期刊這一亞組所得到的各路徑之間的效應(yīng)值更接近平均效應(yīng)值:一方面可能因為納入期刊多屬核心期刊,質(zhì)量較高,所得結(jié)果更貼切;另一方面可能由于期刊在納入的文獻中所占比重較大,使得這一亞組的結(jié)果更接近總體效應(yīng)值的均值。
表10 文獻類型為調(diào)節(jié)變量的分析結(jié)果Table 10 Analysis results of document category as adjustment variable
續(xù)表10 文獻類型為調(diào)節(jié)變量的分析結(jié)果Continued Table 10 Analysis results of document category as adjustment variable
一個完整的元分析還應(yīng)該包括對整體結(jié)果穩(wěn)定性的檢驗。敏感性分析能夠檢驗所得效應(yīng)量結(jié)果的穩(wěn)定性,評估元分析結(jié)果的可靠性,是元分析的一個重要環(huán)節(jié)。但通過梳理文獻,發(fā)現(xiàn)圖書情報領(lǐng)域已有研究在使用元分析方法時,對敏感性分析不夠重視。本文采用逐篇剔除法進行分析,每次剔除一個文獻,觀察是否存在剔除文獻后所得效應(yīng)值的95%的置信區(qū)間沒有與平均效應(yīng)量的95%的置信區(qū)間重疊的異常值(95%置信區(qū)間包含0)[51]。由表11敏感性分析結(jié)果表明,除“感知努力—科學(xué)數(shù)據(jù)重用態(tài)度”(PE—SDRA)“感知努力—科學(xué)數(shù)據(jù)重用意愿”(PE—SDRI)兩個路徑所得結(jié)果穩(wěn)定性較差(結(jié)論不具有代表性),其余路徑研究結(jié)果都有較高的穩(wěn)定性。未來還需要增加研究文獻對不穩(wěn)定的研究結(jié)果進行分析,從而得出可靠的結(jié)論。
表11 敏感性分析結(jié)果Table 11 Sensitivity analysis results
本研究收集中文、英文實證文獻共13篇,共計80個效應(yīng)值,共涉及5 878名被調(diào)查者,得到與科學(xué)數(shù)據(jù)重用意愿相關(guān)的7個影響因素,最終構(gòu)建出較為完整的科學(xué)數(shù)據(jù)重用意愿影響因素整合模型,見圖3所示(圖中的英文縮寫代表調(diào)節(jié)變量,如SL代表量表等級)。
在主效應(yīng)層面,對科學(xué)數(shù)據(jù)重用意愿具有顯著正向影響的因素按其程度大小排序依次是科學(xué)數(shù)據(jù)重用態(tài)度、感知有用性、主觀規(guī)范、感知數(shù)據(jù)質(zhì)量、數(shù)據(jù)存儲庫的可用性、內(nèi)部資源支持。其中,重用態(tài)度、主觀規(guī)范、感知數(shù)據(jù)質(zhì)量對科學(xué)數(shù)據(jù)重用意愿影響程度的排序與魏銀珍等人[23]的研究結(jié)果一致。此外,還發(fā)現(xiàn)感知有用性、主觀規(guī)范與科學(xué)數(shù)據(jù)重用態(tài)度正相關(guān)。對科學(xué)數(shù)據(jù)重用意愿具有顯著負向影響的因素是感知風(fēng)險,還發(fā)現(xiàn)感知風(fēng)險也對科學(xué)數(shù)據(jù)重用態(tài)度有負向影響。感知努力與科學(xué)數(shù)據(jù)重用態(tài)度或意愿沒有存在顯著的關(guān)系,這一結(jié)論與Yoon A.等[9]的結(jié)論不一致。相較于強相關(guān)和中度相關(guān)因素而言,具有弱相關(guān)關(guān)系或者沒有顯著關(guān)系的影響因素在不同研究所得的結(jié)果更可能與元分析結(jié)果不一致。
在調(diào)節(jié)效應(yīng)層面,科學(xué)數(shù)據(jù)重用意愿影響因素會隨量表等級、國別、學(xué)科、文獻類型的不同而存在顯著差異:量表等級對“感知風(fēng)險—科學(xué)數(shù)據(jù)重用意愿”“內(nèi)部資源支持—科學(xué)數(shù)據(jù)重用意愿”之間的關(guān)系起到調(diào)節(jié)作用;國別對“感知有用性—科學(xué)數(shù)據(jù)重用態(tài)度”“感知數(shù)據(jù)質(zhì)量—科學(xué)數(shù)據(jù)重用意愿”“內(nèi)部資源支持—科學(xué)數(shù)據(jù)重用意愿”“數(shù)據(jù)存儲庫的可用性—科學(xué)數(shù)據(jù)重用意愿”之間的關(guān)系起到調(diào)節(jié)作用;學(xué)科對“感知有用性—科學(xué)數(shù)據(jù)重用意愿”“科學(xué)數(shù)據(jù)重用態(tài)度—科學(xué)數(shù)據(jù)重用意愿”“數(shù)據(jù)存儲庫的可用性—科學(xué)數(shù)據(jù)重用意愿”之間的關(guān)系均起到調(diào)節(jié)作用;文獻類型對“感知數(shù)據(jù)質(zhì)量—科學(xué)數(shù)據(jù)重用意愿”“主觀規(guī)范—科學(xué)數(shù)據(jù)重用態(tài)度”“內(nèi)部資源支持—科學(xué)數(shù)據(jù)重用意愿”之間的關(guān)系均起到調(diào)節(jié)作用。對于沒有被驗證的假設(shè)關(guān)系,可能是還存在其他因素的影響,未來還需納入更多文獻進行檢驗。
本研究的理論貢獻主要有以下幾點。第一,本研究結(jié)合現(xiàn)有科學(xué)數(shù)據(jù)重用影響因素實證文獻中常用的理論,基于多理論融合發(fā)展的方法,選擇計劃行為理論、技術(shù)接受模型及其擴展模型作為理論基礎(chǔ),有助于多理論的融合發(fā)展。然后,提出了科學(xué)數(shù)據(jù)重用意愿影響因素的整合分析框架,較為全面地揭示了影響科學(xué)數(shù)據(jù)重用意愿的因素,為未來學(xué)者們的研究理論架構(gòu)和研究設(shè)計提供了借鑒。第二,本研究整合關(guān)于科學(xué)數(shù)據(jù)重用意愿影響因素的不同研究結(jié)果,并對其進行數(shù)據(jù)分析,揭示了科學(xué)數(shù)據(jù)重用意愿與影響因素的效應(yīng)值,得出了更具有普適性的結(jié)論,并進一步豐富了科學(xué)數(shù)據(jù)重用的研究成果。第三,本研究針對以往研究中存在的相關(guān)系數(shù)差異甚至存在方向相反的結(jié)果進行差異性分析。通過引入量表等級、國別、學(xué)科、文獻類型四個調(diào)節(jié)變量進行調(diào)節(jié)效應(yīng)分析,降低了部分變量之間的異質(zhì)性,深度挖掘了研究結(jié)果存在差異性的部分原因,為以后學(xué)者開展類似研究提供借鑒和參考。
本研究的實踐啟示如下:在國家層面,應(yīng)該加快推進科學(xué)數(shù)據(jù)共享和重用的建設(shè)工程,建立健全科學(xué)數(shù)據(jù)重用的相關(guān)政策法規(guī);在政府層面,應(yīng)該加強和完善基礎(chǔ)設(shè)施建設(shè),例如,安排相關(guān)技術(shù)人員進行實時監(jiān)督,保證平臺運行的可靠性、穩(wěn)定性與安全性,還可以適當(dāng)?shù)卦跀?shù)據(jù)庫中增加一些反饋信息進行引導(dǎo);在社會層面,營造積極的、規(guī)范的開放共享與重用環(huán)境,社會相關(guān)機構(gòu)可以基于科研人員雙重身份(共享者及重用者)的視角下建立和完善相關(guān)激勵與獎勵機制,建立明確的貢獻評價體系;在個人層面,個人要正確認識數(shù)據(jù)重用的價值,提高自身對數(shù)據(jù)重用的積極性;在組織層面,相關(guān)組織應(yīng)呼吁相關(guān)利益主體從數(shù)據(jù)生產(chǎn)到再利用各個環(huán)節(jié)中對數(shù)據(jù)進行嚴格把控,以期提高科學(xué)數(shù)據(jù)的質(zhì)量。
雖然本文盡可能地按照規(guī)范化的步驟展開研究,且在具體處理過程中采用多種方法對數(shù)據(jù)進行處理,但仍存在一定的局限性:本研究納入文獻較少,沒有探究滿意度、信任等因素對科學(xué)數(shù)據(jù)重用意愿的影響;僅對科學(xué)數(shù)據(jù)重用態(tài)度及意愿有直接影響的路徑進行了分析,沒有檢驗中介效應(yīng)。未來要多關(guān)注科學(xué)數(shù)據(jù)重用相關(guān)研究的動態(tài)發(fā)展,納入更多的影響因素及調(diào)節(jié)變量,還可以利用元分析結(jié)構(gòu)方程的方法對中介變量進行研究,從而得到更加完善的理論模型。此外,還發(fā)現(xiàn)已有研究多以多學(xué)科的科研人員為研究對象進行探究,未來可嘗試對單一學(xué)科領(lǐng)域的科研人員科學(xué)數(shù)據(jù)重用影響因素進行研究。