張瀟月,宋秀芳,顧立平,劉金亞,陳新蘭
(1.中國科學(xué)院文獻(xiàn)情報中心,北京 100190;2.中國科學(xué)院大學(xué)經(jīng)濟與管理學(xué)院圖書情報與檔案管理系,北京 100190)
科研數(shù)據(jù)重用,是指科研人員對科研數(shù)據(jù)集進行原始意圖以外二次使用的活動[1-2]。信息管理領(lǐng)域?qū)W者對其的定義更強調(diào)可追溯程度,即通過正式學(xué)術(shù)交流渠道對科研數(shù)據(jù)進行開放與獲取,如數(shù)據(jù)知識庫[3]??蒲袛?shù)據(jù)重用行為有助于科研人員更好地實踐開放科研數(shù)據(jù)的理念,提升科研人員和科研社群整體的科研效率[4]。
數(shù)據(jù)重用與開放共享之間是相互依賴與促進的關(guān)系,有助于形成二者相互推動的循環(huán)生態(tài)。該生態(tài)能夠鼓勵科研人員將數(shù)據(jù)重用所產(chǎn)生的新型研究發(fā)現(xiàn)以開放共享的形式反饋至科研社群中,提升科研人員對開放科研數(shù)據(jù)理念的認(rèn)同與持續(xù)參與。例如,在英國開放數(shù)據(jù)運動中,便促進二次分析定性數(shù)據(jù)成為一種主流的研究方法[5]。
作者們前期圍繞開放科研數(shù)據(jù)環(huán)境下,科研人員科研數(shù)據(jù)重用主題的研究進行綜述,研究結(jié)果表明,該主題的發(fā)展遵循以下發(fā)展路徑(圖1)。簡而言之,開放科研數(shù)據(jù)的發(fā)展初期,需要發(fā)展基礎(chǔ)設(shè)施,否則科研數(shù)據(jù)無法得到有效地存儲和傳播。由于需要明確行為規(guī)范,并且存在數(shù)據(jù)權(quán)益的利益相關(guān)者,需要政策甚至法律法規(guī)來界定權(quán)責(zé)機制,因此,為了進一步將相關(guān)的流程固定并優(yōu)化,便開始進行數(shù)據(jù)引用和重用流程方面的完善工作,并且以科研數(shù)據(jù)開放和重用為中心的數(shù)據(jù)社群逐漸形成[6]。數(shù)據(jù)重用實踐中,科研人員是推動開放科研數(shù)據(jù)的戰(zhàn)略核心。如果“回歸本質(zhì)”思考,開放科研數(shù)據(jù)發(fā)展推動的核心是人,啟動與最終受益的是科研社群的發(fā)展和壯大。
圖1 開放科研數(shù)據(jù)環(huán)境下科研數(shù)據(jù)重用主題發(fā)展路徑
科研人員在開放科研數(shù)據(jù)運動中起到關(guān)鍵作用,他們既是科研數(shù)據(jù)的生產(chǎn)者又是使用者,既是實現(xiàn)者又是受益者。因此,從這個角度上來說,有必要探究以科研人員為核心,以數(shù)據(jù)基礎(chǔ)設(shè)施、利益相關(guān)方、數(shù)據(jù)政策以及數(shù)據(jù)流動過程為組成要素的相互促進的循環(huán)體系。進一步而言,科研數(shù)據(jù)流動以科研人員的使用(重用)需求為導(dǎo)向,受科研活動中競爭與合作機制的影響。Adner等[7]認(rèn)為,生態(tài)系統(tǒng)視角可用來理解同時以合作和競爭為特征的伙伴間的相互依賴關(guān)系。有學(xué)者在管理學(xué)[8]、開放政府?dāng)?shù)據(jù)領(lǐng)域[9]運用該視角探索梳理實踐框架。本研究亦采用該視角探究科研數(shù)據(jù)重用環(huán)節(jié),將數(shù)據(jù)重用生態(tài)系統(tǒng)定義為:通過不斷完善現(xiàn)有科研數(shù)據(jù)交流網(wǎng)絡(luò),提供良好的環(huán)境支持,從而形成數(shù)據(jù)資源輸入(開放共享的科研數(shù)據(jù))與產(chǎn)出(數(shù)據(jù)重用成果)間相互促進狀態(tài)的場域。
科研人員是開放科研數(shù)據(jù)利益相關(guān)方中的核心角色[10],在科研數(shù)據(jù)重用過程中發(fā)揮重要作用。有學(xué)者認(rèn)為,清晰理解數(shù)據(jù)重用定義能夠促進相關(guān)人員對數(shù)據(jù)重用的討論,并提升參與感[11]。科研人員作為科研數(shù)據(jù)的生產(chǎn)者與重用者,對開放科研數(shù)據(jù)重用行為的理解與實施,直接決定了開放科研數(shù)據(jù)的實際效果。愛思唯爾調(diào)查顯示,所有相關(guān)方應(yīng)盡量縮小科研數(shù)據(jù)開放共享、數(shù)據(jù)重用活動政策與實踐之間的鴻溝,確保科研人員應(yīng)用這些指導(dǎo)原則與標(biāo)準(zhǔn)[12]。上述結(jié)果說明,利益相關(guān)方已逐步認(rèn)識到科研人員在落實開放科研數(shù)據(jù)政策理念中的關(guān)鍵作用。
當(dāng)前,眾多學(xué)者利用行為學(xué)理論來驗證科研人員自身的態(tài)度和感知對其數(shù)據(jù)重用行為的影響,諸如技術(shù)接受和使用統(tǒng)一理論(Unified Theory of Ac‐ceptance and Use of Technology,UTAUT)、理性行為理論(Theory of Reasoned Action,TRA)[13]、計劃行為理論(Theory of Planned Behavior,TPB)[14]等。例如,Curty等[15]基于UTAUT理論編碼了13位社會科學(xué)家的訪談內(nèi)容,構(gòu)建了科學(xué)家數(shù)據(jù)重用意圖和行為的影響因素模型,其認(rèn)為感知有用性、感知風(fēng)險、感知努力程度、社會影響以及促進條件通過影響數(shù)據(jù)重用意圖,影響科研人員的數(shù)據(jù)重用行為。這說明科研人員自身的意圖和感知對其數(shù)據(jù)重用行為具有較大影響。隨后,Curty等[13]以TRA理論為基礎(chǔ),探索影響科學(xué)家數(shù)據(jù)共享與重用行為的態(tài)度和規(guī)范要素,研究結(jié)果發(fā)現(xiàn),感知效率和感知重要程度作為態(tài)度的重要組成部分,對科研人員的數(shù)據(jù)重用行為具有較大的正向影響,這說明科研人員的態(tài)度同樣是科研數(shù)據(jù)重用行為的影響因素。Kim等[16]以TPB理論和制度理論為基礎(chǔ),對科學(xué)家的科研數(shù)據(jù)重用行為意愿開展多層次分析,研究結(jié)果顯示,數(shù)據(jù)知識庫的實用程度(availability)、感知有用程度、感知顧慮以及內(nèi)部資源的實用程度顯著影響數(shù)據(jù)重用行為意愿,并建議科研社群可從教育/培訓(xùn)科研人員、給予內(nèi)外部支持方面,促進科研人員開展數(shù)據(jù)重用活動。這說明相關(guān)學(xué)者注意到通過多種支持途徑提升科研人員對科研數(shù)據(jù)重用活動益處的感知,并采取相關(guān)措施降低感知風(fēng)險。
科研數(shù)據(jù)重用行為影響因素存在學(xué)科差異。英國數(shù)字監(jiān)管中心(Digital Curation Center,DCC)對藝術(shù)人文、社會科學(xué)、生物科學(xué)、物理科學(xué)等領(lǐng)域的科研人員開展數(shù)據(jù)共享和重用的態(tài)度調(diào)查時,發(fā)現(xiàn)學(xué)科間的差異體現(xiàn)在技術(shù)和行為水平方面[17]。有學(xué)者指出,應(yīng)注意產(chǎn)生大數(shù)據(jù)和長尾數(shù)據(jù)的學(xué)科,在數(shù)據(jù)重用條件、成本與數(shù)據(jù)重用行為方面的異同[18]。本研究受其啟發(fā):科研人員對數(shù)據(jù)重用行為的態(tài)度和感知、對數(shù)據(jù)重用行為的影響,亦可能存在學(xué)科差異。因此,本文欲探究科研數(shù)據(jù)重用行為的影響因素與機制,可首先選取具有代表性的某一學(xué)科領(lǐng)域。
對比國內(nèi)外研究發(fā)現(xiàn),我國當(dāng)前對數(shù)據(jù)重用行為影響因素的研究尚處于起步階段,鮮有涉及具體學(xué)科領(lǐng)域。從世界范圍來看,生物學(xué)領(lǐng)域具有較為深厚的數(shù)據(jù)重用基礎(chǔ)與機制,數(shù)據(jù)基礎(chǔ)設(shè)施完善且擁有開放數(shù)據(jù)的文化基礎(chǔ),科研數(shù)據(jù)重用的流程和機制較為成熟。無論在數(shù)據(jù)的可發(fā)現(xiàn)性,還是在共享科研數(shù)據(jù)方面,生物學(xué)領(lǐng)域均居各學(xué)科之首。并且該領(lǐng)域已經(jīng)建立起較為完善的數(shù)據(jù)共享規(guī)范[19]。在我國,生物學(xué)領(lǐng)域也具備較為成熟的數(shù)據(jù)開放共享基礎(chǔ)。我國2019年發(fā)布的《國家科技資源共享服務(wù)平臺優(yōu)化調(diào)整名單的通知》中,涉及生物學(xué)領(lǐng)域眾多科學(xué)數(shù)據(jù)中心和國家生物種質(zhì)與實驗材料資源庫[20]。相關(guān)政策的出臺也在進一步規(guī)范和促進生物學(xué)領(lǐng)域科研數(shù)據(jù)的開放共享,如《中國科學(xué)院戰(zhàn)略生物資源服務(wù)計劃數(shù)據(jù)管理及標(biāo)準(zhǔn)規(guī)范》[21-22]。因此,本文選取我國生物學(xué)領(lǐng)域科研人員作為調(diào)查對象,以生態(tài)系統(tǒng)視角探究該領(lǐng)域科研數(shù)據(jù)重用行為的影響因素,比較具有實踐與調(diào)查的可行性。
本文立足生態(tài)系統(tǒng)視角,關(guān)注科研數(shù)據(jù)重用文化氛圍的形成。如上文所述,在以科研人員的科研數(shù)據(jù)重用活動為核心的生態(tài)系統(tǒng)中,科研人員既受到現(xiàn)有基礎(chǔ)設(shè)施和政策環(huán)境的影響,又使得基礎(chǔ)設(shè)施方和政策提供方調(diào)整服務(wù),以更好地滿足其數(shù)據(jù)重用的需要。簡而言之,科研人員及其所處的開放科研數(shù)據(jù)環(huán)境之間是相互作用的。
班杜拉提出的社會認(rèn)知理論(Social Cognitive Theory,SCT),根據(jù)“三方互惠決定論”(triadic reciprocal determinism)的原因解釋心理現(xiàn)象。從這一互動的因果模型可知,人的能動性是其內(nèi)部因素(以認(rèn)知、情感和生物事件形式出現(xiàn))、行為模式和環(huán)境影響三者彼此相互作用的產(chǎn)物[23]。該理論較為符合本研究的背景,亦能夠促進更好地實現(xiàn)本文的研究目的,即從科研人員視角理解其科研數(shù)據(jù)重用需求與重用行為。因此,本文基于社會認(rèn)知理論中的三方互惠決定論來制定理論模型。Middleton等[24]的研究表明,已有大量研究將社會認(rèn)知理論應(yīng)用于信息科學(xué)(information science)的研究領(lǐng)域中,特別是在信息搜尋行為(與使用)和知識共享方面。我國圖書館學(xué)、情報學(xué)領(lǐng)域?qū)W者亦應(yīng)用社會認(rèn)知理論(以及其中的自我效能理論)開展相關(guān)研究[25-27],主題涉及信息使用、搜尋和共享行為。這說明使用社會認(rèn)知理論研究科研人員的科研數(shù)據(jù)重用行為,具備可行性和擴展應(yīng)用領(lǐng)域的價值。
本研究以“open science”“open data”“open re‐search data”作為背景關(guān)鍵詞,分別與數(shù)據(jù)重用相關(guān)的行為關(guān)鍵詞“data reuse”“research data reuse”“scientific data reuse”“secondary data analysis”“sec‐ondary use of data”“secondary use of scientific data”進行組合,通過Web of Science(WoS)對英文學(xué)術(shù)論文進行檢索,通過Bing搜索引擎檢索其他類型英文文獻(xiàn)。以“開放科學(xué)”“開放數(shù)據(jù)”“開放科研數(shù)據(jù)”作為環(huán)境關(guān)鍵詞,以“數(shù)據(jù)”“科學(xué)數(shù)據(jù)”“科研數(shù)據(jù)”作為核心術(shù)語關(guān)鍵詞,以“重用”“再利用”“二次使用”作為行為關(guān)鍵詞,在中國知網(wǎng)組合進行中文論文檢索,最終得出核心文獻(xiàn)集。
根據(jù)該文獻(xiàn)集,共提煉出4個構(gòu)念(con‐struct),即科研人員對科研數(shù)據(jù)重用(research data reuse,RDR)生態(tài)系統(tǒng)的態(tài)度(attitude,ATT)、感知社群文化基礎(chǔ)(perceived community culture foundation,PCCF)、感知規(guī)則熟悉程度(perceived reuse regulation proficiency,PRRP)以及感知支持措施實用程度(erceived reuse support usability,PR‐SU)。其具體含義及典型參考來源,如表1所示。
表1 本研究中構(gòu)念的含義及對現(xiàn)有研究的參考
2.3.1 科研人員對科研數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度
科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度影響其重用行為。Yoon等[34]對社會科學(xué)家數(shù)據(jù)重用行為開展問卷調(diào)查時,發(fā)現(xiàn)科研人員的態(tài)度正向影響著科研人員數(shù)據(jù)重用的行為意圖。Joo等[35]對健康領(lǐng)域科研人員的調(diào)查顯示,科研人員的態(tài)度影響其數(shù)據(jù)重用行為的意圖。參考理性行為理論的觀點,行為意向在很大程度上能夠代表行為。有學(xué)者認(rèn)為,如果行為意向能夠被準(zhǔn)確的測量,那么行為意向是大多數(shù)社會行為的精準(zhǔn)預(yù)測指標(biāo)[36]。據(jù)此,提出假設(shè)1:
H1:科研人員對RDR生態(tài)系統(tǒng)的態(tài)度正向影響其實際RDR行為。
科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度正向影響感知規(guī)則的熟悉程度。He等[37]研究發(fā)現(xiàn),科研人員傾向于引用同團隊人員生產(chǎn)的數(shù)據(jù)集,并且認(rèn)為其中一個原因可能是這些數(shù)據(jù)更易于理解和可信。同課題組所產(chǎn)生的數(shù)據(jù)集能夠較好地進行獲取,數(shù)據(jù)的上下文信息更易獲得,且數(shù)據(jù)集的透明度較高。在這種情況下,科研人員更易于確認(rèn)評價數(shù)據(jù)集質(zhì)量標(biāo)準(zhǔn),也就客觀上促進其對數(shù)據(jù)重用規(guī)則的了解。Faniel等[38]研究發(fā)現(xiàn),社會科學(xué)家對數(shù)據(jù)重用滿意度的判斷是基于數(shù)據(jù)質(zhì)量,如數(shù)據(jù)的完整性和數(shù)據(jù)可信度。滿意度是積極態(tài)度的重要表現(xiàn),其受到科研人員對相關(guān)質(zhì)量判斷標(biāo)準(zhǔn)的影響。在這種積極重用態(tài)度的推動下,科研人員更愿意去熟悉數(shù)據(jù)重用所涉及的環(huán)節(jié)與規(guī)則。這說明科研人員對重用數(shù)據(jù)集行為本身的態(tài)度,能夠影響其對數(shù)據(jù)重用相關(guān)規(guī)則的熟悉程度。據(jù)此,提出假設(shè)2:
H2:科研人員對RDR生態(tài)系統(tǒng)的態(tài)度正向影響其對RDR生態(tài)系統(tǒng)的感知規(guī)則熟悉程度。
2.3.2 感知社群文化基礎(chǔ)
感知社群文化基礎(chǔ)正向影響科研人員對科研數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度。Yoon等[34]研究發(fā)現(xiàn),現(xiàn)有社群或?qū)W科規(guī)范正向影響社會科學(xué)家對科研數(shù)據(jù)重用的態(tài)度。而現(xiàn)有的社群和學(xué)科規(guī)范,實際上,是作為科研人員開展數(shù)據(jù)重用活動的社群文化基礎(chǔ)而存在的。Melero等[39]指出,數(shù)據(jù)開放和重用領(lǐng)域的一個關(guān)鍵問題是如何鼓勵和獎勵科研人員參與數(shù)據(jù)的共享和管理工作。但該問題通常與研究的內(nèi)在習(xí)慣相關(guān),而這些習(xí)慣的形成需要一個文化方面的轉(zhuǎn)變,從而來創(chuàng)建一個數(shù)據(jù)共享生態(tài)系統(tǒng)。這說明社群的文化基礎(chǔ),對科研人員了解和參與科研數(shù)據(jù)重用活動的態(tài)度具有重要影響的。據(jù)此,提出假設(shè)3:
H3:科研人員對RDR生態(tài)系統(tǒng)的感知社群文化基礎(chǔ)正向影響其對RDR生態(tài)系統(tǒng)的態(tài)度。
科研人員對科研數(shù)據(jù)重用生態(tài)系統(tǒng)的感知社群文化基礎(chǔ)正向影響科研人員的數(shù)據(jù)重用行為。Zim‐merman[29]對生態(tài)學(xué)領(lǐng)域科研人員的調(diào)查顯示,本地化情境知識對生態(tài)學(xué)家的數(shù)據(jù)重用行為具有重要影響??蒲腥藛T融入社群的社會化過程(social pro‐cesses)在判斷數(shù)據(jù)可重用價值中發(fā)揮重要作用。這說明社群文化影響科研人員對科研數(shù)據(jù)價值的判斷,進而影響其數(shù)據(jù)重用行為。研究結(jié)果表明,雖然眾多科研人員高度認(rèn)同透明、開放和可再生性是科學(xué)的特征,并且該特征成為眾多的學(xué)科規(guī)范,但是由于缺乏合理學(xué)術(shù)獎勵制度的激勵,造成了開放實踐與理想的脫節(jié)[40]。這說明科研人員對現(xiàn)有科研社群實踐情況的感知會影響其科研數(shù)據(jù)開放共享的行為。這種感知同樣也可類比至科研數(shù)據(jù)重用行為。據(jù)此,提出假設(shè)4:
H4:科研人員對RDR生態(tài)系統(tǒng)的感知社群文化基礎(chǔ)正向影響其RDR行為。
2.3.3 感知規(guī)則熟悉程度
科研人員對科研數(shù)據(jù)重用生態(tài)系統(tǒng)的感知規(guī)則熟悉程度正向影響科研數(shù)據(jù)重用行為。Faniel等[1]對地震工程領(lǐng)域科研人員的調(diào)查表明,數(shù)據(jù)的相關(guān)性、科研人員對數(shù)據(jù)的理解與信任程度是其判斷同行數(shù)據(jù)可重用程度的重要標(biāo)準(zhǔn)。這說明科研人員在判斷數(shù)據(jù)可重用性時,有相應(yīng)的準(zhǔn)則和標(biāo)準(zhǔn),并在各判斷項目的具體準(zhǔn)則下重用相關(guān)數(shù)據(jù)。謝艷秋等[41]認(rèn)為,在數(shù)據(jù)共享發(fā)展具有一定基礎(chǔ)的情況下,科研人員對研究成果的開放意識與接受程度等因素在科研數(shù)據(jù)共享過程中起到重要作用。本研究認(rèn)為,這類影響因素可類比至數(shù)據(jù)重用活動,即科研人員對數(shù)據(jù)重用的開放意識與接受程度對其重用行為具有重要影響,而這種接受程度的一個重要體現(xiàn)在于對重用規(guī)則的熟悉程度。據(jù)此,提出假設(shè)5:
H5:科研人員對RDR生態(tài)系統(tǒng)的感知規(guī)則熟悉程度正向影響其RDR行為。
2.3.4 感知支持措施實用程度
感知數(shù)據(jù)支持措施實用程度正向影響其感知重用規(guī)則熟悉程度。感知數(shù)據(jù)支持措施實用程度包括:數(shù)據(jù)基礎(chǔ)設(shè)施支持服務(wù)、感知數(shù)據(jù)重用培訓(xùn)服務(wù)以及相關(guān)政策指南內(nèi)容的實用程度。Hsu等[33]研究表明,缺乏元數(shù)據(jù)標(biāo)準(zhǔn)與資源、工作流文檔阻礙了該領(lǐng)域數(shù)據(jù)資源的發(fā)現(xiàn)、共享與重用,因為這種情況將會使得科研人員在數(shù)據(jù)的獲取與理解方面投入更多額外的時間與精力;而數(shù)據(jù)重用支持措施可從多環(huán)節(jié)為數(shù)據(jù)重用奠定良好的基礎(chǔ),如提供較完善的元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)重用許可聲明等,進而增加科研人員對科研數(shù)據(jù)重用規(guī)則的熟悉程度。Tenopir等[42]研究認(rèn)為,美國國家科學(xué)基金會(National Sci‐ence Foundation,NSF)資助項目,如DataNET(包括DataONE),會把科研人員的注意力吸引到使科學(xué)家更容易應(yīng)用合理的數(shù)據(jù)管理原則方面。這說明資助機構(gòu)已經(jīng)開始通過數(shù)據(jù)基礎(chǔ)設(shè)施提升數(shù)據(jù)共享和數(shù)據(jù)重用方面的易用程度,以增加用戶對科研數(shù)據(jù)共享和數(shù)據(jù)重用實用程度的感知。據(jù)此,提出假設(shè)6:
H6:科研人員對RDR生態(tài)系統(tǒng)的感知支持措施實用程度正向影響其對數(shù)據(jù)重用生態(tài)系統(tǒng)的感知規(guī)則熟悉程度。
感知支持措施實用程度正向影響科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度。Federer等[43]研究發(fā)現(xiàn),盡管眾多科研人員認(rèn)為數(shù)據(jù)共享和數(shù)據(jù)重用很重要,但他們認(rèn)為自身的專業(yè)程度較低,并且其認(rèn)為準(zhǔn)備可供分享的數(shù)據(jù)耗費大量的工作。這說明研究人員需進行相關(guān)的支持活動,以降低他們開放共享和重用科研數(shù)據(jù)時所耗費的精力,促進重用行為。Roche等[44]從數(shù)據(jù)質(zhì)量的角度,調(diào)查了生態(tài)學(xué)和進化領(lǐng)域期刊中強制公共數(shù)據(jù)存檔政策(mandate public data archiving)的落實效果,強調(diào)發(fā)揮關(guān)鍵指南的作用,可提升科研數(shù)據(jù)重用的潛在可能,即可以通過靈活的支持措施轉(zhuǎn)變科研人員對數(shù)據(jù)共享的態(tài)度。據(jù)此,提出假設(shè)7:
H7:科研人員對RDR生態(tài)系統(tǒng)的感知支持措施實用程度正向影響其對RDR生態(tài)系統(tǒng)的態(tài)度。
科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的感知支持措施實用程度正向影響其數(shù)據(jù)重用行為。Davis等[30]在人們對計算機系統(tǒng)使用接受程度的研究中發(fā)現(xiàn),科研人員對該技術(shù)的感知有用性和感知易用性能夠通過影響科研人員的態(tài)度最終影響對該技術(shù)的實際接受意圖。Kim等[45]對STEM(science,technology,en‐gineering,and mathematics)學(xué)科研究人員的調(diào)查表明,數(shù)據(jù)知識庫的感知可獲取程度對科研人員的數(shù)據(jù)共享行為具有較大影響。Enke等[32]研究發(fā)現(xiàn),由于技術(shù)阻礙(如缺乏適當(dāng)?shù)臄?shù)據(jù)知識庫和引用機制)和社群方面的(sociological)阻礙(如時間、資金),科研人員不愿共享生物多樣性數(shù)據(jù)。Poisot等[46]認(rèn)為,在生態(tài)學(xué)領(lǐng)域中,借鑒來自公開共享存檔中的數(shù)據(jù),可促進生態(tài)學(xué)研究轉(zhuǎn)型,并認(rèn)為一個較具有前景的方式是鼓勵和促進系統(tǒng)化地檢索,以及結(jié)構(gòu)化和專門化的生態(tài)學(xué)數(shù)據(jù)知識庫。這體現(xiàn)出數(shù)據(jù)知識庫服務(wù)對促進科研人員科研數(shù)據(jù)重用行為的可能性。據(jù)此,提出假設(shè)8:
H8:科研人員對RDR生態(tài)系統(tǒng)的感知支持措施實用程度正向影響科研人員的RDR行為。
綜上,本文構(gòu)建的我國科研人員科研數(shù)據(jù)重用行為影響因素理論模型如圖2所示。
圖2 我國科研人員對科研數(shù)據(jù)重用行為影響因素理論模型
本研究旨在初步探索在開放科研數(shù)據(jù)環(huán)境下,科研數(shù)據(jù)重用生態(tài)系統(tǒng)形成的影響因素,既需要采取定量研究了解生態(tài)系統(tǒng)視角下各潛變量之間的影響路徑,亦需要通過定性研究探索變量之間相互影響的具體情境條件與細(xì)節(jié),從而達(dá)到從多層面探索科研數(shù)據(jù)重用行為影響因素的目的[47-48]。進一步而言,一方面,本文期望提出理論模型,并通過一定測量工具驗證模型中的影響因素與路徑;另一方面,由于目前數(shù)據(jù)重用活動影響機制的構(gòu)建主要基于國外研究,亦需通過相關(guān)訪談,了解和補充已有理論模型,或?qū)碚撃P徒Y(jié)果中與研究假設(shè)不相符的內(nèi)容進行解釋。在此基礎(chǔ)上,才能夠更有針對性地為我國利益相關(guān)方在本土開展數(shù)據(jù)重用的促進服務(wù)提供更符合實際情況的建議。
由于需要采取定量與定性研究,并在特定的時間段內(nèi)獲取兩類數(shù)據(jù),因此,本文參考混合方法研究中的聚斂式設(shè)計(convergent design)——通過文獻(xiàn)綜述確定研究假設(shè),獨立收集定量與定性數(shù)據(jù),在群體和個體層面獲取研究假設(shè)驗證程度的數(shù)據(jù)。本文采用偏最小二乘法的結(jié)構(gòu)方程模型(partial least squares structural equation modeling,PLS-SEM)分析定量數(shù)據(jù);定性研究部分對問卷中開放式問題與科研人員的半結(jié)構(gòu)化訪談結(jié)果進行分析。最終,在結(jié)果分析部分通過匯總表格開展結(jié)果比較(com‐parison of results)[49],對定量與定性結(jié)果間開展雙向理解[50],進而得出研究結(jié)論,研究路徑如圖3所示。
圖3 本研究所使用混合方法研究路徑圖
3.1.1 問卷設(shè)計
調(diào)查問卷由卷首語、填寫說明、各潛變量的測量項以及受訪者信息組成。卷首語部分說明本次調(diào)查問卷的核心概念,以確保受訪對象對研究問題所涉及內(nèi)涵和外延理解一致。問卷中測量項的設(shè)計均參考相應(yīng)量表與文獻(xiàn)中關(guān)于科研數(shù)據(jù)重用行為(re‐sarch data reuse behavior,RDRB)的影響因素,如表2所示。問卷共包含24個測量項,視測量內(nèi)容采用李克特五點式量表與多選題方式,并將科研人員對開放科研數(shù)據(jù)原因、放棄重用他人數(shù)據(jù)原因和常用存儲位置這3個題項額外設(shè)置為開放式問題。調(diào)查問卷于2019年7月15—17日面向15名科研人員進行預(yù)調(diào)研,根據(jù)結(jié)果反饋調(diào)整相應(yīng)測量項的表述,以便于受訪對象理解。
表2 問卷調(diào)查的潛變量及其測量項參考來源
3.1.2調(diào)查問卷發(fā)放與數(shù)據(jù)收集
本研究以中國科學(xué)院生物學(xué)領(lǐng)域科研人員(崗位狀態(tài)在碩士研究生及以上)為調(diào)查對象,通過電子郵件向中國科學(xué)院28個生物學(xué)領(lǐng)域研究所的2245名助教/研究實習(xí)員及以上崗位狀態(tài)科研人員定向發(fā)放(共獲得90份有效調(diào)查問卷),通過社交媒體面向中科院生物學(xué)領(lǐng)域的碩博士研究生進行滾雪球式發(fā)放(共回收211份有效調(diào)查問卷),發(fā)放周期為2019年9月10日—11月10日。剔除無效的調(diào)查問卷后,共回收301份有效調(diào)查問卷,大于測量項的10倍以上[54],符合PLS-SEM分析的樣本數(shù)量要求。受訪對象的人口統(tǒng)計特征分布如表3所示,其中,學(xué)科領(lǐng)域劃分參照中華人民共和國國家標(biāo)準(zhǔn)《學(xué)科分類與代碼》(GB/T 13745-2009)[55]和國家科技圖書文獻(xiàn)中心生物學(xué)領(lǐng)域科技詞表[56]。
表3 受訪對象的人口統(tǒng)計特征
訪談對象的選取主要根據(jù)其來源機構(gòu)的性質(zhì)、重用他人數(shù)據(jù)的程度以及研究經(jīng)驗,通過咨詢生物學(xué)領(lǐng)域?qū)W科館員,選取10位來自中國科學(xué)院6個相關(guān)研究所的受訪對象,其中5名男性、5名女性。受訪對象研究范圍兼顧基礎(chǔ)與應(yīng)用研究,涵蓋碩士研究生到教授的多個崗位狀態(tài)。并根據(jù)各潛變量及其測量項的內(nèi)容,制定半結(jié)構(gòu)化訪談提綱,具體如表4所示。
表4 半結(jié)構(gòu)化訪談提綱
訪談時間跨度為5個月①訪談時間為2019年9月17日—2020年2月19日。,訪談方式為面對面訪談或線上訪談。采用半結(jié)構(gòu)化大綱,訪談時間為20~60分鐘不等。征得訪談對象同意后,對訪談過程進行錄音,并在后期整理為文字版。根據(jù)匿名保密原則,本文僅引述受訪對象的觀點(后續(xù)用I1~I10分別表示這10位受訪對象)。
本研究同時涉及反映型和形成型測量模型,且樣本數(shù)量較小,因此,采用偏最小二乘法的結(jié)構(gòu)方程模型進行數(shù)據(jù)分析,該方法對樣本數(shù)據(jù)正態(tài)分布要求的較低,適用于本研究。數(shù)據(jù)分析的工具為SmartPLS 3.2.8版本[57]。
結(jié)構(gòu)方程模型由測量模型與結(jié)構(gòu)模型組成,前者表示測量變量對潛變量的反映程度,后者表示潛變量間的因果關(guān)系。具體分析過程:首先,通過檢驗測量模型,評價理論模型與所采集數(shù)據(jù)間的擬合程度,而后對結(jié)構(gòu)模型各構(gòu)念之間的關(guān)系進行檢驗。
4.1.1 測量模型具有穩(wěn)定性
測量模型可分為反映型測量模型和形成型測量模型?!翱蒲袛?shù)據(jù)重用行為(RDRB)”這一潛變量需由其測量變量共同表示,為形成型測量指標(biāo)(formative indicator)。其余潛變量的效果由其相對應(yīng)的測量變量體現(xiàn),為反映型測量指標(biāo)(reflective indicator)[58-59]。
通過驗證性因子分析(Confirmatory Factor Anal‐ysis,CFA)檢驗測量模型的信效度[60]。不同類型的測量模型在信效度評價的具體指標(biāo)上有所差異,對反映型指標(biāo)信度與效度分析具體結(jié)果如表5所示。反映型測量模型的信度主要分為內(nèi)部一致性測量和各顯變量的信度。內(nèi)部一致性考察一組測量項是否測量了相同的潛變量[61],主要通過組合信度(composite reliability,CR)評價,建議值為0.5[62]。各測量變量的信度,主要表現(xiàn)每個題目能夠反映潛變量的程度,通過各測量項的因子負(fù)荷(factor loading)判定,其建議值為0.55[63]。由表5可知,在本研究的測量模型中,各潛變量的組合信度均大于0.5,且各測量變量的因子負(fù)荷均大于0.55,說明該反映型測量模型具有較高的信度。
反映型測量模型的效度分析主要包括聚斂效度和區(qū)別效度兩方面。聚斂效度表示一個潛變量能夠被一組觀察變量有效估計的程度,以平均變異萃取量(average variance extracted,AVE)和組合信度作為判定指標(biāo),建議值均為0.5。由表5可知,各潛變量的AVE值和CR值均大于0.5,說明其具有較好的聚斂效度。區(qū)別效度表示不同構(gòu)念間能夠有效分離的程度,可通過比較兩個潛變量的AVE值是否大于其相關(guān)系數(shù)的平方進行判定[64]。由表6可知,各潛變量間的相關(guān)系數(shù)均小于AVE值的平方根。因此,該反映型測量模型具有較高的區(qū)別效度。
表5 測量模型的信度與效度分析
表6 AVE平方根及潛變量相關(guān)系數(shù)
形成型指標(biāo)的評估主要從因子對構(gòu)念貢獻(xiàn)的絕對指標(biāo)、共線性和指標(biāo)顯著性三個方面判定[65],結(jié)果如表7和表8所示。Petter等[66]認(rèn)為,形成型模型中的方差膨脹因子(variance inflation factor,VIF)相對于內(nèi)部一致性和信度而言更為重要,測量變量所反映的是構(gòu)念的不同方面,多重共線性是反映型構(gòu)念測量項(需要關(guān)注)的一個問題,故可選用VIF進行評價。VIF的評價閾值為10,由表7可知,測量項RDRB1的值小于10,但后兩個測量項的VIF值均大于10,這說明后兩個測量項存在共線性問題。在科研實踐中,RDRB2與RDRB3具有正相關(guān)關(guān)系,但這兩個測量項是科研人員數(shù)據(jù)重用行為是否規(guī)范的表現(xiàn),因此,對其保留。從外部權(quán)重來看,僅有RDRB1測量項符合判定要求。但Bollen[60]認(rèn)為,形成性測量模型中測量變量對潛變量的因子負(fù)荷反映了形成性指標(biāo)對潛變量的影響。在本研究中后兩個測量項對潛變量貢獻(xiàn)程度(因子負(fù)荷)同樣較高,故將其保留。
表7 形成型指標(biāo)評估
表8 形成型指標(biāo)外部權(quán)重
4.1.2 結(jié)構(gòu)模型具有預(yù)測相關(guān)性
1)假設(shè)檢驗結(jié)果
結(jié)構(gòu)方程模型分析的第二步為結(jié)構(gòu)模型的分析,研究結(jié)果支持了本文提出的8個研究假設(shè)中的5個。通過使用SmartPLS中的自助法(bootsrap‐ping)得到各潛變量間關(guān)系的T統(tǒng)計量、路徑系數(shù)、P值及假設(shè)檢驗結(jié)果如表9所示。
表9 結(jié)構(gòu)模型假設(shè)檢驗結(jié)果
科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度正向影響其對數(shù)據(jù)重用規(guī)則的熟悉程度(β=0.183,P=0.007),未對數(shù)據(jù)重用行為產(chǎn)生顯著影響。感知社群文化基礎(chǔ)正向影響其數(shù)據(jù)重用行為(β=0.183,P=0.019),對數(shù)據(jù)重用生態(tài)系統(tǒng)態(tài)度具有負(fù)向顯著影響??蒲腥藛T的感知規(guī)則熟悉程度負(fù)向影響數(shù)據(jù)重用行為??蒲腥藛T感知支持措施實用程度正向影響重用規(guī)則熟悉程度(β=0.365,P=0.000)、科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度(β=0.409,P=0.000)以及數(shù)據(jù)重用行為(β=0.122,P=0.003)。結(jié)構(gòu)模型檢驗結(jié)果如圖4所示。
圖4 結(jié)構(gòu)模型假設(shè)檢驗結(jié)果
使用可解釋變異量R2(R-square)做進一步分析。若R2>0.19[67],則說明模型解釋力可接受,即某一潛變量是引起另一潛變量變動的主要原因;科研人員對感知社群文化基礎(chǔ)和感知重用支持措施實用程度對其態(tài)度的解釋能力R2=0.208,解釋力尚可;科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度和感知支持措施實用程度對感知重用規(guī)則熟悉程度的解釋能力R2=0.226,解釋能力較強;科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的感知和態(tài)度對其重用行為的解釋能力R2=0.09,解釋力不足,有待提升。這說明科研人員對科研數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度和感知對科研數(shù)據(jù)重用行為具有一定影響,但不是主要影響因素。同時,也說明未來在研究科研數(shù)據(jù)重用行為影響因素時,需考慮科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度與感知的作用。模型中其他潛變量間,即PCCF和PRSU對ATT的解釋力,以及ATT和PRSU對PRRP的解釋力均尚可。因此,總體來看,該模型具有一定的解釋力,但有待提升。通過blindfolding方式求得Q2,當(dāng)Q2≥0時,模型具有預(yù)測相關(guān)性[68],且Q2越大表示預(yù)測相關(guān)性越強。本研究中,Q2(0.054)>0,說明科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度和感知對其重用行為具有預(yù)測相關(guān)性。
2)中介效果檢驗
結(jié)構(gòu)模型的潛變量中,自變量不僅對因變量產(chǎn)生直接效果,也會通過中介變量對其產(chǎn)生間接效果,可通過PLS-SEM中的bootstrap方法檢驗[69]。通過總間接效果判斷是否存在中介效果,如表10所示??蒲腥藛T的態(tài)度(ATT)和感知支持措施實用程度(PRSU)對數(shù)據(jù)重用行為(RDRB)的間接效果顯著,因此認(rèn)為存在中介效果。感知社群文化基礎(chǔ)(PCCF)對數(shù)據(jù)重用行為的間接效果不明顯。
表10 模型中介效果檢驗
4.2.1 調(diào)查問卷開放式問題結(jié)果
調(diào)查問卷中,開放式問答旨在了解科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)所持態(tài)度,以及其對現(xiàn)有社群文化基礎(chǔ)的感知情況。由于開放式問答題需視相應(yīng)題目的回答情況有選擇地填寫,因此,下述三項開放式題目回答人員數(shù)量不同。
共有50位受訪者對“放棄使用他人已有數(shù)據(jù)集的原因”做出有效回答,分類后的結(jié)果如圖5所示。擔(dān)心產(chǎn)生權(quán)益問題(21)、數(shù)據(jù)本身的質(zhì)量(10)、數(shù)據(jù)獲取與重新整理耗費大量努力(8)以及擔(dān)心誤用他人數(shù)據(jù)(7)成為科研人員放棄使用現(xiàn)有數(shù)據(jù)集的主要原因。由此可見,數(shù)據(jù)權(quán)益問題成為開放科研數(shù)據(jù)背景下,數(shù)據(jù)重用不可忽視的一項問題。
圖5 受訪對象放棄重用現(xiàn)有數(shù)據(jù)集的原因
共有125位受訪對象說明“開放共享研究數(shù)據(jù)供他人使用的原因”,其中重用過他人數(shù)據(jù)的有71人。由于回答有時涉及多重原因,拆分后得到161條結(jié)果,具體原因分布如圖6所示。由圖6可知,前5名從高到低依次為:①節(jié)約研究成本,充分發(fā)揮數(shù)據(jù)價值。包括由于實驗材料和環(huán)境的特殊性,研究數(shù)據(jù)的獲得條件較高,因此,希望充分發(fā)揮數(shù)據(jù)價值;②促進科研發(fā)展。包括跨學(xué)科交流、合作、數(shù)據(jù)開放與數(shù)據(jù)重用者研究成果相互促進;③增強學(xué)術(shù)可見度與影響力;④增強研究可信度。包括能夠得到同行的認(rèn)可、作為研究成果的支撐材料;⑤數(shù)據(jù)是學(xué)術(shù)共同體/公眾的共同財富。
圖6 受訪對象開放共享科研數(shù)據(jù)的原因
共有25位受訪者回答“常用科研數(shù)據(jù)存儲位置”,清洗后得到29條結(jié)果。其中,14位受訪者回答了選擇這些存儲位置的原因,清洗后得到18條結(jié)果,如圖7所示??蒲袛?shù)據(jù)常用存儲位置的回答可分為明確的存儲位置與較為模糊的存儲位置兩類:①明確的科研數(shù)據(jù)存儲位置中,專業(yè)的數(shù)據(jù)知識庫占比62.07%。其中,NCBI(National Center for Bio‐technology Information)子庫的回答最多(41.38%)。有4條回答涉及中國科學(xué)院北京基因組研究所的BIGD(BIG Data Center)子庫,占比13.79%。值得注意的是,有4條(13.79%)結(jié)果涉及百度網(wǎng)盤、科研團隊服務(wù)器以及研究人員個人電腦。這說明部分科研人員或小型科研群體的長尾數(shù)據(jù)托管也值得重視。②模糊的存儲位置,側(cè)面反映了科研人員對其選擇的標(biāo)準(zhǔn),即持久可獲取、學(xué)術(shù)期刊指定的位置、考慮數(shù)據(jù)的長期可獲取程度以及便于數(shù)據(jù)共享的網(wǎng)站。前兩項原因?qū)儆诟兄缛何幕A(chǔ)的影響,后兩項原因?qū)儆诤罄m(xù)在支持措施中能夠加以引導(dǎo)或提供服務(wù)的內(nèi)容。由于該部分內(nèi)容所含數(shù)據(jù)較少,在此僅作為參考。
圖7 受訪對象科研數(shù)據(jù)常用存儲位置及原因
4.2.2 半結(jié)構(gòu)化訪談結(jié)果
1)態(tài)度
科研人員開放科研數(shù)據(jù)的動力主要源自數(shù)據(jù)資源的充分利用(I8~I10)、支撐科研成果、擴大學(xué)術(shù)影響(I6)以及啟發(fā)自身研究(I8)等方面。數(shù)據(jù)重用的目的與程度存在差異,更傾向于從研究設(shè)計和方法角度參考。某些研究領(lǐng)域,如“分子生物學(xué)”中,序列比對和同源性分析是重要分析過程(I10)。
科研人員重用他人已開放數(shù)據(jù)的顧慮主要集中在對自身研究的風(fēng)險評估、對數(shù)據(jù)所有者和數(shù)據(jù)所反映對象的權(quán)益保護(I6)以及在利用他人數(shù)據(jù)時對結(jié)果的分析與解讀(I10)。該結(jié)果與問卷調(diào)查中開放式問題結(jié)果相似,這說明科研人員著重關(guān)注數(shù)據(jù)質(zhì)量、權(quán)益問題以及自身數(shù)據(jù)管理與分析技能的提升。
2)感知社群文化基礎(chǔ)
感知社群文化基礎(chǔ)對科研人員的影響主要體現(xiàn)在數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)出版的方式與要求上。生物學(xué)領(lǐng)域的科研人員關(guān)注科研數(shù)據(jù)質(zhì)量,對開放共享數(shù)據(jù)集的質(zhì)量評價標(biāo)準(zhǔn)主要集中在統(tǒng)計、生物學(xué)和科研意義三個層面上(I6、I8~I10)。目前,數(shù)據(jù)質(zhì)量控制的關(guān)鍵主體為期刊、基礎(chǔ)設(shè)施平臺和科研人員,訪談對象指出“數(shù)據(jù)的質(zhì)量控制環(huán)節(jié)主要以科研人員自身、同行評議為主(I6)”。國內(nèi)外在數(shù)據(jù)出版同行評議環(huán)節(jié)對數(shù)據(jù)質(zhì)量控制的探討較多[70-71],后期則更應(yīng)關(guān)注科研人員自身對數(shù)據(jù)質(zhì)量控制相關(guān)技能的掌握情況。
數(shù)據(jù)發(fā)現(xiàn)平臺的引用機制對數(shù)據(jù)貢獻(xiàn)認(rèn)可具有重要影響。科研人員主要通過論文補充材料了解相關(guān)數(shù)據(jù),在引用方式上,傾向于引用文章(I8、I10);以生物數(shù)據(jù)分析為主的團隊,傾向于在文章中提及所使用數(shù)據(jù)集的注冊號,在文末引用與該數(shù)據(jù)集關(guān)聯(lián)的文章(I6)。微生物領(lǐng)域的科研人員(I9)逐步開始采用數(shù)據(jù)引用方式,形式為“標(biāo)注注冊登記號+文末引用數(shù)據(jù)集”。
3)感知規(guī)則熟悉程度
該部分著重了解訪談對象對數(shù)據(jù)發(fā)現(xiàn)與數(shù)據(jù)存儲方面規(guī)則的熟悉程度。科研人員選擇數(shù)據(jù)發(fā)現(xiàn)平臺時,著重關(guān)注數(shù)據(jù)知識庫的權(quán)威性、資源是否全面以及其特定數(shù)據(jù)處理功能。例如,訪談對象5指出“傾向于使用(NCBI)的原因:首先,其體量比較大;其次,是功能比較強大,有些可以在線進行一些可視化的內(nèi)容”。訪談結(jié)果與問卷開放式問題在科研數(shù)據(jù)存儲位置的選擇標(biāo)準(zhǔn)上較為相似:相較領(lǐng)域公認(rèn),以期刊要求或推薦作為主要參考標(biāo)準(zhǔn)(I5、I6、I8~I10)。調(diào)查問卷的開放式結(jié)果中,科研人員也將平臺中數(shù)據(jù)的長期可獲取程度作為衡量指標(biāo),這說明數(shù)據(jù)基礎(chǔ)設(shè)施方通過采取與高質(zhì)量期刊合作、長期穩(wěn)定的運營以及數(shù)據(jù)覆蓋量的不斷更新與增長等措施,能夠提升科研人員對該平臺的認(rèn)可。
4)感知支持措施實用程度
科研人員對數(shù)據(jù)重用支持措施的需求,主要體現(xiàn)于數(shù)據(jù)發(fā)現(xiàn)、加工分析與可視化階段。例如,“對他人科研數(shù)據(jù)的加工處理、對發(fā)表渠道權(quán)威性的關(guān)注與了解數(shù)據(jù)知識庫的實用性”(I1)。另一訪談對象指出,“在大型項目中需從事交叉學(xué)科的工作,大家傾向于先彌補一些專業(yè)知識,而對于像諸如可視化這方面的工作沒有很了解”(I2)。由此可見,數(shù)據(jù)重用生態(tài)系統(tǒng)的支持措施需從科研數(shù)據(jù)生命周期的各環(huán)節(jié)部署,而非僅集中在數(shù)據(jù)發(fā)現(xiàn)與重用階段。
本文采用獨立地定量與定性數(shù)據(jù)收集和分析過程,并在本節(jié)對兩者所揭示的現(xiàn)象進行合并闡述(表11)。從總體上看,科研人員對科研數(shù)據(jù)重用生態(tài)系統(tǒng)的態(tài)度與感知(感知社群文化基礎(chǔ)、感知規(guī)則熟悉程度以及感知支持措施實用程度)對其重用行為具有重要影響。
由表11可知,在得到支持的研究假設(shè)中,感知社群文化和感知支持措施是影響科研人員科研數(shù)據(jù)重用行為的主要因素,并且以感知社群文化基礎(chǔ)影響最大。因此,利益相關(guān)方的支持措施:首先,可關(guān)注促進科研社群形成認(rèn)可數(shù)據(jù)重用生態(tài)系統(tǒng)理念的社群文化;其次,通過促進科研人員對科研數(shù)據(jù)重用活動中各環(huán)節(jié)規(guī)則的全面認(rèn)識和熟悉,降低其在開展重用工作時的顧慮,進而逐步樹立其對數(shù)據(jù)重用的積極態(tài)度。
表11 定量與定性研究結(jié)果匯總分析
未獲得支持的研究假設(shè)中,主要有以下兩個方面原因:①開放科研數(shù)據(jù)的存儲位置是數(shù)據(jù)重用重要的來源,決定了科研數(shù)據(jù)重用的后續(xù)進程。因此,認(rèn)識開放科研數(shù)據(jù)與數(shù)據(jù)重用過程是相互促進的生態(tài)系統(tǒng)非常重要。目前,科研人員對數(shù)據(jù)存儲位置環(huán)節(jié)的選擇,主要是在期刊的要求/推薦下,完成的一項出版活動,并未對該生態(tài)系統(tǒng)具有較清晰的理解。②科研人員因為對數(shù)據(jù)質(zhì)量控制和權(quán)益管理方面技能的缺乏,導(dǎo)致其產(chǎn)生一系列顧慮,不利于順利開展數(shù)據(jù)重用活動。
綜上,數(shù)據(jù)發(fā)現(xiàn)與數(shù)據(jù)出版過程是科研人員感知社群文化基礎(chǔ)形成的重要環(huán)節(jié),在數(shù)據(jù)社群層面上,開展數(shù)據(jù)質(zhì)量控制和權(quán)益管理是利益相關(guān)方提供支持措施的兩個切入點。
實證研究結(jié)果表明,從生態(tài)系統(tǒng)視角探索科研人員的數(shù)據(jù)重用行為,可為利益相關(guān)方促進開放科研數(shù)據(jù)可持續(xù)發(fā)展提供新思路?;谏鲜鲅芯拷Y(jié)果,本研究提出如下三條建議。
數(shù)據(jù)發(fā)現(xiàn)所使用的平臺與數(shù)據(jù)出版過程中所建議的存儲位置有較大聯(lián)系。目前,我國生物學(xué)領(lǐng)域也在積極推進國家級科學(xué)數(shù)據(jù)中心建設(shè)[20],促進將我國科研經(jīng)費資助項目所產(chǎn)生的科研數(shù)據(jù)存儲在本土的數(shù)據(jù)知識庫中。同時,亦可從數(shù)據(jù)出版環(huán)節(jié)反向增加科研人員數(shù)據(jù)發(fā)現(xiàn)平臺來源的選擇。除了數(shù)據(jù)中心自身外,圖書館在此過程中,能夠積極輔助國內(nèi)大型數(shù)據(jù)中心完成相關(guān)國際化認(rèn)證,并推廣該認(rèn)證內(nèi)容。例如,可制作資源列表通過社交媒體平臺,宣傳經(jīng)眾多期刊認(rèn)證的國內(nèi)數(shù)據(jù)知識庫。
數(shù)據(jù)重用生態(tài)系統(tǒng)建設(shè)需建立協(xié)作網(wǎng)絡(luò),以更全面了解當(dāng)前數(shù)據(jù)重用實踐進展、協(xié)調(diào)其中關(guān)鍵問題的解決方案與具體實施步驟,評估與改進協(xié)作效果[72]。定量調(diào)查結(jié)果顯示(見第4.1節(jié)),感知支持措施實用程度是科研人員數(shù)據(jù)重用行為的重要影響因素,其涉及眾多利益相關(guān)方;定性研究進一步表明,利益相關(guān)方對數(shù)據(jù)重用活動的支持需在數(shù)據(jù)生命周期各環(huán)節(jié)相互配合與協(xié)調(diào)(見第4.2.2節(jié)),且在不同環(huán)節(jié)與互動中,其角色的主次與支持的連貫程度較為重要。因此,需要利益相關(guān)方進行對話與協(xié)作。
根據(jù)生物學(xué)領(lǐng)域科研人員在研究過程中的需求特點,提供數(shù)據(jù)和政策層面的服務(wù)。數(shù)據(jù)重用與其應(yīng)用情境密切相關(guān)[73]。生物學(xué)領(lǐng)域數(shù)據(jù)種類與使用情境眾多,有學(xué)者指出,對生物系統(tǒng)的描述中,受制于不同分析類型(如基因組測序、蛋白質(zhì)-蛋白質(zhì)相互作用測定、代謝物濃度的測量)原始材料(source material)多樣化的報告格式,很難作為連貫的研究單元進行分享。而目前眾多數(shù)據(jù)知識庫是為了特定類型的數(shù)據(jù)而設(shè)計的,因此,需將復(fù)雜數(shù)據(jù)集碎片化。并提出ISA commons框架方案以增強數(shù)據(jù)層面的互操作性[74]。由此可見,眾利益相關(guān)方在基礎(chǔ)設(shè)施與數(shù)據(jù)實體層面的協(xié)作是科研數(shù)據(jù)重用的基礎(chǔ)。Duke等[75]將數(shù)據(jù)共享與重用中所涉及的倫理問題聚焦至數(shù)據(jù)引用和確定合著者的層面。這說明構(gòu)建數(shù)據(jù)重用生態(tài)系統(tǒng)所需的協(xié)作,既包括基礎(chǔ)設(shè)施層面,又包括眾利益相關(guān)方共同管理與協(xié)調(diào)的政策、規(guī)范等,以保證數(shù)據(jù)生成者與數(shù)據(jù)重用者的權(quán)益。
數(shù)據(jù)中心在建立和整合領(lǐng)域數(shù)據(jù)知識庫的基礎(chǔ)上,關(guān)注國際主流知識庫元數(shù)據(jù)層面互操作性。加快我國數(shù)據(jù)知識庫的國際化認(rèn)證進程,使得本土數(shù)據(jù)庫能夠出現(xiàn)在眾多領(lǐng)域期刊推薦的存儲位置中。并基于現(xiàn)有數(shù)據(jù)資源,開展眾多激勵措施,鼓勵科研人員對開放科研數(shù)據(jù)資源的使用,如構(gòu)建官方公眾號、定期推送平臺內(nèi)新增數(shù)據(jù)集的信息。開展相應(yīng)的開放數(shù)據(jù)大賽,吸引更多科研人員參與重用數(shù)據(jù)或進一步促進其開放自身研究過程中生成的科研數(shù)據(jù)。
資助機構(gòu)重視開放科研數(shù)據(jù)觀念在科研人員中的傳播,提升科研人員對開放科研數(shù)據(jù)和數(shù)據(jù)重用活動的參與。在科研人員申請科研項目和結(jié)項階段,需明確科研數(shù)據(jù)開放的范圍與重用許可等事項。同時,與科研評價方合作,提升將科研數(shù)據(jù)集作為科研成果的認(rèn)可程度。
學(xué)術(shù)圖書館可進一步探索自身在知識產(chǎn)權(quán)研究方面的服務(wù),幫助更好地平衡科研人員和眾多利益相關(guān)方的權(quán)益問題。學(xué)術(shù)圖書館與所在科研機構(gòu)或高校合作,引導(dǎo)在課堂教學(xué)方面提供數(shù)據(jù)重用的介紹,并能夠在實際數(shù)據(jù)分析課程重用已有數(shù)據(jù)時,提供必要的指導(dǎo);幫助未來的青年科研人員,了解科研數(shù)據(jù)重用的益處,并提供相關(guān)技能培訓(xùn);幫助所在機構(gòu)科研人員或課題組,進行數(shù)據(jù)管理方面的學(xué)科數(shù)據(jù)管理服務(wù);提供或與數(shù)據(jù)中心合作,提供相應(yīng)基礎(chǔ)設(shè)施幫助存儲大型和長尾科研數(shù)據(jù)集;通過設(shè)立數(shù)據(jù)館員崗位,更加聚焦開放科研數(shù)據(jù)環(huán)境下的諸多科研數(shù)據(jù)管理服務(wù),特別是在數(shù)據(jù)質(zhì)量控制與權(quán)益管理方面。
本研究建議高等教育機構(gòu)在開展相應(yīng)的教學(xué)實踐活動時,引導(dǎo)學(xué)生開展重用已有科研數(shù)據(jù)的探索。鼓勵機構(gòu)內(nèi)科研人員將非涉密數(shù)據(jù)存儲至特定數(shù)據(jù)知識庫中,促進已有數(shù)據(jù)的可發(fā)現(xiàn)程度,從而幫助進一步提升科研人員的學(xué)術(shù)可見度,并對此過程中的各環(huán)節(jié)及其規(guī)則進行說明??膳c所在高校圖書館、數(shù)據(jù)中心就具體實施內(nèi)容開展合作。