摘 要:在大數(shù)據(jù)背景下,海量科學(xué)數(shù)據(jù)涵蓋了科研活動(dòng)的各個(gè)環(huán)節(jié),已然成為科研活動(dòng)中一類極為重要的資源。開展科學(xué)數(shù)據(jù)歸檔對數(shù)據(jù)價(jià)值的科學(xué)保管、充分利用及科技創(chuàng)新發(fā)展具有重要的作用。文章通過調(diào)研目前科學(xué)數(shù)據(jù)管理現(xiàn)狀,梳理了歸檔流程構(gòu)建的原則,分析了歸檔流程構(gòu)建的關(guān)鍵策略,闡述了歸檔流程構(gòu)建與實(shí)施的過程,以期為科學(xué)數(shù)據(jù)歸檔實(shí)踐提供參考。
關(guān)鍵詞:科學(xué)數(shù)據(jù);管理;歸檔;流程構(gòu)建
中圖分類號:G275.3 文獻(xiàn)標(biāo)識碼:B
引言
科學(xué)數(shù)據(jù)是國家科技創(chuàng)新的基礎(chǔ)性和戰(zhàn)略性資源,是科學(xué)研究中必不可少的基本要素。2020 年修訂發(fā)布的《科學(xué)技術(shù)研究檔案管理規(guī)定》,明確提出科學(xué)數(shù)據(jù)是研究實(shí)施及過程管理階段形成的重要文件材料,并將科學(xué)數(shù)據(jù)納入科研檔案歸檔范圍。同時(shí),《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》中也強(qiáng)調(diào)要積極推動(dòng)科學(xué)數(shù)據(jù)與科研檔案協(xié)同管理。從基礎(chǔ)研究到工程技術(shù)研究領(lǐng)域,科學(xué)數(shù)據(jù)貫穿于科研活動(dòng)的各個(gè)環(huán)節(jié),不僅是科研成果的重要體現(xiàn),還是后續(xù)研究的基礎(chǔ)與支撐,對科技創(chuàng)新的深度與廣度有著決定性的影響。
科學(xué)數(shù)據(jù)歸檔作為科學(xué)數(shù)據(jù)管理的關(guān)鍵環(huán)節(jié),對于數(shù)據(jù)價(jià)值的長期保存、有效利用以及科研活動(dòng)的可持續(xù)發(fā)展具有極為重要的意義。盡管科學(xué)數(shù)據(jù)匯交工作已開展多年并取得了一定成效,但科學(xué)數(shù)據(jù)歸檔工作仍處于探索階段,在實(shí)踐過程中面臨著諸多問題與挑戰(zhàn)。
一、科學(xué)數(shù)據(jù)的概念和特點(diǎn)
根據(jù)2018年國務(wù)院辦公廳印發(fā)的《科學(xué)數(shù)據(jù)管理辦法》,科學(xué)數(shù)據(jù)主要包括在自然科學(xué)、工程技術(shù)科學(xué)等領(lǐng)域,通過基礎(chǔ)研究、應(yīng)用研究、試驗(yàn)開發(fā)等產(chǎn)生的數(shù)據(jù)以及通過觀測監(jiān)測、考察調(diào)查和檢驗(yàn)檢測等方式取得并用于科學(xué)研究活動(dòng)的原始數(shù)據(jù)及其衍生數(shù)據(jù)。這一明確的定義清晰地界定了科學(xué)數(shù)據(jù)的范疇,為后續(xù)科學(xué)數(shù)據(jù)管理、歸檔等相關(guān)工作的開展提供了基本依據(jù)。
1.數(shù)據(jù)來源廣
科學(xué)數(shù)據(jù)的來源極為廣泛,涵蓋了科研活動(dòng)的各個(gè)環(huán)節(jié)與眾多領(lǐng)域。從基礎(chǔ)研究中的理論推導(dǎo),到應(yīng)用研究里的實(shí)際驗(yàn)證,再到試驗(yàn)開發(fā)環(huán)節(jié)的反復(fù)測試,科學(xué)數(shù)據(jù)源源不斷地產(chǎn)生,廣泛分布于科研活動(dòng)的方方面面。
2.數(shù)據(jù)格式多
科學(xué)數(shù)據(jù)格式類型多樣,有數(shù)值型數(shù)據(jù)、文本數(shù)據(jù)、圖像數(shù)據(jù)和音視頻數(shù)據(jù)等。此外,因?yàn)榇蟛糠挚茖W(xué)數(shù)據(jù)具有較強(qiáng)的學(xué)科特性,往往是由專業(yè)設(shè)備或?qū)I(yè)軟件所生成,所以其除了通用格式外,還存在學(xué)科通用格式以及專有格式。
3.數(shù)據(jù)體量大
隨著科學(xué)技術(shù)的飛速發(fā)展,信息化設(shè)備在科研領(lǐng)域的廣泛使用以及存儲(chǔ)介質(zhì)容量的不斷增大,科學(xué)數(shù)據(jù)的量呈現(xiàn)出爆炸式增長的態(tài)勢,已經(jīng)從最初的KB、MB級別發(fā)展到GB、TB乃至PB、EB級別,體量極為龐大。
4.數(shù)據(jù)共享需求高
在科研領(lǐng)域,數(shù)據(jù)共享有著至關(guān)重要的作用,其需求十分迫切。對于科研人員來說,可以利用背景信息完整的科學(xué)數(shù)據(jù),重現(xiàn)前人的研究結(jié)果,進(jìn)而在此基礎(chǔ)上創(chuàng)新,避免重復(fù)開展相同的基礎(chǔ)實(shí)驗(yàn),大幅節(jié)省時(shí)間和資源,提高科研效率。從整個(gè)科技事業(yè)的角度來看,不同科研團(tuán)隊(duì)之間共享數(shù)據(jù),可以激發(fā)出更多創(chuàng)新的科研思路和方法,催生新的科研成果。
二、科學(xué)數(shù)據(jù)管理現(xiàn)狀
近年來,我國高度重視科學(xué)數(shù)據(jù)管理工作,相繼出臺(tái)了一系列政策法規(guī)與制度文件,為科學(xué)數(shù)據(jù)管理提供了明確的規(guī)范與指導(dǎo)。2018年2月,科技部、財(cái)政部聯(lián)合印發(fā)《國家科技資源共享服務(wù)平臺(tái)管理辦法》,將承接科技計(jì)劃項(xiàng)目實(shí)施所形成的科學(xué)數(shù)據(jù)的匯交、整理和保存作為國家科學(xué)數(shù)據(jù)中心的重點(diǎn)任務(wù)之一。2021年,國家標(biāo)準(zhǔn)化管理委員會(huì)發(fā)布的《科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù)匯交技術(shù)與管理規(guī)范》等3項(xiàng)國家標(biāo)準(zhǔn),規(guī)范了匯交的原則、明確了匯交的管理主體與職責(zé),確定了匯交的主要內(nèi)容,并提出了標(biāo)準(zhǔn)化的匯交流程。2024年,科技部、財(cái)政部印發(fā)了《國家重點(diǎn)研發(fā)計(jì)劃管理暫行辦法》,要求國家重點(diǎn)研發(fā)計(jì)劃落實(shí)國家科技報(bào)告、科學(xué)數(shù)據(jù)匯交和科技成果匯交制度,做好有關(guān)檔案的整理、保存和歸檔。
此外,還建設(shè)了多家國家科學(xué)數(shù)據(jù)中心,這些科學(xué)數(shù)據(jù)中心分布在不同的學(xué)科領(lǐng)域,涵蓋了基礎(chǔ)科學(xué)研究、前沿技術(shù)研發(fā)及重大社會(huì)公益研究等多個(gè)方面,承擔(dān)了相關(guān)領(lǐng)域科學(xué)數(shù)據(jù)的整合匯交工作。
三、科學(xué)數(shù)據(jù)歸檔流程構(gòu)建
雖然國家出臺(tái)了一系列的政策制度來規(guī)范科學(xué)數(shù)據(jù)管理,并建立多家科學(xué)數(shù)據(jù)中心,形成了較為完善的科學(xué)數(shù)據(jù)管理體系,從不同層面、不同角度規(guī)范指導(dǎo)科學(xué)數(shù)據(jù)管理工作,推動(dòng)了我國科學(xué)數(shù)據(jù)管理工作的有序開展,促進(jìn)了科學(xué)數(shù)據(jù)資源的整合、共享與利用,為我國科技創(chuàng)新提供了有力的數(shù)據(jù)支撐。但是,科學(xué)數(shù)據(jù)歸檔工作仍處于探索階段,缺少可供借鑒的實(shí)踐案例,構(gòu)建規(guī)范的科學(xué)數(shù)據(jù)歸檔流程將為后續(xù)工作的開展奠定基礎(chǔ)。
1.歸檔流程構(gòu)建的原則
構(gòu)建科學(xué)數(shù)據(jù)歸檔流程,應(yīng)當(dāng)遵循以下原則:
(1)科學(xué)性原則。流程設(shè)計(jì)應(yīng)基于科學(xué)研究的一般規(guī)律和特點(diǎn),確保數(shù)據(jù)歸檔流程能夠與科研活動(dòng)過程相契合,滿足不同學(xué)科領(lǐng)域的實(shí)際需求。
(2)可操作性原則。歸檔流程應(yīng)簡潔明了,易于理解和執(zhí)行,避免因設(shè)置過于復(fù)雜和煩瑣的操作步驟,導(dǎo)致科研人員對數(shù)據(jù)歸檔工作產(chǎn)生抵觸情緒,確保數(shù)據(jù)歸檔工作順利開展。
(3)安全性原則。流程設(shè)計(jì)應(yīng)保障數(shù)據(jù)在存儲(chǔ)、傳輸與共享過程中的安全,采用技術(shù)手段防止數(shù)據(jù)被泄露、篡改或丟失,同時(shí)還應(yīng)建立完善的數(shù)據(jù)備份與恢復(fù)機(jī)制,構(gòu)建全方位的數(shù)據(jù)安全防護(hù)體系。
(4)可持續(xù)性原則。流程設(shè)計(jì)應(yīng)考慮長期的運(yùn)行、維護(hù)以及未來科研需求和技術(shù)發(fā)展,確保數(shù)據(jù)歸檔體系能夠持續(xù)升級,歸檔數(shù)據(jù)持續(xù)可用。
(5)成本效益原則。流程設(shè)計(jì)應(yīng)在保證質(zhì)量的前提下,盡可能降低數(shù)據(jù)歸檔的成本,提高資源利用效率。
2.歸檔流程構(gòu)建的關(guān)鍵策略
科學(xué)數(shù)據(jù)歸檔流程的構(gòu)建是復(fù)雜且困難的,下述關(guān)鍵策略對歸檔流程的構(gòu)建和實(shí)施具有重要的作用。
(1)獲得高層管理者的重視與支持。高層管理者對科學(xué)數(shù)據(jù)歸檔工作的認(rèn)知程度與重視程度,直接關(guān)乎整個(gè)歸檔工作的走向與成效。只有他們深刻認(rèn)識到科學(xué)數(shù)據(jù)歸檔的重要意義,才能為歸檔工作的開展提供必要的人力、物力和財(cái)力等資源保障,才能通過自身的影響力與領(lǐng)導(dǎo)力,在本單位營造出重視數(shù)據(jù)歸檔、尊重?cái)?shù)據(jù)資產(chǎn)的良好文化氛圍,帶動(dòng)全體員工積極配合及參與數(shù)據(jù)歸檔工作,為構(gòu)建完善的數(shù)據(jù)歸檔體系奠定堅(jiān)實(shí)的人員基礎(chǔ)與文化根基。
(2)建立職能工作小組??茖W(xué)數(shù)據(jù)歸檔流程的復(fù)雜性決定了其需要多部門協(xié)同合作。因此,建立職能工作小組至關(guān)重要。小組成員應(yīng)涵蓋科研人員、數(shù)據(jù)管理人員、項(xiàng)目管理人員、檔案管理人員、信息化管理人員以及保密管理人員等,由本單位法人/主管領(lǐng)導(dǎo)擔(dān)任組長,并定期召開工作會(huì)。通過分工合作的工作模式,職能工作小組能夠充分發(fā)揮各成員的專業(yè)優(yōu)勢,有效整合各方資源,為科學(xué)數(shù)據(jù)歸檔流程的順利實(shí)施提供有力保障,確保科學(xué)數(shù)據(jù)歸檔工作高效、有序地開展。
(3)制定規(guī)范、有效的管理辦法。科學(xué)規(guī)范的制度體系是科學(xué)數(shù)據(jù)歸檔工作得以正常開展的重要前提與基礎(chǔ)。各單位應(yīng)依據(jù)自身的實(shí)際需求與特點(diǎn),制定一套全面、細(xì)致且具有可操作性的科學(xué)數(shù)據(jù)管理辦法。在管理辦法中,需明確各部門、人員在科學(xué)數(shù)據(jù)歸檔工作中的具體職責(zé)及科學(xué)數(shù)據(jù)歸檔范圍、歸檔要求、歸檔方式和歸檔步驟等,同時(shí)提出相應(yīng)的獎(jiǎng)懲措施,確保管理辦法能夠得到有效執(zhí)行,為科學(xué)數(shù)據(jù)歸檔工作提供堅(jiān)實(shí)的制度保障與工作依據(jù)。
(4)開展多種形式的培訓(xùn)。培訓(xùn)能夠顯著增強(qiáng)各級各類人員的科學(xué)數(shù)據(jù)歸檔意識,提高技能水平。既可以包括制度宣貫、基礎(chǔ)知識培訓(xùn)和操作技能培訓(xùn),也可以根據(jù)人員身份、關(guān)注的重點(diǎn)以及實(shí)際參與工作的不同,開展針對性的專項(xiàng)培訓(xùn)。通過這些形式多樣的培訓(xùn),使他們充分認(rèn)識到科學(xué)數(shù)據(jù)歸檔工作的重要性,掌握數(shù)據(jù)歸檔的相關(guān)知識與技能,在實(shí)際工作中自覺、規(guī)范地履行數(shù)據(jù)歸檔職責(zé),為科學(xué)數(shù)據(jù)歸檔工作的順利開展提供堅(jiān)實(shí)的人力保障。
(5)爭取持續(xù)性經(jīng)費(fèi)投入??茖W(xué)數(shù)據(jù)歸檔工作無論是歸檔流程的構(gòu)建還是歸檔系統(tǒng)的建立,都不是一蹴而就的,需要經(jīng)過長期的經(jīng)驗(yàn)積累、技術(shù)升級和人員能力提升來不斷迭代,這些都需要有經(jīng)費(fèi)的持續(xù)性投入。因此,在做好上述關(guān)鍵策略并取得實(shí)際進(jìn)展的基礎(chǔ)上,積極爭取各方投入,以保障科學(xué)數(shù)據(jù)歸檔工作在技術(shù)更新、設(shè)備維護(hù)和人員培訓(xùn)等方面有穩(wěn)定、充足的資金來源。
3.歸檔流程構(gòu)建及實(shí)施過程
科學(xué)數(shù)據(jù)歸檔流程的構(gòu)建是一項(xiàng)系統(tǒng)工程,需要細(xì)致規(guī)劃和周密考慮,結(jié)合本單位實(shí)際情況,總體按照“調(diào)研—制度體系建立—系統(tǒng)搭建—實(shí)施”的步驟來開展工作。
(1)調(diào)研階段
首先,通過訪談、問卷調(diào)查和研討會(huì)等方式對科研人員開展廣泛而深入的調(diào)研,以全面了解其在科學(xué)數(shù)據(jù)管理方面的現(xiàn)狀與需求。調(diào)研內(nèi)容包括現(xiàn)行科學(xué)數(shù)據(jù)管理方式、數(shù)據(jù)歸檔需求、歸檔意愿、歸檔范圍、數(shù)據(jù)格式、數(shù)據(jù)體量和數(shù)據(jù)生成常用軟件等,并統(tǒng)計(jì)分析上述調(diào)研結(jié)果,形成初步歸檔范圍及歸檔方案,為后續(xù)科學(xué)數(shù)據(jù)管理辦法的制定、歸檔系統(tǒng)的搭建及推廣使用奠定基礎(chǔ)。
(2)制度體系建立階段
制定《科學(xué)數(shù)據(jù)管理辦法》,建立數(shù)據(jù)管理的責(zé)任體系,明確檔案管理部門、項(xiàng)目管理部門、信息化管理部門、保密管理部門、項(xiàng)目負(fù)責(zé)人、數(shù)據(jù)管理員及科研人員的職責(zé)。確立科學(xué)數(shù)據(jù)生成、收集、整理、鑒定、封裝、歸檔、存儲(chǔ)和利用等全生命周期的管理要求、工作步驟及獎(jiǎng)懲措施,明確科學(xué)數(shù)據(jù)歸檔目標(biāo)、歸檔范圍及歸檔要求??蒲腥藛T是科學(xué)數(shù)據(jù)管理的主體責(zé)任人,在數(shù)據(jù)歸檔前,收集保管科研活動(dòng)中產(chǎn)生的科學(xué)數(shù)據(jù),并確保其真實(shí)、完整,對完成科學(xué)數(shù)據(jù)歸檔至關(guān)重要。科學(xué)數(shù)據(jù)歸檔流程的實(shí)現(xiàn),需要在各管理部門及管理人員的監(jiān)督指導(dǎo)下完成,以保證科學(xué)數(shù)據(jù)的安全、可用。
(3)系統(tǒng)搭建階段
根據(jù)各單位的實(shí)際狀況,選取適配的系統(tǒng)搭建方式。對于建有科學(xué)數(shù)據(jù)中心且已開展數(shù)據(jù)收集、保管工作的單位而言,由于已具備一定的工作基礎(chǔ)與數(shù)據(jù)資源,可在現(xiàn)有基礎(chǔ)上適應(yīng)性地開發(fā)與改造數(shù)據(jù)中心與檔案管理系統(tǒng),構(gòu)建兩者之間的有效銜接。在系統(tǒng)改造時(shí),應(yīng)充分考慮數(shù)據(jù)歸檔的特殊需求,如優(yōu)化數(shù)據(jù)的分類標(biāo)準(zhǔn)、存儲(chǔ)結(jié)構(gòu)和元數(shù)據(jù)管理等方面,以確保數(shù)據(jù)能夠順利地從數(shù)據(jù)中心流轉(zhuǎn)至檔案管理系統(tǒng)??刹捎梦锢須w檔或邏輯歸檔的方式來實(shí)現(xiàn)數(shù)據(jù)歸檔。物理歸檔是將數(shù)據(jù)的實(shí)體文件完整地轉(zhuǎn)移至檔案管理系統(tǒng)中存儲(chǔ),這種方式能夠確保數(shù)據(jù)的原始性與完整性,適用對數(shù)據(jù)安全性與可靠性要求較高的場景;邏輯歸檔則僅將數(shù)據(jù)目錄及相關(guān)元數(shù)據(jù)歸檔,數(shù)據(jù)實(shí)體仍保留在原數(shù)據(jù)中心,通過建立索引和鏈接的方式實(shí)現(xiàn)數(shù)據(jù)的共享與利用,這種方式在一定程度上能夠節(jié)省存儲(chǔ)資源,提高數(shù)據(jù)的訪問效率,適用于數(shù)據(jù)量較大且對實(shí)時(shí)性要求較高的情況。
對于尚未建立科學(xué)數(shù)據(jù)中心的單位,需要開展全局性、系統(tǒng)性的規(guī)劃設(shè)計(jì),建立既能滿足本單位科研工作需要,又能保證數(shù)據(jù)真實(shí)性、完整性、安全性和可用性的科學(xué)數(shù)據(jù)管理系統(tǒng)。在系統(tǒng)設(shè)計(jì)過程中,應(yīng)充分考慮數(shù)據(jù)的全生命周期管理,要注重系統(tǒng)的擴(kuò)展性與兼容性,確保其能夠與未來的技術(shù)發(fā)展和業(yè)務(wù)需求相適應(yīng)。同時(shí),還需兼顧與檔案系統(tǒng)的接口銜接,確保數(shù)據(jù)在兩個(gè)系統(tǒng)之間能夠安全、高效地傳輸與共享。
(4)實(shí)施階段
上述工作完成后,科學(xué)數(shù)據(jù)歸檔的具體實(shí)施可分階段推進(jìn)。初期可選擇幾個(gè)具有代表性的科研項(xiàng)目來做試點(diǎn),通過試點(diǎn)項(xiàng)目驗(yàn)證流程的有效性和可行性,并根據(jù)試點(diǎn)結(jié)果進(jìn)行調(diào)整優(yōu)化。在試點(diǎn)過程中,需嚴(yán)格測試歸檔流程的各個(gè)環(huán)節(jié),包括數(shù)據(jù)提交環(huán)節(jié)、數(shù)據(jù)分類整理環(huán)節(jié)、數(shù)據(jù)存儲(chǔ)環(huán)節(jié)、數(shù)據(jù)檢索與訪問環(huán)節(jié)、數(shù)據(jù)鑒定環(huán)節(jié)以及數(shù)據(jù)移交環(huán)節(jié)、數(shù)據(jù)利用環(huán)節(jié)等。通過多個(gè)試點(diǎn)項(xiàng)目的反復(fù)迭代測試與優(yōu)化,不斷完善歸檔流程及系統(tǒng)功能,逐步形成一套具有廣泛參考價(jià)值與推廣意義的科學(xué)數(shù)據(jù)歸檔體系。同時(shí),可總結(jié)歸納試點(diǎn)過程中的經(jīng)驗(yàn)與教訓(xùn),形成詳細(xì)的文檔資料與操作規(guī)范,為后續(xù)數(shù)據(jù)歸檔工作的推廣提供可靠的依據(jù)與指導(dǎo),推動(dòng)科學(xué)數(shù)據(jù)歸檔工作在更大范圍內(nèi)的規(guī)范化、標(biāo)準(zhǔn)化與高效化開展。
四、結(jié)語
科學(xué)數(shù)據(jù)歸檔流程構(gòu)建是一項(xiàng)系統(tǒng)性工程,不僅需要組織層面的支持、跨部門的協(xié)作以及分階段的推進(jìn)和技術(shù)保障,還需要持續(xù)優(yōu)化改進(jìn)。展望未來,應(yīng)繼續(xù)致力于完善科學(xué)數(shù)據(jù)歸檔體系,加強(qiáng)交流與合作,促進(jìn)數(shù)據(jù)共享與再利用,為科技創(chuàng)新提供更強(qiáng)大的數(shù)據(jù)動(dòng)力。
參考文獻(xiàn):
[1]科學(xué)技術(shù)研究檔案管理規(guī)定[EB/OL].(2020-11-30).https://www.saac.gov.cn/daj/xzfgk/202112/2618b69465e5469e9165116ddc1190f8.shtml.
[2]中辦、國辦印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].(2021-06-08).https://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.
[3]國務(wù)院辦公廳關(guān)于印發(fā)科 學(xué) 數(shù) 據(jù) 管 理 辦 法 的 通 知[EB/OL],https://www.gov.cn/gongbao/content/2018/content_5283177.htm.
[4]趙秋紅,李元睿,鄧修權(quán),等.科學(xué)基金資助機(jī)構(gòu)視角下的科學(xué)數(shù)據(jù)管理研究[J].中國科學(xué)院院刊,2021,36(12): 1456-1462.
[5]科技部 財(cái)政部關(guān)于發(fā)布國家科技資源共享服務(wù)平臺(tái)優(yōu)化調(diào)整名單的通知[EB/OL].(2019-06-10) https://www.most.gov.cn/xxgk/xinxifenlei/fdzdgknr/qtwj/qtwj2019/201906/t20190610_147031.html.
[6]張 靜,付玥甜,何思源,等.重大科技項(xiàng)目科學(xué)數(shù)據(jù)歸檔路徑初探[J].檔案學(xué)通訊,2024(04):37-43.
作者單位:中國科學(xué)院西安光學(xué)精密機(jī)械研究所