劉 軍
(山西省科學(xué)技術(shù)情報研究所,山西太原 030001)
科技計劃項目事實型數(shù)據(jù)庫建設(shè)研究
劉 軍
(山西省科學(xué)技術(shù)情報研究所,山西太原 030001)
開展事實型數(shù)據(jù)庫的建設(shè)是科技情報研究基礎(chǔ)環(huán)境建設(shè)的重要工作。文章以科技計劃項目事實型數(shù)據(jù)庫為例,從數(shù)據(jù)源分析、建設(shè)內(nèi)容、工作流程、數(shù)據(jù)結(jié)構(gòu)設(shè)計及應(yīng)用實例幾個方面探討開展事實型數(shù)據(jù)庫的建設(shè)。
事實型數(shù)據(jù)庫;科技計劃項目;情報研究;數(shù)據(jù)庫建設(shè);數(shù)據(jù)共享;信息共享
我國的科技情報研究工作已經(jīng)經(jīng)歷了從翻譯報道、學(xué)科專業(yè)研究、情報綜述和評述研究、決策支持研究、參與決策的知識服務(wù)研究等5個階段[1]。近年來,中國科學(xué)技術(shù)信息研究所提出的以“事實型數(shù)據(jù)+專用方法工具+專家智慧”的科技情報研究綜合集成模式[2],引起國內(nèi)情報研究機構(gòu)的高度重視,對推動科技情報研究工作具有一定的指導(dǎo)意義。
多年來,科技情報機構(gòu)的業(yè)務(wù)發(fā)展借助緊靠科技管理部門的體制優(yōu)勢,部分業(yè)務(wù)的開展很大程度上成為所在科技管理部門的職能延伸,分擔(dān)著越來越多的輔助性和外圍性工作,成為科技管理部門的得力助手。尤其是目前全國各省級科技情報機構(gòu)大部分都承擔(dān)著當(dāng)?shù)乜萍加媱濏椖啃畔⒐芾硐到y(tǒng)的運行維護管理工作,具有科技計劃項目事實型數(shù)據(jù)庫數(shù)據(jù)整合和建設(shè)的獨有優(yōu)勢。
開展科技計劃項目事實型數(shù)據(jù)庫的建設(shè),對于科技情報機構(gòu)開展科技發(fā)展動態(tài)研究、產(chǎn)業(yè)發(fā)展問題研究、科技發(fā)展跟蹤研究和科技發(fā)展預(yù)測研究等研究工作奠定了基礎(chǔ)。本文以科技計劃項目數(shù)據(jù)庫為例,對事實型數(shù)據(jù)庫的建設(shè)進行探討。
我國科技計劃主要包括:基礎(chǔ)研究計劃、國家科技支撐計劃、高技術(shù)研究發(fā)展計劃、科技基礎(chǔ)條件平臺建設(shè)、政策引導(dǎo)類計劃等。各?。ㄗ灾螀^(qū)、直轄市)的科技計劃體系雖未按照國家統(tǒng)一的計劃框架搭建,各種具體計劃的稱謂和內(nèi)涵各不相同,但對國家科技計劃的框架內(nèi)容都得到了不同程度的覆蓋[3]。概括起來,在各?。ㄗ灾螀^(qū)、直轄市)的科技計劃主要包括科技產(chǎn)業(yè)化環(huán)境建設(shè)、科技攻關(guān)、基礎(chǔ)研究、國際科技合作、科技創(chuàng)新、軟科學(xué)研究、基礎(chǔ)條件平臺等各類科技計劃。各類科技計劃項目的管理也歸口于不同政府部門的司處(室)管理。由于各項目具有不同的管理特點,因此其管理流程也具有差異性。歸結(jié)起來,各項目的管理經(jīng)歷了9個階段,即計劃指南發(fā)布、項目申報、項目評議審查、項目立項、項目簽定任務(wù)書(合同書)、項目實施、項目中期匯報(檢查)、項目驗收、資料歸檔[4]。在各個階段中都會產(chǎn)生大量的事實型數(shù)據(jù)。為了明確各階段中可能產(chǎn)生的數(shù)據(jù),我們可以將這9個階段再分為項目實施的前、中、后3個階段,總結(jié)出各階段事實型數(shù)據(jù)庫的數(shù)據(jù)來源。
2.1 項目實施前的數(shù)據(jù)
主要是在確定立項項目前所產(chǎn)生的事實型數(shù)據(jù),包括各計劃年度申報指南、科技查新數(shù)據(jù)、項目申報數(shù)據(jù)、項目評審專家數(shù)據(jù)以及立項項目數(shù)據(jù)。在這些數(shù)據(jù)中,我們可能重點關(guān)注的是最終各計劃確定的立項項目數(shù)據(jù),但是,也不能忽略其他數(shù)據(jù)當(dāng)中所隱含的對于情報研究具有一定價值的信息。比如:從項目申報數(shù)據(jù)中發(fā)現(xiàn)科學(xué)研究熱點變化趨勢,從計劃申報指南中開展科技政策的導(dǎo)向研究。
2.2 項目實施中的數(shù)據(jù)
主要是指立項項目在研究實施過程中所產(chǎn)生的科學(xué)數(shù)據(jù),是項目的再生數(shù)據(jù),而非項目管理數(shù)據(jù)。這些數(shù)據(jù)包括原始性觀測數(shù)據(jù)、探測數(shù)據(jù)、試驗數(shù)據(jù)、實驗數(shù)據(jù)、調(diào)查數(shù)據(jù)、考察數(shù)據(jù)、綜合分析及統(tǒng)計數(shù)據(jù)。這些數(shù)據(jù)雖然得到單獨項目資金資助而產(chǎn)生,但具有共性價值,是科技基礎(chǔ)數(shù)據(jù)。這些數(shù)據(jù)的收集不僅為其他計劃項目研究提供了數(shù)據(jù)基礎(chǔ),也為情報機構(gòu)在情報研究過程中提供了數(shù)據(jù)參考。比如情報機構(gòu)通過對不銹鋼力學(xué)性能測試數(shù)據(jù)的參考,在企業(yè)競爭情報服務(wù)中,可以為企業(yè)提出更加合理的產(chǎn)品改進和優(yōu)化決策分析報告。
2.3 項目實施后的數(shù)據(jù)
主要是指立項項目在驗收、結(jié)題后所產(chǎn)生的數(shù)據(jù)。這個階段的數(shù)據(jù)其實應(yīng)該屬于項目檔案的范圍,是重要的一次文獻或三次文獻。這些內(nèi)容包括驗收(結(jié)題)證書、發(fā)表的學(xué)術(shù)論文、出版的專著、項目研究報告、軟件著作權(quán)、專利授權(quán)書、用戶使用(反饋)報告等。通過對這些項目檔案的數(shù)字化加工及其數(shù)據(jù)的規(guī)范加工整理,可以為科技管理中科技項目成果統(tǒng)計提供事實數(shù)據(jù),為科技管理決策提供有效公證的評價依據(jù)。
開展科技計劃項目事實型數(shù)據(jù)庫的建設(shè),重點是對科技計劃管理過程中長期積累形成的客觀反映科技計劃項目生命周期活動的各類信息的整合、加工和處理。它與傳統(tǒng)的科技項目管理信息庫有著本質(zhì)的區(qū)別,傳統(tǒng)的科技項目信息管理庫主要是側(cè)重于項目管理各個流程服務(wù),而科技計劃項目事實型數(shù)據(jù)庫的建設(shè)不是在傳統(tǒng)科技計劃管理系統(tǒng)上的升級或簡單整合,而是一個全新的具有獨立目標和資源規(guī)劃的系統(tǒng)[5]??萍加媱濏椖渴聦嵭蛿?shù)據(jù)庫的建設(shè)包括兩大類數(shù)據(jù)的建設(shè)內(nèi)容,一類是為科技情報機構(gòu)開展立項評估、科研經(jīng)費支出、領(lǐng)域或行業(yè)發(fā)展趨勢、機構(gòu)或人員評估等情報研究提供決策支持的分析類事實型數(shù)據(jù)。這些數(shù)據(jù)主要來自于項目管理過程中產(chǎn)生的數(shù)據(jù)庫,包括計劃項目申報庫、計劃項目立項庫、項目評審專家數(shù)據(jù)庫、科技項目查新數(shù)據(jù)庫、科技成果庫等。一類是在計劃項目實施過程中再生的,為科技情報機構(gòu)開展技術(shù)跟蹤、技術(shù)創(chuàng)新和科學(xué)研究提供的科技基礎(chǔ)類事實型數(shù)據(jù)。這些數(shù)據(jù)來自于項目實施過程中產(chǎn)生的數(shù)據(jù)庫,主要包括觀測數(shù)據(jù)、探測數(shù)據(jù)、試驗數(shù)據(jù)、實驗數(shù)據(jù)、調(diào)查數(shù)據(jù)、考察數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等。
科技計劃項目事實型數(shù)據(jù)庫的建設(shè),應(yīng)按照數(shù)據(jù)的分類和情報研究分析內(nèi)容來進行。在數(shù)據(jù)庫建設(shè)開始階段首先要明確數(shù)據(jù)的來源。對于項目管理類數(shù)據(jù),首先按照可能涉及的情報分析指標設(shè)計數(shù)據(jù)表結(jié)構(gòu),然后按照數(shù)據(jù)源數(shù)據(jù)的類型進行數(shù)據(jù)的采集和入庫。在數(shù)據(jù)采集過程中,如果是通過信息管理系統(tǒng)產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù),可以通過字段映射進行批量數(shù)據(jù)的導(dǎo)入;如果是非信息管理系統(tǒng)中的數(shù)據(jù),可以人工根據(jù)紙質(zhì)檔案逐條著錄數(shù)據(jù)。對于項目再生類數(shù)據(jù),首先按照規(guī)范的元數(shù)據(jù)格式,建立元數(shù)據(jù)目錄數(shù)據(jù)庫,并分類管理,然后對其實體數(shù)據(jù)集(結(jié)構(gòu)化數(shù)據(jù)表或非結(jié)構(gòu)數(shù)據(jù)文檔)可按照分類獨立存儲。圖1是科技計劃項目事實數(shù)據(jù)庫建設(shè)工作流程。
圖1 科技計劃項目事實型數(shù)據(jù)庫建設(shè)工作流程
科技計劃項目事實型數(shù)據(jù)庫中各數(shù)據(jù)表結(jié)構(gòu)的設(shè)計是獲取科技計劃項目相關(guān)知識的關(guān)鍵,也是進行知識組織的基本數(shù)據(jù)元。因此,結(jié)合知識獲取要素及分析內(nèi)容,可以通過人物、機構(gòu)、經(jīng)費投入、研究領(lǐng)域、成果五大分析主題進行數(shù)據(jù)表結(jié)構(gòu)的設(shè)計。
(1)人物主題。反映科技計劃項目中人物主體的事實情況。涉及的數(shù)據(jù)表結(jié)構(gòu)字段包括:項目責(zé)任人及項目承擔(dān)人的姓名、性別、職稱、學(xué)位、年齡等基本字段。
(2)機構(gòu)主題。反映科技計劃項目中機構(gòu)主體的事實情況。涉及的數(shù)據(jù)表結(jié)構(gòu)字段包括:機構(gòu)名稱、機構(gòu)性質(zhì)、機構(gòu)所在地區(qū)、機構(gòu)人員學(xué)歷狀況等字段。
(3)經(jīng)費投入主題。反映科技計劃項目中經(jīng)費投入及構(gòu)成的的事實情況。涉及的數(shù)據(jù)表結(jié)構(gòu)字段包括:政府撥款、銀行貸款、單位自籌等字段。
(4)研究領(lǐng)域主題。反映科技計劃項目在不同研究領(lǐng)域、不同科技計劃的分布情況。可根據(jù)項目的研究方向,按照國家國民經(jīng)濟分類標準三級編碼及科技計劃類別編碼進行統(tǒng)一標引。
(5)成果主題。反映科技計劃項目研究成果的事實情況。涉及的數(shù)據(jù)表結(jié)構(gòu)字段包括:項目驗收、鑒定、獎勵、成果水平、應(yīng)用領(lǐng)域、經(jīng)濟效益、科研產(chǎn)出(專利、論文)等字段。
對于項目再生類數(shù)據(jù),可通過元數(shù)據(jù)規(guī)范設(shè)計,建立元數(shù)據(jù)目錄數(shù)據(jù)庫。在元數(shù)據(jù)規(guī)范設(shè)計中,考慮到未來數(shù)據(jù)的共享、交換,建議參考國際DC標準進行著錄,并結(jié)合實際情況在其15個核心元素的基礎(chǔ)上進行自定義擴展,建立本區(qū)域的元數(shù)據(jù)目錄庫。
科技計劃項目事實型數(shù)據(jù)庫的應(yīng)用重點是基于數(shù)據(jù)庫圍繞人物、機構(gòu)、經(jīng)費、研究領(lǐng)域、成果主題開展數(shù)據(jù)的挖掘和信息分析服務(wù)。具體可以實現(xiàn)如下的信息分析服務(wù)內(nèi)容。
(1)立項監(jiān)測?;陧椖控撠?zé)人承擔(dān)項目情況分析,可以監(jiān)測項目負責(zé)人在某個階段承擔(dān)的計劃項目情況,避免項目負責(zé)人同年主持多項項目的情況;基于項目承擔(dān)機構(gòu)的情況分析,可以監(jiān)測機構(gòu)承擔(dān)各類計劃項目情況,避免同一項目在不同計劃類別下的重復(fù)立項,為科技項目管理部門提供立項管理。
(2)產(chǎn)業(yè)研究?;陧椖繋煨畔⒎治?,可以分析不同行業(yè)或領(lǐng)域在不同計劃類別的支持力度變化情況,通過橫向和縱向比較,揭示出當(dāng)?shù)禺a(chǎn)業(yè)發(fā)展和科技扶持政策的變化情況,為科技產(chǎn)業(yè)規(guī)劃提供決策參考。
(3)創(chuàng)新能力評估。主要對機構(gòu)的歷年承擔(dān)項目、取得成果、資助經(jīng)費及科研人員構(gòu)成等情況進行分析,從而反映出機構(gòu)的總體科研實力和科研產(chǎn)出水平。
此外,通過對科技計劃項目再生科學(xué)數(shù)據(jù)元數(shù)據(jù)目錄庫的建立和實體數(shù)據(jù)的匯交,可以構(gòu)建科學(xué)數(shù)據(jù)共享服務(wù)平臺,實現(xiàn)科學(xué)數(shù)據(jù)的統(tǒng)一保存管理,避免科學(xué)數(shù)據(jù)的分散保存、丟失和重復(fù)建設(shè),為科技創(chuàng)新提供科技基礎(chǔ)數(shù)據(jù)支撐和保障。
數(shù)字化時代,科技情報研究工作正在發(fā)生著改變,對數(shù)據(jù)的依賴性也日益加強。以事實型數(shù)據(jù)為基礎(chǔ),為科技決策提供權(quán)威公正的評估考量和決策分析已成為科技情報研究機構(gòu)的工作重點??萍记閳髾C構(gòu)要想在情報研究工作中取得優(yōu)勢,必須結(jié)合業(yè)務(wù)環(huán)境與工作內(nèi)容,扎扎實實地積累,構(gòu)建服務(wù)于特定對象、目標的事實型數(shù)據(jù)庫。當(dāng)前,全國大多科技情報機構(gòu)承擔(dān)著當(dāng)?shù)乜萍脊芾聿块T的科技計劃項目信息管理工作,科技情報機構(gòu)要充分利用這一優(yōu)勢,逐步收集、加工、積累和構(gòu)建科技計劃項目的事實型數(shù)據(jù)庫,為科技情報工作奠定良好的數(shù)據(jù)基礎(chǔ)。本文通過多年的工作實踐,提出科技計劃項目事實型數(shù)據(jù)庫的建設(shè)思路,在建庫過程中如數(shù)據(jù)的清洗、轉(zhuǎn)換及及時更新等細節(jié)還需深酌,在此只愿能拋磚引玉,為情報研究機構(gòu)建設(shè)事實型數(shù)據(jù)庫做一參考。
[1] 梁戰(zhàn)平.我國科技情報研究的探索與發(fā)展[J].情報探索,2007(7):3-7.
[2] 賀徳方.基于事實型數(shù)據(jù)的科技情報研究工作思考[J].情報學(xué)報,2009(5):764-770.
[3] 劉婭,龔春紅.我國地方社會發(fā)展領(lǐng)域科技管理工作現(xiàn)狀與特征分析[J] 科技管理研究,2011(19):30-31.
[4] 劉軍,范文虎.初探山西省科技計劃項目科學(xué)數(shù)據(jù)的匯交管理[J].中國科技資源導(dǎo)刊,2010(5):37-42.
[5] 劉潤達,趙輝.科技項目信息庫建設(shè)現(xiàn)狀及應(yīng)用前景初探[J].科學(xué)管理研究,2011,29(3):41-42.
Study on the Factual Database Construction for S&T Plans’ Projects
Liu Jun
( Shanxi Science & Technology Information Institute, Taiyuan 030001)
Carrying out the construction of factual database is an important work of environmental infrastructure construction for scientif c and technological information research. This paper takes factual database of S&T plans’projects as an example, from it discusses the probes the factual database construction from the data source analysis, construction content, working process, data structure design, and application example, etc.
factual database, S&T p lans’ projects, in form ation research, database construction, data sharing, information sharing
G35
:ADOI:10.3772/j.issn.1674-1544.2013.03.018
劉軍(1968- ),男,山西省科學(xué)技術(shù)信息研究所副研究員,研究方向:科技文獻共享服務(wù)平臺和科學(xué)數(shù)據(jù)共享平臺建設(shè)、科技情報。
山西省軟科學(xué)研究項目“山西省科技計劃項目科學(xué)數(shù)據(jù)匯交管理政策措施研究”(2012041021-02)。
2013年3月25日。