陳白雪 屈寶強 崔小委 寇亞東 賢 信
(中國科學(xué)技術(shù)信息研究所,北京 100038)
科技項目申報指南作為科技項目管理過程中的起始環(huán)節(jié),是一類重要的科技信息資源,用于指導(dǎo)申報單位組織科研人員就某個項目的重點支持方向進行申報,是科技項目申報與評審的重要依據(jù),更是未來項目實施和結(jié)題驗收的重要依據(jù),對引導(dǎo)國家科技發(fā)展具有舉足輕重的作用??萍柬椖可陥笾改蠌暮暧^上概括了一個國家或地方在某個時期內(nèi)重點支持的領(lǐng)域或研究方向,是一個國家或地方科技資源配置的重要體現(xiàn)。學(xué)界對科技項目指南等進行了相關(guān)的研究。郜正亞[1]通過對2011年國家社會科學(xué)基金項目課題指南和項目評審結(jié)果的對比分析,探索了我國圖書館學(xué)學(xué)科研究熱點;梁美宏[2]運用信息熵方法對國家社科基金“圖書館·情報與文獻學(xué)”領(lǐng)域歷年課題主題進行了定量處理,從時間和主題的角度分析了該領(lǐng)域指南主題的總體演化特征,分析結(jié)果表明本領(lǐng)域指南涉及主題分布越來越均衡,對學(xué)科發(fā)展具有積極導(dǎo)向作用;曹玲等[3]針對2007—2016年國家社會科學(xué)基金“圖書館·情報與文獻學(xué)”下課題指南和立項項目名稱,進行了關(guān)鍵詞切分與比對,綜合內(nèi)容分析結(jié)果,對課題指南與立項項目的關(guān)聯(lián)性進行了討論;張慶芝等[4]利用自然語言處理技術(shù),對科技規(guī)劃文本進行主題挖掘,構(gòu)建科學(xué)研究前沿主題地圖,并進行可視化展示;劉玲等[5]對項目申報指南進行了定量和定性分析,并對申報指南與立項項目間的關(guān)系進行了分析。
目前,科技項目申報指南以文本形式存在,在科技項目管理工作中發(fā)揮了重要的作用。由于各類科技計劃的主管部門不一,科技計劃項目申報指南資源分布在各個網(wǎng)站的不同頁面,缺乏統(tǒng)一的組織、整合與管理,因此申報指南數(shù)據(jù)一直沒能得到有效的利用,不利于科技專家或相關(guān)科技機構(gòu)的查閱和利用,使得申報指南資源發(fā)揮的作用有限。隨著大數(shù)據(jù)時代的到來,利用傳統(tǒng)的信息組織方式已經(jīng)無法滿足用戶日益增長的需求,除了將各種資源進行統(tǒng)一規(guī)范化的描述之外,研究者們開始注重各類資源之間存在的關(guān)聯(lián)關(guān)系,通過自然語言處理、文本挖掘、語義推理等技術(shù),充分發(fā)掘資源中的隱藏知識,更好地為用戶提供服務(wù)。在數(shù)據(jù)和語義的雙重驅(qū)動下,數(shù)據(jù)關(guān)聯(lián)組織不斷向標(biāo)準(zhǔn)化和語義化的方向發(fā)展,語義關(guān)聯(lián)數(shù)據(jù)表示和知識組織成為新的發(fā)展趨勢[6]。euroCRIS[7]將CERIF(Common European Re- search Information Format)模型推薦給其成員國,應(yīng)用于科研信息系統(tǒng)建設(shè),便于科研信息的交換和共享。CERIF模型從科研管理流程出發(fā),分析和明確了研究計劃、項目、成果等各個環(huán)節(jié)涉及的主要科研實體和科研關(guān)系,并可以進行模型擴展,滿足新的科研需求。Fedora模型定義了一系列表示數(shù)字對象的概念,明確了數(shù)字對象間的關(guān)系,以及鏈接數(shù)字對象的行為,該模型采用XML格式的數(shù)據(jù)存儲和導(dǎo)入導(dǎo)出,在數(shù)字圖書館、內(nèi)容管理、資源保存等方面有良好的應(yīng)用前景[6,8]。DoDAF模型通過本體描述框架,明確了各視圖中體系組成要素的定義、關(guān)系、屬性的形式化表示[6,9]。謝園等[10]研究了科學(xué)標(biāo)本資源的匯交要素、基礎(chǔ)性資料元數(shù)據(jù)標(biāo)準(zhǔn),以及標(biāo)本資源的共性描述規(guī)范,探討了標(biāo)本數(shù)據(jù)庫的應(yīng)用前景。宋培彥等[11]以知識組織理論為基礎(chǔ),從6個方面將分散、異構(gòu)的專家信息進行語義化描述、關(guān)聯(lián)與聚合,并采用RDF進行形式描述和實證研究,最終生成具有較強規(guī)范性和語義關(guān)系的專家信息庫,為實現(xiàn)異構(gòu)專家信息庫的共建、共享與服務(wù)提供基礎(chǔ)。由上可知,無論是科研管理機構(gòu)還是科研人員,都試圖尋找一種能夠?qū)⒍嘣吹?、異?gòu)的、不同主題的信息進行統(tǒng)一描述的語義模型,實現(xiàn)同類信息資源的統(tǒng)一存儲和共享,為用戶提供更多的服務(wù)。
科技計劃項目的申報指南涉及的領(lǐng)域及范圍不同,申報指南包含的內(nèi)容、排版形式也不盡相同。為了實現(xiàn)對不同科技計劃類型申報指南資源的組織,需要對申報指南的文本進行解析,歸納出科技項目申報指南的基本特征,從而構(gòu)建一個統(tǒng)一的、具有可拓展性的科技計劃項目申報指南資源描述框架,實現(xiàn)對科技計劃項目申報指南資源的統(tǒng)一存儲和管理。為進一步挖掘科技項目申報指南的作用,加強科技項目申報指南資源的組織和利用,發(fā)揮其在指南檢索、指南推送、專家回避等方面的作用,本文試圖對科技項目申報指南資源描述框架進行分析。
目前,我國科技計劃(專項、基金等)主要有國家自然科學(xué)基金、國家科技重大專項、國家重點研發(fā)計劃等五大類計劃(專項、基金等)[12]。其中,國家自然科學(xué)基金設(shè)立于1986年,主要資助基礎(chǔ)研究和科學(xué)前沿探索,支持人才和團隊建設(shè),增強源頭創(chuàng)新能力[12];國家科技重大專項聚焦國家重大戰(zhàn)略產(chǎn)品和重大產(chǎn)業(yè)化目標(biāo),發(fā)揮舉國體制的優(yōu)勢,在設(shè)定時限內(nèi)進行集體式協(xié)同攻關(guān)[12];國家重點研發(fā)計劃2015年底啟動,面向事關(guān)國計民生的重大社會公益性研究,以及事關(guān)產(chǎn)業(yè)核心競爭力、整體自主創(chuàng)新能力和國家安全的重大科學(xué)問題、重大共性關(guān)鍵技術(shù)和產(chǎn)品、重大國際科技合作,按照重點專項的方式組織實施,加強跨部門、跨行業(yè)、跨區(qū)域研發(fā)布局和協(xié)同創(chuàng)新,為國民經(jīng)濟和社會發(fā)展主要領(lǐng)域提供持續(xù)性的支撐和引領(lǐng)[12];國家科技重大專項聚焦國家重大戰(zhàn)略產(chǎn)品和重大產(chǎn)業(yè)化目標(biāo),發(fā)揮舉國體制的優(yōu)勢,在設(shè)定時限內(nèi)進行集體式協(xié)同攻關(guān)[12]。除上述科技計劃外,社會科學(xué)領(lǐng)域的國家社會科學(xué)基金,每年也會發(fā)布項目申報指南。該基金設(shè)立于1991年,主要資助國家哲學(xué)社會科學(xué)的研究,組織實施哲學(xué)社會科學(xué)創(chuàng)新工程、人才工程等。
本文以國家自然科學(xué)基金、國家重點研發(fā)計劃和國家社會科學(xué)基金3種典型項目申報指南為例,對申報指南的特征進行分析。3種典型項目申報指南的部分內(nèi)容如圖1、圖2、圖3所示。這以上3種典型的項目申報指南主要有以下特征。
圖1 國家自然科技基金2019年申報指南(部分)
圖2 國家重點研發(fā)計劃“典型脆弱生態(tài)修復(fù)與保護研究”重點專項2016年申報指南(部分)
圖3 國家社會科學(xué)基金2019年申報指南(部分)
(1)發(fā)布渠道均由官方網(wǎng)站公布。國家自然科學(xué)基金申報指南通過國家自然科學(xué)基金委員會官網(wǎng)的“項目指南”欄目公布,并在國家科技管理信息系統(tǒng)公共服務(wù)平臺同步公示;國家社會科學(xué)基金申報指南通過全國哲學(xué)社會科學(xué)工作辦公室的“通知公告”欄目公布;國家重點研發(fā)計劃申報指南通過中華人民共和國科學(xué)技術(shù)部網(wǎng)站和國家科技管理信息系統(tǒng)公共服務(wù)平臺首頁的“申報指南”公布。
(2)指南基本結(jié)構(gòu)單元一致。國家自然科學(xué)基金、國家社會科學(xué)基金和國家重點研發(fā)計劃的申報指南的組成內(nèi)容基本一致,包括指南基本信息、指南編制專家信息、申報條件信息和管理信息等四個方面。不同科技計劃項目申報指南的基本組成內(nèi)容如表1所示。
表1 3種典型項目申報指南的基本組成內(nèi)容
(3)發(fā)布形式不完全一致。國家自然科學(xué)基金申報指南主要通過網(wǎng)頁發(fā)布;國家社會科學(xué)基金和國家重點研發(fā)計劃申報指南通過“網(wǎng)頁+附件”形式發(fā)布,用戶可以自行下載申報指南。
(4)指南發(fā)布時間不同。國家自然科學(xué)基金和國家社會科學(xué)基金基本上在當(dāng)年年底發(fā)布下一年的大部分申報指南;而國家重點研發(fā)計劃的申報指南是以專項為單元進行發(fā)布的,不同的專項發(fā)布的時間不一樣,每年發(fā)布的專項指南也不完全一樣。
以上3種科技計劃的申報指南資源的內(nèi)部和外部特征表明,不同的科技計劃項目申報指南資源在組成內(nèi)容上具有一定的共通性,能夠通過一個統(tǒng)一的描述框架對其進行描述、整合和組織。
根據(jù)典型科技計劃項目申報指南的基本組成內(nèi)容特征,可以歸納出科技項目申報指南資源的一般描述框架如圖4所示,主要包括以下4個部分。
(1)基本信息:包括資助項目類型、研究內(nèi)容、考核指標(biāo)、資助周期、資助經(jīng)費等信息;
(2)編制專家信息:包括專家信息、工作單位、職稱和職務(wù)等信息;
(3)管理信息:包括指南的發(fā)布時間、申報時間、發(fā)布機構(gòu)、受理機構(gòu)、擬支持項目數(shù)和資助方式等信息;
(4)申報條件信息:包括人員條件、申請單位條件、申報方式、經(jīng)費要求、項目條件、申報材料要求以及其他申請注意事項等信息。
圖4從國家重點研發(fā)計劃申報指南的基本信息、指南編制專家信息、申報條件信息和管理信息等4個方面對申報指南進行具體描述,形成一個比較完善和通用的申報指南描述框架,用于支撐指南推送、專家推薦、項目管理等方面。上述4方面信息能夠基本涵蓋申報指南中所涉及的內(nèi)容以及科技工作者和申報單位關(guān)注的內(nèi)容,并可以根據(jù)需求進行一定的擴展和細(xì)化。每個信息項可以從唯一標(biāo)識符、定義、值域、數(shù)據(jù)類型和必備性等屬性對其進行屬性約束,實現(xiàn)申報指南的規(guī)范化描述。
為了實現(xiàn)對科技計劃項目申報指南數(shù)據(jù)的統(tǒng)一存儲和組織,可以根據(jù)科技項目申報指南一般描述框架構(gòu)建科技項目申報指南數(shù)據(jù)庫。該數(shù)據(jù)庫包括1個主表,即科技計劃項目申報指南表;4個子表,即基本信息表、編制專家表、管理信息表和申報條件信息表。在申報條件信息表下,包括3個子表,分別是項目條件表、人員條件表和經(jīng)費條件表。在管理信息表下包括管理機構(gòu)子表。各個表之間通過主鍵和外鍵進行關(guān)聯(lián),科技項目申報指南的物理表及表間關(guān)系如圖5所示。
科技項目申報指南不僅可以在科技項目實施過程中起到監(jiān)督作用,還可以通過科技項目申報指南,判斷項目在立項、中期和驗收等環(huán)節(jié)中是否嚴(yán)格依照申報指南進行研究,為國家或地方的科技計劃過程管理提供參考依據(jù)。通過對不同科技計劃的申報指南資源進行統(tǒng)一描述,構(gòu)建申報指南資源數(shù)據(jù)庫,并利用語義關(guān)聯(lián)、數(shù)據(jù)挖掘等技術(shù)手段,發(fā)揮申報指南資源的作用。
圖4 科技計劃項目申報指南一般描述框架
圖5 科技項目申報指南資源庫的物理表及表間關(guān)系
(1)輔助管理部門進行申報指南的查詢、制定和發(fā)布。通過對申報指南進行語義化描述,構(gòu)建申報指南數(shù)據(jù)庫,可以對申報指南數(shù)據(jù)進行檢索,查看各類型科技計劃申報指南的發(fā)布情況,不同科技計劃申報指南對同一領(lǐng)域的資助情況、經(jīng)費配置情況,使管理部門從宏觀上掌握各類計劃的執(zhí)行情況。
(2)輔助計劃組織實施部門進行項目過程管理。項目申報指南是項目立項、中期和驗收等項目管理過程中的重要依據(jù)。通過將申報指南數(shù)據(jù)庫與已立項項目信息進行關(guān)聯(lián),可以分析當(dāng)年的立項情況,已立項項目是否與指南中的任務(wù)保持一致,是否指南中的所有任務(wù)都已被立項,并根據(jù)項目對應(yīng)的指南方向可以為項目的中期和驗收提供考核依據(jù)。通過這種關(guān)聯(lián)分析,還可以為下一年管理部門制定和發(fā)布申報指南時提供參考和借鑒。
(3)通過申報指南信息精準(zhǔn)推送,提醒項目申報者進行項目申報。通過將申報指南數(shù)據(jù)庫與科研人員庫、科研誠信庫和項目庫等進行關(guān)聯(lián),將不滿足限項規(guī)定、不滿足科研誠信的科研人員過濾掉,把指南精準(zhǔn)、快速地推薦給科研人員,讓科研人員在第一時間了解指南的基本情況。
本文通過對3種典型項目申報指南的內(nèi)容進行分析和歸納,總結(jié)出科技計劃項目申報指南的主要組成內(nèi)容:指南的基本信息、編制專家信息、項目管理信息和申報條件信息。通過這4個方面的信息,可以對項目申報指南進行具體描述。同時運用CERIF模型構(gòu)建科技項目申報指南描述框架,形成申報指南資源數(shù)據(jù)庫,實現(xiàn)對多來源、異構(gòu)的申報指南資源的統(tǒng)一描述。通過將申報指南的內(nèi)容信息、指南編制專家信息等內(nèi)容與科技項目庫、科研人員庫、科技專家?guī)旌涂蒲姓\信庫等數(shù)據(jù)庫進行關(guān)聯(lián),充分發(fā)揮其在指南查詢、指南推送、指南與立項情況分析等科技管理活動中的作用,可以為不同類型的用戶提供有針對性的服務(wù),切實提高科技項目申報指南的利用效率。