馬 靜,許 丹,趙莉花,高 健,李 森,張栓堂
(河北省水利科學研究院,河北 石家莊 050061)
隨著時代的不斷發(fā)展和進步,科學技術(shù)研究、信息技術(shù)、計算機等迅速發(fā)展,各種網(wǎng)絡(luò)上的信息呈指數(shù)形式增長。面對海量的、紛繁復雜的網(wǎng)絡(luò)信息,各行各業(yè)人員對所需信息的尋找準確度大大降低,這是通用知識服務(wù)平臺的最大弊端。為解決弊端,各個行業(yè)建立行業(yè)服務(wù)平臺是必然趨勢。
當今社會大數(shù)據(jù)[1-2]、云計算[3-4]、物聯(lián)網(wǎng)[5-6]等現(xiàn)代信息技術(shù)正處于快速發(fā)展時期,世界也因此進入大數(shù)據(jù)時代[7],大數(shù)據(jù)技術(shù)在金融、醫(yī)療衛(wèi)生、互聯(lián)網(wǎng)、電信等領(lǐng)域的應用已取得較好的成果。大數(shù)據(jù)平臺主要由數(shù)據(jù)存儲、接入和平臺管理等系統(tǒng)組成,具有數(shù)據(jù)量和資料規(guī)模非常巨大的優(yōu)點,能在短時間內(nèi)精準擷取、管理和整理數(shù)據(jù)[8]。
建設(shè)水利知識服務(wù)平臺,不僅是目前網(wǎng)絡(luò)信息社會對水利行業(yè)提出的客觀要求,也是新時期水利工作發(fā)展的方向。國家水利“十三五”規(guī)劃明確提出,水利行業(yè)信息化建設(shè)要基于國家信息化發(fā)展最新戰(zhàn)略和現(xiàn)有工作基礎(chǔ),加大對新信息技術(shù)的充分利用和信息資源的開發(fā)力度,建立服務(wù)水利行業(yè)發(fā)展的信息化體系,全面提升對水利要素的感知、業(yè)務(wù)數(shù)據(jù)的知識化處理和綜合決策的支持等能力,逐步推動智慧水利平臺建設(shè)[9]。在水利知識服務(wù)平臺建設(shè)過程中須嚴格按照標準化程序進行,實現(xiàn)水利行業(yè)數(shù)據(jù)的安全接入、存儲、共享、分析應用和管理的目標,更好地服務(wù)水利行業(yè)[10]。河北省水利行業(yè)的信息與數(shù)據(jù)資源相對分散,沒有進行有效的整合,因此,應緊密結(jié)合河北省水利行業(yè)實際情況及未來發(fā)展趨勢,重點落實關(guān)于加強知識管理工作的指示精神,推進水利知識服務(wù)平臺建設(shè)。
通過建立以水利知識為支撐的信息平臺,讓水利行業(yè)及相關(guān)人員更快捷、高效地獲取最新的知識和信息,不僅使水利知識服務(wù)平臺得到充分應用,更能在一定程度上縮短水利及相關(guān)行業(yè)的工作人員查詢最新水利信息的時間。水利知識服務(wù)平臺是水利知識與信息技術(shù)融合的產(chǎn)物,水利知識定期傳輸?shù)椒?wù)平臺,所需人員在平臺上獲取信息,形成一體化線上獲取模式。
為貫徹落實河北省水利“十三五”規(guī)劃指導思想[11-12],實施行業(yè)資源整合,建設(shè)水利知識服務(wù)平臺是河北省水利信息化工程的重要組成部分。河北省水利知識服務(wù)平臺總體建設(shè)目標為:建成一個以數(shù)字化知識資源為基礎(chǔ),以河北省水利機構(gòu)需求為中心,以先進的信息技術(shù)為手段的一體化的個性化知識綜合服務(wù)與管理平臺。它既是資源加工、管理平臺,又是功能完備、資源豐富、特色鮮明、共知共享的網(wǎng)絡(luò)信息服務(wù)窗口。實現(xiàn)管理現(xiàn)代化和文獻服務(wù)網(wǎng)絡(luò)化,最終建成面向研究室領(lǐng)導決策、科研創(chuàng)新、信息咨詢的,集知識管理、數(shù)據(jù)分析、項目過程管理、科研成果轉(zhuǎn)化、交流互動、移動端服務(wù)于一體的全方位服務(wù)的大型綜合性知識服務(wù)平臺。
水利行業(yè)是一個復雜且相對獨立的系統(tǒng),與較多行業(yè)存在廣泛的業(yè)務(wù)往來,所以水利知識服務(wù)平臺建設(shè)是一個龐大的系統(tǒng)工程。真正解決水利行業(yè)統(tǒng)一的數(shù)據(jù)管理、存儲、服務(wù)、應用與安全等問題是水利知識服務(wù)平臺建設(shè)的需求[13],因此,應基于河北省水利行業(yè)發(fā)展現(xiàn)狀,通過科學的規(guī)劃與設(shè)計,逐步建立水利知識服務(wù)平臺。建設(shè)思路[14]總結(jié)如下:
1)科學規(guī)劃、統(tǒng)一設(shè)計。水利大數(shù)據(jù)具有結(jié)構(gòu)復雜及多樣的特點,因此大數(shù)據(jù)平臺建設(shè)必須遵從信息化要求[15],在建設(shè)前對總體框架進行科學規(guī)劃、統(tǒng)一設(shè)計,形成水利知識服務(wù)平臺整體架構(gòu)藍圖,為今后平臺的擴充、運行及管理提供便利。
2)逐步建立。由于水利知識服務(wù)平臺是一個龐大的系統(tǒng)工程,涉及的業(yè)務(wù)較廣,數(shù)據(jù)多而雜,所以大數(shù)據(jù)平臺的建設(shè)不能一次性快速完成,應該是在總體架構(gòu)的基礎(chǔ)上,采用分期、分階段的方式,逐步建立,完善,最終形成水利知識服務(wù)平臺。
3)重視基礎(chǔ)建設(shè)。對于國家建設(shè)而言,經(jīng)濟基礎(chǔ)決定上層建筑。同理,對于水利知識服務(wù)平臺而言,一個好的基礎(chǔ)也有利于平臺的建立、穩(wěn)定和完善。因此,在水利知識服務(wù)平臺建設(shè)過程中,基礎(chǔ)軟硬件的選擇與建設(shè)、平臺基礎(chǔ)數(shù)據(jù)的規(guī)范和治理、相關(guān)管理制度的建立、主要功能的設(shè)計等,要滿足基礎(chǔ)、現(xiàn)實和實用的需求。
水利知識服務(wù)平臺的建設(shè)應遵循以下原則:
1)整體性原則[16]。建設(shè)水利知識服務(wù)平臺重要目的是實現(xiàn)資源整合,因此任務(wù)中遵循的首要原則為整體性原則。
2)動態(tài)相關(guān)性原則[17]。水利知識服務(wù)平臺處在不斷地發(fā)展變化之中,主要由建設(shè)項目中的子模塊之間,以及子模塊組成要素之間的排列組合不斷變化所引起,也決定了系統(tǒng)的相互關(guān)聯(lián)性。因此,要遵循動態(tài)相關(guān)性原則,將平臺中各動態(tài)要素實時關(guān)聯(lián),做到互通。
3)層次等級性原則[18]。水利知識服務(wù)平臺中應用子模塊都被包含在比它更大或更高一級的系統(tǒng)里,同時每個系統(tǒng)都包含著若干個比它小的或是低一級的子系統(tǒng)。系統(tǒng)與系統(tǒng)或要素與要素之間除了并列關(guān)系外,更表現(xiàn)出明顯的層次等級性。因此應遵循層次等級性原則,將模塊功能細化,使各子模塊有條不紊地展示給用戶。
4)開放性原則[19]。水利應用的系統(tǒng)集成需要具有開放和全面的接口,方便從各級水利機構(gòu)選擇合適的軟件和工具進行集成,并可根據(jù)示范應用單位的應用需求和業(yè)務(wù)流程進行配置,增加或減少軟件和工具。
5)易用友好性原則[20]。水利知識服務(wù)平臺應提供直觀易用、友好、人性化的用戶操作界面,方便不同層次的工作人員使用。
6)穩(wěn)定性和安全性原則[21]。水利知識服務(wù)平臺是一個長期運行的系統(tǒng),設(shè)計時須充分考慮數(shù)據(jù)的安全性和平臺的穩(wěn)定性,并提供備份和災難恢復機制,使該平臺在出現(xiàn)部分故障時仍然能夠為用戶提供必要的服務(wù)。
7)合規(guī)和標準性原則[22]。水利知識服務(wù)平臺的設(shè)計、代碼的書寫、文檔的編輯等,應嚴格執(zhí)行國家相關(guān)、行業(yè)和審計標準。
水利知識服務(wù)平臺將大數(shù)據(jù)技術(shù)與迭代創(chuàng)新模式引入建設(shè)過程中,及時為機構(gòu)領(lǐng)導和科研人員提供水利行業(yè)資源和科研成果等全方位服務(wù),真正實現(xiàn)各創(chuàng)新要素高效整合,以及基礎(chǔ)研究、應用研究和工程開發(fā)等各類人才與資源的綜合利用。
河北省水利知識服務(wù)平臺包含水利系統(tǒng)各方面的知識,如河北省水利行業(yè)最新的新聞資訊、科技知識,以及科普知識、水利行業(yè)的專家智庫及水利學會的相關(guān)信息等。
采用“自建 + 外采”的整合方式,通過大數(shù)據(jù)信息技術(shù)對水利數(shù)據(jù)資源進行統(tǒng)一規(guī)劃、整合加工、深度挖掘分析等,逐步建立水利知識服務(wù)平臺。自建資料包含水利行業(yè)的數(shù)據(jù)、資料等相關(guān)信息,外采資料指通過第三方數(shù)據(jù)庫獲取的各種類型的資料。將自建與外采的資料放到河北省水利知識服務(wù)平臺上,使不同行業(yè)、領(lǐng)域的相關(guān)數(shù)據(jù)和信息資料得到有機的整合,有針對性地對行業(yè)或機構(gòu)發(fā)展中的重點和難點問題進行知識關(guān)聯(lián),個性化定制,并提供知識分析和服務(wù),形成有相關(guān)研究證據(jù)支撐的、可信度較高的可行性研究報告。水利知識服務(wù)平臺系統(tǒng)技術(shù)架構(gòu)如圖 1 所示,從圖中看出在平臺上可以同時檢索到自有資源與第三方數(shù)據(jù),這些資源通過進一步分類、加工、聚類、管理等,形成使用者能直接獲取的標準、期刊、論文、專利等信息,充分體現(xiàn)了“自建 + 外采”下的數(shù)據(jù)信息的融合。
圖 1 水利知識服務(wù)平臺系統(tǒng)技術(shù)架構(gòu)圖
河北省水利知識服務(wù)平臺是在不斷完善中逐步建立起來的,初步建立時服務(wù)范疇是為水利行業(yè)的科研人員提供文獻的查詢、簡單信息的獲取,隨著技術(shù)的進步,服務(wù)平臺逐漸開通新聞資訊、科技知識等模塊。到目前為止,在 TPI 大數(shù)據(jù)和 KBase 知識庫等管理系統(tǒng)核心技術(shù)的支持下,河北省水利知識服務(wù)平臺已經(jīng)是集專家咨詢、科普知識、期刊投稿、學習平臺等欄目在內(nèi)的綜合系統(tǒng),可為水利及相關(guān)行業(yè)的用戶提供更全面的知識服務(wù)。
3.2.1 TPI 大數(shù)據(jù)管理系統(tǒng)
TPI 大數(shù)據(jù)管理系統(tǒng)[23]基于非結(jié)構(gòu)化的文檔管理,以全文檢索數(shù)據(jù)庫為核心,采用 B/S 瀏覽器的檢索方式和 3 層 C/S 架構(gòu),能同時管理文本、圖像、多媒體等各類信息,具備中文智能信息處理能力,并提供全文檢索的優(yōu)質(zhì)化服務(wù),支持網(wǎng)頁的動態(tài)發(fā)布等,是一個面向資源信息應用、管理和發(fā)布的系統(tǒng)。TPI 大數(shù)據(jù)管理系統(tǒng)功能強大,可以支持準確、高效的檢索;具備多服務(wù)器同時處理能力;能支持多種編碼形式,通用的操作系統(tǒng)均可適用。
TPI 大數(shù)據(jù)管理系統(tǒng)可實現(xiàn)以下功能:
1)大數(shù)據(jù)發(fā)布與內(nèi)容管理。TPI 大數(shù)據(jù)管理系統(tǒng)能夠?qū)⒂脩艚⒌拇髷?shù)據(jù)信息資源(包括期刊、論文、音頻、圖件等)定期自動或動態(tài)實時發(fā)布在網(wǎng)上,實現(xiàn)多導航和數(shù)據(jù)庫的緊密連接,可以采用單庫、跨庫、分布式、高級、二次、同義詞和反義詞等檢索方式,在用戶、項目、Web 發(fā)布管理等完整配套管理下,實現(xiàn)水利大數(shù)據(jù)的全面安全控制。
2)分類標引。可對大數(shù)據(jù)中的文本、圖像、視頻等資源進行分類和標引,為平臺提供更直觀、全面的瀏覽和檢索界面。
3)數(shù)據(jù)庫轉(zhuǎn)換。通過 OAI 和 METS 協(xié)議,經(jīng)過數(shù)據(jù)交換和遠程整合,可實現(xiàn)水利大數(shù)據(jù)資源的信息統(tǒng)一。
4)在線提交??梢酝ㄟ^ HTTP 和 FTP 等渠道,采用自行或后期統(tǒng)一提交的方式,上傳格式不定、布局優(yōu)化、樣式靈活和用戶名不重的文件。
3.2.2 KBase 知識庫管理系統(tǒng)
KBase 知識庫管理系統(tǒng)可以管理海量非結(jié)構(gòu)化數(shù)據(jù),擁有智能信息處理能力,是一個以中文信息處理為特色的國產(chǎn)專用網(wǎng)格數(shù)據(jù)庫管理系統(tǒng),同時還是直接支持網(wǎng)格應用的專用知識庫系統(tǒng),結(jié)構(gòu)圖如圖 2 所示。KBase 知識庫管理系統(tǒng)支持 Windows,Linux 和 Unix 操作系統(tǒng)平臺,同時具有智能中文信息大規(guī)模并發(fā)處理及高效的全文檢索等能力,擁有豐富的數(shù)據(jù)庫管理工具,目前通過嚴格測試,在廣泛的試用中證明具有穩(wěn)定的運行能力。
3.3.1 水利知識服務(wù)平臺服務(wù)門戶
通過對不同專業(yè)領(lǐng)域用戶的調(diào)查分析,為滿足水利及其他相關(guān)行業(yè)用戶的實際需求,水利知識服務(wù)平臺服務(wù)門戶系統(tǒng)在借鑒其他領(lǐng)域應用框架的基礎(chǔ)上,逐步建立起為政府、企業(yè)、科研及個人等用戶提供水利信息查詢,在線咨詢,預覽和下載等服務(wù)。其發(fā)布系統(tǒng)的主要功能是將水利資源庫中的數(shù)據(jù)信息通過發(fā)布模板呈現(xiàn)在 Web 終端上,操作流程如圖 3 所示。
圖 2 KBase 知識庫管理系統(tǒng)體系結(jié)構(gòu)圖
圖 3 水利知識服務(wù)平臺服務(wù)門戶發(fā)布系統(tǒng)流程圖
水利知識服務(wù)平臺服務(wù)門戶系統(tǒng)包含水利資源檢索、多維度導航、在線閱讀、智能關(guān)聯(lián)、個性化定制和系統(tǒng)管理 6 個主要功能。其中水利資源檢索、在線閱讀和個性化定制是基礎(chǔ)常用功能;多維度導航針對所管理的數(shù)據(jù),按照業(yè)務(wù)種類、成果形式、文獻類型等多個維度進行導航分類檢索,大大提高了用戶檢索和查找的效率;智能關(guān)聯(lián)根據(jù)用戶的檢索記錄生成快速智能提示詞,同時為用戶提供當前檢索文獻的相似或同類文獻,提高文獻和信息檢索的廣度;系統(tǒng)管理主要涉及用戶信息的增加、刪除和修改。
3.3.2 水利大數(shù)據(jù)知識資源池
通過水利大數(shù)據(jù)知識資源池,將河北省水利機構(gòu)的內(nèi)部和外部資源進行收集、加工標引和提交,實現(xiàn)水利信息資源的可持續(xù)更新。河北省水利機構(gòu)的內(nèi)部資源是核心數(shù)據(jù),包含文檔、圖件成果、自建數(shù)據(jù)庫、項目信息、業(yè)務(wù)知識、專家?guī)?、科研成果和其他文件;外部資源主要是 CNKI 知識資源庫,以及互聯(lián)網(wǎng)采集和機構(gòu)自有資源。
3.3.3 統(tǒng)一檢索平臺
水利大數(shù)據(jù)統(tǒng)一檢索平臺的功能是對水利大數(shù)據(jù)知識資源池中的內(nèi)部和外部資源,統(tǒng)一進行異構(gòu)檢索、排序和智能關(guān)聯(lián),滿足水利行業(yè)所有用戶對知識資源池中所有資源的檢索、在線閱讀和下載需求,并快速幫助用戶查找需要的信息資源。根據(jù)檢索方式的不同可分為以下檢索:1)單庫檢索,針對某一個數(shù)據(jù)庫進行檢索;2)統(tǒng)一檢索,針對統(tǒng)一檢索平臺及其對接的第三方資源進行一站式檢索;3)全文檢索,根據(jù)用戶需要查找數(shù)據(jù)庫中某個全文報告或成果中的相關(guān)章、節(jié)、段、句、詞等信息,同時還可對其進行統(tǒng)計與分析。
水利文獻信息系統(tǒng)可為水利行業(yè)的管理者、研究者、規(guī)劃設(shè)計者,以及高校師生和廣大社會用戶,搭建一個專業(yè)性和行業(yè)化的文獻查詢、檢索、在線閱讀和下載的服務(wù)平臺[24]。水利文獻信息系統(tǒng)將文獻按照學科及研究方向進行分類,分為水文學、泥沙動力學、水力學等 18 個專欄,每個專欄都有學科相對應的文獻。水利文獻信息系統(tǒng)的建設(shè)不僅提高了水利系統(tǒng)內(nèi)文獻、專著等信息資源的共享程度,在一定程度上將參建單位的特色資源通過引進和自建結(jié)合的方式進行整合,也為用戶提供專業(yè)化的檢索工具,提高了檢索信息的準確率和查全率。
近幾年來,水利科研項目申報是國家科技發(fā)展的重要方式,是我國水利行業(yè)發(fā)展戰(zhàn)略目標、具體方針政策和任務(wù)的主要體現(xiàn),且水利科研項目的申報審批能有效地促進水利行業(yè)的快速發(fā)展[25]。河北省水利科研項目管理平臺可為水利行業(yè)科研人員提供一個專業(yè)了解項目申報文件法規(guī)、網(wǎng)上項目申報、項目審批進度查詢和任務(wù)書管理的綜合服務(wù)平臺,是水利知識服務(wù)平臺的具體應用。河北省水利科研項目管理平臺建設(shè)完成后, 從 2017 年開始至今,有 44 家單位申報了 163 個項目,為水利行業(yè)項目的網(wǎng)絡(luò)化管理提供了一個便捷的平臺。
河北省水利知識培訓平臺是水利基礎(chǔ)知識和專題業(yè)務(wù)培訓系統(tǒng),也是水利知識服務(wù)平臺建設(shè)的典型實例,具體功能結(jié)構(gòu)如圖 4 所示。此培訓平臺是一個集網(wǎng)上注冊和培訓、考試、在線交流、課程選擇、學員綜合管理、階段性和結(jié)業(yè)考試、數(shù)據(jù)統(tǒng)計分析、結(jié)業(yè)證書頒發(fā)等于一體的綜合水利信息化大數(shù)據(jù)平臺,為全面提升河北省水利廳機關(guān)(事業(yè)單位)干部的專業(yè)知識和業(yè)務(wù)水平提供便捷、高效的學習平臺。水利知識培訓平臺上傳的課程共有 4 門,分別為“工程地質(zhì)與水文地質(zhì)基礎(chǔ)知識”“水工建筑物基礎(chǔ)知識”“水力學基礎(chǔ)知識”和“水文水資源基礎(chǔ)知識”。在水利知識培訓平臺開放期間,截止到 2019 年 11 月共有 238 人注冊、學習相關(guān)水利知識。
圖 4 河北省水利知識培訓平臺功能結(jié)構(gòu)圖
目前,大數(shù)據(jù)技術(shù)在金融、教育、商業(yè)等多個領(lǐng)域已取得一定的成果,但由于水利行業(yè)與其他行業(yè)聯(lián)系緊密,信息資源龐雜,因此,水利知識服務(wù)平臺與其他領(lǐng)域數(shù)據(jù)平臺的建設(shè)相比更為復雜。協(xié)調(diào)各領(lǐng)域、部門的利益,有效整合和集成共享多來源、多途徑的水利數(shù)據(jù)信息資源,是構(gòu)建河北省水利知識服務(wù)平臺的基礎(chǔ)。河北省水利知識服務(wù)平臺的建設(shè),不僅為河北省水利行業(yè)人員,更為其他省份水利行業(yè)的科研管理人員,以及廣大社會用戶,搭建一個文獻查詢、檢索、在線閱讀和下載的服務(wù)平臺,與其他綜合性查詢網(wǎng)站相比,更加專業(yè)化和行業(yè)化,大大提高了水利行業(yè)數(shù)據(jù)的資源共享程度。河北省水利知識培訓平臺的建設(shè)與廣泛應用有效促進了河北省與其他省份水利行業(yè)的協(xié)同創(chuàng)新發(fā)展。今后,在水利數(shù)據(jù)整合研究基礎(chǔ)上,將更深入研究水利數(shù)據(jù)之間,以及水利數(shù)據(jù)與其他行業(yè)數(shù)據(jù)之間的復雜關(guān)系,促進學科與行業(yè)的融合發(fā)展。