廣西壯族自治區(qū)科學技術情報研究 廣西 南寧 530022
隨著通信技術的快速更迭,社會已經全面進入到5G時代,大數據技術的應用越來越廣泛和普遍,為各行各業(yè)賦予發(fā)展的新動能。對科技情報研究單位來說,充分借助新技術并發(fā)揮好科技信息大數據的優(yōu)勢是新時期內科技情報研究服務工作的重點內容。為此,針對科技信息大數據在情報研究服務中的應用問題進行分析和研究是十分必要的。
科技信息大數據主要是圍繞科研著作、專利、研究報告等科技信息而產生的數據。隨著網絡通訊技術和數據技術的發(fā)展,科技信息也不再局限于紙質的方式,而是越來越多地以電子信息的方式產生、傳輸、呈現(xiàn)。經過一段時間的累計后,這些電子式科技信息會形成一定規(guī)模的數據平臺或數據庫。工作人員可以通過對這些科技信息數據進行分析研究來獲取所需要的科技情報。由于越來越多的科研人員傾向于以電子信息的方式來進行科學技術研究工作,因此應用科技信息大數據的方式來獲取科技情報信息更容易獲取到核心的數據,并且這些數據比紙質數據更新鮮更全面,更容易從中發(fā)現(xiàn)科技發(fā)展的趨勢。從具體的特征來看,科技信息大數據相對于傳統(tǒng)的數據具有以下特征:一是信息量大,數據平臺或數據庫規(guī)模大;二是數據增加更快,呈指數增長模式;三是數據維度更全面多元,不僅包括本專業(yè)的數據,還涵蓋了相關專業(yè)的數據;四是數據具有多源異構性,同一個信息有不同的來源;五是數據新鮮度高,隨著時間的推進和科技的發(fā)展,能夠及時獲取到新鮮數據,使科技情報數據具有更強的時效性。
以往科技情報服務工作主要通過科技論文、圖書報刊等紙質文獻的方式來獲取科技信息,從中梳理出具有價值的科技情報。隨著信息技術和數據技術的應用,科技情報工作模式發(fā)生了很大的改變。情報研究服務工作應保持與時俱進,結合大數據技術特征積極調整工作模式,使大數據技術能夠在情報研究服務工作中發(fā)揮出積極的效用。
首先,利用大數據技術對科技信息進行采集、處理、儲存和應用。對已經建成的科技專業(yè)平臺數據庫以及機構化或非結構化的數據進行采集,動態(tài)監(jiān)測科技數據流并采集相關信息,對采集的信息進行清洗、格式轉換以及關聯(lián)度和有效性分析。借助云計算技術建立科技大數據云存儲系統(tǒng),為海量增長的科技數據資源提供儲存或擴展的空間,隨著科技數據的不斷積累,逐步形成清洗的大數據存儲結構。利用大數據技術、機器學習技術以及各種數學模型,對多種來源不同結構的數據進行計算、分析、比較,從而實現(xiàn)對科技數據的深度挖掘,為科技情報研究服務工作提供技術支持。
其次,利用大數據技術完善科技情報服務體系。根據不同的用戶需求建立起各自的科技情報服務需求模型,提高科技情報服務產品及情報服務的精細化水平。利用大數據技術建立科技情報研究服務云平臺,基于服務云平臺建立完善的科技數據和情報成果管理共享機制。通過對用戶提供科技情報研究服務產品,提升科技情報研究服務的便利性、規(guī)范性和權威性。為用戶提供數據的應用程序接口,依托學生期刊、報紙報刊、網絡科技新媒體平臺,做好科技情報數據和情報研究成果的傳播。利用大數據技術探索更多的產品服務模式,提高科技情報服務覆蓋的光度。
第三,利用大數據技術為科技情報服務工作提供可靠的保障支持體系。建立統(tǒng)一的數據采集、儲存、共享和利用標準,及時針對數據問題給出反饋和響應,合理解決數據問題。通過大數據技術的支持,逐漸形成穩(wěn)定的科技情報研究服務可持續(xù)工作機制,形成日益完善的科技數據資源基礎服務環(huán)境,保證科技研究情報服務平臺穩(wěn)定運行。
數據抽取技術:隨著互聯(lián)網技術的普及應用,網絡上的信息數據也越來越多,信息數據量的增多一方面使數據來源更多,另一方面也存在很多的偽信息或對目標無效的信息。通過數據抽取技術可以幫助情報研究人員在海量的信息中快速篩選出符合自己需要的信息,節(jié)省時間和精力,提高情報研究服務工作效率。
多源異構數據融合技術:數據的開發(fā)和共享必須打破傳統(tǒng)數據孤島的瓶頸,將工業(yè)業(yè)務數據和互聯(lián)網數據之間的壁壘打通。通過多源異構數據的融合,將格式不同、開發(fā)框架不同、語義不同、關聯(lián)關系不同的數據在統(tǒng)一的框架內進行集成和整合。傳統(tǒng)的技術方法是通過自定義或定義標準來協(xié)同數據,但在整合過程中需要開放源代碼或者數據庫支持。隨著大數據技術的發(fā)展,如今已經出現(xiàn)了數據接口和計算分析平臺,不需要底層數據庫和源代碼開放就能夠實現(xiàn)數據接口自動生成,并通過多種內置算法對數據源進行獲取和分析。
用戶畫像和用戶需求分析技術:通過用戶數據來構建用戶畫像,利用大數據技術還原用戶的旅程思維,挖掘用戶決策歷程,從中分析用戶的潛在需求,實現(xiàn)針對某種標簽項下的用戶進行精準信息推送,為用戶提供更符合自身需求的服務,使科研情報研究服務信息實現(xiàn)更有效的觸達,提高科研情報工作的精準性和用戶體驗度。
新的時代和技術背景下,科技情報研究服務工作也面臨新的挑戰(zhàn)。積極轉變工作思路,調整和優(yōu)化工作模式,將大數據技術的優(yōu)勢充分發(fā)揮到科技情報研究服務工作中,更好地發(fā)揮出科技情報單位在科技研究和發(fā)展過程中的積極作用,釋放出科技的引擎動力,推動行業(yè)、國家和社會蓬勃發(fā)展。