王延紅
非結構化數據是一種新的理念,由美國最先提出,后來我國在21世紀初引入大數據的概念。非結構化數據是指數據的結構存在缺陷或者是不完全的,沒有原始數據,不能從數據庫中查到,無法進行計算與整合。非結構化數據包括文本、圖片以及音頻等[1]。它是一個長期的、多種多樣的以及大規(guī)模的數據庫。相比于結構化數據,非結構數據的處理難度增大,對管理員的要求更高,需要管理員具備一定的IT知識,掌握先進的IT技術,擁有更先進的思想。
圖書館的非結構化數據的對象主要針對學校內部人員。比如景德鎮(zhèn)陶瓷大學的圖書館,運用了智能系統,對進入圖書館的人員設有門檻,需要刷卡才能進入,圖書館的開放對象是老師與學生。所以,可以對這兩者進行調查以及收集相關數據,對圖書館非結構化數據開展分析與探討,了解非結構化數據在高校的發(fā)展現狀[2]。
相比于結構化數據,非結構化數據的處理難度會更高。原因在于非結構數據缺乏統一的數據庫以及準則。我們在查詢以及獲取時缺乏對比卡,很多數據都是伴隨使用的過程中產生的最新數據,而且沒有規(guī)律性,利用計算機處理數據難度就直線上升了。
一方面,圖書管理員的綜合能力不強。非結構數據的處理對管理員的要求較高,需要有良好的操作能力。普通的圖書管理員一般只需對數據入庫和查詢,處理的大部分為結構化數據。另一方面,圖書館的設備不夠先進。圖書館的設施一般都是老舊的機器,對數據處理的計算機操作性能不高?,F代技術的進步,非結構數據處理對圖書館的設備要求進一步提升。所以技術方面,圖書館的非結構化數據存在一定的缺陷。
非結構數據的處理對技術有更高的要求,從我國的現狀分析,缺乏一定的資金支持。大數據的規(guī)模量大,設備比較先進,需要大量的資金支持。然而,一般情況下,政府提供的資金是有限的,一般用于圖書館的建設與修葺,設備需要圖書館管理者籌款。而且圖書館大多數為紙質資源,大數據更多的是處理電子資源。而紙質資源到電子資源需要大量的技術人員以及設備,如果沒有資金支持,非結構化數據處理工作就很難開展。
非結構數據的另一大缺陷為管理理念。傳統的管理理念,是對紙質資源的整合。一方面,圖書管理者將大量的資金都投入到紙質書本上,追求圖書的質量和數量。另一方面,電子資源。圖書館的重心是紙質資源,對電子資源了解頗少。根據目前的趨勢分析,電子資源的引用量已經超過紙質資源。互聯網的推進,師生更加致力于電子資源的引進。但是,目前圖書管理者的理念較為落后,還未意識到電子資源的必要性,很難推進非結構化數據的工作。
大數據環(huán)境下,圖書館的資金支持來源于兩個方面。一方面是政府的支持,大數據環(huán)境必定會帶來科技的革命,對政府要求也會越來越高。所以,對于圖書館的技術以及設施,政府都將會大量投入,減輕了非結構化數據處理的壓力。另一方面,社會的支持。當下,社會對于大數據的理念是接受并且支持的,所以發(fā)展大數據理念,圖書管理者可以利用社會的支持,為非結構化數據處理工作提供一定的保障。
第一,技術人員的引進。大數據環(huán)境下,數據處理者有更高的操作的水平,圖書館將引進優(yōu)秀的人才,對非結構化數據處理工作會比較輕松,而且在新的數據面前,應變處理能力會更強。第二,技術設備的引進。圖書館若想在大數據環(huán)境下簡便非結構化數據處理工作,就必須將引進電子設備,而且必須是最先的技術。大數據是一種全新的技能,對于非結構數據是利大于弊。在這種環(huán)境下,數據處理工作將會簡潔,處理難度也會降低。
第一,管理者必須適應大數據帶來的改變,接受這種新理念。第二,管理者需要引導老師與學生學會使用大數據的功能,并且對非結構數據有具體的操作規(guī)范。第三,引進電子資源。一方面將現有的紙質資源轉化為電子資源,供數據處理者查詢。另一方面引進更為先進的電子資源,對非結構化數據的破解提供更方便的渠道,讓數據處理工作不再復雜。
大數據環(huán)境改變了人類的生活,也改變了高校的數據處理工作,尤其表現在非結構化數據。原始的環(huán)境下,非結構化數據處理強度大、技術達不到要求以及缺乏資金。而大數據環(huán)境下,對各個方面都有較大的空間的提升,為非結構化數據處理工作提供更為簡便的處理渠道。所以,相信在大數據環(huán)境下,高校圖書館的非結構化數據工作必將發(fā)展得更好。