羅偉文
目前我國(guó)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,數(shù)據(jù)處理工作量大大提升,這也對(duì)信息管理工作提出了新的挑戰(zhàn)。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,計(jì)算機(jī)數(shù)據(jù)庫(kù)不僅需要增加信息處理速度,還需要在龐大的數(shù)據(jù)中對(duì)于有效信息進(jìn)行篩選與提取。近年來(lái)我國(guó)已經(jīng)針對(duì)大數(shù)據(jù)背景下信息管理工作的轉(zhuǎn)變進(jìn)行了計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)化與升級(jí),本文也將對(duì)此進(jìn)行分析并探討其應(yīng)用模式。
一、大數(shù)據(jù)背景下計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)用現(xiàn)狀分析
大數(shù)據(jù)背景下信息管理工作的首要特征便是龐大的信息處理量,在大數(shù)據(jù)時(shí)代每天所產(chǎn)生的數(shù)據(jù)不可勝數(shù),這也導(dǎo)致信息管理工作需要面對(duì)大量的數(shù)據(jù)。而且隨著信息類型的增加,現(xiàn)有的計(jì)算機(jī)數(shù)據(jù)庫(kù)所能處理的信息類型愈發(fā)顯得有限,大量數(shù)據(jù)難以得到高效的處理。而大數(shù)據(jù)背景下,大量的有效信息正是包含在龐大的數(shù)據(jù)之中,因此有效信息的提取顯得尤為關(guān)鍵。大數(shù)據(jù)背景下信息管理工作的另一個(gè)特征便是高速化,由于大數(shù)據(jù)時(shí)代信息的爆炸式增長(zhǎng),信息管理工作必須要快速完成信息的收集整合及分析工作,這樣才可以跟得上大數(shù)據(jù)背景下新信息產(chǎn)生及擴(kuò)散的速度。但由于數(shù)據(jù)種類的增加及涉獵范圍的愈發(fā)廣泛,信息處理工作量也顯著提高,信息處理模式也由因果關(guān)系分析向相關(guān)性分析轉(zhuǎn)變。近年來(lái)我國(guó)研究人員基于大數(shù)據(jù)背景下的信息管理工作特點(diǎn)進(jìn)行了計(jì)算機(jī)數(shù)據(jù)庫(kù)的優(yōu)化,但是目前我國(guó)的計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)依舊存在諸多的問(wèn)題,限制了信息管理工作的效率,不能滿足大數(shù)據(jù)背景下人們對(duì)于信息管理工作的需求。
首先目前我國(guó)信息管理工作所使用的計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)的信息存儲(chǔ)結(jié)構(gòu)依舊沿用傳統(tǒng)的模式,導(dǎo)致不能在存儲(chǔ)階段對(duì)于不同類別數(shù)據(jù)進(jìn)行合理的劃分并分別存儲(chǔ)。信息存儲(chǔ)結(jié)構(gòu)的老化也影響著后期的信息篩選及提取工作,傳統(tǒng)的信息存儲(chǔ)模型使得相關(guān)信息提取工作較為困難,同時(shí)信息篩選算法也沒(méi)有進(jìn)行升級(jí),傳統(tǒng)的信息篩選模式不僅效率低下而且篩選范圍較窄。由于信息篩選及提取工作的問(wèn)題,在進(jìn)行后續(xù)信息數(shù)據(jù)分析處理時(shí)當(dāng)前的計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)也不能真正做到對(duì)于所有相關(guān)數(shù)據(jù)的全面分析,且大量的數(shù)據(jù)處理工作依舊建立于因果關(guān)系分析之上,大數(shù)據(jù)中包含的有效信息不能被真正利用。
另外目前我國(guó)信息管理工作人員只重視大數(shù)據(jù)背景下信息的分析處理工作優(yōu)化,往往忽視了信息安全問(wèn)題,導(dǎo)致目前信息管理計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)的安全防護(hù)技術(shù)也沒(méi)有進(jìn)行及時(shí)的升級(jí),數(shù)據(jù)庫(kù)系統(tǒng)安全性得不到保障。
二、大數(shù)據(jù)背景下信息管理中計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)用探析
首先計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)需要應(yīng)對(duì)大數(shù)據(jù)時(shí)代多種類、大規(guī)模的數(shù)據(jù)存儲(chǔ)工作,而隨著云存儲(chǔ)技術(shù)的不斷完善,目前計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)的數(shù)據(jù)存儲(chǔ)已經(jīng)可以利用云存儲(chǔ)技術(shù)進(jìn)行大數(shù)據(jù)的存儲(chǔ)與提取。其結(jié)構(gòu)主要由云存儲(chǔ)、云計(jì)算及檢索模塊組成,信息管理工作所需要的數(shù)據(jù)會(huì)被存儲(chǔ)于各個(gè)云存儲(chǔ)節(jié)點(diǎn)之中,計(jì)算機(jī)數(shù)據(jù)庫(kù)在引入了云存儲(chǔ)技術(shù)之后,不同的數(shù)據(jù)庫(kù)系統(tǒng)通過(guò)網(wǎng)絡(luò)系統(tǒng)連接,各個(gè)數(shù)據(jù)庫(kù)間的數(shù)據(jù)也實(shí)現(xiàn)了連通,這樣也使得數(shù)據(jù)庫(kù)系統(tǒng)所包含的數(shù)據(jù)種類更加豐富。而在數(shù)據(jù)信息的存儲(chǔ)過(guò)程中,計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)還應(yīng)對(duì)相關(guān)檔案進(jìn)行分類整理存儲(chǔ),并利用回歸方程對(duì)檔案分布密度進(jìn)行前期的計(jì)算,藉此優(yōu)化數(shù)據(jù)存儲(chǔ)的分布,為后期的信息提取及分析工作提供便利。
在利用云存儲(chǔ)技術(shù)解決了大數(shù)據(jù)背景下計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)數(shù)據(jù)存儲(chǔ)難題后,目前技術(shù)人員還對(duì)信息的提取模式進(jìn)行優(yōu)化。區(qū)別于以往的因果關(guān)系數(shù)據(jù)檢索模式,為了應(yīng)對(duì)大數(shù)據(jù)背景下多種類數(shù)據(jù)的信息提取,現(xiàn)階段通常建立于數(shù)據(jù)聯(lián)合密度函數(shù),對(duì)于關(guān)聯(lián)數(shù)據(jù)進(jìn)行提取,同時(shí)利用并行閉頻繁項(xiàng)集挖掘技術(shù)進(jìn)行相關(guān)數(shù)據(jù)的全面挖掘提取。在云存儲(chǔ)的基礎(chǔ)上,云計(jì)算技術(shù)可以有效提升數(shù)據(jù)的處理速度,而虛擬化技術(shù)的引入也可以節(jié)約技術(shù)的應(yīng)用成本。而在大數(shù)據(jù)背景下數(shù)據(jù)的種類的規(guī)模變化難以控制,數(shù)據(jù)庫(kù)系統(tǒng)也需要增強(qiáng)自身的擴(kuò)展性以適應(yīng)未來(lái)的數(shù)據(jù)處理工作。
SQL是目前最主要的關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言,其可以通過(guò)結(jié)構(gòu)化查詢語(yǔ)言實(shí)現(xiàn)對(duì)于多個(gè)數(shù)據(jù)庫(kù)信息的查詢,而且通過(guò)結(jié)構(gòu)化查詢語(yǔ)言可以進(jìn)行嵌套,這也讓SQL數(shù)據(jù)庫(kù)技術(shù)擁有更為強(qiáng)大的功能,但是在大數(shù)據(jù)時(shí)代信息量的爆炸式增長(zhǎng)及數(shù)據(jù)間關(guān)聯(lián)性的降低使得SQL這種關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言應(yīng)用效果大打折扣。NoSQL數(shù)據(jù)庫(kù)可以有效改善SQL數(shù)據(jù)庫(kù)存在的不足,NoSQL是一種非關(guān)系數(shù)據(jù)庫(kù),其在工作過(guò)程中不需要強(qiáng)制改變數(shù)據(jù)格式,可以同時(shí)對(duì)多種格式及類型的數(shù)據(jù)進(jìn)行查詢與分析,較之于SQL數(shù)據(jù)庫(kù)擁有更高的信息處理效率。例如在社交網(wǎng)站上的用戶動(dòng)態(tài)數(shù)以億計(jì),SQL數(shù)據(jù)庫(kù)難以高效完成有效信息的查詢。而NoSQL數(shù)據(jù)庫(kù)采用通過(guò)摒棄數(shù)據(jù)因果關(guān)系分析而實(shí)現(xiàn)了關(guān)聯(lián)性查詢與分析,不僅提升了數(shù)據(jù)查詢速度還提升了計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)的信息兼容性,便于多種類數(shù)據(jù)的介入,讓計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)可以更好地應(yīng)對(duì)大數(shù)據(jù)時(shí)代的工作需求。
NewSQL數(shù)據(jù)庫(kù)則是在具有NoSQL數(shù)據(jù)庫(kù)對(duì)海量數(shù)據(jù)的高效處理能力的同時(shí)支持傳統(tǒng)的ACID及SQL數(shù)據(jù)庫(kù)技術(shù),同時(shí)具有兩者的優(yōu)點(diǎn)因此有著廣闊的發(fā)展前景。
其次分布存儲(chǔ)技術(shù)的應(yīng)用也提升了計(jì)算機(jī)數(shù)據(jù)庫(kù)的工作效率,這種技術(shù)利用網(wǎng)絡(luò)專線或高速的網(wǎng)絡(luò)同時(shí)將多個(gè)數(shù)據(jù)庫(kù)與總服務(wù)器完成搭建,形成一個(gè)總的數(shù)據(jù)庫(kù)傳輸網(wǎng)絡(luò),這種狀態(tài)使得看似分離的數(shù)據(jù)庫(kù)在整體上形成了一個(gè)邏輯上的統(tǒng)一,不僅可以解決大批量數(shù)據(jù)存儲(chǔ)的問(wèn)題,而且多個(gè)服務(wù)器的共同服務(wù)實(shí)現(xiàn)了數(shù)據(jù)的高度流通,縮減了數(shù)據(jù)處理的時(shí)間,使大數(shù)據(jù)平臺(tái)的高效性充分的發(fā)揮出來(lái)。在分布存儲(chǔ)技術(shù)的基礎(chǔ)之上,目前云計(jì)算技術(shù)也得到了長(zhǎng)足的發(fā)展并被廣泛應(yīng)用于計(jì)算機(jī)數(shù)據(jù)庫(kù)之中,云計(jì)算技術(shù)是通過(guò)將龐大的數(shù)據(jù)分析程序分割為無(wú)數(shù)個(gè)子程序并由不同的服務(wù)器單獨(dú)完成子程序的運(yùn)算并反饋于用戶終端,完成整體運(yùn)算分析工作。基于分布存儲(chǔ)網(wǎng)絡(luò)計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)可以輕易地實(shí)現(xiàn)云計(jì)算網(wǎng)絡(luò)的搭建,這樣數(shù)據(jù)分析處理速度也可以大大提升,滿足大數(shù)據(jù)時(shí)代下龐大的數(shù)據(jù)處理工作要求?;诖髷?shù)據(jù)關(guān)聯(lián)性弱、數(shù)據(jù)量龐大的特點(diǎn),計(jì)算機(jī)數(shù)據(jù)庫(kù)在云計(jì)算使用時(shí)也需要改變傳統(tǒng)的數(shù)據(jù)庫(kù)模式,目前主流采用的是Hbase數(shù)據(jù)庫(kù),這是一個(gè)非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫(kù),目前在智能城市工程、電商平臺(tái)日常工作中得到了使用。
在大數(shù)據(jù)時(shí)代,在實(shí)現(xiàn)了數(shù)據(jù)的大批量存儲(chǔ)和傳輸?shù)那闆r下,信息的安全保證就被提到了一個(gè)更加重要的位置上,因?yàn)橐坏┬畔⒊霈F(xiàn)泄漏,就是大規(guī)模的信息泄漏,這會(huì)造成非常嚴(yán)重的影響。二在信息安全的技術(shù)中,采用數(shù)據(jù)假幣的方法對(duì)不同數(shù)據(jù)庫(kù)在計(jì)算和存儲(chǔ)的流程中均進(jìn)行了加密。例如,加入用戶密碼,或采用不可逆的MD5算法,通過(guò)往復(fù)循環(huán)的計(jì)算,實(shí)現(xiàn)用戶身份認(rèn)證。另外,在使用云存儲(chǔ)技術(shù)的同時(shí)可以引入安全測(cè)量模塊,同時(shí)要賦予不同用戶不同的權(quán)限等級(jí)從而確保信息安全。而在實(shí)際工作過(guò)程中如果操作人員需要對(duì)某些特定數(shù)據(jù)進(jìn)行訪問(wèn),其需要經(jīng)過(guò)管理人員的許可方可進(jìn)行操作,這樣可以進(jìn)一步提升計(jì)算機(jī)數(shù)據(jù)庫(kù)的安全性。另外管理人員需要對(duì)計(jì)算機(jī)數(shù)據(jù)庫(kù)的訪問(wèn)加以記錄,并定期進(jìn)行系統(tǒng)信息安全檢查。
三、結(jié)束語(yǔ)
結(jié)合大數(shù)據(jù)背景下數(shù)據(jù)量大、數(shù)據(jù)種類多、網(wǎng)絡(luò)安全性差等特點(diǎn),計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)首先需要結(jié)合云存儲(chǔ)優(yōu)化信息存儲(chǔ)模式同時(shí)優(yōu)化數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)、優(yōu)化數(shù)據(jù)提取算法,使相關(guān)數(shù)據(jù)挖掘提取更加全面,還要加強(qiáng)數(shù)據(jù)的相關(guān)性分析以提升信息處理速度,另外還要加強(qiáng)信息安全管理,使計(jì)算機(jī)數(shù)據(jù)庫(kù)系統(tǒng)真正滿足大數(shù)據(jù)背景下的信息管理工作需求。