袁東鋒 南陽理工學院
隨著社會科學技術的迅猛發(fā)展和國民經濟的逐步提升,基于LBS功能基礎上的個人移動電子產品已經全民普及,企業(yè)及個人電子商務業(yè)務蓬勃發(fā)展,電子商務各類形勢發(fā)展迅猛,諸如B2B、O2O、B2C等不同端對端模式;企業(yè)發(fā)展盈利模式也由渠道為王轉向流量為王。各行各業(yè),交通、運輸、信息、教育、營銷等離不開對于大數據的依賴。本文將從大數據時代的背景分析、大數據時代計算機信息處理的核心關鍵點、大數據時代發(fā)展前景三方面進行系統的論證和闡述。
大數據,是互聯網時代下的產物,是對浩瀚的互聯網中海量數據和信息,進行系統化、科學化、準確化的抓取、保存、分析和管理。大數據具有四大特點,數據海量化、數據流動快速化、數據類型多樣化以及價值密度低,數量級也產生了極大的變化,由之前的TB轉化為現有的ZB,IZB達到1024PB。以前,銷售商品需要有實體店鋪,雇人員銷售,且只能服務于周圍3公里內有效居民。現在只需要一臺筆記本甚至一臺手機,既可以完成尋找客戶、客戶咨詢、銷售達成、付款到賬等全部流程;以前,企業(yè)無法了解用戶的真實需求和喜愛,新品的研發(fā)和推廣,靠的是頂級設計師或決策者的經驗與判斷,現在可以通過大數據了解用戶的基本情況,對其進行用戶畫像和數據分析,進而研發(fā)新品并進行精準推送,讓企業(yè)的發(fā)展更加精準和良性化??梢哉f,大數據時代為企業(yè)和個人提供了更多可能性、變化性、便捷性。大數據時代的技術核心就是數據的快速采集、穩(wěn)定保存、精準的分析和科學化管理,但這些都離不開強大而成熟的計算機信息處理技術,沒有良好的硬件設備和軟件操作人員,再多的海量數據也會成為無用的字數。如果大數據不能實現計算機信息處理的正確性、科學化,出現紕漏或失誤,更將帶來錯誤的數據分析結論,反而不利于應用者。
大數據不同于其他行業(yè)或工作,大數據的重要意義可以改變和顛覆一個行業(yè)。但大數據同時也是一項高科技、高技術、高標準、高要求的技術產業(yè),對于人才的需求和搶奪正在白熱化。近年來,我國雖然在信息技術方面發(fā)展迅速,但在人才的培養(yǎng)和教育上,卻依然存在諸多問題和缺陷:現有教學系統和教學資料滯后于社會需求;高端信息技術人員急缺,自主研發(fā)能力較弱;高端技術人才集中在杭州、上海、北京等重點城市,其他城市人員急缺。要想大數據不斷的升級和發(fā)展,必須對引進更為高端的技術人才,與國內外的高端院?;驅I(yè)進行聯合教學或交換式教學,向世界一流和知名企業(yè)學習優(yōu)秀的計算機信息技術處理方法和管理模式。
過去我們理解大數據,更多的理解為只是數據的抓取、分析、存儲和輸出應用。但實際上,在大數據的時代中,隨著云計算、物聯網、區(qū)域塊鏈接等技術的不斷發(fā)展和應用,大數據前景應用將更為廣泛和有意義的。但所有的應用,都是為人類社會的發(fā)展和進步而服務的。尤其是遺傳算法和數據的高效索引,都為大數據的應用提供堅實的基礎。遺傳算法,是一種隨機的搜索方式,可以讓搜索更為自主化和便捷化;高效索引,重點在于聚簇索引以及互補性聚簇索引兩方面內容,通過不同的索引列和順序,提升索引的高效性。
云計算的發(fā)展意味著大數據及大數據信息處理技術已經非常成熟和穩(wěn)定。云計算在數據的處理上具有開放性、便捷性、廣泛性的特點,解決了大數據的數據海量、內容復雜、處理難度大的問題,克服了傳統計算機處理中局限性的缺陷。云計算是指將海量數據進行集中,并于云平臺和各種電子設施上進行交換處理和存儲,用戶可利用平臺對所需信息進行上傳和下載。云計算的應用和產生,為大數據發(fā)展的更為迅速和有效。加速對數據的處理,提升數據的安全,使大數據可以應用到各行各業(yè)和各個領域當中,真正引領時代的發(fā)展和進步。
大數據時代,最顯著的特征,就是各種數據呈現海量是井噴。各種數據層出不窮,大數據具備信息量大、信息復雜、維度多的特點。對于大數據的抓取并不難,難點在于如何在海量的信息數據中,能夠根據相應的訴求進行準確的抓取。這就要求,必須要有專業(yè)的產品經理和技術人員,對數據應用需求進行數據分析,并采取可視化技術,對感情、空間、時間、網絡、各序列號進行分析,在過程中可采取拓撲分析、幾何統計分析、編碼分析等分析手段。抓取準確的數據后,要對數據進行精準的分析,分析數據呈現出的規(guī)律,內涵和存在的實際價值和意義。分析的過程中,可以采取分類分析和聚類分類分析等各種方法。分類分析,是指根據數據點,進行假設點的系統架構,預測有可能產生的行為;聚類分析,是指將所有不同分組的數據對象,進行集中式處理和分析,便于數據的整體分析和深度挖掘。
數據的存儲具有極高的價值,由于大數據具有信息數據量大、信息處理復雜的特點。對于大數據的存儲,絕不是簡單的進行保存即可,而是應該科學化、合理化、系統化的對已經抓取的數據,進行精準的分類和處理。原有的GFS系統(文件系統技術)已經不能滿足大數據時代的需求,分布型的數據存儲技術,則是在GFS基礎上發(fā)展出來的新技術。而列存儲則是分布型存儲技術的核心,它將列作為基本的單位,然后進行列存儲。能夠快遞的加工、計算海量數據,節(jié)省磁盤空間。
大數據時代,互聯網技術異常發(fā)達,由于信息的傳遞性和海量性,各類知識、理念都可以不限時間、地點進行傳播。大量的企業(yè)和個人也擁有先進的信息處理技術,各種黑客組織和個人都具有侵入各類信息技術系統的能力,信息和數據被盜竊的危險性極高。由于政府、機關、金融、商業(yè)等重點行業(yè)的大數據信息涉及到社會經濟安全和國民的個人生活隱私,大數據的安全性、可靠性和穩(wěn)定性及其重要。為此,必須要保證大疏忽信息的絕對安全。要引進專業(yè)和先進的人才,建立計算機安全保護系統;要采用最先進的設備,保護信息的安全保存;要定期對系統進行檢測和升級,提升防護系統的安全指數。
結束語:大數據時代已經來臨,大數據對于國民經濟的發(fā)展和人們日常生活都具備極其深遠的影響。大數據對企業(yè)的經營管理、運營模式,國民社會形態(tài),居民日常生活都起到了至關重要的作用。大數據可以為企業(yè)的經營提供更為精準的可靠分析,可以為居民提供更加便捷的生活方式,更可以為國家的發(fā)展和進步提供交通、運輸、信息處理等各類廣泛的應用和幫助。對于大數據的信息處理是大數據應用的關鍵,如何準確獲取數據、分析數據、應用數據,能大數據的優(yōu)勢和特點發(fā)揮到極致。在持續(xù)的信息處理技術提升和優(yōu)化的過程中,大數據時代必將發(fā)展更為迅猛,為社會經濟發(fā)展做出貢獻。