羅 興
(江西財(cái)經(jīng)大學(xué) 軟件與通信工程學(xué)院,江西 南昌 330032)
大數(shù)據(jù)及其科學(xué)問(wèn)題研究
羅 興
(江西財(cái)經(jīng)大學(xué) 軟件與通信工程學(xué)院,江西 南昌 330032)
大數(shù)據(jù)的增長(zhǎng)幅度,已經(jīng)遠(yuǎn)遠(yuǎn)超出了人們的預(yù)期,同時(shí)對(duì)大數(shù)據(jù)的處理也存在著巨大的難度。所以,處理大數(shù)據(jù)任重而道遠(yuǎn)。文章對(duì)大數(shù)據(jù)進(jìn)行了科學(xué)的分析和思考,主要從大數(shù)據(jù)的生成條件、組成結(jié)構(gòu)和資源出處等3個(gè)方面進(jìn)行探討,以便有效地提高大數(shù)據(jù)的利用率。
大數(shù)據(jù);科學(xué)應(yīng)用;探討問(wèn)題;技術(shù)方針
什么是大數(shù)據(jù)呢?大數(shù)據(jù)是在一定的時(shí)間內(nèi)用普通工具無(wú)法衡量數(shù)量并分析的信息,其規(guī)模是不斷發(fā)生變化的,不確定因素很多。所以,對(duì)大數(shù)據(jù)的研究要借助科學(xué)技術(shù),并且進(jìn)行分析和思考,以便形成新的數(shù)據(jù)。利用科學(xué)技術(shù)進(jìn)行分析,將其與人類(lèi)的生活所涉及的信息進(jìn)行融合,形成更加多樣化的內(nèi)容,將會(huì)使數(shù)據(jù)庫(kù)不斷壯大,數(shù)據(jù)庫(kù)則承擔(dān)著極為重要的角色。在對(duì)信息進(jìn)行合理規(guī)劃、整合的過(guò)程中,要合理地利用數(shù)據(jù)庫(kù)和科學(xué)研究手段,充分挖掘其應(yīng)用價(jià)值,并且創(chuàng)造新的價(jià)值。當(dāng)然,對(duì)大數(shù)據(jù)的研究也面臨著諸多挑戰(zhàn),還有許多問(wèn)題需要解決。
1.1 不同形態(tài)的噪聲
一般情況下,大數(shù)據(jù)是由很多不同形式的數(shù)據(jù)組成的,不是單一化的,對(duì)其展開(kāi)的研究更多的是根據(jù)流動(dòng)的動(dòng)態(tài)數(shù)據(jù)進(jìn)行研究分析的[1]。因此,在處理數(shù)量龐大的數(shù)據(jù)時(shí),這些原始數(shù)據(jù)必然會(huì)產(chǎn)生不同形態(tài)的噪聲;與此情況之下,在進(jìn)行整合數(shù)據(jù)的時(shí)候,會(huì)發(fā)現(xiàn)大量數(shù)據(jù)本身的缺點(diǎn)或者在整理過(guò)程中設(shè)備突然壞掉也會(huì)極大地影響數(shù)據(jù)的精準(zhǔn)度并產(chǎn)生數(shù)據(jù)噪聲。這些原因,主要來(lái)自多個(gè)方面,如:(1)大數(shù)據(jù)的組成部分多種多樣,有很多的不確定因素,并且在不同環(huán)境下,存在的數(shù)據(jù)是不一樣的;(2)在進(jìn)行多方面的應(yīng)用時(shí),對(duì)數(shù)據(jù)的準(zhǔn)確性要求很高,但是,在大數(shù)據(jù)庫(kù)中,有非常多的數(shù)據(jù)需要篩選,所以在提取信息的過(guò)程中,數(shù)據(jù)來(lái)源多樣,且數(shù)量龐大,也會(huì)導(dǎo)致數(shù)據(jù)的冗余。
1.2 新時(shí)代大數(shù)據(jù)的表現(xiàn)形式
在當(dāng)今時(shí)代,大數(shù)據(jù)可以以不同的表現(xiàn)手法表現(xiàn),但也存在著致命的弱點(diǎn)。這些數(shù)據(jù)并不能直接、清晰地表現(xiàn)在人們面前,因此體現(xiàn)不出它的價(jià)值所在。大數(shù)據(jù)傳統(tǒng)的觀念和固定的模式并未消失,所以,在大數(shù)據(jù)的傳達(dá)方面仍存在著很多弊端,這會(huì)影響數(shù)據(jù)的最終成效。我們能做的就是要把大數(shù)據(jù)和原來(lái)的來(lái)源進(jìn)行區(qū)分,整理規(guī)劃,這樣一來(lái),會(huì)更有利于后期資料的整合。在這個(gè)過(guò)程中,如果造成數(shù)據(jù)泄漏,又會(huì)給使用者帶來(lái)新的問(wèn)題。因此困難重重,問(wèn)題層出不窮[2]。這些問(wèn)題也會(huì)阻礙大數(shù)據(jù)的發(fā)展。
1.3 大數(shù)據(jù)的儲(chǔ)存空間應(yīng)如何規(guī)劃
大數(shù)據(jù)的存儲(chǔ)方式也有可能是阻礙其發(fā)展的重要因素之一。對(duì)大數(shù)據(jù)的存儲(chǔ)有很多種方式,在很大程度上也會(huì)影響后期數(shù)據(jù)的分析速度;其存儲(chǔ)成本也會(huì)相應(yīng)提高。僅靠現(xiàn)在的方式,不能夠完全實(shí)現(xiàn)后期的處理速度,也影響到了大數(shù)據(jù)的發(fā)揮,并且大大浪費(fèi)了資源,在資金流通方面,也存在問(wèn)題。
2.1 完善基礎(chǔ)科學(xué)研究方式
國(guó)內(nèi)外的政府機(jī)構(gòu)針對(duì)大數(shù)據(jù)的研究,都較為重視,大力支持并且強(qiáng)化對(duì)其研究的力度。在對(duì)大數(shù)據(jù)的研究中,計(jì)算方法和速度尤為重要。所以,人們逐漸將研究重點(diǎn)慢慢轉(zhuǎn)移到數(shù)據(jù)分類(lèi)中,即不是借助單一的、少量的一些數(shù)據(jù)進(jìn)行分析研究,而是分類(lèi)對(duì)大量數(shù)據(jù)進(jìn)行有規(guī)劃的研究。這樣一來(lái),一些事物的快速發(fā)展也能夠很快被了解清楚,并且其所反映出的問(wèn)題展開(kāi)進(jìn)一步研究可得到進(jìn)行更快速有效的處理。從側(cè)面看,有時(shí)候不能忽略那些百分比低的數(shù)據(jù),常常是那些數(shù)據(jù),起到了關(guān)鍵性的作用。
2.2 進(jìn)一步完善大數(shù)據(jù)的構(gòu)成
數(shù)據(jù)的組成方式,還需要不斷地優(yōu)化。那么如何來(lái)進(jìn)一步完善呢??jī)?yōu)化的過(guò)程需要借助各種支持,如,中國(guó)計(jì)算機(jī)學(xué)會(huì)和中國(guó)通信學(xué)會(huì)的支持,可以借助這兩個(gè)組織來(lái)推動(dòng)相關(guān)活動(dòng),也給完善大數(shù)據(jù)提供了一定的有力條件。通過(guò)這一系列的應(yīng)用,大大地提高了數(shù)據(jù)資源的利用,同時(shí)也提供了技術(shù)支持,推動(dòng)分析有效開(kāi)展。此外,不同的組織方式也會(huì)有不同的反響效果。組織方試方式的多樣化,收集不同行業(yè)不一樣的數(shù)據(jù),再將這些數(shù)據(jù)進(jìn)行仔細(xì)地整合之后,總結(jié)出符合當(dāng)?shù)氐臄?shù)據(jù),進(jìn)行規(guī)劃和統(tǒng)計(jì),一切從實(shí)際出發(fā),并運(yùn)用到生活中去。
2.3 擴(kuò)大數(shù)據(jù)庫(kù)
資源的豐富多樣化有利于大數(shù)據(jù)的發(fā)展。在沒(méi)有這些資源的基礎(chǔ)下,大數(shù)據(jù)并不能得到很好的利用,也不能很好地運(yùn)用到現(xiàn)實(shí)的生活當(dāng)中去[3]。從而得出,這些資源對(duì)大數(shù)據(jù)研究的重要性,也體現(xiàn)了尤為重要的價(jià)值性。與此同時(shí),不僅僅只依靠多樣化的資源,也要相關(guān)政府部門(mén)的大力支持。只有在宏觀調(diào)控和微觀調(diào)控兩者的結(jié)合下,才能更好地發(fā)揮其優(yōu)勢(shì),開(kāi)展各類(lèi)活動(dòng),并在其中得到相應(yīng)的支持。
2.4 充分利用科學(xué)的數(shù)據(jù)研究方法
大部分人頗為熟知的數(shù)據(jù)科學(xué)是將多種領(lǐng)域中的相關(guān)知識(shí)進(jìn)行巧妙的融合,并從中去提取出新知識(shí)的要點(diǎn),進(jìn)行檢測(cè)、驗(yàn)證,并且發(fā)現(xiàn)“新大陸”。人們不斷地尋求新的方向、不斷地提高新的技術(shù)是大數(shù)據(jù)發(fā)展的唯一訴求?,F(xiàn)階段,大數(shù)據(jù)的不斷壯大帶動(dòng)了不少的企業(yè)發(fā)展,引領(lǐng)進(jìn)步。一些大型的銀行和相關(guān)部門(mén)的數(shù)據(jù)量已經(jīng)難以統(tǒng)計(jì),大部分企業(yè)充分了解到數(shù)據(jù)的重要性。良好的數(shù)據(jù)分析能力是取勝的關(guān)鍵所在,同時(shí)也成為企業(yè)發(fā)展的主要組成部分。大力宣傳和發(fā)展大數(shù)據(jù)研究方法是現(xiàn)階段任務(wù)的重中之重,也需要掌握多門(mén)學(xué)科的技術(shù),如:數(shù)學(xué)的應(yīng)用,計(jì)算機(jī)科學(xué)等等[4]。
2.5 對(duì)大數(shù)據(jù)的研究需求越來(lái)越多
大數(shù)據(jù)與人們的生活息息相關(guān),密不可分,因此得到了各行各界的關(guān)注。人們應(yīng)充分地利用大數(shù)據(jù),滿足社會(huì)的需求,推進(jìn)社會(huì)的發(fā)展,并將其合理地運(yùn)用到科學(xué)技術(shù),推動(dòng)我國(guó)科研技術(shù)的發(fā)展。人類(lèi)的未來(lái)正走向另一個(gè)開(kāi)端,大數(shù)據(jù)的應(yīng)用也將決定科學(xué)發(fā)展的步伐。在發(fā)展產(chǎn)業(yè)化的同時(shí),如何利用數(shù)據(jù)帶動(dòng)產(chǎn)業(yè)化,實(shí)現(xiàn)更大的價(jià)值是人們下一步應(yīng)思考的問(wèn)題。當(dāng)前大數(shù)據(jù)的發(fā)展所激發(fā)的需求將會(huì)讓更多人清晰地認(rèn)識(shí)到數(shù)據(jù)的重要性。應(yīng)用計(jì)算機(jī)對(duì)人們的要求也越來(lái)越高,考驗(yàn)人們對(duì)數(shù)據(jù)的處理水平。大數(shù)據(jù)分析技術(shù)在不同行業(yè)的應(yīng)用,是各類(lèi)企業(yè)發(fā)展的基礎(chǔ)。隨著發(fā)展,大數(shù)據(jù)的應(yīng)用也推動(dòng)著企業(yè)的發(fā)展和進(jìn)步,成為企業(yè)的核心競(jìng)爭(zhēng)力毋庸置疑[5]。在對(duì)數(shù)據(jù)進(jìn)行分析的過(guò)程中,提取大量的有價(jià)值意義的信息,才是大數(shù)據(jù)時(shí)代的價(jià)值所在。在處理一些新增的材料時(shí),直接通過(guò)大數(shù)據(jù)計(jì)算來(lái)處理,會(huì)更有效率,不管是在信息提取的準(zhǔn)確度上還是速度上,都有了明顯的提升。
大數(shù)據(jù)的價(jià)值性包含大量的數(shù)據(jù),不管是在企業(yè)、生活中還是在科學(xué)研究方面,都起著至關(guān)重要的作用。隨著社會(huì)的不斷發(fā)展,不斷進(jìn)步,云計(jì)算的平臺(tái)規(guī)模也隨之越來(lái)越壯大,收集不同的數(shù)據(jù),并進(jìn)行梳理,將其導(dǎo)入數(shù)據(jù)庫(kù),用高科技的手段進(jìn)行處理、分析、研究,使最后得出的結(jié)果更能滿足人們的需求極為重要。在做相關(guān)試驗(yàn)時(shí),一定要秉著嚴(yán)謹(jǐn)?shù)膽B(tài)度,認(rèn)真負(fù)責(zé)的工作狀態(tài),對(duì)待每一次的數(shù)據(jù)提取。也能得到國(guó)家的大力扶持,更有利于進(jìn)一步對(duì)大數(shù)據(jù)的研究和發(fā)展。除了得到國(guó)家相關(guān)部門(mén)的精神支持外,對(duì)大數(shù)據(jù)的研究在資源上也能獲得一定的扶持,有利于更好地發(fā)展大數(shù)據(jù)。在另一方面,應(yīng)該不斷更新計(jì)量方式,將單一的方式發(fā)展為多樣化,加大創(chuàng)新力度,轉(zhuǎn)換思想方式,有目的地進(jìn)行操作,促進(jìn)科學(xué)技術(shù)更好地為人們服務(wù)。
[1]陳泓茹,趙寧,汪偉.大數(shù)據(jù)融入人文社會(huì)科學(xué)的基本問(wèn)題[J].社會(huì)觀察,2016(2):16-18.
[2]化柏林,李廣建.大數(shù)據(jù)環(huán)境下多源信息融合的理論與應(yīng)用探討[J].圖書(shū)情報(bào)工作,2015(16):5-10.
[3]高麗娟.大數(shù)據(jù)時(shí)代城市增長(zhǎng)邊界劃定方法探討[J].城市地理,2016(8):123.
[4]陳偉,SMΙELΙAUSKAS W.大數(shù)據(jù)環(huán)境下的電子數(shù)據(jù)審計(jì):機(jī)遇、挑戰(zhàn)與方法[J].計(jì)算機(jī)科學(xué),2016(1):8-13.
[5]高筱培.知識(shí)產(chǎn)權(quán)政策研究中的大數(shù)據(jù)方法應(yīng)用研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2016.
Research on big data and its scientific problems
Luo Xing
(Software and Communication Engineering School of Jiangxi University of Finance and Econom ics, Nanchang 330032, China)
The grow th rate of big data has far exceeded people’s expectations, and there exists huge difficulty in the large data processing. So, there is a long way to go in dealing w ith big data. This paper makes a scientific analysis and reflection on big data, mainly from the formation conditions, composition structure and resources 3 aspects of big data to carry out discussion, so as to effectively improve the utilization rate of big data.
big data; scientific application; discuss problems; technical policy
羅興( 1995— ) ,男,江西九江,本科;研究方向:軟件工程。