王梓北京聯(lián)合大學生物化學工程學院
信息時代大數(shù)據應用的探索
王梓
北京聯(lián)合大學生物化學工程學院
隨著計算機技術的普及和發(fā)展,各行各業(yè)所使用的數(shù)據量愈來越大,數(shù)據的內容更加復雜,而且還有數(shù)據保密和共享的需求,開放數(shù)據不僅是公開數(shù)據,使得數(shù)據可以被重復使用,任意加工,而且數(shù)據還可能涉及到個人隱私等問題。數(shù)據開放與共享已經成為一種大趨勢,互聯(lián)網將成為智能的數(shù)據網。
信息;大數(shù)據;開放與共享
信息時代是農業(yè)時代、工業(yè)時代之后出現(xiàn)的一個全新文明時代,在信息時代,信息資源已經成為比人力資源和物質資源更重要的資源,信息資源的收集、公開、利用以及整合已經成為經濟社會活動的樞紐,并對整個社會的政治、文化生活產生積極的影響。
在大多數(shù)情況信息和數(shù)據這兩個詞是可以互相替換的。但嚴格來說,數(shù)據和信息這兩個概念還是有著比較大的區(qū)別。信息是把數(shù)據放置到特定的條件下,對數(shù)字進行解釋并賦予意義,數(shù)據是將信息進行數(shù)字化記錄,其本身并無意義。比如:2.26是一個數(shù)據,姚明的身高2.26米就是一個信息。但是,自從步入了信息時代之后,人們更加趨向把已經存在計算機上的信息,包括音視頻多媒體資料統(tǒng)稱為數(shù)據。本文所說的大數(shù)據主要是指不能快速的利用普通軟件工具進行捕捉、處理和管理的海量數(shù)據集合,這是需要更加新型的計算模式才能具有更強的優(yōu)化能力和決策能力的海量多元化信息資產。
隨著計算機技術的普及和發(fā)展,各行各業(yè)所使用的數(shù)據量愈來越大,數(shù)據的內容更加復雜,而且還有數(shù)據保密和共享的需求,開放數(shù)據不僅是公開數(shù)據,使得數(shù)據可以被重復使用,任意加工,而且數(shù)據還可能涉及到個人隱私等問題。因此什么樣的數(shù)據能夠共享,什么樣的數(shù)據需要保密已經成為目前亟待解決的問題。
能夠共享的數(shù)據應該是完整原始的、可讀取可處理的,所以數(shù)據公開的格式也非常重要。例如我們身邊經常能接觸到的共享數(shù)據資源包括,通過手機通訊等渠道即時發(fā)布的節(jié)假日旅客出行情況,我們能夠提前預判交通擁堵的可能性,公眾便以此來決定出行的時間和方向,從而緩解假日出行帶來的交通擁堵問題。數(shù)據開放與共享已經成為一種大趨勢,互聯(lián)網將成為智能的數(shù)據網。
目前信息時代的主要特點是創(chuàng)新。信息的存儲、處理、發(fā)布已經不再是重點,基于信息的創(chuàng)新已經成為主導。信息的高度個性化已成現(xiàn)實,隨著無線傳感器以及普適計算的深入“萬物皆聯(lián)網、無處不計算”逐漸成為現(xiàn)實。我們察覺到隨著大數(shù)據的應用給社會帶來了改變,軟件開源和數(shù)據開放催生了大眾的創(chuàng)新——從滴滴打車到共享單車,信息共享正在向普通人流動。目前數(shù)據已成為重要的資源,一旦信息數(shù)據自由開放,就意味著信息和每個人的距離是相等的,而且中間沒有損耗。數(shù)據的開放和流動是多方面多渠道的。在這個時代,社會的主體結構將從“層級”轉向“網狀”,在網狀傳播的不斷沖擊下,個人的主體價值將得到空前地張揚,大數(shù)據催生一個更加開放、更加平等的網狀社會。
傳統(tǒng)的學校教育手段大都是一對多的講授,無法做到對每位學生的個性化教學。信息技術的變革給教育領域帶來的最直接的改變就是在線互動學習對傳統(tǒng)的教育機構的沖擊。教育資源優(yōu)勢學??梢园驯拘4罅康脑诰€精品課程匯集成海量的數(shù)據公布在網絡平臺,通過計算統(tǒng)計廣大在線用戶的點擊數(shù)據,從而不斷的淘汰和沉淀,最終會成為經典的教育資源,這些課程數(shù)據作為寶貴的現(xiàn)實需求資源,可能會取代老師在課堂上的講授。
未來大部分教育工作者更多是扮演著教學組織者和引導者。學習者可以根據自身的特點和條件自主定制個性化課程表,合理的安排好業(yè)余時間進行在線學習。優(yōu)質的教育資源將得到共享,廣大民眾將是這場變革最大受益者。大數(shù)據在教育領域的應用在不遠的將來還有可能對我國的整個教育體制產生深遠的影響。
信息時代大數(shù)據的迅猛發(fā)展給各行各業(yè)帶來了前所未有的機遇。教育行業(yè)利用自身學術優(yōu)勢搭建在線教育平臺之所以具有優(yōu)勢,是因為能夠通過在線平臺收集、分析、使用大量的數(shù)據。這類數(shù)據的規(guī)模是空前的,用戶通過身份驗證登錄在線學習平臺,從中挑選自身需要的各類課程,我們從中獲取的個人信息和用戶需等數(shù)據是及時的、海量的,真實有效的。這不僅僅是簡單的數(shù)據,通過有效的算法提煉加工形成各種信息資源,我們可以通過用戶群體的年齡性別以及所學課程了解當前社會最熱門領域的人才需求,及時優(yōu)化教育資源配置,提高資源的利用率。還可以利用各類在線測試挑選出優(yōu)秀人才,使得優(yōu)質的人力資源在相應的領域能夠最大限度地發(fā)揮自身價值。
信息時代大數(shù)據應用對各個行業(yè)產生的影響是巨大的。以用戶的在線學習成績等評價手段選拔行業(yè)所需人才只是大數(shù)據應用的冰山一角。隨著信息技術的不斷發(fā)展,數(shù)據在不斷的積累,我們每個人在現(xiàn)實生活中的活動都會形成各類數(shù)據被完整的記錄下來,這種記錄可能通過身邊的手機通訊設備、公共監(jiān)控設備、共享資源系統(tǒng),匯集成完整的數(shù)據信息。這些數(shù)據信息看似雜亂無序,通過有效的整合提煉,可以形成非常有價值的信息資源。
信息時代,虛擬網絡的信息的真實可靠性相對較低。隨著現(xiàn)代應用平臺對身份驗證的要求不斷提高,采集信息的真實可靠性都有了質的飛躍。這對社會科學的分析研究提供了精準的、可靠的、及時的數(shù)據資源。社科類研究再也不再需要設計各類調查問卷的形式收集特定研究對象的相關信息,而是通過已有的大數(shù)據資源,篩選、提煉從而得到比以往更加精準的分析結果。
信息時代大數(shù)據的應用對每個人的工作、生活都會產生影響,我國是一個人口大國,但不是一個數(shù)據大國,我國大數(shù)據技術發(fā)展相對不平衡,數(shù)據的收集渠道、處理手段還有需要加強和完善,不論是國家還是個人在收集數(shù)據的意識這方面都需要更加的規(guī)范。只有這樣才能使得我們在這個充滿數(shù)據的時代發(fā)揮人口大國優(yōu)勢,充分利用好大數(shù)據資源給我們的歷史機遇。
[1]涂子沛.大數(shù)據[M].桂林:廣西師范大學出版社,2014.7
王梓(1983-),男,北京人,北京聯(lián)合大學生物化學工程學院,實驗師,大學本科,研究方向:計算機技術。