文/魏利梅
互聯(lián)網(wǎng)在當(dāng)今社會各個領(lǐng)域都實現(xiàn)了廣泛普及,而且其發(fā)展速度非常迅速,網(wǎng)絡(luò)資源數(shù)據(jù)容量在快速擴張,大數(shù)據(jù)所帶來的時代變革引起了各國政府的高度重視。在信息技術(shù)快速進步的前提下,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及云計算的技術(shù)發(fā)展非常迅速,以文本、圖像、視音頻為主的各類網(wǎng)絡(luò)大數(shù)據(jù)增長速度非常驚人,這也標(biāo)示著我國已經(jīng)正式進入了以大數(shù)據(jù)為主的三次工業(yè)革命時代,大數(shù)據(jù)已經(jīng)成為了當(dāng)今世界技術(shù)創(chuàng)新、核心競爭力以及生產(chǎn)力提升的前沿科技。
(1)對于當(dāng)前國家的信息產(chǎn)業(yè)以及科學(xué)技術(shù)發(fā)展來說,大數(shù)據(jù)的研究已經(jīng)成為了其重要的支撐點。網(wǎng)絡(luò)媒體在當(dāng)今社會的快速普及,擁有龐大群體的公眾在參與網(wǎng)絡(luò)活動的過程中產(chǎn)生了大量網(wǎng)絡(luò)數(shù)據(jù),這就使得在金融服務(wù)、醫(yī)療衛(wèi)生、社會生活的各個層面有大量數(shù)據(jù)需要進行表達。因此政府部門只有在針對上述各種數(shù)據(jù)進行及時準確的獲取,并進行精確處理之后最終得到正確的信息,才能夠及時的發(fā)現(xiàn)存在的各種民生問題,在此基礎(chǔ)上才能夠制定出更加符合時代發(fā)展、人民生活需求的決策。
(2)隨著互聯(lián)網(wǎng)經(jīng)濟時代的來臨,大數(shù)據(jù)技術(shù)的掌握程度也決定了其經(jīng)濟發(fā)展的水平。海量的網(wǎng)絡(luò)數(shù)據(jù)中往往都含有非常豐富的個人信息以及個人實際需求等相關(guān)的信息,只有在建立起智能化的服務(wù)系統(tǒng)之后,才能將各項網(wǎng)絡(luò)數(shù)據(jù)的具體內(nèi)容轉(zhuǎn)化為可利用的有效信息,在此基礎(chǔ)上,政府部門就能夠進一步提升經(jīng)濟戰(zhàn)略部署以及公共服務(wù)水平。
網(wǎng)絡(luò)大數(shù)據(jù)目前主要是以文本、圖像、視音頻等作為主要載體形式。用戶充分利用谷歌以及百度等常規(guī)的搜索引擎就完全能夠快速的查找到自己所需要的個人信息,而優(yōu)酷網(wǎng)等一些平臺能夠為客戶提供大量的視頻數(shù)據(jù)。另外,F(xiàn)acebook、新浪微博以及微信等一些社交網(wǎng)絡(luò)平臺能夠為廣大用戶提供豐富的圖像、視頻數(shù)據(jù)。隨著數(shù)據(jù)量的不斷增加,有時也帶來了數(shù)據(jù)存儲、檢索、管理等多個方面的問題。谷歌、百度等一些具有商業(yè)性質(zhì)的搜索引擎主要是建立在網(wǎng)絡(luò)數(shù)據(jù)模式下的文本檢索;但是在網(wǎng)絡(luò)大數(shù)據(jù)快速發(fā)展的形勢下,大部分的數(shù)據(jù)都嚴重缺乏文本描述,因此就必須要充分利用合理的算法來實現(xiàn)對各種數(shù)據(jù)的分析,并實現(xiàn)對可視化以及音頻內(nèi)容的理解,但是在現(xiàn)在完全文本化的技術(shù)水平下很難實現(xiàn)良好應(yīng)用,必須要充分利用網(wǎng)絡(luò)大數(shù)據(jù)的語義來對此進行全面的分析。
隨著社交網(wǎng)絡(luò)的快速發(fā)展,使得人們的生態(tài)生活逐步形成了網(wǎng)絡(luò)化、數(shù)字化、虛擬化的環(huán)境,在此基礎(chǔ)上也讓人們擁有了從未有過的高度信息知識產(chǎn)權(quán),也進一步促使社會的信息化水平達到了一個全新的高度。在社交網(wǎng)絡(luò)快速發(fā)展的同時,不僅讓人們的信息交流需求得到進一步釋放,也使得網(wǎng)絡(luò)信息產(chǎn)生了社會化、內(nèi)容碎片化的問題,而信息的傳播也體現(xiàn)出了更加強烈的網(wǎng)絡(luò)化特征,在這種形勢下,網(wǎng)絡(luò)信息環(huán)境要想實現(xiàn)科學(xué)化管理和合理化的應(yīng)用就具有了一定難度。目前來說,人們并沒有對社交網(wǎng)絡(luò)模式下的群體行為方式進行充分掌握和深刻的理解,從而使得當(dāng)前社交網(wǎng)絡(luò)中信息出現(xiàn)了可靠性的問題,信息的傳播也存在不可預(yù)測的現(xiàn)象,而群體行為本身具有不可控的性質(zhì),導(dǎo)致社會數(shù)據(jù)大量出現(xiàn)的同時,人們對于社會數(shù)據(jù)缺乏基本的了解。在針對社交網(wǎng)絡(luò)結(jié)構(gòu)的具體演化過程以及產(chǎn)生群體行為的原動力及其本質(zhì)進行深入研究分析,能夠全面促進社交網(wǎng)絡(luò)管理實現(xiàn)科學(xué)化,而且也能夠?qū)W(wǎng)絡(luò)環(huán)境的文明理性發(fā)展起到積極的促進作用。
當(dāng)今時代網(wǎng)絡(luò)媒體發(fā)展非常迅速,各種新聞、微博、論壇等新媒體平臺的發(fā)展呈現(xiàn)出了不可阻擋的勢頭,由此也產(chǎn)生了海量的媒體內(nèi)容。但是在當(dāng)今的媒體形勢下,往往采用的是簡單的羅列來實現(xiàn)對媒體信息的展示,例如,當(dāng)前一些主流的搜索引擎往往是將各種搜索的結(jié)果按照一定的數(shù)據(jù)來進行簡單排列,而大多數(shù)新媒體網(wǎng)站也主要是通過人工方式將新聞主頁按照不同的區(qū)塊來進行編輯,而不同的媒體信息之間基本處于單一和孤立的狀態(tài),因此在實際瀏覽的過程中,整體效率非常低下,并不能滿足當(dāng)今時代下網(wǎng)絡(luò)大數(shù)據(jù)實際的呈現(xiàn)需求。由于上述幾種問題的存在,使得人們并不能夠?qū)崿F(xiàn)對網(wǎng)絡(luò)熱點信息的快速感知,因而也不能夠?qū)Ξ?dāng)前的網(wǎng)絡(luò)熱點信息進行全面、準確的了解。鑒于此,必須要針對當(dāng)前的網(wǎng)絡(luò)大數(shù)據(jù)聚合以及呈現(xiàn)等相關(guān)技術(shù)進行深入研究,這樣才能從根本上進一步改善網(wǎng)絡(luò)大數(shù)據(jù)的分析與理解,也能夠讓網(wǎng)絡(luò)大數(shù)據(jù)的使用效率以及實際的使用效果得到進一步提升。
大數(shù)據(jù)語義分析技術(shù)的出現(xiàn)能夠為網(wǎng)絡(luò)大數(shù)據(jù)的理解提供更加充足的支持,也能夠為各種大數(shù)據(jù)的實際應(yīng)用奠定堅實基礎(chǔ)。但是需要注意的是,隨著當(dāng)前網(wǎng)絡(luò)中異構(gòu)化數(shù)據(jù)產(chǎn)生的速度不斷提升,導(dǎo)致數(shù)據(jù)本身的媒體形式更加復(fù)雜,如何能夠?qū)崿F(xiàn)對海量異構(gòu)媒體信息的有效識別就成為了當(dāng)前需要重點研究的話題之一。領(lǐng)域自適應(yīng)算法主要是針對某一個目標(biāo)領(lǐng)域視頻數(shù)量相對比較有限的條件下,充分利用該領(lǐng)域已經(jīng)形成的模型來最終構(gòu)建起該目標(biāo)領(lǐng)域的模型;但是,在這種模式下還必須要面對如何能夠?qū)崿F(xiàn)對信用模型的合理應(yīng)用并順利的建立起目標(biāo)領(lǐng)域的模型。
在針對當(dāng)前國內(nèi)外主要發(fā)展現(xiàn)狀進行分析之后可以發(fā)現(xiàn),社交網(wǎng)絡(luò)在具體研究過程中還存在著下面一些問題:
(1)目前人們主要是從宏觀的層面來針對網(wǎng)絡(luò)結(jié)構(gòu)進行分析,而網(wǎng)絡(luò)結(jié)構(gòu)的微觀變化則很少有人進行關(guān)注;
(2)對于社交網(wǎng)絡(luò)來說,其主要是通過傳染病模型來建立起信息傳播模型,但是并沒有在信息傳播過程中將用戶的個人角色、心理因素以及不確定性等相關(guān)因素進行充分考慮;
(3)在實際針對涉及到網(wǎng)絡(luò)影響力進行分析的過程中,通常情況下都是針對網(wǎng)絡(luò)節(jié)點的全局影響力進行分析,而對這種影響力的多樣性則往往選擇忽略。
多層次多維度的信息聚合與呈現(xiàn)技術(shù)主要是針對多源異構(gòu)數(shù)據(jù)的統(tǒng)一性表示進行研究,其關(guān)注的重點在于多元動態(tài)信息聚合以及管理,并針對當(dāng)前的網(wǎng)絡(luò)熱點事件進行深度挖掘,并將其呈現(xiàn)給用戶,針對這兩個方面目前已經(jīng)開展的多項的研究內(nèi)容,要想實現(xiàn)對網(wǎng)絡(luò)熱點事件的全面掌握,人們就必須要從多個角度對整個事件進行全面分析,在這種情形下就必須要將整個時間完整的呈現(xiàn)給用戶。 現(xiàn)有的方法大多基于數(shù)據(jù)可視化的策略進行信息呈現(xiàn)。
雖然目前人們已經(jīng)針對上述內(nèi)容展開了大量的研究,但是在整個領(lǐng)域的發(fā)展過程中還有一些關(guān)鍵性的技術(shù)必須進行深入探討,而這些技術(shù)主要包括以下幾個方面:
(1)異構(gòu)媒體信息的語義關(guān)聯(lián)。其主要內(nèi)容關(guān)聯(lián)整體方式相對比較單一,因此很難適應(yīng)當(dāng)前在網(wǎng)絡(luò)事件深度挖掘?qū)嶋H需求,目前大量應(yīng)用的數(shù)據(jù)挖掘都是建立在物理鏈接的基礎(chǔ)上,而這種挖掘方式在很大程度上對各種潛在因素的關(guān)聯(lián)并沒有給予高度重視,這樣就會導(dǎo)致針對網(wǎng)絡(luò)事件的挖掘缺乏全面性。
(2)網(wǎng)絡(luò)事件挖掘。網(wǎng)絡(luò)事件的挖掘目前主要是建立在搜索的方式之上,其主要利用的是網(wǎng)絡(luò)數(shù)據(jù)在某種形式上存在著相似度,通過對數(shù)據(jù)相似度進行匹配并實現(xiàn)排序來進行搜索,但是在這個過程中并沒有對網(wǎng)絡(luò)事件背后潛在的語義結(jié)構(gòu)進行充分考慮。
(3)媒體內(nèi)容呈現(xiàn)。媒體內(nèi)容也往往是以單一的平臺網(wǎng)絡(luò)數(shù)據(jù)形式來展開對數(shù)據(jù)的分析,在不同的平臺之間或者是異質(zhì)媒體之間并沒有實現(xiàn)對網(wǎng)絡(luò)事件的協(xié)同呈現(xiàn)。
近幾年來,我國社交網(wǎng)絡(luò)媒體的發(fā)展非常迅速,從而使得用戶數(shù)據(jù)量在不斷攀升,為了能夠?qū)崿F(xiàn)這個社交媒體網(wǎng)絡(luò)大數(shù)據(jù)的深度挖掘,并在此基礎(chǔ)上為社會網(wǎng)絡(luò)的發(fā)展帶來機遇。在未來涉及網(wǎng)絡(luò)數(shù)據(jù)的深度分析與發(fā)展過程中進一步強化研究,這樣才能讓網(wǎng)絡(luò)信息的管理以及實際的應(yīng)用水平得到有效提升。