惠州學(xué)院 胡 松 胡 輝 陳 伽 蔡映雪 范 瑾 蔡昭權(quán)
?
跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究與市場效益
惠州學(xué)院 胡 松 胡 輝 陳 伽 蔡映雪 范 瑾 蔡昭權(quán)
【摘要】移動智能終端的廣泛應(yīng)用和日益普及,研究這些移動設(shè)備、手持終端,以及在網(wǎng)絡(luò)上登錄行為記憶等的消費行為,行動區(qū)域,在不同媒體平臺上瀏覽的信息內(nèi)容等方面信息,已成為一個跨媒體數(shù)據(jù)研究方向。在這數(shù)據(jù)就是價值的時代,跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究將帶來不可估量的研究價值和市場效益。
【關(guān)鍵詞】跨媒體數(shù)據(jù);智能系統(tǒng)技術(shù)研究;跨媒體數(shù)據(jù)市場效益
跨媒體技術(shù)的發(fā)展是隨著移動智能終端設(shè)備的廣泛應(yīng)用和普及,海量、天量的視頻、音頻、文本文件以及各種觸感數(shù)據(jù)構(gòu)成了當(dāng)前移動互聯(lián)網(wǎng)領(lǐng)域中信息共享、傳播的主體內(nèi)容。手持移動化帶來的變革是信息量的迅猛激增,對這些信息內(nèi)容的深入研究,借助數(shù)據(jù)分析程序,基于位置移動(定位)從中得出分析人們行為,如:消費習(xí)慣,閱讀習(xí)慣,個人社交,運動軌跡等,精準地研究這些習(xí)性,正在形成一種研究潮流和方向,其研究的深度和廣度,正受市場熱烈追捧,市場效益日益凸顯。
跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究經(jīng)歷一個從無到有的發(fā)展歷程。從起初平面媒體時代到TV時代,到當(dāng)今的跨媒體網(wǎng)絡(luò),經(jīng)歷了一個百年歷程。如今跨媒體數(shù)據(jù)正趨向動態(tài)高效,實時海量方向發(fā)展,正日益影響人們知識獲取,知識重構(gòu)的進程。
當(dāng)前比較熱門的智能系統(tǒng)技術(shù)研究方向和內(nèi)容是:
物理層:SAS+數(shù)據(jù)中心機房+虛擬機+高速網(wǎng)絡(luò)+GPU加速+重核加速+SSD 該層主要體現(xiàn)在系統(tǒng)硬件及硬件配套上
存儲層:離線存儲+在線存儲+云平臺 主要體現(xiàn)數(shù)據(jù)存儲介質(zhì)。
計算層:離線計算+在線計算 主要呈現(xiàn)系統(tǒng)算法規(guī)則。
業(yè)務(wù)邏輯層:數(shù)據(jù)抓取+實時統(tǒng)計+實時監(jiān)控+在線分析+實時推薦+日志處理+預(yù)測建模呈現(xiàn)系統(tǒng)操作層面。
服務(wù)層:提供系統(tǒng)各條業(yè)務(wù)線路的服務(wù)。
此外還有系統(tǒng)自動運行維護外設(shè)軟硬系統(tǒng)。
由于需要研究的跨媒體數(shù)據(jù)來源眾多,跨平臺,跨行業(yè)的內(nèi)容龐大。這將必然導(dǎo)致數(shù)據(jù)的處理,分類,匯總問題極其復(fù)雜,也導(dǎo)致了數(shù)據(jù)類型向非結(jié)構(gòu)化爆炸增長,數(shù)據(jù)單位有起初的TB-PB-EB-ZB的級別進化演進。這就需要我們研究如何在各種各樣類型的海量數(shù)據(jù)模型中,快速獲得有價值信息,目前采用數(shù)據(jù)分析系統(tǒng)主要用過程為:數(shù)據(jù)采集,數(shù)據(jù)存取,基礎(chǔ)架構(gòu),數(shù)據(jù)處理,統(tǒng)計分析,數(shù)據(jù)挖掘,模型預(yù)測,結(jié)果呈現(xiàn)等八種技術(shù)能力。研究這些過程需要用到的計算模式是:批處理、流處理和交互分析三種計算模式。
目前主流的技術(shù)趨向是:人機交互,語音識別方向。
有人說,這是一個最好的時代,也是一個最壞的時代,跨媒體數(shù)據(jù)智能研究技術(shù)已經(jīng)上升到國家戰(zhàn)略發(fā)展的高度,日益受到黨和國家的重視。國家了“十二五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》要求深入開展海量數(shù)據(jù)存儲項目立項,跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)深入研發(fā),要投入更多的資金,資源。在當(dāng)今互聯(lián)網(wǎng)科技前沿技術(shù)當(dāng)中,關(guān)于信息生物感知技術(shù)、信息高速傳輸技術(shù)、信息高度安全技術(shù)等,都引入跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)的研發(fā)體系。
眼下最讓科技界關(guān)注和投入的跨媒體數(shù)據(jù)運營的商業(yè)思維,我國互聯(lián)網(wǎng)三大巨頭公司BAT,在各自領(lǐng)域做出的努力已經(jīng)慢慢讓世人眼前一亮。
百度搜索,當(dāng)用戶網(wǎng)上進行搜索,其搜索行為馬上被百度系統(tǒng)記錄下來,當(dāng)這位用戶下一次再去使用搜索功能時就會出現(xiàn)和上次他搜索時相關(guān)內(nèi)容的廣告。舉個例子,當(dāng)他搜索“跨媒體數(shù)據(jù)”這個關(guān)鍵詞達到一定次數(shù)時,再瀏覽網(wǎng)頁就他會發(fā)現(xiàn),百度搜索頁面會跳出來一堆跟這個“跨媒體數(shù)據(jù)”關(guān)鍵詞相關(guān)的內(nèi)容。百度公司在運用跨媒體智能系統(tǒng)技術(shù)達到只要用戶上網(wǎng)瀏覽輸入關(guān)鍵詞,就能分析出用戶的搜索行為后,就能馬上匹配精準的廣告,大大提高了廣告的展示效果。
阿里公司也是如此,用戶在天貓,淘寶購物,瀏覽頁面,所有行為,購物行為、和瀏覽數(shù)據(jù),甚至包括支付賬單,更精密的是,阿里可以精細地研判用戶通過阿里云計算分析后,進行精準的用戶行為預(yù)測,然后進行商品信息推送。比如:某個用戶上淘寶搜索“眼鏡”這個關(guān)鍵詞的次數(shù)是行為數(shù)據(jù)里面最高的,分析出來之后,阿里預(yù)測這位用戶就是喜歡這款眼鏡品類的商品,然后挑一些爆款的讓這位用戶進行推薦。
騰訊公司更厲害,只是他們比較低調(diào),不顯山露水,騰訊一直在數(shù)億的QQ用戶,微信用戶的社交數(shù)據(jù),消費數(shù)據(jù),娛樂數(shù)據(jù)(玩游戲,聽音樂,看視頻等)進行跨媒體數(shù)據(jù)智能研究,用戶的社會關(guān)系、性格稟賦、興趣愛好、隱私緋聞甚至生理周期和心理缺陷都盡在其中。這樣騰訊就可以根據(jù)這些數(shù)據(jù),開發(fā)產(chǎn)品。所以騰訊每推出一款社交工具軟件,立馬受到用戶歡迎。
總的來說。根據(jù)跨媒體數(shù)據(jù)智能研究,可以精準地知道用戶要干什么,喜歡干什么。
3.1 跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究主體的問題
跨媒體數(shù)據(jù)智能研究技術(shù)如此重要,那么研究這個技術(shù)的市場主體到底是政府還是企業(yè)個人?目前觀念比較統(tǒng)一的看法是,因為跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究關(guān)系到國計民生,必須由政府主導(dǎo),企業(yè)實行,走市場化的道路。
3.2 跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究政策配套問題
既然跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究需要政府主導(dǎo),企業(yè)參與,走市場化道路,那么政府就必須要出臺一系列相關(guān)的政策,來扶持配套和引導(dǎo)監(jiān)督企業(yè)對跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)研究。
3.3 跨媒體數(shù)據(jù)智能系統(tǒng)研究人才問題
美國蓋特納咨詢公司預(yù)測跨媒體數(shù)據(jù)研發(fā)領(lǐng)域?qū)槿驇?40萬個IT新崗位和上千萬個非IT崗位。麥肯錫公司預(yù)測美國到2018年需要深度數(shù)據(jù)分析人才44萬—49萬,缺口14萬—19萬人;需要既熟悉本單位需求又了解跨媒體數(shù)據(jù)技術(shù)與應(yīng)用的管理者150萬,這方面的人才缺口更大。
中國雖然是人才大國,但能理解與應(yīng)用跨媒體數(shù)據(jù)的創(chuàng)新人才更是奇缺。和中國國防科技一樣,跨媒體數(shù)據(jù)智能系統(tǒng)研究需要一大批耐得住寂寞的頂級科學(xué)家、尖端人才參與。如何吸引到頂尖人才加入研究,需要各方面整合資源,一起努力。一方面要加速人才培養(yǎng),一方面要多渠道吸引人才。
3.4 研究跨媒體數(shù)據(jù)智能系統(tǒng)面臨的技術(shù)難點
首先要進行跨媒體數(shù)據(jù)智能研究,首先要有海量可研究的數(shù)據(jù)來源,目前我們由于行政體系改革還不深化,政府各個部門間存在大量的數(shù)據(jù)鴻溝,阻礙數(shù)據(jù)開放,我國政府、企業(yè)和行業(yè)信息化系統(tǒng)建設(shè)缺少統(tǒng)一規(guī)劃和科學(xué)論證,系統(tǒng)之間缺乏統(tǒng)一的標準,形成了眾多“信息孤島”,而且受行政壟斷和商業(yè)利益所限制,數(shù)據(jù)無法開放出來,數(shù)據(jù)共享難度大,這給數(shù)據(jù)利用和開發(fā)造成極大阻力。
影響和制約我國數(shù)據(jù)資源開放和共享的原因是是數(shù)據(jù)共享政策法規(guī)不完善。由于立法跟不上,數(shù)據(jù)擁有者無法保證共享,怕出現(xiàn)數(shù)據(jù)濫用,寧可讓數(shù)據(jù)躲在深閨無人知。所以要加快推動政府相關(guān)立法,保證公共數(shù)據(jù)開放和隱私保護??傮w來說,我國跨媒體數(shù)據(jù)研究缺乏政府?dāng)?shù)據(jù)開放的參與,就會造成無米下鍋。我國跨媒體數(shù)據(jù)處理技術(shù)基礎(chǔ)薄弱,總體上以跟隨國際發(fā)達國家為主,難以滿足市場迅猛發(fā)展的數(shù)據(jù)需求。
最后,跨媒體數(shù)據(jù)時代的市場經(jīng)濟,甚至政治決策不能光靠經(jīng)驗,而是真正要“拿數(shù)據(jù)說話”。更深層次看,就是要變革我們的市場管理模式、管理思維以及管理架構(gòu)的與現(xiàn)實實際需求相適應(yīng)??傊痪湓?,改進不足,拋掉包袱,跟緊時代需求的腳步。
跨媒體數(shù)據(jù)價值認知,即跨媒體數(shù)據(jù)智能技術(shù)研究的市場效益,正日益影響整個人類社會的前進腳步。跨媒體數(shù)據(jù),也叫大數(shù)據(jù),正在日益影響我們生活的方方面面,它已經(jīng)儼然成為當(dāng)今炙手可熱的經(jīng)濟類別,如同貨幣或黃金一樣成為人們眼中香餑餑,研究對象。
跨媒體數(shù)據(jù)智能研究技術(shù),目前有幾種較為靠譜的,能變現(xiàn)的商業(yè)思維:
從海量數(shù)據(jù)首先要能保存下來,才能有后續(xù)的處理,既數(shù)據(jù)存儲和安放問題,由于數(shù)據(jù)海量,天文量級別,需要的運行系統(tǒng)十分龐大,運用的服務(wù)器組別都是上萬臺組。因此根據(jù)跨媒體數(shù)據(jù)存放需要,要有龐大的數(shù)據(jù)處理中心,在我國,很多城市紛紛取立項成為國家級別的跨媒體數(shù)據(jù)中心。因為大家都深知,這將給當(dāng)?shù)氐慕?jīng)濟能帶來不可估量的騰飛機遇。
從跨媒體數(shù)據(jù)運行系統(tǒng)看,目前最火最老牌是方式就是IDC。所謂IDC, 就是互聯(lián)網(wǎng)內(nèi)容提供商(ICP)、企業(yè)、媒體和各類網(wǎng)站提供大規(guī)模、高質(zhì)量、安全可靠的專業(yè)化服務(wù)器托管、空間租用、網(wǎng)絡(luò)批發(fā)帶寬以及ASP、EC等業(yè)務(wù)。IDC是對入駐(Hosting)企業(yè)、商戶或網(wǎng)站服務(wù)器群托管的場所;是各種模式電子商務(wù)賴以安全運作的基礎(chǔ)設(shè)施,也是支持企業(yè)及其商業(yè)聯(lián)盟(其分銷商、供應(yīng)商、客戶等)實施價值鏈管理的平臺。目前除了三大運營商根據(jù)國家戰(zhàn)略需要,各自啟動了自己的IDC,一些大型企業(yè)也自己布局IDC。如華為公司,早在幾年前就投入巨資開發(fā)IDC市場。
跨媒體數(shù)據(jù)研究內(nèi)容上分析,目前廣告行業(yè)運用最多的技術(shù)模式是:數(shù)據(jù)搜集+數(shù)據(jù)分析+精準推送=精準營銷。國際和國內(nèi)頂尖的廣告公司,他們面對自己的廣告客戶,最拿得出手的是各自手頭上的用戶資源。那么他們的用戶資源從哪里來?廣告主憑什么要給他們投入廣告?最根本的原因是因為跨媒體數(shù)據(jù)智能研究技術(shù)的使用。廣告公司可以更為有,目的根據(jù)用戶點擊、瀏覽廣告的行為來精準地研究用戶的消費習(xí)慣,消費心理。
在跨媒體數(shù)據(jù)時代,很多傳統(tǒng)的商業(yè)思維正在被顛覆和取代,越來越多的IT企業(yè)正在加緊分一羹,紛紛入駐布局,搶占行業(yè)研究的戰(zhàn)略制高點,開展研究跨媒體數(shù)據(jù)智能系統(tǒng)技術(shù)在人才,資金,資源的儲備。據(jù)測算,2016年全球在跨媒體數(shù)據(jù)方面的耗資將達到2320億美元,由此產(chǎn)生的市場價值則高達幾十萬億美元。
跨媒體數(shù)據(jù)將能激發(fā)巨大的內(nèi)需增量,將引發(fā)產(chǎn)業(yè)的巨大變革。因此我們需要提早做好研發(fā)準備,最有可能實現(xiàn)我國在這一科技領(lǐng)域“彎道超車”的奇跡。未來跨媒體數(shù)據(jù)的應(yīng)用最可能在電子商務(wù)、廣告行業(yè)和企業(yè)管理三個領(lǐng)域取得重大突破??缑襟w跨媒體數(shù)據(jù)將帶給我們一個革命性的方向。
參考文獻
[1]鄧香蓮,楊佳.新媒體環(huán)境下的傳統(tǒng)文本閱讀實證分析——基于上海圖書館外借排行榜的SPSS解讀[J].圖書情報知識,2011(06).
[2]鄭偉青.高校圖書館閱讀推廣實踐現(xiàn)狀調(diào)查與分析——以“211工程”高校圖書館為例[J]. 圖書館工作與研究,2012(08).
基金項目:廣東省教科規(guī)劃項目(11JXZ012,14JXN065),廣東省自然科學(xué)基金項目(S2013010013432, S2013010015940),廣東省教育廳項目(2013LYM00874),廣東省高校優(yōu)秀青年創(chuàng)新人才培養(yǎng)計劃資助項目(2013LYM_0087),惠州市科技計劃項目(2013B020015008,2014B020004026,2014B050013016,2014B020004023)。
作者簡介:
胡松(1985-),女,河北秦皇島人,碩士,講師,研究方向:信息系統(tǒng)和信息管理。