尹克堅
【摘要】 隨著時代的進步和社會經(jīng)濟的發(fā)展,特別是科學(xué)技術(shù)的革新與應(yīng)用,開始逐步興起了社交網(wǎng)絡(luò),那么就從數(shù)據(jù)方面推動了城市感知的發(fā)展。但是因為它的數(shù)據(jù)復(fù)雜程度較高,那么就增加研究的難度。本文以某城市信息感知平臺為例,對面向城市的信息感知技術(shù)進行了深入的研究;研究結(jié)果表明,基于社交網(wǎng)絡(luò),對城市規(guī)模的計算模型進行構(gòu)建,可以對城市發(fā)展的進程進行更加有效的感知,將城市運行規(guī)律給找出來,促使智能城市的目的得到實現(xiàn)。
【關(guān)鍵詞】 信息感知 社交網(wǎng)絡(luò) 大數(shù)據(jù)
一、前言
國外有教授學(xué)者明確指出,在人類發(fā)展過程中,最為偉大的發(fā)明就是城市,城市的出現(xiàn),促使人們更好的創(chuàng)新,城市化讓人們更加的智慧,可以更加幸福和健康的生存。但是,城市化進程的加快,也增加了服務(wù)和管理的難度。如果不將信息技術(shù)及時應(yīng)用過來,那么城市化可能會更多發(fā)揮消極的東西。另外一方面,隨著信息技術(shù)的發(fā)展,如移動互聯(lián)網(wǎng)技術(shù)、社交網(wǎng)絡(luò)、云計算技術(shù)等,在互聯(lián)網(wǎng)上,數(shù)據(jù)的傳播速度以及內(nèi)容量在不斷地提高和增長。根據(jù)相關(guān)的統(tǒng)計資料表明,每秒鐘,全球都有超過300萬封電子郵件在發(fā)送,每天有5000萬條消息發(fā)布于“推特”中,而谷歌的分布式系統(tǒng),每天需要處理的數(shù)據(jù)達到了24pb之多;淘寶網(wǎng)有著數(shù)十億的會員,每天有著千萬筆交易誕生。這些海量數(shù)據(jù),已經(jīng)將目前人力處理范疇給超越了過去,代表著我們已經(jīng)進入到了大數(shù)據(jù)時代。
近些年來,人們越來越重視城市計算技術(shù)。在城市計算技術(shù)的概念中,在一個城市級別的計算中,可以將計算單元定義為城市空間的任何車輛、設(shè)備、建筑一級道路等。近些年來,有著一些比較有代表性的工作涌現(xiàn)出來,如在哥本哈根,人們將傳感器安裝于自行車輪胎上,來對城市空氣和質(zhì)量進行探測;在美國,研究人員,借助于手機用戶的通信時刻和位置,來對城市動態(tài)信息進行深入地研究;而在北京,通過對出租車軌跡進行分析,達到城市交通研究的目的。
二、社交網(wǎng)絡(luò)是城市感知的重要途徑
截止到2012年12月底,我國一共有5.6億互聯(lián)網(wǎng)用戶,有著超過百分之四十的互聯(lián)網(wǎng)普及率;其中,微博作為一種新型的社交媒體,得到了迅速的發(fā)展,已經(jīng)擁有了超過了3億的用戶,相較于前幾年,獲得了成倍的增長。
隨著社交網(wǎng)絡(luò)的興起,出現(xiàn)了大量的活躍用戶,那么大量的記錄城市生活的數(shù)據(jù)就在持續(xù)產(chǎn)生,這些數(shù)據(jù)有著較強的交互性和實時性,如果深入研究的話,可以將很多有價值的信息給找出來,已經(jīng)受到了數(shù)據(jù)科學(xué)家的重視。有科學(xué)家將分層社區(qū)發(fā)現(xiàn)算法應(yīng)用到社交網(wǎng)絡(luò)中的大型用戶關(guān)系網(wǎng)絡(luò)中;我國專家利用聚類方法來檢測了城市熱點話題;還有專家借助于社交網(wǎng)絡(luò)的位置信息,將挖掘頻繁模式應(yīng)用了過來,對城市信息進行分析。
三、社交網(wǎng)絡(luò)中的城市信息
本文將新浪微博數(shù)據(jù)充分利用了起來,對某城市信息感知平臺進行了構(gòu)建,具體來講,深入開展這些方面的工作:
一是城市屬性挖掘:我國有著十分遼闊的地域,既有國際大都市,如上海、北京等,又有歷史悠久風(fēng)景美麗的旅游城市,如麗江、鳳凰等等。每個城市在發(fā)展軌跡方面都是獨特的,存在著較大的差異,在政治、經(jīng)濟、文化以及地理環(huán)境方面都是不同的,并且在城市生活的各個方面都有體現(xiàn)。通過研究發(fā)現(xiàn),本省市的其他地級市的微博活躍度,會直接受到人均GDP的影響,通過微博活躍度,就可以將本城市的經(jīng)濟地位和政治地位給有效反映出來。在微博活躍度的基礎(chǔ)上,用戶的位置、言論以及關(guān)系等信息也被涵蓋于微博中,通過分析這些信息,就可以將更加全面的城市整體以及各個區(qū)域的屬性特征給得出來,如經(jīng)濟特征、政治特征以及文化特征等等,這樣就可以促使人們對城市更好的理解和感知。
二是城市動態(tài)性分析:一個城市,基本特征就是動態(tài)性,而城市動態(tài)性直接體現(xiàn)于車輛運行以及人群移動等諸多方面。對城市中移動對象的移動軌跡進行感知,并且分析軌跡數(shù)據(jù),可以將人類社會活動的特征給找出來,并且發(fā)現(xiàn)統(tǒng)計規(guī)律,那么就可以對復(fù)雜的城市動態(tài)進行把握和認知。通過分析時間軸上社交網(wǎng)絡(luò)用戶所發(fā)布的言論或者圖片等信息,可以將空間位置上用戶的變化給找出來,比如簽到功能是社交網(wǎng)絡(luò)所具備的,用戶可以對地理位置隨時記錄和分享,這樣就將豐富的空間移動軌跡數(shù)據(jù)給提供了出來。借助于人們提供的位置信息,可以分析城市各個空間對象的運動規(guī)律,這樣人們可以對城市動態(tài)特征進行更好的把握,促使城市獲得更好的發(fā)展。
三是社區(qū)發(fā)現(xiàn):人是城市的基本組成單位,而且,有著一定的規(guī)律存在于人類行為中;通過研究表明,有著較強的時間和空間相關(guān)性存在于人類的行為軌跡中;并且在社交網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)中,這種小世界特性是依然存在,將人類的共同愛好,或者在真實世界中的社會關(guān)系給有效體現(xiàn)了出來。要想將人的社交結(jié)構(gòu)給找出來,就可以將社交網(wǎng)絡(luò)中用戶之間的交互信息給利用起來,然后將一系列的技術(shù)給利用起來,如譜圖技術(shù)、動態(tài)社區(qū)發(fā)現(xiàn)算法等,提取用戶之間的社區(qū)結(jié)構(gòu),然后借助于其他的技術(shù),來對同一社區(qū)的構(gòu)成原因進行分析和研究。因為有規(guī)律存在于人類行為中,那么就有著諸多的宏觀特征體現(xiàn)于城市當中。在如今的數(shù)據(jù)挖掘中,對個性化以及社交化更加重視,將社交網(wǎng)絡(luò)中用戶的生活模式以及社交結(jié)構(gòu)給提取出來,其中,生活模式包括諸多方面的內(nèi)容,如行為、意圖等,都可以在很大程度上推動城市規(guī)律研究工作的發(fā)展。
四是異常事件檢測:在城市計算中,非常重要的一項研究內(nèi)容就是異常事件分析;在城市中,出現(xiàn)了一些異常事件,將會在較大程度上影響到居民的正常生產(chǎn)和生活,甚至帶來較為嚴重的損失,比如流感的出現(xiàn)、暴雨災(zāi)害等等。采用傳統(tǒng)的檢測手段,異常事件往往無法及時發(fā)現(xiàn)。而通過社交網(wǎng)絡(luò),則可以對信息數(shù)據(jù)進行實時的監(jiān)測。通過采集、分析社交網(wǎng)絡(luò)中的相關(guān)數(shù)據(jù),可以對異常事件進行實時監(jiān)測,還可以對異常事件的發(fā)展趨勢進行預(yù)測,然后將一系列有針對性的措施和方法給應(yīng)用過來。社交網(wǎng)絡(luò)有著較強的實時性,因此,在異常事件檢測中,已經(jīng)成為非常重要的一項手段,可以最大限度的降低城市正常運行受到異常事件的影響程度。除了流感外,在自然災(zāi)害、群體事件以及交通事件等檢測中,社交網(wǎng)絡(luò)也可以發(fā)揮較大的作用,這是因為社交網(wǎng)絡(luò)具備較強的實時性。通過研究社交網(wǎng)絡(luò)的城市異常事件檢測,可以促使城市正常運行不會在過大程度上受到異常事件的影響,避免城市居民的正常生產(chǎn)生活受到異常事件的影響,提高了城市的智能化程度。
四、社交網(wǎng)絡(luò)數(shù)據(jù)分析的挑戰(zhàn)
無數(shù)的人在互聯(lián)網(wǎng)上產(chǎn)生了社交網(wǎng)絡(luò)數(shù)據(jù),這些數(shù)據(jù)比較的復(fù)雜,雖然有規(guī)律存在,但是無用數(shù)據(jù)以及重復(fù)數(shù)據(jù)也占據(jù)了較大的一部分,它們沒有利用價值。因此,在這些豐富的社交網(wǎng)絡(luò)數(shù)據(jù)中,將有價值的信息給提取出來,就是如今需要重視的一個方面。
一是對大規(guī)模多源異構(gòu)數(shù)據(jù)進行管理和處理:社交網(wǎng)絡(luò)數(shù)據(jù)屬于多源異構(gòu)數(shù)據(jù),它的產(chǎn)生源是不同的,并且包括著諸多類型的格式,如圖像、文本和聲音等;還有著諸多類型存在于社交網(wǎng)絡(luò)數(shù)據(jù)中,如用戶關(guān)系、移動軌跡、地理信息等。同時,社交網(wǎng)絡(luò)中,包括了較大的數(shù)據(jù)量,隨著時間的推移,還有諸多的實時數(shù)據(jù)產(chǎn)生,那么就增加了數(shù)據(jù)管理和處理的難度。
二是對社交網(wǎng)絡(luò)數(shù)據(jù)進行在線實時分析:通過應(yīng)用智慧城市,如交通流信息等,實時性要求比較的高。因此,在分析社交網(wǎng)絡(luò)數(shù)據(jù)時,雖然有著較大的數(shù)據(jù)量,但是要快速高效的進行數(shù)據(jù)分析,這樣實時應(yīng)用的要求才可以得到滿足。
三是如何在紛繁復(fù)雜的社交網(wǎng)絡(luò)數(shù)據(jù)中將知識提取出來:社交網(wǎng)絡(luò)數(shù)據(jù)的采集不需要花費較高的成本,但是也沒有較高的質(zhì)量,那么就需要從海量的數(shù)據(jù)中將有價值的信息和數(shù)據(jù)給提取出來,將大數(shù)據(jù)的典型特征給找出來。同時,如果數(shù)據(jù)是單個方面的,那么發(fā)現(xiàn)的信息也是不全面,要想對更加全面更深層次的知識進行獲取,就需要從多個方面來努力。如如今開始利用實時云計算平臺來獲取處理海量社交網(wǎng)絡(luò)數(shù)據(jù),通過對實時云計算平臺下的數(shù)據(jù)獲取任務(wù)調(diào)度策略以及社交網(wǎng)絡(luò)協(xié)議解析方法進行設(shè)計,使用社交網(wǎng)絡(luò)協(xié)議,來對社交網(wǎng)絡(luò)產(chǎn)生的原始數(shù)據(jù)進行解析。
四是如何從社交網(wǎng)絡(luò)中提取知識,來指導(dǎo)人們的決策:上文我們已經(jīng)提到,從社交網(wǎng)絡(luò)中,可以將城市生活各個角度的信息給提取出來,但是我們還需要深入的進行研究,以便將這些信息和數(shù)據(jù)給充分利用起來,對城市管理起到有效的指導(dǎo)作用,將更加便捷和智能的城市生活提供給人們的生存和發(fā)展。
五、結(jié)語
通過上文的敘述分析我們可以得知,隨著時代的進步和社會經(jīng)濟的發(fā)展,特別是社交網(wǎng)絡(luò)的興起,如今已經(jīng)進入到了大數(shù)據(jù)時代;社交網(wǎng)絡(luò)中包含了諸多的數(shù)據(jù)來源,通過分析這些數(shù)據(jù)和信息,可以更加有效的進行決策,提高城市生活的便捷性和智能化程度。但是,社交網(wǎng)絡(luò)包括著十分豐富的數(shù)據(jù),比較的復(fù)雜;目前的研究工作只是處于起步階段,在未來的研究中,需要對傳統(tǒng)的思維模式進行革新和轉(zhuǎn)變,將一系列更加先進的技術(shù)方法給利用起來,將社交網(wǎng)絡(luò)數(shù)據(jù)中存在的規(guī)律和特征給找出來,促使人們對城市信息以及發(fā)展軌跡進行更好的理解和感知,促使城市獲得更好的發(fā)展,提升人們的生存質(zhì)量。本文主要研究了基于信息感知平臺的社交網(wǎng)絡(luò)大數(shù)據(jù)分析,希望可以提供一些有價值的參考意見。
參 考 文 獻
[1] 李文俊,陸建,王橋. 面向城市信息感知的社交網(wǎng)絡(luò)大數(shù)據(jù)分析[J]. 中興通訊技術(shù),2013,2(4):123-125
[2] 李建國,姚良超,張文生. 社交網(wǎng)絡(luò)中感知技術(shù)的研究與應(yīng)用[J]. 計算機科學(xué),2009,2(11):55-57
[3] 薛美鳳,葉繼元. 學(xué)術(shù)虛擬社區(qū)知識共享研究綜述[J]. 圖書情報工作,2011,2(13):55-57
[4] 張超旭,劉云. 基于關(guān)系的社交網(wǎng)絡(luò)感知模型研究[J]. 鐵路計算機應(yīng)用,2012,2(12):55-57
[5] 于志文,于志勇. 社會感知計算:概念、問題及其研究進展[J]. 計算機學(xué)報,2012,2(1):55-56
[6] 周建立,張愛華. 社會關(guān)系強度對社交網(wǎng)絡(luò)中應(yīng)用接受意愿的影響研究[J]. 中國科技信息,2012,2(23):132-134
[7] 溫忠麟,侯潔泰. 調(diào)節(jié)效應(yīng)與中介效應(yīng)的比較和利用[J]. 心理學(xué)報,2005,2(2):43-45