張 偉,陳曉慧,李 鋒
(1. 信息工程大學 地理空間信息學院,河南 鄭州 450001;2. 地理信息工程國家重點實驗室,陜西 西安 710000)
淺析地理輿情的概念及相關技術
張 偉1,2,陳曉慧1,2,李 鋒1
(1. 信息工程大學 地理空間信息學院,河南 鄭州 450001;2. 地理信息工程國家重點實驗室,陜西 西安 710000)
分別從地理輿情的基礎理論、技術支撐、概念解析、分類定義及框架體系等方面,對地理輿情進行了系統(tǒng)的介紹,以期能研究地理輿情的體系框架,為大數據時代地理輿情的網絡環(huán)境研究打下基礎。
地理輿情;概念;可視分析
隨著科學技術的不斷發(fā)展進步,尤其是以互聯(lián)網、移動互聯(lián)、物聯(lián)網組成的泛在網絡為代表的Web2.0時代的到來,網絡空間的用戶數正處于一個高速增長的
時期。網絡媒體已被公認是繼報紙、廣播、電視之后的“第四媒體”,網絡成為反映社會輿情的主要載體之一。大數據時代,網絡輿情表現(xiàn)為廣泛、快速、互動、自由等特性,掌握不好也具有危害性[1,2]。因此,利用網絡媒體進行網絡輿情分析已經得到了廣泛的關注。本文介紹和研究了大數據時代地理輿情研究的理論依據和技術支撐,以期為地理空間信息科學的研究領域拓展奠定基礎。
從研究領域來看,地理輿情的研究方向是地理學、社會學和情報學交叉學科的研究領域,不屬于某個單一領域,是多領域的結合;從分析方法來看,地理輿情還涉及統(tǒng)計數學、計算機科學等領域。因此,地理輿情的理論基礎見表1。
表1 地理輿情的理論基礎
①地理學的基礎理論,為地理輿情的研究范圍提供依據,為地理輿情的客體研究提供理論支撐。尤其是空間認知理論,為地理輿情的可視化提供了參考,地理語義的認知是地理輿情分析概念模型構建的基本依據。②社會學的基礎理論,為地理輿情的分析提供方法依據。傳統(tǒng)輿情分析過程一般包括收集、處理、分析、總結等,在此基礎上地理輿情分析過程可分為數據獲取、信息抽取、統(tǒng)計分析、可視化分析等。社會心理學的理論為輿情的情感分析提供依據。③情報學的基礎理論,為地理輿情的歸宿提供理論依據。地理輿情是主體對客體的主觀情感進行分析,挖掘主體之間的關系、客體的分布、發(fā)展、變化的規(guī)律。地理輿情是人們(主體)對客體的主觀認識的客觀反映。當然,情報學中的一些標準規(guī)范、分析方法等也給地理輿情分析提供了依據。
大數據時代,地理輿情分析往往采用基于網絡的形式獲取數據,其最大優(yōu)點是自由性。因此,地理輿情分析需要通過數據挖掘[3]、自然語言處理[4]、可視分析[5,6]等關鍵技術,實現(xiàn)對地理輿情的實時獲取、統(tǒng)計分析、可視化表達和預測判斷等,如表2所示。
表2 地理輿情分析的技術支撐
數據挖掘技術為地理輿情分析的數據處理提供了技術支撐。地理輿情中主客體都要進行特征化描述,對主體的關系進行關聯(lián)分析,客體的發(fā)展過程進行演變分析及趨勢分析,客體的事件分布可以用數據挖掘的聚類分析進行聚類表示。自然語言處理技術為地理輿情分析的信息處理提供技術支持。命名實體識別是自然語言處理中一個關鍵技術。自然語言處理中信息抽取、關系抽取、自動文摘等技術是地理輿情中進行地名事件識別、主客體關系分析、事件過程標注的基礎。地理輿情分析,除統(tǒng)計分析外,還要依靠可視分析進行人機交互,挖掘更高級別的推理成果。地理輿情的可視分析不僅是“可視化-分析”的過程,而是“分析-可視化-分析”的一個循環(huán)過程。地理輿情分析目的是為了得到主客體相互關系及其發(fā)展規(guī)律,并預測發(fā)展趨勢。
地理輿情是以地理學、社會學、情報學等理論為基礎,數據挖掘、自然語言處理、可視分析等技術為支撐,人(民眾)為主體,具有地理空間屬性的對象或事件為客體,在一定的社會空間(包括虛擬網絡空間)內,獲取主體對具有地理空間特征的現(xiàn)象或事件的發(fā)生、發(fā)展和變化的態(tài)度、情緒、意見的主觀表現(xiàn),并分析具有空間、時間以及視覺特征的關于主客體關系及發(fā)展規(guī)律(分布和趨勢)的情報,如圖1所示。
圖1 地理輿情定義結構圖
地理輿情的特點為:
1)時空關聯(lián)性。地理輿情研究對象是具有時空特征的輿論情報,具體表現(xiàn)為時空事件的主觀態(tài)度、相互關系及其發(fā)展規(guī)律。
2)實時動態(tài)性。地理輿情其本質是一個情報產品,具有情報的實時性與動態(tài)性,隨時間變化而不斷發(fā)生變化。
3)主觀不確定性。地理輿情研究的主體是人本身,信息來源是人的主觀表現(xiàn),因此具有主觀情感特征。
4)可視性和預測性。地理輿情分析的目的是提供可視化的情報產品,預測地理輿情的發(fā)展走向,輔助決策。
地理輿情按照內容可分為:環(huán)境輿情、資源輿情、人口輿情、土地輿情、城鎮(zhèn)輿情、水利輿情和交通輿情等[7],如表3;按照性質可分為:政治輿情、經濟輿情、軍事輿情、文化輿情、社會輿情和生態(tài)輿情等,如表4。
地理輿情的基本要素包括地理輿情對象(GO)、地理輿情事件(GE)、地理輿情過程(GP)和地理輿情屬性(GA),是一個四元組{GO,GE,GP,GA}集合。地理輿情分析模型設計主要從數據獲取、數據處理、數據分析、功能應用4個方面進行模塊化設計。以地理輿情的概念模型為基礎,對地理輿情的內容、分析手段及產品表現(xiàn)進行規(guī)范,如圖2。
表3 按內容分類的地理輿情
表4 按性質分類的地理輿情
圖2 邏輯框架圖
大數據時代,測繪保障已經不是簡單的提供數據服務,而是將數據轉化為信息,從信息中提取知識,最終為用戶提供智能服務。地理輿情是通過對樣本數據進行分析而得出具有時空特征及發(fā)展規(guī)律的情報產品,是測繪在人文社會空間和網絡空間的典型應用。隨著科技的不斷發(fā)展,無論從網絡安全分析、研究領域的拓展,還是測繪保障的需求,地理輿情都是大數據時代地理空間信息科學領域研究的重要內容。
[1] 陸鋒,張恒才.大數據與廣義GIS[J].武漢大學學報:信息科學版,2014,39(6):645-654
[2] 李清泉,李德仁.大數據GIS[J].武漢大學學報:信息科學版,2014,39(6):641-644
[3] Han J W,Kamber M.數挖掘概念與技術[M].北京:機械工業(yè)出版社,2004
[4] 張素香.信息抽取中關鍵技術的研究[D].北京:北京郵電大學,2007
[5] Keim D, Andrienko G, Fekete J, et al. Visual Analytics: Definition, Process, and Challenges[C].In: Kerren A, Berlin,2008
[6] 華一新,曹亞妮,李響.地理空間可視分析及其研究方向綜述[J].測繪科學技術學報,2012,29(4):235-239
[7] 陳俊勇.地理國情監(jiān)測的學習札記[J].測繪學報,2012, 41(5):633-635
P208
B
1672-4623(2016)03-0005-02
10.3969/j.issn.1672-4623.2016.03.002
張偉,博士,工程師,研究方向為作戰(zhàn)環(huán)境學。
2015-01-12。
項目來源:國家自然科學基金資助項目(41301428);地理信息工程國家重點實驗室重點基金資助項目(SKLGIE2014-Z-4-1)。