秦 昆,康朝貴
(武漢大學 遙感信息工程學院,湖北 武漢 430072)
?
計算社會科學的時空分析理論與方法
秦 昆,康朝貴
(武漢大學 遙感信息工程學院,湖北 武漢 430072)
正在向智慧社會方向發(fā)展的大數(shù)據(jù)時代的計算社會科學具有復雜性、自適應性、社會交互性和時空特性等特點,從社會數(shù)據(jù)、信號、情報到社會智慧的轉(zhuǎn)化及量化是智慧社會的核心目標。計算社會科學利用先進的計算技術(shù)、信息技術(shù)和智能技術(shù)等定量分析方法,研究復雜的人類行為及社會運行,既體現(xiàn)了日趨復雜的人類活動和網(wǎng)絡社會所提出的迫切現(xiàn)實需求,也促進了計算機技術(shù)及多學科交叉所產(chǎn)生的新方法、新工具的快速發(fā)展。
然而,作為一種新的研究范式,計算社會科學在引起普遍關(guān)注的同時,也引發(fā)了廣泛的爭論和質(zhì)疑。要充分認識計算社會科學的積極意義與價值,我們必須對自然科學、以技術(shù)為主導的學科、工業(yè)界與計算社會科學的交叉融合及未來發(fā)展趨勢進行深入思考:社會科學的可計算性及其核心技術(shù)是什么?社會系統(tǒng)的復雜自適應性及其如何度量?社會系統(tǒng)具有何種時空分布及演變規(guī)律?腦科學與智能科學與技術(shù)如何影響計算社會科學?如何分析大數(shù)據(jù)時代計算社會科學的物理機制和生態(tài)學機制?如何分析大數(shù)據(jù)時代計算社會科學的社會交互網(wǎng)絡?如何建立相對合理完善的計算社會科學的方法體系?正確認識這些問題,乃是理解和預測計算社會科學及其支撐學科的走向和發(fā)展前景、促進社會科學研究者接受和發(fā)展計算社會科學研究的動力。
上述問題中,時空問題已成為大數(shù)據(jù)時代計算社會科學順利發(fā)展的關(guān)鍵問題之一。如何借助遙感(RS:Remote Sensing)、地理信息系統(tǒng)(GIS:Geographical Information System)、全球衛(wèi)星導航系統(tǒng)(GNSS:Global Navigation Satellite System)等空間信息科學與技術(shù),從時空觀的角度,研究和探討計算社會科學的時空分析理論和方法,是擁抱大數(shù)據(jù)時代計算社會科學的重要發(fā)展方向。
時空問題是社會理論的核心。社會科學是以“人”為研究對象的學科,同時研究人與地理空間的關(guān)系;地理空間信息科學是以“地理空間”為研究對象的學科,同時研究地理空間與人的關(guān)系。二者分別從不同的視角研究“人——地關(guān)系”和“地——人關(guān)系”。
社會的一切結(jié)構(gòu)性和過程性變遷,不僅都是在時空維度上進行的,而且時空變化構(gòu)成了一切社會變化最基礎(chǔ)的層面。因此,社會時空視角被看作研究社會發(fā)展的基本視角,社會時空分析被廣泛運用于社會科學領(lǐng)域。以人文社會科學研究的“空間轉(zhuǎn)向”為契機,運用地理空間信息科學的空間綜合思維,可以加強社會科學基礎(chǔ)性研究成果的整理、挖掘與可視化表達,促進社會科學相關(guān)學科的交叉與融合,形成新的研究方向和研究課題,從而推動計算社會科學研究走向縱深。然而,受限于數(shù)據(jù)采集、管理、分析、展示的能力,傳統(tǒng)社會科學研究學者對“時空”進行研究在尺度、粒度、直觀度等方面已經(jīng)顯得較為落后,從而限制了相關(guān)研究及結(jié)果的傳播。
因此,抓住大數(shù)據(jù)、地理計算、遙感科學、地理信息科學和社會智能等科技進步帶來的重大機遇,尋求建立更具綜合性和一般性的空間綜合人文社會科學理論,是人文科學、社會科學、計算科學和空間科學、地理信息科學等領(lǐng)域?qū)W者的共同歷史使命。以遙感、地理信息系統(tǒng)、全球衛(wèi)星導航系統(tǒng)為核心的地理空間信息科學與技術(shù),集地理信息、空間分析方法與地理空間知識于一體,為多種學科、多種來源的數(shù)據(jù)整合與集成提供了技術(shù)平臺,為擴展傳統(tǒng)學科、促進學科交叉融合和開拓新興學科提供了信息和學術(shù)支撐。
以大數(shù)據(jù)時代計算社會科學的時空觀為理論基礎(chǔ),針對時空分析與時空可視化的迫切需求,計算社會科學應重點開展以下幾個方面的時空分析方法研究。
(一)計算社會科學的空間化與可視化方法
利用地理編碼方法,將計算社會科學中的文本信息、描述性信息進行空間化處理,進行地學可視化表達,讓抽象的描述性文字在地理空間中進行地學可視化,將為計算社會科學的研究提供更加形象和科學的表達方法。
地理編碼(Geocoding),也稱為地址匹配,是將地址映射成地理坐標的過程,它提供了一種把描述文本地址的地理位置信息轉(zhuǎn)換成地理坐標的方式。地理編碼,可以利用地址數(shù)據(jù)庫來建立地址與地理坐標空間的對應關(guān)系,地址編碼技術(shù)是大量業(yè)務數(shù)據(jù)可視化定位和空間分析的橋梁。通過地理編碼,可以實現(xiàn)原有信息系統(tǒng)和空間信息的融合,將日常的經(jīng)濟、社會、人文、歷史、旅游、商業(yè)等一系列城市生活中的信息空間化,用于在空間信息支持下進行空間分析和決策應用。
地學可視化(Geo-visualization),也稱地理空間數(shù)據(jù)可視化,指運用地圖學、計算機圖形學和圖像處理技術(shù),將地學信息輸入、處理、查詢、分析以及預測的數(shù)據(jù)及結(jié)果采用圖形符號、圖形、圖像,并結(jié)合圖表、文字、表格、視頻、音頻等可視化形式顯示,進行交互處理的理論、方法和技術(shù)。對計算社會科學數(shù)據(jù)進行地學可視化,可以讓社會科學問題在實際的地理空間進行可視化展現(xiàn),從而在可視化的“人——地”空間中進行社會問題的分析,將產(chǎn)生一系列有效的計算社會科學的地學可視化分析方法。
我們認為:抓住信息科學發(fā)展的機遇,引入地理空間信息科學領(lǐng)域的地理編碼技術(shù)和地學可視化技術(shù),對社會科學研究的問題和社會要素數(shù)據(jù)在地理空間進行空間定位、地學可視化展示,將對社會科學的研究方法和思路產(chǎn)生革命性的變化,并將促進計算社會科學的極大發(fā)展。
(二)計算社會科學的時空統(tǒng)計分析方法
統(tǒng)計分析是社會調(diào)查研究的常用方法。但是,面對大數(shù)據(jù)時代計算社會科學中的海量時空數(shù)據(jù),傳統(tǒng)的社會統(tǒng)計分析方法已經(jīng)難以勝任,迫切需要發(fā)展計算社會科學的時空統(tǒng)計分析方法,具體包括:
1.社會科學數(shù)據(jù)的探索性時空統(tǒng)計分析方法。探索性時空統(tǒng)計分析方法是在探索的基礎(chǔ)上再對數(shù)據(jù)進行時空建模的方法,不預先作理論假設,實際上是 “讓時空數(shù)據(jù)說話”的方法。
2.社會科學數(shù)據(jù)的時空相關(guān)性統(tǒng)計分析方法。時空相關(guān)性是一些時空變量之間時間和空間的相互依賴性,包括全局性時空相關(guān)性統(tǒng)計和局部時空相關(guān)性統(tǒng)計。從時間和空間兩個維度,對計算社會科學的社會要素數(shù)據(jù)之間的空間相關(guān)性、時間相關(guān)性,以及時空交互的時空相關(guān)性進行統(tǒng)計分析。
3.社會科學數(shù)據(jù)的時空聚集模式探測方法。對一些社會現(xiàn)象的時空分布模式進行分析,對于社會科學研究具有十分重要的意義。這些社會現(xiàn)象的時空分布是規(guī)則的聚集分布模式,還是隨機分布模式?是什么因素影響和造成了這種分布模式?一種社會現(xiàn)象的時空分布是否會對另一種社會現(xiàn)象的時空分布產(chǎn)生影響?如何量化這種影響?諸如此類問題的分析需要建立和發(fā)展社會科學數(shù)據(jù)的時空聚集模式探測方法,可以將地理空間信息科學的時空聚集模式探測方法,引入社會科學數(shù)據(jù)分析領(lǐng)域,并進行適應性改造,從而發(fā)展社會科學數(shù)據(jù)的時空聚集模式探測方法。
我們認為:將社會科學領(lǐng)域的一般統(tǒng)計方法,擴展為社會科學數(shù)據(jù)的時空統(tǒng)計分析方法,將社會空間與地理空間進行統(tǒng)一分析,必將產(chǎn)生一些創(chuàng)新性的時空統(tǒng)計分析方法,也將促進計算社會科學、時空統(tǒng)計分析方法的大發(fā)展。
(三)計算社會科學的時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法
在大數(shù)據(jù)時代,我們積累了越來越多的社會科學數(shù)據(jù),含有豐富的時空信息,將這些數(shù)據(jù)和信息轉(zhuǎn)化為有效的知識,是計算社會科學服務于智慧社會的迫切需要。時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn),是從時空數(shù)據(jù)中提取隱含其中的、事先未知的、潛在有用的、最終可理解的時空知識和規(guī)則的過程。將時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法引入大數(shù)據(jù)時代的計算社會科學,可產(chǎn)生以下方法:(1)計算社會科學數(shù)據(jù)的時空聚類方法;(2)計算社會科學的時空關(guān)聯(lián)挖掘方法;(3)計算社會科學數(shù)據(jù)的時空預測方法。
將時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法引入計算社會科學領(lǐng)域,可以發(fā)展計算社會科學的大數(shù)據(jù)挖掘技術(shù),將研究出一些創(chuàng)新性的社會數(shù)據(jù)時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法。
(四)計算社會科學的時空分析建模與輔助決策服務方法
時空分析建模是運用地理時空分析方法建立有效的時空分析模型,產(chǎn)生期望的信息,并提供輔助決策服務的過程和方法。智慧社會是大數(shù)據(jù)時代計算社會科學的發(fā)展目標,通過對大數(shù)據(jù)時代社會科學的特點進行研究,分析和吸收大數(shù)據(jù)時代與計算社會科學相關(guān)的多學科協(xié)同創(chuàng)新成果,研究計算社會科學在智慧社會中的具體應用,如教育問題、農(nóng)民工問題、社會治理創(chuàng)新、群體性事件發(fā)生時的應對等,通過分析這些具體的社會問題,構(gòu)建時空分析模型,提供輔助決策服務,從而有利于促進計算社會科學自身在智慧社會領(lǐng)域的長期可持續(xù)發(fā)展。
計算社會科學研究的最終目的是為社會服務,為解決現(xiàn)實中的教育問題、農(nóng)民工問題、社會治理問題、群體性事件問題等貢獻一份力量。通過構(gòu)建計算社會科學問題研究的時空分析模型,并提供輔助決策服務,將為現(xiàn)實社會問題的解決提供更加科學有效的方法。
下面以我們正在開展的一項社會科學與地理空間信息科學學科交叉的項目為例,介紹空間人文社會調(diào)查與分析方法,對大數(shù)據(jù)時代計算社會科學的時空分析方法進行一個實際的探索性研究。
GIS(地理信息系統(tǒng))與GPS(全球定位系統(tǒng))技術(shù)正在逐步應用于人文社會科學,為人文社會科學的研究提供了空間化、計量化的新技術(shù)和新手段。我們的項目從測繪地理信息科學與社會科學學科交叉入手,研究和探討基于GIS和GPS的空間人文社會調(diào)查與分析方法,具體包括:(1)GIS支持下的社會調(diào)查空間抽樣方法;(2)GIS和GPS支持下的社會調(diào)查輔助技術(shù);(3)社會調(diào)查的行為軌跡分析方法;(4)社會調(diào)查數(shù)據(jù)的空間統(tǒng)計分析方法。
上述研究將為社會調(diào)查提供空間化和可視化的新方法,拓展GIS和GPS在人文社會科學領(lǐng)域的應用,從而為測繪地理信息科學與社會科學的交叉融合做出基礎(chǔ)性貢獻。
本文對大數(shù)據(jù)時代計算社會科學的時空分析理論、方法和應用進行了探索性的討論。在計算社會科學的新語境下,社會科學與地理空間信息科學的交叉融合,正成為國際研究的新熱點,雙方的學者日益注重借鑒對方的視角,對社會結(jié)構(gòu)與社會過程中的“人——地關(guān)系”和“地——人關(guān)系”展開創(chuàng)新性的交叉研究。從社會科學研究者的角度來看,社會科學研究急需地理信息科學(遙感、地理信息系統(tǒng)、全球衛(wèi)星導航系統(tǒng))為其提供空間化、可視化、定量化的新技術(shù)手段。站在地理信息科學研究者的角度而言,地理信息科學領(lǐng)域的學者也迫切需要拓展在人文社會科學領(lǐng)域的應用,研究地理信息科學理論與技術(shù)在人文社會科學中應用的新理論和新方法。兩大領(lǐng)域?qū)W者的合作研究與交流討論必將產(chǎn)生更多的創(chuàng)新性成果,必將促進兩大學科各自產(chǎn)生長足的進步,從而共同為推動社會發(fā)展和進步貢獻一份力量。
2016-09-12
國家社科基金重大項目“大數(shù)據(jù)時代計算社會科學的產(chǎn)生、現(xiàn)狀與發(fā)展前景研究”(16ZDA086)的階段性成果。
秦 昆(1972-),男,湖北隨州人,武漢大學遙感信息工程學院教授,博士生導師。研究方向:空間分析與數(shù)據(jù)挖掘、智能空間信息處理;康朝貴(1987-),男,湖南衡陽人,武漢大學遙感信息工程學院講師,博士。研究方向:軌跡計算、城市信息學。