劉中顯 成卓
我國宏觀經(jīng)濟運行正面臨諸多新問題新挑戰(zhàn),迫切需要做好政策儲備。前瞻性地研判宏觀經(jīng)濟走勢,僅僅依靠統(tǒng)計數(shù)據(jù)稍顯滯后。市場日趨復(fù)雜和多元,采用大數(shù)據(jù)分析方法一定程度上能夠彌補如此局限,是提高宏觀經(jīng)濟研判效率、積極應(yīng)對內(nèi)外部挑戰(zhàn)的必要工具。阿里巴巴作為全球互聯(lián)網(wǎng)公司市值第五名企業(yè),匯聚了海量經(jīng)濟數(shù)據(jù),在大數(shù)據(jù)應(yīng)用于行業(yè)分析、景氣判斷、經(jīng)濟預(yù)測等宏觀經(jīng)濟研究方面進行了有益的探索,值得借鑒。
一、初期探索:前瞻性精準預(yù)判的優(yōu)勢初步顯現(xiàn)
早在2008年初,阿里巴巴就成功地應(yīng)用大數(shù)據(jù)預(yù)測出世界貿(mào)易拐點。根據(jù)常識,買家在采購商品前,會比較多家供應(yīng)商的產(chǎn)品,反映到阿里網(wǎng)站統(tǒng)計數(shù)據(jù)中,就是查詢點擊數(shù)量和購買點擊量會保持一個相對穩(wěn)定的數(shù)值。阿里綜合各個維度的海量數(shù)據(jù)建立了“點擊量—購買量”的用戶行為模型。2008年初,阿里平臺上歐美買家的查詢點擊數(shù)急劇下滑。根據(jù)該用戶行為模型,阿里前半年時間預(yù)測出了世界貿(mào)易的拐點。這成為阿里較早應(yīng)用大數(shù)據(jù)研究宏觀經(jīng)濟的成功案例,也顯示出大數(shù)據(jù)在宏觀經(jīng)濟分析應(yīng)用中所具有的前瞻性精準預(yù)判優(yōu)勢。
二、基本邏輯:底層數(shù)據(jù)—指標集—經(jīng)濟模型
隨著物聯(lián)網(wǎng)、云計算、人工智能等新一代信息技術(shù)的發(fā)展,阿里逐漸采集、匯聚、整理、分析和研究其平臺內(nèi)外的數(shù)據(jù),形成了“數(shù)據(jù)—指標—模型”的大數(shù)據(jù)研究宏觀經(jīng)濟的基本邏輯。
(一)匯聚阿里生態(tài)圈全域數(shù)據(jù)
阿里主要采集的數(shù)據(jù)包括:淘寶天貓、新零售、飛豬、螞蟻金服、大阿云、高德、釘釘、大文娛、阿里健康、站外數(shù)據(jù)等阿里生態(tài)經(jīng)濟圈的全域數(shù)據(jù)。具體包括電商、零售、生活、工具、商業(yè)基礎(chǔ)設(shè)施、外部等6大類13小類72種數(shù)據(jù),其中既包括基本畫像、行為偏好、社會交往、財富狀況等消費者數(shù)據(jù),也包括商品/品牌、行業(yè)/地域、風(fēng)險/價值等商業(yè)數(shù)據(jù)。數(shù)據(jù)采集方式為數(shù)據(jù)庫接入、外部數(shù)據(jù)爬取、輿情數(shù)據(jù),以及通過人脈、經(jīng)驗、內(nèi)部管理層級等手工錄入。之后進行數(shù)據(jù)清洗。數(shù)據(jù)清洗方法:一是根據(jù)統(tǒng)計局、省市縣、貧困縣、農(nóng)產(chǎn)品等分類整理;二是對文本進行結(jié)構(gòu)化;三是對輿情等數(shù)據(jù)進行情感分析,最后得到經(jīng)濟與社會數(shù)據(jù)、人脈關(guān)系數(shù)據(jù)。
(二)提取經(jīng)濟數(shù)據(jù)指標集合
基于匯聚起來的經(jīng)濟數(shù)據(jù),阿里從新零售、消費升級、產(chǎn)業(yè)發(fā)展、區(qū)域經(jīng)濟、全球化、中小企業(yè)雙創(chuàng)、平臺經(jīng)濟治理、數(shù)據(jù)技術(shù)政策、技術(shù)普惠和社會責(zé)任等十個維度提取經(jīng)濟數(shù)據(jù)指標集合,共涉及28類指標??傮w上看,這些指標包括主要四類:一是區(qū)域經(jīng)濟發(fā)展指標,包括城鎮(zhèn)化、淘寶村等方面指標;二是行業(yè)發(fā)展指標,包括產(chǎn)業(yè)帶、小微企業(yè)活躍度、綠色產(chǎn)品、農(nóng)產(chǎn)品、國產(chǎn)品牌、老字號等方面的指標;三是人的指標,包括消費升級、大學(xué)生、殘疾人、婦女等方面的指標;四是國家關(guān)系指標,包括貿(mào)易、旅游、金融等方面的指標。
(三)構(gòu)建模型展開經(jīng)濟研究
阿里在底層數(shù)據(jù)和指標集合的基礎(chǔ)上,構(gòu)建模型開展經(jīng)濟研究。模型的邏輯是通過A(指標)變化看B的情況:一是分析就業(yè)、消費者福利、普惠金融等領(lǐng)域指標,得出阿里價值;二是分析消費品價格、信息化、創(chuàng)業(yè)等領(lǐng)域指標,為政府價格監(jiān)測、供給側(cè)結(jié)構(gòu)改革、智能制造、雙創(chuàng)等政策提供決策支撐;三是分析AI/IOT/BC技術(shù)趨勢、平臺治理、數(shù)據(jù)規(guī)范等領(lǐng)域指標,對未來發(fā)展進行預(yù)測;四是分析數(shù)據(jù)經(jīng)濟。如,通過母嬰用品指標分析二胎情況、通過冬裝指標分析氣候、通過食鹽指標分析人口分布、通過進口保健品指標分析供給側(cè)改革、通過人員流動指標分析房地產(chǎn)和區(qū)域發(fā)展不平衡狀況。
三、主要特點:圍繞數(shù)據(jù)全生命周期開展“小核心、大協(xié)作”的數(shù)據(jù)能力整合
阿里充分利用大數(shù)據(jù)時代的顛覆性數(shù)據(jù)算力,圍繞阿里生態(tài)內(nèi)外海量數(shù)據(jù)的采集、匯聚、分析和反饋等核心環(huán)節(jié),以“小核心、大協(xié)作”的內(nèi)外部資源配置模式,組織“內(nèi)部少量數(shù)據(jù)分析團隊+規(guī)模龐大內(nèi)部數(shù)據(jù)清洗團隊和外部研究團隊”,探索開展宏觀經(jīng)濟分析,并對數(shù)據(jù)全生命周期進行安全保障。
(一)體現(xiàn)了及時、精準、低成本、高顆粒度和大樣本等大數(shù)據(jù)獨特優(yōu)勢
一是及時性。阿里互聯(lián)網(wǎng)平臺積累起來的數(shù)據(jù)存儲在開放、即時的網(wǎng)絡(luò)空間中,交易數(shù)據(jù)、價格數(shù)據(jù)、瀏覽痕跡、位置信息等一切信息從相關(guān)主體使用互聯(lián)網(wǎng)起,即刻被記錄在網(wǎng)絡(luò)平臺中。這些數(shù)據(jù)被特定算法提取出來并用于處理和分析經(jīng)濟問題,不存在時滯。二是精準性。阿里互聯(lián)網(wǎng)平臺按照實際電子商務(wù)交易情況記錄數(shù)據(jù)信息,減少辦理人員人工登記的操作,提供相對更加原始的數(shù)據(jù)信息,而非人工搜集并經(jīng)過處理后的數(shù)據(jù)信息,體現(xiàn)了分析精確性的特征。三是低成本。阿里平臺大數(shù)據(jù)是用戶使用過程中自動被記錄下來的,不需人工調(diào)查和搜集。用于經(jīng)濟分析的數(shù)據(jù)是通過算法等技術(shù)手段提取出來加以整理獲得的,很大程度上降低了數(shù)據(jù)獲取成本。四是高顆粒度。阿里互聯(lián)網(wǎng)平臺匯聚了10萬余種具體商品的交易數(shù)據(jù),擺脫了傳統(tǒng)經(jīng)濟研究集中在國家總量數(shù)據(jù)、行業(yè)總體數(shù)據(jù)等非細化數(shù)據(jù)的局限,使得阿里可以開展更加細化、更加具體的經(jīng)濟研究。五是大樣本量。阿里互聯(lián)網(wǎng)平臺生態(tài)中既有大企業(yè),也有大量規(guī)模以下的小微企業(yè),使阿里擁有海量的樣本數(shù),可以相對獲取總體或者接近全體的樣本信息。
(二)內(nèi)部以部門合作方式生成和分析價格變動等宏觀經(jīng)濟指標
阿里巴巴以清晰科學(xué)的部門專業(yè)化分工開展大數(shù)據(jù)經(jīng)濟分析研究,基本分工方式為:少量經(jīng)濟分析人員+大量數(shù)據(jù)采集和清洗人員。經(jīng)濟分析人員配置較少。通常情況下,一項大數(shù)據(jù)經(jīng)濟分析任務(wù)僅配置3名研究人員左右、全職工作3—6個月完成。數(shù)據(jù)采集清洗人員規(guī)模龐大。阿里配置了常設(shè)的百人規(guī)模的團隊負責(zé)數(shù)據(jù)采集和清洗工作。具體的工作內(nèi)容龐雜而細碎。例如,a為b購買商品,a在北京下單和支付,b在沈陽收貨。當(dāng)經(jīng)濟分析任務(wù)是研究區(qū)域消費購買力時,數(shù)據(jù)采集清洗團隊要通過算法識別出該“支付和收貨不同城”的交易類別,并將其歸入a所在的北京地區(qū)數(shù)據(jù)集。
目前,阿里巴巴生產(chǎn)的常規(guī)指數(shù)包括網(wǎng)購價格指數(shù)、區(qū)域電商指數(shù)、云棲指數(shù)(用于測度云計算應(yīng)用情況)。其中,主要用于宏觀經(jīng)濟研究的為網(wǎng)購價格指數(shù)??傮w上看,網(wǎng)購價格指數(shù)由兩類指數(shù)構(gòu)成。一是阿里網(wǎng)購核心商品價格指數(shù)(aSPI—core)。該指數(shù)是固定籃子價格指數(shù),通過圈定阿里零售平臺上近五百個基本分類下接近10萬種核心商品作為“固定籃子”,每月追蹤“固定籃子”內(nèi)商品和服務(wù)實際網(wǎng)購成交價格變化,以刻畫網(wǎng)購主流商品和服務(wù)的一般物價水平波動,從而從網(wǎng)絡(luò)零售渠道反映宏觀物價走勢。二是阿里巴巴全網(wǎng)網(wǎng)購價格指數(shù)(aSPI)。該指數(shù)用以反映全網(wǎng)總體網(wǎng)購支出價格水平的變化。它不但包含了商品層面一般價格變動,還包含了新產(chǎn)品涌現(xiàn)所形成的消費結(jié)構(gòu)變動信息。兩組指數(shù)均由十大分類指數(shù)構(gòu)成,分別是食品、煙酒及用品、衣著、家庭設(shè)備及維修服務(wù)、醫(yī)療保健和個人用品、交通和通信、娛樂教育文化用品及服務(wù)、居住、辦公用品和服務(wù)及愛好收藏投資。十大分類指數(shù)下還包括了近五百個基本分類價格指數(shù)。
(三)對外以項目制開展宏觀經(jīng)濟單個領(lǐng)域研究合作
一是與清華大學(xué)合作開展京津冀“電商→區(qū)域一體化”促進指數(shù)研究。該研究采集阿里平臺在京津冀地區(qū)銷售大數(shù)據(jù),度量電商對區(qū)域經(jīng)濟一體化的影響效果。指數(shù)體系分為區(qū)域差異性指數(shù)、專業(yè)化分工指數(shù)以及城市間互動指數(shù)等三個“橫向”維度,另外還有區(qū)域?qū)用婧统鞘袑用孢@兩個指數(shù)的“縱向”維度。指數(shù)間通過幾何加權(quán)平均方法進行合成,從而得到電子商務(wù)對區(qū)域一體化促進指數(shù)。
二是與國務(wù)院發(fā)展研究中心合作開展重點城市價格監(jiān)測,選取阿里平臺在重點城市的重點產(chǎn)品消費情況,監(jiān)測重點城市的消費發(fā)展。
三是與國家發(fā)改委的合作。采集阿里平臺消費大數(shù)據(jù),分析消費構(gòu)成比例變化,用于對“十三五”規(guī)劃中消費升級的評估。該研究分析中高端商品消費、信息消費、個性消費比例變動,判斷消費升級情況;分析長江經(jīng)濟帶、粵港澳等地區(qū)消費占比,判斷消費的區(qū)域增長動力情況;分析盒馬鮮生、天貓小店等消費占比,判斷新業(yè)態(tài)消費發(fā)展情況。
(四)從數(shù)據(jù)全生命周期梳理出14個安全域設(shè)立50個安全管理過程
阿里大數(shù)據(jù)宏觀經(jīng)濟分析涉及復(fù)雜的數(shù)據(jù)流程和龐大的數(shù)據(jù)量,并涉及阿里生態(tài)內(nèi)外的多方數(shù)據(jù)主體。為此,阿里在數(shù)據(jù)產(chǎn)生、數(shù)據(jù)存儲、數(shù)據(jù)使用、數(shù)據(jù)傳輸、數(shù)據(jù)共享、數(shù)據(jù)銷毀等數(shù)據(jù)全生命周期共梳理出14個安全域。其中,數(shù)據(jù)產(chǎn)生環(huán)節(jié)包括數(shù)據(jù)權(quán)利管理、數(shù)據(jù)分類分級等2個安全域。數(shù)據(jù)存儲環(huán)節(jié)包括存儲介質(zhì)安全、存數(shù)數(shù)據(jù)安全、數(shù)據(jù)可用性管理等3個安全域。數(shù)據(jù)使用環(huán)節(jié)包括身份認證與訪問控制、加密管理、數(shù)據(jù)使用行為監(jiān)控、數(shù)據(jù)使用過程安全等4個安全域。數(shù)據(jù)傳輸環(huán)節(jié)包括網(wǎng)絡(luò)安全管理等1個安全域。數(shù)據(jù)共享環(huán)節(jié)包括數(shù)據(jù)共享基本原則、數(shù)據(jù)共享安全等2個安全域。數(shù)據(jù)銷毀環(huán)節(jié)包括數(shù)據(jù)清理、數(shù)據(jù)介質(zhì)的銷毀等2個安全域。在每個安全域,阿里又細分出50個安全管理過程。在每個安全管理過程中,都制定了相關(guān)的規(guī)章、工作流程,并能夠?qū)Π踩芾淼慕Y(jié)果進行量化分析和可視化展示。目前,這些數(shù)據(jù)安全管理流程逐漸被阿里平臺上的企業(yè)所使用,向這些企業(yè)賦能。
四、借鑒阿里經(jīng)驗,推動宏觀經(jīng)濟研究智能化發(fā)展
(一)探索推進智庫與互聯(lián)網(wǎng)平臺“經(jīng)濟分析+數(shù)據(jù)采集清洗”模式合作
阿里與清華大學(xué)、國務(wù)院發(fā)展研究中心等高端智庫合作的分工,通常采取阿里的數(shù)據(jù)能力與高端智庫的研究能力結(jié)合。建議發(fā)揮高端智庫經(jīng)濟研究人員規(guī)模較大、專業(yè)齊全的優(yōu)勢,推進與互聯(lián)網(wǎng)平臺公司開展對接合作。通過研究需求導(dǎo)向,積極推進高端智庫與互聯(lián)網(wǎng)平臺溝通,逐步解決當(dāng)前大數(shù)據(jù)宏觀經(jīng)濟分析中數(shù)據(jù)編碼、分類、時間、空間等口徑不一致問題,解決基礎(chǔ)信息采集、分析、使用的困難。
(二)研究建立大數(shù)據(jù)宏觀經(jīng)濟監(jiān)控指標體系
大數(shù)據(jù)研究宏觀經(jīng)濟正在發(fā)生三個轉(zhuǎn)變:從依靠傳統(tǒng)統(tǒng)計數(shù)據(jù)向依靠互聯(lián)網(wǎng)非統(tǒng)計數(shù)據(jù)轉(zhuǎn)變,從監(jiān)測預(yù)測宏觀經(jīng)濟總量向監(jiān)測預(yù)測宏觀經(jīng)濟先行指標轉(zhuǎn)變,從中長期監(jiān)測預(yù)測向?qū)崟r監(jiān)測預(yù)測轉(zhuǎn)變。但也應(yīng)看到,大數(shù)據(jù)應(yīng)用宏觀經(jīng)濟研究更多是對價格、消費等進行客觀描述,較少采用結(jié)構(gòu)性的方法來分析,缺乏經(jīng)濟理論支撐。因此,建議發(fā)揮高端智庫的經(jīng)濟研究理論優(yōu)勢,圍繞網(wǎng)絡(luò)搜索、社交媒體、電子商務(wù)、終端定位和業(yè)務(wù)交易等大數(shù)據(jù)源,探索建立基于非傳統(tǒng)數(shù)據(jù)的宏觀經(jīng)濟監(jiān)測預(yù)測體系,提升宏觀經(jīng)濟形勢分析以及重點行業(yè)、重點區(qū)域發(fā)展實時監(jiān)測預(yù)測的大數(shù)據(jù)應(yīng)用能力,以及中美貿(mào)易戰(zhàn)等突發(fā)事件應(yīng)急研究相應(yīng)能力。
(三)著力解決數(shù)據(jù)使用中的安全隱患
互聯(lián)網(wǎng)平臺公司的大數(shù)據(jù)中,微觀數(shù)據(jù)主體是多元的。一方面,基礎(chǔ)數(shù)據(jù)和初步合成數(shù)據(jù)涉及生態(tài)圈中小企業(yè)、平臺企業(yè)商業(yè)秘密,有較強的企業(yè)數(shù)據(jù)隱私性。另一方面,當(dāng)眾多微觀數(shù)據(jù)運用大數(shù)據(jù)技術(shù)合稱為宏觀數(shù)據(jù)后,會涉及國家經(jīng)濟安全。因此,建議著力關(guān)注數(shù)據(jù)應(yīng)用的安全問題。鑒于我國高端智庫的信息化團隊普遍規(guī)模較小,建議借鑒阿里等平臺公司對數(shù)據(jù)全生命周期的安全管理模式,建立智庫大數(shù)據(jù)使用規(guī)章、制度、流程,合理安全使用大數(shù)據(jù)。
(作者單位:中國宏觀經(jīng)濟研究院、國家發(fā)展改革委經(jīng)濟所)